当前位置:首页 > 迎宾机器人 > 展厅迎宾机器人小脑技术的演进:视觉-语言模型进行模仿学习
 

展厅迎宾机器人小脑技术的演进:视觉-语言模型进行模仿学习

来源:中国信息通信研究院    时间:2025/1/3

传统的机器人控制方法依赖于准确的动力学模型和专家知识,难以适应非结构化环境的不确定性和复杂性。近年来,学习型控制的发 展使得机器人能够从数据中学习控制策略,但其泛化能力和鲁棒性仍 难以满足复杂场景需求。大模型为机器人控制引入了丰富的先验知识 和泛化能力,有望进一步突破传统控制方法的局限性。整体上看,目前展厅迎宾机器人的“小脑”核心技术正在从基于模型的控制方法向基于学习的控制方法演进。

在强化学习L域,大模型为引入先验知识和提G样本效率提供了 新的思路。以 LanguagePlan 为例,该模型利用 GPT-3 根据任务描述 生成抽象的行动计划,如“先走到门口,然后打开门,再走出房间”。 然后,LanguagePlan 将该行动计划嵌入到状态空间中,作为额外的观 察信息,用于训练一个分层强化学习智能体。实验表明,LanguagePlan 能够显著提G样本效率和泛化性能,加速复杂任务的学习。类似地,LOFT、T-EBM 等模型也展示了利用语言模型引导策略学习的能力。

在模仿学习方面,视觉-语言模型为机器人学习复杂技能提供了新的范式。以 CLIP-ASAP 为例,该模型先利用 CLIP 将视频帧编 码为语义特征,然后通过因果语言建模学习动作与视觉变化之间的关 系。在控制阶段,CLIP-ASAP 根据语言指令和当前视觉观察,预测下 一时刻的关键帧,并将其传递给低层控制器执行。实验表明,CLIPASAP 能够学习复杂的长期技能,如烹饪、家政等,且具有很强的泛化能力,能够根据不同的指令组合技能。类似地,R3M、Pix2R 等模 型也展示了利用视觉-语言对齐进行模仿学习的能力。

尽管大模型在机器人控制中展现出了广阔的应用前景,但如何进 一步提G其实时性、鲁棒性和可解释性仍然是亟待解决的问题。此外, 如何将控制与感知、决策和规划更紧密地结合,构建端到端的自主系 统,也是未来的重要研究方向。




 
 
 
相关推荐
» 新一代展厅指引服务机器人的机械手的特点:多个关节和多个自由度,具有很高的灵活性
» AI陪伴机器人-自然交互的陪伴机器人
» AI智能交互陪伴机器人核心技术:外观设计、情感计算、表情控制
» AI迎宾接待机器人的技术壁垒之情感智能
» 展厅迎宾讲解机器人的小脑技术路线:两种(基于模型、基于学习)
» 迎宾服务机器人的大脑发展方向:智能化和自主化发展
» 智能迎宾服务机器人大模型多技术路线:四条(LLM,VLM,VLA,多模态大模型)
» 迎宾机器人的大脑需要具备的能力:实时交互 多模态感知
» 服务机器人的GPS-SLAM系统
» 餐饮酒店标准化高,服务机器人将体现独特的优势实现成本优化
» 仅部分企业部署了服务机器人,存在巨大的增量空间
» 服务器人提供助力点,解决医疗服务业的企业端和顾客端痛点
» 服务器人提供助力点,解决餐饮快消业的企业端和顾客端痛点
» 服务器人提供助力点,解决酒店旅游业的企业端和顾客端痛点
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728