当前位置:首页 > 机器人开发 > 大模型与智能机器人结合,用语言指导机器人抓取物体
 

大模型与智能机器人结合,用语言指导机器人抓取物体

来源:CAAI认知系统与信息处理专委会    时间:2023/9/6

从斯坦福大学的 VIMA 机器人智能体,到谷歌 DeepMind 推出控制机器人的视觉 - 语言 - 动作(VLA)的模型 RT-2,大模型加持的机器人研究备受关注。

当前,自监督和语言监督的图像模型已经包含丰富的世界知识,这对于泛化来说非常重要,但图像特征是二维的。我们知道,机器人任务通常需要对现实世界中三维物体的几何形状有所了解。

基于此,来自 MIT CSAIL 和 IAIFI 的研究者利用蒸馏特征场(Distilled Feature Field,DFF),将准确的 3D 几何图形与来自 2D 基础模型的丰富语义结合起来,让机器人能够利用 2D 基础模型中丰富的视觉和语言先验,完成语言指导的操作。

论文地址:https://arxiv.org/abs/2308.07931

具体来说,该研究提出了一种用于 6-DOF 抓取和放置的小样本学习方法,并利用强大的空间和语义先验泛化到未见过物体上。使用从视觉 - 语言模型 CLIP 中提取的特征,该研究提出了一种通过开放性的自然语言指令对新物体进行操作,并展示了这种方法泛化到未见过的表达和新型物体的能力。

研究团队用一个讲解视频详细介绍了 F3RM 方法的技术原理:



 
 
 
相关推荐
» Nature Materials: 胶体机器人,小小身体却无穷潜力
» 由主动学习和AI驱动的智能自主实验[Nature Reviews Materials评论文章]
» 软体手的多模态感知 Advanced Functional Materials
» 2023人形机器人技术专利分析报告-技术范围、核心权利人及相关产品、专利数据
» 人形机器人擎天柱Optimus只申请外观设计专利(共 5 件)
» 工控&机器人系列深度-人形机器人空心杯电机:迎国产替代机遇
» 中国人形机器人研发团队-24支机器人团队介绍
» 人形机器人BOM拆解分析-三大核心部分
» 人形机器人整体构造及成本拆解:执行系统较为关键
» 人形机器人执行系统之线性执行器-行星滚柱丝杠
» 人形机器人执行系统之旋转执行器-减速器
» 人形机器人执行系统之灵巧手-空心杯电机
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号

扫码关注微信公众号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728