投资者关系

当前位置：首页 > 机器人开发 > 大模型与智能机器人结合,用语言指导机器人抓取物体

大模型与智能机器人结合,用语言指导机器人抓取物体

来源：CAAI认知系统与信息处理专委会时间：2023/9/6

从斯坦福大学的 VIMA 机器人智能体，到谷歌 DeepMind 推出控制机器人的视觉 - 语言 - 动作（VLA）的模型 RT-2，大模型加持的机器人研究备受关注。

当前，自监督和语言监督的图像模型已经包含丰富的世界知识，这对于泛化来说非常重要，但图像特征是二维的。我们知道，机器人任务通常需要对现实世界中三维物体的几何形状有所了解。

基于此，来自 MIT CSAIL 和 IAIFI 的研究者利用蒸馏特征场（Distilled Feature Field，DFF），将准确的 3D 几何图形与来自 2D 基础模型的丰富语义结合起来，让机器人能够利用 2D 基础模型中丰富的视觉和语言先验，完成语言指导的操作。

论文地址：https://arxiv.org/abs/2308.07931

具体来说，该研究提出了一种用于 6-DOF 抓取和放置的小样本学习方法，并利用强大的空间和语义先验泛化到未见过物体上。使用从视觉 - 语言模型 CLIP 中提取的特征，该研究提出了一种通过开放性的自然语言指令对新物体进行操作，并展示了这种方法泛化到未见过的表达和新型物体的能力。

研究团队用一个讲解视频详细介绍了 F3RM 方法的技术原理：

相关推荐

» Nature Materials: 胶体机器人，小小身体却无穷潜力
» 由主动学习和AI驱动的智能自主实验[Nature Reviews Materials评论文章]
» 软体手的多模态感知 Advanced Functional Materials
» 2023人形机器人技术专利分析报告-技术范围、核心权利人及相关产品、专利数据
» 人形机器人擎天柱Optimus只申请外观设计专利（共 5 件）
» 工控&机器人系列深度-人形机器人空心杯电机：迎国产替代机遇
» 中国人形机器人研发团队-24支机器人团队介绍
» 人形机器人BOM拆解分析-三大核心部分
» 人形机器人整体构造及成本拆解：执行系统较为关键
» 人形机器人执行系统之线性执行器-行星滚柱丝杠
» 人形机器人执行系统之旋转执行器-减速器
» 人形机器人执行系统之灵巧手-空心杯电机

分类导航

== 资讯 ==

» 2025年度重庆市人工智能应用场景
» 2026具身智能操作系统技术白皮书
» 2026十大央国企AI+场景标杆案
» 四足机器人场景应用发展蓝皮书-市场
» 迎宾机器人的位置传感器：电位器、光
» 人形机器人上岗餐饮酒店服务场景（如
» 智能清洁机器人在商业综合体清洁场景
» 中国人工智能系列白皮书—-具身智能
» 腰部外骨骼机器人,20kg的攀登与
» 室内安防巡检机器人的数据中心巡检场
» 光伏机器人清洁太阳能板的七大优点：
» 2025上海智能机器人百大场景案例
» 具身大模型：人形机器人智慧内核,主
» 具身智能数据行业研究白皮书2026
» 2025上海市“AI+制造”发展白


网站首页
关于创泽	公司简介资质荣誉企业文化
新闻资讯	公司新闻 [机器人新闻董事长新闻比赛与荣誉类] 行业动态
解决方案	商用服务机器人陪护机器人安防机器人智能医疗机器人党建机器人
服务支持	常见问题下载
人才招聘	招聘信息精彩瞬间
党群建设	党建活动工会活动其他活动
商务合作	招募支持报名提交
联系我们	售后服务留言咨询

	北京·清华科技园C座五楼

	山东省日照市开发区太原路71号

版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心：北京·清华科技园C座五楼生产研发基地：山东日照太原路71号电话：4008-128-728