|
|
当前位置:首页 > 机器人开发 > 大模型与智能机器人结合,用语言指导机器人抓取物体 |
大模型与智能机器人结合,用语言指导机器人抓取物体 |
来源:CAAI认知系统与信息处理专委会 时间:2023/9/6 |
从斯坦福大学的 VIMA 机器人智能体,到谷歌 DeepMind 推出控制机器人的视觉 - 语言 - 动作(VLA)的模型 RT-2,大模型加持的机器人研究备受关注。 当前,自监督和语言监督的图像模型已经包含丰富的世界知识,这对于泛化来说非常重要,但图像特征是二维的。我们知道,机器人任务通常需要对现实世界中三维物体的几何形状有所了解。 基于此,来自 MIT CSAIL 和 IAIFI 的研究者利用蒸馏特征场(Distilled Feature Field,DFF),将准确的 3D 几何图形与来自 2D 基础模型的丰富语义结合起来,让机器人能够利用 2D 基础模型中丰富的视觉和语言先验,完成语言指导的操作。 论文地址:https://arxiv.org/abs/2308.07931 具体来说,该研究提出了一种用于 6-DOF 抓取和放置的小样本学习方法,并利用强大的空间和语义先验泛化到未见过物体上。使用从视觉 - 语言模型 CLIP 中提取的特征,该研究提出了一种通过开放性的自然语言指令对新物体进行操作,并展示了这种方法泛化到未见过的表达和新型物体的能力。 研究团队用一个讲解视频详细介绍了 F3RM 方法的技术原理:
|
相关推荐 |
»
Nature Materials: 胶体机器人,小小身体却无穷潜力
» 由主动学习和AI驱动的智能自主实验[Nature Reviews Materials评论文章] » 软体手的多模态感知 Advanced Functional Materials » 2023人形机器人技术专利分析报告-技术范围、核心权利人及相关产品、专利数据 » 人形机器人擎天柱Optimus只申请外观设计专利(共 5 件) » 工控&机器人系列深度-人形机器人空心杯电机:迎国产替代机遇 » 中国人形机器人研发团队-24支机器人团队介绍 » 人形机器人BOM拆解分析-三大核心部分 » 人形机器人整体构造及成本拆解:执行系统较为关键 » 人形机器人执行系统之线性执行器-行星滚柱丝杠 » 人形机器人执行系统之旋转执行器-减速器 » 人形机器人执行系统之灵巧手-空心杯电机 |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |