机器人的技术创新任务主要在于人形机器人关键技术的突破,其中在人形机机器人本体上的重要技术任务在于开发基于人工智能大模型的人形机器人“大脑”与
开发控制人形机器人运动的“小脑”。大模型作为爆火的人工智能概念,推动了人形机器人大脑的形成,助力人形机器人具有人的感知、交互与决策能力;对
于控制系统仍在切入中。
感知、交互与决策
多模态大模型增强人机交互,实现
对人类意图的理解,对复杂外部环
境的理解与认知,助力形成决策:
大模型可直接用于对环境的理解, 并通过提示词使之输出结构化内
容如控制代码、任务分解等指令
利用多模态大模型对环境进行建
模, 实现具身智能对空间信息的
多模态理解
机器人能够从数据中学习决策与
规划策略,基础模型为机器人决
策与规划引入了丰富的先验知识。
控制
大模型在控制上的助力主要集中于大模型处理环境观察与提示,输出动作序
列,动作序列可以是一系列关节角度或末端执行器的位姿与夹爪开合数据,
这些序列将直接用于控制机器人的运动。
原生机器人大模型ERA-42, 展示了与自研五指灵巧手星动XHAND1 结合后的灵巧操作能力,能够完成超过100种复杂灵巧的 操作任务,是真正的具身大模型
普渡机器人提出了 Robot-to-Everything 架构,实现万物互联,全场景的智能生态;率先完成了专用、类人形、人形三类机 器人的完整产品布局
机器人像人一样使用工具的灵巧手,是提升机器人柔性操作能力的关键部件,是柔性制造避不开的一环;灵巧手工程量占据Optimus工程量的50%,灵巧手是机器人走向“好用”的关键
欠驱动手硬件集成度G,整体系统简洁G效、体积小、质量轻,便于进行动力学分析;存在功能性不足,对于精度要求比较G的手指精巧控制无法胜任
具有完全可重复的运动轨迹,适合某些功能性和精细操作较G的场合,在工业场合, 例如组装、测量等情况下有更好的表现,没有合理的运动学分析控制时,整体的灵活性差
机器人的触感灵巧手Linker Hand具备20个主动自由度,包括柔性电子皮肤,实现精细触觉感知,构建大的灵巧操作数据集,包含了大量的人手操作数据,覆盖了各 种复杂的抓取和操作任务
当人们认为机器人是有意图的代理时,他们的大脑以类似的方式处理自己和机器人的行动结果,意图归因在人机交互中起着至关重要的作用,可能包括通过言语指令等非交互性手段来调整人们对机器人意图的感知
移动机器人系统用于解决探索性化学中的三个主要问题以及根据数据决定下一步做什么,移动机器人做出与人类研究人员相同或相似的决定比人类快得多
大模型可加快人形机器人复杂任务训练速度,提升任务生成速度及缩短理解周期;1 提升人形机器人语言处理能力 2 提升人形机器人场景理解能力 3 提升人形机器人运动控制能力 4 提升人形机器人数据训练能力
NLP 大模型在语言的歧义、文化差异及多样化、情感分析困难;CV 大模型算法处理复杂;多模态大模型融合不同模态的信息并提G模型的标识能力
NLP 大模型是人工智能L域的重要研究方向,CV大模型是指基于深度学习的计算机视觉模型,多模态大模型是指将文本、图像、视频、音频等多模态信息联合起来进行训练的模型
机器人大脑提G人形机器人的人-机-环境共融交互能力,支撑全场景落地应用;机器人小脑提升人形机器人非 结构化环境下全身协调鲁棒移动、灵巧操作及人机交互能力