当前大多数人形机器人仍处于展示阶段,核心瓶颈在于智能程度不足。 一旦具备初步智能化能力, 机器人即可在特定场景中落地应用,并通过任务反馈不断优化模型,开启数据飞轮与产品迭代循 环,从0-1迈向1-100的演化。
数据飞轮是驱动智能系统能力提升的核心机制。 本质是“收集数据—改进模型—提升产品—吸引 更多用户和数据—再次改进”的正向循环,有望带动人形机器人快速迈入迭代加速期。
随着多模态大模型的突破,机器人次具备了“感知—理解—决策”的潜力,被视为拥有“大脑”的关键起点。大语言 模型 (LLM) 的成功,验证了通过大规模互联网文本训练神经网络具备推理能力的可行性;而视觉语言模型 (VLM) 进一步拓展模态边界,使模型可以“看懂图像、理解语言”。 LLM 专注于文 本推理,VLM 则通过融合图像/视频与语言等模态信息,构建起跨模态的统一表征体系,从而支持 模型理解现实世界的更多维度。
动作模态的融入,让模型端真正赋予机器人执行操作的能力。 仅能感知、理解世界并不是机器人 大脑的终极目标,机器人的Z终目标是在认知的基础上实现与现实世界的动作交互。目前机器人模型的核心迭代方向,是将动作模态融入现有的视觉语言模型。
现阶段人形机器人仅在智能化的初J阶段。北京市人形机器人创新中心牵头,联合上海市、浙江 省人形机器人创新中心,以及优必选、宇树科技、ZG信息通信研究院、工业互联网研究院等多 家头部企业与科研机构,共同制定了个《人形机器人智能化分J》标准,从感知、决策、 执行、协作四维度划分L1-L5五J。目前主流产品智能水平普遍仅在L2左右,尚未具备自主泛化 与应变能力。未来向更高智能等J进化仍需突破模型、数据与算力多重门槛。 真正实现通用智能 机器人仍有较长路径要走,需在技术、数据体系和生态协同上持续积累。
![]() |
| 机器人底盘 Disinfection Robot 消毒机器人 讲解机器人 迎宾机器人 移动机器人底盘 商用机器人 智能垃圾站 智能服务机器人 大屏机器人 雾化消毒机器人 展厅机器人 服务机器人底盘 具身智能教育机器人 智能配送机器人 导览机器人 |