“具身智能”是指将人工智能融入机器人等物理实体,赋予它们感知、学习和 与环境动态交互的能力。在人工智能与物理世界深度融合的当下,具身智能正以颠 覆性姿态重塑产业格局。具身智能通过赋予机器“大脑”,使其具备感知、决 策与执行的全栈能力,正在工业、医疗、服务等领域催生万亿J市场机遇。2025年, 具身智能被写入我国政府工作报告,标志着具身智能正式成为未来产业的重点 发展方向。目前,从层面到地方政府,我国出台了一系列政策措施,重点围绕 核心技术攻关、重点场景应用、资金和人才保障等方面,积极营造良好的发展环境, 积极推动具身智能产业飞速发展。整体来看,具身智能产业呈现多技术融合推动具 身智能系统能力泛化升J,具身智能数据生态向质量标准化、多元规模化、通用协 同化发展迈进,仿真平台大量涌现将重塑具身智能产业发展模式,具身智能机器人 应用场景分阶段商业化落地,材料革命重塑具身智能产品形态和场景应用等发展趋 势。然而,随着具身智能相关技术和产品的快速迭代,应用发展过程中也带来了网 络安全、数据安全、伦理安全等前所未有的安全风险。
本期阐梳理了国外具身智能产业发展情况,总结了我国具身智能产业发展情况、 面临的问题,分析了具身智能产业发展趋势,以及具身智能应用发展面临的安 全威胁,Z后从产业创新和安全风险应对两方面提出了对策与建议。
附件:2025具身智能产业发展趋势研究及安全威胁分析报告:网络安全、数据安全、伦理安全等风险

工业制造领域,具身智能凭借其独特优势提高了生产效率、保障产品质量;医疗服务领域,具身智能产品能从精准医疗和高效护理两方面发挥独特优势;智能家居领域带来智能化变革
机器人大模型的进展从RT-1实现端到端动作输出,再到PaLM-E 、RT2将多模态感知能力融合至统一模型空间,大模型已逐步具备“看图识意、理解任务、生成动作”的完整 链条
多模态具身语言模型PaLM-E展现出优秀的泛化能力和任务迁移性能;RT2采用经动作信息训练的VLA 模型,输出1-5Hz 的动作序列;π0/π0-Fast/π0.5: 引入动作专家,输出50Hz 动作轨迹
多模态大模型的突破,机器人首次具备了“感知—理解—决策”的潜力,通过融合图像/视频与语言等模态信息构建起跨模态的统一表征体系,机器人模型的核心迭代方向,是将动作模态融入现有的视觉语言模型
梳理了部分布局者的大模型及本体进展,对比本体厂、大厂和独角兽公司的大模型技术路径及进展;各公司对垂直行业的深度理解、丰富场景和海量数据,实现具身智能在垂直场景的率先落地
异构数据协同训练是如何让机器人从别人的经验中学习;两阶段训练为机器人打造通用大脑与专业小脑;真实家庭环境验证在“整理抽屉”、“收集衣物”、“洗碗”等任务中表现
商超大模型机器人在仿真器中复现一个极度拥挤且充满变数的零售商超环境。其实现聚焦三个关键模块:程序化商店与动态消耗模拟(环境构建)、海量资产与几何物理优化(底层加速)、长程任务与基准评测体系(验证闭环)
软体具身适配与多视角构建,设置了传统的刚性机械臂和软体机器人;大模型的部署与性能对抗;模型控制软体机器人执行极高风险的“给人类嘴里喂棉花糖”任务
大模型机器人通过准确识别-三维定位-轻柔采摘大幅提升采摘效率与品质;大模型机器人通过实时感知与动态决策,实现按需调控、准确供给;大模型机器人通过早期监测与准确防控,有效降低病虫害损失
大模型机器人能理解复杂、口语化的指令,支持多轮对话和上下文记忆;实现跨模态信息整合;大模型机器人可将指令拆解为可执行步骤;具备在线学习能力,能不断优化行为策略