|
|
| 当前位置:首页 > 大模型机器人 > 像人一样家庭大模型机器人的关键模块:异构数据协同训练(数据策略)、两阶段训练管线(训练策略)、分层推理架构(模型设计) |
像人一样家庭大模型机器人的关键模块:异构数据协同训练(数据策略)、两阶段训练管线(训练策略)、分层推理架构(模型设计) |
| 来源:Physical Intelligence 时间:2026/3/12 |
|
家庭大模型机器人不局限于单一机器人的数据,而是构建了一个异构数据混合体(Heterogeneous Data Mixture)。 1、数据大熔炉:将移动操作机器人(Mobile Manipulator)、静态机械臂、不同形态的机器人数据(Cross-Embodiment)、互联网图文数据(Web Data)以及高层语义任务预测(High-Level Prediction)全部扔进一个模型里训练。 2、两阶段进化:先通过海量杂乱数据进行预训练(Pre-training)获得通用常识,再通过高质量指令数据进行后训练(Post-training)学会听话和精细操作。 3、语义指导动作:模型不仅输出底层的关节指令,还预测高层的子任务(如“打开微波炉”),利用语言思维链来指导长程操作。 家庭大模型机器人π0.5 证明了机器人的泛化能力不需要奇迹,只需要足够丰富的数据“喂养”——当机器人看过了互联网上的万千世界,它自然也就懂得了如何收拾你家乱糟糟的卧室。
家庭大模型机器人的核心设计围绕如何让一个模型同时消化“书本知识”(Web Data)和“肌肉记忆”(Robot Action)。其实现聚焦三个关键模块:异构数据协同训练(数据策略)、两阶段训练管线(训练策略)、分层推理架构(模型设计)。 关键模块一:异构数据协同训练 (Co-training)这个模块要解决的,是“如何让机器人从别人的经验中学习”。 数据构成: MM (Mobile Manipulator) :本机型的移动操作数据。 ME (Multi-Environment) :其他非移动机器人在不同环境下的数据。 CE (Cross-Embodiment) :实验室环境下不同构型机器人的数据。 WD (Web Data) :互联网上的视觉问答(VQA)和检测数据,用于提升对陌生物体的认知。 HL (High-Level) :高层子任务预测数据,教机器人学会规划。 优势:如图 4 所示,这种混合策略让模型在面对从未见过的物体(Out-of-Distribution Objects)时,能利用 Web Data 中的常识进行推理,而不是傻眼。 关键模块二:两阶段训练与 FAST Tokenizer为机器人打造“通用大脑”与“专业小脑”。 1、预训练 (Pre-training) :目标是多样性。 混合了所有来源的数据,使用 FAST action tokenizer 将连续动作离散化,像训练 GPT 一样训练机器人预测下一个 Action Token。 2、后训练 (Post-training) :目标是专业化。 加入口头指令 (Verbal Instructions) 数据,专注于移动操作任务,剔除部分实验室数据,让模型适应真实家庭的嘈杂环境。 关键模块三:真实家庭环境验证展示了“Sim-to-Real”和“Lab-to-Home”的跨越。 实验设置: Mock Rooms:搭建了可复现的模拟房间进行定量测试。 Real Homes:Z硬核的部分。在 3 个完全陌生 的真实家庭(Real Kitchens & Bedrooms)中部署机器人。 表现:如图 7 所示,在“整理抽屉”、“收集衣物”、“洗碗”等任务中,家庭大模型机器人π0.5 展现了惊人的鲁棒性。它不仅能听懂“把衬衫放进篮子”这样的指令,还能连续工作 10-15 分钟 不掉链子。
|
| 相关推荐 |
|
»
Sim+to+Real,具身大模型的问题、现状与投资机会:本体厂,大厂和独角兽公司的大模型技术路径及进展
» 初级大模型机器人撬动人形机器人产业0-1落地,机器人模型的核心迭代方向是将动作模态融入 » 大模型机器人的语音模型:RT-1,PaLM-E,RT2,π系列 » 机器人大模型深度报告-我们距离真正的具身智能大模型还有多远,模型智能从数据堆料到结构优化的阶段 » 具身智能大模型产业的市场需求和应用领域:工业、医疗、物流等多个行业和应用场景 » 2025具身智能产业发展趋势研究及安全威胁分析报告:网络安全、数据安全、伦理安全等风险 » 银行大模型机器人《小安》,深耕智能化服务领域,不断迭代升级服务模式 » 商超大模型机器人聚焦三个关键模块:程序化商店与动态消耗模拟(环境构建)、海量资产与几何物理优化(底层加速)、长程任务与基准评测体系 » 将 VLA大模型部署于机器人:硬件适配与数据流,架构的微调对比,人机交互与容错验证 » 大模型机器人在农业场景中的应用:精准采摘,环境调控与水肥管理,病虫害智能监测与防控 » 大模型机器人的特点,以及优缺点 |
![]() ![]() ![]() |
![]() |
|
|
|||||||||||||||||||||||||||||||||||||||||
| 版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |