家庭大模型机器人不局限于单一机器人的数据,而是构建了一个异构数据混合体(Heterogeneous Data Mixture)。
1、数据大熔炉:将移动操作机器人(Mobile Manipulator)、静态机械臂、不同形态的机器人数据(Cross-Embodiment)、互联网图文数据(Web Data)以及高层语义任务预测(High-Level Prediction)全部扔进一个模型里训练。
2、两阶段进化:先通过海量杂乱数据进行预训练(Pre-training)获得通用常识,再通过高质量指令数据进行后训练(Post-training)学会听话和精细操作。
3、语义指导动作:模型不仅输出底层的关节指令,还预测高层的子任务(如“打开微波炉”),利用语言思维链来指导长程操作。
家庭大模型机器人π0.5 证明了机器人的泛化能力不需要奇迹,只需要足够丰富的数据“喂养”——当机器人看过了互联网上的万千世界,它自然也就懂得了如何收拾你家乱糟糟的卧室。
家庭大模型机器人的核心设计围绕如何让一个模型同时消化“书本知识”(Web Data)和“肌肉记忆”(Robot Action)。其实现聚焦三个关键模块:异构数据协同训练(数据策略)、两阶段训练管线(训练策略)、分层推理架构(模型设计)。
这个模块要解决的,是“如何让机器人从别人的经验中学习”。
数据构成:
MM (Mobile Manipulator) :本机型的移动操作数据。
ME (Multi-Environment) :其他非移动机器人在不同环境下的数据。
CE (Cross-Embodiment) :实验室环境下不同构型机器人的数据。
WD (Web Data) :互联网上的视觉问答(VQA)和检测数据,用于提升对陌生物体的认知。
HL (High-Level) :高层子任务预测数据,教机器人学会规划。
优势:如图 4 所示,这种混合策略让模型在面对从未见过的物体(Out-of-Distribution Objects)时,能利用 Web Data 中的常识进行推理,而不是傻眼。
为机器人打造“通用大脑”与“专业小脑”。
1、预训练 (Pre-training) :目标是多样性。
混合了所有来源的数据,使用 FAST action tokenizer 将连续动作离散化,像训练 GPT 一样训练机器人预测下一个 Action Token。
2、后训练 (Post-training) :目标是专业化。
加入口头指令 (Verbal Instructions) 数据,专注于移动操作任务,剔除部分实验室数据,让模型适应真实家庭的嘈杂环境。
展示了“Sim-to-Real”和“Lab-to-Home”的跨越。
实验设置:
Mock Rooms:搭建了可复现的模拟房间进行定量测试。
Real Homes:Z硬核的部分。在 3 个完全陌生 的真实家庭(Real Kitchens & Bedrooms)中部署机器人。
表现:如图 7 所示,在“整理抽屉”、“收集衣物”、“洗碗”等任务中,家庭大模型机器人π0.5 展现了惊人的鲁棒性。它不仅能听懂“把衬衫放进篮子”这样的指令,还能连续工作 10-15 分钟 不掉链子。
![]() |
| 机器人底盘 Disinfection Robot 消毒机器人 讲解机器人 迎宾机器人 移动机器人底盘 商用机器人 智能垃圾站 智能服务机器人 大屏机器人 雾化消毒机器人 展厅机器人 服务机器人底盘 具身智能教育机器人 智能配送机器人 导览机器人 |