在人类的具身活动中,“大脑”“小脑”与“本体”协 同运作:大脑主导感知、记忆、学习与决策,小脑负责运动协调与精细控制,而本体则提供与外部环境互动的物理基础。这种紧密协作机制为具身智能系统的设计提供了重要的生物学启发,尤其是人类大脑相关脑区在具身活动(如环境中导航、与物体交互)中表现出的特定激活模式与功能分工,为具身系统“大脑”架构构建提供了参考,如图2(a) 所示。
在具身活动中,位于大脑半球中部,沟后方D 叶是人类感知的重要脑叶之一。D叶感觉处理区接收 并整合来自皮肤、关节和肌肉的触觉与感觉信号,角回 负责处理空间关系与抽象符号,将三维环境的内在逻 辑与数学符号转化为空间认知²。此外,位于大脑半球 后部的枕叶,专注于视觉信息的深度解演,其中所包含 的初J、次J和高J视皮层如同像素解析器,将光线分 解为轮廓、色彩与运动轨迹。同时枕叶中的视觉处理 区进一步识别物体概念与场景语义。
在学习与记忆层面,颞叶内的海马体是人脑的记 忆中枢。海马体实现学习和记忆的生物学基础是神 经的可塑性3。这种可塑性包含多种机制,长时程增强 机制强化与情境信息相关的突触通路,而长期未强化 的冗余连接则被长时程抑制修剪,使神经网络在感知 刺激下不断重塑,这些机制让海马体将感官信息与情 境细节编织成情景记忆。海马体相邻的杏仁核为记忆 赋予情感权重并推动短期记忆向长期存储转化。同时 记忆需要在学习后的离线阶段(如睡眠)通过“重放”活 动来巩固46。通过人脑的学习与记忆的过程,人类就 可以形成记忆并用学到的信息完成后续的决策任务7。
在决策与行动层面,近年来的研究表明,决策并非 某一个脑区的“d角戏”,而是全脑范围内的共同任务。前额叶皮层作为参与决策层面的重要脑区8,可以 评估信息价值并抑制冲动反应,同时调度工作记忆暂 存多任务信息。海马体通过θ波节律实现和位于额叶 的眼窝额皮质的同步,共同参与到决策当中9。由多个 脑区结合产生的决策,会通过运动皮层等区域将决策 转化为动作序列,Z终完成行动过程。
为了使具身智能系统可以像人类一样完成具身活 动,具身智能系统应包括感知、记忆与学习、决策三大核心功能模块,如图2(b) 所示,它们彼此紧密协作,形成类似人脑的感知、记忆与学习、决策的闭环。
感知模块是系统获取外界信息的门户。它模拟人 脑中枕叶和D叶等区域的功能,负责采集和处理来自 外部环境的多模态信息(如视觉、听觉、语言等),并结 合上下文对信息进行解析。这一过程不仅为后续的记 忆与决策提供输入,也通过实时感知支持短期反应和 环境适应,是具身智能系统感知与理解世界的基础。
记忆与学习模块承担着对环境知识的抽象和积 累,类似于人脑中海马体的作用,它通过对感知信息进 行场景建模与经验总结,形成对环境规律和交互情境 的内化知识。这些知识不仅包括对过去情境的存储, 也支持通过主动学习不断优化,实现知识的迁移与泛化。
决策模块类似人脑额叶的功能,承担综合判断与行动输出。它将来自感知的实时信息与记忆中的长期 知识进行融合,用于行为预测、任务规划、路径选择和 语言交互等操作,从而驱动系统产生具体的身体行 为。这一模块不仅是系统输出的“发动机”,也会根据 反馈调整未来的学习与感知重点。
这3个模块之间不仅存在信息传递关系,更构成了一个高度耦合、动态协同的整体认知结构。感知不 仅接收信息输入,还是决策过程的依据;记忆不仅存储 信息,还参与感知特征的选择与策略决策;决策不仅输 出行为规划,还通过自主学习调节感知关注的重点。 整个系统在具身活动过程中是一个不断循环迭代、自 我调节的认知体。
此外,上述具身系统大脑中的智能功能与身体行为和环境之间同样紧密耦合,大脑和身体通过行为与感知的持续循环而动态连接在一起。感知不仅是对视觉和语言的理解,更是服务于环境与身体,即视觉理 解要支持身体在环境中的避障,语言理解要引导身体 在环境中的交互行为,身体行为也会反过来影响智能 系统的认知状态。例如,身体位置和运动路径的变化 会重新定义观察坐标系与感知范围,从而改变对场景 的理解。这种耦合关系说明具身智能不只是大脑的产 物,而是大脑、身体和环境整体协调的结果。这种耦合 关系构成了具身智能系统d有的认知闭环,也是其区 别于传统离身式的感知与推理系统的根本所在。
![]() |
| 机器人底盘 Disinfection Robot 消毒机器人 讲解机器人 迎宾机器人 移动机器人底盘 商用机器人 智能垃圾站 智能服务机器人 大屏机器人 雾化消毒机器人 展厅机器人 服务机器人底盘 具身智能教育机器人 智能配送机器人 导览机器人 |