“小脑”的运动规划与控制是展厅迎宾讲解机器人实现自然和流畅动作的 关键。传统的基于模型的控制方法通过建立机器人的运动学和动力学模型,进行运动轨迹规划和平衡控制,特点是身体控制稳健,步频较慢,代表算法有零力矩点(ZMP,Zero Moment Point)算法、线性倒 立摆(LIP,Linear Inverted Pendulum)算法、模型预测控制(MPC, Model Predictive Control)算法、中心引力优化(CFO,Central Force Optimization)算法等,但整体开发较为复杂,成本高,不利于产品快 速迭代。基于学习的控制方法则使用端到端的人工智能技术,代替复 杂的运动学模型,大幅度降低了“小脑”开发难度、提升了迭代速度, 一般通过人类示教或自主学习建立运动执行策略。其中通过人类示教 的方式也称为模仿学习,指通过人或者其他专家提供反馈示教的方式, 使机器人以产生与示教相似的行动策略进行学习,效果依赖高质量示范数据。通过自主学习的方式也称为强化学习,指通过精心设计学习 目标,机器人不断在环境中探索逐渐发现最大化奖励的方式学习到最 优的执行策略,效果依赖于仿真环境。
目前主要的“小脑”技术路线包括以下几种。
基于模型的控制方法:
ZMP判据及预观控制。基于简化的倒立摆模型/小车模型进行质 心点运动规划和控制。该算法需要精确的动力学模型和复杂的在线控 制策略,扰动适应性差。典型代表有日本本田、AIST 的相关产品。
混杂零动态规划方法。通过在全身动力学模型上采用非线性控制, 根据状态选择步态,进行轨迹跟踪控制。该算法需要精确的动力学模 型和线性化反馈,实时求解慢,对复杂环境适应性差。典型代表有美 国俄勒冈州立大学的相关产品。
虚拟模型解耦控制。将控制解耦为速度、姿态、高度等,建立弹 簧阻尼等虚拟模型进行力矩控制。该算法降低了对精确动力学模型的 依赖,但融合复杂,对复杂环境的容错能力有限。典型代表为波士顿 动力的相关产品。
模型预测控制+全身控制。基于简单/复杂的动力学模型进行力的 预测控制,进而全身优化,可实现臂足协同及物体接触。该算法依赖 精确动力学模型和状态估计,线性模型仅适用于下肢单一步态的控制, 而非线性模型求解速度慢。典型代表有美国麻省理工学院、瑞士苏黎 世联邦理工大学和波士顿动力公司的相关产品。
基于学习的控制方法:
强化学习。通过奖励设计和仿真环境设计,实现了受控步态、奔 跑、转弯、上下台阶等运动学习,提升运动的鲁棒性,并可以通过采 用因果 Transformer 模型,从观测和行动的历史中对未来行动进行自 回归预测来训练。典型代表如 Agility Robotics 的相关产品。
模仿学习。采用非线性最优化求解的动作映射,以人机关节轨迹 相似为目标,以机器人可执行性、安全性、稳定性判据为约束,规划 运动方案。该算法计算耗时长,严重依赖初值,对碰撞检测难以解析 计算。典型代表有日本 AIST、北京理工大学的相关产品。
机器人底盘 Disinfection Robot 消毒机器人 讲解机器人 迎宾机器人 移动机器人底盘 商用机器人 智能垃圾站 智能服务机器人 大屏机器人 雾化消毒机器人 紫外线消毒机器人 消毒机器人价格 展厅机器人 服务机器人底盘 核酸采样机器人 智能配送机器人 导览机器人 |