需要注意的是,有时选择的示教方法和获取的数据类型与学习算法的选择有关。一方面来自多个模态的示范增加了维数,增加了学习的复杂性。数据的维数可以降低,但是有些信息被忽略,导致从示教数据中学习不当。另一方面,缺少传感模态可能会在一开始就提供不完整的信息,导致学习算法表现不理想。
GJ技能可以认为是一组低J技能或一组动作基元。除此之外,GJ技能还包括对象可视性,涉及构建物理世界对象和机器人动作之间关系的知识。GJ技能学习方法可以大致分为学习计划和学习目标。
1)学习计划:在这种GJ技能的学习方法中,学习计划为从初始状态到终状态的一系列动作。因此,动作是根据前置条件和后置条件定义的。前置条件为动作执行前的状态,后置条件为动作执行后的状态。除此之外,人类教师还用注释的形式提供附加信息。注释可以通过触觉、视觉或语义来提供。额外的信息允许更好地概括G水平的技能。可执行的动作可以是简单的低J技能,如抓住目标对象,拾起绿色的对象等,组合起来形成一个GJ任务,如排序绿色的对象。另一方面,有一些方法可以通过在示教数据中寻找重复的结构来从GJ技能示教中提取低J技能,这样就可以在不同的示教中识别它。在[2]中,一个示教学习范例是通过人类示教和在程序界面输入的用户目的来描述的。在[18]中,一些涉及一系列顺序旋转和转换的日常对象操作的示教被用来提取顺序的低J技能,并进一步构建一个计划。这项工作还示教了从一个对象到其他类似对象的学习知识转移。
	
2)学习目标:推断GJ技能的目标。人类教师提供的示教被用来推断执行GJ技能的意图。通过生成假设,可以从重复的示教中推断出目标。现代方法也使用基于奖励函数的强化学习方法来实现期望目标。如果奖励函数是从给定的示教中学习的,那么它就被认为是目标学习。一些基于强化学习的方法得到了很好的研究[19]。
	
3、讨论总结
技能的学习直接依赖于示教的准确性。大多数方法[20]手动消除了部分示教中的噪声。结合强化学习,在奖励和探索机制的基础上对技能学习进行改进。另一种改进技能的方法涉及示教者反馈[21]。当机器人在一个稍微不熟悉的情况下执行学习到的技能时,从人类教师那里得到关于执行技能可取性的反馈。目前为了实现这种技能细化的方法,研究人员主要从两个方面进行了研究:(1)控制机器人和人类教师之间的信息交互,(2)提供反馈。
	
| 资料获取 | |
智能教育机器人功能介绍  | 
       |
| 新闻资讯 | |
| == 资讯 == | |
| » 海南省中小学人工智能教育应用指南 (20 | |
| » 海南省推进中小学人工智能教育工作方案 ( | |
| » 服务机器人的应用:为人类生活和健康提供服 | |
| » 机器人的详细设计:控制方案,设计及驱动方 | |
| » 机器人的自由度,直接影响到机器人的机动性 | |
| » 机器人系统的结构:机械手、环境、任务 和 | |
| » 2025年智能焊接机器人产业发展蓝皮书: | |
| » 商用服务机器人控制系统的组成:任务规划, | |
| » 具身智能工业场景,精准、重复的任务流程成 | |
| » 智能机器人的传感器的种类:内部传 感器和 | |
| » 前台智能机器人对传感器的要求:基本性能要 | |
| » 各地对具身智能核心发展需求:产业端落地, | |
| » 2025年中国具身智能产业发展规划与场景 | |
| » 按控制方式进行分类,机器人分为二种:非伺 | |
| » 按机械手的几何结构进行分类,机器人分为三 | |
| == 机器人推荐 == | |
 
    服务机器人(迎宾、讲解、导诊...) | 
  |
 
    智能消毒机器人 | 
  |
 
    机器人底盘 | 
  
![]()  |