当前位置:首页 > 机器人开发 > 一种基于层次强化学习的机械手鲁棒操作
 

一种基于层次强化学习的机械手鲁棒操作

来源:CAAI认知系统与信息处理专委会    时间:2020/6/24
1.  研究背景

机械手内操作(in-hand manipulation)是指使用单只机械手,通过移动手指、手掌等部位来改变物体在手中的相对位置和姿态。这种能力对于机器人实现人类水平的灵巧操作J为重要,因为在日常生活中有很多类似的任务,例如抓取一件工具并调整它在手中的位置和旋转角度。我们注意到,在实现复杂的操作目标时,人在操作物体时常常改变抓取物体的手指接触点位置,从而J大的提G物体在手中的位姿范围。

传统上,手内操作有两类解决方案,一类是基于模型的方法(model-based method),通过对抓取的动力学建模,来控制手指移动带动物体姿态。这种办法好处在于稳定性强,模型简单,但问题在于难以实现较长和复杂的手内操作流程,特别是目标位姿和起始位姿相距很远的情况,因为它们很难规划手指接触点的移动;另一类方法是无模型方法(model-free method),通常使用深度强化学习的方法。这类方法优点在于不需要系统模型,但缺点在于稳定性差,并且需要大量数据进行训练。而我们的方法结合了这两种方法:在底层使用传统的动力学建模方式保持稳定的抓取和实现简单基本的操作单元,在中层通过深度强化学习来进行规划,选择不同的操作单元,终实现稳定且复杂的操作流程。我们的方法结合了两种方法的优点:在底层通过使用基于模型的操作单元,保证了手指与物体之间持续稳定的抓取;在中层使用强化学习进行规划,从而实现较长和复杂的手内操作流程。

 

2.  研究方法

在底层,我们使用柔性力矩控制器定义了三个操作单元,分别是reposing,sliding和flipping。Reposing是指在不改变手指与物体接触点的前提下,通过控制机械手改变物体的位姿;sliding是指在不改变物体位姿的前提下,沿着物体滑动指尖改变接触点;flipping是指将指头从一侧移动到另一侧,从而改变抓握方式。在中层,我们使用深度强化学习网络学习在给定目标位姿下选择底层操作单元,终形成一条由大量不同操作单元组成的序列,实现复杂的操作目标。



 
 
 
相关推荐
» 移动机器人Wang利用深度强化学习算法和视觉感知相结合的方法完成非结构环境下的移动
» 移动操作机器人Centauro通过融合自身携带的多传感器信息可实现自主移动和抓取操作
» 机器人手腕的系列分享之一
» 机器人手腕的系列分享之二
» 机器人手腕的系列分享之二自由度手腕
» 机器人手腕的系列分享之三自由度手腕
» 串行腕关节与并行腕关节优缺点对比分析
» 假肢腕关节和机器人腕关节优缺点对比分析
» 柔软的灵巧手的设计、制备及驱动
» 服务机器人核心模块分析
» LDV激光测振与3D视觉传感在智能机器人中的应用
» 基于主动探索的智能抓取机器人
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号

扫码关注微信公众号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728