计算机视觉(CV)和自然语言处理(NLP)早先是两个较为d立的研究L域。CV 重点关注如何用计算机代替人眼对目标完成识别、跟踪、测量等任务,对图像进行处理;NLP 则研究计算机如何处理、运用自然语言,包括语言生成、问答、对话等任务。近年来,以深度神经网络为代表的机器学习和模式识别技术被广泛应用于 CV 和 NLP L域,取得了目前先进的效果。
近年来,研究者们试图将动作控制也引入到「视觉-语言」任务的框架中。吴琦将此类任务命名为 V3A(Vision, Ask, Answer, Act),在给定视觉输入后,我们希望机器能够提出问题、回答问题、并通过和人以及机器之间的语言交流执行某些动作。
例如,「Vision+Ask」的任务包含视觉问题生成、根据问题生成查询、图像描述等;「Vision+Answer」的任务包含视觉问答、视觉对话等;「Vision+Act」的任务包含指称表达、视觉对齐(visual grounding)、语言引导的视觉导航、具身视觉问答、具身指称表达等。
资料获取 | |
服务机器人在展馆迎宾讲解 |
|
新闻资讯 | |
== 资讯 == | |
» 各地主要人形机器人政策及核心内容 | |
» 人形机器人的产业布局特点:核心突破-特色 | |
» 国产人形机器人:多维共振 应用场景落地加 | |
» 机器人底盘设计同步驱动结构的轮子装配 | |
» 移动机器人轮子类型的选择,轮子的结构和装 | |
» 轮式引导机器人的轮子设计方案:四种轮子类 | |
» 六腿机器人(六脚)设计案例参考:Laur | |
» 四腿机器人机器狗设计案例参考:AIBO, | |
» 双腿机器人(双脚)设计案例:SDR-4X | |
» 单腿机器人的优缺点:不需要协调,难是保持 | |
» 类人形机器人腿的构造与设计:腿的自由度提 | |
» 仿人形腿式移动机器人的优缺点:适合于粗糙 | |
» 迎宾前台机器人控制系统设计方案:电源系统 | |
» 迎宾机器人外形结构设计方案:卡通形象,触 | |
» 导引机器人内部之加速度和角加速度传感器, | |
== 机器人推荐 == | |
![]() 服务机器人(迎宾、讲解、导诊...) |
|
![]() 智能消毒机器人 |
|
![]() 机器人底盘 |
![]() |