创泽机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人知识 > 自然语言处理技术发展趋势进一步推动人工智能从感知智能向认知智能的演进

自然语言处理技术发展趋势进一步推动人工智能从感知智能向认知智能的演进

来源:阿里机器智能     编辑:创泽   时间:2020/6/23   主题:其他 [加盟]
2020 趋势:NLP 进一步推动人工智能从感知智能向认知智能的演进

站在新的一个十年,智能人机交互、多模态融合、结合领域需求的 NLP 解决方案建设、知识图谱结合落地场景等将会有突破性变化。

1  智能人机交互

语言模型将在智能人机交互中扮演更重要的角色,形成更丰富的形式,混合 100 种语言的多语言语言模型,以及融合图像-文本和语音-文本多模态语言模型将崭露头角,在不同语言、不同模态、不同领域的小样本场景下带来全面的能力提升。

多语言交互从不同语言理解上升到不同文化的理解,通过跨文化理解技术深入当地文化实现地道的对话交互。

以在线文本为核心的交互方式将全面转变为结合视频、图像、语音、文本的多模态人机交互。

基于数据驱动的对话状态跟踪和对话策略将逐渐替代规则式策略,使得多轮对话技术进一步演进,带来更自然的对话体验。

知识图谱将广泛融入问答和对话的各类深度学习模型,通过先验知识及推理能力的融入,使得模型更为白盒化,在对话的理解和生成过程中带来更好的可控性和可解释性。

对话系统在小样本情况下的冷启动能力提升带来应用构建成本的大幅下降,对话系统从主要为大体量的客户服务,拓展为更普惠的、广泛的支持海量规模、各行业的小企业及小商家,并进一步走向海外,使得更多不同国家、不同语言和不同文化的用户进入智能服务时代。

2  多模态融合

随着 5G 和边缘计算的逐步成熟和普及,将带来视频、图像、文本、语音等模态的全面融合,语言模型朝着多模态融合的方向发展,在在线场景下实现混合模态的理解,将能融合理解用户经过多轮对话发送的图片、语音和文字内容,并以多模态的形式进行回复;

对话系统产品中将全面实现多模态交互能力,直播和 IOT 大屏交互将全面应用视频+图像+文本多模态技术带来丰富的交互体验,流畅的全双工语音对话机器人将被普遍应用,实现边听边想、边听边猜、主动抢话等类人交互能力。

在语音交互场景下通过声学信号+文字信号,识别用户交流中的情绪变化, 在 IOT 互动场景下实现基于摄像头、麦克风的拟态生命;

3  结合领域需求的NLP解决方案建设

过去 NLP 算法多以平台/API 的方式输出通用模型,相应地也在各种云上建立了通用 NLP 算法平台(Amazon Comprehend,微软 Azure Text Analytics,谷歌云 Natural Language,阿里 NLP,百度 NLP 等)。

但是在业务场景中,每种场景领域都有自己的特定的需求,产生了相应的场景数据。通用模型结合场景数据进行领域自适应训练,从而输出的领域定制模型会更好地满足业务需求。

4  知识图谱结合落地场景

面向新的一个十年,通过 NLP 和知识图谱两大核心技术来构建行业知识图谱,机器能够通过知识图谱挖掘隐性关系,洞察“肉眼”无法发现的关系和逻辑,用于最终的业务决策,实现更深层次的业务场景落地。从发展方向来说,可以分为下面几个方面:

优化知识抽取能力:结合已有的知识和 NLP 技术能力进一步提高非结构化数据理解能力,应用预训练语言模型、信息抽取、实体链接等相关的技术,对非结构化及半结构化数据进行抽取和转换,形成知识图谱形式的知识,以及和知识图谱里面的结构化的知识进行链接。

与行业知识沉淀:在行业知识图谱解决方案实际的落地过程中,面临重重挑战,行业知识图谱的构建,本身就需要数据积累和基于业务场景的数据理解,而构建和积累行业知识图谱,将是认知智能时代的核心竞争力。在行业数据构建时,对知识的准确性要求非常高,实体通常需要较多且具有行业意义。需要针对多源异构数据融合,基于可动态变化的“概念—实体—属性—关系”数据模型,对各种类型的数据进行抽象建模。

智能可信的知识推理:基于过去已知知识进行知识推理,理解行业事件知识驱动知识推理传导,利用行业规则逻辑结合深度模型进行推理,使其能够在业务的推理和辅助决策上带来更加智能化的体验。

以上是我们对于 NLP 技术过去一年发展的回顾和今年趋势的思考。一家之言难免疏漏或者以偏概全。抛砖引玉,希望能够得到更多同学们的思考和指正。比尔·盖茨曾说过,“语言理解是 人工智能 皇冠上的明珠”。要达到这样的高度,还需要技术和应用上的突破发展期待在下一个十年的开始,我们一起让 NLP 技术发展更加迅速,应用场景更加丰富,推动认知智能的发展更进一步。





中国移动室内定位白皮书

中国移动联合产业合作伙伴发布《室内定位白皮书》,对室内定位产业发展现状及面临的挑战,深入分析了垂直行业的室内定位需求,并详细阐述了实现室内定位的技术原理, 及室内定位评测体系

传感器面临时代新机遇,未来发展将呈现哪些趋势

机器人、无人机、自动驾驶汽车等加快落地,智慧城市深入建设,更是为传感器产业带来了难以估量的庞大机遇

仿人操作机器人Cosero配备7自由度机械臂装有Kinect相机实现对目标环境的3D感知

Cosero是德国波恩大学的Sven Behnke团队根据家庭环境中的日常操作任务而研制的一款仿人操作机器人基于深度学习方法的目标姿态估计和RGB-D SLAM等感知测量

移动式操作机器人平台Personal Robot 2可模拟开门、打台球和画画

机器人的学习分为三个部分的轨迹预测包括示教者的手部运动轨迹、示教者的身体移动轨迹以及被操作物体的运动轨迹

Jupiter由四轮独立转向的底盘和UR5机械臂组成通过SSD网络检测目标物体

通过2D激光雷达信息采用Hector SLAM实现机器人对地图的感知和自主导航规划,通过顶部的RGB-D相机采集目标物体深度和RGB图像信息

野外自主农作物探测机器人Robotanist使用扩展卡尔曼滤波器(EKF)方法融合MTI等传感器信息

驱动系统由4个200W无刷直流电机构成,通过50:1的空心轴减速机可以最高达2m/s的速度在玉米、高粱等农作物的地里前进

视频搜索太难了!阿里文娱多模态搜索算法实践

视频搜索是涉及信息检索、自然语言处理(NLP)、机器学习、计算机视觉(CV)等多领域的综合应用场景

浅谈服务机器人的潜在危险

服务机器人潜在危险有:电击、与能量有关的危险、着火、与热有关的危险、机械危险、辐射、化学危险等

个性化的人机交互

HRI的MTL可以使机器人更轻松,更智能地与新用户进行交互,即使使用诸如RL这样的数据密集型方法,也可以避免社交交互失败的不利影响。MTL和多模态ML已用于自动识别自闭症谱系障碍(ASD)儿童

优必选专家丁宏钰深入讲解大型仿人机器人整机构型

从大型仿人机器人整机构型国内外研究现状入手,围绕机器人整机构型、关节运动特点、伺服驱动器、减速器、仿真平台等方面进行深度讲解,最后就大型仿人机器人整机构型未来发展趋势给出自己的见解

优必选科技副总裁庞建新:面向智能机器人的视觉感知与理解

智能机器人视觉方面的工作,主要体现在感知、理解、学习及推理4个方面,涉及到目标检测、目标追踪、人体姿态估计、人脸识别、行为识别、推理等技术

基于康复机器人内部传感器的运动功能评价方法

基于康复机器人内部传感器识别记录训练过程中的运动学参数,能够实时定量评估不同的运动模式,还能够掌握患者是否主动参与训练等情况
资料获取
机器人知识
== 最新资讯 ==
ChatGPT:又一个“人形机器人”主题
ChatGPT快速流行,重构 AI 商业
中国机器视觉产业方面的政策
中国机器视觉产业聚焦于中国东部沿海地区(
从CHAT-GPT到生成式AI:人工智能
工信部等十七部门印发《机器人+应用行动实
全球人工智能企业市值/估值 TOP20
创泽智能机器人集团股份有限公司第十一期上
谐波减速器和RV减速器比较
机器人减速器:谐波减速器和RV减速器
人形机器人技术难点 高精尖技术的综合
机器人大规模商用面临的痛点有四个方面
青岛市机器人产业概况:机器人企业多布局在
六大机器人产业集群的特点
机械臂-高度非线性强耦合的复杂系统
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人招商 Disinfection Robot 机器人公司 机器人应用 智能医疗 物联网 机器人排名 机器人企业 机器人政策 教育机器人 迎宾机器人 机器人开发 独角兽 消毒机器人品牌 消毒机器人 合理用药 地图
版权所有 创泽智能机器人集团股份有限公司 中国运营中心:北京 清华科技园九号楼5层 中国生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728