一般来说,服务机器人“嘴巴”(人机对话系统)由6个功能模块组成,其外形和系统 结构如图2.5所示。
(1)语音识别模块。该模块将从音频输入设备中获得的用户语音信号所包含的词汇 内容转换为计算机可以读的文本信息或命令。
(2)自然语言理解模块。得到的文本信息或命令需要经过语言理解模块的分析才能获取用户话语的语义信息,主要目的是将自然语言的表达形式转换成计算机内部所表示 的形式化语言,然后经过计算和推导后获取用户的意图。
(3)对话管理模块。人机对话系统是用户和计算机按照特定次序互相获取对方信息 来完成特定任务的过程,此过程要对话管理模块来进行有效的控制管理。其主要根据当 前用户的话语信息,结合领域知识和对话历史来确定用户意图,并决定系统下一步将要 采取的动作,如返回查询结果,对用户意图的猜测询问,出错提示等。
(4)后台服务处理模块。该模块完成系统的管理业务,例如数据库查询和管理等工 作。它在对话管理模块的控制之下工作。
5)自然语言生成模块。该模块用来将系统输出信息转换成用户可以理解的自然语言格式,将对话管理模块输出的询问、确认、澄清、查询结果信息等转变成用户能够理解 的自然语言。
(6)语音生成模块。语音生成也称为语音合成,该技术是将自然语言文本格式转换 成为语音格式,Z终以声音的方式将处理结果输 出给用户。下面介绍几个服务机器人“嘴巴”的 实例。
近年来,SCUT “智能计算机”科研团队也对 聊天机器人展开了研究,如图2.6所示。他们开 发的SCUT 聊天机器人包括摄像头及驱动模块、 语音拾取模块、语音识别模块、知识查询模块、语 音生成模块;摄像头捕获人脸图像,语音信号经 由语音拾取模块和语音识别模块后识别出语义,聊天机器人根据用户的语音来了解用户的需求,
然后通过知识查询模块来形成会话语句,再通过语音生成模块生成语音与用户进行交 流。该聊天机器具有语音识别和理解能力,它能够听懂用户指令,可以应用于学校、家 庭、宾馆、公司、机场、车站、码头、会议等地进行教育、聊天、会话、咨询等服务;它还可以 为用户提供宣传介绍、来访接待、办事查询、文秘服务、外语翻译等。
日本日立公司也研制了一台智能机器人EMIEW, 它的个头和小孩一样,依靠轮子移 动,如图2.7(a)所示。由于身上装有数码相机和雷达探测器,它可以自动地躲避障碍物。 同时它的词汇储备量达到100多个,能够对一些简单的声音指令做出反应,并且还能够 和人进行简单的对话交流,甚至播报天气预报等。第二代 EMIEW2 机器人可以通过无 线电装置接收指令,然后毫不费力地在办公室之间来回奔波,为办公室人员跑腿。它站 立时身高大约为31.5英寸,体重为29磅。它能够对障碍物应付自如,对人的语音做出 回应,并且一次充电后即可工作1小时。此外,能说5国语言的机器人及与人对话的机 器人也已经诞生了,如图2.7(b) 所示。在我国举办的日语演讲大赛现场上,参加比赛的 选手以及日语院校的学生不但与该机器人进行了交流互动,而且该机器人还献上了许多 精彩舞蹈和歌曲。
![]() |
机器人底盘 Disinfection Robot 消毒机器人 讲解机器人 迎宾机器人 移动机器人底盘 商用机器人 智能垃圾站 智能服务机器人 大屏机器人 雾化消毒机器人 展厅机器人 服务机器人底盘 具身智能教育机器人 智能配送机器人 导览机器人 |