|
|
| 当前位置:首页 > 机器人知识 > 机器人的 语音的生成、音响特征及语音分析,语音识别 |
机器人的 语音的生成、音响特征及语音分析,语音识别 |
| 来源:机器人[李明] 时间:2026/5/20 |
|
机器人的语音输入输出内容如图3-9所示。语音输入过程是一种模式识 别过程,先对空气振动引起的语音声波进行分析,然后抽取声波里的音响特征,模式识别以及限定语音之间的连接关系。正确无误地对连续的发音进行 一个一个语音识别是一件非常困难的事情,所以只能从不是那么准确的语音 序列或单词的识别去理解人的说话内容。因此,在机器人系统中所使用的语 音识别方法、韵律规则和语法规则等语言学方面的规则都是综合了各种知识 形成的,只有这样才能理解人说话表达的意思。可以把这种系统称为语音理 解系统。但是人的说话有时不那么明确,或者表达不那么清楚,这时机器人就 要通过语音合成装置在人说话内容不明确或不清楚的地方提出疑问并请求解 答,或对人的说话内容多次加以确认,采用这种方式构成的系统称为语音对话 系统。在语音对话系统中,虽然对人所发出的语音或单词的识别并不十分准 确,但通过对话和理解过程就能把人说话的内容传达给机器人。
一般来说,语音的生成过程分为三个阶段:声道内音源的发音;到声道出 口为止的声波的传递;从声道出口到语音接受点的声波辐射。发音的音源也 有三种:通过声带的振动引起声道内呼出的气流所产生具有近似周期性的断 续气流量的变化;当呼出的气流通过声道时,由于声道变窄而产生的声压变 化;把闭锁的声道突然开放而产生的阶跃型的音压变化。对元音而言,声道由 咽喉、口咽和口腔组成,并具有全极点的传递函数特性,每个极点的频率称为 共振峰频率,把这些共振峰频率依次编号为D一共振峰频率、第二共振峰频 率、第三共振峰频率等。 语音的特征有分节特征和韵律特征两种。在语音分节特征中,可以把元 音或辅音等每个单音作为语音的一个特征单位,因此可以根据声道的传递函 数和音源的种类对这些特征单位进行描述。在语音的韵律特征中可以把语音 的抑扬、强度、节奏和速度作为语音的一种特征单位。语音的抑扬可以用振动的基频来描述,语音的强度可以用音源的强弱来描述,而语音的节奏和速度则 可以用单音或停顿的持续时间来描述。 通过傅里叶变换对频率函数进行分析是一种基本的语音分析方法。这种 方法得出的结果是一种频谱特性,包括振幅频谱和相位频谱,但相位特性对语 音影响不大,所以一般仅用振幅频谱(简称频谱)来表示。因为语音特征是随 时间变化的,所以使用傅里叶变换对语音分析时,应截取有限长度的语音信号 进行分析。 孤立单呼语音识别系统的基本构成。该图所示系统只能 识别预先指定的有限个孤立单词,这种系统不是进行组成单词的音素的识 别,而是把单词整体作为一个单位来进行识别。输入系统的孤立单词语音用 随时间变化的函数来描述,通过某些数学运算把单词语音信号变换为语音特 征更为明确的参数序列,进行音响分析。经过变换后的单词语音通常用十几 维的向量序列来描述,即使同一说话者对同一单词进行发音,每次发音时的 向量序列长度也有可能不同。对单词整体而言,向量序列长度的伸缩不是线 性变化的,元音的稳定发音部分的长度容易引起伸缩,辅音部分和各个过渡 部分则保持相对的固有长度,因而描述单词的整个向量序列长度的伸缩呈非 线性的。 在单呼语音识别系统中,被识别对象的单词,都预先准备好其标准的特征 向量序列。这些特征向量序列叫做标准模式。所谓单呼语音识别,是把经过 变换后的输入单词的特征向量序列与各单词的标准模式之间的相似性(或距 离)逐一进行比较,Z后把相似性Z高的单词作为识别结果进行输出。把被识 别单词的特征向量序列与标准单词模式进行比较,计算两者的相似性的操作 过程称为“对照”或“匹配”。输入的单词和标准单词的模式的向量序列长度一 般有差异,两者进行匹配时不能单纯的线性伸缩把两者凑齐,需要根据在时间 轴上的非线性特点采用时间规整技术进行复杂的数学计算。 单呼语音识别系统有两种类型:以特定人为前提并随时进行语音调整的 系统和以非特定人为前提且不对语音进行特别调整的系统。前者叫做特定人 的单呼语音识别系统,后者叫做非特定人的单呼语音识别系统。在特定人的 单呼语音识别系统中,大多数情况下是把特定人所说的单词语音进行音响分 析再变换为特征向量序列,然后原封不动地将这个特征向量序列句作为标准 模式来使用。在特定人的单呼语音识别系统中,选择几个典型的单词特征向 量序列作为标准单词模式,或从多个标准单词模式中求出概率分布,Z后进行 统计判别。
|
| 相关推荐 |
|
»
机器人图像匹配的常用方法:极线约束,唯一性约束,视差连续性约束,顺序一致性约束
» 机器人的视觉技术:单目视觉、双目视觉和全景视觉 » 足式移动机器人独特的优势:适应能力,隔振能力,能耗较少 » 不同类型的机器人手臂的运动形式和特点:直线,伸缩、升降及横向,回转,上下摆动 » 机器人的手臂机构的要求:刚度要大、导向性要好、偏重力矩要小 » 迎宾机器人的低层控制的三种关键控制策略:阻抗柔顺控制,力/位混合控制,高频伺服与 PID 控制 » 迎宾机器人的动作的生成与运动学的三项核心技术:时序轨迹规划,逆运动学解算,动力学一致性 » 智能服务机器人动作表征体系的三种形式:任务空间表征,关节空间表征,肌群协同表征 » 导引指路机器人的触觉感知技术:触觉阵列、加速度/振动传感器以及光学触觉传感器 » 仿人机器人路径规划:滚动路径规划的方法 |
![]() ![]() ![]() |
![]() |
|
|
|||||||||||||||||||||||||||||||||||||||||
| 版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |