创泽机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人开发 > 机器人语音识别主要模式:频谱图法,LPC法,隐藏式马可

机器人语音识别主要模式:频谱图法,LPC法,隐藏式马可

来源:神奇的机器人     编辑:创泽   时间:2025/12/29   主题:其他 [加盟]

人的发声器官可以分为两个部 分,即声道和声带。如果直接让机器人理解我们说的话,难度比较大,将人类语 言转化为机器人可以理解识别的信号,就是一个很好的途径。如果将整个过程看 为一个信号过程的话,声带是发生源,声道相当于一个谐振时的声带振动,可用 一个脉冲串发生器代替。发一些有声带振动的音时,可用一个脉冲串发生器代 替。发一些无振音的时候,因为声带并不振动,而是从喉管发出的,只是一般的 随机气流,可以用一个噪声发生器代替。上文介绍过,声音的强弱是变化的,用 一个增益因子K 来表示的话

通过上面的办法,我们可以把语音信号转化为机器人能够理解的电信号, 那么机器人又要怎样去理解呢?

由于人类的语言非常复杂,无论哪个民族,其词汇量都非常大,即使是同一个 人,他的发音也随着环境及身体情况的变化而变化。目前在大词汇语音识别方面处 于L先地位的IBM 语音研究小组,就是在70年代开始了大词汇语音识别研究工作 的 。AT&A 的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究 历经10年,其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。

关于语音识别,表4-1介绍了三种主要模式。

频谱图法

将语音信号的频谱沿着时间轴加以展开,制成频谱图。此法是取语音信号的频率 特性作为比较基础。此种方法识别精度一般,适用于对少量语音的识别,及对特定 人说话的场合

LPC法

即线性预估编码法,此法是对语音信号抽取LPC系数,然后与参考样板的LPC系 数加以比较,计算出其间的“差距”。LPC法是模拟人的发音器官构造而设计的。因 此,LPC系数就代表发音器官腔调的不同状态。此法也用于特定人的语音识别

隐藏式马可夫模式

此法可用于非特定人的语音识别。即要识别不同人的发音,并且对同一个人发同一 个音,每次发音也未必一致。这需要有大量的“储存”与“比较”。此法是采用“统 筹”的理论,建立语音的状态转移模式。经大量的语音资料得出模式的“概率”,选 出“相似率”Z高者

语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于 语音到音节概率的计算和音节到字概率的计算。在声学模型方面,我们介绍一下 HMM 声学模型。

HMM 声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机,隐 马尔可夫模型HMM 是指这一马尔可夫模型的内部状态外界不可见,外界只能看 到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声 学特征。用HMM 刻画语音信号需作出两个假设,一是内部状态的转移只与上一 状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设 大大降低了模型的复杂度。HMM 的打分、解码和训练相应的算法是前向算法、 Viterbi算法和前向后向算法。

总的来说,语音识别技术就是让机器通过识别和理解过程把语音信号转变 为相应的文本或命令的高技术,其技术流程图如图4-17所示。语音识别技术主 要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车 联网也得到了充分的引用,例如在翼卡车联网中,只需按照一键通客服人员口述 要求即可设置目的地直接导航,安全、便捷。语音识别技术正朝着能识别任意人 发音的方向发展。





机器人图像处理的几种方法:点运算、图像增强、图像复原

机器人通过摄像头这些外设获得图像之后,利用某种算法来进行图像之间的变换,对图像进行各种操作以达到所需要实现的功能;点运算改善图像的显示效果

机器人如何看到物体:由硬件图像采集和软件图像信息处理

由图像采集系统,图像处理系统及信息综合分析处理系统构成;机器人的视觉,大概可以理解为“视”和“觉” 两部分;系统主要由图像采集部件、图像的处理和分析、处理结果输出装置

机器人如何规划行走路线:全局规划方法,局部规划

全局规划方法依照已获取的环境信息,给机器人规划出一条路径,路径的精确程度取决于获取环境信息的准确程度;局部规划方法侧重于考虑机器人当前的局部环境信息

机器人的视觉传感技术,从二维图像中理解和构造出三维世界的真实模型

机器人的视觉系统是通过图像和距离等传感器来获取环境对象的图像、颜色和距离等信息,然后传递给图像处理器,利用计算机从二维图像中理解和构造出三维世界的真实模型

机器人的工件识别传感器:接触识别、采样式测量、邻近探测、距离测量、机械视觉识别

接触识别这种测量一般精度不高;采样式测量如测量某一目标的位置、方向和形状;距离测量测量某一目标到某一基准点的距离;机械视觉识别测量某一目标相对于一基准点的位置方向和距离

机器人的柔性腕力传感器:检测末端执行器所受外力/力矩的大小和方向

腕力传感器安装在机器人手臂和末端执行器之间,更接近力的作用点,准确地检测末端执行器所受外力/力矩的大小和方向,为机器人提供力感信息,扩展了机器人的作业能力

机器人位姿传感器:6个电涡流传感器组成的特定空间结构

6个传感器构成三维测量坐标系, 其中传感器1、2、3对应测量面 xOy, 传感器4、5对应测量面 xOz, 传感器6对应测量面 yOz 。 每个传感器在坐标系中的位置固定,这6个传感器所标定的测量范围就是该测量系统 的测量范围

机器人轨迹规划的基本原理

以两自由度机器人为例,将机器人操作臂两个关节的运动用一个公共因子做归一化处理,使其运动范围较小的关节运动成 比例地减慢,这样可使得两个关节能够同步开始和 同步结束运动

机器人操作臂动力学方程系数的简化

机器人动力学的显式状态方程,可用来分析和设计高级的关节变量空间的控制策略,给定力和力矩,用动力学方程求解关节的加速度,再积分求得速度及广义坐标

WebSocket在实时对话中存在关键缺陷:数据包丢失或延迟,破坏对话流畅性

WebSocket 基于 TCP 协议,其可靠传输机制在实时媒体流中反而成为瓶颈,会导致单个数据包丢失或延迟时,对于对话式 AI 需连续交互的场景,此问题会显著破坏对话流畅性

机器人互动如何做好上下文:短期记忆,固化和注入长期记忆:

通过结构化短期记忆+动态长期记忆注入,在保障兼容性的同时,针对实时语音交互场景进行深度优化,并赋予开发者高度灵 活的上下文控制权限

机器人的动力学:拉格朗日法

拉格朗日函数L被定义为系统的动能K 和势能P 之差,即 L=K 一P 式中 K—— 机器人手臂的总动能,P—— 机器人手臂的总势能,机器人系统的拉格朗日方程为
资料获取
机器人开发
== 资讯 ==
机器人语音识别主要模式:频谱图法,LPC
机器人图像处理的几种方法:点运算、图像增
机器人如何看到物体:由硬件图像采集和软件
机器人如何规划行走路线:全局规划方法,局
机器人应用的趋势:垂直化、工艺化、多样化
协作机器人的中国市场格局:初具雏形,未完
中国协作机器人市场前景:高速稳步增长,未
协作机器人市场的发展历程:起步期、调整期
机器人的安全解决方案:力感知方案,轻量化
机器人的视觉解决方案:2D视觉和 3D
协作机器人与人形机器人的发展关系:应用领
2025年中国协作机器人产业发展蓝皮书,
机器人工作站的安全规范及标准:安全防护空
机器人工作站的功能要求和环境条件:机器人
智能服务机器人的导引方式:固定路径导引方
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  展厅机器人  服务机器人底盘  具身智能教育机器人  智能配送机器人  导览机器人 
版权所有 创泽智能机器人集团股份有限公司 运营中心:北京 清华科技园九号楼5层 生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728