电工技术基础_电工基础知识_电工之家-电工学习网

欢迎来到电工学习网!

语音辨认的底子原理和语音辨认的办法

2017-04-25 12:51分类:电气工程 阅读:

 

 1、语音辨认的底子原理

  语音辨认体系实质上是一种办法辨认体系,包含特征提取、办法匹配、参看办法库等三个底子单元,它的底子构造如下图所示:

语音辨认技能原理悉数解析

  不知道语音经过话筒改换成电信号后加在辨认体系的输入端,首要经过预处理,再依据人的语音特征树立语音模型,对输入的语音信号进行剖析,并抽取所需的特 征,在此根底上树立语音辨认所需的模板。而核算机在辨认进程中要依据语音辨认的模型,将核算机中寄存的语音模板与输入的语音信号的特征进行比照,依据必定 的查找和匹配战略,找出一系列最优的与输入语音匹配的模板。然后依据此模板的界说,经过查表就能够给出核算机的辨认作用。明显,这种最优的作用与特征的选 择、语音模型的好坏、模板是不是精确都有直接的联络。

  2、语音辨认的办法

  如今具有代表性的语音辨认办法首要有动态时刻规整技能(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支撑向量机(SVM)等办法。

  动态时刻规整算法(Dynamic Time Warping,DTW)是在非特定人语音辨认中一种简略有用的办法,该算法依据动态方案的思想,处理了发音长短纷歧的模板匹配疑问,是语音辨认技能中出 现较早、较常用的一种算法。在运用DTW算法进行语音辨认时,即是将现已预处理和分帧过的语音测验信号和参看语音模板进行比照以获取他们之间的类似度,按 照某种间隔测度得出两模板间的类似程度并挑选最好途径。

  隐马尔可夫模型(HMM)是语音信号处理中的一种核算模型,是由Markov链 演变来的,所以它是依据参数模型的核算辨认办法。因为其办法库是经过重复练习构成的与练习输出信号符合概率最大的最好模型参数而不是预先贮存好的办法样 本,且其辨认进程中运用待辨认语音序列与HMM参数之间的似然概率抵达最大值所对应的最好状况序列作为辨认输出,因而是较抱负的语音辨认模型。

  矢量量化(Vector Quantization)是一种首要的信号紧缩办法。与HMM比照,矢量量化首要适用于小词汇量、孤立词的语音辨认中。其进程是将若干个语音信号波形或 特征参数的标量数据构成一个矢量在多维空间进行全体量化。把矢量空间分红若干个小区域,每个小区域寻觅一个代表矢量,量化时落入小区域的矢量就用这个代表 矢量替代。矢量量化器的方案即是从很多信号样本中练习出好的码书,从实习作用动身寻觅到好的失真测度界说公式,方案出最好的矢量量化体系,用起码的查找和 核算失真的运算量结束最大或许的均匀信噪比。

  在实习的运用进程中,咱们还研讨了多种下降杂乱度的办法,包含无回想的矢量量化、有回想的矢量量化和含糊矢量量化办法。

  人工神经网络(ANN)是20世纪80年代晚期提出的一种新的语音辨认办法。正本质上是一个自习气非线性动力学体系,仿照了人类神经活动的原理,具有自 习气性、并行性、鲁棒性、容错性和学习特性,其强壮的分类才干和输入—输出映射才干在语音辨认中都很有招引力。其办法是仿照人脑思想机制的工程模型,它与 HMM恰好相反,其分类决议方案才干和对不断定信息的描绘才干得到全世界公认,但它对动态时刻信号的描绘才干尚不尽善尽美,一般MLP分类器只能处理静态办法分 类疑问,并不触及时刻序列的处理。虽然专家们提出了很多含反响的构造,但它们仍短少以描写比方语音信号这种时刻序列的动态特性。因为ANN不能极好地描绘 语音信号的时刻动态特性,所以常把ANN与传统辨认办法联络,别离运用各自长处来进行语音辨认而战胜HMM和ANN各自的缺陷。这些年联络神经网络和隐含 马尔可夫模型的辨认算法研讨取得了明显翻开,其辨认率现已挨近隐含马尔可夫模型的辨认体系,进一步行进了语音辨认的鲁棒性和精确率。

  支撑向量机(Support vector machine)是运用核算学理论的一种新的学习机模型,选用构造危险最小化原理(Structural Risk Minimization,SRM),有用战胜了传统阅历危险最小化办法的缺陷。统筹练习过失和泛化才干,在处理小样本、非线性及高维办法辨认方面有很多 优胜的功用,现已被广泛地运用到办法辨认范畴。

上一篇:消防操控体系的构成

下一篇:江森DX-9100智能楼宇体系装备和参数

相关推荐

电工推荐

    电工技术基础_电工基础知识_电工之家-电工学习网
返回顶部