电工技术基础_电工基础知识_电工之家-电工学习网

欢迎来到电工学习网!

语音识别芯片的工作原理和分类

2021-11-24 00:51分类:电子元器件 阅读:

 

语音识别技术集成ic也叫语音识别技术IC,与传统的的语音识别芯片对比,语音识别技术集成ic较大 的特征便是可以语音识别技术,它能让设备听得懂我们的视频语音,而且能够依据指令实行各种各样姿势,如眨眼、动嘴唇(智能娃娃)。此外,语音识别技术集成ic还具备高质量、高压缩系数音频播放音乐作用,可完成人机对换。

语音识别技术集成ic所涉及到的工艺包含:信号分析、计算机视觉、摡率论和信息论基础、发音原理和听觉系统原理、人工智能技术这些。

语音识别技术集成ic的原理

内嵌式语音识别技术系统软件都使用了匹配算法的基本原理。入录的语言数据信号最先通过预备处理,包含视频语音讯号的取样、反混叠过滤、语音增强,下面是svm算法,用于从视频语音数据信号波型中获取一组或几个可以叙述视频语音数据信号特点的主要参数。svm算法以后的数据信息一般分成2个流程,第一步是系统软件“学习培训”或“训炼”环节,这一时期的日常任务是搭建参照方式库,词汇表中各个词相匹配一个参照方式,它由这个词反复音标发音很多遍,再经svm算法和某类训炼中获得。第二是“鉴别”或“检测”环节,依照一定的规则求得被测视频语音状态参数和视频语音信息内容与方式库文件相对应模版中间的失帧度量,最配对的也是鉴别結果。

LD332X系列产品语音识别技术集成ic的原理:

LD3320给予的语音识别技术技术性,是根据“重要词句目录”的识别系统:ASR(Autospeechrecognition)技术性。

语音识别技术集成ic进行的作业便是:把根据MIC键入的音效开展频谱分析-》获取视频语音特点-》和重要词句目录中的重要词句开展对照配对-》找到评分最多的重要词句做为辨别結果輸出。

语音识别芯片的工作原理和分类

语音识别技术集成ic能在这两种情形下得出鉴别結果:

1)外界送进预订時间的音频数据信息后(例如5秒左右的音频数据信息),集成ic对那些视频语音数据信息计算剖析后,得出鉴别結果

2)外界送进视频语音数据流分析,语音识别技术集成ic根据节点检验VAD(voiceacTIvitydetecTIon)检验出客户终止讲话,把客户逐渐讲话到终止讲话中间的音频数据信息完成计算剖析后,得出鉴别結果

针对第一种状况,能够解释为设置了一个按时音频(例如为5秒左右),集成ic在5秒左右后,会终止把响声送进鉴别模块,而且依据已送进模块的音频数据信息测算出一个鉴别結果。

针对第二种状况,必须掌握VAD的原理:

VAD(VoiceAcTIvityDetecTIon)技术性是在一段视频语音数据流分析中,分辨出哪一个时间点是人声伴奏的逐渐,哪一个时间点是人声伴奏的完毕。分辨的重要依据是,在声音特效的根基上拥有视频语音音标发音,则视作响声的逐渐。然后,检验到一段延迟时间的情况音(例如600ms),则视作人声伴奏讲话完毕。

根据VAD分辨出人声伴奏讲话的地区后,语音识别技术集成ic会把这过程中的响声数据信息开展鉴别处置后,测算出鉴别結果。

必须表明的是,除开上述二种情形外,语音识别技术优化算法没法“积极”地辨别出是不是鉴别出了一个結果。这是由于,在预估的环节中的任何时候,语音识别器都是会对已送进鉴别集成ic的响声数据信息开展剖析,并依据配对水平为鉴别目录中的重要词句开展评分,最配对的评分最大。可是,因为鉴别优化算法不清楚客户后边是不是还再次说视频语音,因此没法“积极”地分辨早已鉴别出一个結果。

例如,鉴别目录中有两个重要词句分别是“李振”和“王飞飞”,当客户说到“晓”这一声调时,在鉴别集成ic內部是“李振”的评分最大,但这时鉴别集成ic是没法得出鉴别結果。伴随着客户讲出“明”声调后,“王飞飞”则变成评分最大。这时,客户终止讲话,或是是按时音频已到,促使鉴别集成ic能够判定出客户早已终止说话了,才可以得出鉴别結果是“王飞飞”。

语音识别技术集成ic的归类

依照用户的限定来讲,语音识别技术集成ic能够分成特殊人语音识别技术集成ic和非特殊人语音识别技术集成ic。

特殊人语音识别技术集成ic

特殊人语音识别技术集成ic是对于特定人的语音识别技术,别人得话不鉴别,须先把用户的视频语音参照样版存进当做核对的信息库,即特殊人语音识别技术在应用前一定要开展语言训炼,一般依照设备提醒训炼2遍视频语音关键词就可以应用。

非特殊人语音识别技术集成ic

非特殊人语音识别技术是无需对于特定的人的识别系统,不区分年纪、性別,只需说同样语言表达就可以,运用方式是在商品定形前依照确认的十几个语音交互关键词,收集200人以内的声响样版,历经PC优化算法解决获得互动关键词的视频语音实体模型和特点数据库查询,随后烧写到处理器上。运用这类集成ic的设备(智能娃娃、电子宠物、儿童电脑)就具备互动作用了。

非特殊人语音识别技术运用有些是根据语素的优化算法,这类方式下不用收集很多人的声响样版就可以做互动鉴别,可是缺陷是准确率不高,鉴别特性不稳定。

依照说话方式的持续性,语音识别技术集成ic又可划分为非持续语音识别技术和持续语音识别技术。

非持续语音识别技术集成ic

针对非持续视频语音而言,鉴别常说的每一个字务必分离分辨,规定讲完每一个字后都需要间断。

持续语音识别技术集成ic

持续语音识别技术能够一般当然流畅的说话方式来开展个性化的语音识别技术,但因为关联到相接音的难题,难以做到好的分辨实际效果。

上一篇:氧化镓制造功率元件,比SiC更出色?

下一篇:隔离开关的作用及日常作用

相关推荐

电工推荐

    电工技术基础_电工基础知识_电工之家-电工学习网
返回顶部