自动语音识别(ASR)在呼叫中心系统中的应用

admin 2012/02/06 14:41:18

自动语音识别(ASR)在呼叫中心系统中的应用
自动语音识别(AutomaticSpeechRecognition简称"ASR")技术的目标是让计算机能够“听写”出不同人所说出的连续语音，也就是俗称的“语音听写机”，是实现“声音”到“文字”转换的技术。自动语音识别(ASR)在呼叫中心系统中的应用，自动语音识别通常有以下几种分类方法：
(1)按系统的用户情况分：特定人和非特定人识别系统；
(2)按系统词汇量分：小词汇量、中词汇量和大词汇量系统；
(3)按语音的输入方式分：孤立词、连接词、连续语音系统等；
(4)按输入语音的发音方式分：朗读式、口语（自然发音）式；
(5)按输入语音的方言背景情况分：普通话、方言背景普通话、方言语音识别系统；
(6)按输入语音的情感状态分；中性语音、情感语音识别系统。语音识别技术适用于家用电器和电子设备，比如电视、计算机、汽车、音响、冷气等的声控遥控器，电话、手机或PDA上的声控人名拨号、数字录音机的声控语音检索标签、儿童玩具的声控等；也可用于个人、呼叫中心，以及电信级应用的信息查询与服务等领域。
语音识别系统选择识别基元的要求是，有准确的定义，能得到足够数据进行训练，具有一般性。自动语音识别(ASR)在呼叫中心系统中的应用，英语通常采用上下文相关的音素建模，汉语的协同发音不如英语严重，可
以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力，会使得性能急剧下降。听写机：大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型参数，识别时，将基元串接成词，词间加上静音模型并引入语言模型作为词间转移概率，形成循环结构，用Viterbi算法进行解码。针对汉语易于分割的特点，先进行分割再对每一段进行解码，是用以提高效率的一个简化方法。自动语音识别(ASR)在呼叫中心系统中的应用对话系统：用于实现人机口语对话的系统称为对话系统。受目前技术所限，对话系统往往是面向一个狭窄领域、词汇量有限的系统，其题材有旅游查询、订票、数据库检索等等。其前端是一个语音识别器，识别产生的N-best候选或词候选网格，由语法分析器进行分析获取语义信息，再由对话管理器确定应答信息，由语音合成器输出。由于目前的系统往往词汇量有限，也可以用提取关键词的方法来获取语义信息。

自动语音识别(ASR)在呼叫中心系统中的应用

{{readManPer}}的人还看了

文章导航

7天免费试用

热门文章