一种引入帧间相关信息的HMM语音识别方法
赵力; 邹采荣; 吴镇扬
东南大学无线电工程系 南京 210096
A METHOD OF HMM SPEECH RECOGNITION INTRODUCED INTER-FRAME CORRELATION
Zhao Li; Zou Cairong; Wu Zhenyang
Department of Radio Engineering Southeast University Nanjing 210096 China
摘要 该文提出了一种基于复数帧段输入HMM的语音识别方法,它采用相继的复数帧组成的特征参数向量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息。为了进一步改善复数帧段输入HMM的输出概率分布函数,作者还提出了用MGDF和RBF函数作为复数帧段输入HMM的输出概率分布函数的方法。通过对非特定人汉语孤立数字和连续数字语音识别试验,证实了该文提出的引入帧间相关信息方法的有效性。
关键词 :
语音识别 ,
隐马尔可夫模型 ,
帧间相关信息 ,
复数帧段输入
Abstract :This paper applies segmental unit into HMM for speech recognition. In this model, several successive frames are combined and treated as an input vector. It expects that segmental unit input HMM would be effective to describe the inter-frame correlation information and has also proposed the MGDF and RBF to further improve output probability function. By comparing them with the traditional HMMs based on their speech recognition performance rates through the experiments of speaker-independent spoken digit (isolated/connected) recognition,the validity of the proposed appraoch could be verified.
Key words :
Speech recognition
Hidden Markov modei
Inter-frame correlation information
Segmental unit input
收稿日期: 1999-06-11
[1]
王蕊,李彦骁, 孙辉,陈增强. 基于隐马尔可夫模型的切换飞行控制系统性能分析 [J]. 电子与信息学报, 2017, 39(4): 989-996.
[2]
张舸,张鹏远,潘接林,颜永红. 基于递归神经网络的语音识别快速解码算法 [J]. 电子与信息学报, 2017, 39(4): 930-937.
[3]
姜志威,丁晓青,彭良瑞,刘长松. 低数据资源条件下基于结构信息共享的无切分维文文档识别字符建模 [J]. 电子与信息学报, 2015, 37(9): 2103-2109.
[4]
但波, 姜永华, 李敬军, 卢毅. 基于空时融合隐马尔科夫模型的舰艇编队目标识别方法 [J]. 电子与信息学报, 2015, 37(4): 926-932.
[5]
高兴龙, 潘接林, 颜永红. 基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度 [J]. 电子与信息学报, 2014, 36(8): 1852-1858.
[6]
张文林, 张连海, 陈琦, 李弼程. 语音识别中基于低秩约束的本征音子说话人自适应方法 [J]. 电子与信息学报, 2014, 36(4): 981-987.
[7]
郭宇弘, 黎塔, 肖业鸣, 潘接林, 颜永红. 基于加权有限状态机的动态匹配词图生成算法 [J]. 电子与信息学报, 2014, 36(1): 140-146.
[8]
潘勉, 王鹏辉, 杜兰, 刘宏伟, 保铮. 基于TSB-HMM模型的雷达高分辨距离像目标识别方法 [J]. 电子与信息学报, 2013, 35(7): 1547-1554.
[9]
李艳玲, 颜永红 . 多特征融合的英语口语考试自动评分系统的研究 [J]. 电子与信息学报, 2012, 34(9): 2097-2102.
[10]
张文林, 牛铜, 张连海, 李弼程. 基于最大似然可变子空间的快速说话人自适应方法 [J]. 电子与信息学报, 2012, 34(3): 571-575.
[11]
黄程韦, 赵艳, 金赟, 于寅骅, 赵力. 实用语音情感的特征分析与识别的研究 [J]. 电子与信息学报, 2011, 33(1): 112-116.
[12]
苏腾荣; 吴 及; 王作英. 基于空间相关性变换的声学模型训练 [J]. 电子与信息学报, 2010, 32(4): 1003-1007 .
[13]
吕勇,吴镇扬. 基于矢量泰勒级数的模型自适应算法 [J]. 电子与信息学报, 2010, 32(1): 107-111 .
[14]
王仕奎; 周 琳; 吴镇扬;尤红岩. 基于HMM状态聚类均值替代的宽带语音ISF参数补偿算法 [J]. 电子与信息学报, 2009, 31(4): 827-831 .
[15]
吕国云; 蒋冬梅; 樊养余;赵荣椿; H. Sahli;W. Verhelst. 基于多流三音素DBN模型的音视频语音识别和音素切分 [J]. 电子与信息学报, 2009, 31(2): 297-301 .