嵌入自联想神经网络的高斯混合模型说话人辨认
陈存宝,赵 力
东南大学信息科学与工程学院 南京 210096
Speaker Identification Based on GMM with Embedded AANN
Chen Cun-bao,Zhao Li
School of Information Science and Engineering, Southeast University, Nanjing 210096, China
摘要 该文提出了一种嵌入自联想神经网络的高斯混合模型,它充分利用了神经网络和高斯混合模型各自的优点,以最大似然概率(ML)为准则,把它们作为一个整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。由于神经网络起到了“数据整形”的作用,因而提高了类内数据的相似性。实验结果表明,采用该文提出的模型在各种信噪比情况下的识别率都比基线系统有所提高,最高能达到19%。
关键词 :
说话人识别 ,
高斯混合模型(GMM) ,
自联想神经网络(AANN) ,
嵌入
Abstract :In this paper, a modified Gaussian Mixed Model (GMM) with an embedded Auto-Associate Neural Network (AANN) is proposed. It integrates the merits of GMM and AANN. GMM and AANN as a whole are trained by means of Maximum Likelihood (ML). In the process of training, the parameters of GMM and AANN are updated alternately. AANN reshapes the distribution of the data and improves the similarity of the data in one class. Experiments show that the proposed system improves accuracy rate against baseline GMM at all SNR, maximum to 19%.
Key words :
Speaker identification
Gaussian Mixed Model (GMM)
Auto-Associate Neural Network (AANN)
Embedded
收稿日期: 2008-03-17
通讯作者:
陈存宝
[1]
罗甫林,黄鸿,刘嘉敏,冯海亮. 基于半监督稀疏流形嵌入的高光谱影像特征提取 [J]. 电子与信息学报, 2016, 38(9): 2321-2329.
[2]
王伟,韩纪庆,郑铁然,郑贵滨,陶耀. 基于Fisher判别字典学习的说话人识别 [J]. 电子与信息学报, 2016, 38(2): 367-372.
[3]
李志敏, 张杰, 黄鸿, 马泽忠. 面向高光谱图像分类的半监督Laplace鉴别嵌入 [J]. 电子与信息学报, 2015, 37(4): 995-1001.
[4]
曹明明, 干宗良, 崔子冠, 李然, 朱秀昌. 基于2D-PCA特征描述的非负权重邻域嵌入人脸超分辨率重建算法 [J]. 电子与信息学报, 2015, 37(4): 777-783.
[5]
邱应强,余轮. 基于拓展广义整数变换的无损信息隐藏方法 [J]. 电子与信息学报, 2015, 37(12): 2830-2837.
[6]
杨爱萍, 郑佳,王建, 何宇清. 基于颜色失真去除与暗通道先验的水下图像复原 [J]. 电子与信息学报, 2015, 37(11): 2541-2547.
[7]
陈丽敏,杨静,张健沛. 一种基于嵌入技术的异构信息网络的快速聚类算法 [J]. 电子与信息学报, 2015, 37(11): 2634-2641.
[8]
支天, 杨海钢, 蔡刚, 秋小强, 李天文, 王新刚. 嵌入式存储器空间单粒子效应失效率评估方法研究 [J]. 电子与信息学报, 2014, 36(12): 3035-3041.
[9]
马俊超, 王献. LTE位置管理中信令开销的分析 [J]. 电子与信息学报, 2014, 36(10): 2320-2325.
[10]
张秋余, 孙媛, 晏燕. 基于分块自适应压缩感知的可逆水印算法 [J]. 电子与信息学报, 2013, 35(4): 797-804.
[11]
陈晨, 陈志坚, 孟建熠, 严晓浪. 基于预测极性动态变换的分支预测框架研究 [J]. 电子与信息学报, 2013, 35(4): 1001-1006.
[12]
齐宁, 汪斌强, 袁博, 张博, 王保进. 面向ReFlexNet的域间嵌入式承载网构建 [J]. 电子与信息学报, 2011, 33(9): 2225-2230.
[13]
王超, 张卫明, 刘九芬. 基于比特控制的快速矩阵嵌入 [J]. 电子与信息学报, 2011, 33(9): 2169-2174.
[14]
聂秀山, 刘琚, 孙建德, 秦丰林. 基于局部线性嵌入的视频拷贝检测方法 [J]. 电子与信息学报, 2011, 33(5): 1030-1034.
[15]
刘铭, 张国印, 姚爱红, 门朝光. 基于层次实时有色Petri网的实时系统建模与分析方法研究 [J]. 电子与信息学报, 2011, 33(3): 580-586.