一种600bps极低速率语音编码算法
丛键; 张知易
现代通信国家重点实验室 成都 610041
A Very Low Bit Rate Speech Encoding Algorithm in 600bps
Cong Jian; Zhang Zhi-yi
National Laboratory for Modern Communications, Chengdu 610041, China
摘要 该文针对抗干扰通信中对低速率语音编码算法的应用需求,提出了一种600bps极低速率语音编码算法,采用6帧超帧结构,超帧中包括2个基本帧与4个插值帧。插值帧的线性预测(LPC)参数采用基于闭环最优一阶线性预测的4阶段残差矩阵量化;在解码端,提出了闭环的激励脉冲幅度估计方法,提高了合成语音的自然度与鼻音音节的清晰度。该算法可以提供良好的合成语音质量,DRT测试结果达到88.55分。
关键词 :
极低速率语音编码 ,
多阶段矢量量化 ,
多阶段矩阵量化
Abstract :A very low bit rate speech encoding algorithm in 600bps is proposed in this paper for application in anti-jamming communication. Super-frame structure with 2 base frames and 4 interpolate frames is used, the LPC coefficients of interpolate frames is quantized with 4 stages residual matrix quantization based on optimal 1-order linear prediction. In the decoder, a closed loop estimation of the impulse magnitude is proposed to improve the naturalness of speech and the articulation of nasals. This speech coder achieves good quality of speech and the DRT score is 88.55。
Key words :
Very low bit rate speech encoding
Multistage vector quantization
Multistage matrix quantization
收稿日期: 2005-07-26
基金资助: 现代通信国家重点实验室基金(51436050604DZ4003)资助课题
[1]
杨鹤飞, 郑成诗, 李晓东. 基于谱优势与非线性变换混合的立体声声学回声消除方法 [J]. 电子与信息学报, 2015, 37(2): 373-379.
[2]
姜开宇, 吴超, 国雁萌, 付强, 颜永红. 基于频域逐级回归的声学回声控制 [J]. 电子与信息学报, 2014, 36(12): 2896-2901.
[3]
张文林, 张连海, 陈琦, 李弼程. 语音识别中基于低秩约束的本征音子说话人自适应方法 [J]. 电子与信息学报, 2014, 36(4): 981-987.
[4]
杨立春, 钱沄涛. 基于相干性滤波器的广义旁瓣抵消器麦克风小阵列语音增强方法 [J]. 电子与信息学报, 2012, 34(12): 3027-3033.
[5]
张雪源, 贺前华, 李艳雄, 叶婉玲. 一种基于倒排索引的音频检索方法 [J]. 电子与信息学报, 2012, 34(11): 2561-2567.
[6]
周彬, 邹霞, 张雄伟. 基于多元Laplace语音模型的语音增强算法 [J]. 电子与信息学报, 2012, 34(7): 1562-1567.
[7]
李艳雄, 吴永, 贺前华. 基于特征均值距离的短语音段说话人聚类算法 [J]. 电子与信息学报, 2012, 34(6): 1404-1407.
[8]
高悦, 陈砚圃, 闵刚, 杜佳. 基于线性预测分析和差分变换的语音信号压缩感知 [J]. 电子与信息学报, 2012, 34(6): 1408-1413.
[9]
张文林, 牛铜, 张连海, 李弼程. 基于最大似然可变子空间的快速说话人自适应方法 [J]. 电子与信息学报, 2012, 34(3): 571-575.
[10]
卢志茂, 金辉, 张春祥, 任明溪. 基于HHT和OSF的复杂环境语音端点检测 [J]. 电子与信息学报, 2012, 34(1): 213-217.
[11]
张云翼, 崔杰, 肖灵. 一种适用于混响环境的双传声器自适应指向性算法 [J]. 电子与信息学报, 2011, 33(11): 2652-2657.
[12]
王天荆, 郑宝玉, 杨震. 基于自适应冗余字典的语音信号稀疏表示算法 [J]. 电子与信息学报, 2011, 33(10): 2372-2377.
[13]
许志勇, 赵兆, 刘明. 宽间距麦克风阵列实时无模糊多声源被动测向 [J]. 电子与信息学报, 2011, 33(9): 2056-2061.
[14]
肖强, 陈亮, 朱涛, 黄建军. 基于准KLT域的线谱对参数压缩感知量化研究 [J]. 电子与信息学报, 2011, 33(9): 2062-2067.
[15]
杨毅, 宋辉, 刘加. 基于NIST评测的说话人分类及定位技术研究 [J]. 电子与信息学报, 2011, 33(5): 1234-1237.