摘 要:CM70C01是处理多种语音压缩格式的混合信号处理芯片,由于编码和解码部分的标准不统一,使得部分语音压缩文件与CM70C01不兼容。本文在深入了解CM70C01解码和语音合成的基础上,就LPC-10提出符合CM70C01的语音压缩编码方法。
关键词:能量;音调;反射系数;语音压缩
引言
CM70C01是中科微电子公司生产的混合信号处理芯片,集成8位MCU和语音合成电路,具有编程方便,能处理LPC-10、CELP、PCM、MELP等多种语音压缩格式的能力和较优的性价比,可以应用在各种语音处理场合。但由于LPC-10、CELP和MELP等语音格式在编码和解码部分有多种不同的标准,而且这些标准之间并不兼容,因此用户自行编制的语音数据并不一定能被CM70C01识别或处理。在熟知语音压缩基本算法而又缺少语音开发板和相应软件的情况下,就可以用纯软件的方法来实现基于CM70C01的语音压缩编码。本文以LPC-10为例子,说明特征参数的提取、编码的帧结构以及CM70C01的解码和编码的实现。
特征参数的提取
语音具有样点间的短时相关性和相邻基因周期间的长时相关性,可以用一个全极点模型来描述一小段语音的生成模型。在利用线性预测方法对语音进行上述两种相关性的去相关处理后,能够得到预测的余量信号。根据余量信号和全极点模型的预测系数,就可以合成语音。这就是线性预测编码。
线性预测编码(LPC-10)是将线性预测理论运用到语音编码领域的一个典型例子。在预测编码过程中,以帧为单位来分析和提取语音信号的相关特征参数,这些特征参数有包括:全极点模型的预测参数{ai}、能量增益(Energy)、音调(Pitch)、浊/清音标志(V/UV)。由特征参数来表述语音信号既可减小存储空间,又可以低速率来进行传输。在接收端,根据帧的特征参数决定激励源、基音块和帧块间的插值,最后通过格型滤波器来合成语音。
由于预测参数不适于直接量化,因为它的微小变化会造成极点位置很大的变化,所以一般采用在数学上与之完全等价的反射系数K1~K10代替预测参数进行量化编码。反射系数的稳定条件是Ki <1,这在量化时是容易保证的。可以用Choleski UV分解法对