语音编码编码的分类

如题所述

语音编码是一种技术,它将模拟的语音信号转化为数字信号,以降低传输速率并进行数字传输。主要的编码方法有波形编码、参量编码(音源编码)和混合编码。

波形编码,如PCM(a率或u率PCM、ADPCM、ADM),是基于模拟话音的波形信号的时域取样、量化和编码。它能提供高质量的语音,但当数据速率低于16kb/s时,音质问题还未得到有效解决。其基本原理是按一定速率抽样并量化幅度,用代码表示,接收端通过解码恢复原始模拟信号。

参量编码,如线性预测(LPC)编码,依赖于语音信号的数学模型,通过对特征参数的提取和编码来传输。虽然编码速率低,2.4-1.2kb/s,但自然度较低,对环境噪声敏感。它试图通过恢复尽可能高的可懂度,但重建语音的波形与原始波形有明显差异。

混合编码则是波形编码和参量编码的结合,能在2.4-1.2kb/s的速率下提供高质量的合成语音。它结合了波形编码的高质量和参量编码的低速率优势,通过保留部分波形信息和语音特征参数来实现。

语音编码的极限速率取决于基本元素——音素的数量。以10个音素/秒的平均说话速率计算,极限速率约为80bps。从实际的64kbps数字化编码速率到理论的80bps,这个差距对理论研究和实际应用具有极高的吸引力。
温馨提示:答案为网友推荐,仅供参考
相似回答