数字音频技术(第6版) 498


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 498
前一篇:数字音频技术(第6版) 497 下一篇:数字音频技术(第6版) 499
文本阅读:
  第12章用于传输的语音编码471
  2-4kbit/s,而且能够产生良好的语音保真度。不过,更高的比特率并不会相应地产生更高的保真度,这是由这种编码技术本身的属性所决定的混合编解码器把参数声源编解码器和波形编解码器的各种特征结合起来。这类编解码器使用语音声源模型来产生准确描述声源模型激励信号的各个参数。解码器使用这些参数与其余的附加参数产生出一个与原始输入波形相似的输出波形。在很多情况中使用过感觉加权的
  误差信号来衡量这个差异。码激励线性预测(Code Excited Linear Prediction,CELP)类编解码器就是混合编解码器中被广泛使用的一种类型。混合编解码器一般工作在中等比特率单一模式编解码器使用一个固定的编码算法,而多模式编解码器则根据音频的动
  特征以及不断变化的网络条件来挑选不同的算法。在选择不同的算法机制时,可以通过基于信号状态的声源控制,也可以通过基于传输信道条件的网络控制。这个选择信息要传送给解码器以进行恰当地解码。虽然每种编码模式都能使用固定比特率,但总体上的操作将产生个可变的比特率。它的高效率产生了一个更低的平均比特率12,3人类语音
  如前所述,语音编码与音乐编码不同,因为语音信号仅发自人类的声道,而不是各种乐器。音乐编解码器必须能够编码各种类型的信道,而语音编解码器只需要编码一种类型的信号。各语音信号中的这种相似性促使我们使用声源编码,用人类语音系统的一个模型对信号进行编码和解码。因此,对语音编解码器的理解要从对人类声道的生理特征和作用方式开始。
  面,语音声音是很容易描述的。与所有声音一样,它们是空气压力的变化。从肺部发出的
  种收缩而被扰动,并从口腔和鼻孔被呼出。实际中统是复杂的。语音声音的形成需要对气流的精确控制,这需要借助于构成时变声学滤波器的很多组成部分。图12.2所示为人类声道的一个简化视图。这个系统的能量来源是来自于横膈膜和肺部的气流。气流通过气管,然后穿过声带(也被称为声襞),这是位于喉部喉结位置的一对弹性肌肉带和粘膜。声带在快速打开和闭合时产生振动,形成了类似噪声的激励信号带可以形成声门的打开,而声门可以阻止气流从而形成多个伪周期脉冲,也可以让空气自由地流出。当产生脉冲时,声带的张力决定了振动的音高。软腭控制着进入鼻腔的空气。空气流过口腔和鼻腔,在那里它被舌、唇、齿和下巴调制,引起局部收缩,因此会在空气流时改变气压。此外,口腔和鼻腔扮演着共振器的角色。共振频率根据声道中各组成成分的位置和形状发生改变。这些频率也被称为共振峰频率