数字音频技术(第6版) 470


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 470
前一篇:数字音频技术(第6版) 469 下一篇:数字音频技术(第6版) 471
文本阅读:
  第11章低比特率编码:编解码器的设计443频信号的需要在时间和频率分辨率之间进行交换。具体地,瞬态起音会促使块长度的降低(降至145ms或29ms),而一个慢速变化的节目则会促使块长度的提升(升至116ms)。块长度与频率带宽是互动的,较长的块长度允许选择更窄的频带和更高的分辨率。这种时间分割基于时域上的前遮蔽(后向遮蔽)效应,即在发声时刻相距很近的各个乐音所展现出来的遮蔽属分析滤波器
  变换
  延时
  103H-22HMC
  56个谱系数(高
  信号PCM)--分析
  数字音频
  55125kHz~11025kHz
  CT中128个谱系数(中
  输出
  分析
  频谱
  滤波
  器2
  8个谱系数
  一MDC
  决定块尺
  寸大
  图11.18:ATRAO编码器的时频分析模块包含QMF滤波器组和MDCT变换用以分析信号通常情况下,长模式能提供良好的频率分辨率。不过,在有瞬态信号时,量化噪声会散布在整个信号块中,并且初始的量化噪声没有被遮蔽。因此,当检测瞬态信号时,算
  法就切换到短模式。由于噪声被限制在瞬态信号开始之前的一个很短的时间里,因此它会因为前遮蔽效应而被遮蔽。由于后遮蔽(前向遮蔽)具有更大的作用范围,因此它在长模式中可以用来遮蔽任何信号衰减。每个频带可以单独选择块尺寸模式。例如,低频带可能选择长块模式,而中频带和高频带则选择短模式。
  DCT频域系数随后被分组成52个BFU,每个BFU包含固定数量的系数。如前所述,在长模式中,每个单元传送116ms的窄频带,在短模式中,每个块传送145ms或2.9ms的较宽频带。频率范围内有52个非一致的BFU,低频区的BFU数量较多,而高频区中的数
  量较少。这种非线性分割基于临界频带的概念。举例来说,在 ATRAO模型中,以150Hz为中心的频带有100Hz宽,以1kHz为中心的频带有160Hz宽,而以10.5kHz为中心的频带有2500Hz宽。这些宽度反映了人耳在高频逐渐降低的敏感性这512个频谱系数中的每一个都根据比例因子和字长进行量比例因子定义了量化的
  满刻度范围。它是从一个可能性列表中选出的,描述了52个BFU中每个单元内频谱系数的幅度。字长定义了每个比例缩放尺度内的精度,它是用下述比特分配算法计算出来的给定BFU中的所有系数被赋予相同的比例因子和量化字长,这是由于每组中的心理声学
  相似性。因此要为每帧的
  数值编码随后这些信息:MDCT块尺寸模式(长或短)每个BFU的字长、每个BFU的比例因子以及被量化的频谱系数