数字音频技术(第6版) 469


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 469
前一篇:数字音频技术(第6版) 468 下一篇:数字音频技术(第6版) 470
文本阅读:
  442数字音频技术(第6版)
  SDDS影院声音系统提供数据缩减算法而开发的,并随后用在了其他应用中,比如 MiniDisc格式。ATRAC使用了改进离散余弦变换和心理声学遮蔽来实现5:1的压缩比。例如,一张MiniDisc上的数据以292kbit/s存储。ATRAC变换编码基于非一致的频率和时间分割概念,并根据比特分配算法制定的规则分配比特。这种算法既观察听觉曲线的固定门限,同时也对音频节目进行动态分析,以充分利用遮蔽等心理声学效应。原始的编解码器版本有时被称ATRAC1。ATRAC是由Sony(索尼)公司开发的。
  ATRAC编码器接收一个数字音频输入并将其分解成各个块。音频信号被分成三个子带,这些子带随后使用一个可变的块长度被变换到频域。各个变换系数被分组成52个子带(被称为块浮动单元【Block Floating Units】或BFU),它们按人耳的临界频带建模,对低频区有细节的分辨率。这些频带中的数据根据动态敏感度和遮蔽特性进行量化,而这两者是以一个心理声学模型为基础的。在解码时,被量化的频谱根据比特分配方法得到重建,并被合成到输出音频信号中。
  ATRAC与其他一些编解码器不
  把心理声学模型同时用于比特分配和时频分割上。
  在这方面,子带和变换编码技术都得到了使用。此外,变换块的长度会适应音频信号的特性,因此幅度和时间分辨率能够在静态和瞬态音乐片段之间被改变。通过这一处理,数据率被缩减了4/5。ATRAC编码算法可以按三个部分考虑:时频分析、比特分配以及频谱成分量化。
  算法的分析部分把信号分解成各频谱系数,这些频谱系数被分组成多用以模仿临界
  频带。算法的比特分配部分在各个BFU之间分配可用比特,为听觉上敏感的各个单元分配更多的比特。算法的量化部分把每个频谱系数量化成指定的字长时频分析如图11.18所示,它使用了子带和变换编码方法。两个正交镜像滤波器
  (Quadrature Mirror Filter,QMF)把输入信号分成三个子带:低5125kz人中(5.5125kz
  1.025kHz)和高(11.025kHz-2205kHz)。QMF组确保由子带分解引起的时域混叠能够在重建过程中被对消。在频带分割之后对信号内容进行分析,从而确定块长度。这些频带中每频带内的信号随后通过MDCT算法转换到频域。MDCT允许在相邻的时域窗之间使用高50%的交叠,这在临界采样时维持了频率分辨率。总共输出系数,有128个谱系数
  于低频带,128个谱系数位于中频带,256个谱系数位于高频带。
  变换编码器必须在频域分辨率与时域分辨率之间做岀平衡。一个较长的块尺寸能获得高的频率分辨率,并且量化噪声也容易被同时遮蔽效应所遮蔽,这对于稳态信号是合适的。不过,瞬态信号需要时域分辨率,否则量化噪声将在时间上散布到块中的各采样点上。在瞬遮蔽音开始之前会
  声预回声。因此,ATRAC算法没有使用固定的变换块长度,而是自适应地进行了非均匀的时间分割,让各个块根据音频节目的内容变化。它使用了两种模式长模式(在高、中和低频段均为11.6ms)和短模式(在高频段为1.45ms,在中和低频段为2.9
  长块模式产生一个狭窄的频带,而短块模式则产生较宽的频带,这样就能根据