数字音频技术(第6版) 453

文本阅读：
　　426数字音频技术（第6版
　　方式让内置的下混功能仅为那些使用左/右立体声编码的比例因子频带计算和信号。对于使用MS和强度编码的比例因子频带仅需要进行缩放操作。
　　为了进一步降低计算复杂度
　　对混合滤波器组进行优化。这个滤波器组包含了|MDCT和多相滤波器组部分。如前所述，需要执行32次MDCT运算，每次18个频谱值，从而把576个频谱数值变换为18个相继的长度为32的频谱。这些频谱通过进行18次多相合成滤波器组的操作而被转换到时域。多相滤波器组包含
　　频率映射操作（类似于矩阵乘法）和一个512系数的FR滤波器。FR滤波器的计算可以通过减少系数数量来简化，可以在冲激响应的结尾对滤波器系数进行截断，并且冲激响应可以使用更少的系数来建模。很多实验已经表明，在不产生额外可闻人造声的情况下，滤波器长度可以缩减25%。更直接的是通过限制输出音频带宽来降亻计算量。高频的频谱值可以被置为零，所有输入采样点均被置零的MDCT不需要进行任何计算。
　　如果仅计算MDCT的低半部分，则音频带宽是受限的。可以用因子2对输出进行下采样，所以为输出进行的计算可以每隔一个数值略过一次，因此就把FR的计算量砍去了一半。
　　有很多非标准的编解码器能产生遵从MP3规格的比特流，它们在性能质量上的差异非常就
　　子，它是一种快速的高质量的免费编解码器，能产生遵从MP3规格的比特率。LAME是开放源代码的，但在一些国家使用LAME可能需要一个专利许可。LAME可以在htp
　　e.sourceforge.net下载。MP3的互联网应用将在第15章讨论。
　　11，6MPEG-1心理声学模型1
　　MPEG-1标准建议了两种心理声学模型，用来为不可闻度确定最小遮蔽门限。这两个模型在标准中仅是资料性的，对它们的使用并不是强制的。这两个模型仅在编码器中使用。在这两种模型中，比特分配器使用最大信号声级与遮蔽门限之差来设置量化级。一般来说，模型1用于层1和层Ⅱ，模型2用于层Ⅲ。
　　心理声学模型1提出了一种低复杂度的方法，用于分析频谱数据并输出信号-遮蔽比。
　　模型1的操作有如下9个步骤。
　　进行FFT分析：用
　　或1024点的快速傅里叶变换把时间对齐的时域数据变换到频域，这个FFT进行了汉宁加窗，并分别进行32或64采样点的相邻交叠，以降低边效应要施加一个适当的延时，从而让心理声学模型的输出是时间对齐的。信号被归一化到最大值这样就把信号的最小值校准到绝对听觉门限上
　　2.确定声压级：为每个子带计算出最大声压级，方法是选择下面两者中较大的一个该子带内最大幅度谱线，或是在考虑子带内低电平谱线的情况下的最大比例因子。
　　3.考虑安静时的门限：给出在没有任何信号时的绝对听觉门限，这构成了遮蔽的下边界