数字音频技术(第6版) 690


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 690
前一篇:数字音频技术(第6版) 689 下一篇:数字音频技术(第6版) 691
文本阅读:
  第16章数字广播与电视663
  意到在那个细节丰富的块中,较低的那些像素(从火车头的烟囱顶部开始)具有较低的数值,代表了一个较暗的图像区域。在经过DCT以后,空间频率系数被表现出来,直
  值表示了该块中所有像素的成比例的平均值,各个交流系数表示了亮度中的各个变化,也就是说,该块的细节。例如,如果所有像素都具有相同的亮度,即100,则系数矩阵将只有值为100的直流,而其他所有块都为零。在本例(图1617)中,这个成正比的平均亮度为120,并且该块没有包含显著的高空间频率。
  D>频率坐标
  方向→水平空间频率
  4p2-,24n回量化(步
  团回
  國叫回叶一
  尺寸为12
  58】21F1
  游程长度编码
  垂直方向数据量
  数据量
  数据
  霍夫曼编而
  垂直
  6字
  =64bi
  uololohduduud
  图16.17:使用MPEG视频算法
  幅图像进行帧内编码的例子。(A)一个8×8的像素块表示亮度数值。(B DCT变换表示该块的各个频率系数。(C)这些系数被量化以实现数据缩减,并使用Z字形图案进行扫描D)在这个数据序列上使用游程长度编码和霍夫曼编码实现数据压缩。
  通过对各个系数进行量化,并把低能量的各个系数截断成零来丢弃它这样就能实
  数据缩减。在本例中使用的步长尺寸为12;这是根据平均亮度值来选择的。在实际中,重要的低频数值通常以高精确度编码(例如数值为8),而矩阵中更高的频率则进行更为粗糙的量化(例如数值为80)。这等效于把量化噪声整形到视觉上更不重要的区域中。直流系数要专
  编码,以充分利用它们较高的空间相关性。例如,MPEG-2主描述文件允许对直系数进行最高10bit精度的量化。块与块之间所采用的量化是变化的。
  为了实现不同的步长尺寸,可以使用量化器矩阵来决定每幅画面的最优感觉加权,在进行均匀量化之前先对各个DCT系数进行加权。这个加权算法充分利用了视觉的各种特性以及人类视觉的各种限制,从而把各种编码缺陷安放在最不容易被感知的频率和区域中。例如面暗区中的高频细节损失就不像在亮区中那么明显。并且,在有纹理的区域中出现的高频错也要比在颜色单一的区域中更不容易被看到。采用这种量化以后,数据可以被减压缩中,因为通常很少有高频细节,所以变换系数中有很多被量化成0。为了充分利用这一点,可以把这个二维矩阵缩减为一个一维序列。在各个变换系数上进行可变长度编码(Variable-Length Coding,VLC)。采用一种Z字形路线对这些变换系数进行扫描(或是