浅议电视信号的数字化与码率压缩的论文_电力电气论文

当今社会，技术的发展进步与设备的更新换代确实让人感到“不是我不明白，这世界变化快！”随着计算机、微电子、信息处理、通信以及激光等技术的迅猛发展，集图文、声音、图像于一体的多媒体技术更是迅速渗透到计算机、通信、广播电视以及消费娱乐业。从事广播电视事业的各单位，其设备从前期到后期，无不越来越多地的采用数字设备，可以这么说：

　　电视系统的数字化是大势所趋

　　其原因在于，相对于模拟电视而言，数字电视具有如下优点：信号经过多次转接切换和远距离传输时，不会有干扰和失真的积累，抗干扰性能强，图像质量好；数字电视系统主要由数字集成电路组成，系统的性能和可靠性可望大幅度提高；它可以实现模拟电视不易高质量实现的功能。譬如：时轴处理、制式转换、特技等功能；它也易于实现电视信号的实时处理，以完成图像质量的改善、压缩频带、二维滤波等功能；在传输中，它易于将图像信号和伴音信号时分复用，充分利用数字传输的优越性。

　　电视设备数字化的一个巨大推动力得益于计算机技术的飞速发展，新型cpu的运算速度与功能正在迅速增长，使得普通微机已具有工作站的能力，专用图像处理和声音处理芯片使得原本复杂的图像处理和声音处理可以借助微机的视卡和声卡轻易完成；加上码率压缩技术的进步和完善，在多个较大的计算机硬盘上存放较长时间的具有播出质量的图像已不成问题，由此而产生的集编辑、切换、数字特技和动画于一身的非线性编辑系统、视频工作站、桌上演播室系统已经成为电视设备发展的另一个方向。WWw.11665.COm

　　电视系统数字化的另一个动力是来自观众的需要，人们已不再满足于普通电视的画面质量水平，渴望看到更好更清晰的高清晰度电视，数字高清晰度电视便成为一种理所当然的选择。

　　要实现电视系统的全面数字化，首先要了解：

电视信号数字化的含义

　　模拟电视系统，在电视信号的产生、处理、记录、传送和接收的过程中，使用的都是模拟信号，即在时间上和幅度上连续的信号；而数字信号，则是在时间和幅度上都经过离散化的信号；将模拟信号变换成数字信号称为模数（a/d）转换，最基本的方法是所谓脉冲编码调制（pcm）法，运用该方法实现电视信号的数字化需要三个步骤：抽样、量化和编码。抽样是指用每隔一定时间的信号样值序列来代替原来在时间上连续的信号，也就是在时间上将模拟信号离散，其理论基础是奈奎斯特抽样定理。量化是用有限个幅度近似原来连续变化的幅度值，把模拟信号的幅度离散化。编码则是按照一定的规律，把量化后的值用数字表示，然后转换成二值或多值的数字信号流。收端经过译码和滤波将数字信号还原成为模拟信号，称为数模（d/a）转换，鉴于这个过程是最基本的数字信号处理过程，一般人都比较清楚，在此不再赘述。但是，我们需要了解一下：

彩色电视信号的编码标准－－ccir601号建议

　　

　　大家经常提到ccir601号建议，这个文件是向着数字电视广播系统参数统一化、标准化迈出的第一步，在该建议中，规定了625和525行系统电视中心演播室数字编码的基本参数值。

　　601号建议单独规定了电视演播室的编码标准，它对彩色电视信号的编码方式，取样频率，取样结构都作了明确的规定。

　下面，对ccir601号建议作几点简要说明：

　　⒈它规定彩色电视信号采用分量编码；所谓分量编码就是彩色全电视信号在转换成数字形式之前，先被分离成亮度信号和色差信号，然后对它们分别进行编码，分量信号（y，b-y，r-y，或r，g，b）被分别编码后，再合成数字信号。

　　⒉它规定了取样频率与取样结构,例如：在4:2:2等级的编码中，规定亮度信号和色差信号的取样频率分别为13.5mhz和6.75mhz，取样结构为正交结构,即按行、场、帧重复,每行中的r-y和b-y取样与奇次（1,3,5,……）y的取样同位置，即取样结构是固定的，取样点在电视屏幕上的相对位置不变。

　　⒊它规定了编码方式，对亮度信号和两个色差信号进行线性pcm编码，每个取样点取8比特量化；同时，规定在数字编码时，不使用a/d转换的整个动态范围，只给亮度信号分配220个量化级，黑电平对应于量化级16，白电平对应于量化级235；为每个色差信号分配224个量化级，色差信息的零电平对应于量化级128。

　　综上所述，我们知道，分量信号的编码数据流是很高的。以4:2:2编码标准为例，其比特流为：13.5*8+6.75*8*2=216兆比特/秒。若对复合信号直接编码，其抽样频率取为13.3mhz，则pcm编码的码率为：13.3*8=106.4兆比特/秒。

　　现在尽管有了多种能够记录与重放未经压缩的全数字电视信号的录像机；使得演播室内进行高质量的记录与还原成为现实。但从上式中可以看出，即使以数字复合信号的带宽而言（在理想情况下，其带宽为53.2mhz），也比传送一路模拟电视信号所要求的带宽提高了接近一个数量级，显然用目前的电视频道传送他们是不可能的，更不用说用普通计算机硬盘去储存这些信号（大概只能存几十秒钟），因此，数字电视的中心问题是要成倍地降低数字信号码元的传送速率（即压缩码率），消除电视信号中的多余信息（冗余量）和采用高效编码方法；也就是本文所要重点讨论的：

码率压缩技术

　　早在七十年代，科学家们就曾为卫星遥感图像的传输，存储和处理绞尽脑汁，经过一段时间的探索，人们发现，电视信号存在着很大的冗余度，即电视图像的像元之间存在着很大的相关性，除了空间轴上的冗余度之外（即各像素之间的统计相关性），在时间轴上也有冗余度（电视信号前一场信号与其后若干场信号中大部分像素没有发生变化，尤其是静止画面，或者是运动不太激烈的画面）。

　　那么，根据像元之间的统计相关性，对数据进行某种运算变换，使变换后图像比特数少于原始图像的比特数，也就是将图像数据进行压缩的方法称为码率压缩技术。

常见有如下方法：

　　⒈降低抽样频率的压缩码率技术。

　　降低抽样频率能够压缩码率这是十分自然的，但是，奈氏定理指出，当抽样频率fs<2fm时，频谱发生重迭，则采用低通滤波器无法无失真地恢复原信号；不过，电视图像信号的能量主要集中在以行频及其各次谐波频率为中心的较窄范围内，中间存在很大的空隙，因此，若把抽样频率fs选为半行频的奇数倍，就可使fs<2fm时出现的频谱混迭部分形成半行频交错。可以采用具有相应频率特性的梳状滤波器将其选出，以较小的失真恢复原始信号，称之为亚奈奎斯特抽样技术。

　　⒉差值脉冲编码（dpcm）

　　差值脉码调制，可以消除电视信号的统计性冗余度，因此大大地压缩了码率。dpcm又称为预测量化系统，它所传输的不是信号本身，而是实际信号与其预测量之间的差值（预测误差）。预测值是借助已经传送的，与待传抽样相邻的若干抽样值估计（预测）出来的。由于电视信号的强相关性，邻近抽样的取值一般很接近，因此预测能有较高的准确性。从统计上讲，需要传输的预测误差主要集中在零附近的一个小范围之内，比信号本身小很多，只有在图象轮廊和边缘处才出现较大的预测误差，但这只是少量的，且人眼很不易察觉这种误差。因此，预测误差量化所需要的量化级较少，从而码率得到压缩。

　　⒊线性变换编码：

　　线性变换编码不直接对图像数据编码，而是首先将图像数据进行某种线性变换，得到一组变换系数，然后对这些系数实现量化、编码、传输。在接收端，对收到的变换系数进行相应的逆变换，再恢复成图像信号。这样做的理由是对变换系数进行压缩编码，往往比直接对图像数据本身进行压缩更容易获得高的效率。以大家熟悉的付立叶变换为例，它是以通常在欧氏空间描写的图像信号变换到频率空间（频域）去描写，付氏变换的物理意义是频谱展开，对一幅图像进行二维付立叶变换就是在纵和横的两个方向进行二维频谱展开，由于信号与其频谱之间有一一对应关系，因此，传输频谱在接收端同样可以恢复信号，而传送频谱往往比传送信号本身简单。由于电视信号的能量主要集中在低频部分，能量密度随频率升高而迅速下降，加之考虑到人眼对图像中的高频细节不甚敏感的特点，因此，在频率域编码时，可以用较多的码位对幅度大的低频分量进行量化，而用较少的码对幅度小的高频分量进行量化，对于频率特别高的分量甚至于可以舍弃不传，从而就整体而言，码率可以明显下降。

　　从理论上讲，线性变换编码，可以压缩码率的原因在于图像信号存在很强的相关性，这种强相关性在频率域的反映是功率大部分集中在低频段，从而有可能利用频率域滤波的方式获得大的压缩比。

　　线性变换除了付立叶变换外，还有沃尔什哈达玛变换、斜变换、离散余弦变换（dct）、卡洛（k-l）变换等等，其中dct因其压缩效果较好而受到广泛应用。据此，下面重点讨论一下：

关于离散余弦变换（dct）

　　离散余弦变换dct（discrete cosine transform）是数码率压缩需要常用的一个变换编码方法。任何连续的实对称函数的付立叶变换中只含余弦项，因此余弦变换与付立叶变换一样有明确的物理意义。dct是先将整体图像分成n*n像素块，然后对n*n像素块逐一进行dct变换。由于大多数图像的高频分量较小，相应于图像高频分量的系数经常为零，加上人眼对高频成分的失真不太敏感，所以可用更粗的量化。因此，传送变换系数的数码率要大大小于传送图像像素所用的数码率。到达接收端后通过反离散余弦变换回到样值，虽然会有一定的失真，但人眼是可以接受的。二维正反离散余弦变换的算式：

　　其中n是像块的水平、垂直像素数，一般取n=8。n大于8时效率增加不多而复杂性大为增加。8*8的二维数据块经dct后变成8*8个变换系数，这些系数都有明确的物理意义。譬如当u=0，v=0时f(0，0)是原64个样值的平均，相当于直流分量，随着u，v值增加，相应系数分别代表逐步增加的水平空间频率和垂直空间频率分量的大小。当我们先只考虑水平方向上一行数据（8个像素）的情况时，如图1所示：

　　可见图像信号被分解成为直流成分；以及从低频到高频的各种余弦成分；而dct系数只是表示了该种成分所占原图像信号的份额大小；显然，恢复图像信息可以表示为这样一个矩阵形式：f(n)=c(n)*e(n)

　　式中e(n)是一个基底，c(n)是dct系数，f(n)则是图像信号。

　　如果再考虑垂直方向上的变化，那么，就需要一个二维的基底，即该基底不仅要反映水平方向频率的变化；而且要反映垂直空间频率的变化；对应于8*8的像素块；其空间基底如图2所示：它是由64个像素值所组成的图像，通常也称之为基本图像。把它们称为基本图像是因为在离散余弦变换的反变换式中，任何像块都可以表示成64个系数的不同大小的组合。既然基本图像相当于变换域中的单一的系数，那么任何像元也可以看成由64个不同幅度的基本图像的组合。这与任何信号可以分解成基波和不同幅度的谐波的组合具有相同的物理意义。

　　图2给出了一个对8*8像块进行dct变换的具体例子:

　　在如图3所示的实例中，可以看出：经过一次dct变换计算后，64个样值仍然得到64个系数，本身码率并没有压缩；但是，经dct变换后，比特数却增加了。原样值是8比特，数据从0～255；得到的f10即直流分量的最大值是原来256的64/8份，即0～2047，交流分量的范围是-1024～1023；但经过第2个步骤，即量化之后（图中△:4），大多数高频分量的系数变为0，一般说来，人眼对低频分量比较敏感，对高频分量则不太敏感；因而量化的结果是去掉了不太重要的高频分量，降低了码率。再通过“之”字型（zig-zag）方式读出数据，这样读出也可以减少码率。因为经dct变换以后，系数大多数集中在左上角，即低频分量区，因此“之”字型读出实际上是按二维频率的高低顺序读出系数的。这样就便于采用游程长度编码（run length encoding)，所谓游程长度编码是指一个码可以同时表示码的值和前面有几个零。这样就发挥了“之”字型读出的优点，因为“之”字型读出，出现连零的机会比较多，特别到最后，如果都是零，在读到最后一个数后，只要给出“块结束”（eob）码，就可以结束输出，因此节省了很多码率。

　　

关于jpeg与mpeg

　　jpeg是joint photographic experts group的缩写，主要用于计算机静止图像的压缩，在用于活动图像时，其算法仅限于帧内，便于它主要使用了两类算法：一类是dct，用来得到不同质量的图像；另一类算法是差值脉冲编码的方法，作为一种无损或近似无损的压缩方法。jpeg还定义了两种工作模式。一种是顺序方式（sequential）。顺序方式中，第一段或第一行数据先编码，然后第二行，直到图像结束。每一段数据都全部编码，解码时按编码的顺序进行。另一种模式是逐步方式（progressive），整幅图像先按低图像质量的水平编码，然后对同一图像再进行编码直到最佳质量。每次编码只传送提高质量的信息直到最佳状态。解码器先解出传送的基本的低质量图像。然后按相同的顺序逐步加上修正信息。jpeg定义了一个基本系统（baseline system），使用约定格式的dct算法，用于所有使用dct压缩算法的jpeg系统，该基本系统能按几种方法进行扩展。扩展系统可以使用逐步方式、高精度（12比特/样值）以及其它编码方法。另外一种无损压缩方法使用差值脉冲编码方法则不建立在上述基本的dct系统中。使用哪一种压缩方法依赖于要压缩的图像。对于在测试算法时所用的自然彩色图像（4:2:2ccir601 y，u，v的图像，每个像素16比特），得到可识别图像的质量只需要每像素0.15比特，可用的图像需每像素0.25比特；每像素0.75比特时图像质量已相当好，在每像素1.5比特左右与原图像基本没有什么差别。

　　由于jpeg没有利用时间方向上的冗余，因此jpeg在帧内编码方式上提供了多种多样的方法和选择。

　　目前，大部分非线性编辑系统，都使用了jpeg方式，因为其是帧内压缩方式可以逐帧

　　现在接触过图像技术的人恐怕很少有不知道mpeg的，mpeg是运动图像专家组的缩写（moving pictures expert groop）成立于1988年以建立活动图像及相应音频的编码标准。

　　实际上mpeg是一个标准系列，有mpeg-1，mpeg-2和mpeg-4。mpeg-1是低精度图像模式，如352*288(pal)25帧，适用于低比特率的应用。如果是cd-rom则输出码率为1.5mbps左右时编码效率较高。mpeg-2的主级和主类提供720*576,25帧的ccir601建议图像质量。在压缩率为30:1或更小的时候，mpeg-2可以提供广播质量的编码图像。mpeg-2也可工作在大压缩比下，如200:1，但效果与mpeg-1相差不大。原来还有mpeg-3，用于高清晰度电视的码率压缩，支持1920*1080 30帧格式，输出码率在20到40mbps。但目前mpeg-3已取消。因为mpeg-1和mpeg-2也能工作在hdtv。目前hdtv也包括在mpeg-2中。mpeg-4现在正处在明确其应用的阶段，希望1998年11月能正式通过。mpeg-4主要是在帧重建方面有非常有效的方法，就像midi使用预先存在的声音元素，用占带宽窄的命令来产生实际的声音。mpeg-4考虑了语言和视频合成、几何分形、计算机可视化和人工智能技术，以很少的数据产生精确的图像。

　　mpeg-2本身不是一个具体的系统标准，而是一种语法元素的工具包，它具有不同的压缩等级，可以这么说mpeg-2是一个家庭，相互有共同性和兼容性。mpeg-2有4种输入格式，称为级（levels）。从有限清晰度的vhs质量图像直到hdtv图像每一种输入格式编码后有一个相应的范围。除了在源格式提供这种灵活性之外，mpeg-2还有不同的处理方法，称为类（profiles），每一类都包括压缩和使用方法的一个集合。不同的类意味着使用不同集合的码率压缩工具。提供前一类没有使用的附加工具。

　　因为有关mpeg-2的介绍文献已经很多，关于mpeg-2的运动控制、帧预测、场预测、双基预测等其它详细内容请读者自行参阅相关文献。

注：此文曾在《广播电视网络技术》1999年第2期上发表过

论文网首页\|会计论文\|管理论文\|计算机论文\|医药学\|经济学论文\|法学论文\|社会学论文\|文学论文\|教育论文\|理学论文\|工学论文\|艺术论文\|哲学论文\|文化论文\|外语论文\|论文格式

		用户注册设为首页
	您现在的位置：中国论文网 >> 工科论文 >> 电力电气论文 >> 正文	会员中心
通信学论文交通运输论文工业设计论文环境工程论文电力电气论文水利工程论文材料工程论文建筑工程论文化学工程论文机械工程论文电子信息工程论文建筑期刊工科综合论文汽车制造