5.国际图像压缩标准
(1)JPEG
国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的联合图像专家小组JPEG(Joint Photo graphic Experts Group)于1991年3月正式通过了静止图像压缩编码标准,称为JPEG建议。该标准不仅适用于灰度等级和颜色连续变化的静止图像的压缩,也适用于电视图像序列的帧内图像压缩。
JPEG标准分为基本系统、扩展系统和信息保持系统三个部分,定义了两种基本压缩方法,各有不同的操作模式。第一种是有损压缩,采用基于DCT变换的有损压缩算法及哈夫曼编码,在保存图像时保留了较多的亮度信息,而将色度信息与周围像素进行合并,图像压缩后虽有损失但压缩比可以很高,合并比例不同,压缩比例也不同,压缩20倍左右时,重建图像质量达到人眼难以观察出损失的要求。第二种为无损压缩,又称预测压缩方法,采用基于空间预测编码DPCM的压缩算法及哈夫曼编码(或算术编码),可保证重建图像数据与原始图像数据完全相同,但压缩比很小。JPEG有一个优点,就是压缩和解压缩是对称的,这意味着压缩和解压缩可以使用相同的硬件或软件。
JPEG基本系统定义的有损压缩编码方法是最常使用的,其压缩过程分为四个步骤:色彩模式转换及采样;DCT变换;量化;编码。
A.色彩模式转换及采样
RGB色彩模式是最常用的表示颜色的方式,但JPEG采用YUV色彩模式,因为YUV模型更适合图像压缩。前文已提到,人眼对图片上的亮度Y的变化远比色度C的变化敏感,既然U和V成分的数据相对不重要,就可以只取部分数据来处理。例如每个像素保存一个8位的亮度值,每4个像素保存一个8位的U和8位的V值,而图像在人眼中的感觉不会有很大变化。这样原来用RGB模型4个像素需要4×3=12字节(每个像素用24位表示R、G、B的值,即3个字节),而现在仅需要4+2=6字节,平均每个像素占12位。
要用JPEG压缩处理彩色图像,必须先把RGB色彩模式的图像数据转换为YUV色彩模式的数据。转换后进行压缩采样。JPEG通常有两种采样方式:Y、U和V三个成分的数据采样比例分别是4:1:1、4:2:2。转换色彩模式后的图像可以理解为变成了Y、U、V三幅图像,每一幅图像单独进行下面的DCT变换、量化和编码。
B.DCT变换
首先按从左到右、从上到下的次序将图像分成许多个“8×8”的小块,即每个小块有8×8=64个像素,然后按该顺序送入DCT离散余弦变换器,对每个8×8的块进行DCT变换(二维),经过离散余弦变换得到频域的64个DCT系数。
C.量化
对上一步得到的64个系数进行线性均匀量化。
量化是根据量化表进行的,量化表是JPEG组织根据人眼视觉特性预先规定好的,有亮度量化表和色度量化表,其中对亮度的量化步长划分“细”一些,对色度的量化步长划分“粗”一些;在低频部分(左上角)步长小一些,在高频部分(右下角)步长大一些。量化就是用64个DCT系数除以(一一对应)量化表中的64个数,量化后得到的仍是一个(8×8)64系数的。
DCT变换后能量(低频部分)大部分集中在左上角。量化后高频部分会出现一些“0”,就实现了对高频信号的压缩,失真也就出现了。
D.编码
量化后得到的仍是64个系数。DCT变换是将数据从时(空)域变换到频域,在频域平面上左上角的一个系数称作直流分量,即DC系数,包含了整个图像能量的主要部分,其余63个系数称作AC系数,即交流分量。
一幅图像中像素之间的亮度或色差信号是连续的,相邻的8×8块之间有很强的相关性,因此相邻块的DC系数值很接近,对量化后前后两块之间的DC系数差值进行编码,可以使用较少的比特数。
为了既能表示出系数的相对位置又能说明系数的值,而且编码效率又比较高,JPEG对AC系数分量用“Z”字型编码。编码时从左上方AC01(u=0,v=1)开始,沿箭头方向,以“Z”字形行程扫描,直到AC77(u=7,v=7)结束。
沿“Z”字形路径行进,可使值为“0”的AC系数集中。
为了进一步达到压缩数据的目的,需要对量化后的DC系数差值,和行程编码后的AC系数进行基于统计特性的熵编码。JPEG建议使用两种熵编码方法:哈夫曼(Huffman)编码和自适应二进制算术编码(Adaptive Binary Arithmetic Coding)。
熵编码分为两步,第一步是把DC和AC系数转换成一个中间格式的符号序列。
AC系数的中间格式由两个符号组成。符号1即第一个字节(NNNN——行程,SSSS——尺寸),符号2即第二个字节(幅值——下一个非零值的实际值)。
符号1中,当两个非0的AC系数之间连续0的个数超过15时,用增加扩展符号1“(15,0)”的个数来扩充。对于8×8块的63个AC系数最多增加三个扩展符号1“(15,0)”。而(0,0)称为EOB(End of Block),来表示其后的AC系数皆为0。符号2直接用二进制数编码表示,若幅值为负数用反码表示。
对于直流分量DC系数的差值,符号1只代表尺寸信息,用以表示DC系数差值的幅值所需的比特数;符号2表示差值的幅值大小。
第二步是给这些符号赋以变长码字。
对DC系数和AC系数中的符号1,查“哈夫曼码表”进行编码,再与符号2的值相连即可得到DC和AC系数的编码。
“哈夫曼变长码表”和“哈夫曼变长整数表”是JPEG标准制定的,必须作为JPEG编码器的一部分输入。
实现上述四个步骤,即完成一幅图像的JPEG压缩。
压缩后的图像文件扩展名为.JPG或.JPEG,这是一种很灵活的图像格式,允许用户用不同的压缩比例对文件进行压缩,支持多种压缩级别(如Photo Shop中的压缩指数),压缩比通常在10∶1到40∶1之间,压缩比越大,品质就越低;相反的,压缩比越小,品质就越好。
(2)JPEG2000
JPEG2000是2000年3月由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它用小波变换为主的多解析编码方式代替了余弦变换为主的区块编码方式。小波变换具有对信号进行多分辨率分析和反映信号局部特征的特点,是当前图像压缩的热点之一。
作为JPEG的升级版,JPEG2000的压缩率比JPEG高约30%左右,不会产生基于DCT的JPEG标准产生的块状模糊,兼容有损和无损压缩(可根据需要自由选择,而JPEG的有损压缩和无损压缩是完全不同的两种方法),在编码端无损压缩的情况下,可以在解码端从码流中以任意的图像质量和分辨率解压图像。JPEG2000有一个极其重要的特征在于渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示(而JPEG图像在网络中传输显示时是逐行显示的)。此外,JPEG2000还支持“感兴趣区域”编码压缩策略,可以任意指定图像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。某些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,同时结合了接收方对压缩的主观需求,实现了交互式压缩。
可提供对图像内容的描述也是JPEG2000的重要优势,JPEG2000在传输图像时,提供额外的关于图像内容的描述信息,通过这一特性,就可以方便地建立关于图像内容的数据库检索,从而使得图像检索在互联网搜索中成为可能。另一方面,这个特性对于大容量图像数据库的维护和检索也是必不可少的。JPEG2000还允许在图像中通过加密、水印等方法,加入图像的版权信息,这个特性对互联网中普遍存在的盗版现象具有现实的应用价值。
由于其强大功能,JPEG2000既可应用于传统的JPEG市场,如扫描仪、数码相机,又可应用于新兴领域,如网络传输、无线通讯等等。但是目前许多公司基于JPEG2000开发的软件还没有形成统一的技术规范,众多JPEG2000的应用软件也还互不兼容,加上JPEG2000的算法复杂度较高,因此近期JPEG2000还不可能代替JPEG。
三、数字图像的编辑处理
1.数字图像素材来源
图形图像是多媒体软件中重要的信息表达元素,它们的采集方式主要有:用图形创作工具软件创作
目前Windows环境下的大部分图像编辑软件都具有一定的绘图功能。这些软件大多具有较强的功能和很好的图形用户接口,可以利用鼠标、画笔及绘画板来绘制各种图形,并进行色彩、纹理、图案等的填充和加工处理。常见的图形创作工具软件中,Windows中的画笔(Paintbrush)是一个功能全面的小型绘图程序,它能处理简单的图形。还有一些专用的图形创作软件,如Auto CAD用于三维造型,Corel Draw、Freehand、Illustrator等用于绘制矢量图形等。这些较专业的绘画软件,可以使用数字化画板和画笔在屏幕上绘画,当然要求绘画者具有一定美术知识及创意基础。
多数图形创作工具软件对一些小型的图形、图标、按钮等,直接制作很方便,但不足以描述自然景物和人像。
扫描仪扫描
扫描仪是图像输入的主要设备,它可以将各种照片、平面图画、幻灯片、艺术作品等变换成不同质量的数字图像。
数码相机拍摄
数码相机可以直接产生数字化图像,带有标准接口与微机相连,以将拍摄的数字图像传输到计算机中。
从数字化仪中输入
数字化仪用于采集工程图形,在工业设计领域有广泛的用途。
从屏幕、动画、视频中捕捉
从屏幕上抓取图像是准备图形图像素材的常用途径,最简单的方法是用键盘上的“Print Screen”键将屏幕图像复制到剪贴板中,再打开图像处理软件“粘贴”即可得到分辨率与屏幕区域设置大小相同的图像。还可以通过抓图软件进行抓图,常用的屏幕抓图软件有Hyper Snap-DX、Capture Profession、Print Key、Snag It等。
在动画、视频中进行单帧捕捉:对视频中精彩画面既可以通过相关软件进行截取(如豪杰超级解霸在播放视频时就可以使用单张抓图和连续抓图功能),也可以利用视频采集卡采集视频图像的单帧画面。虽然清晰度较低,但对于一些瞬间即逝的画面,采用这种方法比用照相机抓拍成功率要高。
数字图像库的利用
目前存贮在光盘和Internet上的数字图像库越来越多,这些图像的内容丰富,图像尺寸和图像深度可选的范围也较广。
光盘中的图像质量完全能满足用户的要求,还可以根据需要对图像素材编辑加工后再使用。
2.数字图像文件格式
将图形图像存储在外存储器上(如硬盘、光盘、优盘),就形成了数字图像文件。数字图像文件有多种存储格式,不同的格式存储图像信息的方式不同,如采用不同的压缩算法、对图像色彩的存储格式不同、与不同的应用软件兼容等等。
(1)BMP格式
该格式是目前应用比较广泛的一种格式,最典型的应用BMP格式的程序就是Windows的画图。它的颜色存储格式有1位、4位、8位及24位,文件不压缩,占用磁盘空间较大。
(2)GIF格式
GIF格式是在各种平台的各种图形图像处理软件上均能够处理的、经过压缩的一种图像文件格式,它采用了无损数据压缩方法中压缩率较高的LZW算法,所以GIF格式的图片所占的空间较小;GIF格式最多只能有256种颜色,适合显示色调不连续或具有大面积单一颜色的图像;GIF格式能够存储成背景透明的形式,并且可以将数张图片存成一个文件,从而形成动画效果。GIF格式在Internet上被广泛应用,主要是因为256种颜色已经基本满足网页图像需要,而且文件较小,适合网络环境传输和使用。
(3)JPEG格式
该格式采用JPEG技术压缩生成,可以用不同的压缩比例对文件进行压缩,但对图像质量影响不大,可以用最少的磁盘空间得到较好的图像质量,因此应用非常广泛,在Internet上更是主流图像格式。
(4)PCX格式
PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发的一种格式,存储格式从1位到24位,它是经过压缩的格式,占用磁盘空间较少。由于该格式出现的时间较长,并且具有压缩及真彩色的能力,所以现在仍比较流行。
(5)PSD格式
Adobe公司开发的图像处理软件Photoshop中自建的标准文件格式就是PSD格式。在Photoshop所支持的各种格式中,PSD格式存取速度比其他格式快很多,功能也很强大,里面可以存放图层、通道、遮罩等多种设计草稿。由于Photoshop软件的应用越来越广泛,PSD格式也逐渐流行起来。