1、第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.主要内容主要内容数据压缩概述数据压缩概述经典数据压缩理论经典数据压缩理论香农范诺与霍夫曼编码香农范诺与霍夫曼编码算术编码算术编码行程编码行程编码词典编码词典编码预测编码预测编码变换编码变换编码现代数据压缩理论现代数据压缩理论小波小波分形分形多媒体数据压缩编码的国际标准多媒体数据压缩编码的国际标准 数字信号的数字信号的压缩与编码是多压缩与编码是多媒体的核心技术媒体的核心技术和重要内容和重要内容;音音频信号的差分频信号的差分/自适应自适应/LPC编编码就是典型的压码就是典型的压
2、缩编码缩编码.第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.数据压缩技术是多媒体技术的关键技术,也是多媒体技术发数据压缩技术是多媒体技术的关键技术,也是多媒体技术发展的基础。在多媒体技术发展到的今天,大家已经知道数据展的基础。在多媒体技术发展到的今天,大家已经知道数据是可以压缩的,但数据是可以压缩的,但数据为什么要压缩?为什么要压缩?为什么能够实现数据压缩?为什么能够实现数据压缩?理论基础与原理是什么?实现数据压缩的具体方法有哪些?目前世界理论基础与原理是什么?实现数据压缩的具体方法有哪些?目前世界通用的数据压缩标准是
3、什么?其规范与实现的途径又有哪些?通用的数据压缩标准是什么?其规范与实现的途径又有哪些?思 考 第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1 多媒体数据压缩编码的重要性和分类多媒体数据压缩编码的重要性和分类 数据压缩就是在一定的精度损失条件下,以最少的数码表示信源所发出的信号信源编码信道编码信道信道译码信源译码信源信宿什么是数据压缩什么是数据压缩第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.多媒体数据4.1.1 多媒体数据压缩编码的重要
4、性多媒体数据压缩编码的重要性数据压缩的必要性数据压缩的必要性多媒体信号的数据量巨大,如:多媒体信号的数据量巨大,如:一幅一幅1024*1024真彩图有真彩图有3MB5分钟的分钟的CD音乐有音乐有50.47MB90分钟的分钟的PAL视频数字化后有视频数字化后有204.68GB为了节省存储空间和传输带宽,进行实时高质的多媒体通为了节省存储空间和传输带宽,进行实时高质的多媒体通信,必须对多媒体数据进行压缩编码信,必须对多媒体数据进行压缩编码 多媒体信源引起了“数据爆炸”,如果不进行数据压缩,传输和存储都难以实用化。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术Octo
5、ber 20December 22.4.1.2 多媒体数据压缩的重要性多媒体数据压缩的重要性1分钟数字音频信号需要的存储空间数数字字音音频频格格式式频频带带(Hz)带带宽宽(KHz)取取样样率率(KHz)量量化化位位数数存存储储容容量量(MB)电电话话20034003.2880.48会会议议电电视视伴伴音音507000716141.68C CD D-D DA A20200002044.1165.2922D DA AT T20200002048165.762数数字字音音频频广广播播20200002048165.766第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术O
6、ctober 20December 22.1分钟数字视频信号需要的存储空间4.1.2 多媒体数据压缩的重要性多媒体数据压缩的重要性第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.数据压缩的好处数据压缩的好处时间域压缩时间域压缩迅速传输媒体信源迅速传输媒体信源频率域压缩频率域压缩并行开通更多业务并行开通更多业务空间域压缩空间域压缩降低存储费用降低存储费用能量域压缩能量域压缩降低发射功率降低发射功率第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1
7、.2 多媒体数据压缩的可能性多媒体数据压缩的可能性声音、视频、图像数据表示有很大的压缩潜力,多媒体数据声音、视频、图像数据表示有很大的压缩潜力,多媒体数据和人类的感觉存在着各种冗余,如:和人类的感觉存在着各种冗余,如:空间冗余:在同一幅图像中,规则物体和规则背景的空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。在数字化图像中就表现为数据冗余。压缩的可能压缩的可能第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December
8、 22.4.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性时间冗余:时间冗余反映在图像序列中就是相邻帧时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。场景可以由其它帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。音频的前后样值之间也同样有时间冗余。F2AF1A第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性听觉冗余:
9、人耳对不同频率的声音的敏感性是不同听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。特别关注,因此存在听觉冗余。信息熵冗余:信源编码时,当分配给第信息熵冗余:信源编码时,当分配给第i i个码元类个码元类的比特数的比特数b(yi)=b(yi)=log pi log pi,才能使编码后单位数,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到各码元类的先验概率很难预知,比特分配不能达到最佳。
10、实际单位数据量最佳。实际单位数据量dH(S)dH(S),即存在信息冗余熵。,即存在信息冗余熵。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性视觉冗余:人眼对于图像场的注意是非均匀的,视觉冗余:人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为类视觉的一般分辨能力为26灰度等级,而一般灰度等级,而一般图像的量化采用的是图像的量化采用的是28灰度等级,即存在着视灰度等级,即存在着视觉冗
11、余。觉冗余。结构冗余:结构冗余:图象有非常强的纹理结构。如草席图结图象有非常强的纹理结构。如草席图结构上存在冗余。构上存在冗余。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性知识冗余:知识冗余:图像的理解与某些基础知识有关。图像的理解与某些基础知识有关。例例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上子上方有眼睛,鼻子在中线上 其它冗余:其它冗余:图象空白的非定长性。图象空白的非定长性。第第4章章
12、 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.3 多媒体数据压缩技术的性能指标多媒体数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标有三个关键参数评价一个压缩系统有三个关键参数评价一个压缩系统 压缩比 图象质量 压缩和解压的速度另外,也必须考虑每个压缩算法所需的硬件和软件。另外,也必须考虑每个压缩算法所需的硬件和软件。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.3 多媒体数据压缩技术的性能指标多媒体数据压缩技术的性能指
13、标压缩比压缩比压缩性能常常用压缩比定义压缩性能常常用压缩比定义输入数据和输出数据比输入数据和输出数据比 例一幅例一幅512 480pixels图像,图像,24bit/pixel 输入输入512 480(24/8)=737280 byte 输出输出15000 byte 压缩比压缩比7372801500049第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.3 多媒体数据压缩技术的性能指标多媒体数据压缩技术的性能指标图象质量图象质量无损压缩无损压缩(图象质量不变)(图象质量不变)有损压缩:失真情况很难量化,只能对测试的
14、图象进行估计。有损压缩:失真情况很难量化,只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实际图象以后。际图象以后。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.3 多媒体数据压缩技术的性能指标多媒体数据压缩技术的性能指标压缩压缩/解压速度解压速度在许多应用中,压缩和解压缩可能不同时用,所以,压缩、在许多应用中,压缩和解压缩可能不同时用,所以,压缩、解压速度分别估计。解压速度分别估计。静态图象中,压缩速度没有解压速度
15、严格;动态图象中,静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。中抓取动态视频。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.4 多媒体数据压缩的硬、软件系统多媒体数据压缩的硬、软件系统硬、软件系统硬、软件系统有些压缩、解压工作可用软件实现。一般地讲,设计系统时必须充分有些压缩、解压工作可用软件实现。一般地讲,设计系统时必须充分考虑:考虑:算法复杂 压缩解压过程长 算法简单 压缩效果差目前有些特
16、殊硬件可用于加速压缩解压。目前有些特殊硬件可用于加速压缩解压。硬接线系统速度快,但硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩缩/解压系统时必须先将算法标准化。解压系统时必须先将算法标准化。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.多媒体数据压缩技术多媒体数据压缩技术数据压缩数据压缩(data compression)与信号编码与信号编码(signal coding)往往往含义相同往含义相同压缩压缩(compress)
17、解压缩解压缩/还原还原/重构重构(decompress)编码编码(encode/coding)解码解码/译码译码(decode)相关学科:相关学科:信息论、信息论、数学、信号处理、数据压缩、编码数学、信号处理、数据压缩、编码理论和方法理论和方法 第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.无损压缩无损压缩是指使用压缩后的数据进行重构是指使用压缩后的数据进行重构(或者或者叫做还原,解压缩叫做还原,解压缩),重构后的数据与原来的数据完,重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号全相同;无损压缩
18、用于要求重构的信号与原始信号完全一致的场合。完全一致的场合。有损压缩有损压缩是指使用压缩后的数据进行重构,重构是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。信号不一定非要和原始信号完全相同的场合。4.1.5 数据压缩技术的分类数据压缩技术的分类 第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.5 数数据据压压缩缩
19、技技术术的的分分类类(2)第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.5 数据压缩技术的分类数据压缩技术的分类(3)1.熵编码熵编码熵编码(entropy encoding)是一类利用数据的统计信息进行压缩的无语义数据流的无是一类利用数据的统计信息进行压缩的无语义数据流的无损编码。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信损编码。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。如息的类型优化压缩。如RLE、LZW、Huffman编码编码2.信源编码(信)
20、源编码(信)源编码(source coding)是一类利用信号原数据在时间域和频率域中的相关性和是一类利用信号原数据在时间域和频率域中的相关性和冗余进行压缩的有语义编码。种类繁多,可进一步分为冗余进行压缩的有语义编码。种类繁多,可进一步分为预测编码:利用先前和现在的数据对在时间或空间上相邻的下面或后来的数据预测编码:利用先前和现在的数据对在时间或空间上相邻的下面或后来的数据进行预测,从而达到压缩的目的。如进行预测,从而达到压缩的目的。如DM、ADPCM变换编码:采用各种数学变换方法,将原时间域或空间域的数据变换到频率域变换编码:采用各种数学变换方法,将原时间域或空间域的数据变换到频率域或其他域
21、,利用数据在变换域中的冗余或人类感觉的特征来进行压缩。如或其他域,利用数据在变换域中的冗余或人类感觉的特征来进行压缩。如DCT、DWT分层编码:将原数据在时空域或频率域上分成若干子区域,利用人类感觉的特分层编码:将原数据在时空域或频率域上分成若干子区域,利用人类感觉的特征进行压缩编码,然后再合并。如子采样、子带编码征进行压缩编码,然后再合并。如子采样、子带编码其他编码:如矢量量化、运动补偿、音感编码其他编码:如矢量量化、运动补偿、音感编码第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.1.5 数据压缩技术的分类数据压
22、缩技术的分类(4)4.混合编码混合编码混合编码(hybrid coding)=熵编码熵编码+源编码源编码大多数压缩标准都采用混合编码的方法进行数据压缩,一般是先利用信源编码进行有损大多数压缩标准都采用混合编码的方法进行数据压缩,一般是先利用信源编码进行有损压缩,再利用熵编码做进一步的无损压缩。如压缩,再利用熵编码做进一步的无损压缩。如H.261、H.263、JPEG、MPEG常见常见第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(1)1843年莫尔斯(年莫尔斯(Morse)的电报码是最原始的)的电
23、报码是最原始的变长码数据压缩变长码数据压缩实例。实例。1938年里夫斯(年里夫斯(Reeves)、)、1946年德劳雷恩(年德劳雷恩(E.m.Delorain)以及贝尔公司的卡特勒(以及贝尔公司的卡特勒(C.C.Cutler)分别发明了)分别发明了脉冲编码脉冲编码调制调制(Pulse Code Modulation,PCM)、)、增量调制增量调制(Delta Modulation,)以及)以及差分脉冲编码调制差分脉冲编码调制(Differential PCM,DPCM)。)。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22
24、.4.2 压缩编码研究史(2)1948年香农(年香农(C.E.Shannon)在其经典论文)在其经典论文“通信的数学原通信的数学原理理”中首次提到信息率中首次提到信息率失真函数概念,失真函数概念,1959年又进一步年又进一步确立了率失真理论,从而奠定了确立了率失真理论,从而奠定了信源编码信源编码的理论基础。的理论基础。1948年提出电视信号数字化后,就开始了图像压缩编码的研究工年提出电视信号数字化后,就开始了图像压缩编码的研究工作。作。1952年霍夫曼年霍夫曼(D.A.Huffman)给出给出最优变长码最优变长码的构造方法。的构造方法。同年贝尔实验室的奥利弗同年贝尔实验室的奥利弗(B.M.Ol
25、iver)等人开始研究等人开始研究线性预线性预测编码理论测编码理论;1958年格雷哈姆年格雷哈姆(Graham)用计算机模拟法研究用计算机模拟法研究图像的图像的DPCM编码方法编码方法;1966年奥尼尔(年奥尼尔(J.B.ONeal)对比)对比分析了分析了DPCM和和PCM,又于,又于1969年进行了年进行了线性预测线性预测的实验。的实验。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(3)20世纪世纪60年代,科学家们也开始探索比预测编码效率更高年代,科学家们也开始探索比预测编码效率更高的编码方
26、法。包括的编码方法。包括KL变换变换、傅立叶变换傅立叶变换等正交变换。等正交变换。1968年安德鲁斯(年安德鲁斯(H.C.Andrews)等人采用)等人采用二维离散傅立叶变二维离散傅立叶变换换(2D-DFT)提出了变换编码。此后相继出现了提出了变换编码。此后相继出现了沃尔什沃尔什-哈哈达玛达玛(Walsh-Hadamard)变换、)变换、斜变换斜变换(Slant变换,由变换,由Enomoto和和Shibata引入引入)、K-L变换变换、离散余弦变换离散余弦变换(DCT)等。等。1976年美国贝尔系统的克劳切年美国贝尔系统的克劳切(R.E.Crochjiere)等人引入等人引入了语音的了语音的子
27、带编码子带编码,1985年奥尼尔(年奥尼尔(S.D.ONeil)将子带)将子带编码推广到对图像的编码。编码推广到对图像的编码。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(4)1983年瑞典的年瑞典的Forchheimer 和和Fahlander提出了基于提出了基于模型图模型图像编码像编码(Model-Based Coding)。)。1986年,年,Meyer在理论上证明了一维小波函数的存在,创在理论上证明了一维小波函数的存在,创造性地构造出具有一定衰减特性的造性地构造出具有一定衰减特性的小波函
28、数。小波函数。1987年年Mallat提出了多尺度分析的思想及多分辨率分析的提出了多尺度分析的思想及多分辨率分析的概念,成功地统一了在此之前各种具体小波的构造方法,概念,成功地统一了在此之前各种具体小波的构造方法,提出了相应的提出了相应的快速小波算法快速小波算法Mallat算法,并把它有效算法,并把它有效地应用于图像分解和重构;地应用于图像分解和重构;1989年,小波变换开始用于多年,小波变换开始用于多分辨率图像描述。分辨率图像描述。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(5)1988年美
29、国年美国Georgia理工学院的理工学院的M.F.Barnsley在在BYTE上发上发表了表了分形压缩分形压缩方法,方法,1992年年A.Jacquin实现分块迭代函数系实现分块迭代函数系统(统(PIFS),完善了),完善了分形编码压缩分形编码压缩方法。方法。1988年在图像压缩编码的发展历史中是极为重要的一年。年在图像压缩编码的发展历史中是极为重要的一年。几十年研究的成果集中表现在确定了几十年研究的成果集中表现在确定了H.261和和JPEG两个建两个建议的原理框架,奠定了议的原理框架,奠定了20世纪世纪90年初相继提出的年初相继提出的MPEG-1、MPEG-2、H.263等标准等标准的基础。
30、的基础。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(6)1991年年3月,月,“联合图片专家组联合图片专家组”(JPEG,Joint Photographic Expert Group)提出)提出JPEG标准草案,标准草案,1994年正式通过(年正式通过(ISO 10918)。)。1991年为二值图像编码年为二值图像编码制订了制订了JBIG标准标准(ISO 11544)。新的)。新的JPEG版本是版本是JPEG-LS(ISO/IEC 14495,1999),和),和JPEG 2000(ISO/
31、IEC 15444,等同的,等同的ITU-T编号编号T.800),于),于1999年年3月形成工作草案,月形成工作草案,2000年正式颁布的。年正式颁布的。JPEG的这些标的这些标准主要应用于静止图像处理。准主要应用于静止图像处理。H.263(H.261 P x 64)涉及低分辨率的视频序列。它可以涉及低分辨率的视频序列。它可以与为与为ISDN和移动通信开发的音频编码标准一起实现,这和移动通信开发的音频编码标准一起实现,这些标准已成为些标准已成为CCITT标准。标准。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2
32、 压缩编码研究史(7)1992年,年,“运动图片专家组运动图片专家组”(MPEG,Moving Picture ExpertGroup)提出了)提出了“用于数字存储媒体运动图像及其用于数字存储媒体运动图像及其伴音率为伴音率为1.5Mbit/s的压缩编码的压缩编码”,简称为,简称为MPEG-1,作为,作为ISO CD11172号建议通过,号建议通过,1993年正式通过。年正式通过。1993年提出年提出MPEG-2标准草案,标准草案,1994年正式通过(年正式通过(ISO/IEC 13818,视频部分为,视频部分为ITU-T H.262),处理能力可达广播级),处理能力可达广播级水平。水平。MPE
33、G-2标准兼容标准兼容MPEG-1标准,适应于标准,适应于1.5Mbit/s 80Mbit/s编码范围。编码范围。MPEG-2标准也是标准也是DVD和高清晰度电和高清晰度电视(视(HDTV)全数字方案所采用的数据压缩标准。)全数字方案所采用的数据压缩标准。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.2 压缩编码研究史(8)1995年年1月,国际标准化组织月,国际标准化组织ITU-TLBC工作组为极低数码工作组为极低数码率可视电话(率可视电话(VeryLowBitRateVisualTelephony)的工作形)的
34、工作形成了成了H.263视频压缩编码视频压缩编码草案。草案。1997年年11月提出了月提出了MPEG-4用于极低数码率数据压缩,用于极低数码率数据压缩,1999年年MPEG-4形成国际标准。形成国际标准。又一个又一个MPEG标准标准MPEG-7,是,是“多媒体内容描述接口多媒体内容描述接口”,在在2001年正式颁布。目前正在开发的新的年正式颁布。目前正在开发的新的MPEG-21。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.3 量化量化 量化处理量化处理是使数据比特率下降的一个强有力的措施。脉冲编是使数据比特率下降
35、的一个强有力的措施。脉冲编码调制(码调制(PCM)的量化处理是采样之后进行,从理论分析的)的量化处理是采样之后进行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以角度,图像灰度值是连续的数值,而我们通常看到的是以(0255)的整数表示图像灰度,这是经)的整数表示图像灰度,这是经A/D变换后的以变换后的以256级灰度分层量化处理了的离散数值,这样可以级灰度分层量化处理了的离散数值,这样可以用用log2256=8比比特表示一个图像像素的灰度值,或色差信号值。特表示一个图像像素的灰度值,或色差信号值。4.4.1 量化原理量化原理第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技
36、术(1)多媒体信息技术October 20December 22.4.3 量化量化 数据压缩编码中的量化处理数据压缩编码中的量化处理,不是指,不是指A/D变换后的量化,而是指以变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。量化输入值的动态范围很正交变换系数、差值或预测误差的量化处理。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用较少
37、的比特数便可表示。每个量化输入作量化级,希望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。差(量化噪声)。4.4.1 量化原理量化原理第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技
38、术October 20December 22.4.3 量化量化 通常设计量化器有下述两种情况:通常设计量化器有下述两种情况:给定量化分层级数,满足量化误差最小。给定量化分层级数,满足量化误差最小。限定量化误差,确定分层级数,满足以尽量小的平均比特限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。数,表示量化输出。4.4.2 标量量化器的设计标量量化器的设计第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.3 量化量化 量化方法量化方法有有标量量化标量量化和和矢量量化矢量量化之分,标量量化又可分为之分,
39、标量量化又可分为:均匀量化均匀量化非均匀量化非均匀量化自适应量化自适应量化4.4.2 标量量化器的设计标量量化器的设计第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.3 量化量化均匀量化特性曲线非均匀量化特性曲线 第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.3 量化量化 矢量量化编码矢量量化编码是近年来图像、语音信号编码技术中颇为流是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法。矢量量化编码方法一般是有失行的一种新型量化
40、编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。真编码方法。矢量量化的名字是相对于标量量化而提出的。对于对于PCM数据,一个数一个数地进行量化叫标量量化。若对数据,一个数一个数地进行量化叫标量量化。若对这些数据分组,每组这些数据分组,每组K个数构成一个个数构成一个K维矢量,然后以矢量为维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。单元,逐个矢量进行量化,称矢量量化。4.4.3 矢量量化矢量量化矢量量化编码解码框图 第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4 常
41、用多媒体压缩方法常用多媒体压缩方法一编码准备一编码准备模数转换模数转换(A/D):A/D连续模拟信号连续模拟信号 离散数字信号离散数字信号采样采样/量化量化预处理:对得到的初始数字信号进行必要的处理,包括过滤、预处理:对得到的初始数字信号进行必要的处理,包括过滤、去噪、增强、修复等,以达到除去数据中的不必要成分、提去噪、增强、修复等,以达到除去数据中的不必要成分、提高信号的信噪比、修复数据的错误等目的高信号的信噪比、修复数据的错误等目的 编码过程编码过程第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.编码与解码编码与解码
42、 A/D 预处理预处理 压缩压缩多媒体信号多媒体信号 数字信号数字信号 处理过的数字信号处理过的数字信号 压缩数据压缩数据 (子子)采样采样/量化量化 过滤过滤/去噪去噪/增强增强/修复修复源编码源编码/熵编码熵编码存储存储 解码解码D/A 压缩数据压缩数据 重构的数字信号重构的数字信号 显示显示/播放播放传输传输 还原还原/重构重构 (插值插值)二编解码过程二编解码过程第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1熵编码熵编码信息量和信息熵信息量和信息熵 图像的概率分布、信息量和信息熵之间有什么关图像的概率
43、分布、信息量和信息熵之间有什么关系?在图像编码压缩理论研究中,为什么要引入信系?在图像编码压缩理论研究中,为什么要引入信息论中息论中“熵熵”值的概念,有什么重要意义?这是我值的概念,有什么重要意义?这是我们下面需要说明的问题。们下面需要说明的问题。信息论中的信源编码理论解决的主要问题:(1)数据压缩的理论极限(2)数据压缩的基本途径第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1熵编码熵编码编码器信源(消息集)编码输出集(接收端)X=x1,x2,xnZ=z1,z2,zn符号集Am=a1,a2,am编码器模型图
44、其中X是消息集,由几个信号单元xj构成(j=1,2,n)Z是输出集,由几个码字zj构成(j=1,2,n),zj与xj一一对应。Am是符号集,由m个码元ai构成(i=1,2,m),符号集中的码元组成输出码字。第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1熵编码熵编码信息熵为信源的平均信息量(不确定性的度量)信息熵为信源的平均信息量(不确定性的度量)熵编码是一类利用数据的熵编码是一类利用数据的统计信息统计信息进行压缩的无语义数据流的无进行压缩的无语义数据流的无损编码损编码 本节在了解熵定义的基础上,讨论若干常用的
45、熵编码算法,内容本节在了解熵定义的基础上,讨论若干常用的熵编码算法,内容有:有:熵熵 Shannon-Fano编码编码 Huffman编码编码 算术编码算术编码 RLE LZW算法算法第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1 熵编码熵编码熵熵(entropy)本来是物理的热力学中用来度量热力学系统无本来是物理的热力学中用来度量热力学系统无序性的序性的(热力学第二定律:孤立系统内的熵恒增热力学第二定律:孤立系统内的熵恒增):(S为熵、为熵、Q为热量、为热量、T为绝对温度为绝对温度)对可逆过程,对可逆过程,
46、(孤立系统孤立系统)信息熵的概念是香农信息熵的概念是香农(Shannon仙农仙农)于于1948年在他创建的年在他创建的信息论中引进的,用来度量信息中所含的信息量:信息论中引进的,用来度量信息中所含的信息量:其中,其中,H为信息熵(单位为为信息熵(单位为bit),),S为信源,为信源,pi为符号为符号si在在S中中出现的概率出现的概率 0 ,TdQdSTdQSiiippSH1log)(2第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.仙农信息论把一个事件(字符仙农信息论把一个事件(字符s1)所携带的信息量定义为:)所携带的
47、信息量定义为:I(s1)=log2(1/p)=-log2 p (bit)其中其中p为事件发生(字符出现)的概率为事件发生(字符出现)的概率I(s1)即随机变量即随机变量X取值为取值为s1时所携带的信息量时所携带的信息量第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.信息熵信息熵H为自信息量为自信息量I:的均值的均值如果将信源所有可能事件信息量进行平均就得到信息的熵(熵就是平 均信息量)。例如,一幅用例如,一幅用256级灰度表示的图像,如果每一个象素点灰级灰度表示的图像,如果每一个象素点灰度的概率均为度的概率均为pi=1/
48、256,则,则即编码每一个象素点都需要即编码每一个象素点都需要8位位(I),平均每一个象素点也需,平均每一个象素点也需要要8位位(H)iipsI1log)(282log256log1log8222ipI)(82log2561256256log25611log822550225502bitppHiiii第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1 熵编码熵编码熵的大小与信源的概率模型有着密切的关系。熵的大小与信源的概率模型有着密切的关系。最大离散熵定理:当与信源对应的字符集中的各个最大离散熵定理:当与信源对应
49、的字符集中的各个字符为等概率分布时,熵具有极大值字符为等概率分布时,熵具有极大值log2m。m为字为字符集中字符个数信源均含有的平均信息量符集中字符个数信源均含有的平均信息量(熵熵),就是进就是进行无失真编码的理论极限。行无失真编码的理论极限。mjjjppxH1log)(mjjp11第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术October 20December 22.4.4.1 熵编码熵编码信源均含有的平均信息量信源均含有的平均信息量(熵熵),就是进行无失真编码就是进行无失真编码的理论极限。的理论极限。信源中或多或少的含有自然冗余。信源中或多或少的含有自然冗
50、余。对于同一个信源其总的信息量是不变的,如果能够通过某种变换(编对于同一个信源其总的信息量是不变的,如果能够通过某种变换(编码),使信源尽量等概率分布,则每个输出符号所独立携带的信息量增大,码),使信源尽量等概率分布,则每个输出符号所独立携带的信息量增大,那么传送相同信息量所需要的序列长度就越短。那么传送相同信息量所需要的序列长度就越短。信源的冗余度隐含在信源符号的非等概率信源的冗余度隐含在信源符号的非等概率 分布之中。只要分布之中。只要H(S)小于)小于log2m,就存在数据压缩的可能,就存在数据压缩的可能第第4章章 静态图像压缩与编码技术(静态图像压缩与编码技术(1)多媒体信息技术Octo
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。