1、第第3 3章章 多媒体数据压缩技术多媒体数据压缩技术本章重点:本章重点:1.1.数据压缩的基本概念数据压缩的基本概念2.2.各种压缩技术的分类各种压缩技术的分类3.3.预测编码的基本原理预测编码的基本原理4.4.变换编码的基本原理变换编码的基本原理5.5.统计编码的基本原理统计编码的基本原理6.6.分析分析合成编码的基本原理合成编码的基本原理7.7.声音压缩标准声音压缩标准8.8.图像视频压缩标准图像视频压缩标准 3.1 数据压缩的基本原理和方法数据压缩的基本原理和方法3.2 音频的压缩音频的压缩3.3 图像和视频的压缩图像和视频的压缩第第3 3章章 多媒体数据压缩技术多媒体数据压缩技术编辑版
2、pppt33.1 3.1 数据压缩的基本原理和方法数据压缩的基本原理和方法 压缩的必要性压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。机系统几乎无法对它进行存取和交换。例如,一幅具有中等分辨率(例如,一幅具有中等分辨率(640640480480)的真)的真彩色图像(彩色图像(2424b/b/像素),它的数据量约为像素),它的数据量约为7.377.37Mb/Mb/帧,一个帧,一个 100 100MBMB(ByteByte)的硬盘只能的硬盘只能存放约存放约100100帧图像。若要达到每秒帧图像。若要达到每秒2
3、525帧的全动帧的全动态显示要求,每秒所需的数据量为态显示要求,每秒所需的数据量为184184MbMb,而而且要求系统的数据传输率必须达到且要求系统的数据传输率必须达到184184Mb/sMb/s。对于声音也是如此,若采用对于声音也是如此,若采用1616b b样值的样值的PCMPCM编码,编码,采样速率选为采样速率选为44.144.1kHZkHZ,则双声道立体声声音则双声道立体声声音每秒将有每秒将有176176KBKB的数据量。的数据量。编辑版pppt43.1 3.1 数据压缩的基本原理和方法数据压缩的基本原理和方法 视频、视频、图像、声音有很大的压缩潜力图像、声音有很大的压缩潜力 信息论认为
4、:若信源编码的熵大于信源的信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。实际熵,该信源中一定存在冗余度。原始信源的数据存在着很多冗余度:空间原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。冗余、时间冗余、视觉冗余、听觉冗余等。编辑版pppt5 节省图象或视频的存储容量,增加访问节省图象或视频的存储容量,增加访问速度,使数字视频能在速度,使数字视频能在PCPC机上实现,需要机上实现,需要进行视频和图象的压缩。进行视频和图象的压缩。有三个关键参数评价一个压缩系统:有三个关键参数评价一个压缩系统:l压缩比压缩比l图象质量图象质量l压缩和解压的速度压缩和
5、解压的速度另外也必须考虑每个压缩算法所需的硬件另外也必须考虑每个压缩算法所需的硬件和软件。和软件。编辑版pppt61压缩比压缩比压缩性能常常用压缩比定义(输入数据和输出压缩性能常常用压缩比定义(输入数据和输出数据比)数据比)例:例:512512480480,24 24bit/pixel(bpp)bit/pixel(bpp)输出输出1500015000byte byte 输入输入737280737280byte byte 压缩比压缩比737280/15000737280/150004949:1:1编辑版pppt72图象质量图象质量压缩方法:压缩方法:无损压缩无损压缩(图象质量不变)和(图象质量不
6、变)和有损压缩有损压缩有损压缩:失真情况很难量化,只能对测试有损压缩:失真情况很难量化,只能对测试的图象进行估计。的图象进行估计。编辑版pppt83压缩和解压速度压缩和解压速度 在许多应用中,压缩和解压将在不同时间、在许多应用中,压缩和解压将在不同时间、不同的地点、不同的系统中进行。所以,压缩、不同的地点、不同的系统中进行。所以,压缩、解压速度分别估计。解压速度分别估计。静态图象中,压缩速度没有解压速度严格;动静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或地从摄像机或VCRVCR中抓取动态视频。中抓取
7、动态视频。编辑版pppt94硬软件系统硬软件系统 有些压缩解压工作可用软件实现。设计系统有些压缩解压工作可用软件实现。设计系统时必须充分考虑:时必须充分考虑:算法复杂算法复杂 压缩解压过程长压缩解压过程长 算法简单算法简单 压缩效果差压缩效果差 目前有些特殊硬件可用于加速压缩目前有些特殊硬件可用于加速压缩/解压。解压。硬硬接线系统速度快,但各种选择在初始设计时已确定,接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩一般不能更改。因此在设计硬接线压缩/解压系统解压系统时必须先将算法标准化。时必须先将算法标准化。编辑版pppt10(1 1)空间冗余)空间冗余在同一幅
8、图像中,规则物体和规则背景的表面物理特在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。像中就表现为数据冗余。(2 2)时间冗余)时间冗余时间冗余反映在视频帧序列中,相邻帧图像之间有较时间冗余反映在视频帧序列中,相邻帧图像之间有较大的相关性,一幅图像中的某物体或场景可由其他帧大的相关性,一幅图像中的某物体或场景可由其他帧图像中的物体或场景重构出来。图像中的物体或场景重构出来。1.1.数据冗余的类型:数据冗余的类型:数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类编辑版pppt1
9、1(3 3)信息熵冗余)信息熵冗余信息熵冗余是指数据所携带的信息量少于数据本身而信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余。反映出来的数据冗余。(4 4)视觉冗余)视觉冗余人类的视觉系统由于受生理特性的限制,对于图像场人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为化。事实上人类视觉的一般分辨能力为2 26 6灰度等级,灰度等级,而一般图像的量化采用的是而一般图像的量化采用的是2 28 8灰度等级,即存在着视灰度等级,即存在着视觉冗余。觉冗余。数据冗
10、余的类型与压缩方法分类数据冗余的类型与压缩方法分类编辑版pppt12(5 5)听觉冗余)听觉冗余人耳对不同频率的声音的敏感性是不同的,不能察觉人耳对不同频率的声音的敏感性是不同的,不能察觉所有频率的变化,对某些频率不必特别关注,因此存所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。在听觉冗余。(6 6)结构冗余)结构冗余数字化图像中物体表面纹理等结构往往存在着数据冗数字化图像中物体表面纹理等结构往往存在着数据冗余,这种冗余称为结构冗余。余,这种冗余称为结构冗余。(7 7)知识冗余)知识冗余由图像的记录方式与人对图像的知识之间的差异所产由图像的记录方式与人对图像的知识之间的差异所产生的
11、冗余称为知识冗余。生的冗余称为知识冗余。数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类编辑版pppt13数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类数据压缩技术分类数据压缩技术分类 根据解码后数据与原始数据是否完全一致可以分为根据解码后数据与原始数据是否完全一致可以分为两大类:两大类:一类一类是熵编码、冗余压缩法,也称无损压是熵编码、冗余压缩法,也称无损压缩法、无失真压缩法;缩法、无失真压缩法;二是二是熵压缩法,也称有损压熵压缩法,也称有损压缩法、有失真压缩法。缩法、有失真压缩法。从从“熵熵”损失角度分为损失角度分为无损压缩无损压缩和和有损压缩有损压缩两种:两种:u无失真
12、压缩,又称熵编码。由于不会失真,多用无失真压缩,又称熵编码。由于不会失真,多用于文本数据的压缩,但也有例外,非线性编辑系于文本数据的压缩,但也有例外,非线性编辑系统为了保证视频质量,有些高档系统采用的是无统为了保证视频质量,有些高档系统采用的是无失真压缩方法。失真压缩方法。u有失真压缩,又称熵压缩法。大多数图像、声音、有失真压缩,又称熵压缩法。大多数图像、声音、动态视频等数据的压缩是采用有失真压缩。动态视频等数据的压缩是采用有失真压缩。编辑版pppt14数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类 从信息语义角度分为从信息语义角度分为“熵熵(平均信息量平均信息量)编码编码”和和“源
13、编码源编码”两种:两种:熵熵(平均信息量平均信息量)编码编码(Entropy Coding)Entropy Coding)熵编码是一种泛指那些不考虑被压缩信息的性质熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量的技术的编码和压缩技术。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。也就是说,平均信息量编码忽的类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。略被压缩信息的语义内容。熵编码分为:重复序列消除编码熵编码分为:重复序列消除编码(含:消零、行程含:消零、行程编码编码
14、)、统计编码等。、统计编码等。编辑版pppt15数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类 源编码源编码(Source Coding)Source Coding)源编码的冗余压缩取决于初始信号的类型、前后的相源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比严格的平均信息关性、信号的语义内容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容,比起平均信息量编码,它的压缩比更据的语义内容,比起平均信息量编码,它的压缩比更大。大。源编码主要分为源编码主要分为:预测编码、变换编码
15、、向量量化等:预测编码、变换编码、向量量化等编辑版pppt163.1.2 3.1.2 数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类Source CodingPrediction:DPCM and DMTransformation:FFT、DCTLayered:Sub-band、Sub-sampling and Bit PositionVector QuantizationHybrid CodingJPEG、MPEG、H.261、DVI、Intel-IndeoEntropy CodingRun Length CodingStatistical CodingHuffmanArithme
16、tic编辑版pppt17常用数据压缩方法的基本原理常用数据压缩方法的基本原理1.1.统计编码统计编码 方法是:识别一个给定的流中出现频率最方法是:识别一个给定的流中出现频率最高的比特或字节模式,并用比原始比特更少高的比特或字节模式,并用比原始比特更少的比特数来对其编码。即就是,频率越低的的比特数来对其编码。即就是,频率越低的模式,其编码的位数越多,频率越高的模式模式,其编码的位数越多,频率越高的模式编码位数越少。若码流中所有模式出现的概编码位数越少。若码流中所有模式出现的概率相等,则平均信息量最大,率相等,则平均信息量最大,信源信源就没有就没有冗余。冗余。编辑版pppt18常用数据压缩方法的基
17、本原理常用数据压缩方法的基本原理(1)(1)行程编码行程编码(Run Length Coding)Run Length Coding)是最简单、最古老的压缩技术之一,主要技术是检是最简单、最古老的压缩技术之一,主要技术是检测重复的比特或字符序列,并用它们的出现次数测重复的比特或字符序列,并用它们的出现次数取而代之。该方法有两大模式:一是消零取而代之。该方法有两大模式:一是消零(消空消空白白),二是行,二是行(游游)程程(run length)run length)编码。编码。消零消零(或消空白或消空白)法:法:将数字中连续的将数字中连续的“0 0”或文本或文本中连续的空白用一个标识符中连续的空
18、白用一个标识符(或特殊字符或特殊字符)后跟数后跟数字字N(N(连续连续“0 0”的个数的个数)来代替。来代替。如数字序列:如数字序列:742300000000000000000055 742300000000000000000055 编码为:编码为:7423 7423Z18Z185555编辑版pppt19常用数据压缩方法的基本原理常用数据压缩方法的基本原理 行行程编码法:程编码法:任何重复的字符序列可被一个短格式取任何重复的字符序列可被一个短格式取代。该算法适合于任何重复的字符。代。该算法适合于任何重复的字符。一组一组 n n 个连续的字符个连续的字符 c c 将被将被 c c 和一个特殊的字
19、符和一个特殊的字符取代。当然,若给定字符仅重复两次就不要用此方取代。当然,若给定字符仅重复两次就不要用此方法。法。任何重复任何重复4 4次或次或4 4次以上的字符由次以上的字符由“该字符记该字符记号号(M)M)重复次数重复次数”代替代替。例如数字序列例如数字序列:Name:.CR:Name:.CR 编码为:编码为:Name:Name:.M10.M10 CR CR 编辑版pppt20常用数据压缩方法的基本原理常用数据压缩方法的基本原理 (2)(2)LZWLZW编码编码 LZW LZW算法在压缩文本和程序数据的压缩技术算法在压缩文本和程序数据的压缩技术中唱主角。它的压缩率高,压缩处理所化费中唱主角
20、。它的压缩率高,压缩处理所化费的时间比其它方式要少。的时间比其它方式要少。LZWLZW编码时,首先将原始的数据分成多个条编码时,首先将原始的数据分成多个条纹,每个条纹都单独进行压缩。纹,每个条纹都单独进行压缩。LZWLZW算法基于一个算法基于一个转换表转换表或或字串表字串表,它将输,它将输入字符映象到编码中,使用可变长代码,最入字符映象到编码中,使用可变长代码,最大代码长度为大代码长度为1212位。位。编辑版pppt21常用数据压缩方法的基本原理常用数据压缩方法的基本原理 LZW LZW算法中的字串表对于每个条纹都不同,算法中的字串表对于每个条纹都不同,并且不必保留给解压缩程序,因为解压缩过并
21、且不必保留给解压缩程序,因为解压缩过程中能自动建立完全相同的字串表。程中能自动建立完全相同的字串表。实际上,实际上,它是通过查找冗余字符串并将此字符串用较它是通过查找冗余字符串并将此字符串用较短的符号标记替代的压缩技术。短的符号标记替代的压缩技术。编辑版pppt22常用数据压缩方法的基本原理常用数据压缩方法的基本原理(3)(3)哈夫曼编码哈夫曼编码19521952年年HuffmanHuffman提出了对统计独立信源能达到提出了对统计独立信源能达到最小最小平均码长平均码长的编码方法,也即最佳码。最佳性可从的编码方法,也即最佳码。最佳性可从理论上证明。这种码具有理论上证明。这种码具有即时性即时性和
22、和唯一可译性唯一可译性。该编码是常见的一种统计编码。对给定的数据流,该编码是常见的一种统计编码。对给定的数据流,计算其每个字节的出现频率。根据频率表,运用哈计算其每个字节的出现频率。根据频率表,运用哈夫曼算法可确定分配各字符的最小位数,然后给出夫曼算法可确定分配各字符的最小位数,然后给出一个最优的编码。代码字存人代码表中。一个最优的编码。代码字存人代码表中。编辑版pppt23常用数据压缩方法的基本原理常用数据压缩方法的基本原理哈夫曼编码过程:哈夫曼编码过程:例:现有例:现有A、B、C、D、E五个待编码的符号,它们的五个待编码的符号,它们的概率分别是概率分别是0.3846、0.1795、0.15
23、38、0.1538、0.1283,用哈夫曼算法求出这五个符号所分配的代码和熵、平均用哈夫曼算法求出这五个符号所分配的代码和熵、平均码长?码长?(1)初始化,根据符号概率的大小,按由大到小顺序)初始化,根据符号概率的大小,按由大到小顺序对符号进行排序。对符号进行排序。(2)把概率最小的两个符号组成一个节点,如)把概率最小的两个符号组成一个节点,如D和和E组成节点组成节点P1。编辑版pppt24常用数据压缩方法的基本原理常用数据压缩方法的基本原理(3)重复步骤)重复步骤2,得到节点,得到节点P2、P3、P4,形成一棵,形成一棵“树树”,P4为根节点。为根节点。(4)从根节点)从根节点P4开始到相应
24、每个符号的开始到相应每个符号的“树叶树叶”,从,从上到下标上上到下标上“0”(上枝)、(上枝)、“1”(下枝)。(下枝)。注:注:至于哪个为至于哪个为“1”哪个为哪个为“0”则无关紧要,最后的则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相结果仅仅是分配的代码不同,而代码的平均长度是相同的。同的。编辑版pppt25常用数据压缩方法的基本原理常用数据压缩方法的基本原理HuffmanHuffman编码的优缺点编码的优缺点优点:优点:当信源符号概率是当信源符号概率是2 2的负幂次方时,的负幂次方时,Huffman Huffman 编码法编码效率达到编码法编码效率达到100%100%。
25、一般情况。一般情况下,它的编码效率要比其它编码方法的效率高,下,它的编码效率要比其它编码方法的效率高,是最佳变长码。是最佳变长码。编辑版pppt26常用数据压缩方法的基本原理常用数据压缩方法的基本原理 缺点:缺点:(1)(1)编码中每个符号的编码长度只能为整数,如果源编码中每个符号的编码长度只能为整数,如果源符号集的概率分布不是符号集的概率分布不是2的负的负n次方的形式,则无法达次方的形式,则无法达到熵极限。到熵极限。(2)(2)为可变长度码为可变长度码,译码复杂译码复杂(3)(3)需要事先知道输入符号集的概率分布需要事先知道输入符号集的概率分布(4)(4)没有错误保护功能没有错误保护功能编辑
26、版pppt27常用数据压缩方法的基本原理常用数据压缩方法的基本原理(4)(4)算术编码算术编码算术编码把一个信源集合表示为实数线上的算术编码把一个信源集合表示为实数线上的0 0到到1 1之间的一个区间。这个集合中的每个元素都要用之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所得到来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要一些更多的区间就越小,当区间变小时,就需要一些更多的数位来表示这个区间,这就是区间作为代码的的数位来表示这个区间,这就是区间作为代码的原理。算术编码首先假设一个信源的概率模型,原理。算术编码首先假设一个信源的概率
27、模型,然后用这些概率来缩小表示信源集的区间。然后用这些概率来缩小表示信源集的区间。编辑版pppt28常用数据压缩方法的基本原理常用数据压缩方法的基本原理新子区间的起始位置新子区间的起始位置前子区间的起始位置当前符号的区间左端前子前子区间的起始位置当前符号的区间左端前子区间长度区间长度新子区间的长度新子区间的长度前子区间的长度当前符号的概率(等价于范围长前子区间的长度当前符号的概率(等价于范围长度)度)最后得到的子区间的长度决定了表示该区域内的某一个数所最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数。需的位数。编辑版pppt29常用数据压缩方法的基本原理常用数据压缩方法的基本原理例
28、:假设信源符号为例:假设信源符号为00,01,10,11,这些符号的概,这些符号的概率分别为率分别为0.1,0.4,0.2,0.3,根据这些概率可把间隔,根据这些概率可把间隔0,1)分成四个子区间分成四个子区间0,0.1),0.1,0.5),0.5,0.7),0.7,1)。如。如果二进制消息序列的输入为:果二进制消息序列的输入为:10 00 11 00 10 11 01,请,请运用算数编码进行编码。运用算数编码进行编码。符号符号概率概率初始编码间隔初始编码间隔00000.10.10,0.1)0,0.1)01 010.40.40.1,0.5)0.1,0.5)10 100.20.20.5,0.7)
29、0.5,0.7)11 110.30.30.7,1)0.7,1)编辑版pppt30步骤步骤输入输入符号符号编码间隔编码间隔编码判决编码判决1 110 100.5,0.7)0.5,0.7)符号的间隔范围符号的间隔范围0.5,0.7)0.5,0.7)2 200000.5,0.52)0.5,0.52)0.5,0.7)0.5,0.7)间隔的第一个间隔的第一个1/101/103 311 110.514,0.52)0.514,0.52)0.5,0.52)0.5,0.52)间隔的最后三个间隔的最后三个1/101/104 400000.514,0.5146)0.514,0.5146)0.514,0.52)0.5
30、14,0.52)间隔的第一个间隔的第一个1/101/105 510 100.5143,0.51442)0.5143,0.51442)0.514,0.5146)0.514,0.5146)间隔的第五个间隔的第五个1/101/10开始,二个开始,二个1/101/106 611 110.514384,0.51442)0.514384,0.51442)0.5143,0.51442)0.5143,0.51442)最后三个最后三个1/101/107 701 010.5143836,0.514402)0.5143836,0.514402)0.514384,0.51442)0.514384,0.51442)间隔
31、的间隔的4 4个个1/101/10,从,从第一个第一个1/101/10开始开始8 8从从0.51438760.5143876,0.514402)0.514402)中选择一个数作为输出:中选择一个数作为输出:0.51438760.5143876编辑版pppt31常用数据压缩方法的基本原理常用数据压缩方法的基本原理2.2.预测编码预测编码(Prediction Coding)Prediction Coding)预测编码是指利用前面的一个或多个信号对下一预测编码是指利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进个信号进行预测,然后对实际值和预测值的差进行编码。行编码。DPC
32、MDPCM与与ADPCMADPCM是两种典型的预测编码。是两种典型的预测编码。编辑版pppt32常用数据压缩方法的基本原理常用数据压缩方法的基本原理(1)(1)差分脉码调制差分脉码调制(DPCM)DPCM)PCM PCM(Pulse Code Modulation)(Pulse Code Modulation),原始的模原始的模拟信号经过时间采样,然后对每一样值进行量拟信号经过时间采样,然后对每一样值进行量化,作为数字信号传输。化,作为数字信号传输。DPCM DPCM不对每一样值都进行量化,而是预测下一样值,不对每一样值都进行量化,而是预测下一样值,并量化实际值和预测值之间的差。并量化实际值和
33、预测值之间的差。DPCMDPCM是基本的编码方法之一,在大量的压缩算法中被是基本的编码方法之一,在大量的压缩算法中被采用,比如采用,比如JPEGJPEG的的DCDC分量就是采用分量就是采用DPCMDPCM编码的。编码的。编辑版pppt33常用数据压缩方法的基本原理常用数据压缩方法的基本原理 举例说明举例说明DPCMDPCM编码原理:编码原理:设设DPCMDPCM系统预测器的预测值为前一个样值,系统预测器的预测值为前一个样值,假设假设输入信号已经量化,差值不再进行量化。若输入信号已经量化,差值不再进行量化。若系统系统的输入为的输入为0 1 2 1 1 2 3 3 4 4 0 1 2 1 1 2
34、3 3 4 4,则预测值,则预测值为为0 0 1 2 1 1 2 3 3 4 0 0 1 2 1 1 2 3 3 4,差值为,差值为0 1 1 0 1 1 1 0 1 1 0 1 0 1 0 1 1 0 1 0,差值的范围比输入样值的,差值的范围比输入样值的范围有所减小,可以用较少的位数进行编码。范围有所减小,可以用较少的位数进行编码。编辑版pppt34常用数据压缩方法的基本原理常用数据压缩方法的基本原理量化器量化器编码器编码器+预测器预测器信道信道译码器译码器+预测器预测器Xndnd1nx1nx2nd1nx1nx2n发送端接收端DPCM典型的工作原理典型的工作原理误差误差 qn=xn-x1n
35、=xn-(x2n+d1n)=(xn-x2n)-d1n=dn-d1n编辑版pppt35常用数据压缩方法的基本原理常用数据压缩方法的基本原理(2)(2)自适应差分脉码调制自适应差分脉码调制(ADPCM)ADPCM)为了进一步改善量化性能或压缩数据率,可采用自为了进一步改善量化性能或压缩数据率,可采用自适应量化或自适应预测的方法。只要采用了其中的适应量化或自适应预测的方法。只要采用了其中的任一种自适应方法,均称为任一种自适应方法,均称为ADPCMADPCM。自适应预测自适应预测 预测参数的最佳化依赖于信源的统计特性,要得到预测参数的最佳化依赖于信源的统计特性,要得到最佳的预测参数是一件繁琐的工作。最
36、佳的预测参数是一件繁琐的工作。而采用固定的预测参数往往又得不到好的性能。为而采用固定的预测参数往往又得不到好的性能。为了既能使性能较佳,又不致于有太大的工作量,可了既能使性能较佳,又不致于有太大的工作量,可以将上述两种方法折衷考虑,采用自适应预测。以将上述两种方法折衷考虑,采用自适应预测。编辑版pppt36常用数据压缩方法的基本原理常用数据压缩方法的基本原理 具体方法是:预测参数仍采用固定的;但此具体方法是:预测参数仍采用固定的;但此时有多组预测参数可供选择。这些预测参数时有多组预测参数可供选择。这些预测参数根据常见的信源特征求得。编码时具体采用根据常见的信源特征求得。编码时具体采用哪组预测参
37、数根据信源的特征来自适应的确哪组预测参数根据信源的特征来自适应的确定。定。为了自适应的选择最佳参数,通常将信源数为了自适应的选择最佳参数,通常将信源数据分区间编码,编码时自动地选择一组预测据分区间编码,编码时自动地选择一组预测参数,使该区间实际值与预测值的均方误差参数,使该区间实际值与预测值的均方误差最小。随着编码区间的不同,预测参数自适最小。随着编码区间的不同,预测参数自适应的变化,以达到准最佳预测。应的变化,以达到准最佳预测。编辑版pppt37常用数据压缩方法的基本原理常用数据压缩方法的基本原理 例如,例如,Microsoft Microsoft 的的ADPCMADPCM采用二预测参数,采
38、用二预测参数,提供提供7 7组预测系数,如右组预测系数,如右表所示。编码时,根据表所示。编码时,根据选定的准则选定的准则(如最小均方如最小均方误差准则误差准则),每个编码区,每个编码区间自动地选取一组最佳间自动地选取一组最佳的参数。的参数。系数集系数集 系数系数1 1 系数系数2 20 256 01 512 -2562 0 03 192 644 240 05 460 -2086 392 -232 编辑版pppt38自适应量化自适应量化根据信号分布不均匀的特点,系统具有随输根据信号分布不均匀的特点,系统具有随输入信号的变化而改变量化区间大小入信号的变化而改变量化区间大小,以保持以保持输入输入给给
39、量化器的信号基本均匀的能力,这种量化器的信号基本均匀的能力,这种能力称为自适应量化。能力称为自适应量化。常用数据压缩方法的基本原理常用数据压缩方法的基本原理编辑版pppt39常用数据压缩方法的基本原理常用数据压缩方法的基本原理3.3.变换编码变换编码(Transformation CodingTransformation Coding)在变换编码时,初始数据要从初始空间或时间在变换编码时,初始数据要从初始空间或时间域进行数学变换,变换为一个更适于压缩的抽域进行数学变换,变换为一个更适于压缩的抽象域。该过程是可逆的;即使用反变换可恢复象域。该过程是可逆的;即使用反变换可恢复原始数据。如将时域信号
40、变换到频域,因为声原始数据。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码就可以信号的能量较集中,再进行采样、编码就可以压缩数据。压缩数据。编辑版pppt40常用数据压缩方法的基本原理常用数据压缩方法的基本原理 变换本身是可逆的,因而其也是一种变换本身是可逆的,因而其也是一种无损技无损技术术。然而,为了取得更满意的结果,某些重要。然而,为了取得更满意的结果,某些重要系数的编码位数比其他的要多,某些系数干脆系数的编码位数比其他的要多,某些系数干脆就被忽略了。这样,该过程就成为就被忽略了。这样,该过程
41、就成为有损有损的了。的了。数学家们已经构造了多种数学变换。除了傅数学家们已经构造了多种数学变换。除了傅里叶变换外,还有余弦、里叶变换外,还有余弦、HadamardHadamard、Haar Haar、Karhunen LoeveKarhunen Loeve变换。最实用最常用的数学变变换。最实用最常用的数学变换是离散余弦变换换是离散余弦变换(DCT)DCT)。编辑版pppt41常用数据压缩方法的基本原理常用数据压缩方法的基本原理典型的变换编码系统框图:典型的变换编码系统框图:信源信源序列序列变换变换变 换 域变 换 域采采 样样量化量化编码编码存 储 或存 储 或传传 输输译码译码填零填零反反
42、变变换换再现再现序列序列变换编码系统压缩数据的三个步骤变换编码系统压缩数据的三个步骤编辑版pppt42常用数据压缩方法的基本原理常用数据压缩方法的基本原理(1)(1)最佳变换(最佳变换(K KL L变换)变换)数据压缩主要是去除信源的相关性。若考虑到信数据压缩主要是去除信源的相关性。若考虑到信号存在于无限区间上,而变换区域又是有限的,那么号存在于无限区间上,而变换区域又是有限的,那么表征相关性的统计特性就是协方差矩阵。表征相关性的统计特性就是协方差矩阵。当协方差矩阵中除对角线上元素之外的各元素都为当协方差矩阵中除对角线上元素之外的各元素都为零时,就等效于相关性为零。所以,为了有效地进行零时,就
43、等效于相关性为零。所以,为了有效地进行数据压缩,常常希望变换后的协方差矩阵为一对角矩数据压缩,常常希望变换后的协方差矩阵为一对角矩阵,同时也希望主对角线上各元素随,的增加很阵,同时也希望主对角线上各元素随,的增加很快衰减。因此,快衰减。因此,变换编码的关键在于变换编码的关键在于:在已知的条:在已知的条件下,根据它的协方差矩阵去寻找一种正交变换,件下,根据它的协方差矩阵去寻找一种正交变换,使变换后的协方差矩阵满足或接近为一对角矩阵。使变换后的协方差矩阵满足或接近为一对角矩阵。编辑版pppt43常用数据压缩方法的基本原理常用数据压缩方法的基本原理 当经过正交变换后的协方差矩阵为一对当经过正交变换后
44、的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称角矩阵,且具有最小均方误差时,该变换称最佳变换,也称最佳变换,也称Karhunen-LoeveKarhunen-Loeve变换。变换。可以可以证明,以矢量信号的协方差矩阵的归一化正证明,以矢量信号的协方差矩阵的归一化正交特征向量所构成的正交矩阵,对该矢量信交特征向量所构成的正交矩阵,对该矢量信号所作的正交变换能使变换后的协方差矩阵号所作的正交变换能使变换后的协方差矩阵达到对角矩阵。达到对角矩阵。编辑版pppt44常用数据压缩方法的基本原理常用数据压缩方法的基本原理(2)(2)离散余弦变换(离散余弦变换(DCTDCT变换)变换)如果变换后的
45、协方差矩阵接近对角矩阵,该类如果变换后的协方差矩阵接近对角矩阵,该类变换称准最佳变换,典型的有变换称准最佳变换,典型的有DCTDCT、DFTDFT、WHTWHT、HrTHrT等。其中,最常用的变换是离散余弦变换等。其中,最常用的变换是离散余弦变换DCTDCT。DCT DCT是从是从DFTDFT引出的。引出的。DFTDFT可以得到近似于最佳变可以得到近似于最佳变换的性能,但换的性能,但DFTDFT的运算次数太多,且需要复数运算的运算次数太多,且需要复数运算。DCTDCT从从DFTDFT中取实部,并可用快速余弦变换算法,中取实部,并可用快速余弦变换算法,因此大大加快了运算。同时其压缩性能十分逼近最
46、因此大大加快了运算。同时其压缩性能十分逼近最佳变换的压缩性能。所以,佳变换的压缩性能。所以,DCTDCT在图像压缩中得到了在图像压缩中得到了广泛的应用。广泛的应用。编辑版pppt45常用数据压缩方法的基本原理常用数据压缩方法的基本原理4.4.分析分析-合成编码合成编码 通过对原始数据的分析,将其分解为一通过对原始数据的分析,将其分解为一系列更适合于表示的基元或者从中提取出更系列更适合于表示的基元或者从中提取出更有本质意义的参数,编码仅对这些基本单元有本质意义的参数,编码仅对这些基本单元或者特征参数进行,而解码时则借助于一定或者特征参数进行,而解码时则借助于一定的规则或者模型,按照一定的算法将这
47、些基的规则或者模型,按照一定的算法将这些基元或者参数再综合成原始数据的一个逼近。元或者参数再综合成原始数据的一个逼近。编辑版pppt46常用数据压缩方法的基本原理常用数据压缩方法的基本原理 矢量量化矢量量化 量化编码按照一次量化的码元个数,可分为量化编码按照一次量化的码元个数,可分为标量量化和矢量量化两种。对数字化后的数据或标量量化和矢量量化两种。对数字化后的数据或PCMPCM数据(样本值)一个一个地进行量化,称为标数据(样本值)一个一个地进行量化,称为标量量化。而将这些数据分组,每组量量化。而将这些数据分组,每组K K维矢量,再以维矢量,再以矢量为单元逐个进行量化,称其为矢量量化。矢矢量为单
48、元逐个进行量化,称其为矢量量化。矢量量化是标量量化的多维扩展。量量化是标量量化的多维扩展。编辑版pppt47常用数据压缩方法的基本原理常用数据压缩方法的基本原理 标量量化中可在随机变量标量量化中可在随机变量X X出现概率比较高的出现概率比较高的间隔内,选择较小的判决间隔,而在其他区域内间隔内,选择较小的判决间隔,而在其他区域内选择较大的间隔,这样可以以较小的量化均方误选择较大的间隔,这样可以以较小的量化均方误差进行量化。差进行量化。矢量量化基于语义编码,其基本思想是采用非矢量量化基于语义编码,其基本思想是采用非线性量化器,即对空间频率及能量分布较大的系数线性量化器,即对空间频率及能量分布较大的
49、系数分配较多比特数;反之分配较少的比特数,从而达分配较多比特数;反之分配较少的比特数,从而达到压缩的目的。到压缩的目的。编辑版pppt48常用数据压缩方法的基本原理常用数据压缩方法的基本原理 小波变换编码小波变换编码 小波变换是一个线性变换,能够将一个信号小波变换是一个线性变换,能够将一个信号分解成对空间和时间、频率的独立贡献,同时又分解成对空间和时间、频率的独立贡献,同时又不失原信号所包含的信息。经过小波变换后的图不失原信号所包含的信息。经过小波变换后的图像能量很集中,便于对不同的分量作不同的处理像能量很集中,便于对不同的分量作不同的处理,达到较高的压缩比。,达到较高的压缩比。编辑版pppt
50、49常用数据压缩方法的基本原理常用数据压缩方法的基本原理 分形编码分形编码 分形编码是一种模型编码,它利用模型的方法分形编码是一种模型编码,它利用模型的方法,对需要传输的图像进行参数估测。分形的方法是,对需要传输的图像进行参数估测。分形的方法是把一幅数字图像,通过一些图像处理技术,如颜色把一幅数字图像,通过一些图像处理技术,如颜色分割、边缘检测、频谱分析、纹理变化分析等等,分割、边缘检测、频谱分析、纹理变化分析等等,将原始图像分成一些子图像。子图像可以是简单的将原始图像分成一些子图像。子图像可以是简单的物体,也可以是一些复杂的景物。然后在分形集中物体,也可以是一些复杂的景物。然后在分形集中查找
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。