1、本单元的内容本单元的内容量化量化变换编码变换编码预测编码预测编码一个典型的信号压缩系统如图所示一个典型的信号压缩系统如图所示。通过时间轴上采样和幅度量化通过时间轴上采样和幅度量化将连续信号变成离散数字信号将连续信号变成离散数字信号一个典型的信号压缩系统如图所示。通过时间轴上采样和幅度量化通过时间轴上采样和幅度量化将连续信号变成离散数字信号将连续信号变成离散数字信号一个典型的信号压缩系统如图所示。通过变换将信号的能量集中在少数几个变换系数上通过变换将信号的能量集中在少数几个变换系数上去除信号中的相关性去除信号中的相关性一个典型的信号压缩系统如图所示。信号压缩真正体现在量化阶段信号压缩真正体现在量
2、化阶段 一个典型的信号压缩系统如图所示。一般先是行程编码,然后一般先是行程编码,然后Huffman编码编码或算术编码进一步提高压缩比或算术编码进一步提高压缩比 量化之前需要规定量化之前需要规定量化级量化级,比如,比如8 8级,级,1616级等级等 量化时将量化时将取样值取样值与与量化级量化级比较,若取样值在某个量化级比较,若取样值在某个量化级的覆盖区间之内,则规定它取这个量化级的代表值,我的覆盖区间之内,则规定它取这个量化级的代表值,我们称其为码字。们称其为码字。 一个量化器只能取有限多个量化级,从而量化过程不可一个量化器只能取有限多个量化级,从而量化过程不可避免地会引起量化误差。避免地会引起
3、量化误差。设编码操作在Rk上进行,X为在Rk上给定了概率分布函数的一个随机向量。x为X的取值。A是随机向量取值空间,则A的一个N级量化器Q=Y, 由以下三部分组成:kAR码本集: ;1,2, iYy in对A的分割: 1;1,2,NiiiR iNRA:( |)iiQ AYyQx xR由下式定义的映射: 在以上定义中,当k 1时,所定义的是向量量化器;当k = 1时,即为标量量化器。 例如例如:码本集:Y = y1,y2,yN 分割 依Y将R划分为N个子空间R1, R2, , RN,且 1NiiRRRi的区间表示为Ri=xi, xi+1), i = 1, 2, , N 产生的量化误差定义为 (
4、)( |)iiy xQx xR( )( )iexQ xxy x量化可以分为两类: (1) 标量量化:输入信号的所有分量使用同一个量化器进行量化,每个分量的量化都和其它分量无关,也称为零记忆量化。 (2)矢量量化:从码本集合中选出最适配于输入信号的一个码字作为输入信号的近似,这种方法以输入信号与选出的码字之间失真最小为依据。 v矢量量化与标量量化相比有更大的数据压缩能力。 v矢量量化也可以与其他的编码方法一同使用。 矢量量化常常是与变换编码相结合使用,在图像进行变换之后,按一定方式形成多维向量组,然后到码本中寻找最佳码字。 标量量化: 均匀量化 (恒定量化步长) 非均匀量化(量化步长可变)带死区
5、的量化: 当 称 为死区 , ),( )0 xQ x , ) 均匀量化标量量化的输入/输出特性采用阶梯形函数的形式 输出输入输出输入带死区的量化器非带死区的量化器输出代表点集Y = y1,y2,yN 存在一种最优分割依Y将R划分为N个子空间R1, R2, , RN,且 Ri的区间表示为Ri=xi, xi+1), i = 1, 2, , N 如果是最优的,yi是Ri的质心。标量量化是将区间上的点映射为质心的操作, 产生的量化误差定义为 ( )( |)iiy xQx xR( )( )iexQ xxy x1NiiRR均方误差为 22( )( )exQ xp x dx1221()( )iiNxeixi
6、xyp x dx最优量化是使 最小,就可得如下解: 111()/2(1)( )( )(2)kkkkkkkxxkxxxyyyxp x dxp x dx(1)(2)是非线性方程组, Lloyd给出了一种迭代法,给出了数值解。当均匀分布时,就构成了最优均匀标量量化器: 111(1)/2()/kkkNxxkqyxqqxxN220,1,2,.,10,1,2,.,ekekkNxkNy2e希望设计一个具有K维N码字的码本空间的向量量化器,给出一个初始码本 000012,NYyyy其对应的量化器记为Q0若能找到一种新的码本 111112,NYy yy其对应的量化器记为Q1。111000() ( ,( )()
7、( ,( )DE dDE dQx Q xQx Q x则称量化器被优化了一次。 重复这个过程我们去寻找Y2, Y3, , Ym1)初始化,给定N, 0,假设初始码本及训练集分别为 000012 ,LYy yy2)对于12,mmmmLYyyy,对 训练集进行划分,将训练集分为3)如果停止,并令 为最终码本4)令 形成新的码本 否则继续。,1,2,. kkNx,1,2,., mkCkL(,)min(,)mmjmmliljddyYx yx ymliCx11min(,)mmjNmmljlDdNyYx y1mmmDDD11,1,2,., mmkkLYy11mjkmkjmCkCxyxmiC划分的原理为 :1
8、2,mmmmLYyyy转向2)其中 是 中矢量的个数miC如果 那么 并计算最优量化器是对于训练向量集而言的,对于实际的未经训练的输入向量是否还是最优的却很难说,这要依赖于训练向量集的代表性到底真实到何种程度。 由于优化分割的过程并没有依据什么数据结构方面的规则或限制,而是自由进行,这就使得对码本进行有效组织时遇到了极大的困难。在某些情况下根本无法找到真正具有代表性的训练向量集。 用LBG算法对Lenna图像进行向量量化的结果,压缩后PSNR = 25.21dB 本单元的内容本单元的内容量化量化变换编码变换编码预测编码预测编码变换是信号实现变换是信号实现时域时域和和变换域变换域( (频域频域)
9、 )映射映射关系的运算关系的运算通常经通常经正变换正变换将信号在变换域将信号在变换域分解分解,然后,然后由由反变换反变换重建重建信号:信号:当当 有有11nn nnsTx111nn nnxTs11nnss11nnxx当,有变换的本质变换的本质就是将信号在一组基函数上投影,得就是将信号在一组基函数上投影,得到一组投影值,即信号的变换域表达。到一组投影值,即信号的变换域表达。变换的目的变换的目的就是将一个实际的物理信号分解为变就是将一个实际的物理信号分解为变换域换域( (频域频域) )上有限的或无限的小的信号上有限的或无限的小的信号“细胞细胞”,以便了解信号的性质,提取信号的有用信息以便了解信号的
10、性质,提取信号的有用信息 现有图像现有图像/ /视频编码国际标准的视频编码国际标准的基本框架基本框架都是采用都是采用预测预测、变换变换、熵编码熵编码等技术将图像等技术将图像/ /视频信号压缩成一定码率的视频信号压缩成一定码率的码流,其核心技术之一是变换。码流,其核心技术之一是变换。 变换是对信号改造和加工的过程,它有助于去除信号中变换是对信号改造和加工的过程,它有助于去除信号中冗余冗余(相关性)和实现信号(相关性)和实现信号能量集中能量集中,正是图像,正是图像/ /视频编视频编码技术的理论基础。码技术的理论基础。 实际应用中通常采用实际应用中通常采用正交变换正交变换。121231 112111
11、2221vvuu vT 图像图像/ /视频压缩处理中常用的变换包括:视频压缩处理中常用的变换包括: 离散傅里叶变换离散傅里叶变换 DFTDFT 离散余弦变换离散余弦变换 DCTDCT KarhunenLoeve变换变换 KLKL 离散小波变换离散小波变换 KLKL变换由于去除信号中的变换由于去除信号中的相关性最彻底相关性最彻底,因而被称为,因而被称为“最佳变换最佳变换”。但。但KLKL变换的基是不固定的,需要存储变变换的基是不固定的,需要存储变换基,计算复杂性高,使得换基,计算复杂性高,使得KLKL变换的应用不现实。变换的应用不现实。图像图像/ /视频压缩处理中常用的变换视频压缩处理中常用的变
12、换 人们发现在信号满足人们发现在信号满足一阶马尔科夫过程一阶马尔科夫过程时,时,DCTDCT是是KLKL变换变换的很好的逼近。的很好的逼近。 DCTDCT有有固定的基固定的基与明确的物理含义,使得与明确的物理含义,使得DCTDCT广泛应用于广泛应用于图像图像/ /视频压缩,成了变换编码的主要工具。视频压缩,成了变换编码的主要工具。 静止图像压缩编码的国际标准静止图像压缩编码的国际标准JPEGJPEG和视频编码标准和视频编码标准H.264H.264都采用了都采用了DCTDCT变换编码变换编码 变换通过将信号的能量集中在少数变换系数上变换通过将信号的能量集中在少数变换系数上给出信号的紧致表达,便于
13、后续的压缩处理。给出信号的紧致表达,便于后续的压缩处理。对于图像而言,采用符合人的视觉系统特征的对于图像而言,采用符合人的视觉系统特征的量化方式,大多数高频系数在量化后会很小或量化方式,大多数高频系数在量化后会很小或者为零,量化后的变换系数矩阵变成了一个稀者为零,量化后的变换系数矩阵变成了一个稀疏矩阵。疏矩阵。选择适当的扫描方式将二维矩阵表示的系数表选择适当的扫描方式将二维矩阵表示的系数表示为一维向量,使得一维向量表示的系数具有示为一维向量,使得一维向量表示的系数具有零系数连续出现的特点,这样通过行程编码可零系数连续出现的特点,这样通过行程编码可以得到高压缩比。以得到高压缩比。 Karhune
14、nKarhunenLoeveLoeve(KLKL)变换)变换以图像统计特性为基础的一种正交变换,以图像统计特性为基础的一种正交变换,也称为也称为特征向量变换特征向量变换或或主分量主分量变换变换KLKL变换的目的:去图像的相关性变换的目的:去图像的相关性相关性:用相关性:用协方差矩阵协方差矩阵度量度量以下图像为例描述以下图像为例描述KLKL的算法的算法 一幅一幅256256256256图像分成图像分成10241024个个8 88 8的块的块 每个每个8 88 8的块按照行(或列)的顺序排成一个的块按照行(或列)的顺序排成一个6464维维 的向量的向量 向量向量 的维数的维数 定义随机向量定义随机
15、向量 使得其取值范围为使得其取值范围为 iXn=64011,.,1024MXXXM-=X011,.,MXXX- KL KL正变换正变换 KLKL逆变换逆变换 A A是正交矩阵,是正交矩阵,m mx x是向量是向量X X的平均值的平均值 101MxiimXM-=()xYXm=-ATxXYm=+A xmE X= KL KL正变换正变换 KLKL逆变换逆变换 A A是正交矩阵,是正交矩阵,m mx x是向量是向量X X的平均值的平均值 101MxiimXM-=()xYXm=-ATxXYm=+A xmE X=如何选取如何选取A A101()()MTxixixiXmXmM-=-C()() TxxxEXm
16、Xm=-C111100001111MMMMTTTTiixiixxxiiiiX Xm XX mm mMMMM-=-+邋邋111100001111()()MMMMTTTTiixiixxxiiiiX XmXX mm mMMMM-=-+邋邋1TT01MTTiixxxxxxiX Xm mm mm mM-=-+1T01MTiixxiX Xm mM-=-*轾犏犏犏犏犏犏犏臌向量向量X X的协方差矩阵的协方差矩阵 ()xEXm=-A()() TyyyE YmYm=-C ymE Y= xE Xm=-AA0 xxmm=-=AATE YY=( ()( () TxxEXmXm=-AA ()()TTxxEXmXm=-A
17、A()() TTxxEXmXm=-AATx= AC A01210121 ,.,.,nne eeel lll-,101011.MTTyxnTeeeeeeCC-轾犏犏犏=犏犏犏犏犏臌101011.MTTyxxxnTeeeeeeCCCC-轾犏犏犏=犏犏犏犏犏臌100011101111.nTTynTnneeeeeeCllllll-轾轾轾犏犏犏犏犏犏犏犏犏=犏犏犏犏犏犏犏犏犏犏犏犏臌臌犏臌为为 CxCx的特征向量的特征向量和相应的特征值,和相应的特征值,特征向量已正交特征向量已正交化处理化处理0121,.,Tne eeeA-=,A A的定义的定义实对称矩实对称矩阵可正交阵可正交相似对角相似对角阵,阵,C
18、xCx是是实对称矩实对称矩阵阵1T-=AA不妨将特征值按不妨将特征值按照递减的顺序排照递减的顺序排列列0121,.,Tne eeeA-=,降维重构降维重构的的误差?误差?1T-=AA()xYXm=-A0121,.,nllll-吵吵TxXYm=+A0121,., ,JTJJne eeeA-=,()JJxYXmA=-JTJxXYmA=+112001nJniiiiiiJEXXelll-=+=-=-=邋原图像的重原图像的重构(无损)构(无损)原图像的原图像的降维重构降维重构(有损)(有损)TyCE YY=Tx= AC A0121(,.,)ndiagllll-=2(,)(,)(,)(,)(,)2TTTT
19、JJJJTTTTTTTTJJJJJJJJTTTJJJJTTJJXXYYYYYYYYYYYYY YY YY YY YY YAAAAAAAAAAAA-=-=-+=-+=-211001TTTTJJJJnJniiiiiiJEXXE Y YY YE Y YE Y Ylll-=+-=-=-=-=邋KLKL变换说明变换说明Y Y向量的协方差矩阵向量的协方差矩阵CyCy非对角线元素是协非对角线元素是协方差,方差,协方差为零协方差为零,表示向量分量间的,表示向量分量间的相相关性关性甚小,甚小,X X向量的协方差矩阵向量的协方差矩阵CxCx非对角非对角线元素非零,说明相关强。线元素非零,说明相关强。KLKL变换说
20、明变换说明KLKL变换后变换后能量高度集中能量高度集中,压缩效果明显;,压缩效果明显;KLKL变换是在变换是在最小方差意义最小方差意义下最优。下最优。主要缺点:主要缺点: KLKL变换的矩阵变换的矩阵计算复杂计算复杂,该,该矩阵不是固定不变的,而是随着输入图像矩阵不是固定不变的,而是随着输入图像的不同而改变的不同而改变, , 没有通用的变换矩阵没有通用的变换矩阵和和快快速算法速算法 正变换正变换 U=Tu 反变换反变换 u=T-1u=UTu2(0) (1). (- 1)( )() |,zzz Nz jnlZz zC=2()nlZ011,.NEEE-2()nfl Z定义定义是是 的的 标准正交基
21、标准正交基对于对于 有有10,Nmmmff EE-=2(0) (1). (- 1)( )() |,zzz Nz jnlZz zC=2()nlZ011,.NEEE-2()nfl Z定义定义是是 的的 标准正交基标准正交基对于对于 有有10,Nmmmff EE-=2(0) (1). (- 1)( )() |,zzz Nz jnlZz zC=2()nlZ011,.NEEE-2()nfl Z定义定义是是 的的 标准正交基标准正交基对于对于 有有10,Nmmmff EE-=?2()nfl Z对于对于 有有10NmmmfEa-=10,Nlmmlmllllf EE EE Eaaa-= = = =10( ),
22、( ).( )Nmmnf mf Ef n En-= =10( )( ).( )Nmmf nf m En-= 正变换正变换 反变换反变换 010101(1)(1)(1)(1)(1)(0)(0)(0)(0)(0)(1)(1)(1)(1)(1)mNmNmNNNNNNfEEEfEEEffEEEff-轾轾轾犏犏犏犏犏犏犏犏犏=犏犏犏犏犏犏犏犏犏犏犏犏臌臌犏臌010101(1)(1)(1)(1)(1)(0)(0)(0)(0)(0)(1)(1)(1)(1)(1)TmNmNmNNNNNNfEEEfEEEffEEEff-轾轾轾犏犏犏犏犏犏犏犏犏=犏犏犏犏犏犏犏犏犏犏犏犏臌臌犏臌正变换逆变换Y = AX1TX=A
23、 Y=AY-( )01g nnN=-( )g n偶延拓偶延拓( )01( )(1)1g nnNf ngnNn-=- 2(1/ 2)121( )( )2jm nNNnNf mf n eNp+-= -=(21)121( )2jnmNNnNf n eNp+-= -=1(21)21( )cos()2NnNnNf nmNp-= -+=10(21)21( )cos()NnnNf nmNp-=+=,.1,0,.,1mNN= -其中偶函数,正弦项 相互抵消11(0)( )NnNff nN-= -=1,2,.,(1)mN= 北10(21)21()( )cos()NnnNfNf nNNp-=+-=-101( )c
24、os()20Nnf nnNpp-=-=( )f m()fm=-01CN=2,0mCmN=10(21)21( )( )cos()NnnNf mf nmNp-=+=10(21)2( )( )cos()NmnnNf mCf nmp-=+=10(21)2( )( )cos()NmnnNf nf m Cmp-=+=0001111(1)(1)(21)13222(21)13222cos(0)cos(0)cos(0)(0)(0)cos()cos()cos()(1)(1)(1)cos(1) )cos(1) )cos(1) )NNNNNNNNNNNcccffcccffff NcNcNcNpppppp-轾犏犏轾犏犏
25、犏犏犏犏= 犏犏犏犏犏犏犏犏-犏犏臌犏-犏臌(1)N轾犏犏犏犏犏犏-犏臌考虑基底的标准化和正变换和逆变换的对称性正变换逆变换0,1,2,.,1mN=-01CN=2,0mCmN=10(21)21( )( )cos()NnnNf mf nmNp-=+=10(21)2( )( )cos()NmnnNf mCf nmp-=+=10(21)2( )( )cos()NmnnNf nf m Cmp-=+=0001111(1)(1)(21)13222(21)13222cos(0)cos(0)cos(0)(0)(0)cos()cos()cos()(1)(1)(1)cos(1) )cos(1) )cos(1) )
26、NNNNNNNNNNNcccffcccffff NcNcNcNpppppp-轾犏犏轾犏犏犏犏犏犏= 犏犏犏犏犏犏犏犏-犏犏臌犏-犏臌(1)N轾犏犏犏犏犏犏-犏臌考虑基底的标准化和正变换和逆变换的对称性正变换逆变换0,1,2,.,1mN=-基向量垂直方向垂直方向水平方向水平方向二维可分离变量的正交变换二维可分离变量的正交变换可分离变量变换通过分别对图像块列和行实施一维变换实现可分离变量变换通过分别对图像块列和行实施一维变换实现垂直方向垂直方向水平方向水平方向( ( ) )( () )T TT TT=uTuvTuTTuTuT可分离变量变换通过分别对图像块列和行实施一维变换实现可分离变量变换通过分别
27、对图像块列和行实施一维变换实现二维可分离变量的正交变换二维可分离变量的正交变换转置后继续对列实施变换相当于对行实施变换转置后继续对列实施变换相当于对行实施变换垂直方向垂直方向水平方向水平方向11()TTT-=vTuTuT v TT vT可分离变量变换通过分别对图像块列和行实施一维变换实现可分离变量变换通过分别对图像块列和行实施一维变换实现二维可分离变量的正交变换二维可分离变量的正交变换是正交矩阵是正交矩阵T垂直方向垂直方向水平方向水平方向可分离变量变换通过分别对图像块列和行实施一维变换实现可分离变量变换通过分别对图像块列和行实施一维变换实现二维可分离变量的正交变换二维可分离变量的正交变换T=u
28、T vTG = AGB%基图像表达形式基图像表达形式G = AGB%000,11,01,11,01,1NNNNNGGGGGGG-轾犏犏犏=犏犏犏犏臌010111(,.,),NNA B-骣= 桫列向量列向量行向量行向量二维可分离变量的正交变换二维可分离变量的正交变换可分离变量变换的基图像表达的一般形式:可分离变量变换的基图像表达的一般形式:其中:其中:二维可分离变量的正交变换二维可分离变量的正交变换0000,11,01,110111,01,11011110110001(,.,)(,.,)(NNNNNNNNNNjjjjjNjjjjNGGGGGGGGGG -=-骣轾犏犏犏=犏犏犏犏 桫臌骣= 桫邋%
29、,11100,0)NNNjijijijiiji jGG -=邋可分离变量变换的基图像表达的一般形式:可分离变量变换的基图像表达的一般形式:二维可分离变量的正交变换二维可分离变量的正交变换可分离变量可分离变量变换的基底变换的基底(基图像)(基图像)0000,11,01,110111,01,11011110110001(,.,)(,.,)(NNNNNNNNNNjjjjjNjjjjNGGGGGGGGGG -=-骣轾犏犏犏=犏犏犏犏 桫臌骣= 桫邋%,11100,0)NNNjijijijiiji jGG -=邋可分离变量变换的基图像表达的一般形式:可分离变量变换的基图像表达的一般形式:X的离散余弦变换
30、的离散余弦变换(DCT)为为Y, X ,Y是是N N 块块.TXA YA=TYAXA=逆变换逆变换IDCT正变换正变换FDCTG = AGB%逆变换有形式Example: Example: N = 4对于44的 DCT变换,变换矩阵 A A :Example Example Calculating the DCT ofX X is 44 block of samples from an image:44 DCT Basis patterns8 8 DCT Basis patternsDCT transformReconstructed block变换后图像块的能量保持不变,变换后图像块的能量保
31、持不变,并且图像块的能量集中在并且图像块的能量集中在DC和和低频部分,当只保留低频部分,当只保留DC系数时,系数时,其他系数均设为其他系数均设为0,逆变换重构,逆变换重构的图像的每个像素值是原图像块的图像的每个像素值是原图像块的均值,重构的结果如图的均值,重构的结果如图(a)所示,所示,当只保留两个重要系数,其他系当只保留两个重要系数,其他系数均设为数均设为0时,重构结果为图时,重构结果为图(b),图图(c)和图和图(d)是保留是保留3个重要系数个重要系数和和5个重要系数重构的结果。图个重要系数重构的结果。图(a)到到 图图(d),重构的图像块越来越,重构的图像块越来越逼近原图像块逼近原图像块
32、。92. 011. 027. 065. 000. 150. 050. 150. 238. 058. 165. 027. 00 .1145 .1185 .1195 .1201D56606159586059625759596157586059F29221714241613141914121216111116C000000000000711118D原是图像数据原是图像数据变换系数后的变换系数后的量化表量化表量化后的结果量化后的结果JPEG (Joint Photographic Experts Group)JPEG (Joint Photographic Experts Group)是是198619
33、86年制定的国际静态图像压缩标准,年制定的国际静态图像压缩标准,采取的核心压缩算法是采取的核心压缩算法是DCTDCT算法(算法(Discrete Discrete Cosine Transform)Cosine Transform)。 DCTDCT算法在历史上起到了很重要的作用,一幅算法在历史上起到了很重要的作用,一幅640640480480的彩色图像,大小为的彩色图像,大小为3 3640640480480921921,600BYTE600BYTE,使用,使用64K/S64K/S的的ISDNISDN网络进行传网络进行传输,大约需要输,大约需要1.91.9分钟。分钟。JPEGJPEG压缩后大约压
34、缩后大约3838,400 BYTE,400 BYTE,传输只需要传输只需要4.84.8秒。秒。这是512512的lena灰度图像,在JPEG压缩100倍后成像,已经在一定程度意义上失去了应用价值 尽管尽管JPEGJPEG算法在过去和现在很多领域还发挥者算法在过去和现在很多领域还发挥者巨大作用,巨大作用,但由于算法是将整体图像分割成小块(但由于算法是将整体图像分割成小块(8 88 8或或161616)16)进行变换,当压缩比高时由于数据损进行变换,当压缩比高时由于数据损失,在块与块失,在块与块 之间就会出现分割的现象:之间就会出现分割的现象: 本单元的内容本单元的内容量化量化变换编码变换编码预测
35、编码预测编码预测编码:根据某一预测编码:根据某一模型模型,利用信号以,利用信号以往的样本值对新样本值进行预测往的样本值对新样本值进行预测 , 对对预预测误差测误差进行编码。进行编码。对于对于相关性较强相关性较强的信号,如果建立的信号,如果建立合适合适的模型的模型, 误差信号的误差信号的幅值幅值将远远小于原将远远小于原始信号始信号,从而可以用较少的电平类对其误从而可以用较少的电平类对其误差信号差信号量化量化得到较大的数据压缩效果。得到较大的数据压缩效果。 问题:能否问题:能否精确精确地地预测预测数据源输出?数据源输出? 答案答案 : 否否 数据源是不确定的数据源是不确定的几乎没有一个实际的系统能
36、找到可以精几乎没有一个实际的系统能找到可以精确预测输出的确预测输出的模型模型 能找到的能找到的最优预测模型最优预测模型是以某种是以某种最小误最小误差差意义下的预测模型。意义下的预测模型。 对于静止图像,由于相邻像素具有很强对于静止图像,由于相邻像素具有很强的相关性,这样当前像素的灰度(颜色)的相关性,这样当前像素的灰度(颜色)值可用前面已经出现的像素值进行预测,值可用前面已经出现的像素值进行预测,得到一个预测值,对实际值与预测值的得到一个预测值,对实际值与预测值的差值进行编码,差值进行编码,对于视频信号,图像帧间的相关性具有对于视频信号,图像帧间的相关性具有很强的相关性,通过帧间预测,对残差很
37、强的相关性,通过帧间预测,对残差图像编码。图像编码。预测编码是当今主流技术并且还会流行预测编码是当今主流技术并且还会流行于未来。于未来。脉冲编码调制脉冲编码调制PCMPCM(pulse code modulationpulse code modulation) 输入是模拟信号,输出是输入是模拟信号,输出是PCMPCM样本,低通滤样本,低通滤波器可以滤除掉指定频带以外的信号,波形滤波波器可以滤除掉指定频带以外的信号,波形滤波器可以理解为采样器。器可以理解为采样器。PCM 理论完善、研究最早、应用最广泛的理论完善、研究最早、应用最广泛的编码技术,主要应用于语音通信编码技术,主要应用于语音通信。对于
38、图像信号对于图像信号 灰度图像灰度图像: 量化级别为量化级别为256 ,8位的位的PCM编码编码 彩色图像:彩色图像: R,G,B或或 Y,U,V彩色信号分别以彩色信号分别以8位位 的的PCM 编码编码差分脉冲编码调制差分脉冲编码调制 DPCM (Differential pulse code modulation)是预测编码方法中是预测编码方法中最主要最主要的方法的方法1( )()ppkkxna x nk( )( )( )ppenx nxn( )( )pqpenQ en( )( )( )pqpq nenenDPCM工作原理工作原理 源信号 预测信号 误差信号 量化 量化产生的误差 ( )x
39、n( )( )( )( )( )()( )(ppqppxnenxnq nenx nqxnn DPCM工作原理工作原理 理想系统重建信号信号的重建误差信号的重建误差=量化误差量化误差 ( )x n当解码器当解码器能精确能精确地获地获得预测信号时得预测信号时1111( )()( ()()()()( )ppkkpkkppkkkkpxna x nkax nkq nka x nka q nkxn 实际系统重建信号 当解码器当解码器不能精确不能精确地地获得预测信号时获得预测信号时( )x n( )( )( )( )( )()(ppqppqxnenxnenx nq nnxxn 实际重建信号 信号重建误差信号
40、重建误差 =量化误差量化误差+累计误差累计误差( )x n图1 实际预测编/解码器结构图2 一般DPCM的结构实际中 ,量化器Q的输出不是输入的代表值, 而是代表值的序号,反量化器的输入是一个序号,通过内部计算或查表,输出一个代表值(1)(2)精品课件精品课件!精品课件精品课件!a1, a2, a3为预测系数为预测系数123( , )( ,1)(1,1)(1, )f i ja f i ja f ija f ij123( , )( , )( , )( , )( ,1)(1,1)(1, )e i jf i jf i jf i ja f i ja f ija f ij22123(,) ( , ) ( ( , )( , ) Q a a aE e i jEf i jf i j123000QaQaQaa1, a2 , aa1, a2 , a3 3为最佳线性预测系数为最佳线性预测系数可以证明,若图像符合平稳的马可以证明,若图像符合平稳的马尔可夫过程,则可以直接用相关尔可夫过程,则可以直接用相关系数来确定预测系数系数来确定预测系数