1、1第第5章章 信源编码标准信源编码标准n掌握掌握MPEG-2 AAC的音频编解码原理的音频编解码原理n熟悉熟悉DRA多声道数字音频编解码的算法原理及关键技术多声道数字音频编解码的算法原理及关键技术n了解新一代环绕多声道音频编码格式了解新一代环绕多声道音频编码格式n理解理解MPEG-2、H.264/AVC标准中标准中“类类”和和“级级”的含义的含义n熟悉熟悉H.264/AVC标准的主要特点及性能标准的主要特点及性能n了解了解H.265/HEVC标准的主要特点及性能标准的主要特点及性能n了解我国具备自主知识产权的音视频编码标准(了解我国具备自主知识产权的音视频编码标准(AVS)的性)的性能及应用能
2、及应用本章学习目标本章学习目标第第5章章 信源编码标准信源编码标准n5.1 数字音视频编码标准概述数字音视频编码标准概述n5.2 高级音频编码(高级音频编码(AAC)算法)算法n5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准n5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式n5.5 H.264/AVC视频编码标准视频编码标准n5.6 H.265/HEVC视频编码标准视频编码标准n5.7 AVS与与AVS+视频编码标准视频编码标准5.1 数字音视频编码标准概述数字音视频编码标准概述国际上数字音视频编码标准主要有两大系列。一个国际上数字音视频编码标准主要有两大系列。
3、一个系列由国际标准化组织(系列由国际标准化组织(ISO)和国际电工委员会)和国际电工委员会(IEC)制定,另一个系列由国际电信联盟电信标准)制定,另一个系列由国际电信联盟电信标准部(部(ITU-T)制定。)制定。 ISO/IEC: JPEG,JPEG2000,MPEG-1/2/4/7 ITU-T: H.261/2/3/4制定这些标准的背景有所不同,面向的主要应用也制定这些标准的背景有所不同,面向的主要应用也有所区别,它们采用的技术有很多共同点,应用领有所区别,它们采用的技术有很多共同点,应用领域有所重叠。域有所重叠。两者合作制定标准:两者合作制定标准:H.262/MPEG-2/ 、H.264/
4、MPEG-4 AVC和和H.265/HEVCn制定视频编码标准的组织制定视频编码标准的组织国际电信联盟(国际电信联盟(ITU)ISO/IECnInternational Telecommunication Union (ITU) 其委员会包括:其委员会包括:nCCITT(Consultative Committee on International Telegraph and Telephone), 19561992nCCIR (Consultative Committee on International Radio),192719921992 重组重组nCCITT ITU-TnCCIR I
5、TU-R5.1 数字音视频编码标准概述数字音视频编码标准概述ITUITU-RITU-TITU-D(发展)SG1SG2Study Group 6 MultimediaWP1- Modemsand InterfaceV.34,V.25terWP2- Systems H.320-ISDN H.323-LAN H.324-POTS T.120-DATAWP3- Coding G.7xx-Audio H.26x-VideoITU 视频编码相关的研究小组视频编码相关的研究小组nISO/IECnIEC - International Electrotechnical Commissionn成立于成立于 19
6、06 年,致力于建立所有电工技术方面的国际标准年,致力于建立所有电工技术方面的国际标准n瑞士法律下的非盈利、私立机构瑞士法律下的非盈利、私立机构nISO - International Standardization Organizationn成立于成立于 1947年,年,“推动工业标准的国际协调和统一推动工业标准的国际协调和统一”n瑞士法律下的非盈利、私立机构瑞士法律下的非盈利、私立机构nISO/IEC 联合技术委员会(联合技术委员会(ISO/IEC Joint Technical Commmittee 1, JTC1)n联合致力于计算机相关的标准活动联合致力于计算机相关的标准活动n占占 I
7、SO 和和 IEC 总标准的总标准的 30%视频编码标准组织视频编码标准组织ISOJTC1IECSubcommittee 29AGWGAGMRAWG1WG12WG11SGSGSGJBIGJPEGMHEG5MHEG6需求Systems描述VideoAudioSNHCTests实现研究联络ISO/IEC 视频编码相关的研究小组视频编码相关的研究小组视频编码标准发展历程视频编码标准发展历程视频编码标准发展历程视频编码标准发展历程视频编码标准发展历程视频编码标准发展历程vISO/IEC-MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC/H.264, HEVCvITU-T -H.26
8、1, H.262(MPEG-2), H.263, H.264, H.265v中国中国 AVS-AVS, AVS+ v下一代标准?下一代标准?-方向、技术?方向、技术? 年代 MPEG-1 1993 2001 1997 2005 MPEG-4 AVC/H.2641989 MPEG-2MPEG-42013AVS下一代标准20092017视频编码标准发展历程视频编码标准发展历程5.1.1 H.26x 系列标准系列标准nITU-T的视频编码专家组(的视频编码专家组(VCEG)制定了)制定了H.26x 标准标准 系列,主要针对实时视频通信领域的应用,如可视电话、系列,主要针对实时视频通信领域的应用,如可
9、视电话、会议电视等。会议电视等。nH.261:“速率为速率为p64kbit/s(p=1,2,30)视听)视听业务的视频编解码业务的视频编解码”,简称为,简称为p64kbit/s标准。标准。 nH.262: 同同MPEG-2的视频部分(的视频部分(ISO/IEC 13818-2)。)。nH.263:低码率视频编码标准。低码率视频编码标准。nH.264:等同于等同于MPEG-4 AVC (ISO/IEC 14496-10)。)。nH.265:等同于等同于MPEG HEVC (ISO/IEC 23008-2)。 ITU-T H.261n1988年制定,奠定了现代视频编码的基础:年制定,奠定了现代视频
10、编码的基础:n编码结构为:编码结构为:运动补偿预测运动补偿预测+DCT 编码编码+熵编码熵编码n关键技术关键技术包括包括 1616宏块运动补偿预测、宏块运动补偿预测、88 DCT、量、量化、环路滤波和变字长编码(化、环路滤波和变字长编码(VLC)等。)等。n这些关键技术后来被其它标准采用。这些关键技术后来被其它标准采用。nH.261v2 (1993年早期年早期) 增加了后向兼容的高清晰度图片模式增加了后向兼容的高清晰度图片模式(例如远程教学中的白板)例如远程教学中的白板)n图像格式:图像格式:CIF or QCIF,帧率,帧率 29.97fpsn数码率为数码率为 n64kbit/s (6419
11、20 kbit/s),典型为,典型为 384kbit/sn特性:特性:n低复杂、低时延低复杂、低时延n后向兼容的一个标准后向兼容的一个标准n被被 H.263 和和 H.264 超越超越H.261 图像格式图像格式ITU-R BT.601CIFQCIF720576352288176144基于基于 MC+DCT 混合视频编码器混合视频编码器反量化反量化IDCTMC预测器预测器DCT量化量化运动估计运动估计ME帧缓存器帧缓存器运动补偿预测运动补偿预测MC输入输入信号信号编码码流编码码流( (送信道送信道) )解码帧解码帧(送显示送显示)运动矢量和块模式数据运动矢量和块模式数据 (送信道送信道)先前解
12、码的帧先前解码的帧(虚框表示虚框表示解码器解码器)熵编码熵编码H.263 :低码率视频编码标准:低码率视频编码标准nITU-T H.263 (V1: 1995): 取代取代 H.261,成为视频会,成为视频会议、可视电话和议、可视电话和 Internet 视频流的压缩标准。视频流的压缩标准。nH.263 + (1997/1998年)年) & H.263 + + (2000年)年)n图像格式通常为图像格式通常为 CIF、QCIF or Sub-QCIF(12896), 帧率一般低于帧率一般低于 10fps。n数码率:任意,典型数码率:任意,典型 20kbps (对于(对于 PSTN)。)。n在所
13、有的数码率上对优于在所有的数码率上对优于 H.261,在一半数码率上与,在一半数码率上与 H.261 具有相同的质量具有相同的质量n是是 MPEG4 标准的压缩标准的压缩 Core。H.263 vs. H.261n改进的改进的运动补偿运动补偿H.261:整数像素精度,环路滤波器,每个:整数像素精度,环路滤波器,每个 MB 一个运动矢量一个运动矢量H.263:半像素精度半像素精度,无环路滤波器无环路滤波器,每个,每个 MB 一个运动矢量一个运动矢量n减少了减少了 Overheadn支持更多的图像格式支持更多的图像格式n附录附录中定义了选项中定义了选项无限制的运动矢量(附录无限制的运动矢量(附录
14、D)基于语法的算术编码(基于语法的算术编码(SAC)(附录)(附录 E)高级预测模式高级预测模式 (AP) (附录(附录 F)n重叠块运动补偿(重叠块运动补偿(Overlapped Block Motion Compensation, OBMC)n每个每个 MB 中中 1 或或 4 个运动矢量切换个运动矢量切换PB 帧图像(附录帧图像(附录 G)n在在 H.263+ 增加了更多选项增加了更多选项5.1.2 MPEG-x系列标准系列标准 MPEG (Moving Picture Experts Group)是是运动图像专家组运动图像专家组的的英文缩写。即英文缩写。即ISO/IEC JTC1/SC
15、29/WG11。这个专家组开发。这个专家组开发的标准通常称为的标准通常称为MPEG标准。标准。 n MPEG-1:针对:针对1.5 Mbit/s以下数码率的数字存储媒体应用的以下数码率的数字存储媒体应用的运动图像及其伴音编码,标准号运动图像及其伴音编码,标准号ISO/IEC 11172。n MPEG-2:运动图像及其伴音信息的通用编码,标准号:运动图像及其伴音信息的通用编码,标准号ISO/IEC 13818。n MPEG-4:视听对象编码,标准号:视听对象编码,标准号ISO/IEC 14496。n MPEG-7:多媒体内容描述接口,标准号:多媒体内容描述接口,标准号ISO/IEC 15938。
16、n MPEG-H Part 2 :同:同H.265,标准号,标准号ISO/IEC 23008-2。n MPEG-1是是针对针对1.5Mbit/s以下数据传输率的数字存以下数据传输率的数字存储媒介应用的运动图像及其伴音编码储媒介应用的运动图像及其伴音编码的国际标准。的国际标准。nMPEG-1的目标是将压缩后的视的目标是将压缩后的视/音频码流存入光盘音频码流存入光盘(如(如CD-ROM、VCD等),数据传输率为等),数据传输率为1.416 Mbit/s,其中,其中1.1 Mbit/s用于视频用于视频,128 kbit/s用于音用于音频频,其余的用于系统开销。,其余的用于系统开销。n MPEG-1是
17、一个开放的、统一的标准,在商业上获是一个开放的、统一的标准,在商业上获得了巨大的成功。尽管其图像质量仅相当于得了巨大的成功。尽管其图像质量仅相当于VHS视视频的质量,还不能满足广播级的要求,但已广泛应频的质量,还不能满足广播级的要求,但已广泛应用于用于VCD等家庭视听产品中。等家庭视听产品中。 5.1.2 MPEG-x系列标准系列标准n在制订在制订MPEG-1的过程中,广播电视的设备制造商立的过程中,广播电视的设备制造商立即意识到即意识到MPEG技术对提高卫星转发器和有线电视信技术对提高卫星转发器和有线电视信道效率的潜力。但数字电视广播不能满足于道效率的潜力。但数字电视广播不能满足于VHS的图
18、的图像质量,数码率也不必像像质量,数码率也不必像MPEG-1限制得那样低。于限制得那样低。于是是MPEG为数字电视广播的应用制订了为数字电视广播的应用制订了MPEG-2标准。标准。nMPEG-1是是MPEG-2的一个子集,任何的一个子集,任何MPEG-2的解的解码器要能够对码器要能够对MPEG-1的码流进行解码。的码流进行解码。nMPEG-2不是不是MPEG-1的简单升级,它在系统和传送的简单升级,它在系统和传送方面作了更加详细的规定和进一步的完善。方面作了更加详细的规定和进一步的完善。nMPEG-2的应用领域非常广泛的应用领域非常广泛,包括存储媒介中的,包括存储媒介中的DVD、广播电视中的数
19、字电视和、广播电视中的数字电视和HDTV、以及交互式、以及交互式的视频点播(的视频点播(VOD)等。)等。5.1.2 MPEG-x系列标准系列标准nMPEG-4 n视听对象编码视听对象编码(Coding of audio-visual objects)标准标准(ISO/IEC 14496),始于,始于1993年的多媒体应用标准年的多媒体应用标准n1998年年10月发布了版本月发布了版本1n1999年底完成了版本年底完成了版本2n2000年初正式成为国际标准年初正式成为国际标准n不断更新和完善不断更新和完善n目标是为通信、广播、存储和其他应用提供数据速率低而视目标是为通信、广播、存储和其他应用提
20、供数据速率低而视听质量高的数据编码方法和交互播放工具听质量高的数据编码方法和交互播放工具n吸收了吸收了MPEG-1、MPEG-2和其他相关标准的许多特性和其他相关标准的许多特性n引入了视听对象引入了视听对象(audio-visual objects,AVO)编码的概念编码的概念5.1.2 MPEG-x系列标准系列标准n扩充了编码类型,由自然对象扩展到合成对象扩充了编码类型,由自然对象扩展到合成对象n采用了合成对象与自然对象混合编码采用了合成对象与自然对象混合编码(Synthetic/Natural Hybrid Coding,SNHC)算法算法n引入了组合、合成和编排等重要概念,以实现引入了组
21、合、合成和编排等重要概念,以实现交互功能交互功能和和对象重用对象重用5.1.2 MPEG-x系列标准系列标准(a)(a)发送端发送端 (b) (b) 接收端接收端MPEG-4MPEG-4基于对象的系统模型基于对象的系统模型5.1.2 MPEG-x系列标准系列标准nAVS (Audio Video coding Standard)是我国具备自主知识产)是我国具备自主知识产权的第二代信源编码标准,是权的第二代信源编码标准,是信息技术信息技术先进音视频编先进音视频编码码系列标准的简称。系列标准的简称。nAVS视频标准(视频标准(GBT 20090.2-2006)主要面向高清晰度和)主要面向高清晰度和
22、高质量数字电视广播、网络电视、高密度激光数字存储媒体高质量数字电视广播、网络电视、高密度激光数字存储媒体和其他相关应用,具有以下特点:和其他相关应用,具有以下特点:(1)性能高,)性能高,编码效率是编码效率是MPEG-2的的2倍以上,与倍以上,与H.264的编码的编码效率处于同一水平;效率处于同一水平;(2)复杂度低,)复杂度低,算法复杂度比算法复杂度比H.264明显低,软硬件实现成本明显低,软硬件实现成本都低于都低于H.264;(3)我国掌握主要知识产权,专利授权模式简单,费用低)我国掌握主要知识产权,专利授权模式简单,费用低。5.1.3 AVS和和AVS+标准标准熵编码反量化反变换运动补偿
23、预测控制数据量化后的变换系数运动数据帧内/帧间编码控制解码器运动估计变换/量化-0环滤波帧内预测5.1.3 AVS和和AVS+标准标准AVS视频编码标准工具集视频编码标准工具集n双向预测双向预测n隔行编码隔行编码n运动矢量预测运动矢量预测n子像素插值子像素插值n多参考帧预测多参考帧预测n可变块大小预测可变块大小预测n帧内预测帧内预测n变换和量化变换和量化n熵编码熵编码n环路滤波环路滤波n缓冲区管理缓冲区管理n其它其它n图像组头图像组头n防伪起始码防伪起始码n码流顺序码流顺序n时间参考索引时间参考索引AVS的的意义的的意义n直接产业化成果:直接产业化成果:未来未来10年我国需要的年我国需要的45
24、亿颗亿颗解码芯片,辐射超万亿的国民经济产业解码芯片,辐射超万亿的国民经济产业n构建完整的产业链:构建完整的产业链:技术技术专利专利标准标准芯片芯片系统系统制造制造业业运营业运营业文化产业文化产业n我国高清电视、直播卫星等音视频产业跨越发展我国高清电视、直播卫星等音视频产业跨越发展的难得契机的难得契机AVS产品形态产品形态n芯片芯片n高清高清/标清标清AVS解码芯片,国内需求量在未来十多年的解码芯片,国内需求量在未来十多年的时间内年均将达到时间内年均将达到4000多万片。多万片。n软件软件nAVS节目制作与管理系统,节目制作与管理系统,Linux和和Window平台上基平台上基于于AVS标准的流
25、媒体播出、点播、回放软件标准的流媒体播出、点播、回放软件n整机整机n机顶盒、播出服务器、编码器、高清激光视盘机、高机顶盒、播出服务器、编码器、高清激光视盘机、高清数字电视机顶盒和接收机、手机、便携式数码产品清数字电视机顶盒和接收机、手机、便携式数码产品等等n媒体运营产业媒体运营产业 AVS+视频标视频标准准nAVS工作组制定了工作组制定了AVS1-P2等视频编码标准,并于等视频编码标准,并于2006年颁年颁布为国标布为国标GB/T 20090.2-2006,之后于,之后于2012年在国标的基础年在国标的基础上升级为上升级为AVS+,形成了广电行业标准,形成了广电行业标准GY/T 257.1-2
26、012。AVS2视频标视频标准准nAVS标准针对视频监控的伸展档标准针对视频监控的伸展档AVS-S2又于又于2013年被国际电子电气工年被国际电子电气工程师协会程师协会(IEEE)标准化委员会接受并颁布为标准化委员会接受并颁布为IEEE 1857标准。标准。2013年年12月月31日国家质检总局、国家标准委批准发布了信息技术日国家质检总局、国家标准委批准发布了信息技术 先进音视频先进音视频编码编码 第第2部:视频(修订)(国标代号部:视频(修订)(国标代号GB/T 20090.2-2013)、信)、信息技术息技术 先进音视频编码先进音视频编码 第第10部:移动语音和音频(国标代号部:移动语音和
27、音频(国标代号GB/T 20090.10-2013)为国家标准,标准将于)为国家标准,标准将于2014年年7月月15日正式实施。日正式实施。nAVS2是是AVS+的下一代的下一代,即,即信息技术信息技术 -先进音视频编码先进音视频编码 第第2部:视频部:视频(修订)(修订)。n国标代号国标代号GB/T 20090.2-2013,简称,简称AVS2视频标视频标准准n首要应用目标是超高清晰度首要应用目标是超高清晰度( 4K或或8K )视频。视频。n测试表明,测试表明,AVS2视频标准的压缩效率已经比上一代视频标准的压缩效率已经比上一代AVS国家标准和国家标准和AVC/H.264国际标准提高了一倍,
28、在场景类视频编码方面大幅度领先国际标准提高了一倍,在场景类视频编码方面大幅度领先于最新国际标准于最新国际标准HEVC,实现复杂度不高于同等级的编码标准。,实现复杂度不高于同等级的编码标准。第第5章章 信源编码标准信源编码标准n5.1 数字音视频编码标准概述数字音视频编码标准概述n5.2 高级音频编码(高级音频编码(AAC)算法)算法n5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准n5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式n5.5 H.264/AVC视频编码标准视频编码标准n5.6 H.265/HEVC视频编码标准视频编码标准n5.7 AVS与与AVS+视
29、频编码标准视频编码标准5.2 高级音频编码(高级音频编码(AAC)算法)算法MPEG-2标准定义了两种音频压缩编码算法:标准定义了两种音频压缩编码算法:nMPEG-2 Audio(标准号为(标准号为ISO/IEC 13818-3),),或称为或称为MPEG-2 BC,它是与,它是与MPEG-1音频压缩编音频压缩编码标准(码标准(ISO/IEC 11172-3)后向兼容的多声道音)后向兼容的多声道音频编码标准;频编码标准;nMPEG-2 AAC(Advanced Audio Coding,高级音,高级音频编码),标准号为频编码),标准号为ISO/IEC 13818-7。因为它与。因为它与MPEG
30、-1音频压缩编码算法是不兼容的,所以也音频压缩编码算法是不兼容的,所以也称为称为MPEG-2 NBC(Non Backward Compatible,非后向兼容)标准。非后向兼容)标准。nMPEG-2 BC:对:对MPEG-1音频编码的扩展,没有音频编码的扩展,没有增加新的编码的算法增加新的编码的算法n增加了低采样频率(增加了低采样频率( 16 kHz 、22.05 kHz 、24 kHz)和)和低数码率低数码率n支持支持 5.1 或或 7.1 声道环绕声声道环绕声n支持多达支持多达 7 种语言种语言n和和 MPEG-1 后向兼容后向兼容5.2 高级音频编码(高级音频编码(AAC)算法)算法n
31、在在MPEG-1 音频编码的基础上,音频编码的基础上,MPEG-2 音频编码能传输音频编码能传输多路声音,称为多路声音,称为MUSICAM 环绕声。环绕声。5.2 高级音频编码(高级音频编码(AAC)算法)算法MPEG-2 多声道编解码器多声道编解码器LoRoMPEG-1编码器编码器MPEG-1解码器解码器MPEG-2EncoderMPEG-2 编码器编码器MPEG-2 解码器解码器缩混缩混重新重新混合混合LFEMPEG-2Decodern前向兼容前向兼容: MPEG-2多声道解码器可正确地对多声道解码器可正确地对MPEG-1立体声码流立体声码流进行解码进行解码n后向兼容后向兼容: MPEG-
32、1立体声解码器可以从多声道码流中正确地对解立体声解码器可以从多声道码流中正确地对解码出双声道立体声信号码出双声道立体声信号5.2 高级音频编码(高级音频编码(AAC)算法)算法nMPEG-2 AAC (ISO/IEC 13818-7)MPEG-2后向不兼容后向不兼容 (Non-backward compatible, NBC) 改名为改名为 AAC(Advanced Audio Coding)支持支持48个主声道、个主声道、16个低频音效增强(个低频音效增强(LFE)声道、)声道、16个配音声道(个配音声道(overdub channel)或者称为多语言声道()或者称为多语言声道(multil
33、ingual channel)和)和16个数据流。个数据流。采样率采样率 896kHz数码率为数码率为 8 160 kbps/声道声道与与MPEG-1的第的第2层相比,层相比,MPEG-2 AAC的压缩比可提高的压缩比可提高1倍,而且音质更好;在质量相同的条件下,倍,而且音质更好;在质量相同的条件下,MPEG-2 AAC的数码率大约是的数码率大约是MPEG-1第第3层(即层(即MP3)的)的70%。5.2 高级音频编码(高级音频编码(AAC)算法)算法n达到达到 CD 质量水平的声音测试质量水平的声音测试44.1kHz, 16 bits/sample, 立体声立体声 = 1.411MbpsMP
34、3 需要需要 128 kbpsAAC 需要需要 96 kbps5.2 高级音频编码(高级音频编码(AAC)算法)算法nMPEG-2 AAC (ISO/IEC 13818-7)5.2 高级音频编码(高级音频编码(AAC)算法)算法n主档次主档次(Main Profile)n除了除了“增益控制增益控制(Gain Control)”模块之外模块之外 n低复杂度档次低复杂度档次(Low Complexity Profile)n不使用预测模块和增益控制模块,瞬时噪声整形不使用预测模块和增益控制模块,瞬时噪声整形(temporal noise shaping,TNS)滤波器的级数也有限滤波器的级数也有限
35、n可分级的采样率档次可分级的采样率档次(Scalable Sampling Rate Profile)n使用增益控制对信号作预处理,不使用预测模块,使用增益控制对信号作预处理,不使用预测模块,TNS滤滤波器的级数和带宽也都有限制波器的级数和带宽也都有限制 MPEG-2 AAC的档次的档次5.2 高级音频编码(高级音频编码(AAC)算法)算法MPEG-4 Time/Frequency CodingM / S预测预测强度立体声强度立体声/耦合耦合时域噪时域噪声整形声整形滤波器组滤波器组增益增益控控制工具制工具比特流复接比特流复接感知模型感知模型量化和编码量化和编码音频音频信号信号ISO/IEC 1
36、4496-3 Subpart 4Coded Audio Bit Stream控制流控制流数据流数据流Bark Scale to Scale Factor Band Mapping窗长度判决Spectral Normal.AAC量化和编码量化和编码BSAC量化和编码量化和编码Twin VQ频谱处理频谱处理MPEG4通用音频编码:通用音频编码:基于基于 AAC 的编码的编码n时时延主要由以下因素引起延主要由以下因素引起:n帧帧长度长度n分析分析和合成滤波器和合成滤波器n在编码器中窗长度切换在编码器中窗长度切换 (2048 vs 256 样值样值) 需要需要 “look-ahead” 时间。时间。n
37、比特比特池池匹配于变比特率(匹配于变比特率(Variable Bit-Rate,VBR) 需求需求n最小最小理论时延理论时延:110ms 210ms(比特池)(比特池)(在 24kHz 取样频率和 24kbit/s 比特率时)nAAC 低低时延时延:n帧帧长长: 只有只有 512 个个样值样值n没有没有提前预见时间(提前预见时间(look-ahead time)n没有没有比特池比特池n编码编码增益损失:约增益损失:约 20%MPEG4 通用音频编码:通用音频编码:AAC 低时延低时延第第5章章 信源编码标准信源编码标准n5.1 数字音视频编码标准概述数字音视频编码标准概述n5.2 高级音频编码
38、(高级音频编码(AAC)算法)算法n5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准n5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式n5.5 H.264/AVC视频编码标准视频编码标准n5.6 H.265/HEVC视频编码标准视频编码标准n5.7 AVS与与AVS+视频编码标准视频编码标准nDRA 数字音频编解码技术采用自适应时频分块(数字音频编解码技术采用自适应时频分块(Adaptive Time Frequency Tiling,ATFT)方法,实现对音频信号的)方法,实现对音频信号的最优分解,进行自适应量化和熵编码,具有解码复杂度低最优分解,进行自适应量化
39、和熵编码,具有解码复杂度低、压缩效率高、音质好等优点,可广泛应用于数字音频广、压缩效率高、音质好等优点,可广泛应用于数字音频广播、数字电视、移动多媒体、激光视盘机、网络多媒体以播、数字电视、移动多媒体、激光视盘机、网络多媒体以及在线游戏、数字电影院等领域。及在线游戏、数字电影院等领域。 5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准 DRA标准概况标准概况(1/4)l标准名称:标准名称:多声道数字音频编解码技术多声道数字音频编解码技术规范规范 (简称(简称DRA音频音频)l标准类别:中国电子行业标准标准类别:中国电子行业标准l标准号:标准号:SJ/T11386-2006l标准批
40、准时间:标准批准时间:2007年年1月月4日日l 批准部门:中华人民共和国信息产业部批准部门:中华人民共和国信息产业部 l标准研发单位:广州广晟数码技术有限公标准研发单位:广州广晟数码技术有限公司司 DRA标准概况标准概况(2/4)lDRA最大特点是用很低的解码复杂度实现了国最大特点是用很低的解码复杂度实现了国际先进水平的压缩效率。际先进水平的压缩效率。l经国家广电总局规划院多次测试表明,经国家广电总局规划院多次测试表明,DRA技技术在每声道术在每声道64 kbps的码率时即的码率时即“达到了达到了EBU定义的定义的不能识别损伤不能识别损伤的音频质量的音频质量”。lDRA可应用于数字电视、数字
41、音频广播、数字可应用于数字电视、数字音频广播、数字电影院、网络流媒体、电影院、网络流媒体、IPTV及移动多媒体等及移动多媒体等领域。领域。 DRA标准概况标准概况(3/4)nDRADRA测试情况测试情况测试条件:测试条件:5.15.1声道声道384kbps384kbps码率情况下,以码率情况下,以5 5分为满分分为满分4.94.54.24.04.0 DRA标准概况标准概况(4/4)采样频率范围8192kHz采样精度24bit比特率329612kpbs可支持的最大声道数正常声道64个, 低频效果声道(LFE)3个, 即64.3算法实现复杂度采用Motorola5636X定点DSP, 只需48MI
42、PS即可完成5.1声道的384kpbs的解码压缩效率每声道在64kbps码率下“达到了EBU定义的不能识别损伤的音频质量”编码延迟43ms(48K采样率),46ms(44.1K采样率)l技术指标5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准nDRA多声道数字音频编码算法多声道数字音频编码算法5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准nDRA多声道数字音频多声道数字音频解解码算法码算法第第5章章 信源编码标准信源编码标准n5.1 数字音视频编码标准概述数字音视频编码标准概述n5.2 高级音频编码(高级音频编码(AAC)算法)算法n5.3 DRA多声道数字音频编
43、解码标准多声道数字音频编解码标准n5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式n5.5 H.264/AVC视频编码标准视频编码标准n5.6 H.265/HEVC视频编码标准视频编码标准n5.7 AVS与与AVS+视频编码标准视频编码标准5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式nDolby Digital Plus(DD+)5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式nDolby TrueHDnDolby TureHD(杜比真高清)是(杜比真高清)是Dolby公司于公司于2005年年9月月8日推出的一种针对高清光盘格式开发的新一代无
44、损音频编日推出的一种针对高清光盘格式开发的新一代无损音频编码格式,可为听众提供相当于高分辨率录音棚母版的音响码格式,可为听众提供相当于高分辨率录音棚母版的音响效果。效果。采用采用MLP无损压缩技术无损压缩技术最高数码率可达最高数码率可达18Mbit/s 支持支持7.1声道,最高可达声道,最高可达13.1声道声道5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式nDTS-HDnDolby TureHD(杜比真高清)是(杜比真高清)是Dolby公司于公司于2005年年9月月8日推出的一种针对高清光盘格式开发的新一代无损音频编日推出的一种针对高清光盘格式开发的新一代无损音频编码格式,可
45、为听众提供相当于高分辨率录音棚母版的音响码格式,可为听众提供相当于高分辨率录音棚母版的音响效果。效果。采用采用MLP无损压缩技术无损压缩技术最高数码率可达最高数码率可达18Mbit/s 支持支持7.1声道,最高可达声道,最高可达13.1声道声道第第5章章 信源编码标准信源编码标准n5.1 数字音视频编码标准概述数字音视频编码标准概述n5.2 高级音频编码(高级音频编码(AAC)算法)算法n5.3 DRA多声道数字音频编解码标准多声道数字音频编解码标准n5.4 新一代环绕多声道音频编码格式新一代环绕多声道音频编码格式n5.5 H.264/AVC视频编码标准视频编码标准n5.6 H.265/HEV
46、C视频编码标准视频编码标准n5.7 AVS与与AVS+视频编码标准视频编码标准VCL实现视频数据的编解码;实现视频数据的编解码;NAL定义数据封装格式,为定义数据封装格式,为VCL提供与网络无关的统一接口提供与网络无关的统一接口H.264/AVC视频编码器的分层结构视频编码器的分层结构H.264/AVC视频视频编码框图编码框图变换变换/ /量化量化去除空间冗余去除空间冗余运动补偿预测运动补偿预测去除时间冗余去除时间冗余熵编码熵编码去除变换系数的冗余去除变换系数的冗余熵编码熵编码反量化反量化/变换变换运动补偿运动补偿控制数据控制数据量化的量化的变换系数变换系数运动矢量运动矢量帧内帧内/帧间帧间编
47、码编码控制控制解码器运动估计运动估计变换变换/量化量化-输入视输入视频信号频信号划分成宏块划分成宏块 帧内预测帧内预测环路滤波环路滤波视频信视频信号输出号输出视频流视频流n仍然采用先前标准中的仍然采用先前标准中的 MCDCT 混合编码算法,混合编码算法,相同的部分相同的部分包括:包括:1616 宏块宏块传统的亮度和色度采样格式传统的亮度和色度采样格式 4:2:0 块运动位移或矢量块运动位移或矢量运动矢量越过图像边界的算法运动矢量越过图像边界的算法块大小可变的运动补偿块大小可变的运动补偿块变换(没有采用小波或分形块变换(没有采用小波或分形 wavelets or fractals)标量量化标量量
48、化I、P 和和 B 帧图像类型帧图像类型变字长编码变字长编码 Variable-length codingH.264/AVC 标准采用的已有技术标准采用的已有技术n多模式、多参考帧运动补偿多模式、多参考帧运动补偿 n1/4pixel 运动矢量精度运动矢量精度n多模式帧内预测(多模式帧内预测(I 帧空域预测)帧空域预测)n去方块效应环路滤波器去方块效应环路滤波器n4 4 整数变换整数变换n熵编码采用熵编码采用CAVLC 或或 CABACnSP-slicesn网络适应层网络适应层 NAL (Network Abstraction Layer)H.264/AVC 标准采用的新技术标准采用的新技术n动
49、机:运动动机:运动/固定目标的大小是可变的固定目标的大小是可变的n许多小块也可能需要花费许多比特来编码许多小块也可能需要花费许多比特来编码n不同块大小和形状的运动补偿不同块大小和形状的运动补偿n1/4-pixel 精度精度 (源自源自 MPEG-4 ASP,但更复杂,但更复杂)n以往的视频编码标准都采用了整像素或半像素的运动估计,以往的视频编码标准都采用了整像素或半像素的运动估计,n-pixel 比比 -pixel 获得获得 1.52dB 增益,约节省增益,约节省20%的比特率的比特率n-pixel 精度采用精度采用 6 抽头滤波器得到抽头滤波器得到n7 种可变块大小:种可变块大小:H.264
50、把每个把每个 1616 宏块再细分,每个宏块再细分,每个子块分别进行预测,提高了预测精度:子块分别进行预测,提高了预测精度:n保持完整的宏块,保持完整的宏块,n水平(垂直)划分为两个子块,大小为水平(垂直)划分为两个子块,大小为 168 (8x16)n划分成划分成 4 个子块,大小为个子块,大小为 88n上述的上述的 4 个个 88 子块可以进一步划分成更小的子块可以进一步划分成更小的 2 或或 4 个块(个块(84、48、44)。)。n节省了节省了15%以上的比特率以上的比特率n多参考帧预测:假设为多参考帧预测:假设为5个参考帧预测,相对于一个参考帧个参考帧预测,相对于一个参考帧来说,来说,