1、数字媒体处理技术课程定位2022-6-10提纲o 1.1 数字媒体的基本概念o 1.2 数字媒体处理关键技术o 1.3 数字媒体标准简介o 1.4 数字媒体技术的应用41.1 数字媒体的基本概念 n计算机的社会角色计算机的社会角色 计算计算 信息交流信息交流 智能服务智能服务信息交流信息交流(人类发展和人的成长人类发展和人的成长/计算机发展计算机发展)情感情感语言语言文字文字bits (简单化、精确化简单化、精确化) 情感情感语言语言文字文字bits (原始信号频率的2倍时, 采样信号才可以保真地恢复为原始信号。Step 2:量化与失真o 将采样样本的幅度按照量化级别决定其取值的过程。目的是将
2、采样样本的幅度值离散化。o 量化之前需要规定量化级,比如8级,16级,256级等。o 量化是一个对一的映射。例如:画图软件的颜色级别例如:画图软件的颜色级别为什么感知很重要?o 失真评价的基础o http:/www.libertarian.on.ca/images/Florida%20Recount.jpgStep 3:编码与压缩o 编码n用相应位数的二进制代码表示量化后的采样样本的量级。n如果有N个量化级为,那么对应的二进制位数就为log2N。当N16,二进制需要4位。n经过编码之后,每个样本都表示为相应的二进制代码。o 脉冲编码调制(PCM,Pulse Code Modulation),完
3、成模拟信号的数字化为什么需要数据压缩?o 压缩编码的理论基本原理n从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。o 信息冗余的例子n你的朋友,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。 (23*2+10=56个半角字符)n你的朋友将于明天晚上 6点零5分在虹桥机场接你。 (20*2+3=43个半角字符)nHelen将于明晚6点在虹桥接你。 (10*2+7=27个半角字符)n结论:只要接收端不会产生误解,就可以减少承载信息的数据量。多媒体领域中的冗余分类o 统计冗余n空间冗余规则物
4、体的物理相关性n时间冗余视频与动画画面间以及音频帧间的相关性o 信息熵冗余n编码冗余数据与携带的信息o 结构冗余n纹理冗余规则纹理、相互重叠的结构表面o 视/听觉冗余n视觉、听觉敏感度和非线性感觉o 知识冗余n凭借经验识别数据压缩o 数据压缩可分成两种类型n无损压缩n有损压缩 o 无损压缩n指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同n用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。o 有损压缩n指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。n适用于重构信号不一定非要和
5、原始信号完全相同的场合。压缩策略o 无损压缩(Lossless Compression)n哈夫曼编码(Huffman Coding)n自适应哈夫曼编码nLempel-Ziv-Welch (LZW)p 用于GIFnJPEG-LSo 有损压缩(Lossy Compression)nJPEGnH.261, MPEG-1, MPEG-2o 无损+有损(Lossless and Lossy Together)nJPEG 2000数据压缩的性能指标o 衡量压缩算法的三个主要性能指标(1)压缩比;(2)压缩质量(失真);(3)压缩与解压缩的速度。o 不能兼得时要综合考虑o 压缩质量评价n主观评价 :平均意见
6、得分(MOS)、五分制(优良中差劣)n客观评价:均方误差、加权均方误差、信噪比、峰值信噪比(图像)、分段信噪比(音频)、似然比、谱失真测度2210log10)(rxdBSNR22max10log10)(rxdBPSNR编码方式举例:哈夫曼编码(Huffman Coding)o Huffman编码属于信息熵编码的方法之一,是根据信源符号出现概率的分布特性而进行的压缩编码。o 也称为最佳编码,平均码长最短。o 编码过程:n1. 初始化:将信源符号按频率递减顺序排列,输入L;n2. 重复如下操作直至L中只有1个结点: (a)从L中取得两个具有最低频率的结点,为它们创建一个父结点; (b)将它们的频率
7、和赋给父结点,并将其插入L;(c) 将树的左右孩子赋符号“0”和“1”,并从L中删除。 哈夫曼编码(Huffman Coding)示例o输入: “ALOHA HAWAII”o频率: 4A, 2H, 2I, 1L, 1O, 1 space, 1Wo96 bits (8 bits * 12 characters) to 32 bits:AIHLspaceWO010000011111A=0, I=100, H=101, L=1100, space=1101, etc.例子:Java applet example at http:/www.cs.sfu.ca/CC/365/li/squeeze/ind
8、ex.html331.3 数字媒体标准简介 为什么需要媒体标准?o 数字媒体标准是相关技术与产业之基础!数字媒体标准是相关技术与产业之基础!n技术基础技术基础:采用不同标准的数字媒体,其压缩、编码、传输、内:采用不同标准的数字媒体,其压缩、编码、传输、内容分析与检索等技术有所不同容分析与检索等技术有所不同n产业基础产业基础:五环相扣:五环相扣技术、专利、标准、产业、应用技术、专利、标准、产业、应用o 例子:全球电视竞争的转折点在例子:全球电视竞争的转折点在MPEG-2 (1996) 1991 1986 1972 1984 1988 92 93 94 97 98 96 日本向 ITU-R提 出
9、模 拟HDTV 提案 日 本 提 出MUSE 模拟传输制式 日本模拟HDTV 在汉城奥运会播出 ISO/IEC 成立信源标准组织 MPEG 美国成立高级电视 技 术 委 员 会(ATSC) , 主攻数字电视 欧洲媒体领域成立推进组织ELG,试探模拟高清电视HD-MAC MPEG-1 标准完成,信源编码技术体系形成 欧洲成立数字电视标准组织 DVB。 日本启动数字电视ISDB 计划 MPEG-2 完成, 得到美、欧、日采纳 日本正式放弃模拟 HDTV 中国部署数字电视战略 正 式 参 加MPEG DVB和ATSC完成数字电视信道标准 , 与MEPG-2一起构成数字电视体系 彩色电视 数字电视时代
10、 美国、英国率先开播数字电视。各国相继宣布数字电视时间表 数字媒体领域的主要技术标准o JPEGo MPEG系列:系列: MPEG-2/4/7/21o H.26x系列:系列:H.261/3/4o AVSJPEGo JPEGnJPEG (Joint Photographic Experts Group)标准标准(ISO 10918)是是ISO和和ITU联合提出的通用静态图像压缩国际标准。联合提出的通用静态图像压缩国际标准。o JPEG的重要特性的重要特性n设定压缩参数设定压缩参数n在解码速度和图像在解码速度和图像 质量间均衡质量间均衡n无损压缩无损压缩原始图像重构图像逆向离散余弦变换正向离散余弦
11、变换量化逆量化编码解码压缩图像量化表编码表Quality level: 90 File size: 10,582 bytes Quality level: 50 File size: 5,154 bytes Quality level: 1 File size: 923 bytes JPEG 2000压缩标准oJPEG 2000(ISO 15444)是是JPEG的更新换代标准,针对的更新换代标准,针对Internet应用和无线通应用和无线通信等领域。信等领域。n关键技术关键技术:以离散小波变换:以离散小波变换DWT为主的多解析压缩方式为主的多解析压缩方式n核心算法核心算法:EBCOTn高压缩比
12、高压缩比:比:比JPEG压缩性能提高压缩性能提高30%oJPEG与与JPEG 2000的性能比较的性能比较标准标准JPEGJPEG 2000标题标题连续色调静态图像的数字压缩编码连续色调静态图像的数字压缩编码新一代静态图像编码标准新一代静态图像编码标准日期日期1986.3-1992.101996.2-2000.12压缩比压缩比2-30:12-50:1主要技术主要技术离散余弦变换离散余弦变换DCTZigzag扫描扫描哈夫曼编码哈夫曼编码算术编码算术编码离散小波变换离散小波变换DWTEBCOT核心算法核心算法ROI编码编码空间可扩展编码空间可扩展编码应用场合应用场合Internet数字照相数字照相
13、图像视频编辑图像视频编辑Internet数字照相数字照相打印、扫描、移动通信打印、扫描、移动通信MPEG系列标准oMPEG系列标准由国际标准化组系列标准由国际标准化组织和国际电工委员会第一联合技织和国际电工委员会第一联合技术组术组( ISO/ IEC JTC1) 制定的。制定的。oMPEG视频标准视频标准nMPEG-1:数字电视标准,:数字电视标准,1992年正式年正式发布。发布。nMPEG-2:数字电视标准,:数字电视标准,1994年成为年成为国际标准草案。国际标准草案。nMPEG-3:已于:已于1992年年7月合并到高清月合并到高清晰度电视晰度电视(High-Definition TV,H
14、DTV)工作组。工作组。nMPEG-4:多媒体应用标准:多媒体应用标准(1999年发年发布布)。nMPEG-7:多媒体内容描述接口标准:多媒体内容描述接口标准(2001年发布年发布)。nMPEG-21:有关多媒体框架的标准:有关多媒体框架的标准(正正在研究在研究)。nMPEG-A:多媒体应用格式标准:多媒体应用格式标准(正在正在研究研究)。MPEG-1oMPEG-1标准编号标准编号ISO/IEC11172,标准名称为,标准名称为“用于码率约为用于码率约为1.5Mbps时用于数字存储媒体的动像及伴音的编码时用于数字存储媒体的动像及伴音的编码”。oMPEG-1的基本目标的基本目标 n在音像质量上,
15、达到在音像质量上,达到VHS/VCD的放像质量的放像质量n在存储上,可存储在光盘、数字录音带、硬盘等在存储上,可存储在光盘、数字录音带、硬盘等n在传输码流上,为在传输码流上,为1-1.5Mbps,以,以1.2Mbps为宜为宜n在网络方面,应适应在网络方面,应适应LAN、ISDN等多种网络等多种网络n满足对称和不对称应用满足对称和不对称应用oMPEG-1的基本内容的基本内容 n几种伴音压缩数据和图像数据的复用;几种伴音压缩数据和图像数据的复用;n图像的压缩;图像的压缩;n伴音的压缩。伴音的压缩。oMPEG-1的特点的特点n使用使用MPEG-1的压缩算法的压缩算法, 可将一部可将一部120分钟长的
16、电影压缩到分钟长的电影压缩到1.2GB左右。左右。因此因此, 它被广泛地应用于它被广泛地应用于VCD制作。制作。MPEG-2o MPEG-2是是MPEG-1 的扩展。标准编号的扩展。标准编号ISO/IEC 13818,标准名称为,标准名称为“运运动图像及其伴音信息的通用编码动图像及其伴音信息的通用编码”。主要内容为:。主要内容为:n码率为码率为4-9Mbps,最大,最大15Mbps;n涵盖涵盖MPEG-1全部内容全部内容;n规定数字存储媒体命令和控制扩展协议,用于管理数据流规定数字存储媒体命令和控制扩展协议,用于管理数据流(DSM-CC);n先进的声音编码方案先进的声音编码方案;n规定系统解码
17、器实时接口扩展标准,用来适应网络传输规定系统解码器实时接口扩展标准,用来适应网络传输;nDSM-CC一致性扩展测试一致性扩展测试;n先进声音编码标准修正。先进声音编码标准修正。oMPEG-2的特点的特点n利用网络提供的利用网络提供的3100Mbps的数据传输率,支持具有更高分辨率图象的压缩和更高的的数据传输率,支持具有更高分辨率图象的压缩和更高的图象质量;图象质量;n可支持交迭图象序列(每帧图像由两个场组成),支持可伸缩性编码,多种运动估计可支持交迭图象序列(每帧图像由两个场组成),支持可伸缩性编码,多种运动估计方式,提供一个较广的范围改变压缩比;方式,提供一个较广的范围改变压缩比;n可以适应
18、不同画面质量、存储容量和带宽的要求,为此定义了不同的功能档次可以适应不同画面质量、存储容量和带宽的要求,为此定义了不同的功能档次(profile,框架),每个档次又分为不同的等级(,框架),每个档次又分为不同的等级(level)。)。o和和MPEG-1主要区别主要区别n隔行扫描制式;隔行扫描制式;DCT变换可在帧内,也可在场内。用户可自行选择,亦可自适应选择。变换可在帧内,也可在场内。用户可自行选择,亦可自适应选择。MPEG-4o MPEG-4标准编号标准编号ISO/IEC14496, 标准名称为标准名称为“甚低速率视听编甚低速率视听编码码”n1998年年11月公布第一版,月公布第一版,199
19、9年年12月公布了第二版,共分为月公布了第二版,共分为6个部分。个部分。o 目标是低速率下(目标是低速率下(64kbps)的视频、音频编码,)的视频、音频编码, 更加注重多媒更加注重多媒体系统的交互性和灵活性。体系统的交互性和灵活性。o 引入了视听对象引入了视听对象(Audio-Visual Objects,AVO)nAVO可以是孤立的人,也可是这个人的语音或一段背景音乐等。可以是孤立的人,也可是这个人的语音或一段背景音乐等。nAVO具有高效编码、高效存储、高效传播以及可互操作的特性。具有高效编码、高效存储、高效传播以及可互操作的特性。nMPEG-4对对AVO的操作主要有:采用的操作主要有:采
20、用AVO来表示听觉、视觉或者视听组合内来表示听觉、视觉或者视听组合内容;生成复合的容;生成复合的AVO;对;对AVO的数据灵活地多路合成与同步;对的数据灵活地多路合成与同步;对AVO进行进行交互操作等。交互操作等。o MPEG-4的特点的特点n与与MPEG-1和和2相比,相比,MPEG-4更适于交互视听服务以及远程监控。更适于交互视听服务以及远程监控。n设计目标使它具有更广的适应性和可扩展性。设计目标使它具有更广的适应性和可扩展性。nMPEG-4能以很低的速率基本实现能以很低的速率基本实现DVD的质量;由于属于一种高比率有损压的质量;由于属于一种高比率有损压缩算法,其图像质量始终无法和缩算法,
21、其图像质量始终无法和DVD的的MPEG-2相比。相比。举例:MPEG-4视听场景的说明o由由4个复合媒体对个复合媒体对象(人,背景,象(人,背景,家具,音视演示)家具,音视演示)组成。组成。o系统定义了一个系统定义了一个场景坐标系场景坐标系, 然后然后可以指定组成该可以指定组成该场景的媒体对象场景的媒体对象在该坐标系中的在该坐标系中的位置,并可设定位置,并可设定用户观察该场景用户观察该场景时所在的坐标位时所在的坐标位置,这些位置信置,这些位置信息都会包含在场息都会包含在场景的描述中。景的描述中。MPEG-7oMPEG-7是一种用于信息检索的内容表示的标准。标准编号是一种用于信息检索的内容表示的
22、标准。标准编号ISO/IEC 15938nMPEG-7将建立各种类型多媒体信息的标准的描述方法。这种描述与内容关联在一起,将建立各种类型多媒体信息的标准的描述方法。这种描述与内容关联在一起,支持对用户感兴趣的材料的快速、高效的检索。支持对用户感兴趣的材料的快速、高效的检索。oMPEG-7 的目标是的目标是:n规定规定 a standard set of descriptors 用来描述各种类型的多媒体信息用来描述各种类型的多媒体信息,n对描述符及其相互关系的预定义结构对描述符及其相互关系的预定义结构(称为称为Description Schemes)以及用户定义自己的结以及用户定义自己的结构的方
23、法进行标准化,构的方法进行标准化, n制定一种用于定义新的制定一种用于定义新的description schemes的标准化的语言的标准化的语言 DDL (Description Definition Language), n把描述把描述 (a set of instantiated Description Schemes) 与内容关联在一起与内容关联在一起,以便用户快速有以便用户快速有效地检索感兴趣的材料,效地检索感兴趣的材料,n把描述进行编码表示把描述进行编码表示,以便有效地进行存储和快速访问。以便有效地进行存储和快速访问。Automatic extraction of features
24、(or descriptors)Search engines44 Still region SR1: Creation inform a tion Text annotation Still region SR2: Text annotation Color structure Still region SR3: Text annotation Matching hint Color structure Spatial segment decompos i tion: No overlap, gap Directional spatial segment relation: left Cont
25、ent Structure Agent object AO1: Label Person Agent object AO2: Label Person Event EV1: Label Semantic time Semantic place Concept C1: Label Property Property Comradeship Shake hands Alex Ana Object-event relation: hasAccompanierOf Concept-semantic base rel a tion: hasPropertyOf Content Semantics Obj
26、ect-event relation: hasAgentOf MPEG-7 Description Segment-semantic base relation: hasMediaPerceptionOf Segment-semantic base relation: hasMediaSymbolOf Photographer: Seungyup Place: Columbia University Time: 19 September 1998 704x480 pixels True color RGB http:/www.alex&ana.jpg Columbia University,
27、All rights reserved Creation information: Creation Creator Creation corrdinates Creation location Creation date Media information: Media profile Media format Media instance Usage unformation: Rights Content Management MPEG音频标准oMPEG音频压缩的主要依据是人耳音频压缩的主要依据是人耳朵的听觉特性,利用了朵的听觉特性,利用了“心理声学心理声学模型模型(psychoacous
28、tic model)” 。n心理声学模型的一个基本概念:心理声学模型的一个基本概念:听觉阈值。低于听觉阈值的声音听觉阈值。低于听觉阈值的声音信号听不到,因此就可以把这部信号听不到,因此就可以把这部分信号去掉。分信号去掉。n心理声学模型的另一个概念:听心理声学模型的另一个概念:听觉蔽特性。听觉阈值会随听到觉蔽特性。听觉阈值会随听到的不同频率的声音而发生变化。的不同频率的声音而发生变化。nMPEG音频标准音频标准n MPEG-1 Layer 1:子带无损压缩:子带无损压缩 + 可选的简单掩蔽模型。可选的简单掩蔽模型。nMPEG-1 Layer 2:更高级的掩蔽模型。:更高级的掩蔽模型。nMPEG-
29、1 Layer 3 (即即MP3):增加了对低比特率的处理。:增加了对低比特率的处理。nMPEG-2 AAC (即即MP4):压缩比更大:压缩比更大(15:1-20:1),增加了对立体声的完美再,增加了对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等特性。现、比特流效果音扫描、多媒体控制、降噪等特性。 H.26X系列标准o H. 26X 系列标准由国际电联(系列标准由国际电联(ITU-T)制定的。)制定的。o H. 26X 系列标准系列标准nH.261:针对在窄带:针对在窄带ISDN 上实现速率上实现速率P 64 kbps 的双向声像业的双向声像业务务,其中其中P = 130 。nH.
30、263:针对低比特率视频应用:针对低比特率视频应用nH.264:ITU-T和和ISO/ IEC 的的MPEG 共同成立的联合视频小组共同成立的联合视频小组JVT 提出,目的是为视频编码应用提供下一代的解决方案。提出,目的是为视频编码应用提供下一代的解决方案。Video CodingSystem ControlAudio CodingDataCall ControlMultimedia Multiplex and SynchronizationNetwork InterfaceNetwork AdaptationGeneral protocol stack of H-series audiovi
31、sual communication terminalH.261o H. 261是是ITU - T 于于19841989 年制定的视频编码标准。年制定的视频编码标准。n针对可视电话和视频会议等业务。针对可视电话和视频会议等业务。n目的:在窄带目的:在窄带ISDN 上实现速率上实现速率P 64 kbps 的双向声像业务的双向声像业务,其中其中P = 130 。n只支持两种图像格式只支持两种图像格式:CIF(352 288 像素像素) 和和QCIF(176 144 像素像素) 。o 技术特征技术特征n帧包括帧包括I帧(帧( Intra-frames )和)和P帧(帧( Inter-frames )
32、;);n16 16 微块的运动补偿、微块的运动补偿、8 8 DCT、标量量化、标量量化、Z - Z 扫描、游程编扫描、游程编码和变长编码的编码结构。码和变长编码的编码结构。o H. 261 是视频编码的一个里程碑,对后续标准有较大的影响。是视频编码的一个里程碑,对后续标准有较大的影响。n现有的一系列视频编码标准的编码方法都是基于现有的一系列视频编码标准的编码方法都是基于H. 261 中的混合编码方中的混合编码方法和编码结构。法和编码结构。o H. 261的特点的特点n优点:低复杂度优点:低复杂度n缺点:低压缩比性能、缺乏灵活性缺点:低压缩比性能、缺乏灵活性47H.263o H. 263 标准是
33、标准是ITU - T 于于1996年年制定的视频编码标准。制定的视频编码标准。n针对低比特率针对低比特率(低于(低于64Kb/s)视频应用视频应用;n目标目标:在许多方面上通过视频编码算法和处理性能的提高在许多方面上通过视频编码算法和处理性能的提高,从而比从而比H. 261 较大较大地提高编码性能。地提高编码性能。nH. 263 支持图像的格式有支持图像的格式有: SubQCIF (128 96 像素像素) 、QCIF、CIF、4CIF(704 576 像素像素) 和和16CIF(1408 1152 像素像素) 。o 技术特征技术特征n使用了半像素运动矢量和重新设计的可变长编码使用了半像素运动
34、矢量和重新设计的可变长编码(VLC) 表表;n更多的帧大小和可选的编码模式更多的帧大小和可选的编码模式;n运动向量预测。运动向量预测。o H. 263+: H. 263的修改版本的修改版本n修改量化模式;修改量化模式;n运动向量范围:取决于帧尺寸;运动向量范围:取决于帧尺寸;n修改半像素插值算法修改半像素插值算法n更多的输入视频格式等。更多的输入视频格式等。48H.263H.263+H.263+H.264oH. 264 标准是标准是ITU-T和和ISO/ IEC 的的MPEG 共同成立的联合视频小组共同成立的联合视频小组JVT于于2003年年公布的视频编码标准。公布的视频编码标准。n目标目标:
35、为视频编码应用提供下一代的解决方案为视频编码应用提供下一代的解决方案,提供显著增强的编码效率提供显著增强的编码效率,,同时减少同时减少H. 263 中一些混乱的可选模式。中一些混乱的可选模式。o标准内容分三个档次:标准内容分三个档次:n基本档次基本档次-实现版本的基本功能;实现版本的基本功能;n核心档次核心档次-用于用于HDTV、DVD;n扩展档次扩展档次-用于用于IPTV。o技术特征技术特征n4 4 块的整数变换块的整数变换n多参考帧预测多参考帧预测n多模式高精度帧间预测多模式高精度帧间预测n多种帧内预测模式多种帧内预测模式n统一的熵编码等。统一的熵编码等。oH. 264 的特点的特点n有点
36、:有点:更高的压缩比和更好的信道适应性更高的压缩比和更好的信道适应性;n缺点:缺点:计算复杂度的大大增加。计算复杂度的大大增加。49AVS标准o AVS是我国具有独立自主知识产权的视音频编码标准。是我国具有独立自主知识产权的视音频编码标准。o 标准进展标准进展n2002年,数字音视频编解码技术标准年,数字音视频编解码技术标准(AVS)工作组成立。工作组成立。n2006年年1月月6日,信息产业部批准通过日,信息产业部批准通过AVS视频部分。视频部分。n2006年年2月,月,信息技术信息技术 先进音视频编码先进音视频编码 第二部分:视频第二部分:视频国家标准国家标准GB/T 20090.2-200
37、6发布。发布。n2006年年3月月1日,日, GB/T 20090.2-2006正式实施。正式实施。o 走向国际走向国际n2006年年9月,月,AVS已正式成为国际电联已正式成为国际电联ITU-T的联络组织,意味着的联络组织,意味着AVS标准已具备选入标准已具备选入ITU-T标准体系的资格标准体系的资格,为为AVS的国际化道路打开的国际化道路打开了大门。了大门。n2007年年4月,月,ISO/IEC MPEG在新一代标准框架在新一代标准框架RVC要求支持的第一要求支持的第一个非个非MPEG视频编码标准就是视频编码标准就是AVS。n2007年年5月,月,AVS列入列入ITU-T IPTV FG的
38、内容编码标准文件,成为与的内容编码标准文件,成为与H.264、VC-1 并列的选项。并列的选项。AVS国家标准的构成AVS部分部分国家标准计划号国家标准计划号小组草案小组草案(WD)工作组草工作组草案案(CD)最终草案最终草案(FCD)标准送审标准送审稿(稿(FD)国家标准国家标准(GB)AVS1-P1(系统(系统-广播)广播)20051304-T-3392003.102003.122006.102007.03 AVS1-P2(视频(视频-基准)基准)20032265-T-3392003.102003.122004.42004.8 2006.2AVS1-P2(视频(视频-增强)增强)20032
39、265-T-3392005.92006.32008.6 AVS1-P3(音频双声道)(音频双声道) 20051305-T-3392004.122005.32005.122006.4 AVS1-P3(音频(音频-5.1)20051305-T-3392005.92005.122005.122006.4 AVS1-P3(移动)(移动)20051305-T-3392007.032007.62007.92007.12AVS1-P4(一致性测试)(一致性测试) 20051306-T-3392007.3-P2AVS1-P5(参考软件)(参考软件)20051307-T-3392006.3AVS1-P6(DRM
40、)20051308-T-3392005.32005.122006.122006.03 AVS1-P7(移动视频)(移动视频)20051309-T-3392005.32005.62005.92006.4 AVS1-P8.1(系统(系统-IP)TBD2005.32005.92005.122006.3AVS1-P8.2(系统(系统-IP)TBD2006.12006.32006.3AVS1-P9.1(文件格式)(文件格式) TBD2005.32005.92005.122006.3 AVS1-P9.2(文件格式)(文件格式) TBD2006.12006.32006.32006.3 52AVS视频技术框架
41、熵编码逆量化& 反变换运动补偿控制数据量化变换因子运动数据帧内/帧间编码控制运动估计变换/量化-输入视频信号划分成16x16的宏块帧内预测环路滤波输出视频信号 激激光光视视盘盘播播放放机机 广广播播电电视视直直播播卫卫星星 地地面面广广播播数数字字电电视视 I IP PT TV V宽宽带带网网络络流流媒媒体体 手手机机电电视视与与移移动动广广播播 (高高清清晰晰)数数字字电电视视 媒媒体体运运营营商商 - -电电视视台台 - -音音像像发发行行 - -电电信信运运营营 - -内内容容提提供供商商 - - 用用户户 - -电电视视机机 - -机机顶顶盒盒 - -计计算算机机 - -手手机机 -
42、-数数码码产产品品 信信源源编编码码理理论论 技技术术、算算法法、专专利利 A AV VS S标标准准 编编解解码码芯芯片片与与软软件件 家家电电、P PC C、消消费费电电子子 广广电电/ /电电信信设设备备系系统统 o 信息论的通信摸式 n任何电信通信技术如电话、电报、广播、电视等都遵循着这一模式 数字媒体的传播模式551.4 数字媒体技术应用数字媒体技术的应用o 家庭娱乐n数字影视(有线电视、IPTV、地面数字电视)n数字游戏n数字广播n数字广告o 教育培训o 视频会议o 远程医疗o 移动通信n移动多媒体广播、手机电视、移动电视o 应用示例1:高清视频应用示例2: 手机电视o Intel IMPlayer嵌入式AVS播放器n可在Pocket PC和Smart Phone上运行n支持全屏播放和窗口方式播放。应用示例3:高清地面广播应用示例4:数字动漫o 数字动漫:艺术与科学的完美结合小结o 数字媒体技术及其应用改变了使用计算机的方式o 数字媒体技术使提供信息、培训和娱乐所需要的大容量文本、图形、音频和视频的传输成为可能o 对数字媒体内容的使用必须经过版权法的审查,以维护开发者和使用者的权益。思考题o 数字媒体包括哪几方面的内容,数字媒体传播有什么特点?o 数字技术与数字传播应用有何区别和关系?o 试讨论数字媒体在今后社会中会有什么新的应用。