1、2022-12-41多媒体应用技术基础o 媒体介绍o 什么是多媒体o 多媒体技术应用的发展历史2022-12-42单媒体与多媒体介绍 人类大脑与五官(甚至包括第六感)对大千世界的观察是立体的、联想的、开放的,也可以说是全息的。在技术的限制下,人们只能制造出各种仅能表达形形式式的单媒体来近似表达不完全的信息。随着人类社会的进步,多媒体信息系统将负担起运用多媒体手段来表达完整信息的任务。起发展的过程如下:全 息 单媒体.单媒体多媒体MULTIMEIDIA全 息2022-12-43多媒体技术的基本概念 “多媒体”翻译自英文:“MULTIMEDIA”,意思是“大量的”,字根“media”是拉丁字med
2、ium的复数形式,其基本意是“中间、中心”,后来,逐渐表示“媒体”的意思。从词源我们可以判断出,多媒体意味着“多媒介”或者是“多方法”的媒体。这里所谓的媒体就是承载信息的载体或者说是信息的表达形式。将此概念引用到信息与通信技术领域中,运用多媒介或多方法媒体的新技术称为多媒体信息技术,由此形成的系统称为多媒体信息系统。2022-12-44多媒体应用技术的发展历史 我们可以通过下面的发展图来了解多媒体的发展过程 P1 P3 P2通信大众传播计算多媒体信息系统与网络2022-12-45多媒体信息的演变o 媒体的演变过程如下图文声像音视频数 据信 息知识2022-12-46媒体的种类与性质o 媒体主要
3、包括以下一些成员:视觉部分,首先是静止的图像、图形、符号、文字;动态部分是视频、真实感三维动画,二维动画。听觉部分,声响(自然界)、语音、音乐。触觉部分,压力、运动、传感/发生器。其它媒体还有包括嗅觉等。2022-12-47数制与数制转换o 数制是进位计数制度的简称n 最早采用的是“逢十进一”;n 钟表采用的是“逢六十进一”n 十二英寸为一英尺采用的是十二进制o 每一种数制的应用决不是偶然的,它要适应人们的习惯和便于使用。2022-12-48数制的表示方法o 十进制o 二进制o 任意进制2022-12-49数制转换o 二进制转化为十进制o 十进制转化为二进制2022-12-410信息量的计算方
4、法o 什么是信息量o 信源、信道、信素o 计算方法2022-12-411信息量的概念 所谓信息量就是信息所携带的不确定度的减少量。人们所的到的信息就是不肯定程度减小的量,或者说是两次不定性之差。所谓不肯定程度和不定性就是指人们对客观事物不了解不清楚时所表现出的那种无知、少知的茫然状态;当人们通过某种方法某种渠道,了解和掌握了客观事物的有关情况之后,那么,这种无知、少知的茫然状态就会得到不同程度的改变,以至消除。(申农)2022-12-412信源、信道、信宿o 消息的来源称之为信源o 消息传播的渠道称之为信道o 消息的接受方称之为信宿2022-12-413信息量的计算方法 如果信源能够产生X1、
5、X2Xr等r个符号且每个符号出现的概率分别为P(X1)、P(X2)P(Xr),则每个符号的信息量为其出现的概率取以2为底的负对数。以每个符号出现的概论进行加权平均,可以得到其平均信息量。2022-12-414符号数据的表示方式ASCIIo 美国标准信息交换码,采用7位进行编码,可以表示09、az、AZ以及标点和运算符号。o ASCII码的校验:补位法2022-12-415文字与数据o 文字称之为“正文”(Text),用二进制编码表示o 西文 用ASCII,是由7个二进制位组成的字符编码系统,包括:大小写字母,标点符号,阿拉伯数字,数学符号,控制符号等共128个字符。o 汉字 n GB23128
6、0标准,1980年制定,用2*7个二进制位表示一个汉字,共有6763个汉字和850个符号。nISO10646标准,中、日、韩均可,已批准为国际标准,16位编码,2万多汉字。o 数据 数据库的结构化数据,表格2022-12-416音频o 音频(Audio)在15Hz20KHz频率范围内。o 声源:麦克风、磁带录音、无线电与电视、CDo 音频信号的数字化处理n 采样Sampling即将模拟信号变换成数字化信号。以下以正弦波为例,根据采样原理,采样频率高于或等于信号最高效频的2倍。2022-12-417音频信号的采样原始波形采样数据采样频率重建波形2022-12-418音频文件的大小及其计算o量化是
7、将采样值整数化,用二进制表示,如用8位即有256个量化级。o数字录音文件大小的计算公式:S=FT(r/8)C其中:S为文件大小,以字节来计算 F为采样频率,以Hz来计 T为录音时间,以秒来记 r为分辨率,二进制位数计,如8位,16位 C为声道数2022-12-419MIDI(Musical Instrument Digital Interface)o 乐器数字接口,它提供详细描述乐谱的协议如音符、音调、乐器等,它实际上是用来记录音乐过程的一串符号命令。通过合成器来播放,因此:计算机合成器作曲软件音乐2022-12-420图形 计算机图形(computer graphic)是用计算机产生、储存、
8、处理物体的物理模型和它们的画面。计算机图形学数据结构图形算法语言2022-12-421图像o 从名称来看,图像是用于描绘或用于摄影等方法得到的外在景物的相似物;像是直接或间接(如拍照)得到的人或物的视觉印象,一般讲,能为人类视觉系统所感觉的信息形式或人们心目中的有形想象。o 从技术角度来看,图像在计算机上以位图(bitmap)表示,实际上是自然的二维光场分布经过空间和亮度的散化,将它考虑为一个矩阵,矩阵中的任一元素,对应于图像中的一点,称为pixel(像元或像素),而这个点相应的值反映它的灰度(或颜色)等级,这是数字化后的结果。2022-12-422图形与图像的关系o 图像是位图,以像素pix
9、els为基础,图像更逼真,而图形更抽象。o 显示过程 图形图元顺序、链码、与图元数据有关;图像扫描,从左自右、从上到下o 图形变换无失真,如发大无失真;图象变换会失真,如放大会产生阶梯效应o 图形能以图元为单位进行属性修改、编辑等操作,而图像只能对像素或分块进行处理2022-12-423图形、图像与识别的关系如图:图像 抽象 文字 符号 图形真实感描述图像分析与模式识别图像处理2022-12-424动画o基本概念n 动画(Animation)是运动的图画n 帧动画(Frame animation):由一幅幅连续的画面组成的图像或图形序列(每秒25幅)n造型动画(Cast-based anima
10、tion),对每个活动的对象分别进行设计,赋予每个对象不同特征(如形状大、小与颜色等),然后用这些对象组成完整的画面。o二维动画:画面仅是二维的透视效果,并无独立的空间造型。n制作过程:关键帧+插值n特点:色彩鲜艳,清晰度高,容易掌握与使用,如:Animator Pro.等o三维动画:用三维框架(三视图)来创造出空间形象n设计过程:建模 动作设计材质选取光源设定摄像机设定着色生成录演播n特点:立体感强,动态效果逼真,如3DMax,Maya等2022-12-425数字视频o 数字视频是一系列相关图像,其特点是:n 速度高,每帧1/25秒,每点越31nsn 容量大,B=h.w.q.c.f.s(垂直
11、、水平、量化、波段、频率、专门算法)2022-12-426多媒体压缩技术o 为什么要对多媒体文件进行压缩o 压缩的主要方法o 举例:哈夫曼编码(Huffman Codes);游程码(RLE)2022-12-427文件压缩的目的o 无损压缩:仙农把数据看作是信息和冗余度的组合。压缩的主要目的就是减小或者消除压缩的主要目的就是减小或者消除数据中的冗余度数据中的冗余度。它是一个可逆过程。o 有损压缩:利用人类视觉听觉上的特性,在不影响人们接受信息的前提下,来减小数据的信息量,从而达到减少数据量减少数据量的目的。它是不可逆的过程。2022-12-428压缩的主要方法介绍o 音频的压缩方法:n 无损压缩
12、:HUFFMAN;RLCn 有损压缩:PCM;DPCM;ADPCM;LPC(AC-3)o 视频的压缩方法:n 无损压缩:HUFFMAN;RLE;LZWn 有损压缩:DCT;JPEG;MPEG;H.2612022-12-429HUFFMAN编码介绍o 哈夫曼编码是使用事件频度或者事件概率作为压缩码基,如果P(x)是概率,X随输入流而产生,若P(x)大时赋较短的码,P(x)小时赋较长的码。一个相对简单的算法如下:nA,令OP是事件概率的集合nB,令Pi与Pj在OP内是最小的两个概率(PiPj)o B1,产生一个分支节点Nij作为对Pi与Pj的双亲o B2,标出分支Nij Pi为0,Nij Pj为1
13、o B3,令P(Nij)PiPj;从OP中删除Pi和Pj并置P(Nij)于OPnC,如果OP中包含一个P,停止,否则goto b2022-12-430HAFFMAN编码举例oIntensity X Occurrence probability P(x)I1=01101110 0.35 I2=10011000 0.25 I3=01010100 0.20 I4=11100011 0.12 I5=00001000 0.05 I6=11001011 0.0335125060120140012120 051 8 030root2022-12-431HAFFMAN编码举例o 例如一条扫描线I4 I1 I1
14、 I2 I1 I2 I611100011 01101110 01101110 10011000 01101110 1001110 11001011进行编码以后相应的码流变成为:001 11 11 10 11 10 0000 这里从7个字节变成为两个多一点字节,从而实现了数据的压缩。2022-12-432RunLength Encoding(Suppression of repeating Characters)o REL(游程码)将一串迭代字符(重复符号)表示为该字符上所迭代的次数。o 适用于重复字符较多的数据,如果重复字符很少则可能会导致文件数据量的增加。2022-12-433REL编码举例o 例一:11111100000003333编码结果为:617043这里减少了11个字符o 例二:000023300034422000001111211000编码结果为:401223301324225041122130以上两例子为有利压缩o 例三:1020304050607080编码结果为:11101210131014101510161017101810例三则为不利压缩的代表 2022-12-434计算机组成结构CPU输出设备存储器输入设备表示媒体存储媒体展现媒体展现媒体感觉媒体感觉媒体表示媒体传输媒体