1、1 1第9章 网络多媒体应用系统9.1 概述概述9.2 多媒体视频会议系统多媒体视频会议系统9.3 IPTV系统系统9.4 多媒体远程监控系统多媒体远程监控系统9.5 虚拟现实系统虚拟现实系统9.6 网络多媒体技术的发展趋势网络多媒体技术的发展趋势9.7 本章小结本章小结思考练习题思考练习题2 2网络多媒体应用种类繁多,涉及很多领域,如通信、计算机、有线电视、安全、教育、娱乐和出版业等。随着用户需求的不断增长,网络多媒体技术的应用也会有新的发展。常见的网络多媒体应用系统有视频会议系统、IP电话系统、视频点播(VOD)系统、远程监控系统、远程教育系统、远程医疗系统和网络电视系统、虚拟现实等。本章
2、介绍其中主要的网络多媒体应用系统。3 3多媒体技术正在许多领域影响着人们的工作和生活。多媒体通信业务的种类很多,并且随着新技术的不断出现和用户对多媒体业务需求的不断增长,新型多媒体通信业务也会不断出现。今后,越来越多的宽带业务将全部是多媒体业务。根据ITU-T的定义,多媒体业务共分为六种:9.1 概概 述述4 4多媒体会议型业务:具有多点、双向通信的特点,如多媒体会议系统等。多媒体会话型业务:具有点到点通信、双向信息交换的特点,如可视电话、数据交换业务。多媒体分配型业务:具有点对多点通信、单向信息传输的特点,如广播式视听会议系统。多媒体检索型业务:具有点对点通信、单向信息传输的特点,如多媒体图
3、书馆和多媒体数据库等。多媒体消息型业务:具有点到点通信、单向信息传输的特点,如多媒体文件传送。5 5多媒体采集型业务:具有多点到一点、单向信息传输的特点,如远程监控系统等。以上多媒体业务的特点有些很相似,可以进一步将其归为以下四种类型。人与人之间进行的多媒体通信业务:会议型业务和会话型业务都属于此类。会议型业务是在多个地点上的人与人之间的通信,而会话型业务则是在两个人之间的通信。另外,从通信质量来看,会议型业务的质量要高些。人机之间的多媒体通信业务:多媒体分配型业务和多媒体检索型业务都属于此类。多媒体检索型业务是一个人对一台机器的点对点的交互式业务;而多媒体分配型业务是一人或多人对一台机器、一
4、点对多点的人机交互业务。6 6多媒体采集型业务:是一种多点向一点的信息汇集业务,一般是在机器和机器之间或人和机器之间进行的。多媒体消息型业务:属于存储转发型多媒体通信业务。此类多媒体信息的通信不是实时的,需要先将发送的消息进行存储,待接收端需要时再接收相关信息。在实际工作中,上述这些业务并不都以孤立的形式运行,而以交互的形式运行。从推动网络多媒体系统发展的技术因素来看,与多媒体通信相关的技术有视/音频压缩技术、网络技术、媒体同步技术、存储技术等。7 7实用的网络多媒体系统有多媒体视频会议系统、多媒体合作应用、远程学习系统、远程医疗系统、多媒体监控系统、电子交易、多媒体检索系统、多媒体邮件系统和
5、视频点播等。经过多年的发展,这些应用系统已在人们的生活和工作中发挥着重要的作用。8 89.2.1 视频会议系统概述视频会议系统概述视频会议又称会议电视或视讯会议,实际上是一种多媒体通信系统,是21世纪多媒体通信领域中一个非常热门的话题。视频会议技术融计算机技术、通信网络技术、微电子技术等于一体,它要求将各种媒体信息数字化,利用各种网络进行实时传输并能与用户进行友好的信息交流。9.2 多媒体视频会议系统多媒体视频会议系统9 9随着现代社会生活节奏和工作效率的加快,传统的通信手段已经远远不能满足用户的要求。视频会议正是在这种巨大的市场驱动下应运而生的新一代通信系统。视频会议是一种以视觉为主的通信业
6、务,它的基本特征是可以在两个或多个地区的用户之间实现双向全双工音频、视频的实时通信,并可附加静止图像等信号传输。它能够将远距离的多个会议室连接起来,使各方与会人员如同在面对面进行通信,使与会人员具有真实感和亲切感。要开好视频会议,要求系统具备以下条件:10 10高质量的音频信息。高质量的实时视频编/解码图像。友好的人机交互界面。多种网络接口(ISDN、DDN、PSTN、Internet、卫星等接口)。明亮、庄重、优雅的会议室布局和设计。在视频会议发展初期,网络环境相对简单,基本上是专线2 MB/s速率,各公司单纯追求一流的编/解码技术,各自拥有专利算法(至今,视频会议供应商还是或多或少地保留了
7、一些自己的专用算法),产品间无法互通,技术垄断,设备价格昂贵,视频会议市场受到很大限制。11 11随着各种技术的不断发展和一系列国际标准的出台,打破了视频会议技术及其设备由少数大公司一统天下的垄断局面,逐渐发展成为由国外如VTEL、Picture-Tel、VCON公司和国内中兴、华为等大企业共同分享视频会议市场的竞争局面。现在,高速IP网络及Internet的迅猛发展,各种数字数据网、分组交换网、ISDN以及ATM的逐步建设和投入使用,使视频会议的应用与发展进入了一个新的时期。12 12在我国,视频会议系统具有十分广阔的应用前景,因为它可以减轻交通压力,减少经费开支。我国视频会议系统的应用有两
8、种形式:一种是以预约方式租用电信运营商经营的公用视频会议系统,此系统覆盖主要城市,会议需要在专用的会场中进行;另一种是组建专用系统,目前海关、公安、铁路、银行、石油、教育等部门多采用这种方式。根据所完成的功能的不同,视频会议的方式可以有很多种。按照参与会议的节点数目,视频会议可以分为点对点会议系统和多点会议系统。按照所运行通信网络的不同,视频会议可以分为数字数据网(如DDN)、局域网(LAN)/广域网(WAN)和公共电话网(PSTN)三种会议系统。13 13在数字数据网(DDN)方式中,信息的传输速率是3842048 kb/s,提供帧频为2530 f/s的CIF或QCIF格式的视频图像。在局域
9、网和广域网环境中,信息的传输速率低于384 kb/s,帧频为1520 f/s。在公共电话网中,信息的传输速率只有28.8 kb/s或33.6 kb/s,帧频也只能达到510f/s。按照所使用的主要设备,视频会议分为电视会议和计算机会议系统。按使用的信息流,视频会议可分为音频图形会议、视频会议、数据会议、多媒体会议和虚拟会议。14 14由于视频会议的会议内容常具有保密特征,因此其安全性就很重要。现有的很多视频会议系统都属于专用系统,许多行业部门也都使用自己的专用系统。而基于互联网的桌面会议系统具有开放性的特征,但安全性无法保证。在一定时期内,这两种系统会并存。15 159.2.2 视频会议系统的
10、关键技术视频会议系统的关键技术视频会议技术实际上不是一个完全崭新的技术,也不是一个界限十分明确的技术领域,而是随着现有通信技术、计算机技术、芯片技术、信息处理技术的发展而发展起来的。如果没有这些技术的发展,多媒体通信、视频会议、可视电话等都只能停留在理论研究上,更谈不上视频会议实用系统。视频会议系统的关键技术可以概括为以下几个方面。16 161.多媒体信息处理技术多媒体信息处理技术多媒体信息处理技术是视频会议十分关键的技术,主要是针对各种媒体信息进行压缩和处理。可以这样说,视频会议的发展过程也反映出信息处理技术特别是视频压缩技术的发展历程。目前,编/解码算法从早期的、经典的熵编码、变换编码、混
11、合编码等发展到新一代的模型基编码、分形编码、神经网络编码等。另外,还不断地将图形图像识别、理解技术、计算机视觉等内容引入到压缩编码算法中。这些新的理论、算法不断推动着多媒体信息处理技术的发展,进而推动着视频会议技术的发展。特别是在网络带宽不富余的条件下,多媒体信息压缩技术已成为视频会议最关键的问题之一。17 172.宽带网络技术宽带网络技术影响视频会议发展的另外一个非常重要的因素就是网络带宽问题。多媒体信息的特点就是数据量大,即使通过上述压缩技术,要想获得高质量的视频图像,仍然需要较宽的带宽。如384 kb/s的ISDN提供会议中的头肩图像是可以接受的,但不足以提供电视质量的视频。要达到广播级
12、的视频传输质量,带宽至少应该在1.5 MB/s以上。作为一种新的通信网络,B-ISDN网的ATM带宽非常适合于多媒体数据的传输,它可以把不同种类的多种业务集中起来,在同一网络上既能传输VBR数据,又能传输CBR视频。过去,ATM由于成熟度不足且交换设备价格昂贵而难以推广应用。18 18经过这些年的大量工作,ITU-T和ATM论坛已经完善了许多标准,各大通信公司生产、安装了大量的ATM设备,同时,ATM接入网也逐步扩充,越来越多的应用已经可以在2 MB/s的速率上运行。另外,还要解决目前通信中的接入问题,它一直是多媒体信息到用户端的“瓶颈”。全光网、无源光网络(PON)、光纤到户(FTTH)被公
13、认为理想的接入网。但目前就全世界来说,接入网仍处于一个“过渡”时期,即使在日本,要实现FTTH的目标,也要到2010年之后。因此,目前的xDSL技术、混合光纤同轴(HFC)、交互式数字视频系统(SDV)仍然是当前高速多媒体接入网络的发展方向。19 19正在迅速发展的IP网络,由于它是面向非连接的网络,因而对实时传输的多媒体信息而言是不适合的,但TCP/IP对多媒体数据的传输并没有根本性的限制。目前世界各个主要的标准化组织、产业联盟、各大公司都在对IP网络上的传输协议(如RTP/RTCP、RSVP、IPv6等)进行改进,并已初步取得成效,为在IP网上大力发展诸如视频会议之类的多媒体业务打下了良好
14、的基础。据预测,在不远的将来,IP网上的视频会议业务将会大大超过电路交换网上的视频会议业务。20203.分布式处理技术分布式处理技术电视会议不单是点对点通信,更主要的是一点对多点、多点对多点的实时同步通信。视频会议系统要求不同媒体、不同位置的终端的收发同步协调,多点控制设备(MCU)有效地统一控制,使与会终端共享数据、工作对象、工作结果、数据资料,有效协调各种媒体的同步,使系统更接近我们人类的信息交流和处理方式。实际上通信、合作、协调正是分布式处理的要求,也是交互式多媒体协同工作系统(CSCW)的基本内涵。从这个意义上说,视频会议系统是CSCW主要的群件系统之一。21 214.芯片技术芯片技术
15、视频会议系统对终端设备的要求较高。要求接收来自于摄像机的视频输入、麦克风的音频输入、共享白板的数据输入以及来自于网络的信息流数据,同时进行视频编/解码、音频编/解码、数据处理等,并将各种媒体信息复用成信息流之后传输到其他终端。在此过程中要求能与用户进行友好的交流,实行同步控制。目前,视频会议终端有基于PC机的软件编/解码解决方案、基于媒体处理器的解决方案和基于专用芯片组(ASIC)的解决方案。不管采用何种方案,高性能的芯片是实现这些视频会议方案所必需的基础。22229.2.3 视频会议系统的组成视频会议系统的组成视频会议是两地或多地间的双向通信,它不仅传送语音、数据,而且还传送实时的活动图像。
16、但由于活动图像是连续的数据流,多个信道间不能直接连接(否则来自不同地方的图像将重叠在一起,无法分辨),因此一个完整的视频会议网不仅要有视频会议系统、传输网络,而且应设置多点控制设备(MCU),以进行图像的切换、语音的混合切换及数据的分流。电视会议系统由网络、终端设备、多点控制单元三部分组成。23231.网络网络传输网络是视频会议信息传输的通道,目前视频会议业务可以在多种通信网络中展开,例如SDH数字通信网、ISDN、LAN、Internet、ATM、DDN、PSTN等,其传输介质可以采用光缆、电缆、微波以及卫星等数字信道,或者其他类型的传输通道。在用户接入网范围内,可以使用HDSL、ADSL、
17、HFC网络等设备进行传输。24242.终端设备终端设备终端设备指用户在召开视频会议时所用的终端设施的总称,有关终端所涉及的相关技术我们在第6章中已经介绍,这里只简单介绍终端设备的外围设备。2525(1)视频、音频的输入输出设备。视频输入设备包括摄像机及录像机。摄像机主要分为主摄像机、辅助摄像机和图文摄像机。它们将视频信号通过视频输入口送入编码器内进行处理,通常视频输入口不少于4个。参加会议人员通过控制器来控制主摄像机的上下、左右转动以及焦距的调节,也可以控制对方会场的主摄像机的转动。主摄像机主要用来摄取发言人的特写镜头。辅助摄像机主要用来摄取会场全景图像或不同角度的部分场面镜头,或摄取白板上的
18、内容。辅助摄像机由人工操作。图文摄像机一般固定在某一位置,用来摄取文件、图表等,其焦距已事先调好。录像机可播放事先已录制好的活动和静止图像。视频输入设备的信号都经终端设备的视频输入口,将视频信号送入编码器内进行处理。2626视频输出设备主要包括监视器、投影机、电视墙、分画面视频处理器。监视器用于显示接收的图像;会场人数较多时,可采用投影机或电视墙。为了在监视器上既显示接收的图像,同时又显示本会场的画面,一般采用画中画的方式,即在监视器屏幕上的某个角落留出一个小窗口,用于显示本会场的画面,而在屏幕上的其余部分显示接收的图像。音频输入、输出设备主要包括麦克风、扬声器、调音设备和回声抑制器。麦克风和
19、扬声器主要用于参加会议人员的发言和收听对端会场的发言。调音设备为辅助设备,用于调节本会场麦克风的音色及音量。回声抑制器起抑制回声的作用。2727(2)信息通信设备。信息通信设备包括白板、书写电话、传真机等。白板供本会场与会人员与对方会场人员讨论问题时写字、画图用,其上内容通过辅助摄像机的摄取而输入编码器,传送到对端,在对方会场的监视器上显示。书写电话为书本大小的电子写字板,供与会人员将要说的话写在此板上,变换成电信号输入到视频编/解码器,再传送到对方会场,并显示在监视器上。28283.多点控制单元多点控制单元视频会议业务是一种多点之间的双向通信业务,限于目前的网络,多点间视频会议信号的切换必须
20、用专用的设备多点控制单元(MCU)来完成。MCU是整个会议电视网的控制中心。MCU在一个会议电视网中可以有多个,但并不是无限增加的,也不是任意连接的,应根据相应的国际标准和传输控制协议设置。MCU和终端的连接网结构呈星形,通常MCU放置在星形网络的中心处,即参加会议的各个终端都以双向通信的方式和MCU相连接。由于MCU端口数是有一定限制的,因此,在遇到会议点特别多的情况时,可以级联多个MCU来使用,但同一级的级联一般不多于两级。2929处在上面一层的MCU是上层MCU,处在下面一层的MCU为从MCU,从MCU受控于上层MCU。MCU是一个数字处理单元,通常设置在网络节点(汇接局)处,可供多个地
21、点的会议同时进行相互间的通信。MCU应在数字域中实现音频、视频、数据信令等数字信号的混合和切换,但不得影响音频、视频等信号的质量。MCU主要由线路单元、音频处理单元、视频处理单元、控制处理单元等模块组成。线路单元由网络接口单元、呼叫控制单元、多路复用和解复用单元组成,完成输入/输出码流的波形转换、输入码流的时钟同步、复合码流的分解及复接。3030控制处理单元完成信息流进出MCU的控制,控制信息的提取和处理,控制各模块内部的操作,并协调各模块之间的动作。音频处理单元提取与会各点的声音并进行混合,然后经编码与其他信息合起来发往各对应点;同时,提取与语音码相连的控制信息码送给控制层,完成相应的处理。
22、该模块也可以与控制层一起根据声音电平的高低实现图像的自动切换。视频处理单元提取各点传来的图像信息,根据MCU图像切换和选择准则的规定,完成视频图像的交换和发送,并进行相应处理后与其他信息合起来发往各对应点。该模块提供用户之间数据信息的交换。31 319.2.4 相关协议相关协议1.系统协议系统协议与视频会议技术有关的协议标准为视频会议、多媒体通信的实现提供了十分灵活的组网方式,使厂商把发展的重点放在提高产品质量和服务质量上来,规范了多媒体通信产业的发展。视频会议(Video Conference)业务在中国已经发展多年,主要是应用H.320协议的视频会议系统;而近年来伴随着IP技术的不断成熟和
23、电信级运营,基于H.323协议的视频会议系统也开始逐步得到了应用。32321)H.320协议H.320是基于P64K数字传输网络的视频会议系统协议,采用H.221帧结构,典型应用网络为N-ISDN网、数字传输网和数字数据网。H.320视频会议系统包括视频会议终端、多点控制单元(MCU)和会议网管等设备。会议网管为可选部分,这里不作讨论。多点控制单元(MCU)将在后面与H.323系统的MCU对比介绍,这里只介绍终端部分。H.320终端的功能框图如图9-1所示。视频编/解码单元完成图像的编/解码、视频切换及前处理过程,用H.261或H.263建议来规范。不同制式的视频信号通过转化为中间格式,实现了
24、互通。3333图9-1 H.320终端的功能框图3434音频编/解码单元完成音频的编/解码、回声抵消和噪声去除工作,用G.711,G.722或G.728建议来规范。相对视频信号来说,音频信号数据量小,处理时间短。延时单元可保证视/音频信号同时到达对端,实现唇音同步。数据业务设备主要包括电子白板、书写电话以及传真机等,可以用来召开数据会议,数据会议单元使用T.120的协议。系统控制部分执行两种功能:通过端到网络接口信令访问网络,通过端到端信令实现端到端控制。3535多信道复用/解复用单元在发送方向上主要对视频、音频、数据和信令等各种数字信号进行ITU-TH.221帧码流的复用处理,使之成为能与用
25、户/网络接口兼容的信号格式,在接收端则进行相反的解复用处理,使从网络接口来的信号解复用到相应的媒体处理单元。用户/网络接口单元将复用后的数据流转换成可以在各种传输网络上传递的码流,并送到网络中传递。36362)H.323协议H.323是基于分组网络的视频会议系统协议,目前主要适用于IP网络。符合H.323建议的多媒体视频会议系统由终端、网守(GK)、网关(GW)、多点控制单元(MCU)四个部分组成。(1)H.323终端。H.323终端的功能框图如图9-2所示。网络接口由H.225建议描述,主要用于呼叫控制,并规定了如何利用RTP对视/音频信号和RAS进行封装。3737图9-2 H.323终端功
26、能框图3838视频编/解码采用H.261或H.263标准,音频编/解码采用G.711、G.722、G.728等标准;数据功能通过H.245建立一条或数条单向/双向逻辑信道来实现;控制功能通过交换H.245消息来实现。H.323会议终端除了H.320系统的四种信号外,还有两类信息,就是RSA信号和呼叫信号。RSA是终端与看门人之间为了登记(Registration),管理(Admission),改变状态(status)、带宽及关系等过程所需要的信令;呼叫信号用于在H.323系统的两个末端设备(Endpoints)之间建立呼叫连接。3939(2)网守(GK)。与电路交换网络上的会议系统不同,H.3
27、23是针对分组交换质量不保证的网络的,所以有时需要用到网守(或称为网闸)。在H.323会议系统中,网守是一个可选的角色,可以有一个或多个网守,也可以没有网守。网守之间还可以进行相互通信。网守向H.323终端设备提供呼叫控制服务。从逻辑上讲,网守是一个独立的设备(功能模块),但实际上,网守可以与终端、MCU、网关等存在于一个设备上,只在功能上独立。4040网守的职责如下:地址翻译。将别名地址翻译成运输层地址。入会场许可的控制与管理。根据一些准则,来确定终端用户是否有权进入会场。如有权则进行入会场处理,如无权则拒绝其进入会场。带宽控制与管理。根据网络上带宽资源的使用情况对终端用户的带宽使用进行控制
28、和管理。呼叫管理。网守对终端用户的呼入作处理,并可进行呼出或呼叫转移。域管理。41 41(3)网关(GW)。在视频会议系统中,网关是跨接在两个不同网络之间的设备,其作用是把位于两个不同网络上的视频会议终端连接起来。网关主要有三大功能:一是转换通信格式,如H.323系统和H.320系统之间通过网关实现H.225和H.221不同码流之间的互译,以完成链路层的连接;二是视频、音频和数据信息编码格式之间的互译,以完成表示层之间的相互通信;三是通信协议和通信规程(如H.245与H.242)之间的互译,以实现应用层的通信。4242在实际的H.323视频会议系统中,有两种情况将用到网关:一种情况是一组会议的
29、多个与会者在不同的网络中(如有的与会者在IP网络中,有的与会者在E1网络中);另一种情况是两组会议的多个与会者在IP网的不同的网段上,需要通过网关绕过一些路由器或某些低速传输通道。4343(4)MCU。多点控制单元(MCU)由多点控制器(MC)和多点处理器(MP)组成。H.320与H.323视频会议系统的多点控制单元有所不同。H.320系统的多点会议的控制、管理和处理都是集中的,MC和MP一般不可分,通常在会议网中作为MCU设备存在。H.320会议系统采用电路交换模式,会议网为星形拓扑结构。H.323会议系统基于分组交换模式,从会议电路的组织来看,不存在星形拓扑结构,而往往以网状或者树状拓扑结
30、构形式存在。因而H.323会议的多点会议控制、管理和处理可以进行集中处理,也可以进行分散处理。同样,MC和MP可以合在一起作为一个设备存在,也可以作为一个功能块放在其他设备(如终端、网关等)中。44442.视频编视频编/解码协议解码协议视频会议系统的视频编/解码主要使用H.261和H.263两种协议。1)H.261建议图像压缩方法一般包括预测压缩编码、变换压缩编码、非等步长量化和变长编码等。H.261建议采用了运动补偿预测和离散余弦变换相结合的混合编码方案,具有很好的图像压缩效果。该建议于1990年正式通过,是其他图像压缩标准的核心和基础。它解决了以下三个问题:4545(1)确立了各国图像编码
31、专家所公认的统一算法。(2)设定了CIF和QCIF格式,解决了因电视制式不同而带来的互通问题。(3)不涉及PCM标准问题,其编码器以641920 kb/s的工作速率覆盖了N-ISDN和PCM一次群通道,解决了PCM标准互换的问题。46462)H.263建议H.263建议在1995年公布,1996年正式通过。与H.261相比,H.263获得了更大的压缩比,最低码流速率可达20 kb/s,是一个适用于低码率窄带通信信道的视频编/解码建议。47473.音频编音频编/解码协议解码协议语音的压缩方法主要包括波形编码、参数编码和混合编码。其中,波形编码可以获得较好的语音质量,能够真实地再现说话人的原音,还
32、原话音特征;参数编码压缩率较高,码率通常低于4.8 kb/s,但是声音质量很差,无法分辨出说话人的声音特征;混合编码结合了波形编码的高质量和参数编码的高压缩率,取得了较好的效果。视频会议系统的音频编/解码主要使用G.711、G.722和G.728三种协议。4848G.711和G.722采用波形编码方式。G.711为波形压缩法的对数压扩(A律或律)PCM编码,采样范围为503500 Hz,压缩后的码率为64 kb/s或48 kb/s。G.722为子带分割的ADPCM语音编码,采样范围为507000 Hz,压缩后的码率为48 kb/s、56 kb/s或64 kb/s。G.728采用混合编码方式,为
33、低延时码激励线性预测(LD-CELP)编码,音频信号带宽为50 Hz3.5 kHz,编码语音输出信号速率为16 kb/s。所以,G.728更适合应用于低码率视频会议系统中。49494.其他协议其他协议H.221:视听电信业务中641920 kb/s信道的帧结构。T.120:多媒体会议的数据协议。H.224:利用H.221建议的低速数据(LSD)/高速数据(HSD)/多层链路协议(MLP)信道单工应用的实时控制协议。H.245:多媒体通信的控制协议。H.242:关于使用2 MB/s以下数字信道在视听终端间建立通信系统的协议,实际上为端到端之间的通信协议。H.243:利用高于1920 kb/s信道
34、在3个以上的视听终端建立通信的规程,实际上为多个终端与MCU之间的通信协议。5050H.230:视听系统的帧同步及控制和指示信号C&I。H.225.0:基于分组交换的多媒体通信中的呼叫信令协议和媒体数据流分组协议。T.123:多媒体会议的网络专用协议栈。G.723.1:音频编/解码协议,是5.3 kb/s和6.3 kb/s多媒体通信传输速率上的双速语音编码。Q.922:ISDN帧模式承载业务使用的数据链路层规范。G.703:脉冲编码调制通信系统工程网络的数字接口参数。IEEE802.3U:10/100Base-T以太网接口标准。51 519.2.5 视频会议的发展趋势视频会议的发展趋势视频会议
35、作为交互式多媒体通信的先驱,已经有20多年的历史,顺应三网合一的发展趋势,势必要进入一个新的发展阶段。主要原因是:第一,交互式多媒体通信所依附的传输网络基础,由电路交换式的ISDN和专线网络向分组交换式的IP网络过渡;第二,其针对的市场目标将由大型公司、政府机构的会议室向小型化的工作组会议室、个人化的桌面延伸,最终发展到家庭;第三,功能已由原先单纯的视频会议功能发展成远程教学系统、远程监控系统、远程医疗系统等多方面的综合业务。5252尽管在此转型期间视频会议发展的势头强劲,但就目前这一阶段而言,视频会议的发展仍不会以一种形式取代另一种形式,而是同时存在着多种解决方案。值得注意的是,现在很多新的
36、技术已经深入并逐渐应用到视频会议中,视频会议出现了一些新的发展趋势。53531.基于软交换思想的媒体与信令分离技术基于软交换思想的媒体与信令分离技术在传统的交换网络中,数据信息与控制信令一起传送,由交换机集中处理。而在下一代通信网络中的核心构件却是软交换(Softswitch),其重要思想是采用数据信息与信令分离的架构,信令由软交换集中处理,数据信息则由分布于各地的媒体网关(MG)处理。相应地,传统的MCU也被分离成完成信令处理的MC和进行信息处理的MP两部分,MC可以采用H.248协议远程控制MP。MC处于网络中心,MP则根据各地的带宽、业务流量分布等信息合理地分配信息数据的流向,从而实现“
37、无人值守”的视频会议系统,还可以减少会议系统的维护成本和维护复杂度。54542.分布式组网技术分布式组网技术这个技术是与信令媒体分离技术相关的。在典型的多级视频会议系统中,目前最常见的是采用MCU进行级联。这种方式的优点是简单易行,缺点是如果某个下层网络的MCU出现故障,则整个下层网络均无法参加会议。如果把信令和数据分离,那么对于数据量小但对可靠性要求高的信令可以由最高级中心进行集中处理,而对数据量大但对可靠性要求低的数据信息则可以交给各低级中心进行分布处理,这样既可提高可靠性又可减少对带宽的要求,对资源实现了优化使用。55553.最新的视频压缩技术最新的视频压缩技术H.264/AVCH.26
38、4具有统一VLC符号编码、高精度、多模式的运动估计以及整数变换和分层编码语法等优点。在相同的图像质量下,H.264所需的码率较低,大约为MPEG-2的36,H.263的51,MPEG-4的61,优势很明显。所以可以预计:H.264必将会在视频会议系统中得到广泛的应用。56564.交换式组播技术交换式组播技术传统的视频会议设备大多只能只能单向接收,采用交互式组播技术则可以把本地会场开放或上传给其他会场观看,从而实现极具真实感的“双向会场”。57579.3.1 IPTV的定义和需求的定义和需求IPTV(InternetProtocolTV或InteractivePersonalTV)也叫交互式网络
39、电视,是一种基于互联网的多媒体技术。IPTV是一种以家用电视机或PC为显示终端,通过互联网络协议(IP)传送电视信号,提供包括电视节目在内的内容丰富的多种交互式多媒体服务。IPTV是计算机、通信、多媒体和家电产品新技术的融合。9.3 IPTV系统系统5858IPTV业务利用IP网络(或者同时利用IP网络和DVB网络),把来源于电视传媒、影视制片公司、新闻媒体机构、远程教育机构等各类内容提供商的内容,通过IPTV宽带业务应用平台(该平台往往不仅支持TV,也支持其他业务)整合,传送到用户的个人电脑、机顶盒电视机、多媒体手机(用于移动IPTV)等终端,使用户得以享受IPTV所带来的丰富多彩的宽带多媒
40、体业务内容。目前,IPTV在全球范围内迅速发展。2006年6月30日,全球IPTV用户数达到300万,是2005年同期的两倍,其中欧洲用户数最多并且在2006年发展最快,法国电信、意大利电信、英国电信都提供了IPTV业务。5959从相关咨询机构对IPTV的预测来看,IPTV业务的发展前景非常乐观。在中国,IPTV也在向积极的方向发展,中国电信和中国网通分别在6个地市获得了IPTV落地许可。60609.3.2 IPTV系统的组成系统的组成IPTV的工作原理是把源端的电视信号数据进行编码处理,转化成适合IP网络传输的数据形式,然后通过IP网络传送,最后在接收端进行解码,再通过电脑或是电视播放。由于
41、数据的传输速度要求比较高,因此要采用最新的高效视频压缩技术,例如H.264、MPEG-4等。IPTV系统主要包括了节目提供系统、内容管理系统、中心媒体服务系统、运营支撑系统、IP网络、边缘流媒体服务器、接入系统和IPTV终端等,如图9-3所示。61 61图9-3 IPTV的系统组成62621.节目提供系统节目提供系统该部分主要完成节目的数字化,使原始节目成为能够在IP网络上传输的数字节目。其主要功能是直播节目的编码压缩、转换和传送。63632.内容管理系统内容管理系统内容管理系统的主要功能是对IPTV的节目和内容进行管理,即主要进行内容管理和用户管理,功能包括内容审核、内容发布、内容下载、用户
42、管理以及用户认证计费等。64643.流媒体传送系统流媒体传送系统流媒体传送系统主要包括的设备是中心边缘流媒体服务器和存储分发网络。存储分发网络可以由多个服务器组成,它们之间通过负载均衡来实现大规模组网,如CDN(Content Delivery Network,内容分发网络)。流媒体服务器是提供流式传输的核心设备,要求有很高的稳定性,同时能满足支持多个并发流和直播流的应用需求。65654.接入系统接入系统接入系统主要为IPTV终端提供接入功能,使IPTV终端能够顺利接入到IP网络。目前常见的接入方式为xDSL和LAN方式;也可采用FTTC/FTTB的方式,结合ADSL、SDSL、Cable M
43、odem等技术,使用FTTCHFC的方式向用户提供宽带接入。66665.IPTV终端终端目前IPTV终端主要有三种形式,即PC、机顶盒普通电视机和手机。其中,机顶盒普通电视机是IPTV的用户最常见的消费终端。67679.3.3 IPTV的体系架构的体系架构为了适应IPTV快速推进、迅速发展的需求,电信领域两大国际标准组织ITU-FGIPTV和ETSI-TISPAN对IPTV的有关标准进行了定义,推进了IPTV的标准化。这两个标准组织给出的IPTV的定义为:IPTV是在IP网络上传送包含电视、视频、文本、图形和数据等,提供QoS/QoE、安全、交互性和可靠性的、可管理的多媒体业务。IPTV需要能
44、够提供一定的服务质量保证,并满足可控、可管和交互性的相关要求。6868FGIPTV在IPTV业务需求文档中专门对IPTV的业务需求进行了要求和说明;TISPAN则将对IPTV的需求分成两个文档分别进行研究,分别是支持IPTV业务的网络传送能力要求及综合NGN业务和IPTV业务的业务层要求。对于IPTV需要支持的业务,FGIPTV和TISPAN的描述虽不尽相同,但是可以看出都需要支持各种广播业务、点播业务、交互业务(如信息类、商务类、通信类、娱乐类、学习类等交互业务),并且对IPTV业务提出了相关需求,包括内容提供商、业务提供商、网络提供商和终端用户。目前我国网络提供商业务都是由运营商承担的,内
45、容很多来自于广电的内容源。6969对于IPTV的架构,两个标准组织从两个方面都在进行研究:一方面是非基于NGN的IPTV架构(Non-NGN-BasedIPTV);另一方面是基于NGN的IPTV架构(NGN-BasedIPTV)。对于基于NGN的IPTV架构,又根据是否重用IMS相关功能部件而分成基于IMS的IPTV架构(IMS-BasedIPTV)和非基于IMS的IPTV架构(Non-IMS-BasedIPTV)。70709.3.4 IPTV系统的关键技术系统的关键技术IPTV技术是一项系统技术,其关键技术主要包括音/视频编/解码技术、流媒体传送技术、宽带接入网络技术、IP机顶盒技术等。71
46、 711.音音/视频编视频编/解码技术解码技术IPTV音/视频编/解码技术在整个系统中处于重要地位。IPTV作为IP网络上的视频应用,对音/视频编/解码有很高的要求。首先,编码要有高的压缩效率和好的图像质量,压缩效率越高,传输占用带宽越小;图像质量越高,用户体验则越好。其次,IPTV平台应能兼容不同编码标准的媒体文件,以适应今后业务的发展。最后,要求终端支持多种编码格式或具备解码能力在线升级功能。7272IPTV采用了先进、高效的视频压缩编码技术,使得视频流在800 kb/s的有限带宽上接近DVD(MPEG-2)的视觉效果(DVD的视频传输带宽通常为3 MB/s)。目前主要编/解码技术是MPE
47、G-4、H.264与AVS三种。MPEG系列是重要的视频编码标准,所有的视频编码技术都参照了MPEG技术。MPEG-4具有高质量、低传输速率等优点,已广泛应用于网络多媒体、视频会议与监控等图像传输系统中。H.264是新一代视频编码标准,2003年3月公布了标准的最终草案,全称是H.264/AVC或MPEG-4Visual Part 10。AVS是中国拥有自主知识产权的第二代音/视频编码技术标准,是高清晰度数字电视、宽带网络流媒体、移动多媒体通信、激光视盘等数字音/视频产业群的基础性标准。7373AVS2006年3月正式成为国家标准。2007年5月在斯洛文尼亚举办的ITU-TFGIPTV工作组第
48、四次会议期间,AVS获得国际认证,其视频部分成为IPTV四个可选视频编码格式之一,这从经济上为我国节约了巨大的专利费开支,否则,如果中国采用MPEG或者H.264标准,每年将支付大约200500亿元人民币的专利费(MPEG专利代理公司MPEGLA规定,每一台MPEG-2解码设备,必须由设备生产商交纳2.5美元的专利使用费)。而AVS的专利政策对发展中国家较为合理,所有专利打包价格是每台解码器1元人民币。AVS与MPEG相比,具有编码效率高、实现复杂度低、专利授权模式简单、收费低等优势。74742.流媒体传送技术流媒体传送技术IPTV的核心业务是数字音/视频流业务,因此流媒体传送技术相当重要。如
49、果传送技术高效可靠,不仅可以节约系统带宽,还可以减轻系统负担,使系统得到优化。通常,IPTV系统中流媒体的传送方式随用户接收方式的不同而不同,从终端用户看,主要有点播和广播两种接收方式。75751)点播接收方式下的流媒体传送点播接收的特点是个性化,接收的内容和时间取决于用户喜好,具有实时交互性能。同时,点播业务对网络带宽的需求也很大,为了避免大量消耗骨干带宽,同时保证服务质量,要求IP网络能有效地将视频流推送到用户接入网络,使用户尽可能就近访问。内容分发网络(Content Delivery Network,CDN)就能提供这种支持。CDN有时也称为MDN(Media Delivery Net
50、work)。CDN是建立在现有IP网络基础结构之上的一种增值网络,是在应用层部署的一层网络架构。在传统的IP网络中,用户请求直接指向基于网络地址的原始服务器,而CDN业务提供了一个服务层,补充和延伸了Internet,7676把要频繁访问的内容尽可能向用户推进,提供了基于内容进行流量转发的新能力,把路由导引到最佳服务器上,动态获得需要的内容。它改变了分布到使用者信息的方式,从被动的内容恢复转为主动的内容转发。其具体工作过程是:CDN把流媒体内容从源服务器复制分发到最靠近终端用户的缓存服务器上,当终端用户请求某个业务时,由最靠近请求来源地的缓存服务器提供服务。如果缓存服务器中没有用户要访问的内容