---- 多媒体技术是以计算机为核心的集中了图象、文字、声音等处理技术的综合性技术。多媒体技术与远程和地区性局部网络、因特网(Internet)、电话、广播、电视、微波、卫星通信等各种通信技术相结合,就产生了多媒体通信技术。理想的多媒体通信方式应该是使人们可以在任何时间、任何地点通过通信网获得所需要的各种各样的多媒体信息。
---- 多媒体通信技术的出现是通讯领域的一次新的革命,它将计算机的交互性,通信的分布性和电视的真实性融为一体,最终将会使计算机、通信、大众传播、娱乐业等多个领域形成一个统一的多媒体产业,从而成为新世纪最大的产业。多媒体通信领域技术水平的高低,将对未来我国在国际上经济地位的高低起非常关键的作用。
1. 多媒体通信终端协议的概况
---- 通信涉及到全球范围,因而实现标准化是使之实现成功产业化的前提。在多媒体通信技术快速发展、迅速成长的背景下,国际电信联盟(ITU)近年内制定了一系列的多媒体通信系统协议-- H.32x系列, 这些系统协议有以下共同的特点:
---- (1) 利用了成熟且大量普及的通信网络--如现有的普通电话网,综合业务数字网(ISDN)和 Internet--进行多媒体通信,所有的通信方式都基于统一的国际标准。
---- (2) 基于ITU-T标准的图象和语音压缩算法。其中图象是H.26x,语音是G.7xx系列。这样,由不同开发者用不同方式实现的编解码器互相之间都遵照同样的格式工作,这是保证不同系统进行互联的前提条件。
---- (3) 保证系统互联性。标准的通信数据码流,标准的数据打包方式、数据复接方式和系统控制,真正让不同的产品在世界上的不同地方相互通信。也只有这样,才能让多媒体通信系统真正在世界范围内普及。
---- (4) 独立于应用平台的系统。无论是基于计算机系统还是独立的电器设备,也无论是大型工作站还是个人电脑(PC),只要系统能够向通信网络提供符合标准的数据和控制,这些系统就能够进行多媒体通信。
---- 表1概括了这些国际标准的情况,其中列出的时间和内容均表示该标准第一版正式批准的时间和内容。由于本文没有讨论除语音图象以外数据的传输标准(如T.120系列),多点控制标准(如H.243)以及加密标准(如H.235),因而这些也就没有列在表中。
---- 应该注意到,不同的通信网络有着不同的传输特性和不同的传输接口,因此有关数据打包和复接的协议以及其它的一些协议对不同的通信网络有着不同的特性依赖程度,本文将在第2节中对此做进一步的分析,同时这也说明在研究工作中,吃透标准的内涵而不拘泥于国际标准的形式,对实现不同的系统是十分必要的。
2. H.324和H.323多媒体通信终端协议的分析和比较
---- ITU-T H.323和H.324是目前最重要的两个多媒体通信终端协议,这一重要性和它们所面向的通信信道有着直接的关系。H.323的通信途径是Internet或Intranet,H.324面向的则是普通电话网。这两个都是联系到每一个人的通信途径,其影响的广泛程度可想而知,因此对这两个系统加以仔细研究是进行多媒体通信系统研究的基础。
---- 2.1 H.324概况
---- 基于H.324的可视电话系统运行于普通电话网(GSTN)之上,可提供语音、图象和其他数据的实时通信。由于电话网带宽的限制,决定了语音和图象都必须采用高压缩比的算法,以低数码率进行传输。这样,语音虽然仍然能够和普通电话的质量相当,但是图象却不会太好。根据协议的描述,对于176×144象素的分辨率,图象每秒的帧数只能在4-15之间,大约只是普通电视帧数的1/3。实际上,如果要得到比较清晰的图象,每秒就只有4到5帧。同352x240象素分辨率的VCD相比,分辨率只有VCD的30%。
---- 只要是按照H.324协议运行的系统,它们之间就可以相互通信。这样的系统包括下面的情形:
---- (1)独立的可视电话。这样的系统和目前的普通电话基本上一样,当然也可以象普通的电话那样使用,同样有话筒和RJ11的电话线接口。但是它外面会多出一些东西,如摄像头和图象显示设备如液晶显示屏,或者也可以用普通的电视机显示影象。而它里面却要比普通电话机复杂得多,需要实现系统控制、语音图象编解码和调制解调数据等功能。
---- (2)基于PC的可视电话。具有多媒体功能的个人计算机通过使用有语音功能的调制解调器,全双工工作的声卡,图象采集卡以及摄像头,利用PC机本身的CPU处理语音和图象,或者还可以再加上另外的数字信号处理器(DSP)来加速处理语音或图象数据,然后再配合上适当的软件,就可以进行普通电话的通话和可视电话的通话。
---- H.324是一个系统协议,其结构如图1所示。它负责控制系统的运行,对语音和图象数据压缩和解压缩,进行数据复接--将语音数据、图象数据和其他数据合在一起再用一条电话线从调制解调器实时传送出去,以及通过调制解调器接收到从电话线上来的数据之后区分开语音、图象等数据并进行再解码,所有这具体的事情都需要有其它的协议来帮助完成。
![]() |
| 图1 H.324的系统框图 |
---- 下面是H.324系统所必须包含的其他协议:
---- V.34 调制解调器协议。在普通电话网络上两点之间以28.8或33.6k位/秒的速率传输数据,要求支持"透明的"同步传输模式,如果是异步的话,PC机就要求有V.80的支持,由V.80完成H.223中要求的透明数据的工作。其它和调制解调器有关的还有:V.8协议,其中包括调制解调器开始数据传输前的起始过程;V.8bis和V.25ter的附录A协议,这其中包括先进行普通电话通话再升级到可视电话的过程。
---- H.223数据复接和分路协议。在发送端把控制数据、语音数据、图象数据和其他数据合成一路数据让调制解调器传输,在接收端再分开这些数据。H.223分成复接(MUX)和自适应(AL)两个层次,MUX与调制解调器接口而AL与数据来源接口。AL层分为AL1, AL2, AL3三种情况,语音数据和AL2相关联,图象数据和H.223的AL3相关联,有关H.245的控制数据则和AL1相关联。
---- H.245系统控制协议。通过协议定义的消息和过程,通信双方互相交换信息,决定如何传送语音、图象和数据,如何处理错误。H.245分成对消息编解码和对各个消息处理的状态转换机制两个部分。语音和图象采用的算法及选项由H.245的交换信息决定。
---- G.723.1语音算法。这是窄带语音编码,编码方法为多脉冲最大似然量化和代数码本激励线性预测编码,把8kHz采样的语音信号压缩成5.3或6.3k位/秒,同时提供静音检测,在没有声音时传输更少比特的数据。
---- H.261、H.263图象算法。这是低码率图象压缩编码算法。采用分块、DCT变换、运动估值和运动补偿、熵编码的基本结构,由于采用了半像素搜索等更好的处理方法,H.263的编码效率比H.261高一倍。
---- 2.2 H.323概况
---- H.323与H.324极为相似, 如图2所示,不同的地方只是在于通信信道变成了包交换机制的网络系统,以及随之而带来的一些通信方式上的改变,比如说,它带宽的变化范围就非常大。对于采用电话拨号上Internet的用户而言,其带宽不可能比在H.324中更高,而如果是用ISDN,DDN或其它高速数字方式接入的用户,其带宽就可能比H.324中高出很多。至于局域网和城域网的情况,带宽就更加宽了。
![]() |
| 图2 H.323终端的系统框图 |
---- 由于可能有比较宽的带宽,在H.323中还允许使用不同于G.723.1的语音压缩编码算法。它们是:G.711脉冲编码调制(PCM),码率为64k位/秒; G.722子带自适应脉冲编码调制(SB-ADPCM),码率为64~48k位/秒可变; G.728短延时码激励线性预测编码(LD-CELP),码率为16k位/秒,并且单路编解码延时小于2ms,很好地避开了回声抵消的问题;G.729代数码本激励线性预测编码(ACELP),编码速率为8k位/秒,延时小于G.723.1。
---- H.225.0协议是H.323所特有的,它包括呼叫控制、登录和管理控制、数据打包/解包及传输三个方面的内容。通过TCP进行呼叫,用户数据报协议(UDP)可进行面向关守(GateKeeper)的登录和管理;基于UDP的实时传输控制协议/实时传输协议(RTCP/RTP)可进行实时语音和图象数据的传输。其中数据打包/解包及传输对应于H.324系统中H.223的AL层,而呼叫控制对应于H.324系统中有关调制解调器的协议部分。
---- 2.3 H.324和H.323的比较
---- 在对两种协议有所了解的前提下,对以下的三个方面进行比较:
---- (1)呼叫的建立
---- 在H.324中,呼叫的建立和通信双方的握手是由调制解调器有关的协议V.8、V.8bis、V.25ter完成的,而在H.323中,这些功能是由H.225.0和网络协议如TCP/IP共同完成的。因此,H.225.0通过ASN.1文法定义了两套消息,一套通过TCP协议在特定端口与通信的对方进行呼叫和握手工作,另一套通过UDP协议在特点端口与网络上的关守(GateKeeper)通信以进行登录和管理工作。在最新的H.323第三版本中,第一套的工作也可以通过UDP来完成,通过新的消息有效加快握手的过程。此外,在H.323的终端中,和关守的通信是可选的。
---- (2)H.245消息的交换
---- 在H.324中,H.245消息的交换在H.223的AL1层进行,通过协议规定的逻辑通道0和简单重传协议(SRP)传送H.245的消息,这一点与调制解调器的数据传输协议在一个方向上只能传输单路数据是密切相关的。而在H.323中,通过H.225.0的对话,通信双方再打开另外一个TCP的端口进行H.245消息的交换。由于H.245的消息必须保证没有任何错误,在H.324中,只能由H.223进行CRC校验以及SRP的重新传送机制来保证这一点,而H.323中则由TCP协议本身来保证这一点。
---- (3)语音、图象数据的传输及错误处理
---- 由于调制解调器的数据传输协议在一个方向上只能传输单路数据,H.223必须分成两个层次,MUX层和AL层。其中MUX层负责把语音、图象、数据以及H.245的消息混合成一路数据来传输,这样就带来了所谓"透明"数据的问题,即需要保证传输的语音图象数据中不出现用来分隔语音、图象等数据的标志--在H.223中,这个标志是"0x7e"。如果要传输的数据中出现了连续5个数据位都是"1"的情况,就必须要加1位的"0"到数据流中,而在接收端再把所加入的"0"剔除出来。这个工作可能会导致要传送的数据不是整数个字节,而多数情况下,比如基于PC机的情况,和调制解调器的接口是整数字节的,这样就需要V.80加入到其中。在有V.80的前提下,H.223的标志变成0x19b1两个字节,"透明"数据的工作变成检查0x19和0xb1,然后根据V.80中定义的规则用两个字节替换,最后再由V.80在调制解调器内把标志由0x19b1换成0x7e。在H.225.0中,就不需要一个MUX层。语音和图象的数据通过不同UDP的端口传送,互不影响。H.223中的Al层相当于H.225.0中的采用RTCP/RTP传送数据,错误处理都是在这个层次上做的,二者在这个层上给语音和图象数据附加上一些头尾数据,以用于监测误码和数码次序的颠倒。
3. 基于不同协议通信终端的互通
---- 从上面的分析和比较可以看出,不同协议间差别的产生是由于各通信终端所应用的通信网络条件有所不同。目前,基于不同协议间多媒体通信终端的互通性还很差,随着多媒体通信的进一步发展,基于不同协议间通信终端的互通性会变得越来越重要,IP电话涉及了公用电话交换网和因特网的互通问题,就体现出了这一发展趋势。
---- 互通的实质就是不同协议的相互转换,可通过设计制作网关来实现,但这必须建立在对各种协议透彻了解的基础上。虽然目前这方面的工作还处于起步状态,但可以预计,在不久的将来,基于不同协议多媒体通信终端的互通性会有很大提高。