| MPEG4技术及其应用 筱叶 1.MPEG4是MPEG家族中的一员 数字技术的蓬勃发展和广泛应用使人类社会迈入了“数字时代”。今天,数字技术产品已走进普通百姓的日常生活之中。 数字技术就是用数字编码来描述和表达图像、声音等各种媒体信息。其信息处理的流程是:模拟信息→数字化→压缩编码→存储或传输→解码再现。其中,压缩编码是一个关键环节。数字化的图像和声音信号数据是非常庞大的,例如一幅640×480像素中等分辨率的彩色图像(24bit/像素)的数据量约为7.37Mbit/帧,如果是运动图像,以每秒30帧或者25帧的速度播放时,则视频信号传输速率为220Mbit/s;如果把这种信号存放在650MB的光盘中,一张光盘只能播放20多秒钟。所以,必须对数字化信息进行压缩,用尽可能少的数据来表达信息,节省传输和存储的开销。 1980年以来,国际标准化组织(ISO)、国际电工委员会(IEC)和国际电信联盟(ITU)等陆续完成了各种数据压缩标准和建议,如面向静止图像压缩的JPEG标准,在运动图像方面用于视频会议的H.261标准、用于可视电话的H.263标准、用于VCD的MPEG1标准、用于广播电视和DVD的MPEG2标准等。MPEG是运动图像专家组的的英文首字母缩写。该专家组成立于1988年,致力于运动图像及其伴音的压缩编码标准化工作,原先打算开发MPEG1、MPEG2、MPEG3和MPEG4四个版本,以适用于不同带宽和数字影像质量的要求。 MPEG1于1993年成为国际标准,它是对1.5Mbit/s以下数据传输率的数字存储媒体运动图像及其伴音的压缩编码标准,适用于CD-ROM、VCD、CD-I(交互式CD)等。它可对SIF(标准交换格式)分辨率(NTSC制式为352×240;PAL制式为352×288)的图像进行压缩,传输速率为1.5Mbit/s,每秒播放30帧,具有CD音质,图像质量基本与VHS家用录像机相当。MPEG1也被用于数字通信网络上的视频传输,如基于ADSL(非对称数字用户线路)的视频点播(VOD)、远程教育等。 MPEG2于1995年成为国际标准,其目标是达到高级工业标准的图像质量以及更高的传输率。MPEG2所能提供的传输率在3~10Mbit/s之间,在NTSC制式下的分辨率可达720×486,可提供广播级的图像质量和CD级的音质,适用于数字电视广播(DVB)、HDTV和DVD的运动图像及其伴音的压缩编码。目前,MPEG2已得到广泛应用,如美国、欧洲、***在DVD和数字电视广播方面都采用MPEG2压缩技术。 MPEG3最初是为HDTV开发的编码和压缩标准,但由于MPEG2的出色性能表现,已能适用于HDTV,使得MPEG3还没出世就被抛弃了。 MPEG4于1999年初正式成为国际标准。MPEG4是一个适用于低传输速率应用的方案。与MPEG1和MPEG2相比,MPEG4更加注重多媒体系统的交互性和灵活性。 1998年10月,MPEG启动了一个新的工作项目,即多媒体内容描述界面,简称为MPEG7。它的目标是扩展现有系统有限的查询能力,使其包括更多的信息形式。MPEG7将确立各种类型的多媒体信息标准的描述方法。据预计,MPEG7将于2001年初最终完成并公布。 2.MPEG4的主要特点 MPEG1、MPEG2标准均为高层媒体表示与结构标准,其交互性及灵活性较低。而MPEG4标准是对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,称为AV对象。AV对象可以组成AV场景。因此,MPEG4标准就是围绕着AV对象的编码、存储、传输和组合而制定的,高效率地编码、组织、存储、传输AV对象是MPEG4标准的基本内容。 AV对象的基本单位是原始“AV对象”,它们可能是一个没有背景的说话的人,也可能是这个人的语音或一段背景音乐等。MPEG4可以采用AV对象来表示听觉、视觉或者视听组合内容;允许组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;允许对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作。 在视频编码方面,MPEG4支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。在音频编码,MPEG4是在一组编码工具支持下,对语音、音乐等自然声音对象和具有回响、空间方位感的合成声音对象进行音频编码的。MPEG4音频编码不仅支持自然声音,而且支持合成声音。 MPEG4的重要特点包括:(1)基于内容的普遍性。MPEG4能够直接选取音频、视频内容进行编码,并对其灵活地进行控制和显示,用户可以自行选择场景中的物体的解码质量,进行家庭影视节目制作和编辑。(2)以AV为对象,增强了交互性和扩展性,从而提高了交互应用的灵活性。(3)将各种功能应用在自然的和合成的AV对象上,增强了节目编辑制作能力。(4)MPEG4在误码环境中,尤其是在恶劣误码条件下的低比特率应用中的抗误码性,有利于节目制作、分配和显示。 3.MPEG4的应用领域 MPEG4在多媒体传输、多媒体存储等领域具有广泛应用:(1)低比特率下的多媒体通信,如视频电话、视频电子邮件、移动多媒体通信、电子新闻等。这些应用对传输速率要求较低,在4.8~64kbit/s之间,分辨率为176×144。MPEG4利用很窄的带宽,通过帧重建技术压缩和传输数据,以最少的数据量获得最佳的图像质量。(2)互联网上的视频流与可视游戏,如网上电影。(3)数字电视、动态图像、万维网(WWW)。(4)实时多媒体监控。(5)基于内容存储和检索的多媒体系统。(6)基于面部表情模拟的虚拟会议。(7)DVD上的交互多媒体应用。 目前,MPEG4技术已开始逐步得到应用。例如,***夏普公司推出了应用在互联网上的数字摄像机VN-EZ1。这台网络摄像机利用MPEG4格式,可把影像文件压缩为ASF(高级流格式),然后用户只要利用微软公司的MediaPlayer播放程序,就可以直接在电脑上进行播放。又如,在移动多媒体通信领域,摩托罗拉公司在今年5月份宣布开发出用手机看电影的技术。该公司已研制成功通过GPRS(通用数据包无线业务)移动数据网络传输MPEG4格式图像的系统。 目前,出现了两种MPEG4技术的具体应用形式:一种是DIVX-MPEG4影碟(国内市面上已出现),另一种是网上MPEG4电影。它们把MPEG4技术的实际应用展现我们眼前。 DIVX视频编码技术实际上就是MPEG4压缩技术,它由微软MPEG4V3修改而来,使用MPEG4压缩算法。据说,用MPEG4技术来编码、压缩一部DVD,只需要两张CD-ROM。这就意味着您不需要买昂贵的DVD-ROM也可以得到和它质量差不多的视频节目了,而这一切只需要您有CD-ROM。当然,现在还只能用计算机来播放DIVX-MPEG4影碟。它对计算机的要求是:300MHz以上的CPU,64MB的内存,8MB显存的显卡。在计算机上播放DIVX-MPEG4文件的方法目前有两种:第一种是用诸如DivxPlayer0.02等专门的播放软件来播放;第二种播放方法是安装一个Windows媒体播放机MPEG4(Divx)插件后,用Windows自带的媒体播放机来播放。但MPEG4毕竟是一种高比率有损压缩算法,其图像质量无法和DVD相比,但要远远优于VCD。DIVX文件也可以压缩到600MB左右,可放入一张CD-ROM中。 互联网上的视频流应用几年前就出现了。目前,互联网上比较流行的几种影像格式包括Quicktime、RealPlay以及微软的MediaPlayer等。MPEG4技术出现之后,互联网上又出现了MPEG4格式的电影。您只要将它从网上下载后,就可以利用MPEG4解码软件在计算机上播放。但一部完整的以MPEG4格式压缩的电影的数据量高达六七百MB,对拨号上网用户来说下载时间太长了。 微软公司开发出了一种叫ASF的可以直接在网上观看视频节目的压缩格式。它也使用了MPEG4的压缩算法,但却是以一个可以在网上即时观看电影的视频流格式存在的,所以它的图像质量比VCD要差一些。 目前,只有少数中文网站提供了MPEG4资源,如http://www.souxin.com,而提供MPEG4资源的英文网站则比较多。 |