访问电脑版页面

导航:老古开发网手机版其他

MPEG与MP3技术的发展

导读:
关键字:

MPEG与MP3技术的发展
The developments of MPEG and MP3


中国地质大学(武汉)信息工程学院 许 盈
摘 要:从MPEG的发展史入手,着重介绍MPEG的音频压缩编码以及MP3编码器和解码器,并对MP3的发展现状和前景进行了较为准确的概括。
关键词:MPEG;MP3;音频压缩;编码器;解码器
1 MPEG概述
1.1 MPEG的发展史

---MPEG(运动图象专家组)音频压缩算法是一项国际化的标准,它专门用于处理高保真音频信号的压缩。MPEG标准是一种具有高复杂性、高密度性、高音质的算法。这种数字压缩算法使数据的存储与传输更为有效,同时,压缩的形式多样性也使编解码器变得更为复杂。
---MPEG标准已经历了许多阶段,它发展的历史如图1所示。
---MPEG自研发数字压缩标准开始就致力于开发一种新的算法,通过这种算法可以将视频信号压缩后在CD-ROM上或者通过电话线以低比特速率播放。MPEG的目标就是能够传输来自各种信息源的全运动、全屏幕的家用录像系统质量的视听信息。
---最初的MPEG标准无法达到广播视听质量的要求,但它已经可以通过电脑显示器直接播放或通过用户多媒体设备进行录音回放。不断进步的压缩技术以及对更高的图像质量的要求,急切盼望着适用于传播业发展的新标准的出现。因此,MPEG开始致力于第二大成果的开发,这就是众所周知的MPEG-2。
---在MPEG-2发展的同时,MPEG-3标准的开发也开始进行,并且把矛头直接指向了HDTV(高清晰度电视)的市场,其编码比特率为20~40 Mbps。然而,在人们探寻到取样速率与编码比特率之间的最佳平衡后,MPEG-2与MPEG-1协同工作便可以很好的满足HDTV视频信号速率的要求。随着HDTV逐渐变成MPEG-2标准的一部份,MPEG-3还没出世就被扼杀在摇篮中了。
---1993年9月,MPEG-4开始在比利时布鲁塞尔进行开发。这一标准的目标指向了低比特速率视听节目的编码,如在电话线上传输视频和音频数据。它更多定义的是一种格式和框架,而不是具体算法。MPEG-4的应用范围很广,具体应用领域包括视频会议和视频电话、交互式视频游戏、多媒体通信、移动通信、多媒体邮件、基于网络的数据库服务、远程教育、远程视频监视和交互电视等。环球移动通信系统(UMTS)已选择MPEG-4 video作为下一代移动电话的压缩标准。
---随后出现的MPEG-7可以被形容为“基于语义的表示”。带有MPEG-7数据的AV资料可以包含静止图像、图形、3D模型、音频、语音和视频,以及这些元素在多媒体表现中组合的信息。这些信息通过MPEG-7的描述,就能被索引和搜索。MPEG-7可独立于其他MPEG标准使用,也可以用来增强其他MPEG标准。
---尽管MPEG取得了种种成功,但在人们的信息交流中尚存有众多的不便之处,例如不同网络之间的障碍、知识产权得不到有效保护等;不同的多媒体信息、网络、设备、协议和标准以及分布在不同的地点等都使得用户不能以统一的方式进行多媒体信息交互。如何通过一个综合标准来对上述不便之处加以协调,使多媒体业务畅通无阻?这就是MPEG墨尔本会议提出的多媒体框架概念,即MPEG-21。MPEG-21的目标是建立统一的多媒体框架,为从多媒体内容发布到消费所涉及的所有标准提供基础体系,支持连接全球网络的各种设备透明地访问各种多媒体资源。

1.2 MPEG音频压缩编码
---MPEG音频标准中的压缩明显分为三个层次。第一层是使用最小化编码形成的最基本的算法,最适用于信道比特率高于128 kbps的情况。第二层具有中间层的复杂性,最适于信道比特率在128 kbps左右的情况。本层的应用有数字音频广播的音频信号编码等。第三层是最复杂的一层,但是它提供了最佳的音频质量,特别适用于信道比特率在64 kbps左右的情况。音频信号经过ISDN传输时,最适合使用本层所提供的压缩算法。图2对三层的情况进行了比较,并对每层比特率所达到的CD音质百分比进行了描述。
---第一层中的一些元素可以增强第二层与第三层的功能。层次从低到高,压缩性能不断增强,但是,这是以编解码器复杂度的提高为代价的,如表1所示。同时,这三层结构都十分简单,都工作在相似的比特率,因此可以使用单芯片或实时解码器来实现。

2 MP3技术
2.1 MP3的产生

---MPEG-1的第三层可以提供一套完整的基于感知的音频编码方案,这就是大家所熟知的MP3新标准。这一算法中应用了心理声学模型以达到1:12的压缩比率。这一模型应用人耳的特性,最大限度的保持了原始声音的质量。MP3是MPEG音频编码家庭中最有力的成员。对于既定的声音质量,它能提供最低的比特率,或者说,对于既定的比特率,它能获得最好的声音质量,也就是我们常说的性价比最高的状态。
---图3显示出与MP3技术相应的基本模型,两大主要元素为编码器与解码器。编码器将获取的数字音频信号压缩为MP3文件。而后,通过信道将其发送至解码器,比如通过Internet进行传播。解码器将获取的MP3文件进行解压缩处理,将其转换成为可以通过声卡或其他音频设备播放的数字音频信号。
2.2 MP3编码器
---编码器是一种计算机算法,它使用心理声学模型(即基于感知的模型)将原始的数字音频文件压缩成为MP3文件,如图4所示。
---压缩算法使用心理声学模型以缩小原始声音文件的大小,同时也使用了均衡量化器和编码器。通过使用快速傅立叶变换(FFT),时域的原始声音信号被转换至频域,以提供各个频率元素的振幅。
---人类的耳朵所能听到的声音信号的振幅只有确定的一些值,而且频率在15Hz到20000Hz之间,了解了这一事实,音频信号的大小就很容易被缩小了。
---例如,同时具有很大声响(即信号中有许多的频率元素)和微弱声音(即信号只有少量的频率元素)的音频信号进行压缩时,压缩算法去除了微弱声音的信号,因为这种声音不可能让每一个人都听到。这一技术被称为声音掩蔽。如果出现强信号,那么,其后的弱信号是不可知的。MPEG算法移除了较弱的信号,如图5所示,信号1与信号2都将被掩蔽,信号3将被MPEG算法采用。这种作法是十分有利的,因为被移除的信息不再需要占用硬盘空间和互联网带宽。
---压缩算法可以缩小原始信号的带宽,因为在大多数情况下,处于人类听觉范围边界频率(如15Hz和20kHz)的信号是不会被听到的,其中的信息会被漏掉。虽然这里例举的是一些最简单的例子,但是正是使用了这些例子中所蕴涵的基本概念,才将数字音频信号压缩成为MP3文件格式。
---MP3文件的一个重要特点是在它被编码后还可以被“流动化”。MP3文件流其实是将MP3文件中的比特段经由互联网传送至电脑的过程。MP3文件流的产生使互联网上可以拥有CD音质的广播站。
---WAV、AIFF和AU等这些旧格式的音频文件容量都较大。如果想通过网络播放这些格式的文件,首先需要等待整个声音文件通过互联网下载完成之后,才能开始收听。但是,使用音频文件流不需要等到整个声音文件完全下载完毕,就可以开始播放声音了。当然,只有拥有了高度压缩的声音文件以及快速的调制解调器,音频流体化才可能实现。
---过去,大多数在线广播的音质与调幅无线电广播的音质相仿,有较严重的失真。因为只有缩小原信号的带宽,才能将信号传送至标准的56kbps调制解调器进行处理。而现在,通过使用电缆调制解调器技术,同样的广播站可以使用MP3工艺经由互联网广播出高质量的声音信号。

2.3 MP3解码器
---MP3软件解码器是一种计算机算法,它将MP3格式的文件转换成为可以通过声卡或其他音频设备播放的WAV文件。
---如图6所示,解码器接收比特流,并对其进行与编码器相反的处理。首先,比特流被解码,而后被简化,最后,使用傅立叶逆变换(IFFT)将频域中的信号重新转换至时域,这样,声音信号才可以通过声卡或其他音频设备播放出来。
---目前,有很多大型软件商致力于软件解码器的开发和不断优化,其升级速度较快,音频质量较高,解码技术也已经比较成熟。不过,因为软件解码要打开电脑,电脑中声卡质量的好坏和其他噪音(如交流声、风扇声和电磁干扰等)的大小,对MP3的回放影响相当大,因此,还可使用硬件IC解码技术,也就是我们常用的MP3播放器的解码技术(包括部分光盘设备的解码技术)。由于MP3播放器(使用闪存的产品)中没有机械部件,所以在MP3播放器中不会出现电脑中才会有的其他噪音。硬件IC技术经过了几年的长足发展,如今也已经相当成熟。目前市场上MP3播放器中常用的芯片有Sigmatel、Actions、Sunplus、MosArt、Atmel、Telechip、ST、PHILIPS和CRYSTAL等,其中Actions为中国公司的产品,而市场上最常见的芯片一般是ST和Telechip。
---无论是软件解码器还是硬件解码器,其复杂程度都与需解码的文件格式类型直接相关。与编码器相类似,MPEG中层次越高,解码的复杂度也越高。因此,第一层的解码器要比第三层的解码器结构简单。为了达到MP3解码器的标准,解码器必需具有后向兼容性,即如果一个解码器声明它应用于MPEG-1的第三层,那么,它也一定可以适用于MPEG-1的第一层和第二层。
---原数据被编码后,解码器可以将其解释成各种不同质量的声音。声音质量的范围是从电话音质到CD音质,如表2所示。
---表2显示出声音质量和比特率与带宽具有十分紧密的联系。大多数情况下,带宽是通信系统中的限制因素,这就是电话系统中声音质量较差的原因,因为电话系统可容纳的带宽十分有限。

2.4 MP3发展现状
---随着MP3技术的出现,对音频文件的存储及恢复得到了惊人的发展。最初,通过互联网下载一首60Mb的歌曲需要近4小时10分钟,而在利用了MP3技术和它12:1的压缩率之后,现在下载同样的一首歌曲可能只需要20分钟。如果再使用电缆调制解调器的话,可以节省的时间就更多了,只需要1.5分钟就可以下载这首歌曲。网络快速下载的能力,使人们越来越热忠于在互联网上下载和交易MP3文件。而MP3强大的压缩算法使整个CD音乐库可以被存储在几张而不是几百张CD中。
---除了MP3技术,目前还有一些其他的音频编码技术。MP3pro是MP3技术改良而来的,在与MP3格式同样的音质时,文件的大小却只需原来的一半,且与MP3技术之间相互兼容。也就是说在MP3上要用128kbps来达到的音质,在MP3pro上仅用64kbps就能够实现,但是由于技术版权等问题,这一项比较有潜力的技术被淹没了。又如Real Networks公司推出的RealAudio,它最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。但是,这种声音格式的音质由于受到自身编码的影响,只能够达到广播收音的质量,所以在随身听的市场上也没有得到广泛的推广。
---MP3技术很好的克服了其他编码技术在发展中所遇到的阻力,成为目前音频编码技术中当之无愧的的霸主。

3 结束语
---经过短暂的十几年发展,MP3技术已经从默默无闻变成了一项应用最广泛、知名度最高的音频标准。但未来是什么样子,没有人能够预知。由于技术的不断发展,更新的技术还会出现,MP3技术的前景也许并非我们想像中那么光明。然而,可以肯定的是MP3技术目前使用广泛,不可能突然之间彻底消失,其格式可能还会经历一些变化,比如满足MPEG-1第四层协议或者其他压缩率更高算法的格式,我们也许有机会亲眼见到下一代更为强大的MP3标准的出现。

参考文献
1 M. Fattouche. Free and Legal MP3 Music,University of Calgary ENEL 571. Lectures Notes. http://www.mpeg.org/MPEG/mp3.html#faqs. 1999
2 Music and Technology Companies Join to Develop Means to Protect Copyrighted Music. http://www.techlawjournal.com/intelpro/19981216.htm. 1999
3 耿静. MPEG视频的发展趋势. 数据通信. 2002年第4期

 
来源:今日电子   作者:  2002/1/1 0:00:00
栏目: [ ]

相关阅读

安森美推出新的高功率图腾柱PFC控制器,满足具挑战的能效标准

动态功耗低至60μA/MHz!助力设备超长续航,首选国民技术低功耗MCU!