打造发烧音质:MP3音频完全攻略(上)-1 [ZT]
【IT168 专稿】【编者按:如果要说在如今以及未来N年的“Internet文明时代”(我暂时标的一个名词)有什么音乐文件是最流行的,那便非MP3莫数。具有无限潜力的发烧音质、较低的容量、随身听硬件的广泛支持、以及全世界无数程序员的共同开发等等。
本文详细叙述了MP3音频格式的方方面面,分上、下两篇,上篇主要有MP3的诞生、原理和前景分析,下篇是高音质MP3音乐文件的制作详细介绍,基本涵盖了有关MP3音频的全部——把本页加入收藏夹吧!
在阅读前请先下载几首高音质MP3欣赏(原版CD—EAC抓轨—LAME 320KBPS):
1 贝多芬——钢琴曲
4 王菲——《天空》
如有意见,请联系编辑 蓝鹤色 OICQ:6572790 email: zwtan*it168.com】
上篇 目录:
第1页:1 合适的技术在合适的时间被激活 |
第2页:2.剖析:红得有道理 |
第3页:几个重要原理 |
第4页:解码 |
第5页:看一些比较有意思的数据 |
第6页:3.末日?MP3前景分析 |
1.诞生:合适的技术在合适的时间被激活
如果在5,6年前你说你不知道MP3还情有可原,可在现在的再说不知道就显得有点火星了。为什么?因为MP3实在太火了,我亲眼在我们学校见过一个老教授脖子上戴着一台新潮的MP3播放器。
MP3是应用于MPEG-1的一项音频压缩技术标准,英文全称是MPEG-1 Audio Layer3。对于既定的声音质量,layer3能提供最低的比特率(相对于layer1和layer2),它是MPEG音频编码家族中最有力的成员。
如果说数字化让我们听到更干净的音乐,让音乐更容易保存的话,那么MP3的诞生则让音乐能在不同地域不同国界的音乐爱好者之间更方便快捷更自由的传递。
看一组比较:
如果你想用CD质量来保存一分钟的音乐——也就是以44.1KHz的采样频率,立体声,每个采样值16比特的方式进行采样。那么那段音乐的大小将是:
44100 (样本值/秒) × 2(两个通道)× 2(每样本值两个字节)×60(每分钟60秒) =10584000 (字节)=10.3M
如果改用128kbps的MP3格式来压缩的话,只需:
128kbps ×60(秒) = 960 KB
大小比是12:1!而且128kbps的MP3也基本能让人满意。正因为MP3能让音乐文件大幅瘦身,从而使音乐在INTERNET普及后大范围传播变得具有现实可能性。
难怪MP3之父Brandenburg博士曾这样评价MP3:“MPEG-1 Layer-3 was the right technology available at the right time(MP3是在合适时间被激活的合适技术)。”
MP3之父,Karlheinz Brandenburg博士(看小资料),德国人。80年代,Karlheinz Brandenburg博士和所领导的研究小组一直在德国的 Fraunhofer IIS-A实验室从事数字音频压缩的研究。他们最早与1987年开发出MPEG-1 layer3(MP3),并在1989年取得专利权,于1991年最终制订出MP3的标准,到了1992年合并到Moving Picture Experts Group (MPEG)规范中。按照Brandenburg博士的说法,MP3的诞生应该是在1991年。
虽然MP3的标准最终得到确定,但是当时对大众来说MP3还是个陌生词。因为受限于当时的计算机的发展和感知编码(perceptual audio coding)研究中的问题,当时Fraunhofer IIS-A并没有推出MP3的标准编码、解码和播放工具。举个例子, 1980年Brandenburg还在电子工程科系读书时研究数字音乐的压缩技术。当年的计算机须花10小时才能为长约1分钟的数字音乐文件解码(注意是解码而不是编码!);而当时MP3编码器当时的编码方式在现在看来也近乎粗暴,音质自然不理想。 不过随着计算机科技的发展和感知编码的科研突破,更高效快速的压缩编码方法出现,同时MP3的传播也得以实现——MP3的好日子来了。
Brandenburg博士认为MP3的真正发展应该是从1995年开始,也就是MP3编码器和播放器发布的那一年。那时以来,INTERNET上MP3的数量就呈几何级数增长。
********************************************************************************[小资料]
< Fraunhofer IIS-A >
Fraunhofer IIS-A,作为国际性的研究实验室,Fraunhofer IIS-A(后缀-A是指Audio即音频部分)是高质量、低比特率音频编码领域的领导者之一。Fraunhofer IIS-A是MPEG Layer3以及MPEG-2 ACC的主要发展者。同时,Fraunhofer IIS-A也在MPEG-4的标准化构架工作中扮演了重要的角色。如今,MP3的专利权就属于Fraunhofer IIS-A实验室的。
(mp3之父: Karlheinz Brandenburg)
(Brandenburg和他的小组成员)
Karlheinz Brandenburg,现年48岁, 早在1980年,Brandenburg博士还在伊尔默瑙技术大学的电子工程科系读书时,他就开始研究数字音乐的压缩技术。
Brandenburg并没有因为MP3而发大财,因为MP3的专利权不是他的。不过他本人可分得部分专利费。不过MP3的发明为Brandenburg在科学界赢得一定声望。为了表彰Brandenburg的贡献,2000年10月19日,德国政府将德国未来奖颁发给Brandenburg博士。而Fraunhofer IIS-A也另成立了一个由他主持的分支机构,继续研究各种新式多媒体标准。
2.剖析:红得有道理!
MP3的如今大红大紫,而真正的市场发展期只有六七年,而在中国,MP3真正深入民心就在这两三年时间,可你看那红火程度,真的有点让人不够想象(连小贝跑步也带个iPod!)。对比MD,发展了十多年,在欧美那边还不是很受欢迎(这里无意谈论MP3和MD谁优谁劣的问题)。我们不禁问一句,MP3凭什么这么红?
以下是本人的观点:
1. MP3自身优秀的内涵,这是内因;
2. WINTEL之流的贡献和internet的普及;
3. LAME等一批优秀的编码器;
4. MP3随身听的推陈出新。
2.1 内涵
要分析MP3的发展必须先了解其内涵,MP3的内涵应该包括其编码原理和解码原理。
2.1.1 编码
这里分两部分介绍:简单介绍和深入了解,如果你只想简单了解一下MP3的编码原理,那之看简单介绍就可以了。
■简单介绍
音频压缩实际上由编码和解码两个部分组成。把波形文件里的数字音频数据转换为高度压缩的形式(称为比特流)即为编码;要解码则把比特流重建为波形文件。
音频压缩可以分为无损(lossless)压缩和有损压缩。无损压缩就是尽量降低音频数据的冗余度,以减小其体积。音频信号经过编码和解码之后,必须要和原来的信号一致。无损压缩的压缩率是比较有限的,不过现在比较出色的APE能做到50%的压缩率(本人用Monkey’s Audio 3。97,Extra High压缩模式下压缩WAV,压缩率最低能达到52%);有损压缩就是用尽一切手段,包括无损压缩用到的方法,丢掉一切能丢掉的数据,以减小体积。而音频压缩后解码听起来起码是要跟原来差不多的,有损压缩的压缩比能大幅提高,MP3就是属于有损压缩,压缩比是12:1(128kbps)。
MP3文件是由帧(frame)构成的,帧是MP3文件最小的组成单位。什么是帧?还记得最初的动画是怎么做的吗?不同的连续画面切换以达到动态效果,每幅画面就是一个“帧”,不同的是MP3里面的帧记录的是音频数据而不是图形数据。MP3的帧速度大概是30帧/秒。
每个帧又由帧头和帧数据组成,帧头记录着该帧的基本信息,包括位率索引和采样率索引(这对理解ABR和VBR编码方式很重要)。帧数据,顾名思义就是记录着主体音频数据。
上面说的都是MP3编码的基础,但事实上,早期的编码器都非常不完善,压缩算法近于粗暴,音质很不理想。MP3的音质达到现在的水平有两次飞跃:人体听觉心理学模型(Perceptual Model)的导入和VBR技术的应用。
转载请注明:在路上 » 打造发烧音质:MP3音频完全攻略(上)-1[ZT]