Tuesday, October 4, 2011

zt: 卡尔海因茨・勃兰登堡(Karlheinz Brandenburg):MP3之父


卡尔海因茨・勃兰登堡(Karlheinz Brandenburg):MP3之父

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
He received a Dipl. Ing. degree from Erlangen University in Electrical Engineering (1980) as well as a Dipl. Math. degree in Mathematics (1982). In 1989 he obtained his Ph.D. from the Friedrich-Alexander University Erlangen-Nuremberg in Electrical Engineering for his work on digital audio coding and perceptual measurement techniques. The research results of his dissertation are the basis of MPEG-1 Layer 3 (mp3), MPEG-2 Advanced Audio Coding (AAC) and most other modern audio compression schemes.
From 1989 to 1990 he worked with AT&T Bell Laboratories in Murray Hill, U.S. on ASPEC and MPEG-1 Layer 3. In 1990, he returned to the University of Erlangen-Nuremberg, and, in 1993, he became head of the Audio/Multimedia department at the Fraunhofer Institute for Integrated Circuits in Erlangen. Since 2000, he is full professor at the Institute for Media Technology at Technical University of Ilmenau. In addition, he is the director of the Fraunhofer Institute for Digital Media Technology IDMT in Ilmenau.
Brandenburg is a Fellow of the Audio Engineering Society (AES) and head of the AES Standards Committee working group SC-06-04 Internet Audio Delivery Systems. He has been granted 27 US patents as a co-inventor; all patents have multiple inventors.
目录

获得的荣誉

1990 Graduation Award of the Technical Faculty, University Erlangen-Nuremberg 
1994 Fellow, Audio Engineering Society (AES) 
1996 Innovation Award: Approval of Bavarian State Government 
1998 Silver Medal, Audio Engineering Society, "for continued contributions and leadership in the art and science of perceptual audio coding" 
2000 Board of Governors Award, Audio Engineering Society 
2000 Ceremony of German Future Award of Federal President for developing of the mp3 format to Karlheinz Brandenburg, Harald Popp and Bernhard Grill 
2000 Consumer Electronics Society, IEEE: Engineering Excellence Award, Region 10 
2001 German Internet Award NEO 
2003 Publications Award, Audio Engineering Society 
2004 SPUTNIK Innovator Award 
2004 IEEE Masaru Ibuka Consumer Electronics Award "for major contributions to digital audio source coding"

MP3的精彩故事

当你使用ipod,惬意的享受着音乐带来的快乐时,你知道第一支mp3格式的歌曲是什么吗?是susanne vega演唱的“汤姆叔叔的小餐馆”,所以susanne被称为是mp3之母。不过从源头来说,创造mp3格式的是一位名叫karlheinz brandenburg的朴素的德国人。尽管他自己并没有从这个如今最流行的数字音乐格式上获得大量的财富,却给一大批像苹果这样的公司带来了新的机遇。而为了表彰karlheinz的贡献,2000年10月19日,德国政府将德国未来奖颁给了他。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
早在1980年,Brandenburg还在爱尔兰根大学的电子工程科系读书时,他就开始研究数字音乐的压缩技术,当年的计算机须花10小时才能为长约1分钟的数字音乐文件解码。MP3最先由Karlheinz Brandenburg所在的 Fraunhofer IIS-A实验室在1987年开发出来,于1989年取得专利权,并在1992年合并到Moving Picture Experts Group (MPEG)规范中。在它推出后的一段时间内, Fraunhofer IIS-A并没有急着推出它的标准编码、解码和播放工具,因此那个时候MP3并没有显示出其强大的威力,对人们来说它还是一个陌生的名词。但随着计算机运算速度的飞速提升,Brandenburg领导的研究小组终于在1995年制定了MP3标准,能够实现数字音乐的实时压缩。
这里不得不说一下Fraunhofer IIS-A,作为国际性的研究实验室,Fraunhofer IIS-A(后缀-A是指Audio即音频部分)是高质量、低比特率音频编码领域的领导者之一。Fraunhofer IIS-A是MPEG Layer3以及MPEG-2 ACC的主要发展者。同时,Fraunhofer IIS-A也在MPEG-4的标准化构架工作中扮演了重要的角色。
MP3大受欢迎并未为Brandenburg带来大笔财富,他服务的非营利性研究机构Fraunhofer IIS-A享有这项技术的专利,Brandenburg本人对可分得的专利费用已相当满足。为表彰他的贡献,研究机构另成立了一个由他主持的分支机构,继续研究各种新式多媒体标准。
   同时MP3的发明也为Brandenburg在科学界赢得一定声望。为了表彰Brandenburg的贡献,2000年10月19日,德国政府在汉诺威世博会场中举行了一个颁奖仪式,德国总统约翰内斯・劳亲手将德国未来奖的奖杯和证书颁发给Brandenburg博士。与Brandenburg共同分享该奖的还有弗劳恩霍夫集成电路研究所的专家伯恩哈德・格里尔和哈拉尔德・波普。他们三人合作发明了播放音乐的MP3技术。
虽然一开始由于当时的条件所限,MP3还是个默默无闻的毛头小子。但是当Fraunhofer IIS-A进一步增强和提高MP3技术并使这项技术免费使用和进行开发以后 ,许多独立的开发人员和公司同时推出了各自的MP3工具,走在最前面的就是-Tomislav Uzelac,他推出了第一款桌面MP3播放软件,这就是鼎鼎有名的AMP播放器!AMP就是Winamp的鼻祖,这款MP3播放器很快受到了广大用户的欢迎。不久,一些大公司如RealNetworks和MusicMatch也加入了这个领域。1999年5月,RealNetworks推出了RealJukebox-一款集CD转录,编码,文件管理及播放于一体的应用软件,与此同时MUSICMATCH也推出了MUSICMATCH BOX播放软件,MP3播放软件的竞争如火如荼地展开了。
在MP3的迅速普及过程中,帝盟公司也曾扮演了重要的角色。它于1998年11月推出了世界上第一款MP3硬件设备-"Rio PMP 300"型MP3随身听。正是由于RIO随身听的推出,使得MP3的需求量急剧上升,让它迅速成为电脑领域的热点!同时也使MP3侵权问题得到了扩散。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
第一台MP3播放器:帝盟的RIO 300。不过当时MP3播放器由于Flash 成本昂贵,使用者观念等问题,的确遇到了不少问题,但现在那些问题基本上都得已解决。1999年,位于美国加州的NAPSTER公司为爱好MP3的用户提供了一个免费的软件-NAPSTER,它的出现更是让有关MP3的版权问题的争论达到了白热化的程度。
MP3,正在得意时!可以说,MP3不知不觉地代表了数字音乐,成为挑战资产阶级版权体系的急先锋。它在网上深受欢迎,资本主义唱片业的寡头们开始恐慌了,他们用尽各种办法,试图把这个小东西扼杀在摇篮里。
尤其是NAPSTER的出现,激起了整个唱片工业的勃然大怒!数十家唱片公司联名状告NAPSTER,要求其停止散布盗版音乐制品。2001年3月,这场官司终于以NAPSTER的落败画上了句号。MP3的威风也受到沉重打击!
对此,Brandenburg有他自己的看法,他认为,造成网络音乐交换及盗版行为的原凶并不是他本人,也不是MP3,唱片业是“自食其果”!,因为他们忽视了这项技术的发展潜力。Brandenburg指出,早在1995年时,研究小组便向各唱片公司提及这种未来可能改变世界的技术,但他们得到的回答却是:“嗯,这是个不错的想法。我们会继续留意。”
在去年3月召开的美国国会上,美国参议员弗里兹.霍林斯提出的《消费者宽带和数字电视促进法案》(CBDTPA,也称“霍林斯法案”)要求“任何数字媒体装置都必须含有并使用符合安全系统标准的标准安全技术”,否则就被视为非法,就是说将由美国政府选定用于版权保护的技术,并通过立法规定制造商必须在其生产和销售的电子产品中使用该技术。这一法案针对的不只是音乐,还包括数字视频、高清晰度电视等一切可能涉及版权问题的数字媒体。“霍林斯法案”是在去年第107次国会上提出的,不过那次会议的焦点后来全集中在伊拉克问题上,所以法案被暂时搁置,但今年肯定会被再次提出来的(摘自《科技新时代》)。

但是,青山遮不住,毕竟东流去,MP3依然是最受欢迎的音乐格式。

Karlheinz Brandenburg:MP3之父

你知道第一支MP3格式的歌曲是什么吗?对,Susanne Vega演唱的“汤姆叔叔的小餐馆”,所以大家都称Susanne为MP3之母。可是,正如夏娃是抽亚当的肋骨做成的,Susanne的封号是Karlheinz Brandenburg辛苦的见证——他才是这种全新数字音乐格式的真正缔造者。可是,他并没有借MP3而一夜成名,也没有靠它赚得大把钞票。这里有一个鲜为人知的故事。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg(1987年)
1977年,一位名叫Dieter Seitzer的德国教授想要通过一根标准电话线传输音乐,但是这种想法在前计算机时代实在太超前了。最初没人愿意给他提供研究经费,后来,这位教授还是多方设法招集一批对这个课题感兴趣的技术人员和科学家。Karlheinz Brandenburg就是其中之一,那时还是硕士研究生的他,非常喜欢数学、声学、电子学,也经常有各种稀奇古怪的想法。为了攻克这个课题,Brandenburg在爱尔兰根大学读了数学、机电工程两个硕士学位,并于1989年获得博士学位,博士论文的主要内容就是数字音频的编码、压缩以及感知测试技术。
在计算机出现之前,基本的压缩技术和理论已经成型多年,但很少有人将此应用到声音等媒介的压缩上。Brandenburg也很奇怪为什么当初音频压缩如此受冷落,尽管后来事实证明这蕴藏着巨大的商机。不过,他自己也没有想到这种纯粹为兴趣而研究的技术竟会掀起唱片工业革命、影响无数的人,“这简直就像在做梦”。在博士论文中,Brandenburg搭建起了音频动态压缩第三层(MPEG Audio Layer-3)、MPEG-2 高级音频编码(AAC)以及当代其他音频压缩方案。
1990年,在美国贝尔实验室短暂停留一年后,Brandenburg返回德国爱尔兰根大学任教并继续研究音频编码。这期间,他进入Fraunhofer集成电路研究所(Fraunhofer IIS-A)并组建MP3研发小组。Fraunhofe研究所是德国顶尖的研究机构,聚集着250名德国最优秀的研究人员,尽管所支付的薪水远远低于企业提供的报酬。在那里,Brandenburg和他的小组实现了MP3从理论到实际标准的转化。他们创建的标准不仅能够大幅削减音频文件的长度,更找到了保证声音不会因压缩而变形的最佳压缩模式,为此付出的代价就是长时间坐在电脑前,戴着专业耳机,把某些音乐的段落反复听上一千遍!

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
1995年,Brandenburg对外公布MP3标准。很快这项新标准便在互联网世界中掀起一股狂潮,很多人到Fraunhofe研究所网站注册,利用这项新技术开发他们自己的MP3文件和软件。不过,Fraunhofe研究所毕竟是一所非营利性研究机构,没有直接的软件合作商和专项预算做MP3的市场推广,它也不打算将此项技术卖给硅谷那些眼睛都红了的软件厂商。
Brandenburg也没从这项技术发明中获得任何私人利益,但他并不抱怨。在接受德国新闻杂志Der Spiegel的采访时,他说道:“我不在乎我银行账户上的数字,但是我满意我的工作、跟我一起工作的人和所发生的一切。”现在,Brandenburg每天最喜欢做的一件事就是上网看看有没有新的MP3网站和使用这项技术的人,“这给我很棒的感觉!”
另一方面,MP3技术的广泛传播撼动了整个唱片业,遭到各大娱乐巨头的围追堵截。对此,Brandenburg略带讥讽地说:“(唱片)工业界需要知道的应该是如何利用这种新的数字媒体和机遇。他们应该探寻积极的方面,而不是消极的一面。”不过,他对那些音乐创作者也充满同情,“他们的创作应当获得报酬,但这不是这项技术要解决的。”
Karlheinz Brandenburg就像一个出世的高人,心态平和地看待MP3带来的纷纷扰扰。可是,当提到他最新发明的“3D”音频技术Iosono时,他眼睛中闪烁着火花。“实现这种‘超真实’的音效是业内多年以来的梦想。如今,随着PC机配置的日益提高,已经完全有能力处理这种超真实音效。再加上‘Ionsono’技术的配合,必将给人们的视听感受带来一场革命。而这些在十年前是根本不可能实现的。”也许,对一个研究者最大的褒奖莫过于此。( 方茜 / 文)

MP3专利身世复杂 谁是持有人扑朔迷离

2007年3月:当美国的一个陪审团裁决微软公司没有向MP3专利的拥有厂商支付相应的专利费用、并判微软赔偿15亿2000万美元,但MP3的专利费用纠纷并未就此结束。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
MP3专利纠纷这个大漩涡,源自在二十年前制定MP3标准的各大厂商何研究机构,包括汤姆逊、皇家飞利浦和AT&T等。而这一系列专利的维权行动也愈演愈烈,采取了包括诉诸法律甚至要求海关查封相关的音乐播放器等。
目前MP3专利的最主要的持有者是德国的夫琅和费研究院(Fraunhofer Society),这一组织于1949年创立并发展成为欧洲最多的应用技术研究组织。
夫琅和费研究院的集成电路部门每年在MP3专利费用上在微软等知名软件厂商和苹果等著名消费电子厂商身上都赚取上百万美元。专利费用的价格是视频游戏收取2500美元或者每个音乐播放器收取2美元。
夫琅和费研究院的主页上明显的标示着这里是MP3的诞生地,MP3之家和MP3的发明者。组织中的音频工程师Karlheinz Brandenburg经常被德国的媒体赞誉为MP3之父。而Brandenburg认为,在研究院主页中的信心和标示都没有夸大其词。他指出,如果没有夫琅和费研究院的努力,就不会有今时今日MP3的辉煌。
而在上个月赢得了对微软的MP3专利权诉讼的阿尔卡特公司,也有自己的版本的MP3发展史。公司声称贝尔实验室是如今的MP3标准的前身的缔造这。阿尔卡特公司这起诉讼的代理律师John M. Desmarais表示,通常人们都误解了以为夫琅和费研究院发明了MP3,但贝尔实验室早在上世纪80年代就提出了MP3的基本技术。这样说并非对其他的MP3标准研发厂商不尊重,但最终的MP3标准大部分都是机遇贝尔实验室的研究成果而发展起来的。
Desmarais称,MP3专利有很多的组成部分,而贝尔实验室则拥有了最核心的两个技术专利。而这也并非意味着其他厂商不拥有MP3专利。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
而让MP3最终成为全球通行的标准的,是国际标准化组织(ISO)。这一总部在日内瓦的非政府组织对MP3的各种技术规范作了说明并作为标准保留下来了。在这一过程中,许多的建议被采纳并保留在第一版的音频/视频压缩标准(MPEG-1)中,这一工作于1992年完成并在1993年公诸于世。而这些被采纳的建议,包括Musicam和Aspec等,一直保留在后来的MPEG-1 Audio Layer 3标准中,也就是MP3标准当中。
因此不少厂商,包括荷兰的电子巨头飞利浦公司都声称对Musicam拥有专利权,因此也拥有MP3技术的部分专利权。飞利浦应用技术公司的项目经理Leon van de Kerkhof表示,在MP3专利这个问题上,现在已经十分清楚,它并不是只由AT&T、夫琅和费研究院和汤姆逊这三家厂商研发出来的,因为它是基于Musicam的。一直以来,汤姆逊和夫琅和费研究院都将自己摆在MP3发明者的位置上,但这并不意味着只有他们对MP3标准的制定作出了贡献,因此也并非只有他们拥有MP3技术的知识产权。
而汤姆逊公司的女发言人Martine Esquirou则确认,夫琅和费研究院和汤姆逊公司并非MP3的相关技术专利的唯一拥有者。她表示公司的专利授权程序,是涵盖了MPEG标准的基于20个单独的专利家族的。而公司已经将这些专利的使用权授予了超过400家硬件和软件厂商。
但在汤姆逊公司的清单中的厂商,如苹果、微软、摩托罗拉、诺基亚和三星等,同时也向Sisvel这一意大利厂商支付MP3专利费用。Sisvel公司表示,自己所拥有的MP3专利是ISO标准强制要求的。
而在今年二月,一个名不见经传的厂商Texas MP3 Technologies也加入到MP3专利之争的漩涡之中。它起诉苹果、三星和SanDisk公司侵害了自己的MP3专利。

新一代Iosono音频标准面世 MP3终将被淘汰?

2004年7月25日消息,MP3音频压缩标准创始人Karlheinz Brandenburg日前表示,他们又开发了一种新型音频压缩格式,该标准将为电影院、主题公园以及家庭的视听效果带来一次前所未有的新感受。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
    该项音频技术被称为“Iosono”,Brandenburg表示,这是一项真正的“3D”音频技术。通过该标准传出的马蹄声就好比一匹真实的高头大马跑过你的走廊。而且,即使是一声细小的噪音,也能给人一种“似乎是有人从远处真实喊出的声音”。
    Brandenburg还称,当前,即使是使用最高先进的环绕立体声音响,人们也只能在某个最佳位置上可以享受到这种感觉,一般是几英尺的范围。而“Ionsono”系统则不然,它可以让整个房间的所有人都能感受到这种“超真实”的音效。
    Brandenburg还表示:“实现这种‘超真实’的音效是业内多年以来的梦想。如今,随着PC机配置的日益提高,已经完全有能力处理这种超真实音效。再加上‘Ionsono’技术的配合,必将给人们的视听感受带来一场革命。而这些在十年前是根本不可能实现的。”
    Brandenberg认为,目前该项技术将首先应用到主题公园或一些特殊场所,然后会逐渐普及到家庭中。他说:“当前,该项技术将只能被一些高端设备场所应用,但最终必将普及到任意一个有音响设备的场所。”
    这主要是因为该技术当前还存在一个“鸡与蛋”的矛盾问题。只有更多的场所支持该项技术,那么音乐发行人才会大规模采用该技术。同理,只有更多的基于该项技术的作品面世,影院等场所才会支持该项技术。
    但据业内知情人士预测,该项技术的普及只是时间早晚问题。视听效果专家David Stump认为:“如果该项技术的确拥有普及价值,那么业界用户该项技术只是时间问题而已。”

MP3之父CES大展推云计算播放系统

北京时间2010年1月11日消息,曾让MP3播放器成为现实的德国电机工程师,现在将注意力放在如何将傻子装置变得聪明些。
目前担任德国伊尔梅瑙科技大学(IlmenauTechnical University)教授的布兰登堡(Karlheinz Brandenburg),正协助研发Perfect Stream技术,让网络云计算替简单电子产品思考。
布兰登堡和Perfect Stream研发伙伴参加今日闭幕的拉斯韦加斯消费电子展(Consumer ElectronicsShow),他向媒体表示:当我第一次碰到这群家伙时,这主意听起来很疯狂。但是我一向喜欢疯狂的点子,当我们刚开始研发MP3时,每个人也都觉得那很疯。
MP3现在几乎是无所不在的格式,用于在线数字档案,以及智能手机和音乐播放器等携带型装置。Perfect Stream的概念,是利用可和网络交流的装置,依据个人品味量身选取数字影音档案,再传送到任何兼容的播放工具。
此系统在德国已获成功,目前正在消费电子展把执照贩卖给美国网络公司。
Perfect Stream的塞米欧斯(Samios)表示:这项技术行得通,我们现在正设法将它推往国际。
布兰登堡表示,此套系统能选出个人喜爱的节目、新闻、音乐、Twitter,或是其它网络内容,传送至数字相框、车内导航系统、多功能手机、游戏主机等其它设备。

曾经沧海难为水 MP3,改变世界的十年

2008年对我们来说确实有太多值得关注的焦点,包括刚刚过去的北京奥运会、残奥会,科技元素成为当今社会不可或缺的组成部分。但是你知道吗,除了这些,今年还是MP3播放器诞生十周年、MP3音频格式诞生21周年的特别日子。一个小小的发明,不仅造就了每年几十亿美元的市场,同样改变了很多人的生活习惯……如果你有兴趣的话,不妨跟随我们的文章,去了解一下这个小家伙所不为人知的另一面吧。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
背景:MP3的前世今生
在MP3之前,我们也经常听音乐,不过那时候流行的是用其它方式—— 黑胶唱片、磁带、CD以及MD等。黑胶唱片是一种褐色的圆盘形胶片,上面刻有凹凸不平的坑纹以记录声音,不过受限于体积以及其它因素并没有大规模普及开来。

黑胶唱片
磁带是很多人都使用过的,相信很多朋友对使用“Walkman”的岁月还记忆犹新,除了经典歌曲带来的无限回忆之外,更多的恐怕是保存磁带的烦恼。关于保存磁带,当时有很多不成文的经验——注意不要让磁带靠近强磁场区域、磁带不使用时应放入盒内直立存放、存放温度不能过高过低、过干燥或者过湿润、收藏的磁带应该每年以快进方式将其重卷一次……只要想想这些麻烦,恐怕都会让现在已经习惯了MP3的朋友们感到头昏脑涨了。
Walkman曾经与磁带机划上了等号,而磁带则是那时候我们享受音乐的首选
有别于黑胶片和磁带的模拟记录方式,1982年由飞利浦公司和索尼公司制定的CD格式一经推出,行情就不断水涨船高——CD记录的是数字信号,可以明显降低干扰和噪声对声音的影响,而且保存时间、歌曲(曲目)的选择更自由。但CD也有自身的缺点,那就是光盘自身的缺陷使得划痕和污垢很容易造成误码;虽然可以通过一定的纠正电路来补偿,但在早期这些问题是非常突出的。而从CD衍生出来的MD虽然具有更大的灵活性,但因为专利授权的问题一直没有大规模推广开来。
从音质上来说,CD和MD已经能够让大众满意了,但数字音乐最大的问题并不在这里,一张CD光盘可以存储16首曲目,但却有640MB的容量。这就严格限制了数字音乐在计算机用户之间(尤其是互联网上)的相互交流,正因如此,缩小文件体积便提上了议事日程。也正是在这种大背景下,各种有损压缩的音频格式诞生了。
一个小东西改变了几亿人的生活娱乐习惯
现在说起MP3相信是无人不知、无人不晓,谁叫它是使用最广泛的有损压缩数字音频格式呢?不过它的发明者(单位)——德国Fraunhofer研究所就没有那么幸运了,1987年Fraunhofer研究所的工程师们制定了MPEG Audio Layer-3这个绕口的规范,到1992年,MPEG才正式将其作为标准规范,并改名“MP3”。据参与开发的技术人员介绍,这种音频标准在128Kbps的情况下压缩比为10∶1,也就是说只要60MB左右的容量就可以将整张CD都给塞进去。

不过也有很多人提出了反对意见,认为MP3相对于CD来说音质有所下降;但毕竟反对的人只是少数专业爱好者,绝大多数消费者并不愿意去深究CD和MP3之间的音质差别有多大,况且他们也听不出二者之间有多明显的差别。随着网络的普及和发展,MP3也迎来了自己第一个发展高峰。
MP3之父:Karlheinz Brandenburg
现在我们知道了MP3音频格式的诞生地是德国的Fraunhofer研究所,但其真正的“生父”却是一位名叫Karlheinz Brandenburg的德国人。

为了表彰其杰出的贡献,德国政府于2000年10月为他颁发了德国未来奖

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
Karlheinz Brandenburg(卡尔海因茨・布兰登保)和互联网之父Tim Berners Lee(蒂姆・伯纳斯・李)一样,并没有从自己所研制的产品中聚集财富,反而是成就了众多以此为依托的公司,如现在的Apple和Google。
为啥MP3能够压得那么狠?
虽然很多人并不明白什么叫无损压缩、什么叫有损压缩,但大家都想知道为什么MP3这样的压缩格式可以节约出9/10以上的文件体积呢?归根到底是因为MP3音频格式应用了心理声学的原理,简单地说就是使用复杂的理论算法,将我们耳朵不可能听到或不容易听到的音频信息去掉,从而降低音频文件容量大小。

举个简单的例子,一对情侣在距离我们不远的地方窃窃私语,这时一辆火车从我们身边飞驰而过,在轰隆隆的汽笛背后那对情侣的声音就显得微不足道了。MP3就是利用了这个道理,它只保留了汽笛的轰鸣声,而滤去了情侣的声音,所以就可以达到更高的压缩效率。利用心理声学的原理,采用MP3编码规格的音乐在常人听来就不会比CD等无损压缩的格式有太大的差距。
MP3的各种编码格式之间有什么区别?
如果细究MP3,大家会发现MP3的编码格式也有不同,其中最主要的方面就体现在编码速率上。目前来看,最常用的主要有三种方式——CBR(Constants Bit Rate,固定比特率)、VBR(Variable Bit Rate,可变比特率)和ABR(Average Bit Rate,平均比特率)。要说清楚三者之间的区别,就需要先了解一下什么是“比特率”。

比特率是一种数字音乐/视频文件压缩效率的参考性指标,比特率表示1秒内传送的比特数bps(bit per second,位/秒),常用的单位有Kbps和Mbps。音乐文件的比特率越高,意味着在单位时间内所处理的数据量越大,也就代表音乐文件有更多的采样信息和细节表现(注:相同算法下);但与此同时,高比特率的文件也会占用更多的存储空间,MP3文件可以使用的比特率一般从8Kbps到320Kbps。
如此一来,三种编码方式之间的差异就很好理解了。顾名思义,固定比特率就是整个文件的比特率是都一样的,好处是编码简单,缺点在于如果使用非320Kbps比特率的话,MP3文件的音质会随复杂程度而变化,也就是说越复杂的部分音质越差,因为表现不出更高的细节来。
可变比特率就是在一首歌(曲目)中对复杂的部分采用高比特率编码,而简单的部分就是用较低的比特率,这样就可以在音质和文件大小中间做到平衡。平均比特率则是在可变比特率的基础上出现的编码方式:在指定的文件大小内,以每50帧为一段,低频和不敏感频率使用较低的比特率编码,而高频和大动态表现时则采用较高的比特率编码。
播放器可以看到当前播放可取的比特率参数(图示为Winamp,上图为APE文件,注意码率的差别)
除了MP3之外,少数朋友可能还听到过另外一种音频格式——MP3 Pro,它又是何物呢?其实这是一种以MP3编码方式为基础的新型编码方式,于2001年6月的时候得到MPEG联盟认证并推广。MP3 Pro可以用64Kbps的比特率实现普通MP3 128Kbps比特率才能达到的效果,几乎将音乐文件在原来的基础上又压缩了一半。可能是MP3 Pro与MP3有着很好的兼容性,就连唱片商又或者播放器厂商都很少提及Mp3 Pro,至于普通消费者,深究其中差别的人就更少了。
MP3 PK WAV
除了MP3之外,经常用电脑的朋友一定不会对WAV(又称WAVE)文件感到陌生。借助Windows无所不在的影响力,WAV几乎成了通用的音频格式。打开Windows的录音机功能,系统会默认使用WAV文件将你的声音记录下来;很多音频软件也提供了将CD上所记录的信号通过抓轨的方式保留下来(比特率:1411.2Kbps)。虽然WAV可以保存无压缩的音频信息,但与MP3格式相比,WAV的体积实在太大了,一首曲目动辄就是几十MB,对于存储和交流都相当不便。

第一首MP3歌曲是什么呢?
饭后,我们随手拿出MP3播放器,将耳塞插入耳朵,就会响起优美的旋律,可是你知道世界上第一首MP3格式的歌曲是什么吗?很多人都回答不上这个问题。


(图)Karlheinz Brandenburg
Karlheinz Brandenburg
Suzanne Vega(照片拍摄于2006年)
第一首MP3格式的曲目名叫“Tom’s Diner”,它的演唱者苏珊娜・薇格(Suzanne Vega)也因此被称为MP3之母(Mother Of the MP3)。这首曲子旋律柔和、简单,使得在回放时很容易听出压缩格式的缺陷,因此当时Karlheinz Brandenburg教授也拿这首歌来评估MP3的压缩算法。
追根溯源:回味MP3播放器的鼻祖
时光倒回1998年3月的德国CeBIT,一家由三星集团分离出来的小公司(韩国世韩公司)展出了第一款MP3播放器——MPMan F10。以现在审美观来看,MPMan F10的确是非常丑,具体参数方面:91mm X 70mm X 16.5mm的三围、体重65克,有一块不足0.3英寸的单色LCD小屏幕,使用并口方式与电脑通讯。

全球首台MP3播放器MPMan F10
5个月后,帝盟公司拿出了改进型的RIO 300,增加了外置闪存(SM卡)插槽,0.7英寸的LCD屏幕。虽然RIO300不是第一款MP3产品,但却是第一款引发业界销售狂潮的产品,有资料统计显示RIO 300在全球发售了20万台以上。这其中除了帝盟公司对高音质的诉求之外,一场意外的官司也帮了RIO 300很大的忙——RIO 300上市后不久,其母公司帝盟就与美国唱片工业协会(RIAA)就版权保护的问题打起了官司,最终的结果以帝盟公司胜出而结束,而RIAA是赔了夫人又折兵,输掉了官司不说,还将RIO 300的知名度推到了一个空前的高度。以至于后来很多人误都认为帝盟RIO 300是第一台MP3播放器。
帝盟Rio 300
早期MP3产品的功能都非常简单,只能进行简单的MP3音频播放,至于录音、图片浏览、视频播放、FM广播以及TXT电子书阅读等都是想都不敢想。不过那时的产品已经打下了MP3产品的基本硬件结构和框架。
光看这幅解剖图,大家可能会觉得有些茫然,让我们为大家介绍一下各芯片的作用。
帝盟RIO 300拆解图
1.Micronas(#MAS 3507):音频解码芯片,完成所有的音频解码算法并将解码后的数据传送到数/模转换器;
2. Micronas(#MAS 3550):数/模转换器,负责将音频解码芯片解码后的数字音频流转换成为模拟音频流,再通过接口输出到耳机;
3.NEC(#uPD78P064GC):8bit MCU芯片,完成操作控制、LCD显示屏驱动、NAND Flash数据读取等工作;
4.Actel(#A40MEX04):专用接口电路控制芯片,完成电脑与MP3播放器的连接和通信;
5.Maxim(#MAX1706):电源管理芯片,负责将普通电池所提供的电压值升压到符合音频解码芯片和MCU芯片工作的电压值;
6.Samsung(#KM29U64000T):NAND Flash芯片,4颗8MB NAND Flash提供32M存储容量;
7.NXP(#74HC157): 四组2选1数据选择器,实现信号分时传送、组合逻辑函数和进行数据的串/并转换。

Apple iPod的异军突起
差不多在十多年前(1996年前后),苹果公司在历经辉煌之后陷入困境,曾被踢出门外的乔布斯也被请了回来,但苹果一直在为寻找一根“救命稻草”和新的突破点而苦恼。这种情况一直持续到2001年11月,第一代iPod产品发布,此时距离第一台MP3播放器诞生已经过去了3年多的时间。那iPod又是如何突出重围并成为领军人物的呢?


(图)Karlheinz Brandenburg
Karlheinz Brandenburg
新一代iPod Nano全家福
追根究底,友好的操作界面、创新的控制方式以及易用的iTunes软件都是不可忽略的元素;但更多人人认为,iPod不仅仅是MP3播放器,而是一种时尚产品。至今,iPod针对不同的群体已经拥有了Shuffle、Nano、Classic和Touch四大系列。据国外有关统计机构的估算,从iPod诞生至今已经成功销售出上亿台,这样的业绩足以让任何一家IT公司所侧目。
MP3与版权保护
在设计MP3之初,Fraunhofer研究院并没有深入全面考虑到版权保护这一现在看来相当重要的问题。也正是没有版权保护技术,才使得MP3如此容易的被修改、复制和通过网络下载。但没有版权保护的MP3音乐对于诸如iTunes Store这类商业在线音乐发行服务商来说是不能接受的。乔布斯能允许一个人买首Chloe Agnew的《Waking In The Air》然后让100个甚至于1000人分享吗?因此,iTunes Store让自己所销售的MP3支持DRM格式,防止受版权保护的音乐被侵权,遗憾的是,大多数保护机制还是能被无情的破解。而近几年来,随着音频数字水印的出现,相信将会对音频产品的版权保护起到积极的作用。

峰回路转再看MP3
现在我们已经知道,促使MP3诞生的主要原因就在于当时硬盘的存储容量有限,每GB存储成本居高不下而且网络带宽也不足以负载像WAV这样的无损压缩格式。但随着技术的进步,这几方面都有了长足的进步。最高320Kbps的比特率以前是MP3的长处(使用较低比特率压缩可以缩小文件体积),但在现在看来却成了一个短板——我们在嘈杂的环境中听MP3觉得还算将就,但是当你静下心来换上高质量耳机或者音响时就觉得不可接受了。甚至有些人开始有了“过河拆桥”的念头。


(图)Karlheinz Brandenburg图书
Karlheinz Brandenburg图书
APE:无损压缩技术的由来
能不能摒弃有损压缩的数字音频格式,而使用无损压缩的方式呢?所谓的无损压缩,顾名思义就是不会对原始的音频信号进行删减处理,在缩小文件体积的同时尽量与原始信号保持一致。仍然用刚才的例子,火车飞驰而过时,我们借助无损压缩技术以及高保真耳机/音响就可以听出那对情侣的窃窃私语。这一点是有损压缩所不能做到的,哪怕使用同样的耳机或者音响设备。

重担落在了APE身上,与MP3编码格式一样,APE也是一种对数字音频信号的编码方式,与原始的WAV文件相比,APE在保证音质一样的前提下,可以缩小一半的文件体积(压缩比2∶1,一张640MB的音乐CD,现在只要320MB就可以装下)。
APE真的是无损压缩吗?
很多人认为只要是压缩就会有所损失,而压缩比高达2∶1的APE文件能够做到跟WAV一模一样吗?国外就有这样“好事儿”的玩家,他为了验证APE是否是无损压缩专门做了一个实验,首先是提取出WAV格式文件的MD5码,然后用Monkey’s Audio音频转换软件将WAV压缩成APE格式,最后将APE格式解压成WAV后再次提取MD5码,得到的结果居然是压缩前后的MD码完全一致。看来APE是无损压缩所言不虚,类似的无损压缩格式还有FLAC等。

采用APE无损压缩格式的音乐越来越流行
PMP:除了能听,还要能看
MP3文件格式和播放器的出现满足了我们随时随地聆听数字音乐的要求,但“贪心”的人们远没有就此满足,除了用耳朵去感受周围这个世界之外,我们更主要的是用眼睛去观察。因此,不仅能听、而且能看的“MP3产品”应运而生了。

这就是我们常说的Portable Media Player(便携式媒体播放器,简称PMP),另外需要注意的是MP3的升级产品——MP4同样也具有视频播放功能,因此PMP与MP4在概念上的区别并不大。在专业人士看来,MP4特指那些只能支持MPEG-4视频格式的移动媒体播放器,而支持多种视频格式的产品则称之为PMP;但MP3的形象太过于深入人心,所以很多普通消费者都将这种随身播放视频的产品唤作MP4。
其实不管是MP4又或者PMP,要实现“看”的功能就必须要首先解决视频解码以及播放所带来的诸多问题,比方说速度、功耗、所能支持的视频格式等。这些问题在PC上面可能不算什么,但便携式产品对体积的要求非常苛刻,在狭小的体积和重量限制下实现上述功能就变得非常困难了。
第一台“能看的MP3”
到底谁发明了世界上第一台能看的MP3产品,现在已经很难考究了——因为当时的产品是一个不断演化的过程,现在公认度较高的说法是DMTECH推出的DM-AV10。它不仅可以听,而且还可以让用户通过LCD屏幕来进行图片浏览和观看影片。不过早期的产品多使用纯CPU的架构,因此视频的解码工作全部由软件来实现。这样对于视频播放速度以及品质都有一定的影响,最大的问题在于CPU架构的功耗非常大,所以续航时间成了这类产品的一块心病。

DMTECH推出的DM-AV10,很多人认为它是现在PMP产品的原型
随后的时间里,PMP产品的架构方案开始不断革新、改进。发展到目前为止,主要有两大方案——其一是DSP与CPU相结合,其二就是基于MCU来构建。前者仍然使用软件来工作,但是将音视频的编解码工作放在专用的DSP芯片中来进行处理,所以在效率、速度以及功耗方面都有了很大的进步;而且软件方案具备很强的灵活性,方便日后升级和改进。后者则是靠硬件来工作,因此在功耗和效能上都能达到最优,缺点在于硬件解码对文件的要求较高(例如飞思卡尔所提供的方案就只能支持MPEG-4和H.263编码的文件)。两种方案各有利弊,至于哪种更好则要看具体的使用情况,不过现在市场上流行的低价PMP产品多以后者居多。
就目前PMP的发展趋势来看,多功能整合、多格式视频支持、丰富的影音资源以及高清视频将是未来发展的重点。就像是在MP3中,人们要求添加对APE/FLAC无损格式支持一样,未来的PMP也必然会走向多格式视频支持的道路。

(图)Karlheinz Brandenburg
Karlheinz Brandenburg
数字移动广播,趋势所在
MP3因为“看”的需要从而进化出PMP产品,而当PMP遇到传统的无线广播时又会发生怎样的变化呢?很多人预测,那会是随身影音播放设备的下一个阶段。

作为一种新兴的媒体传送方式,数字移动广播受到国内外业界的广泛关注,其应用范围也在不断扩大,例如我们在电梯和公交车上看到的数字移动电视、奥运期间的手机电视等。目前,我国已经有两个统一的移动电视标准:CMMB和TDBM。
其中CMMB(中国移动多媒体广播)是国家广电总局广播科学研究所开发的一项基于混合式卫星和地面网络的移动广播标准;而TDMB则是一种基于3G移动通讯标准TD-SCDMA的移动电视标准。截止到目前为止,CMMB的应用已经大规模展开,例如奥运会期间各式各样能够支持移动电视的手机、PMP产品;而TDMB的应用就要稍微滞后一些。
结语
回首MP3产品发展的这十年,我们会感叹技术发展之迅速。从最早的只是播放MP3音乐这一单一功能的播放器,到大小视频通吃的PMP Player,再到现在如火如荼的CMMB移动播放器/手机……就算是Karlheinz Brandenburg本人也不会想到,当时不经意的研究,不仅造就了每年几十亿的产业,而且改变了很多人生活和工作的习惯。当我们现在想起往事时,真有一种“曾经沧海难为水,除却巫山不是云”的感慨!(对于时下流行的CMMB中国移动多媒体广播,我们将在后续的文章中为大家详细介绍其中的技术细节,敬请期待。)

参考文献

No comments:

Post a Comment