![女子唱歌的照片。](http://www.hallspoultry.com/media-library/photo-of-woman-singing.jpg?id=25561045&width=1200&height=1468)
当你不小心按下控制面板上的“换CD”按钮时,你正在用家用音响听你最喜欢的平克·弗洛伊德的CD。当你的CD播放机急迫地转向播放下一个碟盘里的任何东西时,一切都安静了一会儿。带着恐惧,你绝望地去抓音量旋钮,但为时已晚——你的扬声器播放着Green Day的最新专辑。你的反应就像被大头针扎了一下一样,你的手猛拉到音量旋钮上,把音量关小了。你松了一口气。但这还没完。十分钟后你觉得有些不对劲。即使你很喜欢这张专辑,你也不能再听了。你把它关了,累了,困惑了,困惑了。当你从一张经典专辑转到一张现代专辑时,这种情况似乎总是会发生。 What you’ve just experienced is something called overcompression of the dynamic range. Welcome to the loudness war.
在过去近20年里,这场被许多发烧友称为对音乐(和耳朵)的攻击的音量之战一直是唱唱业的公开秘密。近年来,随着数字技术的进步,cd的音量已经突破了极限,音量之战也得到了更多关注。“战争”指的是唱片公司之间为了制作越来越响亮的专辑而展开的竞争。但是,这场音量之战可能不仅仅是提高音量和激怒发烧友,它可能会导致未来几年音质技术的停滞。
过压缩
音量大战的确凿证据是20年前和现在歌曲波形的差异。
这里有一个例子:
第二种波形不仅具有比第一种更高的振幅,而且高度压缩——其最高点与平均水平之间的差异非常小。换句话说,这首新歌的动态范围大幅缩小,即声音中最响亮的部分(峰值)和最安静的部分之间的差异。
音乐和演讲一样,都是动态的。有安静和吵闹的时刻,它们互相强调,并通过它们的相对音量来传达意义。例如,如果有人正在说话,突然大声喊叫,喊叫的音量除了内容之外,还传达了一种信息——可能是紧迫感、惊讶或愤怒。
当一首歌的动态范围为了达到响亮的程度而被大幅降低时,声音就会变得类似于某人不停地喊他或她说的话。不仅所有的冲击都消失了,而且恒定的声音水平也会使耳朵疲劳。那么,为什么获得越来越大的音量如此重要,以至于音乐的自然起伏被轻易地牺牲了呢?
答案要追溯到录制音乐的开始。
黑胶时代
对于主流流行音乐来说,音量一直是一种可取的品质。一首歌的声音越大,它就越能从周围的噪音中脱颖而出,就越能吸引你的注意力。研究人类如何感知声音的心理声学领域的研究表明,人们根据声音的平均响度而不是峰值响度来判断声音的大小。因此,即使有两首歌中最响亮的部分达到了相同的分贝(dB)响度,平均水平较高的那首通常被认为更响亮。
早在20世纪60年代初,唱片公司就开始了一场音量大战,因为他们发现自动点唱机里声音大的歌曲比声音小的歌曲更能吸引眼球。为了保持竞争优势,唱片公司希望不断提高歌曲的音量。但是黑胶唱片的物理特性限制了工程师不断提高音量的能力。
黑胶唱片由一层漆片组成,漆片上刻有v形的小凹槽——模拟声音的振动转录。在录音棚里录制唱片涉及到一个被称为“母版”的过程,在这个过程中,歌曲在声音上进行调整,并按照适当的顺序排列,以适应给定的媒体要求。黑胶唱片的掌握总是在音量和播放时间之间取得平衡。你想让一首歌的声音越大,为了适应更大的转录幅度,凹槽就需要越宽。由于每张黑胶唱片的可用表面积有限,提高音量就意味着牺牲播放时间,尤其是在一张长时间播放(LP)唱片上,每张唱片的每一面都要放6首以上的歌曲。
为了节省制作每张专辑过多的黑胶唱片的成本,播放时间通常比音量更重要。现场音乐的动态范围通常为120分贝,最高音量与喷气发动机的音量相当(尽管一些音乐会的声音甚至更大)。黑胶唱片往往有大约70分贝的动态范围。这意味着为了把一首歌放进唱片里,它要么需要降低整体振幅,要么需要压缩——把它的峰值降低到一个较低的水平——以适应给定的范围。每一张唱片做了多少都是不同的,并定义了掌握的艺术。然而,模拟信号处理工具限制了可能的压缩量。
这个时代的模拟压缩器基本上是电压控制放大器,它根据控制电压改变输出信号的电平,类似于调幅收音机中调节信号的设备。这种压缩器通常用于单个乐器音轨(人声、吉他等),以增加声音的清晰度或改变乐器的声音以达到效果。然而,在某些情况下,比如摩城唱片公司推出的热门单曲(例如Honey Cone的“Want Ads”),压缩器被用来将歌曲的音量提高到高于平均水平。精通工程师通过缩小一首歌的动态范围来实现这一点,这样整首歌就可以在它突破介质的物理极限之前被放大到更大的程度。这被称为“热”母版,通常是在唱片的每一面只包含一首歌的单曲上完成的。然而,总的来说,歌曲和专辑的平均水平在整个时期保持相对稳定。
“CD”的行为
“数字音频和激光唱片的发明为之前已经存在的音量竞赛提供了新的动力,”鲍勃•卡茨(Bob Katz)说,他是一位著名的唱片制作工程师,也是最早直言不讳地批评动态范围过压缩的人之一。“原因是模拟媒体不允许我们所谓的‘正常化’到峰值水平。”
当光盘(CD)在20世纪80年代初推出时,有很多让发烧友高兴的事情。数字音频消除了乙烯基施加的许多物理限制,例如对表面噪音(由灰尘、划痕、漆本身等引起的)和有限的动态范围的担忧。该CD能够支持约96 dB的动态范围。在20世纪80年代的大部分时间里,CD仍然是高端产品,唱片工程师基本上没有数字信号处理技术,CD唱片发行倾向于利用这种更好的动态范围。
黑胶唱片因其物理特性而具有不同的响度限制,而CD唱片则因其指定的数字化标准(一种脉冲编码调制(PCM))而具有明确的峰值响度限制。PCM以前曾在电话中用作模拟信号的数字化方法。当模拟信号被采样进行数字化时,信号的每一电平都被量化(存储为二进制的数字)。信号的采样频率由采样率指定,并且能够存储的唯一量化级的总数由比特数决定。当索尼和飞利浦为CD音频指定标准时,他们确定采样率为44.1 kHz,每个采样16位。根据经验法则,每比特的动态范围近似为6.02 dB, CD音频的动态范围大约为96 dB。最高响度级别(所有1的16位)被指定为0分贝满量程(dBFS)。较低的水平被分配负数。
在20世纪80年代,cd的普及使得歌曲的平均均方根(RMS)在-20 dBFS到-18 dBFS之间徘徊,达到了-6 dBFS的峰值。20世纪90年代末,随着多碟CD更换机开始在家庭中崭露头角,同样的点唱机式音量竞争又开始了,因为唱片公司希望自己的CD比竞争对手的更突出。到20世纪80年代末,cd上的歌曲被放大到峰值开始突破0 dBFS的音量极限。在这一点上,要提高歌曲的平均水平,而又不剪掉它们最大声的部分(在数字领域相当于失真,信息因为超过比特容量而丢失),唯一的方法就是压缩峰值。
虽然模拟压缩机在降低峰值水平方面受到了限制,但数字压缩机的功能要强大得多。随着母版工程师开始掌握数字信号处理工具,他们能够更“热”地掌握歌曲。这个过程类似于在一些乙烯基上所做的事情——将单峰水平降低一定数量,然后整个波形被放大,直到(现在减少了)峰值再次达到0 dBFS。结果呢?整首歌的平均水平提高了。
20世纪90年代,在极端情况下,平均振幅水平从-15 dBFS左右上升到-6 dBFS。然而,这十年中的大多数歌曲仍然保持在-12 dBFS左右。进入21世纪以来,音量大战达到了顶峰,目前大多数歌曲的平均音量为-9 dBFS或更高。从20世纪80年代中期到现在,cd的平均音量增加了10倍,歌曲的峰值现在是过去的十分之一。音量大战也不仅仅局限于四大唱片公司(华纳音乐集团、百代唱片、索尼BMG和环球音乐集团)。过度压缩现在很普遍,独立厂牌和国际唱片公司都在使用。
CD已死;响度继续
从15年前到今天,最大的变化是人们消费音乐的方式。今年年初,ipod的全球销量超过了1亿台,越来越多的人开始在路上听音乐,而不是在家里的音响前。像cd这样的实体媒体正在被淘汰。然而,过度压缩仍在困扰着音乐界。
尽管CD可能正在垂死挣扎,但网上大多数数字音乐都是为CD制作的。流行的格式如MP3、AAC和自由无损音频编解码器(FLAC)仅仅使用数据压缩技术(不要与动态范围压缩混淆)来减少用PCM编码的歌曲所占用的数据量。只要cd的幽灵继续困扰着网络世界,下载的歌曲仍然会受到过度压缩的影响。
但问题不仅仅在于生产端。如果人们在嘈杂的环境中听歌,比如在车里、火车上、机场候机室、工作场所或宿舍里,音乐需要更大的声音来补偿。动态范围压缩就是这样做的,甚至更多。它不仅提高了歌曲的平均音量,而且这样做也消除了一首歌中所有安静的时刻。因此,听众现在能够在噪音中听到整首歌,而不会被任何听不见的低部分所困扰。
这可能是大多数人完全没有意识到现代音乐中动态缺失的最大原因之一。他们总是在不太理想的环境中听歌。但很多听众都在潜意识里感受到了过度压缩的歌曲所带来的听觉疲劳,也就是继续听音乐会变得很累。
“你想要有气息的音乐。如果音乐停止了呼吸,这是一堵连续的声音墙,那就会让人疲劳,”Katz说。“如果你也大声听,它可能会比旧音乐更早损伤你的耳朵,因为旧音乐有呼吸的空间。”
一些发烧友通过回到过去来寻找解脱。一些音乐家仍然继续在黑胶唱片上发布他们的专辑(除了cd和在线格式)。因为黑胶唱片不能像CD那样支持响亮的声音,所以这些现代黑胶唱片要比CD唱片安静得多。但它们通常也没有那么压缩,在某些情况下,重新灌录的方式就像20世纪60年代和70年代发行的专辑一样充满活力。
其中一个最突出的例子是Red Hot Chili Peppers最近的专辑《Stadium Arcadium》,这是由唱片工程师Steve Hoffman重新制作的黑胶唱片,目的是提供完整的动态声音。霍夫曼是少数几个拒绝接受某些工作的母音工程师之一,因为他被要求过度压缩音乐。霍夫曼说:“这种事一直都在发生。“至少一周一次。”
但是,用黑胶唱片来录制未压缩的音乐可能并不总是能带来拯救。为了节省重制的成本,唱片公司可能会简单地把一首歌的压缩母版,降低整体的音量,然后把它放在黑胶唱片上。Katz警告说:“你可以把Red Hot Chili Peppers的唱片放到黑胶唱片上,就像它从CD唱片上出来一样,听起来也会很疲劳。(唯一的区别是)你只需要把音量控制调大,因为你无法得到相同的峰值水平。”
推倒墙
发烧友们展望未来,希望从过度压缩中解脱出来,但他们看到的是一幅模糊的图景。DVD-Audio和超级音频光盘(SACD)是两种高保真格式,被认为是解决音量战争的解决方案。这两种格式不仅提供了比CD更大的动态范围,而且还提供了更高的采样率。这允许将高于大多数人能够听到的频率编码到介质上,解决了那些更喜欢模拟而不是数字的人的常见抱怨,因为他们声称他们能听到这些频率。
DVD-Audio使用PCM编码,可以支持24位192千赫的立体声(与CD的16位44.1千赫相比),产生144分贝的动态范围,比人类的疼痛阈值高出14分贝。SACD和CD一样,是由索尼和飞利浦开发的,使用一种称为直接流数字的脉冲密度调制(PDM)编码。基本上,它不是以44.1 kHz的频率进行16位采样,而是以64倍的频率(2.82 MHz)进行1位采样。它的动态范围约为120分贝。此外,SACD和DVD-Audio都能够提供高保真的五声道环绕声。
然而,自2000年推出以来,这两种格式都没有站稳脚跟。绝大多数的发行都是古典音乐类型的,通常一开始就没有受到过度压缩的影响。因此,即使发烧友愿意花300多美元购买DVD-Audio或SACD播放器,他们也很可能无法通过这两种媒介购买自己喜爱的流行专辑。
由于音乐已经在线,拥有高保真数字文件的可能性仍然存在,FLAC等格式能够支持24位音频。去年被罗技(Logitech)收购的Slim Devices公司已经开发出两款产品——Squeezebox和transporter——可以将数字文件从电脑或互联网无线传输到高端立体声接收器。Slim Devices前首席执行官肖恩•亚当斯(Sean Adams)表示,这两款手机都能处理24位音频,但问题在于内容不足。
“如果我们要提高音质水平,真正的问题是把内容传出去。现在,不幸的是,唱片业已经从CD的质量上倒退了。当MP3问世时,它被称为CD质量,但实际上并不是。”亚当斯说。“从那以后,我们通过更好的(压缩技术)做了一些改进,但这实际上是人们对更好音质的要求。在唱片业开始制作之前,这必须先做到。”
然而,过度压缩似乎是需要克服的最大障碍之一。随着音乐被压缩到越来越小的动态范围,对下一种高保真音频格式的需求消失了。如果唱片公司没有充分利用cd的动态功能,那么为什么要麻烦地转向另一种具有更多潜在未使用功能的格式呢?由于普通消费者要么完全不知道,要么只是下意识地对过度压缩的音乐现状感到恼火,因此音质几乎没有提高的动力。因此,更高质量的音频——逼真的动态范围、更大的频率响应和多声道环绕声——的所有潜在好处仍然没有被看到,即使技术已经存在。发烧友们被迫重新使用20年前就应该过时的黑胶唱片和模拟唱片。
但仍有希望摆脱这场音量之战。RMS(平均)归一化算法,如Replay Gain,已经在许多数字音频播放器中实现,并将数字库中的所有歌曲带到相同的平均水平。启用重放增益后,来自许多cd的歌曲将以一致的平均响度进行处理和回放。这对听众很有帮助,因为他们不再需要每次从一张专辑转到另一张专辑时都要调整音量。虽然这种正常化并不能消除音乐的压缩(它会放大或减少歌曲的整体),但它抵消了任何让一首歌比另一首歌更响亮的努力,基本上完全消除了音量战争。
许多人希望,重放增益(Replay Gain)等技术的广泛应用将使唱片公司认识到,以竞争响度的名义进行越来越多的压缩是一项徒劳的任务,慢慢地,但肯定地,流行音乐将开始回到一种动态的、压缩程度较低的状态。事实上,许多数字音频播放器已经流行起来;Winamp使用重放增益,iTunes有自己的标准化选项,称为声音检查,也适用于ipod。
音量大战能否结束,下一代高保真音频能否诞生,在很大程度上取决于消费者的态度。与CD和DVD视频不同的是,目前还没有大规模的工业生产来提高音质水平。歌曲和专辑听起来如何完全取决于听众是否真正关心音乐的复杂性。