您当前所在的位置:首页 » 中音 » 揭开数字音频的秘密

揭开数字音频的秘密

来自:■根据《电子音乐家》杂志文章 金毓镇编写

我们刚进入一个全新的数字化时代,几乎任何领域都可以发现数字的踪迹。可惜就象许多科技成果刚刚来到我们身边一样,伴随而来的还有许多混乱、矛盾、不确实的说法,这篇文章如同科普读物,力图澄清数字音频技术的一些误解。
传说之一:文件的拷贝不总是完美的
模拟磁带之间的复制不是完美的,每次都会有损失,信号降级。但不能因此而认定所有的复制都具有同样的性质,在电脑上复制音频文件与复制模拟磁带完全不同。
当我们在电脑上复制文件时,不论是音频文件,Word文件或者软件程序,操作系统将认真地复制每一个字节。如果Word文件错了一个字节,也许出现拼写错误,格式错误,甚至更糟。如果程序中有错字节,也许根本打不开。因此精确的复制至关重要,数字音频文件也不例外。电脑不但复制,还要逐字节的核对,以确保复制的准确。如果核对中发现问题,电脑会提醒你注意。无论在磁盘之间复制,或者从硬盘复制到CD-R,备份到磁带,全都照此办理。
传说之二:所有的文件压缩都导致音频降级
音频的压缩格式,如同大家已经熟悉的MP3,改变了录音媒介的面貌,使它便于在因特网上传送。MP3格式使用“有损”压缩使文件缩小,“有损”的意思表示并不是全部音乐数据都存储到MP3文件,压缩过程只保留了重要的数据,不太重要的数据则被丢弃。压缩的MP3在回放的时候从新构成音频文件,无论如何它的品质必然低于原始文件。
因为MP3是广为流传的压缩音频文件格式,有人就以为所有的音频压缩全部是有损压缩。事实并不如此,Emagic的Zap和Wave的TrackPac是专门设计的无损音频压缩格式,它们在压缩文件时保存全部数据,只是将文件的大小减少到50%。
许多通用的压缩程序同样执行无损压缩,如常见的PKWare的PKZIP,Computing的WinZip,Aladdin System的Stuffit等。用这些软件压缩音频文件就象压缩Excel文件一样,每个字节都不会丢失。不过用它们压缩音频文件,不象MP3或专门压缩音频的软件一样能够戏剧性地缩小文件的尺寸。
音频的压缩格式,如同大家已经熟悉的MP3,改变了录音媒介的面貌,使它便于在因特网上传送。MP3格式使用“有损”压缩使文件缩小,“有损”的意思表示并不是全部音乐数据都存储到MP3文件,压缩过程只保留了重要的数据,不太重要的数据则被丢弃。压缩的MP3在回放的时候从新构成音频文件,无论如何它的品质必然低于原始文件。
传说之三:CD质量
一些音频产品广告中泛滥的“CD质量”词句已经让人听得耳朵生老茧了。最初问世的时候,它是暗指某产品具有相当于16-bit,44.1KHz规格的CD唱片的音质。不幸这一说法很快被滥用,一块仅30美元的声卡,就敢说信噪比65dB,达到CD质量。虽然16-bit从理论上讲可以达到90dB信噪比。此外象MP3、MD也夸口称CD质量,也许它们原来的素材是CD唱片,但是经过了有损压缩降低了文件的尺寸和保真度,它们不再具有CD质量。
还有更糟的说法:“近似CD质量”。对于不熟悉市场上欺人之谈的老实人,“近似”就是“事实上”。而广告宣传上的这两个词对应该解释为“没有”才对!
再谈问题的另一方面,“CD质量”就好吗?多年以前,16-bit,44.1KHz是先进技术的同意语,而三年前录音工业已经普遍转向24-bit,96KHz规格,更高的CD唱片规格正在酝酿之中,泛指的“CD质量”可以休矣。
传说之四:24比特
分解度是衡量数字设备品质的一个主要标准,不幸以它推测产品的水准也不可靠了。我记得有一次会议上比较两个厂家的20比特数/模转换芯片,有人觉得其中一片的噪声和性能更象是14比特的水平,厂商竟然说其中有6个市场比特!真不知良心何在。
所以不要看见24比特就以为具有相同的音质,事实证明精心设计的16比特设备在声音上可以超过粗制滥造的24比特器材。
D/A和A/D芯片有各种质量,大厂家的产品形成系列,例如24-bit, 44.1或48Khz的产品依据噪声和其他性能分出不同的价格。对于最小的抖动(Jitter)指标,时钟的品质非常重要。一些高端A/D/A厂家舍得在这里花钱,时钟的稳定性经常是它们宣传的重点,而小厂家干脆回避这一问题。
最后,要记得D/A和A/D中间的A是模拟,转换器中的模拟部分更能显示工艺水平,而这部分的差异对整体品质至关重要。
传说之五:抖动是录音造成的(颤抖、跳动、抖动、时基误差)

在理想世界里,数字音频的采样和回放是非常均匀平稳的,例如44.1KHz系统中每秒采样44100次,各次采样和间隔时间精确到丝毫不差。而现实世界没有那么完美,时间上会有微小的赶前错后,这就是抖动。抖动造成数字音频的失真,但这种失真与我们在模拟世界常见的失真完全不同。它不象吉他音箱过驱动出现的幅度失真,它是时间上的失真,造成音频波形变形。插图上图表示对正弦波采样时发生抖动;下图表示该采样在没有抖动的情况下回放,造成波形失真。如果回放的时钟也有抖动,失真将更严重。
每台数字音频设备都会产生一定的抖动,只不过有多、少的差别。抖动能够“积累”,如果信号通过多个信号处理设备,抖动会更加严重。用数字系统录模拟信号时,抖动会“冻结”。也就是你每次回放音频都不可避免的听到录音时抖动的效果,再加上来自数/模转换器的抖动。
然而两套数字系统间的录音就不一样,一旦数据进入数字领域,抖动就不再被纪录。实际捕获的只是一系列幅度值,数字媒体不再存储各样本的时间信息。时间取决于采样率,在回放的时候由数/模转换器的时钟新建时间信息。
数字音频磁带系统甚至并不直接从磁带放音,它们先把数据送进缓冲内存,再从缓冲内存输出。这样带速和数据之间的空隙都不会影响数据输出。
传说之六:数字复制是完美的
如果在DAT、CD或数字多轨机之间作数字复制,你一定希望它们是完美的,因为它们不过就是0和1,而且我们在前面讲到过电脑复制文件是非常精确的。但是用磁带、CD等媒介录音的时候情况有点不同。
电脑从硬盘中读出文件时如果出现差错,电脑将重复读操作,企图消除错误;读备份磁带时如果出现差错,电脑将控制磁带机倒带重读。但是DAT和CD回放时不能这样做,否则音乐就会断断续续的。和电脑的做法不同,DAT和CD使用错误更正系统自动解决这个问题。
用得最多、最有效的是Reed-Solomon码(理德-所罗门码)它能够纠正许多数据错误,但是也有连它也无能为力的时候,结果就出现一个或更多的空白字节。这时需要纠正系统的“二梯队”,通常称作Interpolation(插补)的技术参与工作。
比如有一系列采样2,6,(空缺),14,15。最简单的插补法是在空缺处的前后数据间拉一直线,由此得出2,6,10,14,15。更完善的插补是根据空缺处前后的数据趋向,用曲线代替直线。如此修补过的数据变成2,6,12,14,15。决定插补值时使用的参考点越多、越密,插补值就越有可能接近正确。
音频通常总是连续性的波形,用这样的插补法修正个别空缺,几乎完全听不出破绽。但是如果磁带或磁头有问题,造成了较大段数据空缺,插补法就会露馅。一些DAT和MDM机器能够显示当前的错码率,应该经常留意观看。
还有更严重的问题,例如一段连续有错的DAT带子可以造成自动纠错系统“罢工”,录音的结果变成一片数字噪声。
抖动是另一个问题。AES标准规定了输出端允许的最大抖动和输入端能够容忍的抖动,因为考虑到设备的串联,后者比前者大许多倍。符合这一规定的设备一般不会在抖动方面遇到太多问题,但有些老设备可能生产于标准形成之前,与它们的交流就容易出问题,会出现噪音。
其他的问题还有:数字音频电缆也是容易被忽视的“牺牲品”,包括松散的连接,污染,阻抗不匹配。DAW的问题往往与磁盘有关(例如缓冲区太小)或处理器跳动造成系统过载。
最后,数字音频中脉冲样的杂音,低电平的咝声等可能是由不正确的字时钟设置所造成。两台数字设备连接传输数据只能共同工作于一个主时钟,否则就会出现许多问题。
传说之七:所有的数字合成器和效果器的声音都一样
说得详细一点:全部数字均衡器的声音一样;全部虚拟模拟合成器的声音一样;全部数字压缩器的声音一样。答案是:如果相对于模拟设备而言,差不多是这样。如果数字设备之间比较,并不一样。
高档次和劣质的模拟设备声音可以差得很远,即使两台高档次的设备(无论均衡器、压缩器或合成器)的声音也完全不相同。数字硬件和软件的情况也基本如此。
数字和模拟音频的一个很大差异在于频率范围。从理论上讲,模拟音频的频率范围是无限的,而数字音频(不论硬件或软件)的频率上限是由采样率限定的。
许多模拟处理假定频率范围无限,当然它们实际做不到。例如标准的模拟均衡器有一个围绕中心频率对称展开的钟形曲线,一侧斜向0Hz,另一侧斜向无穷高频率。在数字均衡器上同样的均衡执行高频一侧将急速下降,终止在采样率的1/2处。如果采样率为44.1KHz,终止点就是22.05KHz。
在均衡中心点接近采样率一半的时候数字均衡器开始呈现奇怪的球状特性,有时它更象是带谐振的高通滤波器。
压缩器、振荡器也有类似的问题,各厂家依靠自己受专利保护的技术从不同的角度解决频率阻隔问题。
传说之八:硬件的声音比软件好

数字音频处理无论使用硬件或软件,也不管用独立硬件,DSP卡或通过plug-in使用主机CPU,起决定作用的是算法,是一场数字的游戏。
所以声音基本与硬件和软件无关,但如果仔细推敲,在技术和实践方面还有些问题可以探讨。
从技术方面讲,如果硬件环境不同,你也许不能总是使用一个算法。电脑用两种方法进行计算,一种称为定点,另一种称为浮点。许多DSP使用Motorola 56000系列芯片,它内部使用定点算法;其他如SHARC芯片使用浮点算法;电脑参与的处理则同时使用两种算法。在某些情况下,某种算法可能更适宜,这就需要算法的设计者精心为不同的硬件分别设计。最终的声音可能完全相同,也可能略有差异。
技术方面,由于所有产品内在的算法有很大差异,一个厂家的硬件产品与另一个厂家的软件产品可能差异更大。
厂家预置音色是合成器很重要的组成部分,内置的效果器与这些音色密切相关。没有最好的声音设计,甚至最好的算法也出不来好声音。相反,天才的声音设计可以使平凡的算法发出惊人的好声音。
因此甚至内部算法相似的两个产品,由于声音设计者的不同,声音相差很远。
硬件和软件的声音为什么不同并没有理论上的答案,就如同苹果和桔子缺乏可比性一样。

Copyright ©2013 Centrmus. All Rights Reserved. Privacy Policy/Your China Privacy 中音公司版权所有,未经允许不得转载,
地址:北京朝阳区建国路88号SOHO现代城D座0712室 电话: 01085801115 传真: 01085801114 邮编:100022