音频资源

关键词: 音频 数字化

音频资源(精选十篇)

音频资源 篇1

1. 模拟音频准备。

数字化生产的第一步是模拟音频的准备。模拟音频的载体有很多种, 目前常见的有磁带 (盒式、开盘式等) 和唱盘。磁带的数字化准备包括:磁带载体状态和材质成分的识别、氧化层与基层之间粘连的修复、载体各种变形和损伤的处理、磁带表面的无损干燥清洁等。唱盘的数字化准备包括:唱盘状态和材质的识别、唱盘载体的清洁、唱针的合理选择以及重放速度的确定等。

2. 模拟音频播放。模拟音频播放通过播放设备实现。播放设备一般有开盘式磁带机、盒式磁带机、唱盘机等。

3. 音频混合。

音频混合是一个可选过程, 它有两个功能:一是将音频混合设备 (如音频混合板) 置于模拟音频播放设备与模/数转换设备之间, 在数字转换之前对由模拟音频播放设备播放出的模拟信号进行增强处理, 提高数字转换的质量;二是可以将多个模拟音频播放设备与模/数转换设备连接起来。

4. 模/数转换。

模/数转换是数字化生产的核心。实现这项功能的设备称为模/数转换设备, 这种设备在目前市场上有很多规格, 如16位、24位等。

5. 数字音频编辑。

数字音频编辑包括音量调节、跟踪、频率均衡、噪音降低和压缩处理等, 需要使用专门软件 (如Tools, Sound Forge, Adobe Audition等) 完成这些操作。并且, 数字音频编辑还有助于提高音质, 因此被广泛应用于各种副本的生成中。但数字主文档必须谨慎使用。

6. 数字音频存储。

数字音频存储涉及的问题主要有两方面。一是格式, 常用的有WAV、AIF和MP3等。其中, WAV和AIF是非压缩格式, MP3是压缩格式。文件文档的存储选择应考虑的是这种格式目前的兼容性和未来的可持续发展性, 宜选择压缩格式, 以扩大容量;数字主文档的存储应考虑音频的保真度, 适宜选择非压缩格式, 以确保音频的高保真度。二是存储器, 通常使用的存储介质有光盘 (CD、DVD) 、硬盘 (包括RAID硬盘存储系统) 和磁带备份系统等。

二、图书馆音频信息资源数字化生产系统的构成

1. 硬件系统。

(1) 模拟音频播放设备。目前常用的模拟音频播放设备有开盘式磁带机、盒式磁带机、唱盘机等。

(2) 音频混合设备。音频混合设备除了用于增强模拟音频播放信号外, 还可用于多频道输入的均衡和调节。当生产系统需要多端输入时 (如, 磁带机、唱盘机及其他模式音频播放设备等) , 音频混合设备可以连接所有输入设备, 形成对模/数转换设备的单一入口。但是, 音频混合设备要谨慎使用, 因为从模拟音频播放到模/数转换之间的路径越直接, 模/数转换质量越高。

(3) 模/数转换设备。在模拟音频数字转换流程中, 模/数转换设备十分关键。模/数转换设备发送到计算机的数字信号质量直接决定了最终数字音频的生产质量。有些项目采用声卡进行模/数转换, 但这种方法可能会把外部噪音引至转换系统, 从而影响数字音频的质量, 而模/数转换设备则避免了这种现象。购买模/数转换设备时应注意的技术指标有噪音水平 (d B) 、采样频率 (k Hz) 和采样位数等。目前, 高端模/数转换设备至少包括44.1k Hz和96k Hz2种采样频率, 以及16比特和24比特2种采样位数。

(4) 计算机。数字化生产音频工作站使用的计算机主要具有2方面的作用:一是连接模/数转换设备, 作为模拟音频的数字转换输出接口, 接收并暂时存储数字音频文件;二是通过软件对数字音频进行编辑 (如, 音量调节、跟踪、频率均衡、噪音降低和压缩处理等) 。由于一般的数字音频文件都比较大, 因此上述2种用途的计算机都需要2个关键技术指标, 即处理能力和RAM容量, 来保证对音频文件的快速、高质量处理和存储。

2. 软件系统。数字化音频工作站会使用到多种软件, 常用的有以下2种。

(1) 音频编辑软件。音频编辑软件可以对音频文件进行各种编辑操作。操作之一是基于音频数字主文档生产出音效最优化的副本, 这种副本可以通过编辑软件进行音量级别的调节、无声间隔的删除、噪音的消除或降低等操作来实现。操作之二是对音频信号的调节, 合理设定声级。如果声级定得太高, 会有超载和失真现象;如果声级定得过低, 会受到噪音的侵扰。一个高质量的声级计无论是在模/数转换过程中, 还是在利用软件对音频信号进行调节的过程中, 都是必不可少的。声级的设定有成批设定和单独设定2种, 前者是对一批相似的录音设定一个声级, 后者则是对每一个录音单独设定声级, 后者针对性更强, 效果也更好。

音频资源 篇2

【摘 要】近年来,临清市市区范围内陆续发现多眼中低温地热井,本文通过研究该区地质、构造和重力异常特征,分析了该区地热资源的成矿有利条件。采用音频大地电磁(AMT)对该区进行勘探,编制了大地电磁综合视电阻率剖面图,研究了不同岩性地层的电磁性特征,结合该区重力异常特征和电性特征,从热源、热储和地下水三个方面,综合分析了该区形成地热资源具备的地层、热源和构造条件。最终确定了井位和井深,为钻探施工设计提供了较为可靠的依据。结果表明,AMT在寻找浅层地热资源中有着积极的效果。

【关键词】AMT勘探;地热资源;布格重力异常;电性异常

地热是集热能、水和矿产于一体的多用途、绿色自然资源,并且开发利用方便无污染,在能源需求日益紧张的今天,有着巨大的开发前景和经济开发潜力。尤其是对于中小城市具有重要的经济、社会和环境价值,因而受到广泛重视。近年来,临清市市区范围内陆续发现多眼地热井,水温40℃~70℃,属于中低温地热资源。大地电磁法,是利用天然音频大地电磁场作为场源,属于被动源电磁法,观测电场和磁场分量。近几年,大地电磁法在方法理论和仪器设备都得到了很大的发展,应用领域也扩展到了普查,勘探石油、天然气、地热、金属矿产、水文、环境等各个方面,从而成为受地质学家重视的一种地球物理勘探方法。

1.地球物理特征

一般环境下,第四纪和第三纪陆相碎屑沉积岩,电阻率一般在15~50Ω·m;中生代陆相碎屑沉积岩电阻率值一般在25~500Ω·m,晚古生代的电阻率一般为50~1000Ω·m,电性稳定,奥陶系灰岩电阻率最高,一般在2000~20000Ω·m,系本地段电阻率无穷大标志层。

大地电磁法,是采用天然场源的一种电磁法,它是以电磁场的理论为基础,在地球物理勘探中,利用介质的介电常数、磁导率和电导率的差异而达到解决不同地质问题的目的。通过以上区内地球物理特征分析,不同岩性的地层具有明显的电磁性差异。因此,在区内利用大地电磁方法勘探,具备良好的地球物理前提。

2.工作方法技术

大地电磁法,是利用天然音频大地电磁场作为场源,属于被动源电磁法,观测电场和磁场分量。

自然界存在着天然变化的电磁场,其频谱范围约为104Hz~10-4Hz,甚至更低。高频部分(大于1Hz)起因于大气层的雷电活动,低频部分起因于太阳活动抛出的等离子体流与地球磁层间的相互复杂作用。来自高空的电磁波,可近似的看成是垂直入射地面向地球内部穿透,感应出电场和磁场,感应场与地球内部的岩石电性分布有关。电磁波频率愈低穿透深度愈大。通过研究大地对天然电磁场的频率响应,可以获得不同深度电阻率的分布,根据电性分布特点来解决地质问题。

3.资料推断解释

3.1重力异常特征

由临清地区布格重力异常图可以看出,该区重力场△g值一般在(-6~-40)×10-5m/s2之间变化,局部重力异常总体呈椭圆状北东走向展布,相对重力高与重力低相间排列。在临清地区附近形成两个重力异常带。

(1)夏津西~临清~冠县相对重力低异常带:重力场总体反应沿北东走向展布的重力低异常带,带宽15km左右,△g值一般在(-24~-30)×10-5m/s2之间变化,为地层相对凹陷区,即冠县凹陷。从重力异常分布看,临清城区附近为重力异常值最低处,且异常呈不规则椭圆状沿近东西向分布,与西部清河—临西以西凹陷相通。可以说,临清城区附近与周围相比是凹陷中局部凹陷区,对寻找地热更为有利。

(2)清河东—临西—冠县西重力异常带:该带总体沿NE40°走向展布,△g值一般在(-6~-20)×10-5m/s2之间变化,反映了地层相对凸起特征,即馆陶凸起。在临西北由于受NW向构造的影响,地层相对下降。

3.2电性异常特征

由本次实测的4条大地电磁测深视电阻率断面图可以看出,该区自上而下根据其电阻率异常高低,大致可划分为4大电性层,总体异常特征呈似层状,向西缓倾。下面结合Ⅰ剖面视电阻率断面图的电性特征和区内已知地质特征,予以分析解释[2]。该剖面在垂向上总体电阻率较低,根据其电性总体特征大致可划分4大层[3]:

第一层:电性稳定,电阻率低缓,等值线间距宽大平缓,厚度0~500m。该层又可细分为上下两段,上段为高阻电性层,在断面图上表现为等值密集,表明其局部电阻率差异较大。

第二层:电性高低变化较大,层位不稳,等值线杂乱。上段以巨厚的高低阻互层,等值线呈锯齿状跳跃的不稳定特征,厚度在500~1350m之间,其电阻率整体较上覆地层高、下伏地层低。

第三层:为稳定的高低组互层,层位稳定,呈两高两低的电性分布特征。据其电性特征分析上部高阻为中粗砂岩,下部高阻为砾岩,中部低阻为泥岩。

第四层:为区内相对高阻层,以水平层状高电性层为主要特征,反映了其地层相对稳定的沉积地质特征,埋藏深度在1800m以下。

3.3综合推断解释

由布格重力异常特征分析,临清城区附近包括该区在内,为凹陷区内的局部凹陷区,地热成矿条件更为有利;由本次物探资料分析,区内热储馆陶组顶板埋深1500m左右,上覆第四系及新近系明化镇砂质粘土、泥岩等巨厚的保温层。

在该区内,东部为冠县断裂,该断裂走向北北东,向西陡倾。西部紧邻临清断裂,该断裂走向北北东,向东陡倾。两断裂形成了冠县凹陷。

据前期研究,其热源为正常的大地热流增温。盖层为第四系黄河组、平原组和新近系眀化镇组,是非常好的隔水层和保温层,使热能得以保存和储集。主要热储层包括馆陶组和东营组。热储层中地下水在缓慢侧向径流过程中,接受下部大地热流而增温,临清断裂、冠县断裂等成为地热水与深部热源沟通的通道。

该区从地貌特征来看,处于谷地漫滩地形。热储馆陶组岩性为中粗砂岩、砂砾岩等。赋存有丰富的碎屑岩类孔隙裂隙水;区内经历了多期构造活动,裂隙发育。充足的地表水,广阔的补给区为地下水的补给提供了足够的水源。

4.结论

本次工作通过对区域重力资料布格重力异常特征及本次剖面异常特征的综合分析[4]认为:重力资料反映区内区域构造临清断裂和冠县断裂异常反应明显,尤其是对冠县凹陷和馆陶凸起反映清晰。大地电磁测深剖面所反映的地层层位清楚,尤其是对热储层馆陶组的顶底板埋深,反映清晰,为钻探施工设计提供了较为可靠的依据。表明AMT在寻找浅层地热资源方面有着积极的作用。

【参考文献】

[1]杨进,安海忠.音频大地电磁法在秦岭地区的地质效果[J].物探与化探,1995,04:286-290.

[2]刘祜,程纪星等.电、磁综合方法在南方硬岩型铀矿勘查中的应用[J].物探与化探,2011,28(6):739-742.

[3]柳建新,曹创华等.综合物探方法在青藏高原某钼多金属矿的勘查效果[J].地质与勘探,2012,17(6):1188-1198.

音频资源 篇3

多年实践表明, 地热资源是一种十分宝贵的综合性矿产资源, 其功能多, 用途广。地热资源的综合开发利用, 在社会、经济和环境效益均很显著, 在发展国民经济中已显示出越来越重要的作用。一般来说地热资源埋藏深, 开采风险大。为了减少开采风险, 提高效率, 开发地热资源必须进行地质调查, 地球物理勘查是地热资源勘查的重要方法之一。随着地热资源开发的难度越来越大, 深度也越来越深, 这就要求我们寻找更有效方法。我们通过CSAMT法在某地的深部地热勘查中取得较好的地质效果。

1 方法简介

CSAMT法是上世纪八十年代兴起的一种物探方法。该方法根据电磁感应的趋肤效应, 高频的电磁场穿透深度浅、低频电磁穿透深度深的原因, 随着频率的改变, 探测深度也随之改变[1]。从电磁波的趋肤效应理论分析可得到趋肤深度公式:

式中:H为探测深度, ρ为电阻率, f为频率。

从 (1) 式可知, 当改变发射机的频率时, 探测深度也随之改变, 这样就达到变频测深的目的[2]。

2 技术措施

CSAMT法具有信噪比高, 观测信号强, 设备较为轻便, 生产效率高等优点。这符合我们进行地热勘查的要求。

本次工作所使用的V8型接收机系统出队前经过了认真检查, 符合有关规定, 均可在野外施工使用。

在野外数据采集前与外业工作结束后均按技术要求对设备进行了标定。经检查, 标定的相位谱和电阻率谱曲线规则、光滑, 符合《CSAMT法技术规定》要求。

(1) 供电系统:电源为30k W柴油发电机组, 发射机型号为TXU30, CSAMT实发最低工作频率为53.33Hz, 最高工作频率为9600Hz。

(2) 采集系统:接收主机型号V8。CSAMT一般布置6个电道, 1个磁道。测量采用不极化电极, 接地电阻一般小于2000Ω, 个别点位因地表条件较差, 接地电阻在4000Ω左右, 采集频率同发射频率。主要采集技术参数为:每测点按设计工作频率表依次扫频观测, 每个频率叠加次数按采集时间满足1分钟或叠加60次。自动记录、存储。

(3) 同步系统:发射与接收采用GPS卫星时间同步, 精度为0.1ns。

(4) 观测方式:CSAMT采用赤道偶极排列。

3 实例分析

该工区平行布置了4条剖面, 各剖面异常形态与电性结构具相似性。4条剖面较好地反映了不同地电特征的岩性界面。

3.1 解释思路第四系 (Q) :

主要岩性为漂砾层, 残坡积层以及冲积层, 该套地层电阻率变化较大, 厚度不大, 分布不稳定, 非本次勘查主要电性层。

CSAMT法工作主要反映工作区内垂向电性结构特征, 岩体:区域岩浆岩为灰白、浅肉红色中粗粒似斑状黑云母花岗岩为主, 电阻率值较高。与地层岩性引起的异常面貌差异较大, 在断面图上呈较明显叠加异常特征。

断面异常等值线密集梯级带、一定线性方向的扭曲、低值异常的一定方向的突出、异常的不连续与错位等现象预示断裂构造的存在。

3.2 解释与推断

下面以通过1线卡尼亚视电阻率共轭梯度反演断面异常为例进行分析解释。

从图1上可以看出在测点260下部存在两个高阻圈闭视电阻率大于3000Ω·m, 横向电阻率梯度变化明显。表层有明显低阻带根据实际野外岩石出露情况推断该区域为第四系。

F1左右两侧电阻率明显错位, 且F1所处位置为以高阻带, 符合断裂带电阻率分布特征, 故推断F1可能为以断裂带, 倾角为20度左右。

F2右侧为一高阻圈闭, 上部电阻率较低推断其为震旦系地层, 下部电阻率明显升高推断其为花岗岩体。F2左侧电阻率为中低组带推断其为震旦系岩层。根据地层接触关系推断F2右侧的高阻圈闭为地层构造运动所造成的硅化带。F2附近电阻率梯度变化大, 且具有一定线性方向故推断其为断裂带, 倾角70度左右。

从剖面方向看, 可明显看到一条低阻带穿过两个高阻圈闭, 符合断裂带电阻率特征, 故可以推断该区域存在一条F3的断裂带, 倾角90度左右。

在530桩号附近密集梯级带, 可能与冲沟相关, 认为此面也可能是富水层位。

4 结束语

通过上面工程实例的分析, 可以CSAMT有如下特点:CSAMT法相对其他电磁法抗干扰能力更强, 探测深度大优势相对明显, 并且具有对低阻异常敏感的特点, 能有效地划分断层破碎带。CSAMT法以电阻率差异为依据, 是一种间接找水的物探方法。在利用这种方法进行找水工作时, 如果很好结合工区地形地质环境, 地球物理特征, 和其他有关资料进行综合分析研究, 可能会取得更佳实际应用效果。

参考文献

[1]陈乐寿.王光锷.大地电磁测深法[M].北京:地质出版社, 1990:10-41.

[2]何继善.可控源音频大地电磁法[M].长沙:中南工业大学出版社, 1990:13-21.

音频资源 篇4

关键词:音频工作站Pro Tools 5.1 声道环绕立体声

中图分类号:TP39文献标识码:A 文章编号:1007-3973(2010)06-055-02

随着时代的发展,计算机技术发生着翻天覆地的变化,音视频技术也实现了从模拟到数字的飞速转变。经过多年的发展,Pro Tools音频工作站近年来已成为音乐、广播、电影、电视中数字音频制作的标准。 同时提供了世界上功能最强大的,基于TDM技术的实时数字信号处理技术,并拥有众多第三方插件的音频效果处理功能。使其成为音频制作行业、电影电视领域、广播及多媒体制作领域中的标准平台。

那么怎样利用Pro Tools音频工作站来完成5.1声道的音频制作呢,首先我们来了解一下什么是5.1声道。

1什么是5.1声道

从数字编解码格式标准来分,5.1 声道环绕立体声目前主要有美国Do1by标准、DTS 标准和世界标准化组织的MPEG2-AAC标准,其中以Do1by系列和DTS系列应用最为广泛。

自20世纪50年代开始研究环绕声以来,环绕声录音格式也从过去的LCR、Quad、LCRS发展到现在的5.1,6.1,7.1甚至更高。杜比数字可在占用较小带宽的前提下完成优质的5.1 声道环绕声编码,现已成为高清电视、数字广播、DVD Audio等世界范围内的音频标准。Dolby与DTS系列中的一些最新编码技术也已经成为下一代数字电影院和蓝光盘的事实性标准。

近几年“高清”概念不断成为人们关注的焦点,作为音频“高清”标准的5.1 声道环绕立体声已经成为现代影视声音制作的标准规范,它给影视作品带来了前所未有的震撼力和感染力。一些比较知名的声音录制压缩格式,譬如杜比AC-3(Dolby Digital)、DTS等都是以5.1声音系统为技术蓝本的,其中“.1”声道,则是一个专门设计的超低音声道,这一声道可以产生频响范围20~120Hz的超低音。其实5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声,把对话集中在整个声场的中部,以增加整体效果。相信每一个真正体验过Dolby AC-3音效的朋友都会为5.1声道所折服。

5.1采用左(L)、中(C)、右(R)、左后(LS)、右后(RS)五个方向输出声音,使人产生犹如身临音乐厅的感觉。而所谓5.1声道音箱,“5”是指2个主音箱(前置音箱)、2个环绕声音箱、1个中置音箱共5个音箱,而“.1”是指超重低音音箱,用于进一步烘托环境,还原标准配置的5个音箱不能很好重放的超重低音(一般100HZ以下),也称低音炮。

2Pro Tools音频工作站的概念

由美国DIgidesign公司出品的Pro Tools系统是当今世界上应用范围最为广泛的计算机音频工作站。大到顶级的录音棚,小到个人的录音间,你到处都可以看到它的身影。

Pro tools是一套真24位,综合了数字录音、编辑、处理和混音的音频工作站。 自从它问世以来,Protools|24正逐步改变音频工作者的思路。过去常用数小时的工作现在只需几分钟的时间就能完成。以前有限的工作需要建立在大量预算的基础上,而现在极具创造性的Protools|24对音乐或者音频进行后期制作即可实现。Pro tools音频工作站的出现大大提高了音频的创作效率。

迄今为止,尚未有另一个系统可以象Pro tools一样提供如此全面,如此强大的编辑工具,这些功能远远超出了基本非线性编辑中对音频进行剪切、复制、粘贴一类的简单功能。Pro tools软件具有单键编辑的操作功能和各种高效的操作方式,利用它们对制作内容进行组织、操作、查看非常便捷。每个工具都是按照录混音实际操作的需要精心斟酌设计。

3利用Pro Tools音频工作站完成5.1声道的音频制作的系统流程

Pro Tools音频工作站是目前最先进的工作站之一,那么这样的工作站怎样来完成5.1音频节目的制作?一个优秀的数字音频工作站,应该能为创作人员带来前所未有的便利性和灵活性。以下,本文将从前期准备、后期编辑、放声系统的设置与调校三部分对环绕声系统使用流程进行详细说明。

3.1前期准备

由于环绕声节目的制作比过去的立体声要复杂得多,所以不能将制作立体声节目的理念沿袭到制作环绕声节目中。5.1环绕声的拾音一般要求录制信号应具有宽频带、高信噪比、大动态和高量化精度和采样频率等特征。只有这样,记录下的声音才能更好地对原始信号进行还原再现。专业声卡一般提供较低的延迟,较容易实现多轨同步录音。

Pro Tools软件具有符合专业要求的声音录入和播放。所谓的专业要求,也就是说从指标上最低应该采用16-bit、44.1kHz的音频格式,频响范围应该达到 20Hz~20kHz,而动态范围和信噪比都应该接近90dB或更高。

其次,能够同时播放至少8个音频轨。由于可以进行同步分轨录音,所以计算机音频工作站能够同时录入几个音频轨似乎并不显得十分重要。但作为计算机音频工作站至少应该可以同时播放8个音频轨,以满足2轨人声、2轨立体声MI DI音乐、l至2轨声学乐器 、2至3轨单独电子音色的需要 。

3.2后期编辑混缩

5.1声道节目在音频工作站Pro Tools系统里可以进行编辑缩混。在ProTools下,我们能够用耳朵、眼睛、手并用去做混音,使这一过程变的相当容易。ProTools 软件的工作界面允许对混音的各个方面进行处理,软件和控制台之间共享信息,您做的每一项操作在两者之间是相互映射的。电脑系统对混音数据进行处理,而您可利用直观的ProTools用户界面去操作具体的混音步骤。ProTools软件提供了多种可变通的方法进行控制和制作自动缩混。所有处理都是非破坏性的,并在可恢复的友好环境内完成。而在一些特别的音乐节目制作中,你也无须离开ProTools环境就可制作环绕声。ProToolsTDM软件能够混录多种流行的环绕声格式——包括LCRS,5.1,6.1,和7.1格式,——并且可几种环绕声格式的制作可同时进行。一旦完成了session的环绕声混音,您就可以将混录的session 交付给您的客户了。ProTools可以同时将声轨分配给多个输出目标,从而提交不同需要的文件格式。它通过共享多个不同混音格式的声像信息完成这个过程。例如,如果您是按7.1格式做的混音,您可以通过分配系统的多重输出,获得一个5.1或立体声混音。这让您可以同时制作多重混音格式。

4总结

显然,利用流行并享有盛誉的Pro Tools音频软件来完成对5.1声道的音频制作是极佳的选择。但是5.1 声道环绕声节目制作目前还处在发展阶段,面临的困难也比较多,要走的路也很漫长。希望通过本文能提供给音频爱好者关于Pro Tools软件的信息以及对5.1 声道环绕声节目制作工艺流程的一个参考。

注释:

顾肖联.电视音响创作技巧[M].北京:中国广播电视出版社,2004:282-299.

胡泽,雷伟.计算机数字音频工作站[M].北京:中国广播电视出版社,2005:439-454.

韩宪柱,刘日.声音素材拾取与采集[M].北京:中国广播电视出版社,2002:179-194.

张伟,刘晋芳. 基于计算机的5.1 声道音频工作站系统构建[J].北京:中国现代教育装备出版社,2009年第6期:64-66.

数字音频压缩编码及音频播放器制作 篇5

1 音频信号处理基本概念

1.1 模拟音频与数字化音频

自然的声音是连续变化的, 它是一种模拟量。比如当人们对麦克风讲话时, 麦克风能根据它周围空气压力的不同变化而输出相应连续变化的电压值, 这种变化的电压值是对人讲话声音的一种模拟, 称为模拟音频。要将模拟音频变为计算机能存储和处理的对象, 必须将模拟音频数字化。

数字化音频的获得是通过每隔一定的时间测一次模拟音频的值并将其数字化, 通常包括采样、量化和编码。每秒钟采样的次数称为采样频率。根据采样定理, 只要采样频率等于或大于模拟音频信号中最高频率成分的两倍, 信息量就不会丢失, 即可以由采样后的离散信号不失真地重建原始连续的模拟音频信号, 否则就会产生不同程度的失真。采样定律用公式表示为:fs≥2F或Ts≤T/2, 其中f为被采样信号的最高频率。

由模拟量转变为数字量的过程称为模-数转换。计算机要利用数字音频信息驱动扬声器发声, 还需要将离散的数字量再转变为连续的模拟量, 该过程称之为数-模转换。在大多数计算机中, 这些功能是通过声卡来完成的。音频信号的一般处理如图1所示。

1.2 数字化音频信号的压缩编码

1.2.1 数字化音频信号压缩编码简介

数字化的音频信号必须经过压缩编码处理才能适应存储和传输要求, 才能在再生时得到最好音质的声音听觉。音频信号压缩编码主要依据人耳的听觉特性。人的听觉系统中存在一个听觉阈值电平, 低于这个电平的声音信号人耳听不到, 可以不必保留这部分信号;当几个强弱不同的声音同时存在时, 强声使弱声难以听到, 当声音在不同时间先后发生时, 强声使其周围弱声难以听见。声音编码算法就是通过这些特性来去掉冗余数据, 从而达到压缩数据的目的。

一般来讲, 根据压缩后的音频能否完全重构出原始声音可以将音频压缩编码技术分为无损压缩及有损压缩两大类。无损压缩包括不引入任何数据失真的熵编码;有损压缩包括波形编码、参数编码和同时利用这两种技术的混合编码方法。波形编码利用采样和量化过程来表示音频信号的波形, 使编码后的波形与原始波形尽可能匹配。波形编码的特点是在较高码率的条件下可以获得高质量的音频信号, 适合对音频信号的质量要求较高和高保真语音与音乐信号的处理。典型的波形编码包括脉冲编码调制 (PCM) 、差值量化 (DPCM) 、自适应量化 (APCM) 、自适应差值量化 (ADPCM) 等。参数编码把音频信号表示成某种信号的输出, 利用特征提取的方法抽取必要的模型参数和激励信号的信息, 并对这些信息编码, 最后在输出端合成原始信号。参数编码的压缩率很大, 但计算量大, 保真度不高, 适合于语音信号的编码。典型的参数编码有线性预测LPC编码等。混合编码介于波形编码和参数编码之间, 集中了这两种方法的优点。典型的混合编码有多脉冲线性预测MP-LPC、码本激励线性预测CELP等。

1.2.2 常见音频压缩编码方式

常见的音频压缩编码有MPEG-1音频压缩编码、MPEG-2音频压缩编码、杜比数字AC-3音频压缩编码等。

(1) MPEG-1音频压缩编码

ISO/IEC的MPEG音频编码的标准化采用了两种编码算法:MUSICAM和ASPEC。以这两种算法为基础形成了3个不同层次的音频压缩算法, 对应不同的应用要求并具有不同的编码复杂度。在MPEG-1的音频编码标准中, 按复杂度规定了3种模式:层1、层2、层3。层1采用MUSICAM算法, 典型码流为384kbps, 主要用于小型数字盒式磁带。层2等同于MUSICAM称为掩蔽模式通用子带集成编码与多路复用, 典型码流为256kbps~192kbps, 广泛应用于数字音频广播、数字演播室等数字音频专业的制作、交流、存储和传送。层3是综合了层2和ASPEC的优点提出的混合压缩技术, 它的复杂度相对较高, 编码不利于实时, 主要应用于因特网上高质量声音的传输。如今流行的MP3音乐就是一种采用MPEG-1层3编码的高质量的数字音乐, 它能以10倍左右的压缩比降低高保真数字声音的存储量, 使一张普通的CD光盘上可以存储大约100首MP3歌曲。层3是MUSICA和ASPEC两个算法的结合, 典型码流为64kbps。

MPEG压缩等级与压缩比率如表1所示。

ISO/MPEG音频编码 (层3) 结构图如图2所示。

MPEG-1层3中采用改进余弦变换MDCT。MDCT的表达式为:, 其中k=0, …, N/2; (固定时间偏移量) 。余弦变换在边界处存在固有的不连续性, 导致在块边界处产生较大噪声, MDCT采用域混叠抵消TDAC技术, 有利于消除这种噪声。做MDCT前要进行加窗处理: (是窗函数, 它的长度等于变换块N的长度) , 从而降低边界效应对谱分析的影响, 提高频率选择性。窗函数的选择必须满足。窗函数越长, 编码效率就越高, 但是过长会使时域分辨率下降, 选择窗函数应该兼顾编码效率和时域分辨率。

PCM数据输入经过分析滤波组被分割成若干子频带信号, 同时数据流经过FFT变换模块, 动态求出每个编码频带的掩码阈值。MDCT对滤波器组的不足作了一定的补偿, 把子带的输出在频域里进一步细分以达到更高的频域分辨率。比例设置和量化器模块根据掩码阈值对子频带信号进行量化, 量化后得到的数据分别经过Huffman编码模块和边信号编码器模块进行编码, 再经过多路复用器MUX得到码流。

(2) MPEG-2音频压缩编码

MPEG-2的音频压缩编码采用与MPEG-1相同的编译码器, 层1、层2、层3的结构也相同, 但它能支持5.1声道和7.1声道的环绕立体声。

MPEG-2 BC是一种类似MP3的音频压缩算法。MPEG-2BC压缩编码主要是在MPEG-1和CCIR Rec.755的基础上发展起来的。与MPEG-1相比较, MPEG-2主要在两方面做了重大改进, 一是支持多声道声音形式;二是为某些低码率应用场合, 进行低采样率扩展。同时, 标准规定的码流形式还可与MPEG-1的第1和第2层前、后向兼容, 并可依据CCIR Rec755与双声道、单声道形式的向下兼容, 还能够与Dolby Surround形式兼容。

MPEG-2 AAC是MPEG-2标准中的一种非常灵活的声音感知编码标准。就像所有感知编码一样, MPEG-2 AAC主要使用听觉系统的掩蔽特性来减少声音的数据量, 并且把量化噪声分散到各个子带中, 通过全局信号把噪声掩蔽掉。在MPEG-2的正式听音测试中, 数据流速率为320kbps的AAC可以提供比数据流速率为640kbps的MPEG-2 BC更好的音质。因此AAC是一种比MPEG-2 BC编码算法更好的音频压缩算法, 而且可以适用于各种环境下, 如可以做电视信号的伴音等。它的主要缺点是后向兼容性不好。

(3) 杜比数字AC-3音频压缩编码

杜比数字AC-3是美国杜比实验室开发的多声道全频带声音编码系统, 采用第三代ATC技术, 被称为感觉编码系统, 它将特殊的心理音响知识、人耳效应的最新研究成果与先进的数码信号处理技术很好地结合起来, 形成了这种数字多声道音频处理技术。它提供的环绕立体声系统由5个 (或7个全频带声道加一个超低音声道组成, 所有声道的信息在制作和还原过程中全部数字化, 信息损失很少, 细节十分丰富, 具有真正的立体声效果, 在数字电视、DVD和家庭影院中被广泛使用。

AC-3编码原理结构图如图3所示。

PCM数据流经分析滤波器组变换成频域信号, 频谱信号以二进制浮点形式表示, 将频谱信号的指数和尾数部分分别处理。指数部分由频域包络模块处理, 采用差分编码, 编码后的指数部分代表整个信号的频谱, 可以作为频谱包络参数, 供比特分配模块处理, 从而动态求出比特分配信息。尾数部分按照比特分配信息进行量化编码, 量化编码后的尾数与频谱包络编码数据流一起按照AC-3数据帧打包组帧, 形成AC-3码流。

1.3 声音的重构

模拟音频要经过采样、量化和编码, 就能得到便于计算机处理的数字语音信息, 如果要重新播放数字化语音, 必须经过解码、D/A转换和插值, 其中解码是编码的逆过程, 又称解压缩。以ISO/MPEG音频解码 (层3) 为例, 结构图如图4所示。D/A转换是将数字量再转换为模拟量便于驱动扬声器发声;而插值是为了弥补在采样过程中引起的语音信号失真而采用的一种措施。声音重构的一般过程如图5所示。

2 音频播放器简介

文中介绍的音频播放器如图6所示, 该音频播放器能实现mp3、wav、mid、wma等格式音频文件的播放。

3 音频播放器制作过程

3.1 音频播放器制作中所需控件及变量设置

3.1.1 所需控件

TMediaPlayer控件 (可以通过MCI播放多种多媒体文件, 如mid、mp3、wav、cd音乐文件和avi、wmv文件等) 、3个TEdit控件 (分别显示正在播放文件的时间进度、正在播放文件的信息、重复播放区域的设置) 、若干TBitBtn控件 (用于对文件进行操作) 、TListBox控件 (用于显示播放列表) 、TTrackBar控件 (用于控制播放的音量和播放的进度) 、以及TTimer控件和TOpenDialog控件。

3.1.2 设置变量

说明:在程序代码中出现的其他变量为控件中的局部变量。

在Form中设置全局变量:

3.2 音频播放器各功能模块

在此仅介绍较为复杂的功能。

3.2.1 文件打开

该模块的功能是打开若干需要播放的文件, 并把这些文件加载到ListBox当中, 形成播放列表。若列表框中无任何文件, 则直接将打开的文件加载到列表框中;若列表框中已有文件, 则将打开的文件与列表框中已有的文件逐个进行比对, 判断文件是否已经加载过, 若已经加载过, 则不加载。在此功能模块中, 需要利用数组变量SongDir记录加载进去的文件的路径 (不包括文件名) , 并利用变量addfileflag判断是否为第一次添加播放文件, 如果是则自动选中播放列表中的第一首歌曲并显示该文件的信息, 同时改变变量addfileflag的值, 保证以后添加进去的播放文件不影响正在播放的文件。文件打开功能模块处理流程如图7所示。

3.2.2 静音

该模块的功能是在播放文件时, 按下此按钮, 则产生静音效果, 再次按下时, 声音恢复, 从而实现静音的功能。实现此功能需要在该模块程序中控制变量sound_sign的变化。该功能是通过Windows API函数waveoutsetvolume来实现, 在使用该函数之前, 必须引用mmsystem单元, 并且为该按钮在静音和非静音时加载不同的图片, 从而清楚地显示声音处于何种状态。

3.2.3 设置播放

设置重复播放的开始位置功能, 设置重复播放的结束位置功能, 清除重复播放区域, 播放重复区域功能:

(1) 设置重复播放的开始位置主要需要将TrackBar2.Position即播放的当前位置记录在变量startpos1中, 并将开始时间点显示在Edit3当中。部分程序代码及说明如下:

设置重复播放的结束位置主要需要将TrackBar2.Position即播放的当前位置记录在变量endpos1中, 并将结束时间点显示在Edit3当中。部分程序代码及说明如下:

运行时设置好的重复播放区域如图6中A所示。

(2) 在显示设置的开始时间点和结束时间点时, 需要用到自定义函数calculate () , 该函数的功能主要是根据提供的播放进度, 将其转换为时间格式的字符串, 以方便显示。播放进度是以毫秒 (Milliseconds) 为计数单位的。输入播放进度, 返回字符串类型的时间数。该自定义函数calculate () 在后面讲述的歌曲信息的显示以及文件播放时间进度的显示中也有重要的应用。

(3) 清除重复播放区域主要需要将变量startpos1、endpos1设置为0, 并将播放模式变量mode设置为0, 即正常播放模式。

(4) 播放重复区域主要用到TMediaPlayer控件的StartPos、EndPos、Position属性以及Play方法。StartPos属性设置为StartPos1, EndPos属性设置为EndPos1, Position属性设置为StartPos1, 并将播放模式变量mode设置为1, 即重复播放指定区域模式。

(5) 在制作播放器时, 需要引进一个重要控件—计时器TTimer, 该控件的Interval属性设置为1000, 计时器的主要功能是显示文件的播放时间进度 (如图6中C所示) 、根据播放模式进行播放 (如果是重复播放指定区域模式且当前播放位置超过指定结束位置时, 从指定开始位置重复播放;如果是正常播放模式且歌曲播放结束, 在该首歌曲不是最后一首的情况下, 自动播放下一首歌曲, 从而实现自动播放下一首歌曲功能) 。在上述的播放、暂停、停止、清除重复播放区域功能中都需要在程序中设置TTimer控件的Enabled属性, 控制计时器TTimer是否工作。

3.2.4 删除

逐个删除歌曲播放列表中歌曲的功能, 全部删除歌曲播放列表中歌曲的功能。

实现逐个删除功能需要判断ListBox1中的歌曲条目是否处于选中状态, 如处于选中状态, 则调用ListBox1的Delete方法来完成选中歌曲的删除。实现全部删除功能只需要利用ListBox1.Clear即可。

3.2.5 歌曲信息显示

歌曲信息的显示主要是通过调用自定义过程ShowInfo (Sender) 来实现的。自定义过程ShowInfo (Sender) 主要需要设置TMediaPlayer控件的FileName属性、调用TMediaPlayer控件的Open方法、在窗体的标题栏上显示完整的文件路径、调用自定义函数calculate () 在Edit2中显示文件的时间长度及文件名、设置全局变量startpos和endpos的值、设置TrackBar2的min和max属性。歌曲信息的显示如图6中B所示。

3.2.6 自动加载历史播放记录

在实际情况中, 媒体播放器都是应该有记忆功能的, 即保存文件播放列表, 在下次打开播放器的时候自动加载该列表。要想实现这一功能, 需要在退出程序的时候, 将文件播放列表保存到INI文件当中, 当再次运行程序时, 从INI文件中读取信息即可。在Delphi中提供了TIniFile类用于操作INI文件, 该类在inifiles单元文件中, 在使用该类文件时, 需要引用inifiles单元。

在窗体关闭过程FormClose (FormClose过程需要映射为OnClose) 中, 需要在该项目生成的可执行文件目录下创建名为-----recentplay.ini的文件, 用于存放播放列表。并将每首歌曲的文件路径 (不包括文件名) 、每首歌曲的文件名、播放列表中文件的总数记录在recentplay.ini文件中。保存文件播放列表处理流程如图8所示。

在创建窗体过程FormCreate中, 判断recentplay.ini文件是否存在, 如果存在的话, 将recentplay.ini中保存的文件名逐个加载到列表框中, 同时利用数组变量记录每个文件的路径 (不包括文件名) 。最后还需要设置变量addfileflag的值, 保证以后添加进去的播放文件不影响正在播放的文件, 并自动播放历史记录中的第一首歌曲。加载历史播放记录流程如图9所示。

在创建窗体过程中还需要设置初始音量的大小、播放模式变量mode、静音标志变量sound_sign、暂停标志变量flag的初始值。

4 结语

随着经济与科技的飞速发展, 促使计算机技术和电子技术的发展突飞猛进。音频信号的处理做为多媒体处理的一个重要分支, 已经深入到人们的工作、学习、生活当中。可根据不同的应用场合或者不同的技术要求, 采用不同的数字音频压缩编码技术。我们在音频信号处理方面的研究仍待继续深入, 提出新的数字音频压缩编码方法或者改进现行的压缩编码方法以适应实际应用的需求。文中利用应用软件Delphi设计的音频播放器, 经过调试和测试, 实现各种音频文件的播放和文中所述的各种功能, 具有一定实际应用价值。

摘要:结合应用软件——Delphi, 介绍制作音频播放器的过程, 并利用音频播放器实现mp3等格式音频文件的播放。该音频播放器具有处理重复播放区域、删除歌曲播放列表中歌曲、歌曲信息以及播放时间进度的显示、自动播放下一首歌曲、自动加载历史播放记录等诸多功能。

关键词:音频信号,数字音频压缩编码,音频播放器

参考文献

[1]陈洪光, 林嘉宇, 易波.数字音频压缩技术研究[J].通信技术, 2000, (2) :68-71.

音频资源 篇6

1 音频信号处理基本概念

1.1 模拟音频与数字化音频

自然的声音是连续变化的,它是一种模拟量。比如当人们对麦克风讲话时,麦克风能根据它周围空气压力的不同变化而输出相应连续变化的电压值,这种变化的电压值是对人讲话声音的一种模拟,称为模拟音频。要将模拟音频变为计算机能存储和处理的对象,必须将模拟音频数字化。

数字化音频的获得是通过每隔一定的时间测一次模拟音频的值并将其数字化,通常包括采样、量化和编码。每秒钟采样的次数称为采样频率。根据采样定理,只要采样频率等于或大于模拟音频信号中最高频率成分的两倍,信息量就不会丢失,即可以由采样后的离散信号不失真地重建原始连续的模拟音频信号,否则就会产生不同程度的失真。采样定律用公式表示为:fs≥2f或Ts≤T/2,其中f为被采样信号的最高频率。

我们将由模拟量转变为数字量的过程称为模-数转换。计算机要利用数字音频信息驱动扬声器发声,还需要将离散的数字量再转变为连续的模拟量,该过程称之为数-模转换。在大多数计算机中,这些功能是通过声卡来完成的。音频信号的一般处理如图1所示。

1.2 数字化音频信号的压缩编码

1.2.1 数字化音频信号压缩编码简介

数字化的音频信号必须经过压缩编码处理才能适应存储和传输要求,才能在再生时得到最好音质的声音听觉。音频信号压缩编码主要依据人耳的听觉特性。人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到,可以不必保留这部分信号;当几个强弱不同的声音同时存在时,强声使弱声难以听到,当声音在不同时间先后发生时,强声使其周围弱声难以听见。声音编码算法就是通过这些特性来去掉冗余数据,从而达到压缩数据的目的。

1.2.2 常见音频压缩编码方式

常见的音频压缩编码有MPEG-1音频压缩编码、MPEG-2音频压缩编码、杜比数字AC-3音频压缩编码等。

1)MPEG-1音频压缩编码

ISO/IEC的MPEG音频编码的标准化采用了2种编码算法:MUSICAM和ASPEC。以这两种算法为基础形成了三个不同层次的音频压缩算法,对应不同的应用要求并具有不同的编码复杂度。在MPEG-1的音频编码标准中,按复杂度规定了三种模式:层1、层2、层3。层1采用MUSICAM算法,典型码流为384kbps,典型码流为256kbps~192kbps。层3是综合了层2和ASPEC的优点提出的混合压缩技术,它的复杂度相对较高,编码不利于实时。如今流行的MP3音乐就是一种采用MPEG-1层3编码的高质量的数字音乐,它能以10倍左右的压缩比降低高保真数字声音的存储量,使一张普通的CD光盘上可以存储大约100首MP3歌曲。层3是MUSICA和ASPEC两个算法的结合,典型码流为64kbps。

MPEG压缩等级与压缩比率如表1所示。

ISO/MPEG音频编码(层3)结构图如图2所示。

MPEG-1层3中采用改进余弦变换MDCT。MDCT的表达式为:,其中(固定时间偏移量)。余弦变换在边界处存在固有的不连续性,导致在块边界处产生较大噪声,MDCT采用时域混叠抵消TDAC技术,有利于消除这种噪声。做MDCT前要进行加窗处理:ω(n)是窗函数,它的长度等于变换块N的长度),从而降低边界效应对谱分析的影响,提高频率选择性。窗函数ω(n)的选择必须满足窗函数越长,编码效率就越高,但是过长会使时域分辨率下降,选择窗函数应该兼顾编码效率和时域分辨率。

PCM数据输入经过分析滤波组被分割成若干子频带信号,同时数据流经过FFT变换模块,动态求出每个编码频带的掩码阈值。MDCT对滤波器组的不足作了一定的补偿,把子带的输出在频域里进一步细分以达到更高的频域分辨率。比例设置和量化器模块根据掩码阈值对子频带信号进行量化,量化后得到的数据分别经过Huffman编码模块和边信号编码器模块进行编码,再经过多路复用器MUX得到码流。

2)MPEG-2音频压缩编码

MPEG-2的音频压缩编码采用与MPEG-1相同的编译码器,层1、层2、层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。

MPEG-2 BC是一种类似MP3的音频压缩算法。MPEG-2 BC压缩编码主要是在MPEG-1和CCIR Rec.755的基础上发展起来的。与MPEG-1相比较,MPEG-2主要在两方面做了重大改进,一是支持多声道声音形式;二是为某些低码率应用场合,进行低采样率扩展。同时,标准规定的码流形式还可与MPEG-1的第1和第2层前、后向兼容,并可依据CCIR Rec.755与双声道、单声道形式的向下兼容,还能够与Dolby Surround形式兼容。

3)杜比数字AC-3音频压缩编码

杜比数字AC-3是美国杜比实验室开发的多声道全频带声音编码系统,采用第三代ATC技术,被称为感觉编码系统,它将特殊的心理音响知识、人耳效应的最新研究成果与先进的数码信号处理技术很好地结合起来,形成了这种数字多声道音频处理技术。它提供的环绕立体声系统由5个(或7个)全频带声道加一个超低音声道组成,所有声道的信息在制作和还原过程中全部数字化,信息损失很少,细节十分丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中被广泛使用。

AC-3编码原理结构图如图3所示。

1.3 声音的重构

模拟音频要经过采样、量化和编码,就能得到便于计算机处理的数字语音信息,如果要重新播放数字化语音,必须经过解码、D/A转换和插值,其中解码是编码的逆过程,又称解压缩。以ISO/MPEG音频解码(层3)为例,结构图如图4所示。D/A转换是将数字量再转换为模拟量便于驱动扬声器发声;而插值是为了弥补在采样过程中引起的语音信2音频播放器简介:

本文中介绍的音频播放器如图6所示,该音频播放器能实现mp3、wav、mid、wma等格式音频文件的播放。

2 音频播放器制作过程简介

2.1 音频播放器制作中所需控件及变量设置介绍

1)所需控件:

TMediaPlayer控件(可以通过MCI播放多种多媒体文件,如MID、MP3、WAV、CD音乐文件和AVI、WMV文件等)、三个TEdit控件(分别显示正在播放文件的时间进度、正在播放文件的信息、重复播放区域的设置)、若干TBitBtn控件(用于对文件进行操作)、TListBox控件(用于显示播放列表)、TTrackBar控件(用于控制播放的音量和播放的进度)、以及TTimer控件和TOpenDialog控件。

2)设置变量(说明:在程序代码中出现的其它变量为控件中的局部变量):

在Form中设置全局变量:

SongDir:array[0..999]of Variant;//播放的文件的路径(不包括播放的文件名)

mode:integer;//播放的模式,是正常播放还是重复播放指定区域

sound_sign:integer;//静音的标志

startpos,endpos:integer;//正常播放时播放的起始位置和结束位置

startpos1,endpos1:integer;//重复播放指定区域的起始位置和结束位置

flag:integer;//暂停的标志

addfileflag:integer;//是否第一次添加播放文件的标志

2.2 音频播放器各功能模块介绍(在此仅介绍较为复杂的功能)

1)文件打开功能模块:该模块的功能是打开若干需要播放的文件,并把这些文件加载到ListBox当中,形成播放列表。若列表框中无任何文件,则直接将打开的文件加载到列表框中;若列表框中已有文件,则将打开的文件与列表框中已有的文件逐个进行比对,判断文件是否已经加载过,若已经加载过,则不加载。在此功能模块中,需要利用数组变量SongDir记录加载进去的文件的路径(不包括文件名),并利用变量addfileflag判断是否为第一次添加播放文件,如果是则自动选中播放列表中的第一首歌曲并显示该文件的信息,同时改变变量addfileflag的值,保证以后添加进去的播放文件不影响正在播放的文件。文件打开功能模块处理流程如图7所示。

2)静音功能模块:该模块的功能是在播放文件时,按下此按钮,则产生静音效果,再次按下时,声音恢复。从而实现静音的功能。实现此功能需要在该模块程序中控制变量sound_sign的变化。该功能是通过Windows API函数waveoutsetvolume来实现,在使用该函数之前,必须引用mmsystem单元。并且为该按钮在静音和非静音时加载不同的图片,从而清楚地显示声音处于何种状态。

3)设置重复播放的开始位置功能,设置重复播放的结束位置功能,清除重复播放区域,播放重复区域功能:

(1)设置重复播放的开始位置主要需要将TrackBar2.Position即播放的当前位置记录在变量startpos1中,并将开始时间点显示在Edit3当中。部分程序代码及说明如下:

startpos1:=TrackBar2.Position;//记录开始位置

Edit3.Text:='重复播放:'+calculate(startpos1)+'->'+'结束点'+'请设置';//显示开始时间点

设置重复播放的结束位置主要需要将TrackBar2.Position即播放的当前位置记录在变量endpos1中,并将结束时间点显示在Edit3当中。部分程序代码及说明如下:

endpos1:=TrackBar2.Position;//记录结束位置

Edit3.Text:='重复播放:'+calculate(startpos1)+'->'+calculate(endpos1);//显示结束时间点

运行时设置好的重复播放区域如图1中A所示。

(2)在显示设置的开始时间点和结束时间点时,需要用到自定义函数calculate(),该函数的功能主要是根据提供的播放进度,将其转换为时间格式的字符串,以方便显示。播放进度是以毫秒(Milliseconds)为计数单位的。输入播放进度,返回字符串类型的时间数。该自定义函数calculate()在后面讲述的歌曲信息的显示以及文件播放时间进度的显示中也有重要的应用。

(3)清除重复播放区域主要需要将变量startpos1、endpos1设置为0,并将播放模式变量mode设置为0,即正常播放模式。

(4)播放重复区域主要用到TMediaPlayer控件的StartPos、EndPos、Position属性以及Play方法。StartPos属性设置为StartPos1,EndPos属性设置为EndPos1,Position属性设置为StartPos1,并将播放模式变量mode设置为1,即重复播放指定区域模式。

3)逐个删除歌曲播放列表中歌曲的功能,全部删除歌曲播放列表中歌曲的功能:

实现逐个删除功能需要判断ListBox1中的歌曲条目是否处于选中状态,如处于选中状态,则调用ListBox1的Delete方法来完成选中歌曲的删除。实现全部删除功能只需要利用ListBox1.Clear即可。

4)歌曲信息的显示功能:

歌曲信息的显示主要是通过调用自定义过程ShowInfo(Sender)来实现的。自定义过程ShowInfo(Sender)主要需要设置TMediaPlayer控件的FileName属性、调用TMediaPlayer控件的Open方法、在窗体的标题栏上显示完整的文件路径、调用自定义函数calculate()在Edit2中显示文件的时间长度及文件名、设置全局变量startpos和endpos的值、设置TrackBar2的min和max属性。歌曲信息的显示如图1中B所示。

5)自动加载历史播放记录功能:

在实际情况中,媒体播放器都是应该有记忆功能的,即保存文件播放列表,在下次打开播放器的时候自动加载该列表。要想实现这一功能,需要在退出程序的时候,将文件播放列表保存到INI文件当中,当再次运行程序时,从INI文件中读取信息即可。在Delphi中提供了TIniFile类用于操作INI文件,该类在inifiles单元文件中,在使用该类文件时,需要引用inifiles单元。

在窗体关闭过程FormClose(FormClose过程需要映射为OnClose)中,需要在该项目生成的可执行文件目录下创建名为———recentplay.ini的文件,用于存放播放列表。并将每首歌曲的文件路径(不包括文件名)、每首歌曲的文件名、播放列表中文件的总数记录在recentplay.ini文件中。保存文件播放列表处理流程如图8所示。

3 结束语

随着经济与科技的飞速发展,促使计算机技术和电子技术的发展突飞猛进。音频信号的处理做为多媒体处理的一个重要分支,已经深入到人们的工作、学习、生活当中。我们根据不同的应用场合或者不同的技术要求,可以采用不同的数字音频压缩编码技术。我们在音频信号处理方面的研究仍待继续深入,提出新的数字音频压缩编码方法或者改进现行的压缩编码方法以适应实际应用的需求。本文中利用应用软件Delphi设计的音频播放器,经过调试和测试,实现各种音频文件的播放和文中所述的各种功能,具有一定实际应用价值。

参考文献

[1]陈洪光,林嘉宇,易波.数字音频压缩技术研究[J].通信技术,2000(2):68-71.

音频资源 篇7

随着数字科技的迅猛发展, 无论您是否喜欢, 调音台是彻底“被数字”了。转型年代, 我们焦虑于调音台功能显示从大同小异的模拟界面变成了各式各样的数字操作界面, 巨大的变化打破了我们固有的习惯, 使得我们的主要关注点集中在调音台面上了, 我们难于关注声音质量, 无暇关注艺术创作, 加之数字调音台较模拟调音台仍是相对不稳定, 对我们而言仍是不够“得心应手”, 我们的专注点就在播出安全了。

眨眼间我们不再“被数字”, 因为除了数字我们别无选择, 我们已经到了后数字时代。在实践应用中我们发现数字系统没那么可怕, 操作也没那么复杂, 广播级的数字调音台也不是那么不稳定。于是先于我们推广数字系统的欧美用户们调整专注点了, 在技术进步的前提下他们再度关注声音质量, 再度思考艺术创作, 而且他们也发现数字平台上的艺术创作比模拟平台的艺术创作有着更广的空间和更大的自由度, 可以充分发挥录音师的想象力和创造力。

2010年始, 欧美用户开始不满足某些调音台厂家的廉价模数/数模转换器, 纷纷要求调音台厂家开放控制协议, 使得他们可以选择第三方路由系统的高品质模数/数模转换器。

在如此时代背景下, 中央电视台紧紧跟踪数字时代潮流和发展方向, 完成了第9演播厅群音频系统的改造, 完美地达到了“播出安全、声音质量、艺术创作”的设计需求。

2010年9月中央电视台决定对第9演播室群音频系统进行改造, 并用于2011年春节联欢晚会。项目于2010年10月完成竞争性谈判, 最终选用了德国斯泰克 (Stagetec) 系统。项目在11月底完成交货, 12月下旬完成安装调试工作, 并通过元旦晚会直播完成首次实战演练。演播室群音频系统以优异的表现完成了2011年春节联欢晚会、元宵晚会等大型节目的播出及现场扩声任务。

第9演播室群音频系统由第9演播室播控系统、1号演播大厅扩声系统、第9演播室扩声系统组成, 是一个网络化的音频系统。整个系统的核心基于斯泰克获得2010年艾美技术大奖的Nexus数字音频路由系统, 核心路由设备包括2台Nexus STAR中央路由器 (安装在第9演播室播控室机房) , 6台Nexus路由接口机箱 (2台安装在第9演播室播控室机房, 2台安装在第9演播室扩声机房, 2台安装在1号演播大厅扩声机房) , 每台Nexus路由接口机箱同时与2台Nexus STAR中央路由器冗余光纤连接, 构成一个物理独立的双星型数字音频网络。

第9演播室播控室、1号演播大厅扩声控制室、第9演播室扩声控制室各配置1张56物理推子的斯泰克AURUS数字调音台面, 如图1。

Nexus路由接口箱和Nexus STAR中央路由器构成一个路由能力为4096×4096的大型数字音频路由矩阵, 而3张数字调音台在逻辑上是对此路由矩阵的音频信号插入处理。因此每张调音台可以取路由矩阵的任意物理输入端口音频信号作为调音台的输入通道, 调音台的母线输出可以分配给路由矩阵的任一物理输出端口, 如图2。

如此网络音频架构, 使得我们可以极其方便地实现不同节目对于音频系统的不同需求:

●第9演播室播出调音台完成第9演播室或1号演播大厅的播、扩一体;

●第9演播厅扩声调音台完成第9演播室播、扩一体;

● 1号演播大厅扩声调音台完成1号演播大厅播、扩一体;

●第9演播室播出调音台挂第9演播厅或1号演播大厅扩声调音台。

一播出安全

我们从宏安全、微安全、源安全、输出安全、核心安全、同步安全及操作安全方面来分析第9演播室群音频系统的安全性设计。

1. 宏安全性

宏安全性是指从宏观层面上系统的安全性, 包括了系统架构的安全、系统连接的安全。由Nexus路由接口箱和双Nexus STAR中央路由器组成的双星型网络拓扑结构确保了整个系统架构的安全, 尤其重要的是这是智能网络拓扑结构, 也就是说音频工程师完成某话筒输入至调音台输入通道及调音台母线输出至物理端口的路由指派后就不用操心信号是通过怎样的物理途径传输的。譬如:话筒A信号默认通过中央路由器1 (最短逻辑路径原则) 传输到调音台, 当此路径故障时, 话筒A信号自动切换至中央路由器2传输到调音台。

每台Nexus路由接口箱至任一Nexus STAR中央路由器均为冗余光纤连接, 也就是说每台Nexus路由接口箱有4对 (Tx&Rx) 光纤连接至系统, 除非这4对光纤同时连接故障系统才可能丢失这台Nexus路由接口箱的输入/输出信号。

系统宏安全性确保了系统连接故障情况下的系统自动修复功能, 任何故障是不需要人工干预的。

2. 微安全性

微安全性是指从微观层面上系统的安全性, 主要是系统中每台设备的单体安全性, 包括双电源、模块化架构、热插拔等等。

AURUS调音台面、Nexus路由接口箱均配置双电源, Nexus STAR中央路由器配置了四电源;AURUS调音台面、Nexus STAR中央路由器、Nexus路由接口箱均是模块化架构, 所有模块支持热插拔。

调音台面模块化设计对于第9演播室群系统来说特别有帮助, 因为群内有3张同型号的调音台面, 在应急情况下可以用任一张空闲调音台面的模块热插拔替换故障模块。

3. 源安全性

顾名思义, 源安全性是指输入信号的安全性。第9演播室群的输入信号主要是话筒信号和音源信号 (含视频播放机) 。

对于话筒源安全性的考虑, 采用两种方案, 首先是分散故障风险。第9演播室播控室、第9演播室扩声控制室、1号演播大厅扩声控制室各配置2台Nexus路由接口箱。如1号演播大厅2台Nexus路由接口箱各配置36路话筒/线路输入, 这样共72路话筒输入可以平均分配到2台Nexus路由接口箱。

其次对于重要话筒信号, 可以经无源话分 (支持2路幻像供电) 同时馈给2台Nexus路由接口箱。1号演播大厅、第9演播室扩声控制室各配置了36路无源话分, 必要时可以作到最多36路话筒信号同时馈给2台Nexus路由接口箱。配合AURUS调音台A/B输入, 可以作到A接口箱信号接入到调音台输入A, B接口箱信号接入到调音台输入B。

至于音源信号, 第9演播室群对于重要的音源信号都配备了主备播放机, 因此可以很方便地作到主播放机输出信号连接至A接口箱, 备播放机输出信号连接至B接口箱, 同样可以输入至调音台的A/B输入通道。

当某一源信号故障时, 调音工程师需要做的就是切换调音台输入通道上的A/B输入功能按钮。

4. 输出安全性

输出安全性设计包括播出PGM输出安全和扩声信号输出安全。采用的解决方案是分主、备接口箱输出。

第9演播室A路由接口箱输出主PGM信号给主播出音分, B路由接口箱输出备PGM信号给备播出音分, 再由主、备播出音分馈给主、备播出加嵌器, 主、备收录。

第9演播室 (1号演播大厅同) A路由接口箱输出主扩声信号 (AES) 给扩声系统, B路由接口箱输出备扩声信号 (模拟) 给扩声系统。

5. 核心安全性

宏安全、微安全、源安全、输出安全可以确保系统架构、系统连接、设备故障不会造成音频信号中断的严重播出事故, 而数字调音台的核心故障则有可能造成音频信号中断。

数字调音台核心是指处理音频信号均衡、压缩限幅、延时以及缩混的核心DSP处理器, 确保核心安全性就是针对核心DSP故障的对应解决方案。第9演播室群音频系统的解决方案有微处理和宏处理两种方式。

AURUS系统的核心DSP卡 (RMD) 是分布式处理方式, 也就是说某张核心DSP卡故障并不会影响其他核心DSP卡, 但故障DSP卡对应的音频通道信号将会中断。微处理方案就是将DSP卡设置成为N+1配置, 即设置某张核心DSP卡为冗余DSP卡, 当某张DSP卡故障时自动替换故障卡。

宏处理方案就是直接启用备用调音台, 并用备用调音台的输出信号接管主调音台的所有物理输出端口。

得益于第9演播室群音频系统是在同一个大音频路由矩阵的系统架构, 主、备调音台可以方便地作到”一键切换”, 而不用物理跳线。

系统中一共3张数字调音台, 任意一张空闲数字调音台可以作为另2张数字调音台的备用调音台。如在2011年春晚的实际应用中, 第9演播室播控调音台为主播出调音台, 1号演播大厅扩声调音台为主扩声调音台, 而第9演播室扩声调音台作为主播出调音台和主扩声调音台的备用调音台, 同时第9演播室播控调音台和1号演播大厅扩声调音台也互为主备。

备用调音台的源信号取自路由矩阵和播控调音台的同源信号 (非常重要:可以继承主播出调音台已作的前置增益、低切、幻像电源等设置) , 而输出信号则通过备调音台面“调用Snapshot”按键一键切换至主调音台的物理输出端口。

实现的方式非常简单, 且在正式播出前已经完成。若在播出中碰到核心故障, 录音师需要的就是“按键+确认”。

●在主调音台路由设置界面将输出母线通过Crosspoint指派给物理输出端口, 完成后存储为路由Snapshot 1;

●在主调音台路由设置界面将备调音台输出母线通过Crosspoint指派给物理输出端口, 完成后存储为路由Snapshot 2;

●调用Snapshot 1表示主调音台启用, 而调用Snapshot 2表示备调音台启用。

6. 同步信号安全性

Nexus路由系统内置9级同步信号自动倒换系统, 包括8个外部同步信号输出及内部同步信号。

第9演播室播控室路由接口箱A接入外部BB主同步信号, 作为第1优先级同步信号;路由接口箱B接入外部BB备同步信号, 作为第2优先级同步信号;内部同步信号作为第3优先级同步信号。

同步信号自动倒换不会造成音频信号中断和可察噪声, 而系统自动同步在有信号输入的最高优先级别同步信号上。

7. 操作安全性

在播出时人机交互界面有且只有调音台面, 调音台面故障有可能造成录音师紧张而造成人为出错。操作安全性考虑就是尽可能地去避免这种可能性。

AURUS调音台面除母线分配及监听功能外, 几乎所有的操作都在通道条上完成, 只要确保通道条始终能够正常工作, 就不会造成调音师的紧张。AURUS调音台面可翻8页, 因此我们将正常使用的音频通道放在第1页和第2页, 而在第7、8页放置其他音频通道的镜像通道。如话筒1~8输入音频通道放在调音台面第1列模块第1页 (8推子) , 则把话筒1~8输入音频通道同时放在调音台面第2列模块第8页。它们相互之间是镜像的。当第1列模块故障时, 翻到第2列模块的第8页就可以继续工作, 推子、旋钮都在第1列模块的同等位置。9

第9演播室群音频系统的安全性达到了如此高的级别, 使得录音师不再需要过多的注意力放在播出安全上了, 可以更多地关注声音质量和艺术创作了。

二声音质量

通常我们知道, 在模拟时代追求好声音需要好的话筒、好的话筒前置放大器、好的调音台均衡及动态处理以及好的录音师合理的平衡。到了数字时代, 除了上述条件还需要好的模数转换器和好的数模转换器, 好的调音台均衡及动态处理变成好的调音台均衡和动态处理算法。

斯泰克模拟输入采用斯泰克专利的TrueMatch技术。TrueMatch技术通过对同一信号源采用4个不同增益的放大器同时进行前置放大, 并使用各自的AD进行模数转换, 再将所得的四个数字输出送入DSP中进行实时比较, 最终“拼接”出一个最优的数字信号输出给下一级, 如图3。TrueMatch专利话筒/线路输入高达158dB (A) 的动态范围, 也就是说如果话筒不失真, 那么前置放大器就不可能失真。

大动态范围带来的直接提高就是系统峰值余量的提高, 见图4:EBU标准的AURUS的增益架构。

同时斯泰克话筒/线路前置增益放大器内置话筒分配器, 如图5。每一路话筒信号可以最大被4张调音台独立控制前置增益。在演播厅音频系统尤为重要, 使得播出调音台、扩声调音台、多轨录机对同一路话筒输入的控制是完全独立的。

斯泰克话筒输入卡还具备一些特殊功能, 如-0.01dBFS的限幅器, 话筒插拔时自动哑音功能都确保了话筒输入信号无失真、无杂音。斯泰克所有输入板卡都内置测试信号发生器, 用以基准电平的校准以及测试音频通路。

斯泰克线路输入卡、线路输出卡的动态范围也分别高达133dB (A) , 131dB (A) 。

而对于调音台均衡和动态处理的算法评价相对更加主观一些, 在此不予测评。

三艺术创作的自由平台

当录音师不用担心播出安全问题, 也不用多考虑话筒输入失真问题, 不用考虑扩声调音台是否变更了话筒前置增益, 甚至不用操心更换话筒时有没有拉下推子时, 他可以干些什么?当然他可以更加专注于自己的本职工作, 创作出好的声音来。我们来看一下可以使用的非常规新工具、新功能。

1. 多通道同时操作

对多个输入通道进行同时均衡或动态处理操作在模拟时代是理所当然的功能, 曾几何时在数字调音台面上成了奢望。AURUS数字调音台面是直接控制式模拟操作界面, 每一通道条具备11个同轴旋钮 (即22个功能旋钮) , 可以在通道条上直接控制前置增益, 线路增益, 多通道LFE增益, 左右PAN, 前后PAN, 4段参量均衡, 2段陷波器, 高通滤波器, 低通滤波器, 16路AUX Send (立体声对控制, 立体声PAN, 推前/推后控制) , 压缩/限幅器/扩张器。

通道条的直接操作意味着多通道可以同时操作, 这是播出调音台必须的功能, 虽然往往被大家所忽略。

2. 设置库

录音师可以把自己得意的均衡设置、压缩器设置、限幅器设置、扩张/噪声门设置存储在设置库当中, 可以被其他通道或其他节目调用, 甚至可以用于不同录音师之间的交流和PK。

3. 快速均衡比较

录音师可以对同一路话筒信号作两种不同的均衡设置, 一种存储在通道条的EQ Memory中, 另一种作为当前均衡设置。当按下EQ MEN键时, 就可以在两种不同的均衡设置中切换, 也就是可以让录音师快速比较两种均衡设置的优劣。

4. 通道用户自定义键

AURUS每一通道条有2个用户自定义键, 在第9演播室群系统1个用户自定义键定义为幻像电源开关键, 另1个用户自定义键定义为千周信号开关。

5. 旁路触发动态处理

对于乐器拾音话筒常常需要用到的旁路触发动态处理功能, 如图6。

6. 增强DSP处理

对于某些节目, 调音台内置的4段参量均衡器不一定够用, 而AURUS调音台可以通过插入在Nexus路由接口箱的XDSP处理卡对调音台信号进行插入处理。在2011年春晚这增强的14路31段参量均衡器对于小品话筒的均衡处理起了重要的作用。

增强的DSP处理可以是均衡, 也可以是动态处理, 延时处理, 甚至是32入2出的虚拟混音台。

随着ITU、EBU响度标准的陆续公布以及数字技术的不断进步, HDTV的兴起, 欧美广电用户正在“返璞归真”, 重新开始追求声音的质量、动态等音频技术基本要素。作为视听并重的电视节目, 声音的发展弱于图像, 视听犹如人的两条腿, 长短不一是走不好的。画面满足着人们视觉的需要——眼见为实;声音提供人们听觉需要——耳听为“虚”。这个“虚”让看不见的声音产生了任意的想象且具备了创造的无限可能, 在联想、遐想、幻想和冥想的艺术空间中声音的艺术表现力优于画面, 可谓“虚则实之, 实则虚之”。深入理解声音的功能和充分调动声音的表现力, 使技术更好地服务于艺术, 让视听这两条腿不再长短不一。飞速发展的数字音频技术在完善解决安全播出这一首要前提的基础上, 充分考虑应用中可能出现的种种问题并很好地加以解决, 为录音师的艺术创作提供了更广的空间和更大的自由度, 也是对录音师想象力和创造力的一种挑战。

播出安全?声音质量?还是艺术创作?

播出安全是前提, 声音质量是根本, 艺术创作是高标。

前提已具备, 根本已确立, 高标即是我们的努力方向。

上述有关央视第9演播室群音频系统的介绍和粗浅的思考尚有诸多不足, 希望能起到抛砖引玉的作用, 也希望能够听到更多富有创造力的优秀音频制作节目。

摘要:本文介绍了中央电视台第9演播室群音频系统改造方案, 从宏安全、微安全、源安全、输出安全、核心安全、同步安全及操作安全方面来分析第9演播室群音频系统的安全性设计, 介绍了改造后提供的非常规新工具以及新功能。

音频文件处理方法 篇8

一、Gold Wave软件界面介绍

这一款软件的安装过程很简单。安装时直接运行安装文件,下面介绍Gold Wave的界面。

1、软件主界面

安装完成后,双击快捷图标,打开Gold Wave界面,如图1所示。

进入Gold Wave时,窗口是空白的,而且Gold Wave窗口上的大多数按钮、菜单均不能使用,需要先建立一个新的声音文件或打开一个声音文件。Gold Wave窗口右下方的小窗口是设备控制窗口。

2、设备控制窗口

设备控制窗口的作用是播放声音以及录制声音,窗口各部分的作用如图2所示。

二、使用Gold Wave剪切音频

在办公活动中,比如在PPT演示文稿中经常需要插入音频文件,有时不需要整个音频,而是需要歌曲或乐曲的一个片断;再比如手机铃声的制作,只需要一首歌曲的高潮部分,此类情形用Gold Wave来操作非常方便。

步骤1:启动Gold Wave,在如图1中点击“打开”按钮,选择需要编辑的mp3格式的音乐文件,将选择的mp3文件载入到Gold Wave中。

步骤2:载入mp3文件后的Gold Wave,在图3中可以看到,中间(绿色和红色)波形代表mp3文件,几个工具按钮功能说明如下:

●撤消:当编辑mp3文件时,不小心操作失误,按这个可以返回上一步操作。

●重复:如果执行了“撤消”操作后,发现刚才做的操作是正确的,无须撤消,就可以用这个操作。

●删除:将选中的部分删除掉。

●剪裁:这个操作将是本例重点要用到的操作。

●选示:显示mp3所有波形。

●全选:同上选示。

●绿色播放按钮:从mp3最开始播放。

●黄色播放按钮:从选择区域播放。

步骤3:按住鼠标左键,在mp3波形区域选择歌曲的高潮部分(按绿色播放按钮听一遍记下高潮部分位置),然后按黄色的播放按钮试听一下所选区域是否满意。如果不满意,可以将鼠标试到所选区域边上的青色线上调整一下所选区域(参考图4、图5)。

步骤4:选择好所剪裁的区域后,然后点击“剪裁”即可将刚才选择的区域剪裁下来。然后点击菜单“文件”-“另存为…”给音频文件取个名字。这样一首只包括片断的mp3音乐就剪切好了。

三、使用Gold Wave合并音频

1、启动Gold Wave;

2、在图6中执行“工具”—“文件合并器”命令,在图7中依次添加需要合并的文件,若需要改变文件的顺序,可以通过直接拖动文件名的方式进行调整。右侧的采样率可以选择,也可以使用默认,它影响文件的大小和音质;

3、单击“合并”按钮,在弹出的对话框中输入保存的新文件名即可。

四、使用Gold Wave调整音量

用Gold Wave修改mp3格式的声音大小有几种方法可以达到相同效果。

方法1:

步骤1:用Gold Wave打开需要修改音量的mp3文件

步骤2;点击菜单“效果”-“音量”-“更改音量…”用鼠标拖动音量上面的滑动块就可以修改音量。建议后面的数值不要超过10,如图8。修改过程中可以按上面的绿色播放按钮试听。修改好后点确定就完成了mp3音量的增大。

方法2:

步骤1:用Gold Wave打开需要增加音量的mp3文件

步骤2:点击菜单“效果”-“动态”在“预置”里选择“巨响”即可很快修改mp3音量大小。推荐使用“放大明亮度”,如图9。

方法3:

步骤1:用Gold Wave打开需要修改音量的mp3文件

步骤2:选择菜单“效果”-“滤波器”-“均衡器…”移动滑动块,数值越高代表调整的音量越高,如图10。

摘要:在现代化数字化办公事务中,办公人员经常会使用音频文件。本文介绍用GoldWave软件进行音频剪切、合并及调整音频音量方法。

关键词:办公自动化,音频处理,剪切,合并,音量调整

参考文献

[1]缪亮.计算机常用工具软件[M].北京:清华大学出版社,2009.

[2]庄洪林等.常用工具软件应用[M].北京:清华大家出版社,2011.

音频文件巧压缩 篇9

编辑后再转换

这种方法通常用在音乐文件本身太长的情况下,做铃声只需要截取高潮部分即可。打开Windows Movie Maker,简单了解一下软件的各个工作区。

然后再导入你要编辑的音频文件。导人完成后将这个文件拖到下面时间线的音频/音乐轨中,完成后会显示效果。

点击上面监视器的播放按钮,试听音乐。找到要作为铃声片断的开始时间,将鼠标在相应的时间线上单击,然后拆分。此时音频文件被剪成两段,然后将不需要的那段删除(注意:如果将前半部分删除,一定要把音频拖到时间线的开头,否则,播放时会出现时间空白。)剪切完成后,点击菜单栏中“文件”,选择“保存电影文件”,单击“下一步”,按提示操作直到完成。

直接转换

这种方法就简单得多了,只需要按步骤就可搞定。将音频文件拖入音频/音乐轨后,直接点击菜单栏中的“文件/保存电影文件”,点击“下一步”,设置完文件名和保存路径后,会出现“电影设置”对话框。

在这里,单击“显示较多选项”,选择“其他设置”。在这里有八种默认的音频格式可以选择,不同格式生成的文件大小比较见下表。作为手机铃声,在音质不发生较大变化的情况下建议使用“CD音质音频(64kbps)”。然后单击“下一步”,直到完成。

论音频压缩器 篇10

但单单凭借一个人用双手来调整推子,对所有声部的电平值进行调整,显然会焦头烂额。尤其对于那些声部很多的大型器乐作品来说,往往会表现得手忙脚乱。这个时候,如果让设备来帮助我们控制那些动态范围大的音频信号,使之达到我们对混音的要求,就会用到一种自动的推拉衰减器,可以对动态范围进行处理的重要工具—压缩器。

1 可调参量

1.1 门限

门限的作用是设定电平是否过高的分界线。若信号高于压缩器的门限值,压缩就开始介入;当电平低于门限值,压缩器就停止工作。压缩器就类似于一个推拉衰减器,一旦信号超过门限值,压缩器就对信号进行衰减。

1.2 压缩比

压缩比是指压缩器介入工作时,所压缩的量。等于输入信号超过门限的量与衰减后的输出信号超过门限的量之比。例如,压缩比为4:1,输入信号的电平超过门限值量的4倍,即超过门限的量是4dB,输出时超过门限的量就是1dB。

1.3 建立时间

信号的衰减速度,取决于“建立时间”的设置。它是指当信号电平达到门限值时,压缩器开始介入压缩的速度。快的建立时间会让压缩器迅速做出反应,反之,压缩器的反应就相对缓慢一些。

1.4 恢复时间

压缩器回到单位增益的速度是由“恢复时间”的设置来决定的。当受压缩的信号幅度开始下降,如军鼓敲击后声音渐弱的时候,压缩器会向不压缩的状态转变。压缩时可能需要衰减10dB,现在也许衰减8dB就足够了,恢复时间就是控制衰减变化的快慢。所以,恢复时间这一参量设定的是一个处于衰减状态的压缩器恢复到单位增益的速度。

1.5 增益补偿

压缩器处理后的信号若要保持信号电平不变,就需要做提升处理,这就是增益补偿。该参量可以对信号电平做一定的补偿,使信号整体电平得到提升。录音师常在没有响度变化的情况下对信号的质量进行评估,通常都会对压缩处理后的信号做电平上的提升。

2 技术发展

2.1 电子管压缩器

在早期的音频制作中,电子管压缩器是可变增益电路设计中的唯一选择。电平检测电路为电子管提供电压,电压控制电子管的增益。电子管的增益被电平检测电路改变时,电子管需要有反应的时间。也就是说,电平的提升或者衰减,电子管不是立刻就能做出反应,这就使电子管压缩器具有自身的建立时间和恢复时间。这种特殊的属性,使其在一些音乐处理上颇具特色。

2.2 光学压缩器

这种压缩器利用光源和光感电阻间的相互作用来控制信号的增益衰减。电平检测电路使光源发光,当光线照在测光元件上,测光元件的阻抗随着光线的强弱变化,对压缩器的信号进行增益或者衰减。还有晶体管压缩器,这种压缩器使用晶体管让检测电路经过一个控制电压来控制增益的变化,从而实现对电平的增益或者衰减。

2.3 数字压缩器

其出现让压缩器不再受实时模拟电路元件的束缚。如今的数字录音技术使音频信号变成数字,数字压缩器相当于计算数字的计算器,通过计算来获得压缩效果的算法。虽然程序的写法是灵活多变的,但也常常以效仿经典模拟压缩器为目的来设计程序。但正因数字压缩器的软件编写灵活,其也具备了模拟压缩器无法实现的功能。

3 基本应用

3.1 避免电平过载

我们录音时经常会遇到歌手声音突然变大,这时,若没有电平保护措施,很容易造成失真。这时,可以在人声做适当压缩,进而可以避免演唱时由于情绪起伏带来的电平变大而造成失真的现象。

3.2 有效降噪

在录音中,录音师常常会与本底噪声做斗争,这时压缩器就会发挥作用,录音师会压缩一些高电平信号的幅度,以减少和低电平信号间的差距。由于高电平降低了,录音师就可以提升整体的信号电平,而且不用担心信号过载,这样低电平信号得到提升,进而超过本底噪声。但这里需要注意的是,这种以压缩克服本底噪声的方式,以不能牺牲作曲家和演奏员创作的动态和音乐表现为基本要求。

3.3 提升响度

在电平弱的音轨中加入压缩,可以使弱的电平响度增加。也就是说,通过加入压缩,可以整体提升该轨道的响度,这样音轨信号的电平平均值也会有所提高。

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:音频嵌入 下一篇:视音频监控