声音技术

关键词: 成分 声音 保真度 质量

声音技术(精选十篇)

声音技术 篇1

本文意在讨论声音信号质量测评技术方法。文中首先介绍语音信号质量评价标准,继而介绍音频信号质量评价标准,再者介绍通信网络语音会谈的质量评价技术。此外,文中还讨论了声音质量评价标准应用,并展望了其今后可能的研究与发展方向。

1、语音信号质量评价方法

1.1 主观测量方法

90年代,语音信号质量评定是通过一系列主观测试进行的,其中一组参听者对给定的语音信号集质量进行打分。这些主观测试被ITU标准化为ITU-T P.800及其相关的建议[3,4,5]。在该标准描述的主观测试中,最常用的是绝对按类定级(absolute category rating,ACR)测试。其中,一个语音信号播放给测听者,该测听者须要用一个1—5的离散刻度值来给出其语音质量级别意见。1—5离散刻度值的含义由表1定义。通常,每个测试语音信号时长为5~8秒,并由单个说话者的二个句子构成,二句间相隔约0.5秒的静音;总共约50个语音样本被24—32个测听者评估打分,其平均结果即为该测试语音集的MOS。值得一提的是,ITU-T P.800及其相关的建议中,还定义了诸如退化按类定级(degradation category rating,DCR)和比较按类定级(comparison category rating,CCR)听测方法,这二种方法均利用了每个语音样本的原始(参考)信号和其退化信号(注:退化信号为原始信号经待测系统的输出),但它们的差别在于信号播放给测听者的次序以及相应质量评定打分的离散刻度值。在DCR中,退化语音样本紧接在其原始样本之后,而在CCR中,这种衔接是随机的;在比较第二个语音样本相对第一个语音样本质量打分离散刻度上,DCR使用从1(“烦人的退化”)到5(“听不到的退化”),而CCR则使用从-3(“很坏”)到+3(“很好”)。

1.2 客观测量方法

基于人类感知特性语音质量客观测量方法的设计,可追溯到80年代Zwicker、Schr der和Brandenburg等人的研究。最著名的算法是感知语音质量测量(perceptual speech quality measurement,PSQM)[8]模型,它于1996年被ITU选定为语音质量客观测量标准ITU-T P.861[9]。PSQM算法的基本框图如图1所示,原始参考语音输入信号和待测系统输出的退化语音信号首先分别经人类听觉感知模型映射成各自的心理物理表征,该表征尽可能地近似语音信号的内部表征(即在人脑中的表征),那么待测系统输出的退化语音信号质量则由该信号和其相应原始参考的内部表征之间的差异来裁决。这一内部表征间的差异然后被用来计算噪音干扰(noise disturbance)的时频函数,其平均值直接关联于退化语音信号的质量。最后将所计算的噪音干扰送至认知模块来处理,从而获得待测系统输出的退化语音信号质量估计。原始(raw)PSQM数值表明待测系统语音主观质量退化的程度。PSQM算法的输出结果映射到MOS刻度上可获得客观平均意见分(objective MOS,OMOS)。主观测试业已表明,即使无退化的透明系统,某些听测者总能听到一些失真,由此而得的MOS值通常在4.05~4.5。这便使OMOS刻度取值范围通常为:1.0~4.05。

由P.861定义的PSQM标准有以下主要缺陷:(1)P.861定义的时间上对齐是非常粗糙的,并不适合含噪线路的实际测量;(2)与人类听测者相比,PSQM不对称处理对响度失真的加权过强;(3)不能处理由遗失或丢包引起的定时截止通道问题。为克服上述的缺陷,PSQM+算法[15]便应运而生。PSQM+算法的框图见图2所示。

与PSQM算法相比,PSQM+测量结果同主观测听结果有着更好的相关性。尽管该算法可以很好地处理固定延时和由突发错误所致的较大失真问题,但不能有效地补偿时变时延问题。为进一步解决PSQM存在的问题,诸如PSQM99[16,17]和感知分析测量系统(perceptual analysis measure-ment system,PAMS)[18,19]等语音质量测量的新算法相继出现。ITU对这些新算法进行了系统地核准测试,结果表明:性能最好的是PSQM99,次好的是PAMS。但它们的性能均不足于用来修正P.861标准。这便促使人们进行语音质量感知评价(perceptual evaluation of speech quality,PESQ)方法的研究。PESQ实际上是由PSQM99和PAMS演变而来的,随后即被ITU定为标准——ITU-T P.862[10]。该算法由预处理、感知建模和认知建模三个级联处理级构成,如图3所示,其中预处理级负责将原始参考信号和退化信号间在电平和时间相位上进行对齐,然后滤波。该步处理改善了俩信号的相关性,以确保在预处理后能作一个较为公正的比较。感知建模模块则对参考和退化信号进行时-频映射、频率扭曲和响度映射操作,以模拟人的听觉系统。认知建模模块用来确定参考和退化信号间的噪音干扰测度,并据此获取退化信号相对于参考的PESQ分数。PESQ的输出x将按下述方程映射为MOS刻度:

其中A=-1.4945,B=4.6607,x为PESQ分,y为MOS值。

PESQ方法仅适用于300~3400 Hz的(窄带)电话信号。而宽带PESQ(即W-PESQ)模型由ITU-T P.862.2[11]来规定,其中PESQ输入滤波器被另一个能够表征头戴耳机50~7000 Hz宽带带宽的滤波器所取代。将W-PESQ分数映射为MOS刻度同样遵循方程(1),然而这时的系数A和B的取值应为:A=-1.3669,B=3.8224。PESQ的MOS刻度范围为1.0(最坏)到4.5(最好)。

1.3 非侵入式测量方法

上述介绍的PSQM和PESQ均利用语音信号的原始参考和其退化来客观评估它们的相似度,这种测量技术称为侵入式测量方法(intrusive testing approach)。而语音信号主观质量评估技术的最近趋势是试图在无任何原始参考信号的开环回路中完成退化语音质量的评估。这种方法通常称为非侵入式测量方法(Nonintrusive testing approach)[20],它与主观ACR MOS测试法十分相似,其区别只不过是参考信号没有同待测退化信号一起播放给测听者。然而由于原始参考信号的缺乏,使得非侵入式测量方法模型相对侵入式测量方法模型而言,其对不同说话者和不同发声方式导致的语音变化,缺乏相应的补偿能力。尽管如此,从网络运营商的角度来看,由于其兴趣在于长期的网络质量监控,基于单端监测而不引起额外流量的非侵入式测量方法,将尤受欢迎。经Psytechnics、OPTICOM和Swiss Qual三方的共同努力,ITU于2004年制定了基于单端评价模型(single-ended assessment model,SEAM)的非侵入式测量方法标准ITU-T P.563[13]。P.563算法框图如图4所示,它由预处理、失真估计和感知映射三级组成。其中预处理级作如下操作:(1)对输入的退化信号电平进行归一化,(2)用类似于电话终端频响的滤波器对退化输入信号进行滤波处理,(3)检测静音区间、辨识语音和噪音信号帧。失真估计级用来并行地运行三个子模块:第一个子模块利用人的声带管道模型,通过辨识声带管道结构中不可接受的变化,来检测语音失真;第二个子模块进行退化信号重建,以便获得其原始参考信号的估计,用于全参考感知模型,来估计退化语音的等级;第三个子模块用来估计特定语音的退化,如机器人噪声和加性噪声等。P.563算法的感知映射级将失真估计级的三个输出与每类干扰预置门限作比较,这些显著失真则将被感知地加权并一起用来确定待测退化语音信号质量的总体水平。

2、音频信号质量评价方法

一般地,高音频质量意味着声音信号可以精确地复现,那么音频信号质量评价方法的背后必须体现这一思想。这便使得无参考信号之音频测听的有关规定异常困难。由此,音频质量评价方法目前仅局限在侵入式测量技术方面的研究。

2.1 主观测量方法

本节主要描述ITU-R制定的二个音频质量主观评价标准:ITU-R BS.1116[6]和ITU-R BS.1534[7]。它们用于单声道(关于基本音频质量)、双声道(关于基本音频质量或立体声影象质量)和多声道(关于基本音频质量,或前侧影象质量,或影象质量的感觉)音频系统,特别是音频编解码器。

I T U-R B S.1 1 1 6音频主观测量方法主要用于小失真(impairment)情况,它并非采用ACR技术,而是使用基于比较的方法。测试至少需要20个专家级的测听者,播放给测听者的音频信号是三个一组的信号集(A,B,C),其中A是参考信号,B和C既可为测试信号,也可为一个A的精确复制。测听者根据B和C相对于A的失真等级来打分,其分数刻度由表2定义,其对应的离散刻度取值范围为从1.0(“很烦人”)到5.0(“感觉不到”)。相应地,可获得测试信号和参考信号之间的SDG分数,其取值范围是从-4到0,这里“0”代表“感觉不到”。

而ITU-R BS.1534音频主观测量方法[7]则应用于中等失真系统的音频质量评价。测试实验要求至少有20个有经验的测听者,播放给测听者的音频信号是:(1)参考信号,(2)用该参考信号生成无法辨识的样本(包括原始参考信号本身和其低通输出),来组成测试信号子集,子集最多为15个样本。测听者从0到100范围内用一个连续的刻度值,来评判测试集中每个样本相对参考样本的失真程度,其中范围0~100被划分成5个等间距区间,它们对应于“坏(Bad)”和“优秀(Excellent)”。总之,上述二种测试实验中所用的信号,必须是能够突出待测系统的自然(和中性)音频信号,并且其持续时间须在10~25秒。测试结果报告应包含测试样本各自的置信区间。测试实验要求测听者须是专家或有经验,其目的是使测试结果的偏差保持尽可能低。

2.2 客观测量方法

音频信号质量客观测量方法的研究始于90年代初,大量学者和工程技术人员相继提出了诸如PAQM、PERCEVAL、DIX、OASE和POM等许多模型[21,22,23,24,25,26],其中PAQM(perceptual audio quality measure PAQM)模型最为成功,但其精度未达到ITU-R的要求。为了达到要求的精度,有关学者和技术人员联合研发,将PAQM同噪声遮蔽比(noise-to-mask ratio,NMR)模型、扰乱度量(disturbance index,DIX)模型和其它模型相集成,从而提出一个音频质量感知评价(perceptual evaluation of audio quality,PEAQ)模型,该模型被ITU采纳为音频质量客观评价标准ITU-R BS.1387[14],它与音频质量主观测量标准ITU-R BS.1116和ITU-R BS.1534相对应。

PEAQ算法有二种版本:基本版和高级版。基本版复杂度较低,适合实时应用或应用环境计算能力受限的场合。而高级版的复杂度大,通常是基本版的4倍,但性能精确,适用于精度尤为重要的应用场合。PEAQ算法的基本版和高级版之间的主要差别在于:(1)基本版算法仅有一个基于FFT的周边耳模型,而高级版算法具有一个基于FFT和另一个基于滤波器组的周边双耳模型;(2)基本版算法产生11个模型输出变量(model outpu variable,MOV),而高级版算法仅产生5个MOV(注:MOV是基于响度、调制、遮蔽和自适应的输出特征)。

PEAQ算法是一种侵入式方法,其输入为参考音频信号和待测音频信号,算法对其二个输入进行电平调节,然后将它们映射到时间-频率域的表征:T1(t,f),继而映射到时间-Bark域的表征:T2(t,Bark)。一个包含听觉门限、响度、调制、遮蔽和自适应特征在内的“计算感知模型”运行于内部表征T2(t,Bark),通过处理,获得一组MOV,该MOV特征子集输给用来模拟人脑认知模型的人工神经网络(artificial neural network,ANN),由它给出音频质量客观差别程度(objective difference grade,ODG)。ODG的离散取值范围为0~-4,这里“0”代表“感觉不到的失真”而“-4”代表“很烦人的失真”。ANN的结构为多层前馈感知器型,其权值训练方法采用误差后向传播算法(error back-propagation)[27]。PEAQ算法的基本版和高级版模型结构框图分别建图5和6所示。

3、网络语音会谈质量评价方法

前述的所有质量评价方法均涉人们被动主观测听活动,因而不适合于评价语音会谈质量。一般地,网络语音链路的会话质量包括:(1)听觉质量(listening quality)——测听者对来自语音链路对端的说话声音感觉(噪声,失真等);(2)说话质量(talking quality)——测听者对自己的说话声音感觉(回声,侧音,背景噪声切换);(3)互动质量(interaction quality)——谈话双方互动时彼此感觉(延时,双向发话失真即Double-talk失真等)。其中说话质量和互动质量强烈依赖于话音和会谈的特性,使其通常难以评定。互动质量依赖于时延和会谈中的张口长度(talk-spurt length)[28]。而时变话音频谱对如何感知回声会产生影响。尽管在主观测试中人们大都能精确裁决同一物理信号,但在会谈主观测试中却不可能做到这一点,由此难以找到主、客观会谈测试之间的关系。通常,会谈测试实验采用一对测试者在测试网络上进行一些会谈互动,然后根据表1各自独立给会谈质量打分[28]。这种主观测试方法涵盖了从每个测听者嘴到其耳的网络所有特性,包括侧音、回声、时延和信号电平失真;但由于其相对复杂、较慢和较贵,因而较少使用。于是人们开始寻求能预测语音会谈质量的计算模型,这便是ITU-T G.107定义的E-模型[29]。

E-模型是远程通信传输计划模型,起初由欧洲电信标准协会(European Tele-communications Standards Institute,ETSI)为预测话音(语音)链路综合会谈质量而开发的。E-模型的框图如图7所示,它预先假设待测话音链路有关的所有参数是已知的。远程通信工业的实践表明,诸如响度、背景噪声、低速率编码失真、丢包、时延和回声等因子对会谈语音质量有较大的影响,并且这些因子的影响作用可定量化。E-模型的输出是一个质量等级因子R,其取值范围为0~100。它通过下述的数学映射而获得相应E-模型会谈语音质量的MOS分,即:MOSCQE。

E-模型中主要考虑三种失真因子:语音信号失真因子、延时产生的失真因子、和设备失真因子,其中设备失真代表由低速率编解码器以及丢包等错误所致的失真,该失真因子的主观与客观测量方法由ITU制定的标准ITU-T P.834确定[30]。应该指出的是,E-模型所基于的诸如线性和次序独立性等简单假设,在某些情况下已知是错误的。正因如此,E-模型通常仅被用作计划(Planning)工具。不过,通过测量某些语音链路的参数,用它可监测语音质量[31,32,12]。

对传统的远程通信网络,其要求信道错误或编码失真(常指64k b i t/s的A-律或μ-律)最小化,那么它的会谈语音质量一般由发话者的回声、往返时延、噪声、和语音电平变化等网路参数决定。通常在干路或国际交换中心,用称之为在职非侵入测量器件(in-service non-intrusive measurement device,INMD)的专利技术(即ITU-T P.562标准[12]),可测得这些网路参数。INMD可应用于E-模型和呼叫清晰指数(call clarity index,CCI)模型,其中E-模型首先根据文献[12]附件B描述的算法将INMD所测的回声、往返时延、噪声和语音电平变化等网路参数映射成E-模型参数来估计质量等级因子R,再通过方程(2)求得相应的会谈质量客观MOS分(即MOSCQE)。而CCI模型如图8所示,其中“INMD”模块提供呼叫清晰度参数;“网络和扬声器假定”模块提供诸如每个传递路径(发话者嘴到INMD和INMD到测听者耳)总体敏感性-频率响应特征、每个侧音路径(每个发话者嘴到其耳)的敏感性-频率响应特征、通话链路每端的室内噪声频谱和电平、以及平均语音频谱和听觉门限;“假定”模块根据来自“INMD”和“网络和扬声器假定”二模块提供的参数,来形成一个端对端网络的完整描述;“损耗和噪声感知模型”模块根据该完整描述来预测在无回声和延时条件下的会谈语音质量MOSCQE;而“回声和延时感知模型”模块对“损耗和噪声感知模型”的结果进行修正,从而获得网络链路最终会谈语音质量MOSCQE的预测值。

对Vo IP网络,其会谈语音质量测量评估有两种模型:Clark的VQMON模型[31]和Broom模型[33]。为了能在低功耗边缘设备(如IP电话机和网关)和载有大量呼叫网路干路上进行实时监测,该两种模型均从实时协议(real-time protocol,RTP)运输工具中计算失真参数,而从控制协议参数中估计往返延时,然后应用E-模型。

4、声音质量评价方法的应用

业已指出[34],ITU的一系列客观评价标准ITU-T P.861(PSQM、ITU-T P.862(PESQ)、ITU-T P.563(SEAM)和ITU-R BS.1387(PEAQ),均源于通过算法的方式对相应主观测试实验进行建模的结果,因此懂得和理解已模型化的主观测试实验的设定范围,对解释客观评价模型的计算结果十分重要和必要。

客观评价模型通常在被学习与训练后,来预测主观测试的结果,因而其性能一般受限于训练数据的涵盖范围[8,10,12,14]。在该涵盖范围外,客观评价模型并不保证其工作性能很好。例如PESQ的范围不包含数据速率4 kbits/s以下的低速音频编解码器(coding and decoding,CODEC)(因为其训练集中没有该方面的数据),用PESQ来评价这类CODEC的性能,结果发现所获得的相关MOS相对低劣[35]。

主观测试数据对其模型的精度加于一个限制。例如,打分的随机误差、测试中使用的声音信号与其它平衡条件等因素引起的偏差(bias),意味着在电话MOS-LQS的测试中,每个测试条件通常有一个95%的置信区间(在0.1-0.3 MOS间)。由此可见,对一给定的主观测试条件,其精度通常为0.1 MOS的量级。尽管人们期望语音与音频质量客观评估研究将有新的连续进展,但上述这一可达精度的实际限制将很难被克服。因此,对于一些很关键的质量评定问题,我们建议要仔细地设计其主观测试实验,并尽可能地将之与相应的客观测试实验联合使用来做出最终的裁决。

客观评价模型的精度和可重复性,很大程度上依赖于它们是如何应用,且其错误相对常见。首先,测试信号的选择必须遵循以下规则:信号不含欺骗性噪声(spurious noise),并有典型(和近似最优)的电平和频谱内容。对电话语音而言,这通常涉及到用一个中间参考系统(intermediate reference system,IRS)滤波器来对记录信号进行预滤波,且语音信号应含有语音和静音区间,并含有平衡语音内容的语言表征[10];而对音频信号的要求是,其必须涵盖较宽范围的内容形式,且播放者应决定是否采用关键素材、典型素材或二者混合来测试。其次,用以记录和注入信号的测试设备必须是高质量,以避免引入额外失真。再者,测试信号的依赖性必须考虑,因为语音和音频CODEC质量随信号内容的不同会发生显著的变化。图9总结了声音评价模型的应用场合,图10展示了评价模型应用选择的示例。

5、声音质量评价方法的最新研究进展与展望

除上述介绍的标准化方法外,声音评价研究领域近来又出现了一些诸如LCQA[36]、RNONLIN[37]和PEMO-Q[38]、AAM[39,40]等新技术方法,其中AAM是一种带有信号电平调整,时频响应对齐,时域与频域遮蔽,和双耳认知模型的扩展PESQ模型;LCQA是一种非侵入式方法,它用来监控网络上窄带语音质量;而RNONLIN和PEMO-Q均为侵入式方法,用它们在整个可听频带内来评估语音和音频的质量。最近,Tu和Zhao[41]提出了基于在待测信号离散子波变换表征中插入水印(Watermarks)技术的语音和音频质量评价另一种非侵入式方法,该方法仅用窄带语音信号对之进行系统测试和评估过,但宽带语音的测试目前尚未见作者报道。

大量研究文献表明:今后声音质量评价技术的研究将可能围绕着以下几个方面来展开:(1)研究和探索能同时进行窄带(300-3400 Hz)和全音频频段(20-20000 Hz)的语音质量评估侵入式方法;(2)研究和探索实时非侵入式质量评估方法,包括基于单端和参数模型的技术;(3)研究和探索能同时进行窄带(300-3400Hz)和宽带(50-7000 Hz)语音信号质量评定的新E-模型;(4)研究和探索电话网络中,特别是Vo IP中谈话质量的新评定方法;(5研究和探索远程监控系统中高质量语音评估方法;(6)研究和探索修复的非编码音频质量评估技术;(7)研究和探索音视频混合(多媒体系统)质量的评估技术。

摘要:本文系统介绍了用于声音信号处理系统质量评价的感知技术,包括声音信号质量主/客观评价技术标准和通信网络语音会谈质量评价技术。此外,文中还讨论了声音质量评价技术标准的应用,并展望了其今后可能的研究与发展方向。

叶片裂纹声音检测技术研究及应用 篇2

叶片裂纹声音检测技术研究及应用

提出了对称补偿降噪以及利用希尔伯特变换方法进行降噪和特征信号提取.将噪声信号按对称条件分解,然后利用对称点的信号统计特性相同的`特点进行补偿降噪,从而提高了信噪比和系统实时响应能力,克服了监测的非即时性和气流噪声非零均值分布及波动信号对信号提取的干扰.

作 者:宋立辉 姜兴渭 张嘉钟 作者单位:哈尔滨工业大学航天工程与力学系,哈尔滨,150001 刊 名:高技术通讯 ISTIC EI PKU英文刊名:HIGH TECHNOLOGY LETTERS 年,卷(期): 12(7) 分类号:V4 关键词:叶片   信噪比   旋转机械   故障诊断

好声音的由来 汽车音响技术 篇3

汽车音响的发展史也是电子技术的发展史,正是电子技术的进步推动着轿车音响的发展。早在1923年美国首先出现了装配无线收音机的轿车,随后许多轿车都在仪表板总成上安装了无线电收音机。70年代初,卡式收录机出现在轿车上,与一对扬声器成为音响组合。当时收放两用机输出功率多在20W左右。进入上世纪90年代后,车载CD音响系统才逐步在汽车领域盛行起来。

汽车音响技术要点有5点:音响系统布局、音响本身的避振技术、音质的处理技术、抗干扰技术,还有主动降噪技术。

主机就好像是大脑

音响系统之所以可以称为音响,最基本的条件就是有回放声音的功能。汽车音响的主要组成部分是主机、功放和扬声器三部分。主机是汽车音响中最重要的组成部分,就好像人的大脑,要发出什么样的声音得由大脑来控制。因为汽车的振动比较大,CD部分通常采用多级减振方法。汽车音响的音质处理已朝数码技术发展,高级汽车音响带有DAT数码音响、DSP数码信号处理器等技术,形成了数字化、逻辑化、大功率的Hi-Fi上体声系统。

判断音响主机的最直接的技术指标是:1.输出功率:现在的主机所标的功率绝大多数为音乐功率,在40W~60W之间,功率不能太大。2.频率响应:人耳所能听到的频率范围在20Hz~20KHz之间,因此该指标最少要达到这个数值,而且越宽越好。3.信噪比:它是指音乐信号和噪声的比例,一般高档汽车音响都在90DB以上,该数值越大越好。4.谐波失真(THD):该指标体现声音再现的还原度,数值越小说明还原度越高,音响效果也就越好。

前级讯号控制

对于当前的汽车音响来说,前级讯号控制能力也是越来越强大。前级就是在后级之前,我们一般将功率放大器称为后级,所以在音源与功放之间,所有对于音乐讯号的处理机件,都称为前级。例如汽车音响主机上对于音量大小的控制,就是属于前级的部分,它控制的就是讯号的强弱度。其他音响器材中,较常看到的前级控制部分,还有高音与低音的调整、左右平衡、前后音量调整、音频均衡器(EQ)等控制。另外,数字音效处理器DSP也成为了现在许多主机的标准配备,它的作用就是模拟体育馆、影院或是音乐厅等空间的声音特性。随着电子集成化的不断提高,前级讯号控制的功能也是越来越强大,也为车上乘员带来了更逼真的现场般的听觉享受。

功放是音响系统的心脏

功放是音响系统的心脏,功放功率的大小,质量的好坏对音乐的播放起着至关重要的作用。普通汽车的功放都设计在主机内,功率一般为10W~45W,但这样无法聆听多层次大功率的数码音乐。要想使声音达到最佳效果,就必须在系统中增加独立的功率放大器,其目的是将电源的12V电压升至35~45V,以高电压推动大功率扬声器。这样动态范围增大了,音乐才能更完美地播放出来。

扬声器的声场效果

汽车音响的安装除了仪表台上的主机外,更重要的是扬声器的安装与配合。所以一辆轿车的音响优劣,不但与音响本身的质量有关系,还与音响的安装技术有直接关系。轿车车厢空间有限,容易形成声波的相互叠加现象,扬声器的安装位置往往影响着汽车音响的音质效果,同一对扬声器在不同的安装位置就会产生不同的效果,因此中高级轿车音响扬声器的安装位置要经过种种测试后才能确定下来。

在音乐的还原效果中,扬声器也占有重要地位,因为制造优质的扬声器需要复杂的技术,其产生的高、低音效果往往是普通扬声器无法达到的。所以高档汽车音响使用的扬声器通常是二分频喇叭或三分频喇叭,因为这样一来较容易在车内做出声场效果,增加氛围感和凝聚力,带来身如其境之感。

抗干扰不可小觑

汽车音响是处在一个非常复杂的环境之中,它随时受到发动机点火装置及各种用电电器的电磁干扰,尤其是车上所有电器都用一个蓄电池,会通过电源线及其他线路对音响产生干扰。汽车音响的防干扰技术就分别对电源线的干扰采用扼流圈串在电源与音响之间进行滤波,对空间辐射干扰采用金属外壳密封屏蔽,用以降低外界的干扰。

主动降噪使声音更出色

在人们对汽车音响音质不断追求的同时,对于汽车音响的使用环境也提出了更高的要求。汽车厂商已经将类似于降噪耳机中的主动降噪技术,应用于汽车的环境中。如凯迪拉克XTSBOSE5.1环绕声高级音响系统具备主动降噪静音系统ANC(ActiveNoiseCancellation),别克的小SUVEncore昂科拉是别克品牌中第一个安装了BOSEANC系统的车型。ANC减少噪声的具体方法是用车内麦克风采集噪声样本,经系统分析处理之后,由车载音响的扬声器播放相反的音频,以抵消噪声波,营造更安静的车内氛围。

强强联合的硕果

当前高端音响品牌和豪华轿车品牌共同开发高端汽车音响的合作也越来越多,如在奔驰S63AMG上就呈现了奔驰AMG与Bang&Olufsen共同开发的BeoSoundAMG高端音响系统(high-endsurroundsoundsystem),新一代BMW7系列也是引入Bang&Olufsen高端车载音响,由B&O经验丰富的音响工程师与宝马工程师密切合作,其成果是一丝不苟的平衡声音,使乘员在每个座位上都可以获得音乐厅般的倾听体验。1200W动力驱动的16个有源扬声器,七个高音扬声器中的每个都配备中音扬声器,提供统一且高度平衡的声音,位于前排座位下的两个强力超重低音扬声器直接安装在车身上,可以显著减少振动并带来同质清晰的音响性能。即使倾听条件发生变化,声音也会保持原声,这得益于动态音色均衡技术(DynamicSoundOptimization),该技术从箱载麦克风和车内的相关电气系统收集数据,根据车内外的条件变化不断调节声音,与通用的ANC技术有异曲同工之处。

随着多媒体存储介质的广泛应用,汽车音响系统大多已经提供USB、SD卡等即插即用式的接口,与机械机芯结构的CDRadio相比就像是听觉的快餐文化,为快节奏的生活提供了便利。经过80多年的发展,车载音响已经由最初的汽车收音机演变成集视听娱乐、通讯导航、辅助驾驶等多种功能于一体的综合性多媒体车载电子系统,成为当今汽车上一个重要的组成部分。

《激战运钞车》声音技术分析 篇4

1.1 本部片子属于动作、惊悚、犯罪影片

1.2 整体上,本片中各声音元素的总时长及所占比例

1)音乐:共出现22处,总时长共计27分9秒,占整部影片约30.6%。

2)音响:共出现108处,总时长共计38分27秒,占整部影片约44.7%。

3)人声:共出现86处,总时长共计51分30秒,占整部影片约58.5%。

4)无声:共出现30处,总时长共计4分50秒,占整部影片约5.7%。

1.3 从表格中找到的规律

1)音响出现的次数远超于其他声音元素。因此,在这类犯罪类的影片中,不仅有我们老生常谈的音乐发挥着重要功能,音响的作用也是不容小觑的。

2)尽管每一处无声的时长较短,但出现30处,超过了音乐的次数,同时占全片时长的比例约为5.7%。因此,在这类犯罪类的影片中,尽管要通过音乐营造影片的整体基调,通过音响营造气氛,但无声同样不可忽视。

2 对影片各段落及各声音元素的把握

2.1 划分段落

2.1.1 各段落时间结点及段落内主要内容

段落1:开头至32分30秒:影片节奏相对舒缓轻松,主要交代男主角Ty的生活,窘迫但苦中作乐。

段落2:32分30秒至42分20秒:Ty迫于现实,无奈接受了Mike的抢钱计划。

段落3:42分20秒至1小时21分40秒:Ty通过老人的死,内心惊醒,开始自我救赎,并搭救警察与弟弟。

段落4:1小时21分40秒至结束:一切归于平静。

2.1.2 划分这四个阶段的分界点为:

分界点1:案发当天,众人上路(通过音乐营造了紧张气氛)。

分界点2:老人的死(通过枪杀老人的开枪声,打破本段落某种程度上的平静)。

分界点3:迈克的死(通过音响,交代了一切结束,生活终归平静)。

2.2 具体各段落内各声音元素的分布情况

1)全片共计87分20秒,音乐出现22次,音响出现108次,人声出现86次,无声出现30次。

2)段落1共计32分30秒,音乐出现9次,音响出现38次,人声出现30次,无声出现7次。

3)段落2共计9分50秒,音乐出现4次,音响出现16次,人声出现10次,无声出现6次。

4)段落3共计38分40秒,音乐出现8次,音响出现53次,人声出现44次,无声出现17次。

5)段落4共计6分20秒,音乐出现1次,音响出现1次,人声出现2次,无声出现零次。

2.3 从表格中得出的结论

1)计算各声音元素转换的速度(计算方法:时间/次数)。

2)得出结论:

(1)除了音乐的转化速度最快是出现在段落1之外,其他声音元素转换的最快、第二快都集中在了段落2和段落3,因此段落2和段落3节奏快。

(2)段落2+3总时长49分10秒约占总时长88分钟的55.7%,因此可以说影片的一半以上的节奏是快的。

从数量以及时长上看,最大值主要集中在段落3,次之主要集中在段落1。而段落1在内容上没有紧张之处却同样浓墨重彩的原因,在于段落1主要介绍的是男主角泰在得知抢钱计划前的这一段生活,表面上仅仅展现了生活的拮据,但其实是在为后文做铺垫。

2.4 比较本片中重复出现次数最高的音响及不同作用

2.4.1 枪声6次

第一次,出现在段落1里,Baines在换衣间摆弄枪支,但没有开火。是为了介绍Baines的性格特点——“枪越大的人越没胆”。

第二次,出现在段落3里,Baines击中老人,Ty通过看到老人的遇害,使得内心惊醒。

第三次,出现在段落3里,Mike彻底杀死老人,使得Ty与同伴们彻底决裂,展开自救。

第四次,出现在段落3里,破了众人的嘈杂。

第五次,出现在段落3里,警察受伤,使得Ty开始展开他救——营救警察。

第六次,出现在段落3里,连续多声枪响,同伴们发现警察没死,并且被Ty转移到他们无法触碰的安全地带——车内。展现了车外的同伴们此时的气急败坏。

2.4.2 对讲机的声音5次

第一次,出现在段落1里,此处并没有特殊的设计,对讲机只是作为场景里的一个环境音响。

第二次,出现在段落1里,前半段介绍了一次“意外的事故”,在这场“事故中”车上的仨人正是通过对讲跟公司联系。但通过后半段的揭秘,我们不难看出这次意外表面上是跟Ty开玩笑,但其实是在为后面的抢劫案做的预演。

第三次,出现在段落1里,是警察局通过对讲与警察Eckehart的对话。交代出了警察Eckehart的性格特点——负责。

第四次,众人到达银行后,银行工作人员间通过对讲进行的沟通。表面上是一处无关紧要的小细节。但在这段对讲中我们看到众人之间眼神的交流,他们心中怀揣着心照不宣的秘密。

第五次,出现在段落3里,Ty努力爬上天台进行报警,终于与外界取得了联系。在这一处对讲之中,我们看到了Palmer的自杀,以及Ty与Eckehart的境遇终于出现转机。

2.4.3 警笛声3次

第一次,出现在段落1里,警笛声并没有推动情节的发展,只是将警察与Ty和Mike在某种程度上建立起一种联系。

第二次,出现在段落3里,警笛声推动了故事情节发展,并且为后文作铺垫。(正在吃热狗的警察正是因为听到了此时的警笛声,后来赶到了这个废弃的工厂)

第三次,出现在段落3里,警笛声进一步推动了故事情节发展,正是因为这一处警笛声使得原本要走的警察发现事情不对,打算进去一探究竟,进而也使得保安开枪、警察受伤。自此Ty开始展开对警察的营救。

2.4.4 敲击声2次

第一次,出现在段落3里,是众人在寻找可以用来砸螺丝的“工具”过程中产生的敲击声。凌乱出现、无节奏感。只是叙述寻找“工具”的这一个过程

第二次,出现在段落3里,众人开始砸螺丝。自出现起,贯穿于段落3接下来的部分里,富有节奏感。与段落1当中,那段长达24s的闹钟铃声呼应。

如果一定要将其与段落1开头的闹钟声进行区别的话:段落1当中的闹钟铃声,不仅交代了主人公从睡梦中醒来的这一过程,同样这种具有节奏感的音响带给观众一种近似于炸弹临爆炸前的读秒声,带给观众一种紧张感。在段落3中的第二次敲击声,不是体现节奏感,更多的是带给观众一种临场感、紧迫感。仿佛此刻锁在车里的人就是我们自己。

2.5 片中出现的音乐

1)本片中,共计18首音乐,出现22次[其中有两首出现次数较多,第一首出现两次,第二首出现4次。其余的在片中只出现一次。1首×2次+1首×4次+(18首-2首)×1次=22次]。

2)这18首音乐的整体特点:没有歌词。

3)逐一分析每一首音乐。

音乐01第一次,出现在段落1开头。配合平行蒙太奇,介绍了正反两派男一号;并且与闹钟声配合,奠定了本片紧张的基调。第二次,出现在段落4结尾,作用:与片子开头首尾呼应。

音乐02第一次,出现在段落1,此时画面内容上没有紧张的情节,配乐却给人一丝隐隐的紧张感。通过片尾的解密——保安队长的那句台词,细想这一干人等为什么计划起初进行的如此顺利,我们不难猜到——保安队长才是这次计划的幕后大佬。那么此处的声音设计我们也就不难理解了——看似没有什么,其实是暗示后文的真相,并且在为后文做铺垫。第二次出现在段落2,可以分为三段,第一段是以一类似脚步声的音响逐渐叠加成旋律,突出Mike此时内心七上八下。第二段没有脚步声的音响,在换衣间内众人不知道Ty是怎样答复Mike的,内心紧张。第三段同样是没有脚步声的音响,表现众人紧张的上路。第三次出现在段落2,将原来的音乐放慢,加入新的旋律,展现内心又紧张又兴奋。第四次出现在段落3,突出了音乐中的节奏,表现了弟弟被抓作人质这一事件的紧迫感。

音乐03出现在段落1,Mike第一次等Ty时的音乐,展现了此时二人关系融洽,内心轻松。

音乐04、05、06出现在段落1,画面内容为3个部分:

(1)3个人以为遇到了抢匪。

(2)逃离的途中运钞车出现了故障,此时抢匪已经步步紧逼,Ty认为死定了。

(3)最后发现是同伴们合伙跟自己开的玩笑。

那么与之对应的是,这一部分的音乐也是三首音乐的融合,作用分别如下:

(1)音乐04,体现悬疑感。

(2)音乐05,体现紧张感。

(3)音乐06,体现急迫感。

音乐07出现在段落1,前一个画面是众人在台球厅里,由那次玩笑谈到了多年以前的抢劫案,当Ty在得知多年以前的抢劫案之后,内心一时难以接受,选择了沉默和离开。此处音乐声音很弱,只有那几声拨弦声音很大,配合了Ty此时的内心。

音乐08出现在段落1结尾,音逐渐增强,配合画面上Mike的解密,以表现了Ty得知真相后的内心的难以接受。

音乐09出现在片段1,作为两个相对轻松的情节之间的连接。在引入故事中的主人公门的工作地点的同时,时刻提醒观众:那根紧张的神经不要放松下来。

音乐10出现在段落2,表现了众人上路。

音乐11出现在段落2,几乎没有什么旋律,只是节奏感很强。展现了老人从出现到遇害,都是一个意外。其中重点展示了追逐老人时的紧迫感。

音乐12出现在段落3,插入打击乐的鼓点,推动了故事情节的发展,Mike痛下杀手,使得Ty终于忍无可忍,与同伴们彻底决裂。

音乐13出现在段落3,展现Ty力图呼叫总部支援,以及Mike在劝说无用后,狠劲彻底爆发。

音乐14出现在段落3,展现Mike与Ty二人彼此追逐。

音乐15出现在段落3,烘托了众人在寻找工具时的气氛。

音乐16出现在段落3,出现在抓Ty弟弟的这一段,声音由弱到强,最后将观众的恐惧推向高潮。

音乐17出现在段落3,Ty从车里爬出来,努力登上天台向外界求救,展示事情出现转机。

音乐18出现在段落3,展现了Mike与Ty的最后一次追逐的场面。

3 从设计者的角度分析

3.1 段落1是怎样为后文的紧张气氛做铺垫的

1)在这一段音乐之下介绍了正面人物Ty醒来、关闹钟、敲门、叫弟弟起床,反面人物Mike洗脸、出门、发动汽车等内容,这段音乐时高时低,营造了一种紧张的基调。并且配以具有节奏感的闹钟音响,带给观众一种近似于炸弹临爆炸前的读秒声,营造紧张感。

2)对于相同场景的不同声音设计例:同为室外,Mike在车内等待Ty一起上班。

第一段中:Mike等到了Ty,并且二人有说有笑,因此配的是轻松的爵士乐。

此处,设计者的目的是介绍二人融洽的关系,以及Mike此时心理并没有在担心Ty是否会来。

第二段中:Mike没等到Ty,独自走向了换衣间。因此配的是紧张的音乐,并且画面上对Mike看向后视镜的眼睛的特写镜头不断抖动,更加加重了紧张感。此处,设计者的目的是介绍二人关系发生微妙变化,Mike此时内心焦虑、紧张,担心等不到Ty,担心Ty会拒绝参加乃至破坏他们的计划。

3.2 人物对比

3.2.1 Ty(正面人物)性格前后对比

之前:被生活所迫才参加了这一次行动。

之后:因为老人的死让Ty惊醒,从此开始自我的救赎,并搭救了警察与弟弟。

3.2.2 警察Eckehart(正面人物)性格对比

之前:善良。之后:坚强,呼吸困难但努力坚持。

3.2.3 Quinn(反面人物)性格特点

作为这个团队中的爆破专家,Quinn只是团队中一个话少、追随大多数人的形象。

3.2.4 Mike(反面人物)性格前后对比

之前:道貌岸然,关心Ty以及弟弟的生活,甚至在吃热狗的时候主动帮Ty的弟弟带一份热狗作为晚餐。

之后:内心阴暗。当Ty将自己锁进车里以后,最为强烈,不惜派同伴把Ty的弟弟抓来做人质。失败后更是对Ty痛下杀手。

3.2.5 Baines(反面人物)性格特点

脾气火爆,但正如在截取的第一段视频中Ty所说的那样,“枪越大的人越没胆”Baines的确是一个外强中干的大块头,在那个意外的目击者——老人,以及意外引来的警察,这两个人出现的时候,每一次他都是先人一步选择开枪,选择杀死可能会坏事的人。

3.2.6 Palmer(反面人物)

我们怎样听到声音+声音的特性 篇5

我们怎样听到声音

●教学目标

一、知识目标

1.了解人类听到声音的过程.2.知道骨导的原理.3.了解双耳效应及其应用.二、能力目标

1.通过实验和生活经验,体验人是如何听到声音的.2.通过本节课的学习,加强物理与生物学科间的交叉、渗透和综合,从而培养学生学科间的综合能力.●教学重点

1.人类听到声音的“物理过程”.2.骨导的原理.●教学难点

通过实验和生活经验,体验人是如何听到声音的.●教学方法

实验法、讨论法、探究法.●教学用具 音叉(若干个)、人耳的构造挂图、录音机.●课时安排 1课时

●教学过程

一、创设问题的情境,引入新课 [师]我们生活的世界充满了各种丰富多彩的声音,人们凭借人体的什么器官听到声音呢?

[生]耳朵.[师]那么,耳朵通过什么途径感知声音呢?请同学们观察人耳的结构挂图,想一想生物课上介绍的人们感知声音的基本过程是什么?

二、进行新课 [人耳的构造]

[师]出示人耳的构造挂图.[生]分组讨论人们感知声音的基本过程.[师生共同活动]总结上述问题:外界传来的声音引起鼓膜振动,这种振动经过听小骨及其他组织传给听觉神经,听觉神经把信号传给大脑,这样人就听到了声音.声音-----鼓膜振动-----听小骨及其他组织-----听觉神经-----大脑-----声音 [生]耳聋是怎么回事?

[师]在声音传递给大脑的整个过程中,任何部分发生障碍(例如鼓膜、听小骨或听觉神经损坏),人都会失去听觉,导致耳聋.[生]神经性耳聋和非神经性耳聋又是怎么回事呢?

[师]由于听觉神经损坏而导致的耳聋为神经性耳聋;由于声音的传导发生了障碍(如鼓膜、听小骨损坏)而导致的耳聋为非神经性耳聋.[生]这两种耳聋能够治愈吗?

[师]神经性耳聋不能治愈,非神经性耳聋可以治愈.[生]助听器矫正的是哪种耳聋? [师]当然是非神经性耳聋,同学们,假如我们听不到自然界中的各种声音,我们的生活将会是什么样子呢?

[生]那样的话,我们将失去了获取信息的主要渠道,我们将生活在一个非常寂静的世界.[师]在我们的周围,有很多人因为各种原因失去听觉,我们每一位健康的人应该关心、帮助残疾人,致力于这方面的研究,使这些人恢复听觉.[想想做做]

[师]请同学们将振动的音叉放在耳边,听音叉的声音.[生]分组操作(两个学生一组,轮换听音叉的声音)[师]在这种情况下,人是如何听到声音的?

[生]音叉的振动在空气中激起声波,声波由空气传入耳内,引起鼓膜的振动,这种振动经过听小骨及其他听觉神经,听觉神经把信号传给大脑,这样人就听到了声音.[师]用手指将耳朵堵住,再听音叉的声音.[生]听不到了.[师]请同学们用手指将自己的耳朵堵住,把振动的音叉的尾部先后抵在前额、耳后的骨头和牙齿上,看看能否听到音叉的声音?

[生]分组操作.把音叉的尾部抵在前额、耳后的骨头上,能“听到”较弱的声音,把音叉放在牙齿上体验,“听到”的声音较强.[师]这个实验说明了什么道理? [生]骨能传声.[师]声音通过头骨、颌骨也能传到听觉神经,引起听觉.物理学中把声音的这种传导方式叫骨传导.一些失去听觉的人可以利用骨传导来听声音.例如:音乐家贝多芬耳聋后,就是用牙咬住木棒的一端,另一端顶在钢琴上来听自己演奏的琴声,从而继续进行创作的.他的这种对音乐的执着和刚强的意志,真让我们健康人为之震撼.[科学世界]

[师]实际中我们如何来确定发声体的位置呢?

[生]通常的情况下,我们可以利用眼睛来确定发声体的位置.[师]如果将你的双眼蒙上,能大致确定发声体的位置吗?让我们一起来做一做.[生]结果表明“能”.[师]这是为什么呢?下面让我们来介绍双耳效应.由于人有两只耳朵,声源到两只耳朵的距离一般不同,声音传到两只耳朵的时刻、强弱及其他特征也就不同,这些差异就是判断声源方向的重要基础,这就是双耳效应.[生]老师,我们明白了:人们可以准确地判断声音传来的方位,是由于双耳效应的结果.[师]在我们的生活中,许多音响设备都是双声道立体声或多声道立体声,这又是怎么回事呢?下面让我们对这一问题进行探讨.人们平常听到的声音是立体的.要想重现舞台上的立体声,使我们有身临其境的感觉,可以把两只话筒放在左右不同的位置(相当于人的两只耳朵),用两条线路分别放大两路声音信号,然后通过左右两个扬声器播放出来,这样,就会感到不同的声音是从不同的位置传来的,这就是常说的双声道立体声.如果想得到更好的立体声音效果,可以在声源的四周多放几只话筒,在听众的四周对应地多放几只扬声器,这样听众就会感到声音来自四面八方,立体效果就更好.三、小结

本节课我们主要学习了以下内容: 1.声音传播的两种途径:(1)空气传导(2)骨传导 2.双耳效应

四、布置作业

1.把动手动脑学物理第2题写在作业本上.1.省电;效果;还原 2.小论文:助听器的功能

3.查阅资料了解双声道立体声.五、板书设计

空气传导声音传播的两种途径 我们怎样听到声音骨传导基础双耳效应:是判断声源方向的重要第三节

声音的特性

●教学目标

一、知识目标 1.了解声音的特性.2.知道乐音的音调跟发声体的振动频率有关,响度跟发声体的振幅有关.3.不同发声体发出乐音的音色不同.二、能力目标

1.通过做“音调与频率有关的实验”和“响度与振幅有关的实验”,进一步了解物理学研究问题的方法.2.培养学生科学探究的能力.●教学重点

音调、响度、音色的概念及其相关因素.●教学难点

探究决定音调、响度的因素.●教学方法

探究法、演示法.●教学用具 钢尺(若干)、示波器、音叉、乒乓球(系有细绳)、铁支架、口琴、笛子、小提琴、录音磁带、录音机.●课时安排 1课时

●教学过程

一、创设问题的情境,引入新课

[师]生活中我们接触到的声音各种各样,千差万别.其中有许多声音让我们感到悦耳、动听.例如:音叉发出的声音、人歌唱的声音、各种乐器的演奏声等,它们都是物体做规则振动时发出的声音,物理学中把这类声音叫做乐音.请同学们注意听下面的歌曲(男低音独唱曲、女高音独唱曲),比较这两支歌曲的演唱风格有什么不同?

[生甲]前者的演唱声音低沉,后者的演唱声音尖细.[生乙]前者的演唱是通俗唱法,后者的演唱是民族唱法.[生丙]前者的演唱声音小,后者的演唱声音大.[生丁] 前者的演唱音调低,后者的演唱音调高.[师]有的声音听起来音调高,有的声音听起来音调低,声音为什么会有音调高低的不同呢?让我们一起来做下面的探究活动.二、进行新课

[探究]音调和频率的关系.[师]每组的实验台上备有钢尺,请同学们想办法使钢尺发声.[生]把钢尺紧压在桌面上,一端伸出桌边,拨动钢尺,听它振动发出的声音.[师]使钢尺伸出桌边的长度短一些,注意观察钢尺振动发声时振动得快慢及声音的特点.[生]钢尺振动得较快,声音尖而细.[师]使钢尺伸出桌边的长度较长一些,再次拨动,注意要使钢尺两次振动的幅度大致相同,比较两种情况下钢尺振动得快慢和发出的音调.[生]当钢尺伸出桌边的长度较短时,钢尺振动得较快,音调高;当钢尺伸出桌边的长度较长时,钢尺振动得慢,音调低.[师]同学们刚才的探究活动很成功,为同学们成功的合作及探索鼓掌.请同学们阅读教材20页内容,回答下面的问题:

[投影]

1.频率的物理意义是什么?什么叫频率? 2.在国际单位制中,频率的单位是什么?

3.物体振动得快慢、频率跟音调的关系是什么? 4.大多数人能够听到的频率范围是什么? 5.什么叫超声波?什么叫次声波?

6.生活中你对超声波、次声波了解多少?能说出它们的一些用处吗? [生]阅读教材内容,并讨论上述问题.[师]指导学生带着问题去阅读.[生答]

1.频率是用来描述物体振动快慢的物理量,物理学中把物体在每秒内振动的次数叫做频率(frequency).2.在国际单位制中,频率的单位是赫兹(Hertz),简称赫,符号为Hz.3.实验表明,频率决定声音的音调.物体振动得快,频率高,发出的音调就高;物体振动得慢,频率低,发出的音调就低.4.大多数人能够听到的频率范围从20 Hz到20000 Hz.其中20 Hz是人类听觉的下限,20000 Hz是人类听觉的上限.5.频率高于20000 Hz的声音叫做超声波(supersonic wave).频率低于20 Hz的声音叫做次声波(infrasonic wave).6.超声波有两个特点:一个是能量大,一个是沿直线传播.超声波的应用主要有以下几个方面

(1)超声波加湿器、治疗咽喉炎及气管炎的药液雾化器利用超声波的高能量将液体破碎成许多小雾滴.(2)超声波清洗污垢.(3)声纳利用超声波基本上沿直线传播探测水中的暗礁、敌人的潜艇,测量海水的深度.(4)超声波探伤仪利用超声波沿直线传播探测金属、陶瓷、混凝土制品内部是否有气泡和裂纹.(5)医院利用B超(B型超声波)分析体内的病变.(6)许多自然灾害如地震、火山爆发、龙卷风等在发生前都会发出次声波,科学家们用次声波来预测台风、研究大气结构等,在军事上可以利用次声来侦察大气中的核爆炸、跟踪导弹等等.[师] 有趣的是很多动物都有完善的发射和接收超声波的器官.例如蝙蝠,飞行中不断发出超声波的脉冲,依靠昆虫身体的反射波来发现食物.海豚也有完善的“声纳”系统,使它能在混浊的水中准确地确定远处小鱼的位置.[生]老师,现代的无线电定位器——雷达,就是仿照蝙蝠的超声波定位系统制造的.[师]的确是这样,这门新学科叫仿生学.另外,有些动物对高频声波反应灵敏(如猫、狗、海豚),而有些动物对低频声波有很好的反应(如大象可以用人类听不到的“声音”进行交流,实际上大象的语言对人类来说就是一种次声波).请同学们课后通过查阅资料、访问网站等多种途径,了解超声波和次声波的应用,并利用活动课进行交流.[演示]观察声波的波形

[师]简单介绍示波器的作用:

在这里,我们要用示波器显示声波的波形.[生]示波器为什么可以显示声波的波形呢?

[师]示波器的构造复杂,工作原理要在高中物理的电场部分涉及到,目前同学们的知识还不足以理解它.另外,我们也没有必要弄懂它,只要我们会正确使用就行了.下面让我们一起来完成这个实验.1.通过示波器观察两个频率不同的音叉发出声音的波形,比较不同频率的声音的波形有什么差别.2.通过示波器观察不同的男女同学发出声音的波形,比较男女学生声音的波形有什么不同? 实验结论:

1.两个频率不同的音叉发出声音的波形相似,但频率高的音叉的波形要密一些.2.男、女学生声音的波形不同,女同学的音调比男同学高,波形就密一些.[生]老师,轻敲和重敲同一个音叉(即频率相同的音叉),音叉发声的波形有什么不同?

[师]这个问题提得很好,实践是检验真理的惟一标准,让我们做做看.实验结论:

轻敲音叉时,波形的幅度小;重敲音叉时,波形的幅度大.但两种情况下,波形的疏密程度相同.[想想议议]

[师]振动会发出声音,为什么我们听不到蝴蝶翅膀振动发出的声音,却能听到讨厌的蚊子声?请同学们分组讨论.[生]分组讨论.[师生共同活动,总结上述问题]

蝴蝶的翅膀一秒钟振动不超过10次,蚊子的翅膀一秒钟振动500~600次,由于蝴蝶的翅膀振动的频率低于人耳能够听到的频率范围,当然人耳听不到蝴蝶翅膀振动发出的声音.而蚊子翅膀的振动频率在人耳的听频范围内,人耳就能听到蚊子翅膀振动发出的声音.[师]声音有音调的不同,也有强弱的不同.物理学中把声音的强弱叫做响度.响度也就是我们平常所说的声音的大小.怎样才能使物体振动发出的声音更响?

[生]大胆地猜想.应该使物体振动的幅度大一些.[师]同学们能设计一些切实可行的实验来证实你们的猜想吗?

[生甲]轻敲鼓面,鼓皮振动的幅度小,声音弱,响度小;重敲鼓面,鼓皮振动的幅度大,声音强,响度大.[生乙]拨动小提琴的琴弦,琴弦振动的幅度小,琴声弱,响度小;琴弦振动的幅度大,琴声强,响度大.[师]同学们刚才的猜想和论证都具有一定的科学性,值得表扬.下面让我们利用准备的仪器进行探究活动,证实同学们上面的猜想.[探究]响度跟什么因素有关? 1.用细线把乒乓球吊起来,使乒乓球静止在竖直位置,恰好跟音叉的一个叉股接触.轻敲音叉,观察乒乓球被弹开的幅度.2.重敲音叉,使音叉发出响度更大的声音,观察乒乓球被弹开的幅度.3.比较音叉发出不同响度的声音时,乒乓球被弹开的幅度有什么不同.4.通过上面的探究活动,可以得出什么结论? [生]分组实验,探究响度跟什么因素有关.实验结果:

1.音叉发出声音的响度小,乒乓球被弹开的幅度小,音叉振动的幅度小;音叉发出声音的响度大,乒乓球被弹开的幅度大,音叉振动的幅度大.2.通过上面的探究活动可知,响度跟发声体振动的幅度有关,物体振动的幅度越大,产生声音的响度越大.[师]物体振动的幅度叫振幅.物体的振幅越大,声音的响度就越大.[生]振幅是确定响度的惟一因素吗?

[师]实际中,响度还跟听者与发声体的距离有关.距发声体越远,听到的声音越小,响度越小.(可以向学生简单介绍原因:因为声音在传播过程中,越到远处越分散.)

[演示]音调和响度的关系 用口琴先用力吹“1”,再轻轻吹“5”.请同学们比较它们音调的高低,响度的大小.[生甲]“1”的响度大.[生乙]“5”的响度小.[生丙]“1”的音调低.[生丁]“5”的音调高.[师]通过上面的实验,我们可以发现:音调和响度是声音的两个不同的特征.响度大的声音,音调不一定高; 音调高的声音,响度也不一定大.在同一首歌曲中,音调低的“1”可以唱得比音调高的“5”更响.[练习]请同学们讨论并回答,蚊子的叫声与黄牛的叫声相比,哪个音调高?哪个响度大?

参考解答:

蚊子的叫声音调高; 黄牛的叫声响度大.[师]频率的高低决定声音的音调.但是不同的物体发出的声音,即便音调相同,我们还是能够分辨它们.这表明在声音的特征中还有一个因素是十分重要的,它就是音色.物理上,把不同的物体发出的声音具有不同的特色叫音色(musical quality).[想想做做]

[师]请两位同学藏在讲桌后面,分别用不同的乐器(口琴和笛子)演奏C调的“1”,让同学们猜他们用的各是什么乐器?

[生甲]第一位同学用的是口琴.[生乙]第二位同学用的是笛子.[师]两位同学猜得都对.为什么这两位同学猜得如此准呢? [生]因为它们的音色不同.[师]播放录音(分别用小提琴和二胡演奏的《二泉映月》).同学们能不能分辨出由不同乐器演奏的同一首乐曲.[生]据它们的音色不同来分辨.[演示]观察波形.将话筒接在示波器的输入端,用不同的乐器对着话筒发出相同音调的声音(都发C调的“1”),比较各波形有何异同?

实验结果:

不同乐器演奏C调的“1”时,波形各不相同,音调相同,频率相同;但振幅不同,响度不同.[想想做做]

[师]在上节的活动课上,我已经让同学们用录音机听自己的录音,然后把自己的录音与自己的原声作了比较.在这里,我们要让别的同学听你讲话,再听你的录音,然后加以比较,两次听到的声音一样吗?

[学生实际操作]

实验结果:听别人直接讲话和听别人的录音没有多大差别.分析原因:这是因为录音机录下的是说话人通过空气传来的声音,直接听到说话人的声音也是通过空气传来的,所以别人认为像说话人的声音.三、小结

本节课我们主要学习了以下内容: 1.乐音的三个特征:音调、响度和音色.2.音调是由发声体振动的频率决定的.3.响度是由发声体的振幅决定的.4.不同的发声体具有不同的音色.四、布置作业

1.活动课上,每个同学尽可能带一种家里有的乐器,观察是怎样发出声音的,又是怎样改变音调和响度的.2.制作音调可变的哨子,并用它演奏一首音乐课上学过的简单的曲子.3.把动手动脑学物理的3题写在作业本上.4.自制乐器,在活动课上交流.五、板书设计 音调:决定于了发声体的效率声音的特性响度:决定于发声体的振幅

声音技术 篇6

【关键词】3D交响音乐会;波场合成;拾音;扩声;声音设计

文章编号:10.3969/j.issn.1674-8239.2014.04.006

2013年10月28日晚,“北外滩景观3D全息交响音乐会”在上海黄浦江国际航运和金融服务中心开放式露天广场激情奏响。此次音乐会是国内首次在露天城市景观中创新性运用基于“波场合成”技术的3D扩声技术来演绎的交响音乐会,是一次在声音还原技术上革命性的突破。这场演出吸引了演艺界和音频工程界的极大关注,并迅速成为媒体报道的热点,8家电台电视台、10家主流报纸、30多家门户网站进行了报道,上海电视台艺术人文频道进行了实况转播。

笔者亲身体验了这场音乐会,希望通过本文与大家共同分享3D声音技术发展信息,研讨3D声音新技术对于文化创新的意义。为行文方便,文中的“上海北外滩景观3D全息交响音乐会”均简称为“北外滩3D音乐会”。

1 波场合成技术的由来

波场合成,英文全称Wave Field Synthesis,缩写WFS。波场合成技术最早由荷兰代尔夫特大学的Berkhout教授提出,其理论是基于荷兰物理学家惠更斯(Christiaan Huygens,1629—1695)①于1678年提出的“惠更斯原理”。惠更斯原理认为:空气中任意波前上的各点,都可以看作是新的子波源,其后的任一时刻,这些子波源发射的波前的包络线,就是声波这一时刻的新波前。举个简单的例子,小提琴演奏时发出的声波,其后的任意一道波前可以看作是由无数的子波源组成,这些子波源散发出新的波前,其后的任一时刻所有子波源波前的包络线,就是小提琴声波在这一时刻新的波前,如图1所示。

真实听感中,声音是在三维空间中传播的,因此,不仅有水平平面上的定位变化,也应该有垂直方向上的定位变化。目前所使用的虚拟听觉重放技术是依据双耳效应的原理,通过强度差、时间差、相位差产生虚拟的平面声像定位。然而由于中近场扬声器回放的都是球面波,听者稍微移动都会导致听感变化,因此,在定位上有很大的局限性,双声道立体声的最佳听音位置只有一个,俗称 “皇帝位”。5.1环绕声系统在同平面上添加了1只中置扬声器和2只环绕扬声器,弥补了正前方虚拟定位和后方定位的不足,扩大了最佳听音位置,但依然没有垂直方向(Z轴)的定位,且都无法还原平面波。

与以往双声道立体声和2D环绕声相比,波场合成系统通过X、Y、Z三维立体声场的重建,让听众仿佛置身于真实的声音空间,沉浸在四面八方传来的直达声、早期反射声和混响声等声音信息中,声源对象可以被定位在空间中的任意位置,任意不同的位置都能聆听到真实的、高品质的声音,消除了“皇帝位”的概念。

波场合成技术从理论到实用化之路并不平坦,这不能不提到IOSONO公司。德国IOSONO公司是为电影院、大型活动和娱乐场所等提供3D全息声音解决方案的创意公司,总部位于德国埃尔福特。自2004年成立以来,IOSONO开发出基于波场合成技术的商用化音频硬件和软件,这一新技术业已在全世界范围内迅速推广,并在展览、演出、文化地标、电影院线、娱乐游戏等众多领域和专业院校获得富有特色的运用。

2010年,国内四维音乐工程设计公司敏锐地觉察到波场合成技术的发展前景,引进这项跨时代的新技术,2012年,位于上海广中路的“SWD- IOSONO三维全息声音实验室”正式落成,这是国内首个3D全息声音实验室,中国的“3D声音”时代由这里开始了。

2 北外滩3D音乐会的创意

为进一步提高上海的国际大都市的影响力,丰富市民的文化生活,上海市政府计划2013年举办上海国际艺术节和上海首届市民文化节,在上海市文广影视管理局、上海市教委和虹口区政府的支持下,音乐会主办方上海交响乐团和四维音乐工程设计公司共同提出了一个大胆的创意——举办中国首次户外景观3D全息交响音乐会,作为两节的重头戏。

音乐会的场地选定在黄浦江北外滩,北外滩作为上海中央商务区“黄金三角”的重要组成部分,也是上海航运发祥地,拥有悠久的历史和丰厚的文化积淀。目前,这片核心区域是亚洲规模最大的绿色建筑商办楼群,已经通过了中国绿色建筑三星级标识、美国LEED、英国BREEAM等三项国际绿色权威的绿色认证,成为世界知名企业的办公总部集聚地,新的城市黄金CBD以及上海金融、航运、贸易、文化中心,成为商界、艺术界等各路明星汇聚之地。

黄浦江北外滩国际客运码头开放式露天广场,周围高楼林立、江水滔滔。当夜幕降临的时候,浦江两岸灯光璀璨、游人如织,江面上凉风习习、游船如梭,上海的标志——东方明珠电视塔近在咫尺,中国改革开放的一幅美丽画卷呈现在人们面前。在户外运用波场合成技术为交响音乐会扩声,让观众在欣赏黄浦江两岸夜景的同时,在露天环境下享受到与音乐厅相媲美的音响效果。毫无疑问,这是一个富有想象力的创意。上海黄浦江北外滩夜景见图2,音乐会现场景观见图3。

交响乐团由90名成员组成,考虑到室外的因素,这场交响音乐会的总时长定在70 min。音乐会特邀著名指挥家陈燮阳先生执棒,上海交响乐团演奏,以歌剧、芭蕾舞剧、独奏、二重奏、独唱等多种的形式演绎众多耳熟能详的曲目,包括《威廉·退尔》序曲、《红色娘子军》、《流浪者之歌》、《胡桃夹子》、《菊花台》等中外经典名曲。

3 北外滩3D音乐会场地设计

根据现场的地形,工程师们为音乐会特别设计了一个穹顶半开放式舞台,该舞台离地高1.5 m,宽20 m,深15 m,由订制的钢桁架搭成,舞台穹顶外部包裹了一层复合材料制成的柔性外衣,这种特殊材料的外衣有很好的声学性能,可以解决交响乐队在露天舞台无限声场环境下演奏时听觉的不适应感,且能防风防雨。

观众席约长40 m,宽约17 m,能够容纳500位观众;观众席四周和头顶上架设了大型钢桁架,桁架分为三层,第一层为观众区环绕扬声器阵列,第二层为观众区头顶扬声器,第三层是舞台龙门架扬声器阵列。如此设计,就是为了在这个户外音乐会上创造出在室内音乐厅的聆听音响效果。北外滩3D音乐会舞台和观众区设计效果,搭建完成的北外滩3D音乐会现场见。

4 北外滩3D音乐会系统设计

北外滩3D音乐会的音响系统,由德国IOSONO公司、TAUCHER声音环境设计公司和四维音乐工程公司共同完成,使用的是IOSONO 86.3波场合成技术。此前在德国柏林爱乐音乐会、澳大利亚悉尼音乐会都运用了IOSONO先进的3D声音技术。 IOSONO 3D系统的设计理念,是将现场捕捉到的声音信号,在音频工作站专用软件的界面上,按照乐队的摆位进行声音设计,经过3D处理器运算后的信号流通过若干层扬声器阵列重放,最终还原交响乐队演奏的宏大声场,让听众宛如身处真实的音乐厅。

调音台使用了声艺Soundcraft Vi6数字扩声调音台,见图9。Soundcraft Vi6具有32路电动推子的控制界面,可以同时输入64路单声道,所有通道都可以直接输出,可以通过内部路由分配到32条编组/辅助/矩阵母线,以及主立体声输出。Soundcraft 优质的超低噪声传声器前置放大器和Studer先进的40 bit浮点数字音频处理技术保证了音乐会的拾音音质。

Soundcraft Vi6调音台主要用于传声器信号电平调整和频率均衡,输出的所有声道均设为单声道模式,并从调音台的MADI接口转换为MADI信号流,送往多通道音频数字接口分配器,从数字音频分配器出来的MADI信号主要送往3个去处。

第一路信号送往装有IOSONO 3D插件的PC音频工作站。音乐会扩声的3D声场设计主要在PC音频工作站的界面上完成。

PC音频工作站安装有STEINBERG公司的Nuendo音频编辑软件,并加装了IOSONO公司的3D制作插件,音乐会场地尺寸和扬声器阵列摆位诸多参数需要事先录入音频工作站,形成直观的音乐会现场图形,然后将调音台送来的多轨信号在音频工作站的界面上进行声场设计,即将声音对象进行组合分配,调整其方位、远近,设置波的性质(球面波、平面波、柱形波),添加其他效果。PC音频工作站并不直接进行WFS运算,而是将设计数据再送入2台IOSONO IPC100数字声音处理器进行处理,IOSONO IPC100音频处理器见图10。这两台处理器包含着3D声音的核心技术,即IOSONO的WFS算法。从3D处理器出来的数字信号流被送入4台D/A转换器,转换后的模拟音频信号被送往133只Meyer Sound有源扬声器和扬声器阵列。

第二路从数字音频分配器出来的MADI信号被送往一台MAC音频工作站进行现场分轨录音,以便进行后期商业制作。

第三路MADI信号被送往电视转播车。

北外滩3D音乐会音响系统信号流程。

5 北外滩3D音乐会拾音与扩声

北外滩3D音乐会现场乐队拾音使用了71支传声器,使用的品牌有NEUMAN、DPA、SCHOEPS、sE、Mics等,就其90人的乐队规模而言,基本上是弦乐两人1支,管乐和打击乐一人1支,独唱和独奏演员一人1支,采取近距离多点拾音方式,这样可以提高信号的分离度,为后期处理提供较大的自由。现场传声器拾音设置见图12、图13。

北外滩3D音乐会音响系统与其他扩声系统相比最显著的特点在于扬声器的布置不同。IOSONO 3D声音系统是一种能够控制整个听音区域内波场的空间声重放技术,它不仅能还原基于水平X轴、纵深Y轴的声音信息,而且能还原高度Z轴上的信息,因此,原则上扬声器的层数要大于或等于3层,同时需要用上百个独立通道所组成的扬声器阵列,在给定的听音区域中重建出室内的空间感。

舞台的正面共有3层扬声器,设置如下:

(1)舞台龙门架上方装有7组M' elodie小型扬声器阵列,扬声器间距约2.5 m,用于观众区纵深的覆盖;

(2)舞台台口装有13只MINA扬声器,间距约0.6 m,负责近场补声;

(3)台口下摆放8只1100-LFC低频控制单元提供低频补充,间距约2 m;

(4)台上另有4只UPJ-1P和2只UPA-1P扬声器用于舞台返听;

(5)观众区左右各装24只UPA-1P扬声器,间距约1 m,并有一定的倾角覆盖观众区;

(6)观众区头顶上方分5排装有13只UPA-1P扬声器,行距约7 m;

(7)观众席后方吊有8组M' elodie扬声器小型阵列,间距约2 m。

音乐会共使用了96个通路信号,133只扬声器。所有的扬声器均采用美国产Meyer Sound有源扬声器。北外滩3D音乐会扬声器设置实景见图14~图16。

6 对北外滩3D音乐会评价

在男高音韩蓬的《今夜无人入眠》中北外滩3D音乐会被推向高潮,经典交响乐与创新3D声音技术的完美结合让现场四百多名听众度过了一个难忘的夜晚。音乐会演出场景见图19。

音乐会结束后,有关3D音乐会的评价如潮涌来……

音乐会的组织者——中国上海国际艺术节总监刘文国说:“本来在室外就很难举办音乐会,比如天气因素影响。但是这次调音好,音响的声音质量也好,所以,听的感觉非常不错。后面的音箱营造了混响的感觉,利用效果声给了观众很好的音乐厅的感觉。”

音乐会的主办者之一,上海交响乐团团长陈光宪说:“我觉得这是一个别开生面的音乐会。对于室外音乐会,最大的问题就是音响。今天的音乐会解决了音响问题,使得整场交响乐听起来非常清晰。别的室外音乐会往往还在某些方面存在问题,如一些扩声的调制等。所以我觉得这次是个很大的进步。”

八十高龄的著名指挥家曹鹏说:“我一直很担心广场音乐会,因为我认为它的音响几乎不可能搞好,但是今天3D全息音响在我们国家首次应用。我听了之后很满意。因为它能够把乐队的声部放射出来,使得整个交响乐的演奏生动,回归到自然。这项技术是行业的发展,这样不管在广场,还是室内都能听到更好的音乐。”

业内行家IMax中国副总裁周子衡说:“我听下来的感觉非常好。没想到这样一个露天的音乐会能够产生如此好的效果,所以,我觉得这是一件了不起的事。这可以说是在露天创造了一个没有墙的音乐厅。我觉得非常好,很有前景。因为这样就不用受到音乐厅的限制,在很多景点都可以举办这样的音乐会。”

7 几点思考

当然,也有一些质疑的声音,归结起来大概有以下几个方面。

质疑一:经过3D扩声的室外音乐会现场的声音能与坐在音乐厅听到的声音相媲美吗?

笔者认为,以目前的技术水平,露天的3D交响音乐会与坐在音乐厅相比,从听觉上尚有相当差距。不言而喻,经过良好声学设计的音乐厅,不插电演出是欣赏古典音乐的最好环境,别的场地都无法比拟。

质疑二:既然六、七百平米不大的场地动用了133只扬声器,70多支传声器,2台昂贵的3D处理器;搭建了舞台灯光系统,工程浩大,花费不小,音响效果还赶不上音乐厅室内演出,这还有什么意义?

笔者认为,科学技术的进步是社会发展最重要的生产力。3D声音技术与其他艺术的结合已经产生了多种新的艺术形式,例如澳大利亚悉尼户外水上3D全息歌剧《卡门》、德国3D全息音响歌剧《Neither》、使用3D音频创意的德国奔驰汽车新车发布会、德国和英国的Kraftwerk巡回电子音乐会、德国PROXIMITY游戏音频等等。3D声音技术将成为一种新的景观艺术、声音艺术、时尚艺术……虽然这场演出花费不菲,但上海作为国际大都市应当有这种与国际接轨、一流的文化活动。当然,作为尝试,北外滩3D音乐会只演出了一场,费用确实很高,但如果今后把它做成一个固定的城市文化景观、一个文化旅游项目,通过长期有效的运作,应当能产生可观的经济效益。在“创意为王”的时代,一个好的创意将对所在城市、地区的发展产生长远的影响,云南丽江山水实景大型歌舞剧《印象丽江》的长盛不衰就是一个绝好的案例。

质疑三: 3D扩声技术效果比通常所用的两声道扩声或多声道扩声技术相比有很大的优势吗?

笔者认为,真的有天壤之别。以前所有的声音技术都是基于声道的矢量电平控制,波场合成技术是基于算法的技术,也就是说,随着人类在声音技术方面不断进步,不仅可以人工合成语音、人工合成音色,也可以合成任意声场。作为音频工作者,笔者最恐惧的扩声现场是:想靠近舞台看清楚可耳朵受不了,耳朵舒服些却离舞台远看不清了;而经过扩声的露天交响乐队演出,声音简直惨不忍睹、毫无美感。这场北外滩3D音乐会,声压级合适、声场均匀,方位清晰、空间感舒适,加上黄浦江夜晚的景观,真给人一种美的享受。

质疑四:波场合成技术的发展前景如何?

声音技术 篇7

关键词:电影声音技术,3D环绕声,杜比全景声

人类对于“环绕声”这个概念的探索要追溯到1550年, 那时的欧洲赞美诗盛行, 作曲家将合唱队按声部进行分组, 根据教堂的形状在空间上错开站位, 以便让听众更清晰地听到旋律走向和声部层次。到了18世纪90年代末, 电影诞生了, 却在很长的一段时间内都是以无声的形式呈现, 人们甚至尝试让配音员站在银幕后说话来鲜活画面内容。1910年爱迪生发明了有声电影机, 声音和画面终于可以被同时记录下来并回放, 1927年上映的电影《爵士歌王》, 观众突然听到主角开口说道:“等一下, 等一下, 你们还什么也没听到呢!”一个新的电影时代来临了。

自1940年世界首部立体声电影《幻想曲》, 到1992年世界首部5.1环绕立体声电影《蝙蝠侠归来》, 再到2010年世界首部7.1环绕立体声电影《玩具总动员3》, 短短几十年的时间里, 从仅能听到声音的单声道, 到可以体验出声音运动变化的立体声, 再过渡至被声音包围的环绕声, 飞速发展的电影声音技术在朝着“将声音最接近现实的还原”这一终极目标不断冲刺着。

尽管如此, 现行的电影声音技术还远远谈不上尽善尽美。例如, 目前主流的多声道系统里重塑声场环境的扬声器方向较少, 声音在声道间的过渡不自然, 环绕声分离度不够, 系统针对多个声道采取不同均衡的处理能力不强, 0.1声道的低频响应不够平滑, 最佳听音区范围狭小等等, 这些问题大大削减了声音再现的真实性。最为重要的是, 现有的多声道系统只能回放二维空间的声音, 缺乏如头顶上方等垂直方位的声音, 这导致听者不能身临其境地融入到电影的情境之中。

2012年4月24日, 杜比实验室发布了全新的影院音频平台“杜比全景声——Dolby Atmos” (见图1) , 同年6月, 华特á迪士尼影片公司和皮克斯动画工作室就联合出品了世界首部采用杜比全景声制作的电影《勇敢传说》, 电影声音技术终于踏进了3D的门槛。

Atmos源自英文单词“Atmosphere”, 意为大气、气氛。正如其名, 有了杜比全景声, 无论观众身处影院何处, 都能感受到声音环绕在四周或是从任意方位滑过 (见图2) 。它带来的听觉冲击就如同听惯了立体声的人突然听到了5.1声道环绕声般的感受, 而声音细节的改善又像是影片画质从标清到高清的巨大提升。这个平台提供的不仅仅是“基于声道”的传统工作流程, 它还提出了“基于对象”的创新理念, 无数的动态音频对象可被分离出并精确地传导至一个或一组扬声器。顶部扬声器的加入也让观众能更全方位地享受各种听觉盛宴, 人们将首次完整地听到整个画面和画面之外的声音内容。本文拟对杜比全景声的技术特点进行全面的解析, 以供广大电视音频工作者参考。

一来自头顶的声音

传统5.1、7.1环绕声系统中对于声道的设计均处在同一维度上, 而现实中, 声音来自于四面八方而非单一的平面。杜比全景声最为突破性的变革就是“顶部声音”的加入, 这使得声音首次能以真正立体的方式呈现, 恰如2D视频至3D视频的转换。

顶部扬声器结构设置以银幕的中心为轴, 两列扬声器对称排列安装在天花板上, 分别对应银幕左中扬声器 (Lc) 和右中扬声器 (Rc) , 最小间隔与左中、右中银幕扬声器之间的间隔相一致, 最大间隔符合以下标准, 即顶部扬声器的高角度应大于同侧环绕扬声器高角度的一半与45°的和。而在横向角度上调整到使其中轴指向该扬声器所在水平位置与影厅中轴线距离的1/2处。纵向角度符合以下几点基本要求:不超过45°、主听音区内角度保持0°不变、主听音区外不超过30°。为确保音色统一, 它们的设计特性与侧墙、后墙的环绕扬声器相一致 (见图3、图4) 。

由于杜比全景声中“顶部声音”的出现, 使听众首次获取来自头顶方位发出的直达声、反射声等, 从而能感受到制作者根据影片内容的需要而营造出的封闭声场空间, 尤其是有顶部结构的特殊的室内环境, 如浴室、教堂等。同样, 室外开放的声场空间环境也能很生动地被体现, 如下雨的场景, 我们可以真实地感受到雨水从天而降落到身边, 这在以前的系统中都是难以实现的。观众也首次能从顶部空间体验到物体的运动, 如直升机在头顶盘旋后滑过头顶的多普勒效应等。顶部方位精确的声音移动, 能显著提升视觉冲击力与现场感, 特别是在突出3D视频特效方面, 如爆炸后渣土扑面而来, 当画面与声音完美融合而极其接近现实情境时, 人们会情不自禁地向后躲避, 这都是因为顶部扬声器诞生而带来的。

根据心理声学的研究, 所有方向的声音都对包围感的形成有帮助。虽然人耳在头顶这个维度上辨别声音距离的感知是最不敏感的, 但两列顶部扬声器使得影厅在声压级和频率响应方面对观众席的覆盖更加均匀, 以此获得的关于听觉上纵深的信息带来了更真实的空间感, 这样的空间感让场景变得十分自然。声音所处的声场空间被最大化展现, 高度与深度均接近电影所要模拟的真实环境, 观众无需分散注意力在脑中构建虚拟声像, 就能体验到身临其境的沉浸感。

创新的顶部区域加上传统的银幕、侧、后区域环绕扬声器, 创造了水平、垂直、纵深三个方向的三维立体声音空间, 由此模拟出的声场环境极大地改善了影院声音的空间感和包围感, 使得听觉体验更加接近真实 (见图5) , 同时, 这样的顶部扬声器也带给了混音师和导演更多的创作空间。

二来自屏幕和侧墙的声音

为了精确定位从影院内任何位置发出的声音, 杜比全景声影厅的侧墙增加了一些环绕扬声器。侧墙上的环绕扬声器从影厅的1/3长度 (以银幕为起点) 的位置开始放置, 一直摆放至房间后墙。各个环绕声扬声器间距是根据听众所在位置到两个相邻扬声器的角度而定, 中央听音区域边缘 (位于距离最近的墙1/4影厅宽的位置中间的区域) 与影厅中线的焦点同两个相邻扬声器组成的夹角不大于30度, 距离一般在2~3米之间, 且左右环绕声扬声器对称摆放 (见图6) 。

影厅侧墙各环绕扬声器应适度调整高角度, 使其中轴指向位于影厅另一侧最远座位上观众就坐时耳朵所在的高度 (见图7) 。

影厅后墙环绕扬声器则使其中轴指向位于影厅第一排座位上观众就坐时耳朵所在的高度 (见图8) 。位于观众席靠前区域的侧墙环绕扬声器与后墙角落上的环绕扬声器的水平角度应调整至朝向观众席的中心, 并遵循以下条件:任何扬声器的水平角度不超过45度, 位于主听音区的侧墙和后墙环绕扬声器在水平角度上保持中轴与影厅横纵向中线平行。

杜比全景声支持多屏幕扬声器声道来增强声音的分离度, 并改善银幕声音和对白的视听一致性, 使得银幕到整个影厅之间的视听传输非常自然。如果银幕中的人物指向某个声源, 混音师就能准确地定位声音, 从而使声音与人物的视线相匹配。对于银幕宽度超过12米的影厅, 增加两只银幕扬声器将帮助整个银幕获得更流畅的移动效果, 且需与另外三只银幕扬声器采用同样的配置。距离银幕最近的侧墙环绕扬声器的高度应与银幕扬声器声学中心的高度齐平, 而后的环绕声扬声器则随着座位坡度的升高而一同升高。

环绕声分离度增加后, 我们就有更多机会以整个影厅为中心来传播声音, 这与传统的方式有很大不同, 过去在内容制作时, 都是假设一个听众位于最佳收听点。而以影厅为中心的方法能更好地与荧幕内容相匹配。在5.1以及7.1系统中, 环绕声区域由扬声器阵列组成, 左环绕或右环绕阵列中的每只扬声器都携载相同的音频信息, 这样的布局对环绕背景或是分散式的环绕声效果尤为有效, 但在现实中, 声音有可能会从任意的点方位传过来, 例如从背后传来开向自己的枪声, 当脱离带有声音的画面时, 你会感到环绕声的声音位置并不精确。而对于移动的声音元素, 以往基于声道的解决方案只能做到从一侧直接跳跃到另一侧。例如在5.1系统中, 只有左、右两个环绕区域, 由几个音箱共同营造的一个声像从放映厅的一边直接切换到另一边, 创造不出移动的感觉;在7.1系统中, 我们可以将声音从左侧移动至左后方, 再从右后再到右侧方, 这样虽有移动感, 但过渡还是粗糙而不自然, 观众很难捕捉到声音运动变化的细节。此次, 杜比全景声带来的关于“独立声源”的创新技术, 针对上述问题进行了颠覆性的改革, 更多的环绕扬声器, 让我们可以听到声音逐一经过每一个音箱的效果, 并能被更精确地定位或移动, 这让还原的真实性最大化地接近现实。

三基于声道和基于对象的制作渲染

在现实中, 我们听到的实际声音效果是由直达声、离散反射声和混响声综合组成的, 直达声让人耳更准确地定位物体, 而离散反射声则可以增加环境的“空间感”。在当代的放映厅内几乎不存在混响声, 通过后期人工加入高质量、可调的早期反射声及室内混响时间的长短来告诉观众空间大小的信息, 以重现空间环境与氛围, 使之与画面内容相对应。

杜比全景声采用了基于声道 (beds) 和基于对象 (object) 两者结合的方式来进行制作和渲染输出。传统的以声道为基础 (beds) 的电影声轨用于表现基础的环境声音, 这些环境效果或混响通过扬声器阵列传播的效果更好。而另一部分则是基于对象 (音频对象+位置数据) 的独立效果处理方式, 例如, 在杜比全景声影厅中, 当出现直升机围绕着主人公转动的画面时, 飞机产生的声音将会按照顺序逐一经过每一只侧墙扬声器, 而非传统环绕声影院中声音跳跃性地移动。

让直达声只来自一只扬声器比同时来自两只扬声器要好, 因为两只扬声器产生的幻象声像必然带来领先效应和频响上的异常。这种情况在边侧定位上比在前、后方定位上更严重, 因而独立处理每支环绕声扬声器的能力就显得尤为重要。在杜比全景声制作中, 为了准确放置声音, 元数据整合入混录棚的控制台界面, 推子、相位、音频处理既可作用于音床或分组混音, 也可作用于音频对象。在控制台界面中可以看到影院的三维立体图, 元数据被放置在不同的点上, 实时移动。在完成对白、效果声前期的基本准备之后, 适合在影院内精确放置或者移动的声音将被标记为一个对象并根据需要进行相位操作。一些特殊的背景声如人群躁动的声音和音乐将被作为音床来操作。在混录棚的最终混音阶段, 混音师将音乐、对白和效果声编组, 每个编组包含一个以声道为基础的音床和一些带元数据的音频对象, 在最终混音时通过音频工作站和调音台的对象相位信息, 将音频渲染至混录棚扬声器相应位置 (见图9) 。

现在的电影混音是将很多声音元素混合在一起, 在混音完成之后这些元素就无法分开了, 更不能再对某一元素单独进行修改。利用音频对象, 就可以实现移动或替换对象, 比如对象是背景音乐声轨, 不需要了就可将其取出或替换成其他音乐, 这样极大地降低了工作时间成本。

声音设计师需要一段时间来研究这一新格式并设计这一格式下播放的内容, 特别是在创作方面。效果、环境、音乐都可以用杜比全景声技术来制作。从前期设计到实际操作需要花更多心思去探索, 但音效师们会逐渐意识到这是一种新的工具, 并将他们带到了一个全新的创作层面。

四全面兼容性与商业附加值

杜比自成立以来一直与一线的电影制作团队有紧密的联系, 因此杜比全景声在应用的最初就可以直接接入到Avid专业剪辑系统中, 而Avid专业剪辑工具在声音剪辑和混录方面正是电影行业的标准。

目前现有的基于声道的解决方案让我们始终面临的一个问题, 就是如何完成不同声音格式的发行工作。以7.1声道为例, 若整部电影是按7.1声道混音的, 在流程的最后, 混音师仍需要增加一个创作环节, 将声音向下缩混为5.1声道的, 因为世界各地在使用多种不同的播放系统。而杜比全景声的一个重要设计目标就是确保向下兼容, 让环绕声能自动适应已有播放系统, 对制作和发行的影响最小化。

每一个放映厅的大小、形状、观众席座位设置也各有不同, 若要让整个观众席都获得统一的声音品质是相当困难的。杜比全景声可针对影厅扬声器布局和特点来优化, 扬声器布局可与现有影院系统保持兼容, 制作者的创作意图能在各类放映厅中被准确再现, 让声音真正能为影厅量身定制, 这与之前的技术相比是本质上的巨大变革。

当一项新的音频技术或音频格式发布时, 设计者更需全面考虑行业的整体需求及未来的发展空间, 而杜比全景声的系统设计正是如此。不仅能允许内容创造者充分发挥想象能力, 也可让混音师根据所听的实际效果来决定在不同的扬声器配置下如何渲染内容, 而放映商则能更为自由地决定针对优化观影体验投入的资金。第一代杜比全景声影院处理器最多能支持64个输出, 并可以准确地根据影院实际的扬声器配置进行渲染, 最佳的扬声器输出声道数量取决于影厅的大小, 这样就能在不改变现有影院扬声器和功放配置的情况下使用。杜比公司也会在整个制作及发行周期中提供全面的技术支持, 无论是在混音阶段、试映时还是播放现场。

五结语

全球现已有接近40部电影已经或即将采用杜比全景声发行。这一彻底改变娱乐音频体验的全新平台得到了电影业的大力支持。在影片制作过程中采用杜比全景声的好莱坞电影公司包括迪士尼、皮克斯、二十世纪福克斯、派拉蒙影业公司以及华纳兄弟。北美主要电影放映商均已在各自影院中安装了杜比全景声音频系统。2013年, 美国电影音响协会授予杜比全景声业界瞩目的后期制作技术成就奖。仅用了半年多的时间, 杜比全景声技术就已基本成为新一代电影音频行业标准。杜比音响系统现有的市场占有率已高达80%, 3D占有率为20%, 可以预计的是, 未来将会有更多的电影公司、导演、音频团队和放映商选择杜比全景声。

作为中国电影后期制作的龙头企业, 中国电影集团中影数字制作基地也成为了全球首批具备杜比全景声混音能力的制作机构之一。在中国经济和电影快速发展的今天, 中影与全球同步, 引领了时代潮流, 这在整个亚洲都是领先的, 采用杜比全景声制作的华语电影见图10。

中国最大的电影院线——万达院线旗下的概念影厅巨幕品牌X-Land也于2013年4月16日签约杜比全景声, 并选择将其作为X-land巨幕影厅的标准音频系统, 计划将目前已建成的以及未来新建的X-Land影厅全部配备杜比全景声。

也许在不久的将来, 当杜比全景声的影院及影片广泛普及时, 人们对于它的理解就会不仅仅局限在过瘾的音效之上, 观众会越来越对这样的沉浸感习以为常, 因此, 如何利用这样一个新鲜的工具真的去说故事, 而不是期待有了刺激震撼的音效而让无聊的影片变得意外惊喜, 这将成为艺术家和制作者需要更多思考的问题。

笔者认为, 无论是3D影像还是3D环绕声音频, 电影制作技术的推陈出新, 都会加速推动广播电视行业的变革, 谁能率先准确意识到当代观众的精神文化需求并及时把握广播电视技术未来发展的航向, 将在市场份额占有的激烈竞争中拔得头筹。

参考文献

[1]杜比白皮书:杜比全景声á下一代影院声音技术

声音技术 篇8

中国电影电视技术学会与浙江广播电视集团于2012年11月30日至12月1日期间, 在浙江广播电视台举办了“2012《中国好声音》节目制作高端技术研讨会”。来自全国20多个省 (市) 、自治区、直辖市和新疆生产建设兵团的84位代表参加了会议。出席研讨会的领导有中央电视台技术管理中心主任兼技术制作中心负责人徐进, 浙江广播电视集团党委委员、副总编辑董传亮, 浙江广播电视集团科技管理部主任周智敏等。

为了分享好声音的音频制作经验, 会议主办方请来了好声音环绕声制作的主要成员, 他们是:浙江广电集团音频部主任赖黎、杜比实验室系统架构师张岩、著名录音师娄炜、上海文广科技总经理陈锡云和中国传媒大学硕士生导师、录音系教授李大康。各位嘉宾分别就好声音的环绕声制作理念、制作流程和制作播出技术进行了全面而深入的探讨, 同时对环绕声的不同制作方式进行了现场试听和比较。会议内容充实、范围全面、极富理论和实践指导意义, 得到了与会代表的高度赞扬和热情参与。

《中国好声音》, 顾名思义, 声音是这个节目的第一要素。如何能够让声音成为惟一的主角?环绕声已逐渐成为全球高清电视服务的音频标准, 把引人入胜的环绕声与高清视频完美匹配, 《中国好声音》为电视观众带来了完整的高清体验。研讨会期间, 好声音制作团队浙江广电集团音频部主任赖黎表示, 我国的电视声音制作长时期一直处于单声道时代, 现在一步跨度到5.1环绕声, 似乎步子迈得有些大。事实上, 大型文艺节目、综艺晚会的音频制作, 不论是进行单声道制作还是立体声制作同样都存在着难度, 5.1环绕声制作的难度并没有比单声道、立体声制作成倍数地增长。《中国好声音》是从第十一期才开始采用5.1环绕声制作和播出的, 前十期都为单声道播出方式。本次5.1环绕声的制作有一些试验性的因素在其中, 所有制作的条件都是以不影响正常单声道播出为前提, 因此, 5.1环绕声的制作系统是一个附加的系统, 完全不会给扩声系统、单声道电视播出系统带来任何影响, 仅仅只是共享了前级的话筒等信号源。在四期的制作过程中, 5.1环绕声声音制作团队试验性地采用了两套音频系统方案, 一套用在第十一至十三期的半决赛, 另一套用在最后的总决赛。如果仅从技术的角度上去考虑, 只用5.1环绕声制作系统制作一套环绕声格式的节目, 向下兼容downmix而有立体声节目、单声道节目是完全可以实现的。

其实不管做什么格式的声音, 现在制作节目的立足点是要服务于最广大的电视观众, 而目前最广大的观众就是单声道的观众, 这也是在设计环绕声节目时候的一个基础。在所有技术成熟的情况下, 最重要的还是制作人员对技术的掌握和运用, 更高层次的就是对艺术的理解, 以及如何利用技术去更好地服务于艺术。

娄炜先生是中国电视剧制作中心的一级录音师, 为国内诸多知名歌手和乐队录制过许多高品质的作品, 在环绕声制作方面有着丰富的制作经验和体会。这次加盟“好声音”也是他首次参与制作综艺类环绕声节目。研讨会上, 娄炜先生与大家分享了好声音环绕声版本在制作和播出过程中的点滴和心得。他说“人类生活在一个环绕着声音的世界, 因此不会满足从一个点发出来的单声道声音”, “只要做好案头工作, 进行充分准备, 5.1一定是可以实现的”。娄炜先生还谈到, “仅从收视环境中听的这一部分去看, 其实都是一样的, 只是在收看不同节目”, 与以前较多从事的影视剧类环绕声节目相比, “现场综艺类节目是要把现场观众所能感受到的感觉、空间和气氛再现给家庭的听众, 而影视作品主要是根据剧情来创作一个声音的环境让观众去接受和体验, 是用两种不同的理念去制作, 就像做音乐厅的节目也是如此, 要尽可能地把音乐厅现场的感觉再现给电视机前的观众。”

娄炜先生说, 为了能让电视观众欣赏到真正的中国好声音, 5.1环绕声声音制作团队前期做了很多准备工作, 毕竟是首次制作综艺类的5.1环绕声节目, 因此在话筒的布置上花费了一番心思。“作为5.1环绕声来说, 最重要的就是‘场’, 要把空间再现出来。基本上5.1环绕声话筒都是布置在观众区, 在不同的区域设置了不同制式的话筒, 这些话筒混合起来使用, 营造现场的气氛。话筒布置的理念还是按照业界公认的环绕声制式为主, 然后结合一些补充的话筒, 比如对某一个侧面的面的效果声拾取、某一个区域的观众声音的拾取等方面去考虑。”

浙江卫视调用了全台最好的设备, 在观众席上架设了24路不同制式的环绕声/立体声话筒, 用于拾取整个演出现场的声场环境和观众气氛, 此外, 环绕声收录系统, 收录了将近100轨的声音素材, 其中包括现场节目声源64轨、空间环境声源29轨、以及现场实时混音的环绕声6轨。“实况版的环绕声制作, 不仅仅为后期缩混提供了宝贵的依据, 同时也是大家学习和提高的过程, 可以通过对比实况版和后期缩混版来查找现场混录的不足和问题。”

同时, 娄炜先生还精心挑选了各类优秀的5.1环绕声作品与大家一同赏析, 从实践中来获取制作5.1环绕声的真谛。

研讨会上, 除了讨论制作经验外, 杜比实验室系统架构师张岩还就整个好声音的环绕声的制作系统进行了介绍。赖黎主任在研讨会第一天的演讲里提到, 现在节目制作的立足点还是要服务于广大单声道电视观众, 如果是由一套系统来进行制作, 应当极力确保5.1环绕声播出和立体声、单声道播出的一致性。张岩在他的演讲里就“确保5.1环绕声播出和立体声、单声道播出的一致性”做了深刻的阐述。杜比多年来一直致力于环绕声的推广, 并且, 杜比凭借其在高品质音频和环绕声方面的丰富经验和雄厚技术实力, 获得了国内各地大多数有线电视运营商的青睐和支持, 现在全国大部分有线电视都在采用杜比AC-3的编、解码技术, 有音频技术背景的同行一定都知道metadata (元数据) 这么一个参数, 首先在搭建环绕声制作系统时, 监听这部分都会使用杜比的DP570仿真监听工具, 目的就是为了在制作5.1环绕声时, 利用它来模拟5.1下变换成立体声、单声道后终端用户的真实收听效果, 同时利用修改元数据的方式来确保5.1环绕声节目和立体声、单声道之间的相关性。因此, 为了让没有环绕声监听环境的终端用户听到更好的声音, AC-3的编、解码技术中, 就是利用metadata (元数据) 这个参数, 在机顶盒解码时来控制环绕声的这几个声道, 是以什么样的比例混合到立体声或单声道中, 其实这些都是在制作的同时, 调整metadata (元数据) 参数, 通过杜比DP570仿真监听来完成的。张岩说, 在“好声音”制作的时候, 由于各方面的原因, 可能来不及去做这样的工作, 但是目前浙江卫视在《我爱记歌词》的制作中, 已经完全采用这个方式去进行了。

本次研讨会还特别邀请了中国传媒大学教授, 一级录音师李大康先生就音乐会环绕声的实况录音进行了讲解。李大康先生几十年来一直从事音乐录音工作, 他认真负责、严谨细致的工作作风和全面扎实的录音技术以及丰富的录音实践经验赢得了与国内外众多优秀艺术团体及艺术名家们的合作机会, 录制了大量有价值的作品。研讨会中, 李大康先生以后来从事录音教学工作后的教学实践案例为纲, 通过一篇篇讲义、一幅幅照片, 生动地讲解了音乐会环绕声实况录音技术、技巧。更可贵的是, 李先生还通过对不同5.1环绕声录音作品的对比分析, 进一步阐述了“如何成就好声音”以及“怎样制作环绕声”, 完全切合了本次研讨会的主题, 获得了与会所有同仁的一致好评。

在研讨会的最后一天, 来自湖南卫视的肖卫华主任和山东卫视的一级录音师于少远先生, 也带来了他们各自台制作的5.1环绕声作品, 与参与研讨会的专家、同行一起就演示的作品, 探讨了5.1环绕声制作中的得与失, 也表示未来会在更多的节目中进行环绕声制作。

会议结束后, 与会专家代表表示, 《中国好声音》音频制作模式和环绕声制作播出实验, 为我国的音频制作提供很好的发展思路, 也做了许多富有前瞻性、具有开创性的尝试, 这样的研讨会不仅及时而且必要, 因为它从电视的本质上推动了中国电视综艺节目的音频制作发展, 业界盛赞、意义深远。

声音技术 篇9

关键词:虚拟仪器,声音测试,振动测试

1 引言

随着科学技术的发展, 机器工作的精度和稳定性的要求很高, 对声音与振动分析也提出了很高的要求。声音与振动分析应用领域很广, 如声音、噪声、振动和舒适度、机器检测、结构动力学和声音质量方面都有着重要的作用, 涉及产品设计、生产测试、机器的性能以及过程控制等, 且具有一组不同的关注点( 传感器、频率范围、采用率、成本等)。传统的测试设备昂贵、功能单一、可配置性弱[1]、测试精度有限、数据处理和后续存储等方面已经不能满足科技的发展,Lab VIEW虚拟仪器技术以全新的语言方式以数据流方式的驱动, 在测控、测试等方面具有强大的功能与优势, 在机械故障诊断方面振动分析以及测量具有重要地位[2]。

Lab VIEW虚拟仪器声音和振动测试测量工具包, 在声音和振动信号采集和处理方面是一个重要的应用领域,是Lab VIEW虚拟技术的一个重要部分。然后结合NI公司提供了大量的软件工具来分析采集到的信号, 虚拟仪器具有人机交互、扩展性强并能实现无缝集成等优势[3,4]。本研究是基于Lab VIEW的声音和振动测试测量工具包的检测分析系统, 利用NI交互式软件声音与振动检测,实现快速采集、分析与记录声学、噪音和振动数据[5,6]。

2 测试系统总体设计

系统分为主控部分和数据采集部分。在声音和信号的获取部分通过放置的传感器采集现场的综合声音和振动, 经过信号调理模块传送至主控中心计算机的Windows系统, 利用Lab VIEW虚拟仪器技术进行判断处理, 实时动态显示数据以及监测结果, 进行综合分析。测试系统整体设计如图1 所示。

测试系统包括: 软件和硬件2 个部分。硬件主要包括计算机、振动和声音传感器、信号调理电路、数据采集卡等; 软件主要包括采集卡驱动程序、控制数据采集VI、创建数据库程序、数据存储VI、查询数据库VI、时域分析VI以及频域分析VI等。主控系统选用通用型测试方案, 基于模块化扩展的PXI Express平台进行开发, 通过PXI控制器机箱集成有动态信号采集模块、时钟模块和数据流盘。传感器采集到的声音或振动信号通过信号调理模块去除夹杂在有用信号中的噪声及干扰,动态信号采集模块将信号转化为数字信号进入PC, 通过声音和振动工具包进行信号的分析与处理, 最后将处理后的信号进行结果显示、存储、输出等。

另外,NI还提供了大量的平台选择, 从单口的USB接头( 最大4 通道) 到多插槽的PXI组件( 最大13000通道)。针对声音和振动信号测试, 系统提供了两种专用的数据测量分析模块, 分别是声音和振动测量模块、频谱分析模块, 这些模块的设计是基于NI公司成熟的测量工具包进行二次开发, 使之更贴近用户的实际需要。

3 测试系统模块化设计

一个典型的测控系统, 是通过传感器、信号处理、信息传输、执行器等环节的有机组合实现的。模块化的理论基础是系统工程的原理和方法, 其基本思想在于:任何系统都是由若干个功能模块通过彼此间的共享的界面连接而成。

基于Lab VIEW的综合声音和振动测试系统的模块由: 声音和振动测量模块( 动态信号采集模块、高速模拟输出模块)、频谱分析等模块组成。数据采集系统采用美国国家仪器公司的专用采集卡PCI-6251 型数据采集卡, 主要作用是: 将传感器的声音和信号综合信号经过A/D转换后利用Lab VIEW软件控制与分析。整个测试系统的模块化设计如图2 所示。

3.1 声音和振动测量模块

声音和振动测量模块, 主要是基于NI公司的测试测量系统软件开发平台Lab VIEW和声音以及振动分析工具包来进行信号的分析与处理。NI公司的声音和振动工具包将NI Lab VIEW图形化开发作出进一步拓展, 其函数和指示器包括: 音频测试、分数倍频程分析、正弦扫描分析、声级测量、频率分析、频率响应测量、瞬态分析、以及若干声音和振动显示。它还包括新型NI声音和振动助手独立交互式软件, 能够快速采集、分析并记录声学、噪声和振动数据。借助灵活且基于配置的测量库和开放式分析功能, 声音和振动助手能够基于软件进行独特的测量, 从而快速采集数据, 并创建自定义的应用程序。其主要特点有: 独立且基于配置的分析和数据记录配备NI声音和振动助手; 易于使用的功率谱、正弦扫描、倍频程分析步骤; 具有A-,B- 或C- 加权的声极以及可集成的振级; 通用文件格式(UFF58) 文件I/O支持。

3.2 频谱分析模块

频谱分析模块提供了一套用途灵活的频谱测量工具, 包括能谱、峰值功率和频率、带内功率、邻频功率、所占带宽、三维频谱图等。此外, 频谱分析模块包含有用于执行调试操作的VI和函数, 如通带IF与基带I-Q的互相转换、模拟调制信号的生成/ 分析等。上述优化的算法与高达GHz的计算机处理速度结合, 将达到前所未有的测量吞吐量。具体包括:I-Q数据用于数字解调; 高度优化的FFT处理; 常用的频谱测量功能; 模拟调试和解调等。数据处理模块程序的设计是基于数学分析, 它需要完成数字滤波、加窗处理、频谱分析、功率谱分析、相关分析等诸多功能。时域分析和频域分析有着各自的算法和分析信号数据的功能。

3.3 动态信号采集模块

NI数据采集卡是实现动态信号采集的重要模块,可以将外部的模拟信号转化为计算机能够处理的数字信号。本文采用PCI-6251 的高速多功能的DAQ板卡,此板卡具有16 位模拟输入通道, 用于设置采集模拟量时的采集路数,2 路模拟输出通道,24 路数字I/O, 分辨率16 位, 单通道采样率可以达到1.25MS/s, 多通道采样速率1.0MS/s。同时板卡内部包括:PCI总线及通信控制总线、内部数据总线、IRQ控制器、板载FIFO、32 位80Mhz计数器/ 定时器、多路转换器等重要部分。可以与Lab VIEW控制系统进行良好的数据衔接。

4 软件系统设计

系统软件框图如图3 所示, 本系统建立在Lab VI EW虚拟仪器开发平台上, 采用与之相匹配的数据采集系统, 结合传感器, 由多路开关、放大器、采样/ 保持和A/D转换组成, 处在PC机前向通道。

4.1 在线检测系统设计

整个设计是基于虚拟仪器和网络传输的工业中声音和振动的测试系统, 软件主要是基于Lab VIEW虚拟仪器技术而设计。声音和振动测量套件作为Lab VIEW的附件软件包, 该软件包提供了信号处理功能, 用于声音测量、分数倍频程分析、频率分析、瞬态分析和阶次跟踪。利用Lab VIEW提供的选项卡、波形图、按钮等控件搭建系统, 同时结合Lab VIEW中提供的Edit Menu菜单以及声音和振动测试工具包模块设计实现其检测功能, 搭建良好的交互式人机界面, 声音和振动测试系统前面板设计如图4 所示。

4.2 数据调用程序设计

Lab VIEW虽然功能很强大, 但是不同的编程语言在不同的领域都有着自己的优势, 综合运用这些语言,可以使Lab VIEW得编程更加完美。基于虚拟仪器的声音和振动测试系统主要外部程序接口设计采用三种方法实现: 一是直接调用Lab VIEW的端口操作图标In Port.vi,Out Port.vi进行编程。Lab VIEW中有两个直接访问底层设备节点的, 即:In Port.vi,Out Port.vi, 分别完成从设备的物理地址直接读取和输出数据。二是调用CIN图标进行编程代码的接口与C语言的直接调用,CIN通过输入、输出端口实现语言的远程调用数据传递, 当Lab VIEW的程序运行到CIN节点时, 数据由CIN的输入端口传输到C源代码图标, 执行完成后返回到Lab VIEW。三是利用Lab VIEW的CLF图标进行动态链接数据库.dll库函数, 用户可以使用某种DLL链接库的函数编程工具, 如VC,VB编写调用它。Lab VIEW也提供了一个动态链接库函数的图标Call Library Function, 放在Functions模板内的Advanced子模板中。在example/dll目录中有使用该图标的例子,可以参照它们完成库函数的调用。

4.3 模态分析系统设计

整套测试系统重在信号的分析与记录, 采用该声音和振动测量套件的好处在于可以很方便的测量进行各类非电量测试相关参数的设置, 如灵敏度、采样率等[7], 支持的测量信号类型包括: 电压、温度、应力、声压等常见信号类型, 无需自己编程, 可以很方便的调用Lab VIEW的测量工具包。

进入在线监测系统后, 进行声音和振动模态分析,基本原理是: 利用多项式拟合频率响应函数的方法识别系统的模态参数。具体模态分析系统软件实现:(1) 实时采集, 结合传感器, 在接收到由串口连接的LCD面板发送的采集信号, 系统确认声音和振动控制器的上的闪存空间数量[7,8], 如果空间不足系统会发送指令到串口端, 以便在采集之前把闪存的数据拷贝到PC机。如果空间足够, 采集即刻开始, 通过传感器信号以及嵌入式系统将测试信号传送到信号调理模块。(2) 声音和振动工具包对采集来的数据进行数学运算, 包括频率测试和响应动态分析。测试的时间间隔可以灵活的设置, 用户可根据需要决定在测试中间的某个时间段记录并进行信号分析。测试采集中实时传送到操作面板, 每隔一秒更新一次, 操作者借此可以监察部位受到的声音和振动的水平以确认是否在预期的范围内。(3) 软件可以实现离线分析, 允许用户在PC机操作界面对已经完成的测试进行离线分析, 基本步骤是: 选择需要的测试数据、查看离线数据, 最后生成报告。

5 测试系统试验验证

本文介绍的Lab VIEW声音与振动测试工具包, 具有强大的信号采集与信号分析等功能[9]。在这里对这套基于虚拟仪器的声音和振动测试系统做了一个整体的介绍, 为了验证整个测试系统程序运行的良好与否, 采用现场人工敲击对试件捶打产生振动和声音进行实时测试, 用装有力传感器的力锤对试验器件进行敲击, 用加速度传感器等进行采集信号, 同时与上位机控制软件同步通信, 软件实时采集、记录与分析。

采集时设置采样通道为2 个, 采样频率为1000Hz,平均次数为10 次, 每次采集点数设置为1024 点, 触发通道为0 通道, 触发电平为100mv, 触发沿为默认的上升沿, 预保留点为30 个。从测试结果上看, 激励信号的响应和响应信号反映的正是敲击测试时的激励以及响应信号应有的典型形状, 由此可见测试系统程序运行良好, 有一定的可靠性。

6 结束语

这套基于虚拟仪器的声音和振动测试系统方案与现有市场上的测试系统昂贵而庞大相比具有明显的优势,此测试系统集成多种软件, 测量、调制等, 功能全面,协议实用性强。底层代码开放, 可进行二次开发, 更方便升级, 增强测试能力, 是基于windows平台借助于Lab VIEW虚拟仪器的强大功能, 通用性好, 处理数据的能力大大加强,具有良好的实际应用价值以及市场需求。

参考文献

[1]李立铭.基于Lab VIEW的振动测试系统研究[J].仪表技术,2013,(2):5-8.

[2]于华彬.基于虚拟仪器技术的振动测试系统设计[D].北方工业大学,2009.

[3]侯志敏,夏薇,邓东花.基于Lab VIEW的设备振动测试系统[J].价值工程,2013,29(6):164-165.

[4]庞尔军,王晓龙,于虹.基于虚拟仪器技术的振动测试分析系统[J].机床与液压,2014,42(7):171-173,178.

[5]章佳荣,王璨,赵国宇等.精通虚拟仪器程序设计与案例实现[M].北京:人民邮电出版社,2014.

[6]梁少华,李智.基于Lab VIEW的现场动平衡测试系统的开发[J].现代电子技术,2014,37(6):110-113.

[7]谢志勇,周其斗,吕晓军.基于声音和振动工具包的振动测量分析[J].四川兵工学报,2013,33(5):75-77.

[8]沈智慧.基于Lab VIEW的电机振动监测系统设计[D].东北石油大学,2013.

声音技术 篇10

关键词:节目录音制作,拾音,录音技术,制作合成

1 节目录音制作之前期准备

节目录音制作的首要任务就是录音语言, 语言的录音是节目制作的基础与核心它是节目二次创作的基础与前提, 相较于其它类型的节目录制, 该方法即便是同一类型的节目, 也可能因为诉说者演绎方式的差异影响录制效果。因此, 对语言播音的第一要求就是发音、吐字准确清晰, 演绎满足内容需求, 语言表达符合故事安排或内容情景。

录音前的前期准备工作非常重要, 除了掌握录音的形式与内容, 男女声、混合声, 吐字速度, 应以何种状态播报, 选何种音乐作背景音乐, 都需要明确规划好。此外, 播音前也有可能对已有内容进行必要的改动, 因此负责人还需要做好播音员的情绪与心理工作, 确保他们能够以最佳状态发挥出应有水平。

2 节目录音制作之拾音处理

2.1 据场景合适选用话筒

拾音阶段, 要根据场景合理的选用话筒, 语言播音中, 通常选用的话筒有两种, 一种是电容传声器, 另一种是动圈传声器, 如美国EV、奥地利D3700、舒尔SM58以及德国森海塞尔等, 文艺录音选用的传声器为C-3000, 上述传声器的共性优点是较高的灵敏度、宽频度以及噪声低等, 录制出来的艺术感染力与真实性较强, 音质音量也相当高。

2.2 关于传声器与声源的位置处理

语音拾音过程中, 传声器与声源的位置关系, 如何发声等内容都要仔细考虑, 通常位置范围在三十厘米, 但也要“因地制宜”, 不同的场景、室内混响时间长短以及剧情要求做出相应调整, 混响时间长, 可贴近声源;时间段, 可远离些。传声器应尽量减小与声源的角度, 确保声源在传声器中心线范围内, 只有这样, 才能得到真实、生动的音质。

2.3“喷话筒问题”的解决

语音拾音时, 最容易出现的问题就是演绎者话语转换时的抽气声以及喷话筒, 后期制作过程中, 抽气声处理相当简单, 但喷话筒的处理则相当麻烦。所以, 拾音过程中, 必须对以下几点加以注意, 出现喷话筒问题的句子大多由[p]、[b]开头, 解决措施是:在声源发出声音时, 及时调整声源与话筒间的角度, 让话筒轴指向声源而非直接正对声源;或将话筒倾斜于声源上方, 这样就能够有效的避免因对嘴产生低音成分。亦或者将话筒摆置在演绎者下方;或在话筒上装置放风网。同时, 话筒的指向性也影响着拾音距离, 当话筒为无指向性时, 播音距离可以适当的贴近些, 当话筒为心形话筒时, 其放置距离为无指向性的1.5倍, 其差别的主要原因在于两者混响声的拾取存在较大的差异。

2.4 录音方法的选择

录音方法会根据节目要求的不同而选择。例如, 节目要录制的是文学节目, 朗读的是一首诗歌, 诗歌对意境要求非常高, 语言动态范围较小, 在拾音时, 会用一些轻音乐作为朗诵背景, 此时, 话筒的距离要尽量贴近播音员, 但要注意尽量不出现重低音低音的切削可用调音台来调节, 这样, 录出的声音才能够让听众身临其境, 给听众更加深刻的印象。如若录制的节目中安排了一个陈词慷慨激昂的环节, 声音变化幅度较大, 此时就需要适当的将话筒远离播音员, 并利用调音台对音质进行调整, 以免出现声音失真。广告录制内容非常繁杂, 除了考虑到场景与内容的不同, 同时还要考虑如何转换室内外的感觉变化。

综上所述, 播音的整体质量与上述内容都息息相关。大量实证研究表明, 要得到优质的播音质量, 除了充分掌握好节目内容与场景的布置, 同时还要“因地制宜”, 灵活的根据实际情况做出调整, 只有这样, 才能为后期制作打下坚实的基础。

3 节目录音制作之后期处理技术

3.1 节目录音制作之配乐

决定录音作品成败关键的主要因素是混录与配乐工作, 其也是节目制作过程中消耗精力与时间最多的工作。节目前期所录制的内同, 如广告、朗诵诗歌等, 为了能够增添节目的艺术感染力、活力以及真实性, 就需要在节目中添加背景音乐 (配乐) , 即将音乐与语言作品相结合。有了配乐的作品, 所呈现出的效果有了质的飞跃。

3.2 节目录音制作之降噪

噪声是影响音质的主要因素之一, 它能够掩蔽信号, 降低听觉灵敏度, 让听着产生厌烦心理。节目录制造成通常有三个来源, 一是相干噪声, 二是随机噪声, 三十环境噪声。随机噪声也可称作热噪声, 其主要出处为拍摄现场及其设备运行所产生的噪声, 该类噪声通常会淹没于信号中, 录制过程中不会被发现, 但在后期制作中, 将音量放大就会清晰的听到这些造成;热噪声属于高频段, 信号段一般在10~20k Hz之间。

环境噪声与相干噪声的主要来源是外界环境、电磁场等干扰。这类噪声的降低方法有很多, 如借助音频工作室的降噪软件, 通过调音台实现降噪, 紧闭环境噪声的空间等。

3.3 节目录音制作之频率补偿

频率补偿主要是指根据处理要求对声音频率进行处理, 或衰减, 或提升, 从根本上改善节目信号功率均值, 进而提升节目的清晰度与可懂度, 实现声音的美化与音质的提升。通常绝大多数语言信号在1k Hz以下的频谱多达80%, 然而可懂度与清晰度的提升明显使声频高于该频谱, 因此利用中高频来提升节目的可懂度与清晰度是最为有效的方法。

譬如说, 语言信号中有齿音, 致使声音不够洪亮, 显得苍白无力, 此时可以借助频率均衡器来实现高频 (10k Hz) 的衰减, 进而达到齿音消除的目的, 同时, 对低频 (100Hz) 与中频 (12k Hz) 分量进行适当提升, 以增强语言的厚实度。

3.4 节目录音制作之混响

录播室建筑材料的吸声系数是影响混响声强度的核心因素, 两者呈反比。建筑材料质地较硬, 其反射能力较强, 吸声量较小, 因此混响声强度很大, 反之, 系数较大的吸声材料, 其反射能力就越弱, 吸声量也越大, 混响声强度就越小。通常我们认为, 声音结构的尾部即是指混响, 其越强, 声音的银色就越具有雄厚力。在节目后期制作中, 混响通常是人为的利用调音台等设备达到节目制作的混响效果。

4 结语

综上所述, 广播节目的播音与录制是一个整体的过程, 它是在各种主观与客观的因素下形成, 除了要把握好录音与播音的技术, 同时还要深刻了解作品的理念与艺术思想, 录音工艺的制作一定要经过深思熟虑, 制定科学, 录音工具与方法的选用要灵活多变。新的工艺与技术为工作人员提供了更为广阔的创作思路。

参考文献

[1]纪惠敏.浅谈录音技术之拾音技巧[C].2007第二届全国广播电视技术论文集2 (上) .2007.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:声音检测 下一篇:幼儿园中班音乐教案《数蛤蟆》及教学反思