音频元数据

关键词: 观众

音频元数据(精选五篇)

音频元数据 篇1

高标清同播的播出方式, 再结合节目播出要兼容原来的标清节目, 这会给电视台播出传输系统带来相当的复杂性, 在制作播出领域既要考虑电视节目的画幅比变化, 还要考虑单声道、立体声和环绕声节目的混播。相比不同画幅的接收终端, 观众在家的收听环境更为多样, 必须通过在电视台压缩编码输送域绑定相应元数据, 才能给不同的视听环境下的最终用户均带来最佳效果。

而且观众在收看电视节目时, 还会遇到节目之间和频道之间的响度差异问题, 观众需要靠遥控器的音量调整来控制响度。虽然节目响度一致性会涉及到广播电视音频链路的各个环节, 包括音频的制作, 节目的播出、传送、卫星上行或有线前端等。但纵观全局, 先要解决好电视台制播域节目响度一致性问题, 达到尽量减小节目间的音频响度差异, 以提高观众满意度的目的。

怎样正确有效地利用大量单声道、立体声的历史节目, 怎样进行高标清同播, 怎样适应不同需求终端用户的视听环境, 怎样减少节目间的响度差异, 成为当前电视台亟待解决的问题。本文将着重探讨如何应对不同音频来源及类型场景, 尽量保证接收终端的艺术效果, 同时解决声音的响度控制问题, 以提供更好的节目声音质量。

一建立全链路音频元数据处理的重要性

电视台首先要了解电视用户的听音需求, 再通过制定声道分配、元数据嵌入方式, 规范立体声和环绕声制作, 梳理全台全链路元数据处理方式, 统筹总控、演播室、后期到播出传输各环节, 提高音频制播的全面性和专业化水平, 才能够为观众带来更加真实、震撼的声音效果, 提升节目的整体视听体验水平。

1. 电视用户听音需求

根据不同人群的实际接收情况, 考虑有以下三类用户使用场景:

•收看高清频道, 且具备环绕声收听条件;

•收看高清频道, 不具备环绕声收听条件, 只能收听立体声;

•只能收看标清频道, 且收听立体声。

2. 音频元数据的关键参数

音频元数据是节目制作者为向用户提供高质量音频信号所使用的处理手段, 能够指导AC-3编码器进行控制编码, 用户端解码器可以根据下混参数、动态范围控制等元数据信息及实际听音环境进行效果控制。因此音频元数据不仅携带诸如音频制作信息、混音电平等描述的信息参数, 最重要的是提供包括对声道模式、下混控制以及对白电平、动态范围控制等参数。

(1) 声道模式 (Channel Mode)

Channel Mode声道模式描述除低频声道以外, 5个声道的输入情况, 例如3/2代表左中右及左环绕、右环绕。LFE Channel低频声道参数描述码流中是否包含低频声道。

(2) 下混参数 (Downmixing)

Downmixing下混使用户在不同听音环境下, 都能对5.1声道节目进行还音, 用户机顶盒 (解码器) 提供数字输出给5.1环绕声音响系统使用, 以及经过下混的模拟立体声输出给电视机或2.0音响系统使用。下混控制参数支持以下两种方式, 一是将环绕声道信号相加, 同相信号入左声道, 反相信号入右声道;二是将左环绕声道入左声道, 右环绕声道入右声道, 同时通过Center Downmix Level、Surround Downmix Level参数控制中央声道和环绕声道写入左、右声道时的电平大小。因此节目制作者就需要在制作过程中, 根据音频效果将参数确定, 保证用户能够以正确的方式下混还音。

(3) 对白电平 (Dialogue level)

对白电平又称为对白归一 (dialogue normalization或者dialnorm) , 代表了节目的平均对白响度, 对白电平的参数设置是为了保证用户在接收到节目信号以后, 音频输出将“归一化”为标准音量, 即使在节目切换、广告插播甚至频道切换时, 电视节目的听音效果能够一直保持在一个舒适的状态, 不会因为节目变化而引起大的音量起伏, 避免用户不停地调整音量。

(4) 动态范围控制 (Dynamic Range Control)

动态范围控制的作用是, 节目制作者根据不同使用场景选择不同的动态范围控制类型, 包括电影轻度型 (Film Light) 、电影标准型 (Film Standard) , 音乐轻度型 (Music Light) 、音乐标准型 (Music Standard) 、语言型 (Speech) 以及不作处理 (None) 六种预置模式, 每种模式的中心区域则是由对白电平决定, 当用户选择动态范围模式时, 解码器将根据其数据描述类型进行动态范围的压缩, 节目制作者的控制类型就能发挥作用。这种方式避免了将音频信号简单做压缩处理, 使不同类型节目能够将听音效果发挥到最好。

3. 电视台全链路音频元数据处理的关键点

应对上述用户听音需求, 就需要在电视台建立节目全流程音频制作播出流程, 制定严格的音频制播规范, 其关键要素是高标清同播系统的声道分布及元数据使用。在传输系统AC-3编码时将元数据绑定在码流中, 以指导用户家中的解码器根据实际听音环境进行效果控制。

尤其是音频制播流程时, 应充分考虑到:

•根据制作、播出和传输需要, 在全链路内制定可行的声道分布, 并实施全线元数据解决方案;

•能明确标识、区分节目的声音类别, 单声道、立体声还是环绕声, 根据不同的类别, 进行不同的处理;

•能明确提供给最终视听终端进行下混和响度控制的元数据, 最大限度还原艺术效果;

•依据高标清同播系统的特点, 确保高清频道和标清频道音频播出的安全和质量。

二电视台全链路音频元数据处理的解决方案

根据音频信号在制播链路中的携载方式, 以及传输系统进行AC-3编码处理选择的不同, 分为以下三种解决方案。

1. 解决方案一:环绕声采用Dolby E编解码, 高清频道支持环绕声或立体声播出, 标清频道立体声播出

节目交换时采用Dolby E编码传输至总控, 总控信号调度至演播室系统或后期制作系统, 节目制作时使用Dolby E解码后的8轨PCM进行编辑, 根据实际情况选定适当的元数据参数, 经过Dolby E编码后传到播出系统, 播出系统遇到Dolby E的节目直通不处理, 在传输系统经AC-3编码器, 依据元数据的参数设定一起进行编码。如果信号不携带Dolby E则认为该节目为立体声节目, 编码器预置一个2.0立体声的静态元数据。

(1) 节目声道分布

节目声道分布如下:

•单声道节目:CH1单声道, CH2单声道国际声;

•立体声节目:CH1、CH2立体声, CH3、CH4立体声国际声;

•环绕声节目:CH1、CH2立体声, CH3、CH4 Dolby E环绕声。

(2) 演播室、后期岛针对环绕声节目的处理

在各个演播室、后期岛制作域均需部署Dolby E的编解码器, 制作域内进行PCM分声道编辑。这种方法会增加台内节目交换的成本, 还需关注每次Dolby E的编解码均会造成1帧延时, 考虑是否视频延时。

(3) 播出域对各类节目的音频处理方式

播出域首先根据单声道、立体声、环绕声等不同节目的声道类型, 在播出切换台上进行音频声道倒换处理, 具体处理方式如下:

•单声道节目:CH1送CH1、CH2;

•立体声节目:CH1、CH2送CH1、CH2;

•环绕声节目:CH1、CH2、CH3、CH4送CH1、CH2、CH3、CH4。

播出域需部署具备Dolby E解码能力的监听单元用来监听环绕声节目。

(4) 传输域的音频处理方式

对于高标清同播频道, 传输域有不同的处理方式。

高清频道:部署Dolby E解码器, 如遇到CH3、CH4声道是Dolby E信号时, 将Dolby E信号解码, 6个声道和元数据传输至Dolby D编码器AC-3 5.1编码;如果只有CH1、CH2有信号, 2个声道据传输至Dolby D编码器AC-3 2.0编码。

标清频道:将CH1、CH2声道进行MPEG layer2编码。

2. 解决方案二:环绕声采用PCM音频, 高清频道支持声音上混、全环绕声播出, 标清频道立体声播出

这种方案要求制作源向播出提供PCM音频, 并且符合特定声道分布规范要求, 才能完成声音的自动上混, 使高清频道实现全环绕声播出, 并在传输域Dolby D编码器预置AC-3 5.1环绕声静态元数据, 以解决该类上混的环绕声节目没有元数据的问题。

(1) 声道分布

•单声道节目:CH1单声道节目声, CH2单声道国际声;

•立体声节目:CH1、CH2立体声节目声, CH3、CH4立体声国际声;

•环绕声节目:CH1~CH6 PCM环绕声节目声, CH7、CH8立体声节目声。

(2) 总控系统对环绕声节目的处理

当外来信号为Dolby E时, 则由总控系统负责完成Dolby E解码, 将元数据写入SDI的VANC区, CH1~CH6为环绕声, CH7、CH 8为立体声;非Dolby E信号则不做处理;再将信号收录或直送演播室。

(3) 演播室、后期岛针对环绕声节目的处理

按照立体声和环绕声的声道分布, 在制作域制定严格的立体声和环绕声制作规范, 以适应环绕声和立体声的混播, 也就是要充分考虑环绕声节目使用立体声素材, 以及立体声节目使用环绕声素材。如果需要动态元数据, 则应在制作域将元数据写入SDI的VANC区, 并一直传输到Dolby D编码器端。

(4) 播出域对各类节目的音频处理方式

播出域首先根据单声道、立体声、环绕声等不同节目的声道类型, 在播出切换台上进行音频声道倒换处理, 具体处理方式如下:

•单声道节目:CH1送CH1、CH2, mute CH3~CH6;

•立体声节目:CH1、CH2送CH1、CH2, mute CH3~CH6;

•环绕声节目:CH1~CH8直通。

响度控制器根据信号中CH3~CH6是否为mute来决定是否上混, 如果mute则证明该信号为单声道或立体声, 先进行响度控制再进行声音上混为5.1环绕声, 如果不mute则证明该信号为环绕声, 不做任何处理。

这样保证送至传输域的CH1~CH6为环绕声, CH7、CH8为立体声。

(5) 传输域的音频处理方式

对于高标清同播频道, 传输域有不同的处理方式。

高清频道:Dolby D编码器使用CH1~CH6的音频信号进行AC-3编码, 通过元数据检测, 如果携带有动态元数据, 则将该元数据与音频信号一起进行编码, 如果不存在动态元数据, 则写入预置的5.1环绕声静态元数据。

标清频道:将CH7、CH8声道进行MPEG layer2编码。

3. 解决方案三, 环绕声采用PCM音频, 高清频道支持环绕声、立体声播出, 标清频道立体声播出

这种方案的声道分布、总控调度处理和节目演播室后期制作, 以及播出域声道处理与方案二基本一致, 区别在于取消了播出系统的声音上混, 并且要求所有环绕声节目必须携带正确的元数据信息, 高清频道节目不再是全部环绕声播出, 会存在环绕声和立体声两种播出形态。传输域的Dolby D编码器预置一个AC-32.0静态元数据。

对于高标清同播频道, 传输域有不同的处理方式。

高清频道:Dolby D编码器对音频信号进行AC-3编码, 通过元数据检测, 如果携带元数据, 则依据该元数据信息的参数对CH1~CH6的音频信号进行AC-35.1编码;如果没有元数据, 则在编码时对CH1、CH2的音频信号进行AC-3 2.0编码, 并写入预置的AC-3 2.0静态元数据。

标清频道:将CH7、CH8声道进行MPEG layer2编码。

4. 三个解决方案的对比

总的来说, 这三种解决方案从效果上, 都能满足观众在收看高清频道时的各种听音环境, 最大程度地还原艺术效果, 但他们在实施上各有利弊, 在音频编码上也各有特点。方案一优点是Dolby E到Dolby D解决方案成熟, 应用案例多, 缺点是全台均需部署Dolby E编解码器, 设备采购、维护成本大, 多次编解码会造成声画不同步。方案二避免在各制作岛或演播室部署Dolby E编解码器, 降低了成本, 立体声节目在播出域将实时自动上混, 这种全环绕声播出, 减少了用户在终端AC-3 5.1和AC-3 2.0转换可能出现的问题, 但也会让听众质疑“假环绕声”效果。方案三可以真实地还原环绕声和立体声节目, 但要求制作人员制作环绕声节目时, 必须正确嵌入元数据, 全线保证元数据的无误传输, 以避免在Dolby D编码时错误识别元数据, 造成无解说声的播出事故。

三电视台全链路响度管控手段

电视台需要解决的另外一个重要事情就是节目响度一致性问题。响度控制既要兼顾信号制作播出、文件制作播出的多种制播模式, 又要考虑单声道、立体声、环绕声的多形式节目兼容播出。电视台全制播链路要根据不同节目形式提供不同的响度监看、响度控制等一系列响度解决方案, 并自动测量及记录播出节目的各项响度指标, 以达到技术管控目标, 实现节目间的音频响度最小差异化。

1. 制定电视节目音频制作的响度规范

要想在中国的电视台做好响度一致性工作, 首先必须制定一个符合中国人的人耳特性、符合中国人主观听觉的舒适区间和视听习惯、符合中国国情的音频响度指标, 再在整个制播环节中采用音频响度的测量与控制的方法和手段。

(1) 国际通用规范

目前国际通用响度规范使用ATSC A/85、ITU-R BS.1770及EBU R.128, 其中ATSC A/85建议了建立和保持数字电视音频响度的技术手段, ITU-R BS.1770建议了测量音频节目响度和真正峰值音频电平的算法, EBU R.128建议了音频信号的响度标准化和允许的最大真实峰值电平, 将Program Loudness节目响度、Maximum True Peak Level最大真实峰值等用于描述区分音频信号。

(2) 制定台内规范

以前对于响度的研究以及实际应用均是参照国际标准等响曲线的数据进行的, 而国际标准数据则是来源于对外国人群的测试结果, 但是, 通过对中国人群的初步研究表明, 中国人群的双耳响度感知特性与西方人群有着明显的差异, 且中国人群具有更大的响度舒适区和容忍区, 因此需要针对中国人群制定新的响度规范。

中央电视台《电视节目音频制作的响度规范》及其附件的各项关键数值都是针对中国人的人耳特性、主观听觉的舒适区间和视听习惯, 结合当前电视节目的实际现状和制作特点制定的, 如表1所示。

适用最大真实规范人群峰值

2. 全台响度控制流程

建立适用于电视台制播全流程的响度管控方案, 要从全局的角度出发, 构建全流程的响度管控架构, 为台内的各个环节制定统一的节目响度标准, 全流程部署实施。依据制播流程中不同的特点, 对于各视频制作岛、音频制作岛、演播室音频系统、播出总控系统分别采用了不同的响度控制方法和应用策略, 如图4所示。多种手段紧密结合互相补充, 兼顾了专业音频领域的艺术创造性、视频领域的时效性和易用性、播出领域的安全性和通用性, 避免了单一控制手段带来的节目音质劣化、校正手段不足及管理统计缺失等问题。

(1) 手动调节响度

以往音频岛、演播室在制作音频过程中, 一般是通过“PPM”表以及“VU”表来估算节目素材响度, 只能保证声音电平符合相关规范。因此为真正解决节目响度问题, 需要引入实时监看响度表和真实峰值, 如图5所示, 通过手动来调整节目的响度。对于在岛内完成的音频文件在送往制作岛之前, 还需经过文件化的响度测量, 如果响度值未达到目标响度, 则需返回重做直至符合规范。这样音频文件在制作岛打包合成的时候, 如果制作岛没有自制音频, 而是完全采用音频岛改文件, 则只允许进行简单的剪辑处理, 不做音量调整, 也不再进行响度的测量或校正。

(2) 自动控制响度

对于视频岛制作音频, 以及台外制作节目, 如广告等在制作过程中不具备响度监看条件, 可以采取基于文件的自动校正的方法, 依据节目类型不同采用模板式软件程序控制, 进行多倍速响度测量与校正, 能够满足非专业音频制作人员对响度控制时效性和易用性的需求, 弥补了其响度控制手段的不足。

(3) 实时控制响度

尽管在制作岛与演播室均配备了响度雷达表与矫正工具, 保证从节目制作源头进行声音的响度规范, 然而考虑实践过程中, 既有老节目的重播, 新节目制作时不可避免会因为类型效果, 如音乐会、电影爆破等, 可能出现响度过大的现象。尤其对于同一频道不同节目切换时, 响度跳变现象更为明显。

因此在播出系统链路中加入响度控制设备, 能够对节目进行信号级的自动响度校正, 实现自动监测、自动记录响度指标, 还能通过SNMP协议监控网络服务器接收并统计, 统计信息包括节目条目的起始时间、结束时间、节目响度、最大短时响度、响度范围和最大真实峰值等数值。播出系统中各频道节目24小时不间断播出, 质量管控域中的网络监控服务器可随节目条目的不断变更, 自动获得每个节目的响度数据。通过海量收集基于节目的响度数据, 质量管控域可对其进行分析和监管, 加强了台内播出末端对于节目响度的把控能力, 为日后进一步研究响度相关课题提供有效数据。

通过这种全台多手段相结合的方式来控制节目响度, 确保了台内全流程的节目响度统一标准, 科学地、全面地解决了节目播出过程中的响度跳变问题。

四结束语

高清节目按照声道分布规范制作完成以后, 嵌入相应的元数据信息, 按照播出传输系统对音频的不同处理方式, 提出了三种音频元数据处理的解决方案, 以保证到达用户以后环绕声能高质还音, 或以正确方式进行声音下混。

音频元数据 篇2

关键词: 元数据 数据服务 按需共享 XML Schema

中图分类号: TP39 文献标识码: A文章编号: 1007-3973 (2010) 04-051-02

1 引言

随着计算机软件技术和网络技术的快速发展,以及计算机应用需求的不断增强,现代企业的日常业务通常都是由众多以网络为中心的应用系统完成,每个应用系统都有具体的任务职责。通过使用这些应用系统,达到了降低管理成本,规范业务流程和提高服务质量的目的。随着信息化建设的深入,可利用信息源数目的不断增大,人们对于存取、关联、组合多信息源信息的愿望越来越强烈。因此,数据的开放式共享是网络时代的必然需求。

数据共享自被提出以来就引起了国内外众多科研人员的关注,已成为当前重要的研究方向。实现数据共享的核心就是解决数据源的数据量大;异构性强;数据格式多样;动态变化和分布;自治程度高等问题。以网络中心的信息共享的目标是确保所有的数据都是可见的、可理解的、可获取的和可利用的。

元数据通常被定义为“数据的数据”,其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。目前元数据已经从简单的描述或索引发展成为用于管理数据、发现数据、使用数据的一种重要工具。因此,元数据是数据共享的重要基础。

数据服务可认为是提供给用户访问一些结构化和半结构化数据的功能组件。数据资源拥有者把数据的各种操作以服务的方式封装,发布在互联网上,供其他用户使用。其他用户不必关心共享数据存储在什么地方和存储的方式,数据对用户而言完全是透明的。

本文探讨元数据技术和服务技术在数据共享中的应用。

2数据共享总体框架

图1为基于元数据的数据共享的基本原理图。如图所示,系统可以划分为三层结构:应用层、数据服务层和数据层。应用层与数据服务层之间采用SOAP协议进行通信。其中,数据服务层是整个数据共享系统框架的核心层,它是应用层与数据层之间关于数据的抽象,以服务的方式抽象出关于底层数据源的各种操作,对外提供共享能力。从用户的角度来看,他只关心服务提供的能力,而不关心服务的具体实现,减少了程序人员学习不同数据库所消耗的精力。

图1 系统层次结构

2.1数据封装器

数据封装器位于数据源之上,它是整个共享模型中最重要的部分,将分散在各处需要共享的数据源按照我们统一的数据模型进行封装。XML Schema文件为XML文件数据类型建模提供严格而完整的标准。我们可以利用这一特性使用XML Schema文件来建模数据库表的结构和内容,以及约束条件。数据封装器使用XML Schema文件对用户所要共享的数据库信息进行建模,使用XML文件来描述数据库的基本信息(数据库类型,用户名,密码等等)和数据库表之间的逻辑关系,把所共享数据的元数据信息提交到元数据中心,完成封装和共享功能。

2.2 中介(mediation)服务

不同的数据源之间存在异构性,特别是语义上的异构性,例如不同字段上的同一名称可能代表着不同的含义,这种异构性给数据共享带来了麻烦。中介服务提供一种格式转换功能,利用存储在元数据中心的各领域的元数据标准,把异构的数据映射到一个同构的虚拟视图上。

2.3 服务封装

服务封装的功能是对共享数据的各种操作以服务的方式进行封装,对外提供数据共享能力。

2.4 元数据中心

元数据中心在数据共享系统中的作用是提供一个元数据信息的共享空间,存储着各种元数据信息,对外提供元数据注册、查询和管理功能。元数据信息包括共享数据资源的元数据,发现类元数据,不同领域的元数据标准等等。用户通过提交共享数据的元数据信息到元数据中心实现资源共享,以及参考领域内的元数据标准开发应用系统,统一数据视图,实现系统间数据的互通和互理解。

2.5 数据服务中心

数据服务中心管理着用户发布出来的数据服务,提供注册、管理和查询数据服务的功能。决定数据共享能力的关键点并不是采用何种技术对数据进行封装和共享,而是在大量的资源中满足用户快速和准确的找到资源的需求。数据服务中心采用定制的发现类元数据对数据服务资源进行描述,提升资源的发现能力。

3 关键技术研究

3.1 数据封装器

目前,数据封装器主要封装一些结构化数据,例如数据库信息。本文提出的数据共享系统对数据源的共享粒度细化到数据表级,而不是数据源级。因此,易于形成高内聚低耦合的状态,实现新加载数据源的按需共享和快速共享。用户根据需要对部分数据库表进行封装和共享,而不是为了共享某些数据而把整个数据库共享出去,实现了按需共享的目标。

数据封装器使用XML Schema文件来描述数据库表的结构和内容。下面举例说明如何使用XML Schema文件对数据库进行建模。例如,一个数据库表包含字段title, author, price, resume, recommendation,类型都为string型。用于封装该库表的XML Schema文件为:

其中可以在每一个element属性下面添加用于解释该字段含义的注释。例如:

书籍的标题名称

3.2 元数据抽取器

元数据信息抽取器属于元数据中心的功能模块,其功能是解析用户提交的共享数据的元数据文件(包括XMLSchema文件和XML文件),并提取文件内的元数据信息,存储到元数据中心。提取的元数据信息的最小粒度为数据库表的字段名和该字段的注释,也就是Schema文件内element属性下的内容。用户在元数据中心不但可以搜索到需要的共享数据,甚至能够了解到共享数据库表内字段的约束和具体含义。

3.3 发现类元数据

发现类元数据标准是一组与每个数据资源相关的通用描述性元数据要素,以支持利用搜索工具发现数据资源。如图2所示,发现类元数据采用分层方法设计,由一个“核心层”和一个“扩展层”组成。 核心层包括4个要素类别组,分别为安全目录集、资源目录集、摘要内容目录集和格式目录集合,每组都有一个描述数据资源的特殊功能重点。扩展层则是根据领域特性增加的一些元数据要素。

用户在发现类元数据目录中输入所感兴趣的核心要素,利用发现类元数据发现资源的能力在共享空间中搜索共享资源,准确地找到所需要的相关数据资源。

图2 发现类元数据逻辑模型

4 总结

本文提出了一种结合元数据技术和服务技术的数据共享方案,并给出了系统设计框架,特别是给出了数据包装器的设计说明。该数据共享设计框架具有以下特点:

(1)按需共享。数据存储在本地,按照需求有选择性的共享数据,提高了数据的安全性。

(2)透明访问。不必关心数据存放的位置和存储的方式,只需要调用数据服务就可以使用共享数据,对用户而言数据是透明的。

(3)松耦合。数据的请求者和提供者之间只有接口上的往来,移除请求者和提供者之间的依赖性。数据源的替换或者更新都与数据请求者无关。

参考文献:

[1] 李军怀, 周明全, 等. XML在异构数据集成中的应用研究[J]. 计算机应用, 2002, (9).

[2] 李学荣, 李莎. 基于元数据的异构数据源集成系统设计与实现[J]. 计算机应用,2005, (25).

[3] 丁兆青, 董传良. 基于 SOA 的分布式应用集成研究[J]. 计算机工程,2007, 33(10).

[4] 毛新生.SOA原理??方法??实践[M]. 北京:电子工业出版社,2007.

对音频数据测试分析系统设计的探讨 篇3

在无线通信设备中, 语音传输还是非常重要的一种功能, 根据实际工作需要, 我们设计了一台音频数据测试分析仪。其主要功能, 包括音频信号产生, 音频信号采集、信号分析, 自动完成对于设备的音频性能测试分析, 给出测试报告记录。

2 平台构建

本仪器的平台构建基于嵌入式计算机, 软件的设计工作采用Lab VIEW虚拟平台。

作为一种程序开发环境, Lab VIEW虚拟平台与ASIC开发环境有较多的相似之处, 但是Lab VIEW平台将原本数字化的文本编写程序通过图形的方式展现出来, 这就是Lab VIEW与其他计算机语言最大的区别所在。Lab VIEW全称为Laboratory Virtual instrument Engineering Workbench, 在数量众多的工业设备、学术研究机关、各个实验机构中, Lab VIEW的运用十分广泛, 使用量很大, 在各种单位的程序开发中占有相当大的比重。Lab VIEW对大部分协议都能够较好的支持, 并且在某些程序中还集成了数据采集卡的功能。对Active X、TCP/IP等函数也能做到支持, 因此Lab VIEW的功能的强大就在此。在Lab VIEW的支持下能够有效地管理各种虚拟仪器, 并且用图形化的操作界面使程序员的操作生动起来。

软件控制声卡产生音频信号, 进而将音频音频信号接入到需要待测的设备中, 对待测的设备中输出音频信号进行采样, 完成数据分析, 包括失真度、信号幅度、频率、频率响应、降噪性能、信噪比等功能。

3 系统设计

图1展示了系统中人机交互、分析处理、数据采集、信号显示等功能。

(1) 系统的工作流程

包括声卡在内的外部设备在运行中会产生待测信号, 将这些信号输入到计算机之中, 由专门的软件系统来处理记录信号、进行各种运算, 将信号的波形与测量结果显示在显示器上, 供专业人员检测观察。如图2展示了系统的工作流程。

(2) 不同功能的实现

虚拟仪器为了提高工作效率, 一般会分出集和信号分析、声卡等下级系统, 并且将其用形象的图形界面表现出来。

a) 声卡设置

为了提高数据采集的效率, 在系统上线之前要准确的设置各项声卡参数。当声卡不止一块时, 要将每块声卡的ID明确的标注出来, 并根据实际情况设置好采样模式、通道数量、每通道采样的数量以及比特率等关键性参数。

b) 数据采集

用户设置的声音格式不同, 数据采集功能就会从声卡采集与保存不同的数据。最后将数据已便于理解的方法显示在计算机的显示设备上。声卡的数据采集开始于声卡的初始化, 在完成实时采样之后还要进行声卡的释放工作。

数据采集的程序设计时, 在“声音采集”条件分支中, 首先用一个开关来控制子条件分支结构, 为真时才执行采集操作, 为假时不进行任何操作。前面板上与之关联的“开关”是采样操作的总控制处。采样时, 首先初始化声卡, 对“配置声音输入”分别输入采样率、通道数、采样位数、缓存大小设置信息。节点上的常数0是默认设备ID, 另一个常数1表示采样模式为连续采样。随后, 通过“读取声音输入”读取显卡中的数据, 分别送至波形显示、文本文件存储 (“写入波形至文件”) 、Excel文件导出 (“导出波形至电子表格文件”) 。

c) 信号分析

信号分析面板如图3所示, “开始分析”作为分析操作的总开关。“打开声音文件”可以选择将要分析的声音文件地址。主屏上的四个波形图分别为被分析信号的时域图、频谱、相位谱、功率谱, 同时在左下角三个数字显示区可以显示出音频信号的平均幅值、周期和频率。

信号分析部分程序设计思路为:用“开始分析”作为操作的开关, 控制条件分支结构, 只是在条件为真时才有操作, 为假时的操作为空。分析信号时, 先读取之前保存的文本文件 (wav格式) , 直接送至波形图可显示时域信号, 经过“频谱测量”、“功率谱测量”后可显示频谱、相位谱和功率谱图像。对于信号频率和周期, 可以使用“信号的时间与瞬态特性测量”, 对于信号幅值, 经过对比选择, 可使用“幅值和电平”函数。

4 总结

本文主要研究了基于Lab VIEW平台的声卡采集功能, 提出了几个关于如何设计出更好的音频信号采集分析系统的建议与意见。从数据采集、声卡设置以及信号分析三个组成部分研究了Lab VIEW平台软件设计的可能性, 阐述了其工作原理, 还进行了关于面板设计等方面的探讨, 以便于更好的完成低频音频信号的采集与处理工作。

参考文献

[1]LabVIEW8.2基础教程雷振山编著中国铁道出版社.2008

[2]LabVIEW8.2.1与DAQ数据采集龙华伟.顾永刚编著清华大学出版社

音频元数据 篇4

1.驱动软件的总体组成及设计

1.1 总体组成

本软件的硬件平台由海上GPS定位数据发送端和陆上GPS定位数据显示端组成。

海上GPS定位数据发送端需要编写大容量FLASH存储器的驱动软件、DTMF编解码电路的驱动软件、GPS OEM板驱动软件。

陆上GPS定位数据显示端需要编写LCD显示器的驱动软件、触摸屏控制器的驱动软件和DTMF编解码电路的驱动软件。

驱动软件的内容如图1 所示。

1.2 海上端硬件驱动软件设计

1.2.1 GPS OEM板驱动软件设计

GPS OEM板上电工作后,按照一定的波特率输出NMEA0183 语句。方案采用GARMINGPS25LP GPS OEM板,该板出厂时默认波特率为4800bps,输出语句为$GPGGA 、$ GPGSA 、 $GPGSV 、$GPRMC和$PGRMT语句,因此GPS OEM板上电工作后就会以4800bps每秒分别输出一帧$GPGGA 、$ GPGSA 、 $GPGSV 、$GPRMC和$PGRMT语句。可以通过$PGRMO语句屏蔽它们。$PGRMO语句格式为:$PGRMO,<1>,<2>,*hh<CR><LF>

根据单片机测量需要,只保留输出$GPRMC语句,通过单片机串口向GPS OEM板输入:

$PGRMO,,2(屏蔽所有输出语句)

$PGRMO,GPRMC,1(激活GPRMC语句)

通过以上设置后,GARMINGPS25LP将连续输出$GPRMC数据,波特率为4800bps。

单片机读取$GPRMC语句的程序设计方法如下:

对于图像传输微波机定位来说,只关心GPS OEM板输出的的经纬度和时间。因此在设计读取$GPRMC语句的单片机软件时,只关心四组数据,即:UTC当地时间的时分秒(hhmmss),UTC当地时间,日月年(ddmmyy);纬度ddmm.mmmm,经度dddmm.mmmm。对GARMIN GPS25LP进行设置后,每隔一秒GARMIN GPS25LP将发送一帧$GPRMC数据。$GPRMC语句格式为:

从$GPRMC数据格式,可以知道第一个逗号之后的字符属于时间的时、分、秒数据;第三个逗号之后的字符属于纬度数据;第五个逗号之后的字符属于经度数据;第九个逗号之后的字符属于时间的日、月、年数据。因此,从收到第一个字符"$" 后,通过判断逗号就可以寻找到设计所关心的数据,具体程序如下:

以上程序将GPS时间的时、分、秒数据存放在stringtime1[]数组中,共占6个字节;将日、月、年数据存放在stringtime2[]数组中,共占6个字节;将纬度数据存放在stringlat[]数组中,共占10个字节;将经度数据存放在stringlon[]数组中,共占10个字节。

1.2.2 FLASH存储器驱动软件设计

FLASH存储器选用三星K9F2808UC0C。该芯片容量为132Mbits,由1024 块组成,每块又由32 页组成,一页有528 字节(512 + 16)×8bit。对K9F2808UC0C进行读写操作时,必须以页为单位进行操作。对K9F2808UC0C进行擦除操作,必须以块为单位进行操作。从设计方案可知,单片机的P25、P26 用于控制74LS245 的数据方向。K9F2808UC0C的驱动程序由读数据程序、写数据程序、擦除程序和写命令程序三部分组成。具体程序如下:

1.2.3 DTMF编解码电路驱动软件设计

GPS定位数据经过DTMF MT8880 编码后,通过图像微波机传输设备的伴音信道传送到陆上的图像微波机端。陆上的图像微波机端接收到DTMF信号的GPS定位数据后,经过DTMF MT8880 解码转换成数字信号, 由CPU的INT0 中断接收。对MT8880 的操作由初始化程序,数据发送程序,数据接收程序组成。具体实现程序如下:

1.3 陆上端硬件驱动软件设计

1.3.1 触摸屏控制器驱动软件设计

本设计中采用触摸屏专用控制芯片ADS7843 实现对触摸屏的控制。它是一款具有同步串行接口的12 位取样模数转换器。由于89C51 没有专门的同步串行接口,因此采用I/O口模拟同步串行接口(SPI)的方式进行设计,触摸屏被按下时产生INT1 中断,单片机通过INT1 中断服务程序实现触摸点位置的读取。具体驱动程序如下:

1.3.2 LCD显示电路驱动软件设计设计

本设计采用台湾晶采光电科技股份有限公司生产的AG320240A4STCW-T51 液晶显示屏,该液晶显示屏内置SED1335 LCD控制器,具有320 列240 行的显示能力。LCD显示屏与单片机之间通过一片74ls245 进行连接。LCD显示屏主要有两个程序,一个是写命令程序,一个是写数据程序,程序如下:

本设计中的USB接口电路不需要特意编写驱动程序,PC机端的驱动程序Silicon公司免费提供,单片机端的驱动程序其实就是UART的收发程序。

2.结束语

本文根据海上图像传输微波机实时定位所设计的的硬件实现方案,设计了相应的驱动软件。论文中所涉及的软件作者工作中都曾经配合相应电路使用过。年初在验证DTMF信号进行数字通信的PCB板上,使用本文所设计的软件成功实现了数字信号的发送和接收。因此可以说,本文所设计的软件是可行的。

参考文献

[1]马忠梅等,《单片机的C语言应用程序设计》,北京航空航天大学出版社,2003.

音频元数据 篇5

模拟式传输终端有信号同传时交调干扰严重、容易受环境干扰影响、传输质量低、长期工作稳定性差等缺点,因此,市场上模拟传输终端已逐渐被数字传输终端所代替。本文设计了一种运用低压差分信号(Low-Voltage Differential Signaling,LVDS)技术[1]的数字信号光纤传输系统,可以在一根光纤中同时传输4路数字视频、1路音频和1路数据信号。硬件基于E2PROM或Flash存储器编程的CPLD,编程次数可达上万次,相比FPGA具有系统断电时编程信息不丢失和保密性好的特点。

所设计终端可用于平安城市、高速公路、银行以及电力系统等的远程监控、远程会议、远程教学、远程医疗等领域,还可以根据需要将不同路数的视频、音频和数据进行任意组合以满足各种不同需求。

1 系统设计

本设计由发送板和接收板2个部分组成。发送板实现的功能是:将4路无压缩视频信号和1路音频信号进行高分辨率数字化,再与1路数据信号一起形成高速多路正向数字流通过CPLD器件,运用Verilog HDL语言编程,实现正向数据的一次复接,并运用LVDS技术将复接后的数据转换为高速差分信号后通过光电一体模块进行发送。接收板运用LVDS技术将接收到的混合信号进行低速分接,并通过CPLD器件二次分接,恢复视频、音频和数据信号,再进行数模、电平转换后,发送到相应的端口。发送板和接收板结构设计框图及所用芯片分别如图1和图2所示。

CPLD是整个系统的核心,选择Altera公司MAXⅡ器件系列的EPM570T100C5芯片,该器件系列是一种非易失性、即用性可编程逻辑系列,是所有CPLD系列产品中成本最低、功耗最小和密度最高的器件。

2 硬件设计

综合传输系统的硬件设计主要包括CPLD核心器件、视频音频数据信号采集、处理和电平转换模块、LVDS串化/解串化模块以及信号的电光、光电转换模块。

2.1 视频模块

发送端视频模块由摄像头采集模拟视频信号,然后通过SGM9123芯片完成放大、滤波、钳位[2]等预处理,并进行模数转换,然后送入CPLD中完成数字信号的一次复接。光传输接收端视频模块实现的功能是将由CPLD输出的数字信号送入TLC5602和SGM9123芯片进行数模转换、视频放大和低通滤波,最后转换成模拟信号送到监控设备上。

发送端和接收端的视频处理模块[3]原理框图分别如图3和图4所示。

视频信号为模拟低频信号,为得到CPLD所需的数字信号,必须经过放大、滤波和模数转换。模拟信号中包含交流和直流分量,经过放大器时,由于其中耦合电容的影响,信号会失去直流部分。视频信号失去直流部分,图像的同步电平将不能固定在同一电平上,同步头将随图像的变化而变化。所以为了使其不受图像变化的影响,必须恢复直流分量,使同步头钳制在同一电平上。SGM9123是一个具有钳位功能,内置带宽为8 MHz的低通滤波器和6 dB增益放大电路的三通道视频缓冲器,因此发送端和接收端的视频驱动电路都采用此芯片。模数和数模转换芯片则采用TLC5510和TLC5602,它们是8 bit、低功耗的转换器。图5为2路视频发送原理图。

2.2 音频和数据模块

数据信号利用RS-232通信接口传输到数据模块发送端,数据模块发送端和接收端通过MAX232[4]芯片进行转换,将计算机串口信号电平和CPLD电平相互转换,以达到计算机和CPLD可以通信的电平标准。图6为1路数据发送原理图。

发送端音频模块是将采集到的音频信号传输至音频编码器,编码后的数字信号接入CPLD;接收端则是对称相反的过程。发送端和接收端的音频处理芯片都采用AKM4550,它是一款低电压,左、右声道各16 bit的A/D和D/A便携式数字音频系统转换器。

2.3 LVDS串化/解串设计

LVDS串化/解串芯片分别采用SN65LV1023和SN65LV1224,它们是10 bit串行器/解串器芯片组,并且SN65LV1023和SN65LV1224成对使用。经CPLD芯片处理后的视频信号和音频及数据信号送入SN65LV1023开始串化过程,10 bit输入信号中低8 bit用于传输采样转化后的视频信号,1 bit用于传音频和数据混合信号,1 bit为控制位信号。输出的DOUT+和DOUT-送入光纤传输模块,解串过程则相反。图7为串化过程原理框图。

2.4 光电模块

发送端,信号经串化器二次复接后,所形成的高速数字差分信号通过光电转化器转换成光信号并通过光纤进行传输。接收端则把光纤传来的信号再转化为电信号,然后送入解串器作进一步处理。

本设计中采用的是1.25 Gbit/s与84 Mbit/s速率不对称单模单纤光收发一体模块,它可以通过单根光纤实现双向工作,单电源+3.3 V/+5 V供电,发射器件可选用工作波长为1 310 nm或1 550 nm的FP、DFB激光器。

3 软件设计

软件设计利用Verilog HDL语言进行编程[5],使CPLD实现所需功能。主要包括:各信号模块初始化、提供时钟信号、处理采样数据、完成串行数据与并行数据的转换以及扰码/解扰码[6]等。图8和图9是发送端和接收端程序流程图。

3.1 发送端并/串数据转换

发送端的视频信号转换频率为15 MHz,而CPLD采样频率60 MHz。通过对60 MHz进行四分频,得到4路15 MHz信号,因而可完成4路视频信号串行输入,并将4路视频数据合并为1路数据流,共8 bit,与8 bit扰码对应位异或后接至串化器的8个输入端口。同样,1路音频信号经过编码后和1路数据合并,与1 bit扰码异或后接至串化器的另一个输入端口。串化器最后一个控制口依次输入00110011…,此信号用来识别视频各路数据输入,便于在接收端分离4路视频信号。音频数据时钟为32 kHz,数据波特率为9 600 baud。发送端时序图如图10所示,其中,fold_out表示加扰码前视频和音频数据混合信号输出的数据流,p_serial_dtout表示加扰码后输出的数据流。

3.2 接收端串/并数据转换

P_data_in是解串器一次分接后输入CPLD的低速数字信号,其时钟安排与发送端相同。根据时钟信号的不同,可分出视频、音频和数据信号,并将其对应送入相应处理模块。图11为接收端时序图,图12为将时钟周期缩小后音频数据时序图。

3.3 扰码/解扰码设计

扰码的作用是对输入信号进行随机化处理,以减少数据的连“0”和连“1”数目,确保接收端的位同步提取。同时还可以扩展基带信号频谱,起到加密效果。因此,需要对传输数据在发送端进行加扰,在接收端进行解扰。扰码结构框图如图13所示。

扰码信号通过循环移位寄存器产生,而扰码器的结构则由扰码生成多项式决定。本设计中使用的扰码生成多项式为x4+x1+1。图14所示是由该生成多项式确定的扰码器结构框图。

设扰码寄存器初始值为R0={r00,r10,r20,r30},在时刻t的状态为Rt={r0t,r1t,r2t,r3t}。由循环移位寄存器的结构可知RtRt+1有如下关系:

r0t+1=r0t+r0t,r1t+1=r0t,r2t+1=r1t,r3t+1=r2t

设计中假设初始值为1010,由上式可知,下一值为1101,一直到第9个值为1000。取各组值的末位为第1个9 bit扰码信号,然后初始值会变成下一个时刻的值,经过不间断的循环,产生一系列9 bit数据扰码。图15为扰码程序流程图。

4 结束语

本文所设计的综合传输系统,以CPLD为核心,传输性能稳定,便于调试和升级。SGM9123等多功能芯片的选择、对称原则的设计布线,简化了硬件电路的设计,降低了成本。同时运用LVDS技术,完成了图像、声音和计算机发出的操作指令的传输。经过实验测试,图像传输稳定,声音传输清晰,计算机操作指令传输无乱码和丢字现象,指令正确。

摘要:以CPLD为核心器件,根据当前实际需要,设计了4路视频、1路数据和1路音频的综合传输系统。给出了设计思想,对多个模块的设计进行了论证和阐述,完成了硬件设计和软件设计。通过制作样机,完成所有设计功能,经过实验测试,图像传输稳定,声音传输清晰,效果理想。

关键词:CPLD,视频模块,RS-232,扰码

参考文献

[1]蒋东初,李玉山.LVDS在高速数字系统中的应用研究[J].现代电子技术,2009,32(7):147-150.

[2]姜鹏,何毅.应用CPLD的数字光端机的设计与实现[J].自动化仪表,2011,32(1):80-82.

[3]王德胜,康令洲.基于FPGA的实时图像采集与预处理[J].电视技术,2011,35(3):32-35.

[4]任安虎,张燕.一种实用光端机的设计与实现[J].电子设计工程,2010,18(9):55-58.

[5]潘松,黄继业,潘明.EDA技术实用教程—Verilog HDL版[M].4版.北京:科学出版社,2010.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:3家庭防火安全教育教案 下一篇:视频音频