视频音频(精选十篇)
视频音频 篇1
Linux是一个基于Unix的操作系统,它也是Unix家族的一元,与Unix不同的是它可以运行在不同的硬件平台上。它于1991年诞生于芬兰的一个为大学生Linus Torvalds手中,不过当时还只是一个雏形,为了不让自己的这个羽翼未满的操作系统夭折,Linus将自已的作品Linux通过Internet发布。从此一大批知名的、不知名的电脑黑客、编程人员加入到开发过程中来,Linux逐渐成长起来。到目前为止,Linux的内核已经发展到了2.6.22,并在此基础上发展了数十种发行版,其中有经过长期发展洗礼的Redhat(Fedora),也有发展迅猛使用方便的Ubuntu。
在多媒体技术中,视频技术发展越来越迅速,比如在远程教育、在线视频会议、银行监控、危险地区探测以及智能家庭安防方面应用越来越广泛。由于Linux自身的特殊的发展过程使得它具有了得天独厚的网络性能,加上越来越丰富的视频支持和开源软件的优势以及对不同硬件平台的良好支持,使得Linux成为视频采集的最佳平台。
2 系统设计
2.1 硬件
硬件平台为PC机,决定图像的质量的一个首要的因素是摄像头,应该根据不同的应用场合合理选择。大体上有两种方案:普通视频聊天用USB摄像头和工业视频拍摄用摄像头。这两种方案在不同的技术参数上各有特点。如果仅仅是用于在线视频会议,则可以选用USB摄像头方案。如果是用于高清晰的拍摄监控,则需选用工业的摄像头,而且由于这种摄像的输出的是模拟信号,必须接入视频采集卡才能将模拟信号转换成数字信号提供给计算机处理。
硬件结构如图1所示,图像信号经过USB摄像头采集后,将数字信号直接提供给计算机进行处理。或者图像经过CCD摄像头采集,通过同轴电缆传给视频采集卡,经过视频采集卡转换成数字信号然后交给计算机。一般的采集卡会有多个视频接入口,按照采集能力的高低还可以分为多路实时采集和多路分时采集。如果是多路实时采集则可以在同一时刻输出多路视频信号。大多数的视频采集卡官方的驱动并不支持Linux,如果视频采集卡采用的是Bt8XX(Bt848/849/878/879)的话就没有问题了,因为Linux内核就提供了对Bt8XX很好的支持,其驱动为bttv(目前最新的版本为0.9),已经包含在Linux的2.6的内核当中。
本方案采用的是Honeywell GC-755P-A2-G工业级摄像头,采用的是微视Microview V110视频卡。USB摄像头用的是金河田的GD-202A,Linux本身支持ov511x芯片的USB摄像头,对于市场上大部分的采用ZC301的摄像头Linux也能够很好地支持。随着Linux的快速发展,对硬件的支持也越来越好。现在安装硬件相对于以前来说方便多了。将视频采集卡插入计算机,重启进入Linux之后系统会识别出硬件然后加载相应的驱动模块,模块包括bttv、bt878、videodev和tuner。然后安装Xawtv来预览,查看视频画面质量来进行测试。一般来说加载的模块和参数都不需要用户更改,要说明一下的是bttv这个模块,由的视频卡插入电脑后运行Xawtv出现的为黑白的画面,甚至有时候出现的是变形和重影的图像。这是bttv没有正确识别出卡的类型导致的,对于本方案中的视频采集卡可以采用指定卡的型号的方法来解决,首先卸载已经加载的模块rmmod bt878、rmmod bttv。然后重新加载模块并附上指定的参数modprobe bttv card=13。然后重新打开Xawtv来查看图像,则图像显示正常。
2.2 软件设计
Video4Linux是Linux下面为各种视频设备提供的统一的API接口,包括市面上常见的视频采集卡和USB的摄像头。视频设备在Linux下对应的文件为“/dev/video0”,如果视频卡支持多路视频输入或者PC上接了多个USB摄像头的话,视频设备文件会有多个比如“/dev/video1,/dev/video2”等等。
在Linux下面所有设备统一当作文件处理,要采集视频首先得打开相应的设备文件。然后才能对设备进行设置和数据采集处理。
1)打开视频设备
2)更改视频设备的设置
ioctl是设备驱动中对设备的I/O通道进行管理的一个函数,所有对设备属性的设置都依靠它来完成。在V4L中还提供了一个额外的ioctl函数用于对各种视频操作的控制。其中有:视频设备的基本信息,包括:设备名称,最大最小分辨率和信号源信息,采集而来的图像的各种属性,包括:亮度,对比度和灰度,还有信号源的属性和内存映射的设置。下面是一个简单的例子:
3)读取数据
首先我们要保证的是程序要等到下一帧图像准备好了才能开始读取,或者一个中断等待的信号。如果由中断信号产生就从系统调用中返回,这样信号才能传达到程序中。此外程序还检查用户是否实际上不想程序读取图像的时候等待,比如采用非阻塞I/O模式在图像没有准备好的时候可以继续做其他的事情。接下来从视频卡拷贝图像,这里的capture_w和capture_h是用来保持采集到的图像的宽度与高度的。
2.3 音频捕捉
对音频捕捉是通过对声卡的编程来实现的,声卡在Linux下对应的设备文件应为/dev/dsp和/dev/audio,这两个文件基本一样,提供/dev/audio是为了与SUN声音系统兼容。编程的流程与视频编程非常相似:
1)打开声音设备文件;
2)对声卡的采样量化位和采样频率等等进行设置;
3)读取声音数据;
4)播放。
代码范例如下:
由于篇幅的限制,其中设置声音采样频率和量化位数的代码没有写入本文当中。
3 结束语
该文介绍了利用一台普通的PC机,利用Linux作为开源软件所具有的低成本,资源丰富等优势。根据使用场所的实际需要,可同时对多路的高性能的专业摄像头和普通USB摄像头捕获的视频信号以及MIC捕获的音频信号进行采集。若结合多媒体视频音频的编码、解码技术和流媒体技术,充分利用现有的网络基础,则可以方便的实现监控、拍摄和远程教育等各种功能。
参考文献
[1]Stevens W R,Rago S A.Advanced Programming in the UNIX Environment[M].2th ed.Addison Wesley/Pearson,2006.
[2]李玉波,朱自强,郭军.Linux C编程[M].北京:清华大学出版社,2005.
视频广播、视频点播、视频会议区别 篇2
视频广播、视频点播和视频会议的区别
视频广播(VB):是基于IP组播技术,对每个节目只发送一个视频数据流,理论上能够支持无限用户对节目的收看。所以比较适合拥有大量观众的视频应用。但用户不能随时请求收看节目,因为它是一种单向的,一对多的广播服务。它带宽耗费小,是一种经济有效的视频应用。
视频点播(VOD):是一种一对一的视频应用,能够允许收看用户随时请求收看节目,但对每一个节目请求都需要1个单独的数据流,无论收看者是否点播同一个节目。它是一种双向不对称的服务,从视频服务器向用户端的视频数据传输远远大于相反方向的点播请求信息数据传输。视频点播的应用带宽耗费较大。
视频及音频系统的测试 篇3
影院设计·李志强·北京
THX/ ISF /CEDIA认证工程师、高级音响师、全国信息化工程师。从事电声扩声系统设计安装调试工作19年,积累了极其丰富的各类系统设计经验,并与顶级设计师保持长期联系。
当我们把一个完整的影院系统搭建完成后,就面临着一个重要的问题——进行系统调试。随着现代影音科技的发展,音频及视频效果越来越引人入胜,如身临其境,但系统也变得越来越复杂。调试起来更为辛苦。
我们从信号源(BD机或游戏机等)的设置一直到最后一个环节,音箱或投影机都需要设定各类参数,一个参数设定错误可能造成系统整体表现的失败,这也是为什么影院系统的调试需要具有丰富的理论及实操经验的工程师来完成的原因。但有了专业的工程师,光依靠他的耳朵和眼睛也是无法达到精准调试的,无论你有多丰富的经验。人体器官的自身适应性很强,0.5dB的音量变化,1FL的亮度变化,光学白平衡点的变化,色原点的变化,音频某频点的增益或衰减的量值,任何人用人体器官都无法做出精准判定。
这时我们必须依靠专业级的测量设备来完成这项任务。测量声相,我们需要相位仪;测量各声道声压需要声压计;测量室内共振频点需要扫频仪;测量色域、白平衡点、亮度值、需要光学探测仪及标准信号发生器。
值得注意的是,其中所采用的软件,如声卡、Mic的专业性和准确性至关重要,此处建议低于2000RMB的声卡不要考虑,低于1000RMB的测试Mic不要考虑。
面向视频监控的视频编解码技术 篇4
目前,国内外的模拟监控系统逐渐被数字监控系统取代。视频监控数字化后,网络化监控技术得到了大规模的应用,初级的智能视频监控很快也得到初步的应用。在这一背景下,国内外可以用于安防监控的视频处理技术的研究主要集中在高效压缩编码、网络适应性、智能分析这3个方面。如图1所示,这3个方面的研究重点不同,但又互相联系、互相制约和促进。高效压缩编码技术的研究起源最早,网络适应性技术在其研究成果上发展而来,而智能分析技术是将计算机视觉技术和编解码技术相结合产生的。反过来,网络适应性技术和智能分析技术的需求或成果又为高效压缩编码提供了新的思路,极大的促进了高效压缩编码的发展。
2 现存问题及发展趋势
目前,视频监控已经成为了一门蓬勃发展的学科,因此应该致力于开发各种技术和设计不同的系统来满足各种特殊环境的视频处理需求。
自从911事件以后,西方各国更加注重国内的安全防范,加速了视频监控技术的研究,促进了视频监控市场的飞速增长。但是,由于网络视频处理技术和智能视频分析技术尚未完全发展成熟,所以目前普遍应用于视频监控系统中的视频处理技术主要是视频数据的压缩、传输和存储,只有少数的监控系统具有初步的智能分析功能。在这样的系统中,视频数据到达终端以后还是需要人为实时观测分析,尤其是比较复杂的场景和活动。另外,视频在网络上的质量保证和安全性方面的研究也尚在进行中。因此,目前的视频监控系统中还存在着响应时间长、联动性能差、数据分析困难、误报和漏报等方面的问题。总的来说,视频编解码技术仍然是视频监控系统的核心和基础部分,无论是在现阶段,还是在网络化、智能化的阶段。因此,在视频编解码技术领域,对编码算法或者框架进行调整,以实现对网络传输、图像理解等安防的特殊需求进行必要的支持,这方面的研究是整个安防领域的视频技术研究的关键问题,具有非常重要的研究意义。
综上所述,制定面向安防监控领域的视频编解码技术,规范安防视频监控核心技术、推动安防监控产业的健康可持续性发展将具有非常重要的现实意义和历史意义。
3 AVS-S规范视频监控编码技术
AVS-S是完全针对安防视频监控的需求而设计的。视频监控系统经历了模拟信号监控系统、数模结合方式的视频监控系统、全数字化的远程联网视频监控系统3个发展阶段。目前,全数字化的网络化视频监控系统开始得到广泛应用。视频从前端图像采集设备输出时即为数字信号,并以网络为传输媒介,基于TCP/IP协议,采用流媒体技术实现视频在网上的多路复用传输,并通过设在网上的网络虚拟(数字)矩阵控制主机来实现对整个监控系统的指挥、调度、存储、授权控制等功能。如目前中国公安部正式启动的城市联网报警与监控系统建设“平安城市”工程,将在全国范围内的省、市、县3级开展报警与监控系统建设试点工程。公交、电力、银行、水利等行业监控的联网需求中,也都是采用了以视频网络传输,集中存储为中心的视频监控联网系统框架。
3.1 编码技术框架
图2所示为AVS-S视频编解码框架,与以往视频编解码技术相比,其主要技术特色为:多码流实现、基于区域编码、全天候信号编码和篡改感知能力。编码框架的选择必须以满足以上应用需求为目标,尽量同时兼顾技术优势和经济优势。
为了适应安防监控的特殊需求,国家多媒体软件工程技术研究中心研究了一种视频编解码体系结构。其所要解决的主要技术问题包括一种视频序列编解码体系结构的提出,与传统编码方式的兼容问题的解决,异构网络的传输问题,如何保证感兴趣区域图像质量的问题,如何适应不同光照条件和天气状况下的图像编码问题,以及编码信息的安全性问题。
该视频编解码体系结构包括基本层编码模块、编码控制模块、增强层编码模块3部分。其中,基本层编码模块的图像通过上采样作为增强层参考帧或层间预测削除基本层与增强层之间的信息冗余;编码控制模块根据感兴趣区域策略控制基本层与增强层中感兴趣区域的编码方式,通过光线模式判断控制基本层和增强层中支持全天候编码模块;增强层编码模块采用分层技术在以上各编码模块的基础上实现对增强层输入视频流的编码。
该视频编解码体系结构既能实现基本层对现有视频编码标准的兼容,又可以满足安防监控应用对视频编码的特殊要求。
3.2 核心技术
3.2.1 基于区域的变质量视频编码算法
在视频监控应用中,重点监控区域的图像细节对于调查取证至关重要。然而传统的编码方法对整体图像进行无差异性的编码,造成了存储空间和传输带宽的浪费。针对这一特殊需求,国家多媒体软件工程技术研究中心研究了基于区域的变质量视频编码算法,采用了使不同权重区域具有不同的质量的分级量化机制,防止了量化系数剧烈跳变的过渡带机制,并使用了提升感兴趣区域率失真斜率的“棋盘格式”算法。
“棋盘格式”算法在传输带宽或者存储容量一定的情况下,优先保证感兴趣区域(RoI)的编码质量,同等码率下,感兴趣区域的主客观质量都得到大幅提升,并且通过过渡带和感兴趣区域内部的优先级设定,使得感兴趣区域和背景区域之间的质量控制更加精细。具体的技术方案如图3所示。将编码图像分为背景区域、感兴趣区域和过渡带区域3个部分,可分别采用不同的量化机制,并且背景区域和RoI的量化值是由用户手动设置的,其余区域可以通过该算法的量化参数计算得到。在RoI采用类似国际象棋棋盘的区域分块方法,使区域中每个小块的量化参数与相邻的纵向和横向的小块不同,但与斜方向上的小块相同。
实验结果如图4所示,图4a为原始的编码结果,图4b为集成了基于区域的变质量视频编码算法后的编码结果。感兴趣区域图像细节质量的优劣显而易见。
该算法主要具有以下优点:1)在传输带宽和存储空间有限的情况下,可优先保证RoI的图像质量;2)算法复杂度不大,没有增加任何高复杂度的编码模块,复杂度与传统编码方式相当。
3.2.2 基于区域的变解析度视频编码算法
在某些安防应用情况下,特定监控对象需要具备不同的采样清晰度,然而现有的编解码方法无法基于区域提供不同的采样清晰度。AVS-S设计了基于区域的变解析度视频编码算法,其技术方案是:从基本层载入感兴趣区域信息,并根据感兴趣区域信息对增强层的原始输入图像进行剪切,对剪切后得到的感兴趣区域编码。针对安防监控的特殊需求,本算法从增强层提取感兴趣区域进行编码,而忽略其他非关键区域的图像,从而减小空域增强层码率,保证空域增强层感兴趣区域视频信息的质量。
实验结果如图5所示,图5a采用的是一般方法的A VS P2编码效果,图5b采用了融合了基于区域的变解析度视频编码算法后改进的方法。对比这两幅图像,当两者所使用的比特率基本相当时,图5b的人脸区域明显具备更加清晰的采样解析度,能提供更多的细节信息,从而提高RoI部分的质量。
上述两种算法与一般视频编码器相比,在充分节省带宽的条件下,能提供更高的局部质量清晰度,充分满足安防调查取证以及智能分析的需求。
3.2.3 超分辨力后处理算法
随着视频应用需求的发展,视频分辨力增强逐渐被人们关注。相对于前两种针对重点监控区域的编码技术,超分辨力技术可以突破采样获取的图像分辨力限制,是一种视频后处理技术,可以得到更高的分辨力。因此,可以将重点监控区域进行编码方法质量和分辨力变化之后,再使用超分辨力技术进行增强。
AVS-S研究了一种超分辨力算法,解决了图像模糊等系列问题。该算法的基本原理是使用信号处理技术从多幅低分辨力图像来获得一幅高分辨力图像或者高分辨力图像序列,这样的分辨力增强方法被称为超分辨力图像重建。超分辨力技术的目标就是要从多幅退化的、混叠的低分辨力图像中复原一幅高分辨力的图像。
实验结果如图6所示,利用相邻两帧辅助修正,得到一个较高分辨力的图像。图6a为低分辨力帧,图6b为分辨力增强后的效果。可以看到,图6b比图6a更清晰且包含更多细节信息。
3.2.4 实现帧率可调算法
对于传输带宽减少时的情况,AVS-S进行了对时域分级编码算法的研究,通过调整帧率来适应传输网络状况。可分级算法能提供灵活的分辨力、帧率和质量的码流结构,能更好地满足大型视频监控系统的要求。图7所示为该算法利用层次B帧的编码示意图。
本算法所要解决的技术问题是针对安防领域的特殊需求,制定一种针对双帧参考视频流的快速时域可伸缩编码实现方法。该方法能够与非可伸缩视频编码标准相兼容,并且能够明显提高编码效率。
该算法的技术方案是:基本层采用I帧或P帧图像编码类型,增强层采用的是B帧图像编码类型,通过对图像组中的各编码帧进行时域层次标注,并且在编码B帧过程中根据时域层次级别来搜索获取当前编码B帧的两个参考帧,参考帧可以是I帧或P帧,也可以是B帧,这样就使码流帧率按照2的整数次幂的倍数伸缩。实现结果如图8所示。
该算法提供的是一种快速实现双帧参考视频流的时域可伸缩编码的方法。该双帧参考视频流是基于B帧的双帧参考视频编码标准,利用这种方法编解码后生成的码流具有时域可分级性,其帧率能够适时调整,与一般丢弃B帧的做法相比,具备更好的编码性能。
3.2.5 面向全天候环境的优化编码技术
夜间视频图像和普通监控图像相比噪点很多,压缩后的码率非常大,需要采用不同于普通的编码模式。AVS-S可根据光线环境,自适应地调节编码模式。其特殊的夜间编码模式,可大大提高编码压缩效率、节约带宽和存储空间。
图9是夜间的监控图像,图9a是采用普通编码技术后的解码图像,图9b是AVS-S的解码图像。两幅图像主观质量相近,而图9b即AVS-S的夜间模式技术可以节省40%以上的带宽,同时也可以节省40%以上的存储空间。
4 总结和展望
综上所述,面向安防的视频编码技术AVS-S克服了针对媒体市场开发的视频压缩标准的不足,完全构架于IP网络之上,彻底摆脱了传统视频监控系统,视频流可以在整个系统范围内自由地被调度、使用和管理,具备了前所未有的灵活性。面向安防的视频编码技术不但知识产权清晰、许可价格合理,还具备和AVS完全兼容的特点,有利于我国安防视频监控相关产业的健康、持续发展。
摘要:通过分析安防系统中视频编码的特殊需求,深入介绍了面向安防的音视频标准AVS-S的核心技术,希望有助于安防自身视频编码技术的进一步发展。
海量视频检索与视频侦查 篇5
启动TDPlatform平台主程序,单击右侧面板中“侦查器”按钮,如下图:
在弹出的“图像侦查器”对话框中,为所有案件指定一个存储根目录,例如“F:武汉市公安局所有案件根目录”,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
为不同案件定义“唯一”的任务名称,例如“2013-08-07-武昌某小区失窃案”,如下图:
根据案情需要,可为案件填写相关任务描述,以备日后调阅,例如“该案发生于2013年08月07日下午14:30-16:00时间段,地点在武昌某小区„„”,如下图:
根据案发现场监控录像,定义可疑目标出现的已知场景,单击“场景”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
在弹出的“图像场景”对话框中,选择案发现场监控录像对应的视频文件作为“媒体源0”,例如:“D:Videoavich10_20***9.avi”,如下图:
单击“起始帧0”右侧的“V”按钮,定义案发现场可疑目标出现的“起始帧0”,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
在弹出的“视频”窗口中,“参考帧步长”可灵活控制播放速度和进退方式,该值默认为1时即正常前进播放,为2时即2倍速快进播放,为4时即4倍速快进播放,„„,依此类推;该值为负值时为倒退播放,如为-1时即正常后退播放,为-2时即2倍速快退播放,为-4时即4倍速快退播放,„„,依此类推。例如,输入“12”以12倍速快进播放,如下图:
“当前帧”在播放停止时作为播放开始的起始帧,在播放过程中作为播放的当前帧,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
可以通过“打开”(注意:第一次打开该视频可能较慢,需要耐心等待画面播放,切记不要着急和频繁操作!)和“中断”按钮,灵活改变“参考帧步长”和“当前帧”的取值,来回细致调节,定义案发现场可疑目标出现的起始帧,如下图:
找到案发现场可疑目标出现的起始帧后,单击“视频”窗口右上角的“关闭”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
返回到“图像场景”对话框,“起始帧0”将使用最后的“当前帧”自动更新,并允许人工再次修改调节,如下图:
单击“自动运行所有”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
在弹出的“先清除结果目录?”询问框中,单击“是”按钮,如下图:
程序自动预处理案发现场图像场景,当可疑目标即将离开案发现场后,单击“视频”窗口右上角的“关闭”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
程序自动再处理案发现场图像场景,生成关键帧集合后,弹出“图像分割器”窗口,这时须要手动定义待侦查目标在图像中的区域。“图像分割器”的主要功能是辅助分割目标图像区域。一张图像可以分割出多个目标图像区域。每个区域单击鼠标左键开始和调整,以单击鼠标右键结束。单击鼠标中键清除所有区域。双击鼠标右键移到下一张图像。向上和向左箭头后退,向下和向右箭头前进。手动定义目标区域时,尽量多选取目标较大、较清晰的图像集合(一个场景通常可以分割出20-100张的目标区域图像),以便在后面进行视频检索和视频侦查时,尽可能多地搜索到目标,同时又尽量减少程序误判和人工筛选的工作量,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
手动定义完待侦查目标在图像中的区域后,单击“图像分割器”窗口右上角“关闭”按钮,如下图:
程序自动运行后续所有程序,可能需要持续一两分钟的时间,请耐心等待后,弹出“操作完成”消息框,单击“确定”按钮,如下图:
单击“图像场景”对话框右上角的“退出”或“关闭”按钮,完成该案发现场可疑目标出现的已知场景定义,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
返回到“图像侦查器”对话框,如果需要再为该案件增加新的已知场景,请再次单击“场景”按钮,重复上面步骤。定义完已知场景后,单击“训练”按钮,如下图:
在弹出的“这可能需要持续几分钟。您要继续吗?”询问框中,单击“是”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
程序全自动训练侦查器,无须任何人工干预操作,可能需要持续几分钟的时间,请耐心等待后,弹出“训练完成”消息框,单击“确定”按钮,如下图:
在“图像侦查器”对话框中,单击“应用”按钮,如下图:
程序将跳到TDPlatform平台主程序,在弹出的消息框中,单击“确定”按钮,如下图:
在“视频”窗口中,选择“源类型”为“视频目录”,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
选择“媒体源”所在的视频目录,例如“D:Videoavi”,如下图:
单击“打开”按钮,如下图:
弹出“先清除捕获结果?”询问框,单击“是”按钮,如下图:
程序开始执行视频检索和视频侦查任务,搜索过程可能须要持续较长时间,请耐心等候。搜索任务结束后,在TDPlatform平台主程序中,单击右侧面板中的“浏览器”按钮,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
在弹出的“图像浏览器”窗口中,进行人工筛选,得到最终检索结果。“图像浏览器”的主要功能有:对图像进行自定义分屏浏览、由图像到对应视频的回放和浏览、对选中图像进行相关操作等。按钮I可选择图像目录。按钮R弹出五个捕获目录的菜单:原图目录、预处理目录、目标目录、警报目录、识别目录。按钮V可选择视频目录。图像到对应视频的回放和浏览,可以指定一个后退的时间间隔,该值默认为5秒。行数和列数用于自定义分屏,其默认分别为3和10。Home键的功能等价于首页,End键的功能等价于尾页,Pgup、Up、Left键的功能等价于上页,Pgdn、Down、Right键的功能等价于下页。左键单击图像进行选择和取消选择的切换。左键双击图像,如果该图像存在对应视频,则定位到视频中的相应位置并浏览,如果该图像找不到对应视频,则弹出其完整文件路径对话框。单击右键弹出快捷菜单,其功能分别为:刷新-刷新当前页、删除-删除选择集、移动-移动选择集、复制-复制选择集、全选-选中全部图像、全不选-取消选中全部图像、反选-反向选择图像。经过人工筛选后的检索结果,如下图: TDPlatform平台应用于海量视频检索与视频侦查入门教程
作者:李瑞鑫 网站: 邮件:ruixin_1981@sina.com
石山视频:找到视频的蓝海 篇6
但令人意外的是,点击播放后,台下的数千名渠道商代表看到的,竟然是一段该企业竞争对手的宣传片。原来,这是该视频网站的广告系统,根据视频内容和关键词自动匹配的一段贴片广告。整整40秒,全场在尴尬和惊讶中,完整地“欣赏”了一遍竞争对手的广告片。
“这是最失败的一次渠道大会。”该公司负责人说,“我需要一个专门针对企业的专业视频服务。”于是,第二天,他们就成了石山视频最早的大型企业客户。
石山视频虽然名不见经传,但却被很多投资人视为“中国的Brightcove”——这是一家以宽带视频服务为主的企业,不同于Youtube的UGC模式和Hulu的iVOD模式,Brightcove是以SaaS模式提供企业级视频服务的B2B企业。早在2009年,Google就曾叫价5亿~7亿美元收购这家公司;而2012年2月,Brightcove成功地在纳斯达克上市,目前市值2.95亿美元。
小公司抓住大需求
尽管和41亿美元市值的优酷相比,视频B2B的鼻祖Brightcove的市值几乎微不足道,但随着互联网和新媒体的发展,企业对宣传和营销手法的要求也越来越高,其中,对视频营销的需求正迅速扩大。相关数据显示,未来5年,企业级视频服务市场规模将增长5倍。
“尽管中国企业级视频服务市场还处在早期发展阶段,但现在已经涌现出几个强需求的行业了。” 石山视频创始人兼总经理徐平岩说,在短短一年时间里,石山视频就累积了100多家付费用户,主要集中在在线培训类企业,比如公务员考试、律师考试、英语培训,还有一些高校的远程课程。而另一方面,一些大型企业也使用石山视频的服务,来满足企业的展示型需求。
据了解,目前企业的视频需求通常有两种方式来满足。
一种是借助现有的优酷土豆等视频网站,企业将内容上传,再把视频网站链接嵌入官网。这样做,企业并不需要投入太多成本,但却面临着内容版权丢失的风险——目前主流视频网站的服务协议中,都有对用户版权内容免责的条款,甚至为了促进内容分享,很多网站还有一键转载功能。
而另一种是外包的方式,在搭建门户网站时,专门开发一套视频系统。这种方式花费很高,仅仅开发成本就达几十万甚至上百万元,开发完成后,还需要购买带宽,并专人维护和升级。但是往往两三年后,随着企业维护人员更迭、浏览器升级等因素的变动,视频系统不是文档丢失,就是跟不上时代,需要重新开发,砸了大钱却效果一般。
可见这两种方式,都不能完全解决用户的需求。对培训企业来说,把课程视频放到视频网站上,相当于把核心资产白白送人;但如果使用自己开发的系统,投入成本太高,无论带宽、服务器还是其他某个环节出了问题,就会遭到用户投诉。对展示型的企业来说,视频是要为企业品牌服务的,而B2C视频网站的品牌定位,并不符合企业的品牌形象。
成立不到两年的石山视频,已经累积了超过100家付费用户,其中不乏奔驰、东芝等全球500强企业。“我们的服务,对企业来说简单许多了。”徐平岩介绍道。简单说,企业只要把制作好的视频内容上传到石山视频在云端的服务器,然后把服务器返回的视频地址链接嵌入官网,就可以很轻松地把视频放在网站上了。
技术解决挑战
“这是我第三次做这个事情了,我敢说我对这个行业非常了解。”徐平岩说。他2008年就加入了Brightcove,作为早期员工之一,徐平岩把公司里从技术产品到市场营销的职位都做了一遍,并代表Brightcove拓展中国市场。随后,他又加入了欧洲市场排名第一的云视频服务提供商Kit Digital,确认了视频B2C的前景后,决定回国创业,做中国市场第一。
但是,徐平岩很清楚,对企业级视频服务来说,如果只满足于视频的展示需求,像石山视频这样的初创企业很容易被取代。“优酷们完全有能力做企业级视频展示,只不过现在视频B2C有百亿级市场规模,企业级市场太小,他们还不愿意做。”徐平岩说,因此,他坚定地把公司定位在SaaS服务提供商,“只做软件,用技术解决更大的挑战”。
首先,视频必须保证流畅播放。利用公有云的规模效应,石山视频能够有效降低带宽和CDN布局的成本,以较低的价格提供视频服务。
其次,版权保护也是企业用户关注的重点。针对这一点,石山视频的工程师还开发了防盗链、防下载、防录屏的“三防”技术。“根据用户需要,我们还可以定制开发播放器,让A企业的视频内容,只能在它的播放器里播放,其他任何播放器,都播不出来。”徐平岩说。
除此之外,为了满足企业客户的决策需求,徐平岩和他的技术团队还在产品中加入了数据统计功能。“在线教育这类行业很大程度上是靠运营视频来赚钱的,比如,加一个计费系统就可以赚钱了。因此,对视频的统计和分析,比如哪些视频比较受欢迎、哪个用户在什么时间什么地点看了哪些视频,以及视频被缓冲了多少次等,是未来大数据时代必不可少的功能。”
“对我们来说,现在最大的问题,不是客户和资金,更重要的是激发出更多需求,而这些,都可以用技术来解决。”徐平岩说。
基于编码的视频嵌入视频方法的研究 篇7
视频隐藏的蓬勃发展激起了研究者在视频中嵌入视频的灵感。SWANSON[6]首先提出了在视频中嵌入视频的思路, 利用一种基于高比特信息隐藏算法的向量射线比较法, 将秘密视频信息隐藏于载体视频中完成传输, 避免了单独传输易丢失的缺点;肖柏创[7]等人对YANG3]的算法进行了改进, 实现了高比特率的视频嵌入视频的方案。尽管这些方法都取得了一定的效果, 但都只是针对秘密为原始视频的情况展开讨论, 并未考虑秘密信息为压缩视频码流的情况。视频鲁棒隐藏算法的隐藏容量较小, 宿主视频每帧中隐藏的数据量有限。而视频的数据量是海量的, 如果不对秘密视频进行压缩编码, 那么一帧秘密图像需要隐藏在多帧的宿主视频中, 这样势必会带来实时性不高、秘密视频隐藏帧数少等问题。
针对上述问题, 本文提出了将秘密信息压缩编码后再嵌入视频的信息隐藏方案。该方案将视频的嵌入过程看成是秘密视频隐蔽通信的过程。首先将秘密视频压缩编码成码流, 从而有效地减少秘密视频的比特数。同时为了克服压缩码流误码敏感的缺陷, 应用了纠错和交织编码增加秘密信息抗误码的性能。在嵌入时, 选用鲁棒性较好的变换域的隐藏算法进行嵌入, 进一步增加隐蔽传输的可靠性。
1 视频嵌入视频方案概述
1.1 算法的改进
本文的隐藏算法在对参考文献[3]的算法进行深入研究的基础上对其进行了改进。参考文献[3]的嵌入算法如下:
(1) 将宿主视频按照4×4块大小进行整数DCT变换, 并按照zigzag扫描的顺序选取前8个系数 (c0, c1, c2, …, c6, c7) 组成向量V;
(2) 计算l和lT:
其中, T表示阈值, [.]表示四舍五入操作。
(3) 计算lT′:
其中, 嵌入1时, +0.25;反之, -0.25
(4) 计算l′和V′:
Yang的提取算法如下:
(1) 计算l″和lT″:
秘密信息的值取决于I的数值。
与其他格式相比, 视频在视频中的嵌入对实时性的要求更高。参考文献[3]算法在鲁棒性和图像质量方面都具有良好的性能, 但由于其嵌入的步骤要涉及到zigzag扫描、向量计算等, 若直接将其应用到视频嵌入视频的方案中, 将不利于实时性目标的实现。因此, 本文在保持了原算法性能的前提下, 对算法进行了简化, 缩短嵌入所需的时间。图1是CIF (352288) 格式的News、Moblie和Foreman视频序列按照4×4分块、整数DCT变换后低频在块中的能量示意图, 其中, 比值
从图中可以看出块中的能量集中于直流系数, 占到前8个系数总能量的0.95~0.99, 则, 将提取端的l′、l、lT、lT′等参数带入到V′中, 则:
为了进一步简化式 (6) , 对News、Moblie和Foreman视频序列进行了抗压缩的鲁棒性实验, 秘密信息为随机序列, 其误码均值的结果如表1所示。通过实验数据可以看出, 选用直流系数的鲁棒性和8个低频系数抗压缩的性能近似。因此, 可将式 (6) 简化为:
同理, 接收端中DCT变换后的能量也主要集中在直流分量上。因此, 可以在保证鲁棒性和图像质量等算法性能的基础上, 利用直流系数作为载体完成秘密信息的嵌入, 这样有利于视频实时性嵌入目标的实现。
1.2 视频嵌入算法
秘密视频信息嵌入框架如图2所示。
(1) 对秘密视频采用视频编码标准进行编码。
(2) 利用纠错码提高系统的鲁棒性, 同时利用交织技术防止突发错误的出现。
(3) 隐藏算法:
(1) 将宿主视频按照4×4进行分块, 并进行整数DCT变换;
(2) 选取每块中的直流系数D (i, j) , 进行如下操作:
其中, m表示秘密信息。
(3) 计算l′和V′:
(4) 将V′写回到4×4块中;
(5) 重复上述过程直到秘密信息嵌入完全。
1.3 视频提取算法
秘密视频提取的框架如图3所示。
(1) 提取算法
(1) 将宿主视频按4×4分块, 并进行整数DCT变换;
(6) 重复上述操作直到将秘密信息提取完毕为止;
(2) 交织和纠错解码;
(3) 视频解码。
2 实验结果
实验中, 采用CIF (352×288) 格式视频序列News、Forman、Mobile作为宿主视频, 秘密视频为QCIF (176×144) 格式的视频序列Forman。视频编码采用H.264/AVC编解码参考软件JM8.6, 编码模式采用IPPPPP…的格式。
表2列出了3组不同运动强度视频序列为宿主视频的仿真实验结果, 其中PSNR/dB、TIME/s、BER/%分别表示利用参考文献[3]算法以及本文算法嵌入秘密信息前后载体图像的峰值信噪比、嵌入算法所需的时间和宿主视频经过编码后接收端提取秘密信息的误码率。QP表示编码宿主视频时的量化步长。
当秘密视频未编码时, 隐藏1帧QCIF视频信息需要48帧CIF宿主视频。按照参考文献[3]的算法提出的秘密视频效果图如图4所示。其中参数N、PSNR分别代表每48帧宿主视频隐藏的秘密视频帧数和接收端提取的秘密视频的峰值信噪比, QP表示宿主视频编码时的量化步长。
由于本文算法对采用了压缩和纠错编码, 隐藏视频的帧数与秘密视频编码的步长和BCH的参数有关。当QP=16时, 编码后的秘密视频的PSNR=45.82 dB, 实验结果如图5所示。
从以上的仿真实验可以看出, 应用本文的所提出的算法后, 嵌入隐藏信息的混合视频信号与原始视频几乎没有什么差别, 达到了隐藏信息透明的要求。从表2的实验数据中可以看出, 在相同压缩比的情况下, 本文的算法较之于参考文献[3]的算法缩短了嵌入所需的时间, 且误码率平均减少了76.6%, 具有更好的抗压缩性能。而当综合采用编码和隐藏算法后, 本文算法的优越性进一步凸显, 从图4、图5的实验仿真效果图中可以看到, 在相同压缩比的情况, 隐藏帧数提高了5~11倍, 并且接收端提取秘密信息的质量也获得了明显改善。
本文提出了一种视频压缩码流在视频中嵌入的方案, 为了避免视频压缩码流对误码敏感的缺点, 在隐藏算法上采用了高比特率的鲁棒算法, 通过修改视频的亮度分量Y在变换域中的直流系数来嵌入秘密信息;同时秘密信息在嵌入前采用预处理的策略, 即先对秘密视频进行压缩编码、纠错和交织编码等预处理。通过实验数据可以看出本方案所提出的视频嵌入视频的方法提高了隐藏的帧数及接收端提取秘密信息的质量, 实现了隐秘视频的高效传输, 为视频嵌入视频提供了一种新的思路。
参考文献
[1]LI Y, CHEN H.-X, ZHAO Y.A new method of data hiding based on H.264 encoded video sequences[J].IEEE Int.Conf.Signal Processing, 2010:1833-1836.
[2]ALY H A.Data hiding in motion vectors of compressed video based on their associated prediction error[J].IEEE Trans.Inform.Forensics Security, 2011, 6 (1) :14-18.
[3]YANG M, BOURBAKIS N.High bitrate multimedia information hiding for digital image/video under lossy compression[J].SPIE Journal of Electrical Imaging, 2007 (16) :1-12.
[4]HU Y, ZHANG C, SU Y.Information hiding based on intra prediction modes H.264/AVC[J].In Proc.IEEE Int.Conf.Multimedia and Expo, ICME, 2007:1231-1234.
[5]Ma Xiaojing, Li Zhitang, Tu Hao, et al.A data hiding algorithm for H.264/AVC video streams without intra-frame distortion drift[J].IEEE Trans.Circuits Syst.Video Technol., 2010, 20 (10) :1320-1330.
[6]SWANSON M D, ZHU B, AHMED T H.Date hiding for video-in-video[C].Proceed-ings of the 1997 International Conference on Image Processing.Sanata Barbara′CA, IEEE Comput Soc, 1997 (2) :676-679.
视频音频 篇8
1 资讯传播的无缝化
网络传播的最大优势就是传播速度快, 信息更新交替周期短。视频网站是人们除电视、报纸之外另一个了解新闻资讯的重要平台。酷六网可以对最新最近发生的事件以声、文、图、像的方式快速发布, 不需要像电视那样需要在特定的时间, 特定的栏目进行传播。只要有最新的新闻资讯事件, 平台就可以对其作出迅速的反应, 并对其进行广泛的传播, 使网络信息传播的时效性得到凸显。网络可以随时“刷新”信息, 在实效性上远远超越传统媒体。新闻资讯栏目的视频更新速度尤为突出, 在新闻事件上的报道突破了传统传播媒体的时间限制, 突出了新闻报道的时效性。对于热点新闻的报道, 电视的新闻报道内容一般是以小时来更新, 报纸则是以一天时间来更新, 而酷六网的报道则是没有时间限制的, 它能以最快的传播速度传播新闻事件, 让大众及时了解事态。酷六网的新闻资讯信息覆盖面广, 报道内容广泛, 内容多、来源广、载体多样化, 内容来自于全球, 同时也全球传播。这给网友在信息的获取上带来了更多的选择, 网友在内容的选择、了解上具有完全的自主权, 传统的传播媒体受限于节目编排时间等因素, 对于新闻报道的事件大多数是以报道特大、重大新闻事件为主, 一些新闻时间往往被忽略, 从而造成了大众缺失对社会百态的进一步了解, 大众对自己所关注的新闻事件各有不同, 传统传播媒体又无法满足大众的这种需求。而在酷六网上, 新闻事件的报道是十分全面的, 军事、外交、财经等新闻资讯让大众了解最新的环球新闻、社会动态。以“拉登之死”新闻为例, 这条新闻是国际性的新闻事件, 酷六网在该新闻的报道上和电视直播几乎是同步报道, 酷六新闻版块为大众提供了另一个了解平台的同时, 也为错过及时观看新闻的网友提供点播回看功能, 不需要时间上的等待。更为重要的是网站还提供了一系列的关于“拉登之死”其他方面的新闻报道, 如“拉登自拍视频”、“拉登活捉后被打死”等为网友进一步了解这一新闻事件提供了更多的视角。
2 娱乐多元化
与传统电视娱乐节目不同, 娱乐内容具有自身的优势, 它首先扩展了娱乐的范畴, 一般的娱乐节目主要包括选秀、才艺表演、明星座谈等, 如《超级女声》、《中国达人秀》等节目, 这些节目娱乐形式较为单一, 涵盖面较窄。酷六网的娱乐内容则是以“独立观点, 娱乐精神"来传播娱乐信息。它不仅涵盖了传统的娱乐观念, 同时开辟了新的娱乐精神, 如”真人秀”、“原创音乐”“动漫”“潮人偶像”等娱乐内容, 这些娱乐内容贴近百姓生活, 多样的娱乐信息也给大众在娱乐爱好上提供了一定的选择空间, 投其所好, 以大众娱乐消费心理为基础, 娱乐大众。其次, 网友是娱乐节目的核心, 网络娱乐节目的主持人是网友自己。网友在娱乐节目的制作、分享上具有完全的自主性, 网友可以自娱自乐, 也可以与大家同乐, 只要自己喜欢, 各种娱乐形式的内容都可以在网站上发布分享, 以“原创频道”为例, 该频道与中央电影学院、戏剧学院、中国传媒大学等多所高校合作为广大学子提供了一个良好的展示平台, 大家可以充分发挥自己的才能, 同时与网友一起分享, 与网友同乐。酷六网通过全民参与的娱乐形式, 实现多点式网状的群体式传播, 它为大众提供了一个充分的娱乐空间, 没有任何限制, 人人都可参与, 没有演员与观众之分, 网友是娱乐的创造者, 同时也是娱乐的消费者。搞笑频道是酷六网全民参与性最强的频道, 频道内容花样繁多、趣味横生。该频道的“配音之新白娘子传奇”结合当前百姓关注的民生事件对电视剧重新配音, 把当下的一些民生百态以娱乐的方式表达出来, 得到了网民热烈的回应, 该系列节目的“第十季之天愁人怨买房难”上传3天的点击率就为355.3万, 网友纷纷发表对此视频内容的评论, 在娱乐的同时共议民生, 对当前社会出现的买房难问题发表自己的看法与见解。
3 点播自由化
说到观看电影、电视综艺节目, 大众的第一意识可能是通过电影院、电视机接收观看, 这些媒介是人们日常生活观看这类节目的主要途径。观众接收观看需要等待这些媒介在时间上的安排, 对自己所喜爱的电视节目, 电影不能自由的选择与观看, 完全处于被动的接收位置。这种单一的具有局限性的视频传播方式, 传播渠道狭窄, 传播质量也往往不尽人意。中国互联网络信息中心 (CNNIC) 2010年4月发布的《2009年中国网民网络视频应用研究报告》显示, 有66.8%的网络视频用户表示, 与以往相比观看电视的时间明显减少, 其中有23.7%的用户表示现在基本不使用电视收看电视台的节目。56.7%的网络视频用户认同对互联网的依赖要超过电视, 其中有26.9%的人对这一描述非常认同。网络视频如此受欢迎, 其重要的一个特点就在于它的点播自由化。网络视频节目打破了传统的时间束缚, 不需要时间上的等待, 网友可以自由选择自己喜欢的视频内容, 即点即播。无论是电影, 电视剧, 还是各类综艺节目, 云中剧场几乎都可以满足网友的需求, 视频点播观看更加的人性化。内容自己选择, 话语权、选择权完全属于网友。以“电影频道”为例, 该频道包含了最新上映、新片预告、首播院线内地港台最新更新等影视节目及影视资讯。海量的片源给网友足够的选择空间的同时, 高画质的视频也极大的满足了网友的视听享受。云中剧场是一座独立的影视基地, 没有门票, 只有属于“看客”的选择权利, 看你想看, 一切自己掌握。
4 信息交互化
信息的交互是互联网与生俱来的特性, 其交互性是指互联网媒体带来了传受双方的双向互动传播。信息传播的及时性、以及交流的自主性、交互性得到凸显, 传统的报纸、广播、电视等媒体是一种单向、线性的传播模式, 而在网络信息传播中, 传播者和受众是自由的个体, 每个人都可以成为信息的传播者与接收者, 主体地位得以体现, 实现了无时空限制的交流。酷六以一种网络媒介的方式为信息交互的双方联结纽带, 发布者通过以主导者的方式来发布自己所喜爱的内容, 网友同时对其所发布的内容作出评价, 并且网友还可以对自己所关注的内容进行转载发布, 这些内容可以发布到任意网站, “人人网”、“腾讯微博”、“QQ朋友”、“天涯论坛”等等都是信息转载发布的目的地。这种行为方式不仅可以使更多的人分享到视频内容, 更重要的是在这个过程中传播的效果明显增强, 这种网状的传播模式, 不断延伸传播, 增强了信息之间的相互交流与沟通。
随着网络传播平台的迅速发展, 大众文化娱乐观念的不断变化, 加之“优酷网”、“土豆网”等具有相同经营业务网站的激烈竞争压力, 酷六网在栏目上进行了大刀阔斧的改革, , 其中最主要的是2010年成立了旗下网站“酷六剧场”, “酷六剧场”为网友提供了丰富的正版内容;独家的网播剧与最新的影视报道, 获得了巨大的反响, 它与酷六网并肩发展, 为用户提供一流的内容、观看体验与互动社区。其形成的连锁反应使更多的人来关注酷六网, 吸引了更多的网友、商家。随着“酷六剧场”的快速发展, 继而又推出了“酷六高清频道”。以及为视频点播服务而开发的点播软件“急速酷六”。为用户提供了更加快捷、方便的点播体验。抓住大众的心理, 站在娱乐、资讯的前沿来进行节目内容创新。
摘要:酷六网是以传播、分享视频为主的网站, 在众多的视频网站中独树一帜, 本文即从其核心的内容入手, 旨在总结其视频内容特征。
关键词:视频网站,酷六网,特征
参考文献
视频音频 篇9
一、音频与视频产业的现状
不同类型的音频和视频产业由于拥有不同的受众和内容, 经营的状况也就各不相同, 盈利模式不同当然就会呈现不同的发展状况, 这也是这个产业面临的共同现状。
(一) 音频与视频市场规模的壮大
因为技术的革新, 传播渠道和通用的高质量声音识别技术随之产生, 使人们的听觉和视觉需求得到了更好的满足。革新了传统市场, 就会出现新市场, 音频和视频的市场也会不断扩大, 网络音乐的快速发展充分见证了这一点。在娱乐基础上发展的车载娱乐系统势不可挡, 而提供听觉和视觉享受的音频和视频内容将有很大的作为。
(二) 多样化、移动化和智能化的渠道终端显现
传统传输渠道的方式日渐变少, 随着技术的革新, 产生了新的且能将内容融合的移动化终端和智能化终端。那些传统的广播居家收听的比例逐渐削弱, 而移动收听尤其是车上的收听比例逐渐增多。据调查显示, 手机、便携式的收音机以及车载的收音系统是位居前三的收听终端。
(三) 较少的版权直接收益和创新化的商业模式
单曲的网络销售和付费收听等版权的直接付费模式在国内还没有形成, 通常情况下, 商家提供免费的版权内容, 而衍生利益则是通过创新商业模式获得。当下, 国内的音频和视频产业运营的模式主要有以下四种:第一, 增值服务模式, 就是为用户提供免费的音频和视频内容, 并根据额外服务收费;第二, 提供免费音频内容并进行新产品销售;第三, 第三方付费的模式, 也就是利用免费的音频内容来吸引和固化用户群, 然后第三方替用户的注意力买单;第四, 把音频内容服务作为基础, 目的是寻求其他的商业机会。
二、新媒体时代视频与音频的商业模式研究
随着互联网的迅速发展, 以互联网媒体传播为平台的新媒体也在迅速发展。例如, 博客、音频的博客、视频的维克等新技术, 都充分利用了互联网技术。各种新媒体的出现加剧了竞争, 所以, 对商业模式进行研究就显得尤为重要。
(一) 利用渠道和终端在原来的基础上扩大音频和视频市场规模
音频和视频要取得发展就不能离开渠道终端, 如手机、电脑等市场的发展。我国的手机市场规模是相当强大的, 据相关统计, 我国的设备和渠道终端也将继续扩大, 也就为以渠道终端为基础的音频和视频商业的发展提供了必要的条件。所以, 为进一步扩大音频和视频市场, 发展音频和视频产业是可以有所期待的。
(二) 提供的内容服务个性化和针对化
随着服务市场的逐渐扩大, 要想获得忠实的用户, 就要对用户进行细分, 提供多元化的服务, 加强互动性, 从而实现此目的。要根据用户需求的差异性提供个性化和差异化的服务, 满足不同用户的不同需求, 只有满足了用户的独特需求, 才能留住用户, 从而实现稳定的发展。
(三) 进行商业模式创新, 技术突破
有激励作为动力才能产生新颖的内容。对于盈利模式来说, 由于全民版权意识的增强和消费观念以及法律环境的变化, 为内容交付费用的形式即将到来, 所以版权收费就名正言顺了。在这种形式到来之前, 增值服务、第三方付费等音频及视频内容的间接性收费模式会继续存在。而其他方面的创新也是极为重要的, 网络视频和音频作为新型的媒体形式, 更要注重创新, 首先是技术的创新, 不断超越自我, 为用户提供更多的利益和体验。再者就是内容的创新, 内容新颖才能吸引更多的用户。还有就是媒体的盈利模式和广告模式也要进行创新, 可以利用创作的音频和视频进行宣传。
(四) 加强品牌建设
在生活水平不断提高的今天, 品牌的影响力日趋重要, 打造独特的品牌可以得到更多用户的关注。视频和音频的发展也要建立属于自己的品牌体系, 包括母品牌和子品牌, 利用母品牌的发展带动子品牌的发展, 同时将经营范围和盈利模式不断扩展。有了自己的品牌, 利用其影响力来发展的方式更加有效。
总之, 在新媒体时代下, 视频和音频的商业模式发展更加突出。而如何在各种媒体不断涌现的压力下提升自己的实力以及影响力, 赢得用户的青睐, 品牌建设是一条有效的途径, 再结合优质的内容和个性化、创新化的服务和产品, 相信视频和音频产业的发展前景将更加广阔。
摘要:在新媒体时代, 视频与音频的市场规模逐渐壮大, 渠道和终端的发展方向呈多样化和移动化, 而且内容趋向多元化、个性化以及交互性。在未来, 那些个性化、有针对性的声音和音频内容服务会变得越来越平常, 商业模式也在创新中不断发展。当然, 商业的发展离不开市场, 在充分了解市场的基础上, 把用户的需求作为出发点将内容优质化、多元化, 在全媒体和多介质传播的背景下完成升级服务模式。此外, 在符合我国的相关法律规定的同时, 创立属于自己的品牌, 自身版权的利益用技术手段和法律手段加以维护, 并且将创作者和社会公众的利益相结合, 从而实现商业价值最大化。
关键词:新媒体,视频与音频,品牌,创新
参考文献
[1]肖叶飞.跨媒体经营的路径选择与范围经济效应[J].新闻研究导刊, 2012 (3) :63-65.
[2]吴澄, 吴晓明.新媒体新闻的演变与社会舆情表达[J].徐州师范大学学报 (哲学社会科学版) , 2011 (5) :142-148.
[3]梁陈智, 朱广明, 黄伟.网络新媒体业务发展的思路与对策[C].第八届全国互联网与音视频广播发展研讨会, 2008:1-7.
数字音频压缩编码及音频播放器制作 篇10
1 音频信号处理基本概念
1.1 模拟音频与数字化音频
自然的声音是连续变化的, 它是一种模拟量。比如当人们对麦克风讲话时, 麦克风能根据它周围空气压力的不同变化而输出相应连续变化的电压值, 这种变化的电压值是对人讲话声音的一种模拟, 称为模拟音频。要将模拟音频变为计算机能存储和处理的对象, 必须将模拟音频数字化。
数字化音频的获得是通过每隔一定的时间测一次模拟音频的值并将其数字化, 通常包括采样、量化和编码。每秒钟采样的次数称为采样频率。根据采样定理, 只要采样频率等于或大于模拟音频信号中最高频率成分的两倍, 信息量就不会丢失, 即可以由采样后的离散信号不失真地重建原始连续的模拟音频信号, 否则就会产生不同程度的失真。采样定律用公式表示为:fs≥2F或Ts≤T/2, 其中f为被采样信号的最高频率。
由模拟量转变为数字量的过程称为模-数转换。计算机要利用数字音频信息驱动扬声器发声, 还需要将离散的数字量再转变为连续的模拟量, 该过程称之为数-模转换。在大多数计算机中, 这些功能是通过声卡来完成的。音频信号的一般处理如图1所示。
1.2 数字化音频信号的压缩编码
1.2.1 数字化音频信号压缩编码简介
数字化的音频信号必须经过压缩编码处理才能适应存储和传输要求, 才能在再生时得到最好音质的声音听觉。音频信号压缩编码主要依据人耳的听觉特性。人的听觉系统中存在一个听觉阈值电平, 低于这个电平的声音信号人耳听不到, 可以不必保留这部分信号;当几个强弱不同的声音同时存在时, 强声使弱声难以听到, 当声音在不同时间先后发生时, 强声使其周围弱声难以听见。声音编码算法就是通过这些特性来去掉冗余数据, 从而达到压缩数据的目的。
一般来讲, 根据压缩后的音频能否完全重构出原始声音可以将音频压缩编码技术分为无损压缩及有损压缩两大类。无损压缩包括不引入任何数据失真的熵编码;有损压缩包括波形编码、参数编码和同时利用这两种技术的混合编码方法。波形编码利用采样和量化过程来表示音频信号的波形, 使编码后的波形与原始波形尽可能匹配。波形编码的特点是在较高码率的条件下可以获得高质量的音频信号, 适合对音频信号的质量要求较高和高保真语音与音乐信号的处理。典型的波形编码包括脉冲编码调制 (PCM) 、差值量化 (DPCM) 、自适应量化 (APCM) 、自适应差值量化 (ADPCM) 等。参数编码把音频信号表示成某种信号的输出, 利用特征提取的方法抽取必要的模型参数和激励信号的信息, 并对这些信息编码, 最后在输出端合成原始信号。参数编码的压缩率很大, 但计算量大, 保真度不高, 适合于语音信号的编码。典型的参数编码有线性预测LPC编码等。混合编码介于波形编码和参数编码之间, 集中了这两种方法的优点。典型的混合编码有多脉冲线性预测MP-LPC、码本激励线性预测CELP等。
1.2.2 常见音频压缩编码方式
常见的音频压缩编码有MPEG-1音频压缩编码、MPEG-2音频压缩编码、杜比数字AC-3音频压缩编码等。
(1) MPEG-1音频压缩编码
ISO/IEC的MPEG音频编码的标准化采用了两种编码算法:MUSICAM和ASPEC。以这两种算法为基础形成了3个不同层次的音频压缩算法, 对应不同的应用要求并具有不同的编码复杂度。在MPEG-1的音频编码标准中, 按复杂度规定了3种模式:层1、层2、层3。层1采用MUSICAM算法, 典型码流为384kbps, 主要用于小型数字盒式磁带。层2等同于MUSICAM称为掩蔽模式通用子带集成编码与多路复用, 典型码流为256kbps~192kbps, 广泛应用于数字音频广播、数字演播室等数字音频专业的制作、交流、存储和传送。层3是综合了层2和ASPEC的优点提出的混合压缩技术, 它的复杂度相对较高, 编码不利于实时, 主要应用于因特网上高质量声音的传输。如今流行的MP3音乐就是一种采用MPEG-1层3编码的高质量的数字音乐, 它能以10倍左右的压缩比降低高保真数字声音的存储量, 使一张普通的CD光盘上可以存储大约100首MP3歌曲。层3是MUSICA和ASPEC两个算法的结合, 典型码流为64kbps。
MPEG压缩等级与压缩比率如表1所示。
ISO/MPEG音频编码 (层3) 结构图如图2所示。
MPEG-1层3中采用改进余弦变换MDCT。MDCT的表达式为:, 其中k=0, …, N/2; (固定时间偏移量) 。余弦变换在边界处存在固有的不连续性, 导致在块边界处产生较大噪声, MDCT采用域混叠抵消TDAC技术, 有利于消除这种噪声。做MDCT前要进行加窗处理: (是窗函数, 它的长度等于变换块N的长度) , 从而降低边界效应对谱分析的影响, 提高频率选择性。窗函数的选择必须满足。窗函数越长, 编码效率就越高, 但是过长会使时域分辨率下降, 选择窗函数应该兼顾编码效率和时域分辨率。
PCM数据输入经过分析滤波组被分割成若干子频带信号, 同时数据流经过FFT变换模块, 动态求出每个编码频带的掩码阈值。MDCT对滤波器组的不足作了一定的补偿, 把子带的输出在频域里进一步细分以达到更高的频域分辨率。比例设置和量化器模块根据掩码阈值对子频带信号进行量化, 量化后得到的数据分别经过Huffman编码模块和边信号编码器模块进行编码, 再经过多路复用器MUX得到码流。
(2) MPEG-2音频压缩编码
MPEG-2的音频压缩编码采用与MPEG-1相同的编译码器, 层1、层2、层3的结构也相同, 但它能支持5.1声道和7.1声道的环绕立体声。
MPEG-2 BC是一种类似MP3的音频压缩算法。MPEG-2BC压缩编码主要是在MPEG-1和CCIR Rec.755的基础上发展起来的。与MPEG-1相比较, MPEG-2主要在两方面做了重大改进, 一是支持多声道声音形式;二是为某些低码率应用场合, 进行低采样率扩展。同时, 标准规定的码流形式还可与MPEG-1的第1和第2层前、后向兼容, 并可依据CCIR Rec755与双声道、单声道形式的向下兼容, 还能够与Dolby Surround形式兼容。
MPEG-2 AAC是MPEG-2标准中的一种非常灵活的声音感知编码标准。就像所有感知编码一样, MPEG-2 AAC主要使用听觉系统的掩蔽特性来减少声音的数据量, 并且把量化噪声分散到各个子带中, 通过全局信号把噪声掩蔽掉。在MPEG-2的正式听音测试中, 数据流速率为320kbps的AAC可以提供比数据流速率为640kbps的MPEG-2 BC更好的音质。因此AAC是一种比MPEG-2 BC编码算法更好的音频压缩算法, 而且可以适用于各种环境下, 如可以做电视信号的伴音等。它的主要缺点是后向兼容性不好。
(3) 杜比数字AC-3音频压缩编码
杜比数字AC-3是美国杜比实验室开发的多声道全频带声音编码系统, 采用第三代ATC技术, 被称为感觉编码系统, 它将特殊的心理音响知识、人耳效应的最新研究成果与先进的数码信号处理技术很好地结合起来, 形成了这种数字多声道音频处理技术。它提供的环绕立体声系统由5个 (或7个全频带声道加一个超低音声道组成, 所有声道的信息在制作和还原过程中全部数字化, 信息损失很少, 细节十分丰富, 具有真正的立体声效果, 在数字电视、DVD和家庭影院中被广泛使用。
AC-3编码原理结构图如图3所示。
PCM数据流经分析滤波器组变换成频域信号, 频谱信号以二进制浮点形式表示, 将频谱信号的指数和尾数部分分别处理。指数部分由频域包络模块处理, 采用差分编码, 编码后的指数部分代表整个信号的频谱, 可以作为频谱包络参数, 供比特分配模块处理, 从而动态求出比特分配信息。尾数部分按照比特分配信息进行量化编码, 量化编码后的尾数与频谱包络编码数据流一起按照AC-3数据帧打包组帧, 形成AC-3码流。
1.3 声音的重构
模拟音频要经过采样、量化和编码, 就能得到便于计算机处理的数字语音信息, 如果要重新播放数字化语音, 必须经过解码、D/A转换和插值, 其中解码是编码的逆过程, 又称解压缩。以ISO/MPEG音频解码 (层3) 为例, 结构图如图4所示。D/A转换是将数字量再转换为模拟量便于驱动扬声器发声;而插值是为了弥补在采样过程中引起的语音信号失真而采用的一种措施。声音重构的一般过程如图5所示。
2 音频播放器简介
文中介绍的音频播放器如图6所示, 该音频播放器能实现mp3、wav、mid、wma等格式音频文件的播放。
3 音频播放器制作过程
3.1 音频播放器制作中所需控件及变量设置
3.1.1 所需控件
TMediaPlayer控件 (可以通过MCI播放多种多媒体文件, 如mid、mp3、wav、cd音乐文件和avi、wmv文件等) 、3个TEdit控件 (分别显示正在播放文件的时间进度、正在播放文件的信息、重复播放区域的设置) 、若干TBitBtn控件 (用于对文件进行操作) 、TListBox控件 (用于显示播放列表) 、TTrackBar控件 (用于控制播放的音量和播放的进度) 、以及TTimer控件和TOpenDialog控件。
3.1.2 设置变量
说明:在程序代码中出现的其他变量为控件中的局部变量。
在Form中设置全局变量:
3.2 音频播放器各功能模块
在此仅介绍较为复杂的功能。
3.2.1 文件打开
该模块的功能是打开若干需要播放的文件, 并把这些文件加载到ListBox当中, 形成播放列表。若列表框中无任何文件, 则直接将打开的文件加载到列表框中;若列表框中已有文件, 则将打开的文件与列表框中已有的文件逐个进行比对, 判断文件是否已经加载过, 若已经加载过, 则不加载。在此功能模块中, 需要利用数组变量SongDir记录加载进去的文件的路径 (不包括文件名) , 并利用变量addfileflag判断是否为第一次添加播放文件, 如果是则自动选中播放列表中的第一首歌曲并显示该文件的信息, 同时改变变量addfileflag的值, 保证以后添加进去的播放文件不影响正在播放的文件。文件打开功能模块处理流程如图7所示。
3.2.2 静音
该模块的功能是在播放文件时, 按下此按钮, 则产生静音效果, 再次按下时, 声音恢复, 从而实现静音的功能。实现此功能需要在该模块程序中控制变量sound_sign的变化。该功能是通过Windows API函数waveoutsetvolume来实现, 在使用该函数之前, 必须引用mmsystem单元, 并且为该按钮在静音和非静音时加载不同的图片, 从而清楚地显示声音处于何种状态。
3.2.3 设置播放
设置重复播放的开始位置功能, 设置重复播放的结束位置功能, 清除重复播放区域, 播放重复区域功能:
(1) 设置重复播放的开始位置主要需要将TrackBar2.Position即播放的当前位置记录在变量startpos1中, 并将开始时间点显示在Edit3当中。部分程序代码及说明如下:
设置重复播放的结束位置主要需要将TrackBar2.Position即播放的当前位置记录在变量endpos1中, 并将结束时间点显示在Edit3当中。部分程序代码及说明如下:
运行时设置好的重复播放区域如图6中A所示。
(2) 在显示设置的开始时间点和结束时间点时, 需要用到自定义函数calculate () , 该函数的功能主要是根据提供的播放进度, 将其转换为时间格式的字符串, 以方便显示。播放进度是以毫秒 (Milliseconds) 为计数单位的。输入播放进度, 返回字符串类型的时间数。该自定义函数calculate () 在后面讲述的歌曲信息的显示以及文件播放时间进度的显示中也有重要的应用。
(3) 清除重复播放区域主要需要将变量startpos1、endpos1设置为0, 并将播放模式变量mode设置为0, 即正常播放模式。
(4) 播放重复区域主要用到TMediaPlayer控件的StartPos、EndPos、Position属性以及Play方法。StartPos属性设置为StartPos1, EndPos属性设置为EndPos1, Position属性设置为StartPos1, 并将播放模式变量mode设置为1, 即重复播放指定区域模式。
(5) 在制作播放器时, 需要引进一个重要控件—计时器TTimer, 该控件的Interval属性设置为1000, 计时器的主要功能是显示文件的播放时间进度 (如图6中C所示) 、根据播放模式进行播放 (如果是重复播放指定区域模式且当前播放位置超过指定结束位置时, 从指定开始位置重复播放;如果是正常播放模式且歌曲播放结束, 在该首歌曲不是最后一首的情况下, 自动播放下一首歌曲, 从而实现自动播放下一首歌曲功能) 。在上述的播放、暂停、停止、清除重复播放区域功能中都需要在程序中设置TTimer控件的Enabled属性, 控制计时器TTimer是否工作。
3.2.4 删除
逐个删除歌曲播放列表中歌曲的功能, 全部删除歌曲播放列表中歌曲的功能。
实现逐个删除功能需要判断ListBox1中的歌曲条目是否处于选中状态, 如处于选中状态, 则调用ListBox1的Delete方法来完成选中歌曲的删除。实现全部删除功能只需要利用ListBox1.Clear即可。
3.2.5 歌曲信息显示
歌曲信息的显示主要是通过调用自定义过程ShowInfo (Sender) 来实现的。自定义过程ShowInfo (Sender) 主要需要设置TMediaPlayer控件的FileName属性、调用TMediaPlayer控件的Open方法、在窗体的标题栏上显示完整的文件路径、调用自定义函数calculate () 在Edit2中显示文件的时间长度及文件名、设置全局变量startpos和endpos的值、设置TrackBar2的min和max属性。歌曲信息的显示如图6中B所示。
3.2.6 自动加载历史播放记录
在实际情况中, 媒体播放器都是应该有记忆功能的, 即保存文件播放列表, 在下次打开播放器的时候自动加载该列表。要想实现这一功能, 需要在退出程序的时候, 将文件播放列表保存到INI文件当中, 当再次运行程序时, 从INI文件中读取信息即可。在Delphi中提供了TIniFile类用于操作INI文件, 该类在inifiles单元文件中, 在使用该类文件时, 需要引用inifiles单元。
在窗体关闭过程FormClose (FormClose过程需要映射为OnClose) 中, 需要在该项目生成的可执行文件目录下创建名为-----recentplay.ini的文件, 用于存放播放列表。并将每首歌曲的文件路径 (不包括文件名) 、每首歌曲的文件名、播放列表中文件的总数记录在recentplay.ini文件中。保存文件播放列表处理流程如图8所示。
在创建窗体过程FormCreate中, 判断recentplay.ini文件是否存在, 如果存在的话, 将recentplay.ini中保存的文件名逐个加载到列表框中, 同时利用数组变量记录每个文件的路径 (不包括文件名) 。最后还需要设置变量addfileflag的值, 保证以后添加进去的播放文件不影响正在播放的文件, 并自动播放历史记录中的第一首歌曲。加载历史播放记录流程如图9所示。
在创建窗体过程中还需要设置初始音量的大小、播放模式变量mode、静音标志变量sound_sign、暂停标志变量flag的初始值。
4 结语
随着经济与科技的飞速发展, 促使计算机技术和电子技术的发展突飞猛进。音频信号的处理做为多媒体处理的一个重要分支, 已经深入到人们的工作、学习、生活当中。可根据不同的应用场合或者不同的技术要求, 采用不同的数字音频压缩编码技术。我们在音频信号处理方面的研究仍待继续深入, 提出新的数字音频压缩编码方法或者改进现行的压缩编码方法以适应实际应用的需求。文中利用应用软件Delphi设计的音频播放器, 经过调试和测试, 实现各种音频文件的播放和文中所述的各种功能, 具有一定实际应用价值。
摘要:结合应用软件——Delphi, 介绍制作音频播放器的过程, 并利用音频播放器实现mp3等格式音频文件的播放。该音频播放器具有处理重复播放区域、删除歌曲播放列表中歌曲、歌曲信息以及播放时间进度的显示、自动播放下一首歌曲、自动加载历史播放记录等诸多功能。
关键词:音频信号,数字音频压缩编码,音频播放器
参考文献
[1]陈洪光, 林嘉宇, 易波.数字音频压缩技术研究[J].通信技术, 2000, (2) :68-71.
相关文章:
音频元数据01-10
3家庭防火安全教育教案01-10
新型城市交通枢纽研究01-10
学生自我教育问题刍议01-10
视音频监控01-10
学校防火安全教育教案01-10
大班防火安全教案01-10
大班安全防火教案01-10
防火自救安全教育教案01-10
防火自救安全教育班会教案01-10