关键词:
图像生成(精选九篇)
图像生成 篇1
关键词:视差,汇聚与调节冲突,立体融合区,深度获取
0 引 言
近几年来,立体显示技术发展迅速。其中基于视差的立体显示方式因为其技术成熟、实现价格相对低廉,已快速进入市场,在立体电视技术中发挥着主要作用。
立体图像内容的制作成为影像技术市场的一个发展热点,但是除少数作品外,大多数并没有获得很好的观众反映。其中重要的原因是,对于当前普及的视差立体显示方式[1],要得到良好的深度感,其中的视差信息往往需要经过反复的调整,而且这些调整通常只能以实验者的主观感受为准[2]。
关于这方面已有的相关研究[3,4],主要集中在确定视差的限制范围上,很少提及具体修正方法。本文除了分析立体图像技术相关的生理学限制,计算出视差允许范围外,还进一步结合立体图像生成方法和人眼跟踪技术,提出了一种用可实时检测和修正虚拟场景的视差错误的方案。
1 视差的生理学限制
1.1 立体视差错误
立体图像的视差错误主要包含2方面:
(1) 生理视觉暗示与心理视觉暗示的冲突,如违反近大远小规则、违反遮挡原则等。这些问题一般只存在手工绘制的立体图像当中。
(2) 深度受限。主要原因是视差立体显示器只有一个屏幕来显示图像,所有不同“深度”的物体都是从同一平面上感知到的,这与人类日常积累的观察规律相违背。因此,在生理上就要求立体图像满足一定要求。下面介绍较为常见的2种生理学限制。
1.2 汇聚与调节冲突
观众在观看立体显示器时,视线必须聚焦在屏幕上,而感觉到的深度却可能深入或浮出屏幕。
一旦这种变化超过一定限度,就会引起“汇聚/调节”冲突[5]。如图1所示。其中的Z为观察深度,E为用户两眼间距,取标准值6.5 cm,N为最大出屏距离,F为最大入屏距离。相关研究[6]结果表明,通常情况下,人类能够忍受的最大正位汇聚角偏差为Δθ1=1.57°,负位偏差为Δθ2=4.93°即必须满足:θN-θ<Δθ2和θ-θF<Δθ1。
以观察位置处于屏幕正前方的Z正轴上来计算最大与最小线视差。根据图1可以求得关系:
进一步可以算出在屏幕面上的线视差大小:
1.3 Panum融合区
当双眼注视一个外界物体时,另外一个远于或近于双眼单视界的物体,虽然没有刺激到左、右眼视网膜的对应点上,但只要刺激在两个视网膜对应点附近的一定范围内,也可以在大脑中产生单一的立体视觉。这一现象在1858年由丹麦生物学家Panum首次报道[7]。
视网膜对应点附近这个很小的范围就叫作Panum融合区(Panum Band)。如果几个物体刺激两个视网膜形成的像的视差过大,便会出现复视。关于Panum融合区对视差的限制关系,见图2所示。
观看者在观看立体图像时,设Z为观看者与电视屏幕之间的距离,I是在观看者大脑中形成的双眼单视的图像点深度。
当Z与I之间的距离差超过一定限制时,调节所提供的深度暗示将起主导作用。此时双眼视差异所提供的深度暗示无法被融合成单一的立体图像[3]。试验表明[8],不能超过的限制为:
式中:η为体视锐度,有实验给出其典型值[9]为10′;D为人眼瞳孔的直径,取典型值4 mm。
观众感觉到的深度与屏幕线视差d的关系见式(4)。当d是一个已知量时,可以求出I的值,并将其带入式(3)中检验是否符合Panum融合区的要求。
2 立体图像生成的参数计算
2.1 立体图像生成流程
使用计算机生成立体图像,常用的手段是使用图像引擎,如OpenGL,Direct 3D。首先在虚拟的三维空间中建立包含所有待显示物体的三维系统,然后使用两架虚拟相机从不同的角度拍摄,从而得到具备视差的图像。在这一过程中,必须注意虚拟相机坐标系与实际观察坐标系之间的转换关系,其中的数学变换关系在文献[10]中有详细叙述。
在图像绘制时,虚拟坐标系中的点(x,y,z),通过一系列的OpenGL函数操作[11],转化成以像素为单位的屏幕坐标系上的点(xs,ys)。
如果在虚拟坐标系中使用另外两架相机对同一个场景作立体拍摄,那么就会得到同一个点(x,y,z)的两个对应像点。进而使用双目立体视觉的计算方法,可以逆向求出观察坐标系中的三维坐标(X,Y,Z)。
2.2 视差计算
设相机坐标系中(x,y,z)对应的二维点是(xsL,ysL)和(xsR,ysR),存在关系公式(5):
那么最后用户观察到的水平视差如公式(6):
式中ws表示屏幕的物理宽度;wA表示屏幕的x轴最大像素分辨率。
2.3 用户深度信息获取
实验中使用人眼检测程序[12]来获取用户的深度信息,见图3。
一般来说人眼跟踪算法所能得到的是左、右两眼的x,y方向坐标,进而用式(7),求出两眼间距为L。
假设两眼间距为E,摄像头中的投影距离为F,存在公式(8)。
因为E,F都是定值,进而推出:
2.4 模型深度信息获取
3D场景的深度信息可以使用OpenGL的缓冲区对象来获得[11]。具体方法见式(10):
式中:z1是存储在缓存中的数据;z是实际的距离。
从式(10)中可知,z与z1是呈反比例变换的关系,其最大最小值是相互对应的。因此并不需要对整幅画面做反变换,便能找到虚拟坐标系下的深度极大、极小点。
2.5 图像坐标系参数计算
对于已知空间位置的深度极值点(x,y,z),并不直接使用2.2节所述的矩阵运算方法。具体方法是先使用黑色清空屏幕,并在(x,y,z)位置上绘制一个白色球体。然后使用原始的相机配置及坐标系观察参数得到左右两幅视图。遍历两幅视图,找到各自白色区域的中点坐标即为(xsL,ysL)和(xsR,ysR)。最后代入式(6)计算得到线视差d。再应用式(4)就可以求得实际坐标系下的最大出屏深度和最大入屏深度。
2.6 观察坐标系参数计算
在2.3中已经获取了用户所处的观察位置,将其分别代入式(2)和式(3),得到两种限制下的线视差范围。取其比较小的值记做dN,dF。再将2.5节得到的2个d与dN,dF做比较,就可以判断当前场景是否满足观察条件。
3 实 验
3.1 实验框架
为了检测虚拟场景中视差的错误,采用如图4所示的检测流程。包括以下几个部分:人眼跟踪系统获取用户的三维位置信息;使用OpenGL获取显示场景的虚拟尺寸信息;应用立体成像原理,计算出视差的极值;使用生理视差限制公式,判断当前场景的视差是否合适并加以修正。
3.2 视差检测
实验计算机为E5300+2 GB内存,操作系统为Windows XP。使用的OpenGL产生红绿立体图像,带上分色眼睛即可观看。显示内容的背景为纯黑色,在屏幕中心附近有3个立方体(见图5(a))。它们相对于屏幕在Z方向上的初始位置分别是正数、零、负数。观众可以通过键盘操作将场景做整体的前后纵深移动。
设置虚拟相机在世界坐标系原点(0,0,0),视线汇聚点在(0,0,-500),相机距离记做Z=500。三个立方体的边长都是25,深度分别为-450,-500,-550。
使用2.5节中所述方法,在找到此时的最大、最小深度后,以此绘制四张视差测试图(见图5(b))。将测试图中的白点检出并做差,可以得到当前立体图像的最大出屏与入屏对应线视差。
在本例中当Z=500时,出屏极限视差为-4.27 mm,入屏极限线视差11.1 mm。
同时使用人眼跟踪装置,先得到两眼的间距,再根据2.3节的方法求得当前用户的距离,进而计算出当前观察位置下的最大出屏和入屏视差(见表1)。
将两个极限线视差相比较,就可以得知当前的图像是否满足立体图像的舒适视差要求。
3.3 视差修正
对于不合适的视差,可以通过调节虚拟相机位置来修正。实验中,一旦检测到出现不符合舒适观察要求的情况,则将相机向观察方向移动(每次改变2%),减小立体图像的入屏线视差,增大出屏视差,直至符合要求(见表1)。调整之后的图像(见图6)相对于原来的图像在内容上并无畸变,但满足了生理学视差限制。这种视差修正存在方法的缺陷是无法实现平滑的改变,可能有跳跃感。
4 结 语
本文论述了在计算机虚拟环境绘制条件下,一种测试视差图像是否合适的方法,并进行了实验验证,为相关计算机立体图像生成工作提供了量化评判方法。在此基础上,也提出了一种初步的解决方案。在接下来的工作里,将对视差控制的问题做进一步研究,提出更完善的实时连续立体图像生成方案。
参考文献
[1]王琼华,王爱红.三维立体显示综述[J].计算机应用,2010,30(3):579-581,588.
[2]WILCOX L M,ALLISON R S.Coarse-ne dichotomies inhuman stereopsis[J].Vision Research,2009,49:2653-2665.
[3]侯春萍,阿陆南,俞斯乐.立体成像系统数学模型和视差控制方法[J].天津大学学报,2005,38(5):455-460.
[4]颜瓅.基于几何原理的立体显示深度感控制[J].船舶,2008(6):55-58.
[5]SREENIVASAN V,BOBIER W R,IRVING E L,et al.Effect of vergence adaptation on convergence-accommoda-tion:model simulations[J].Biomedical Engineering,2009,56(10):2389-2395.
[6]BOS K J.Reducing the accommodation and convergencedifference in stereoscopic three dimensional displays by us-ingcorrection lenses[J].Optical Engineering,1998,37(3):078-080.
[7]AGARWAL A,LAKE A.Dense stereo matching over thepanum band[J].Pattern Analysis and Machine Intelli-gence,2010,32(3):416-430.
[8]SKERJANC Robert.Combined motion and depth estimationbased on multiocular image sequences for 3DTV[J].SPIE,1994,2177:35-44.
[9]吴夕,刘玉华,颜少明.正常人双眼视觉的Panum融合区[J].眼科新进展,1999,19(5):375-376.
[10]杨富宝.基于计算机三维立体视差映射的双目立体成像研究[J].电脑知识与技术,2011(12):9230-2931.
[11]SHEREINER D.OpenGL编程指南[M].徐波,译.北京:机械工程出版社,2008.
图像生成 篇2
为了更加逼真地模拟红外目标及战场背景,基于图像生成及显示计算机、硅桥MOS电阻面阵控制计算机系统、128×128 MOS电阻阵列及电源、实时通讯反射内存网络(反射内存卡及光纤)、目标及背景红外图像实时生成软件和MOS电阻面阵控制软件等6部分组成了某红外图像实时生成系统;该系统采用的高速光纤反射内存实时通讯网络、超大规模D/A控制板等使得帧刷新频率达到了200 Hz以上、长线传输不受环境电磁干扰、更易于向256×256MOS电阻阵列扩展等,同时保证了在五轴转台的恶劣环境下可靠工作.
作 者:张安京 王仕成 张金生 刘志国 高智杰 韩连洋 ZHANG An-jing WANG Shi-cheng ZHANG Jin-sheng LIU Zhi-guo GAO Zhi-jie HAN Lian-yang 作者单位:张安京,王仕成,张金生,刘志国,ZHANG An-jing,WANG Shi-cheng,ZHANG Jin-sheng,LIU Zhi-guo(第二炮兵工程学院301教研室,西安,710025)
高智杰,GAO Zhi-jie(北京市清河大楼,北京,100085)
韩连洋,HAN Lian-yang(第二炮兵驻十院军事代表室,北京,100854)
图像生成 篇3
新算法名为“使用补丁优先的连续高分辨率图像重建(CHIRP)”,由MIT计算机科学和人工智能实验室、海斯塔克天文台以及哈佛-史密松森天体物理中心的研究人员联手开发。作为国际项目“事件视界望远镜”的一部分,新算法可以整合多台射电望远镜收集的信息,最终目标是将整个地球各地的望远镜整合成一个虚拟的大型射电望远镜。
新算法负责人、MIT电子工程和计算机科学研究生凯蒂·鲍曼表示:“无线电波有很多优势,能穿墙而过,也能穿透星际尘埃。但它属于长波,需要大型抛物面天线。目前世界上最大射电望远镜的直径约为305米,但所生成的月球图像,比普通光学望远镜还要模糊。黑洞距离我们非常遥远且内核致密,给银河系中央的黑洞拍照,就好比用射电望远镜给月球上的一颗葡萄柚拍照,要得到清晰图像,需要直径达1万千米的望远镜,但这是不可能的,因为地球的直径不到1.3万千米。”
事件视界望远镜项目采用的办法是对全球多台射电望远镜的观测数据进行整合,目前已有6台望远镜签署了合作协议,更多望远镜可能紧随其后。但即便加入的望远镜数量翻番,与1万千米直径的抛物面望远镜提供的数据量相比,还是存在巨大差异。而新算法有望解决这一问题。
研究参与者表示,目前几乎所有工作都已准备就绪,将于2017年开始给黑洞拍照,拍摄出的图像将对包括广义相对论在内的物理学领域多个核心假设进行验证。广义相对论认为,像黑洞这么大质量的物体将能弯曲时空,如果这一说法属实,科学家能在图像中看到这一点。(中国青年网)
图像生成 篇4
随着经济水平的提高, 车辆也随着增多。各种交通事故也增多, 故开发一套检测路面信息和车辆信息的软件刻不容缓。本人通过C语言开发了一个小软件有助于路面和车辆图像的检测。
1 具体算法
首先给出了BOIS中断调用程序, REGS是声明 (描述) Intel 80x86 CPU 16位通用寄存器的一个内部结构 (还包括标志位寄存器, 标志位寄存器一般用作设置或获得错误) 。int86 () 函数的功能是提供通用的8086软中断接口, 其原型是int86 (int intno, union REGS*inregs, union REGS*outregs) ;intno参数指定中断号, inregs与outregs分别是入口参数寄存器和出口参数寄存器[1]。
采用平均值方法来求道路背景[2,3]。由于车辆是运动的, 而路面是静止的, 车辆在不同时间段内位置不同, 先利用90幅照片的叠加, 这个过程中, 车是沿着运行方向前行, 故用像素点表示和路面的像素点来说, 可以不计。抽取连续的90幅照片, 然后90幅图片相加, 按图片的宽度width和长度length来计算除以90, 就可以得出路面的背景, 这里的长度的像素点从640开始, 而宽度从1078开始计数, 具体用C语言可以表示为:
for (i=length-1;i>=0;i--)
{
for (l=0;l<640;l++)
fseek (fp, 1078+width*x, SEEK_SET) ;
……fread (point, width, 1, fp) ;
sumresult[n]+=point[n];
averbmpdata[n]=sumresult[n]/TOTALBMP;}
/*90幅图片的对应点求平均*
而对于车辆的形成图像, 假如从90幅照片中随机选择一幅照片做车辆的生成, 这照片与前述的背景照片相减, 就可以得出单独的车辆:
if (point[n]-buffer[n]<30) /*作差*/
{averbmpdata[n]=220;}
else
{averbmpdata[n]=buffer[n]-point[n]-100;}
2 结论
根据上述算法, 得出背景照片如图1所示:
车辆照片如图2所示:
本程序是基于C语言的路面背景信息和车辆信息的, C语言简单易懂, 且运行速度快, 并能很好地显示路面背景。特别是当出现路面状态 (路面损坏) 等, 提取摄像头拍摄的照片, 分析得出直观的路面情况, 以便交警或是相关负责人作出决策, 避免交通事故的发生。同时, 由各个照片与背景路面的差值, 得出车辆信息。
从上述可以看出, 本程序简单、实用、对相关工作人员实际工作中带很大的帮助, 可以避免一些事故的发生。
参考文献
[1]谭浩强.C语言程序设计第二版[M].北京:清华大学出版社, 1999.
[2]吴国平.数字图像处理原理[M].北京:中国地质大学出版社, 2007.
基于圆鱼眼照片的全景图像生成方法 篇5
近年来, 基于图像绘制的虚拟现实技术成为了计算机图形图像人员研究的热点。全景技术就是一种基于图像的绘制技术, 这种技术的特点是它的绘制和场景的复杂度无关, 并且能够达到照片级的真实感。
根据全景图像数据映射的空间模型不同, 可以把全景分为柱面全景、球型全景和立方体全景[1]。球型全景与柱面和立方体全景技术相比, 图像采集过程简单、合成的全景图像质量稿而越来越受到人们的青睐。
球型全景技术需要用户借助于专用数码设备 (鱼眼镜头) 拍摄到某一场景的一组样本图像 (至少两张) , 然后对样本图像进行校正、拼合得到最终的全景图像。本文论述了由圆形鱼眼照片合成一个全景图的系统流程, 着重研究了对圆鱼眼图像的变形校正算法以及图像拼接的配准算法, 并就各阶段的算法进行了分析、比较, 提出了改进策略。
2、全景图像的生成
球型全景技术生成全景图像主要包含以下四个步骤:图像预处理、图像校正、图像的拼接三个阶段。
2.1 图像预处理
图像的预处理主要是指对圆鱼眼图像圆心、半径的确定。通常鱼眼镜头所拍摄到的圆鱼眼照片的圆形有效区域与边缘未曝光区域存在着较大的色差依据此特征, 对于景物区域的圆心坐标和半径的确定可以采取以下几种方法来完成。
1) 面积法
首先预定义一个较小的阈值, 然后统计圆鱼眼图像中大于该阈值的像素点个数, 记为S。由公式即可求得圆形区域的半径;再由图像一阶矩含义求得圆心坐标位置:
当源图像中景物区域存在较多颜色值较小的像素点时, 利用面积法求圆心坐标和半径时容易受到较大的干扰, 求得的数据误差偏大。
2) 扫描线法
用四个扫描线分别从源图像的上、下、左、右四个方位向图像中部扫描。当源图像的颜色值大于某一阈值时, 记录扫描线的位置top、bottom、left、right, 则圆心坐标和半径可用以下式子求出:
扫描线法克服了面积法的缺陷, 但是当源图像中景物区域颜色值较小的像素点集中于边缘时, 该方法同样会带来误差。一种改进的方法是可以借助于对源图像的旋转扫描求解, 最后求取加权平均值, 可以在一定程度上克服扫描线法的缺点。
3) 二次曲线拟合法[2]
该算法的实现步骤大致可描述如下:
Step 1.选定一阀值, 分别从图像的上、下、左、右按行、列向图像的中心检测图像相邻两点的亮度变化, 如该行或该列上的相邻两个像素值的亮度差绝对值大于该阀值, 则把该点坐标放入亮度突跳点集合中, 该行/列探测结束, 否则到该行/列中点位置时, 该行/列探测自动结束, 直到探测完所有的行列;
Step 2.通过最小二乘方法对所探测到的点的集合进行最小二乘圆曲线拟合, 就可以得到圆的曲线方程, 从而求得圆心坐标和半径。
最小二乘法相比前两种方法鲁棒性明显增强, 但是该方法需要迭代求解, 时间上的消耗相对较大。
2.2 图像校正
根据鱼眼图像的成像原理可知, 利用鱼眼镜头获取的图像存在着严重的变形如图1所示。这种变形主要表现为越靠近圆形区域的两极附近, 图像变得越拥挤;而在赤道附近和两极连线上基本上没有变形[3]。
鱼眼镜头引起的图像变形主要有三种: (1) 径向变形 (2) 偏心变形 (3) 切向变形三种变形中, 径向变形是最严重的。
鱼眼图像的校正算法根据是否需要借助照相机详细参数可以分为两类:参数标定法和无参校正法。
2.2.1 参数标定法
参数标定法是主要针对径向变形提出的一种校正方法。通常径向变形可以表示为:rd=r+δr, rd是指有变形的径向距离, δr是形变量。
普遍采用的一种方法是使用高次多项式模拟近似的变形方程[4], 通过计算标定多项式系数来得到源图 (有变形) 到目标图的点对点的坐标映射关系。径向变形的多项式模拟公式为:
实验表明, 在实际应用中使用4次多项式 (n=2) 就已经满足需要了。亦即:
选取标定物中的几个基准点坐标, 对照鱼眼镜头拍摄后的照片, 利用迭代计算误差最小化方法从而确定参数值。求得了多项式的系数之后, 源图像到目标图像的一一映射关系就唯一的确定下来。
参数标定法针对特定的鱼眼镜头, 算法基于光学成像原理而来, 所以得到的校正结果比较精确;但是这种方法需要精确的标定设备, 并且在求解标定多项式系数时, 需要多次迭代求解, 计算量较大, 因此难以满足普通中小客户的需要。
2.2.2 经纬映射图像法
经纬映射图像法是一种比较好的用于存储球面数据的方法。鱼眼镜头的成像原理采用了等距成像模型, 如图2所示, 鱼眼图像上的像素点 (u, v) 与球面坐标系中的球面上像素点 (θ, φ) 存在一种映射关系为:
这里c是一个与鱼眼镜头的焦距或视域大小有关的缩放因子, φ∈[-π/2, π/2], 。
在实际的计算过程中, 为了避免空洞现在的产生, 通常采用逆向映射的方法。
设鱼眼图像任一像素点 (xs, ys) , 转换后对应球面展开图中的对应坐标 (xd, yd) 。首先计算出对应的球面坐标系坐标 (θ, φ) 为:
θ=xd/r, φ=yd/r
然后, 计算出该点在三维笛卡尔坐标系中的对应坐标 (x, y, z) :
最后, 根据等距离投影成像模型可以得到鱼眼图像中对应的像素坐标 (xs, ys) :
图3所示为采用该方法所得的校正结果。
2.3 图像的拼接
图像拼接一般包括预处理、图像配准、统一坐标变换和图像融合几个阶段。
如何精确找出相邻两副图像中重叠部分的位置是整个拼接过程的关键所在。其核心就是要确定两张图像的变换关系, 即图像配准。配准的目的就是找出一种最能描述待拼接图像之间映射关系的变换模型。图像配准算法大体可分为基于特征的图像配准和基于区域的图像配准两类。
1.基于特征的图像配准
基于特征的图像拼接是利用图像的明显特征 (角点、关键点、轮廓等) 来估计图像之间的变换。
(1) 控制点配准算法
在待配准的图像中选取一些特征点, 对准了这些特征点, 两幅图像也就配准了。控制点法往往要借助人工选取初始匹配点, 这大大降低了算法的速度和适用范围。
(2) 自动角点检测配准算法
这类算法通过检测图像中的角点, 然后对两幅图像的角点按照一定的配准原则进行配准, 最后剔除误匹配对, 得到正确的配准结果。经典的角点检测算法主要包括Harris角点检测算法[5]、SU-SAN角点检测算法[6]以及Do G角点检测算法[7]。
基于特征点的配准算法计算量较小, 配准精度高, 缺点是边缘信息少的图像、大旋转和大尺度缩放的图像和多光谱图像不能很好地进行配准。
(3) 轮廓线检测配准算法
轮廓线检测配准算法首先对图像进行轮廓线提取, 然后对提取的轮廓线进行配准, 进而确定重叠区域。轮廓线的匹配准则可以选取链码相关或者其他一些相似性准则, 如主轴和不变矩等。文献[8]利用两幅图像中分割得到的较大轮廓的质心进行匹配估计出变换参数, 从而达到配准的目的。
轮廓线检测配准算法适用于光照不一致、存在尺度关系及旋转的图像。该方法需要准确提取出明显的轮廓特征, 对于数据的缺失比较敏感, 要求两幅图像的对应轮廓要比较完整。对于轮廓特征不明显或噪声干扰较大的图像不适用。
2.基于区域的图像配准
(1) 相位相关法
相位相关算法是目前应用最广泛的图像匹配算法之一, 其基本原理是:
设两幅图像之间存在平移量 (Δx, Δy) , 即
根据傅里叶变换的性质, 可得,
所以二者的均值协功率谱:
其中为F1的共轭。对均值协功率频谱求其逆傅立叶变换, 可以得到一脉冲函数, 该脉冲发生在 (Δx, Δy) 处。根据这一原理, 假如两幅图像之间仅存在平移变换, 我们可以通过寻找该脉冲位置来确定平移参数。
相位相关法具有场景无关性、受几何失真影响小、噪音容忍度高等优点, 因此受到了研究人员的普遍认可。
(2) 对数极坐标变换法[9]
相位相关法实现了两幅图像间存在平移变换是的拼接方法, 对数极坐标变换法致力于将存在旋转、尺度变换的图像转化为平移变换, 然后再利用相位相关的方法来完成两幅图像的拼接。
对数极坐标变换的关键点就是将存在旋转和尺度关系的图像通过对数极坐标变换变为该坐标系下的平移关系。其中极坐标用来解决旋转问题, 对数变换用来解决尺度关系问题。
由于圆形鱼眼照片在拍摄时焦距相等、相机的主轴位于同一个平面上, 因此对于圆形鱼眼照片经校正后, 拼接阶段进行图像配准时主要集中在平移变换的确定。最后对重叠区域按照加权平均法进行图像融合, 生成一副全景图 (如图4所示) 。
3. 结论
全景成像技术由于能获得360°的大视场, 在很多场合发挥着重要的作用, 其中以鱼眼照片最为突出。本文系统阐述了由两幅圆形鱼眼照片生成一张全景图的过程。并就其中的关键技术、关键算法展开了分析比较, 指出了各种算法的优缺点和局限性。总的来说, 全景成像技术已经较为成熟, 目前该领域的研究人员致力于提高拼合精度、降低时耗, 以及如何采用普通数码照片来快速准确的合成全景照片而努力。
摘要:本文讨论了如何由鱼眼照片生成全景图像的过程, 对各阶段的不同算法进行了分析比对, 指出了不同算法的优缺点, 最后通过实验拼合出了一副完整的全景图像。
关键词:鱼眼图像,图像拼接,图像校正,全景图像
参考文献
[1]韦群, 张永明等.虚拟空间构造及漫游系统[J].计算机工程与应用, 2004Vol.40, No.4:114-117, 13;
[2]徐士良, 计算机常用算法[M], 清华大学出版社, 2001, 202-207
[3]黄有度, 苏化明.一种鱼眼图像到透视投影图像的变换模型[J].系统仿真学报, 2005, 1:29-32
[4]Tsai R.Y., "A versatile camera calibration technique for high-accuracy3D machine vision metrology using off-the-shelf TV cameras and lenses.", IEEE Journal of Robotics and Automation, 1987, 3 (4) :323-344.
[5]Harris C, Stephens M.A combined corner and edge detector[C].Procof the 4th Alvey Vision Conference.Manchester, 1988:147-151.
[6]Smith S M, Brady M.Susan.A new approach to low level image pro-cessing[J].International Jaurnal of Computer Vision, 1997, 23 (1) :4578
[7]陈燕新, 戚飞虎.一种新的提取轮廓特征点的方法[J].红外与毫米波学报, 1998, 17 (3) :171-176.
[8]刘小军, 周越.基于轮廓特征的SAR图像自动配准[J].计算机工程, 2007, 33 (4) :176-178.
图像生成 篇6
非真实感绘制是计算机图形学和图像处理中一个崭新的课题,是计算机科学与艺术的有效融合,属于计算机艺术的范畴。与传统真实感的绘制不同,它强调人们的主观感受, 而不追求真实感,旨在给人以美的享受。它是以计算机为工具,搭建各种数学模型并设计各种算法,来模拟艺术化的绘制风格。
根据数据源的不同,非真实感绘制可以分为两类:基于三维观察空间的绘制-绘制3D场景和基于图像空间的绘制-绘制2D图像。而基于图像空间的非真实感绘制是目前计算机图形学的研究热点,在许多方面有着重要的应用。而基于图像空间的非真实感绘制工作又可分为两类:一类是计算机自动绘制生成所需的艺术风格图像;另一类是基于过程的物理模拟,它通过抽象出特定的笔刷模型,使之产生与现实绘画工具相同的艺术效果[1]。本文主要研究基于图像空间的自动非真实感绘制的理论和方法。
作为计算机艺术的一种形式,计算机仿真浮雕艺术是指通过一定的特殊处理方法,为一幅二维图像中的有效内容和物体增加立体的显示效果。它能艺术地再现图像,并在平面上凸现景物及其层次,提高视觉冲击力,给人以凝重的艺术风格与感染力[2,3]。它作为非真实感绘制领域的研究分支之一, 与非真实感绘制水墨画、水彩画、漫画相比,是一个相对较新而具有挑战性的研究领域。
2浮雕生成的基本原理(Thebasicprincipleofrelief)
实现图像浮雕效果的一般原理是:将原图像上每个像素点与其相邻的像素点形成差值,使相似颜色值淡化,不同颜色值突出,从而产生纵深感,达到浮雕的效果。但对大多数图像而言,相邻像素的差值可能并不大,这样图像就有可能变黑。因此,需要在差值的基础上再加一个正整数的常量来提高浮雕图像的整体亮度。
以3×3邻域为例,所谓“相邻”像素点是指与围绕在该像素点周围8个方向,即左、右、上、下、主对角左上、主对角右下、辅对角右上和辅对角左下相邻的8个像素点。因此其差值的计算可以在这8个方向上展开,即有8种处理方法,不同的处理方式得到的效果表现在浮雕效果的光照方向不同, 如图1所示。相比较而言,对角线方向上的浮雕效果更佳,实际应用中通常采用主对角线方向。
3本文算法(Thealgorithminthispaper)
3.1灰度浮雕
本文在传统灰度浮雕的基础上,利用浮雕图像和雕刻图像互补的这一特点,进一步计算浮雕图像与雕刻图像之间的差值,从而增大图像的深度,使图像轮廓更为分明,凹凸感更为强烈。
本算法具体分为四个步骤,如图2所示。
Step1:输入任意一幅肖像图像。
Step2:将原图像转换为灰度图像即灰度化处理。
Step3:利用传统的浮雕原理生成浮雕图像(主对角左上方向的浮雕图像)和雕刻图像(主对角右下方向的浮雕图像)。
Step4:计算浮雕图像与雕刻图像之间的差值得到最终浮雕效果,如图3(e)所示。
3.2彩色浮雕
浮雕是介于绘画和雕塑之间的一种独特的造型艺术形式,融合绘画与雕塑两者的表现优势。因此,色彩在浮雕中的运用会使其更具表现力,同时也符合现代社会人们审美观和多元的精神需求[4]。
由于一幅RGB图像就是M×N×3大小的彩色像素的数组,其中的每个彩色像素点都是在特定空间位置的彩色图像所对应的红、绿、蓝三个分量,也可以看作由三个灰度图像形成的“堆”。因此,传统彩色浮雕生成的基本思路是:首先将彩色图像先分离成R、G、B三个单通道图像,然后分别对每个通道运用灰度浮雕方法进行处理,最后重新将处理后的三个单通道图像合并成一个多通道图像,从而生成彩色浮雕,如图4(b)所示。但该方法生成的并不是真正意义上的彩色浮雕,颜色只是在边缘处才隐约可见,形成的仍然是类似灰度浮雕的效果。
针对传统彩色浮雕生成方法存在的不足,本文采用卷积算法对图像进行滤波的方法来生成彩色浮雕。卷积通常可以被看成加权求和的过程,区域中的每个像素分别与卷积核中的每个元素相乘,所有乘积之和即为区域中心像素的新值。其中卷积核是指卷积时使用的权矩阵,其大小是奇数,而且与使用的区域大小相同,而且权值的大小、方向及排列顺序决定了卷积的图像处理效果。二维卷积公式如式1所示,其中f(x,y)是输入图像,g(x,y)是输出图像,h(x,y)是卷积核。 g(x,y)的形成过程就相当于用h(x,y)函数做了一个大小为 (A,B)的滑动窗,在f(x,y)上滑动,在重叠部分加权求和,所得结果赋给窗口中心的点。
本文设计使用的卷积核如图5(b)所示,基本思路是取邻近三个像素点的值减去2倍右下角像素点的值,由于被减的点数大于减的点数,在雕刻阴影形成时保留了很大的亮度,这就相当于给各像素加了一个不固定的背景值,从而形成彩色浮雕效果,如图5(c)所示。
4实验结果(Experimentalresults)
本文所研究的浮雕算法是以Matlab R2014a作为实验平台,在Windows 7操作系统的PC机上进行仿真计算。通过对大量的图像进行实验,生成的浮雕效果基本令人满意。图6给出了不同类型的图像所生成的浮雕效果图。
从图6可以看出,本文提出的浮雕生成算法的显示效果明显优于传统的浮雕生成方法。就灰度浮雕而言,其凹凸程度有较大程度的提高,层次感进一步加强,浮雕化效应明显; 就彩色浮雕而言,其效果更接近于真实,更具表现力。
5结论(Conclusion)
图像生成 篇7
已有的利用计算机进行水墨画模拟的方法大致分为两种。一种是通过对虚拟毛笔、纸张等的建模, 模拟毛笔、水墨和纸张之间的相互作用, 开发出可以交互操作的中国画创作系统。最早尝试这种方法的是S.Strassmann[1], 他提出了第一个虚拟毛笔模型Hairy Brush。Guo和Kunii[2]在Strassmann的研究基础上加入墨扩散的效果, 建立了一种纸张模型。J.Lee[3]基于力学弹性理论建立了三维毛笔模型。香港科技大学的Nelson S.-H.Chu和ChiewLan Tai[4]开发出Mo Xi系统, 可以让用户手握真实的毛笔进行创作, 取得了很好的效果。但该方法只是为人们提供一个类似于纸和笔的工具, 而不提供人们创作的灵感、方式等, 需要用户在水墨艺术创作领域有一定的先验知识, 只有具有一定美术功底的人才能创作出理想的水墨仿真作品。第二种方法是通过Maya、3ds Max等软件实现水墨仿真。这方面具有代表性的是中国导演许毅执导的水墨动画《夏》, 也是中国大陆首次入选SIGGRAPH的作品。但该方法只适用于专业人员, 不适合普通用户, 且制作复杂, 水墨渲染所需的时间较长。
本文提出一种方法, 将一幅已有的静态图像自动转化为水墨风格图像。图像内容的取材为适合水墨风格的场景, 如山水、古建筑等。该方法中, 用户只需要调整几个简单的参数就可以对生成的水墨作品进行调节, 且对用户的美术功底没有要求, 几乎所有的用户都可以通过该方法来完成对图像的水墨效果处理。该方法的处理速度快, 可以满足即时性操作。
1 水墨风格图像自动生成方法
典型的中国水墨画作品具有以下几个明显的特征:1) 只有黑色与白色而没有彩色, 通过水墨的混合比例来调节墨的浓淡, 从而使得画面有层次感;2) 更加注重大面积的区域表现, 并不拘泥于细节;3) 水墨笔触更注重写意, 由毛笔在宣纸上绘制所产生的笔触以粗线条为主;4) 水墨在宣纸上扩散产生出晕化模糊的效果[5], 边缘部分较为柔和。
基于以上特点, 本文提出的水墨风格图像自动生成方法流程如图1所示。包括图像预处理、图像腐蚀、各向异性扩散滤波和边缘的提取与叠加等主要步骤。预处理把图像色彩空间从RGB转换为Lab, 并将彩色通道进行分离, 使得后续处理在只包含亮度信息的L通道内进行, 在去掉彩色信息的同时加快了处理速度。图像腐蚀的作用是减少图像细节信息, 同时生成类似毛笔笔触的粗线条。各向异性扩散滤波用来模糊细小的边缘, 生成类似水墨扩散的效果。边缘的提取与叠加使得图像主要的边缘信息被保留, 增加了输出图像的真实感。整个过程通过对参数的调整, 实现对输出图像效果的控制。
1.1 图像预处理
图像预处理包括图像色彩空间的转换以及颜色通道的分离。首先把图像色彩空间从RGB转换为Lab[6]。在Lab空间中, 一种颜色由L (亮度) 、a颜色、b颜色3种参数表示。在一幅图像中, 每个像素都有对应的L, a, b值, 一幅图像就有对应的L通道、a通道和b通道。其中的亮度和颜色分量是分开的, L通道只有亮度信息没有颜色信息, a通道和b通道只有颜色信息没有亮度信息。在Lab空间的每个像素中, L分量取值为0~100 (纯黑-纯白) 、a分量取值为-128~+127 (绿-洋红) 、b分量取值为-128~+127 (蓝-黄) 。如果只取L通道的信息而抛弃a、b通道的颜色对立维度信息, 则得到的即是一幅单通道的灰度图像。水墨画中有墨的浓淡变化, 灰度图像中也有不同灰度级的变化。将真实场景图像转化为灰度图像是本方法的第一个步骤。同时, 将Lab色彩空间图像进行通道分离, 可以使得后面的各向异性扩散滤波与边缘提取的计算仅仅在L通道中进行, 从而缩短了计算时间。图2为一幅花的照片以及其L通道图像对比。
1.2 图像腐蚀
中国水墨画注重写意, 不苛求细节信息, 而一幅现实场景的图像中难免会包含有很多不需要的细节信息。图像腐蚀使得图像亮部边界向内部收缩, 暗部边界向外扩张, 是一种消除边界细节的过程, 可以用来消除图像中细小而且无意义的物体。在本文算法中, 采用图像腐蚀的方法来消除多余的细节信息, 初步模拟毛笔的粗线条笔触。图像腐蚀属于数字图像处理中形态学的范畴。在灰度图像中, 设输入图像为f (x, y) , 结构元素为b (x, y) , 则用结构元素b对输入图像进行腐蚀运算的定义为
图像腐蚀的基本原理如图3所示。将一幅图像A与结构元素B进行卷积, 计算结构元素B覆盖区域的最小值, 并把这个最小值赋给参考点指定的像素。结构元素在多数情况下是一个实心的正方形、十字形或圆形, 参考点一般指结构元素中间的一点。本方法选用圆形的结构元素, 使得图像腐蚀的效果最为接近毛笔绘制的笔触。
图4展示了对大小为200×200像素的图像选用不同尺寸的圆形结构元素进行腐蚀得到的不同效果。从中可以看出, 结构元素的尺寸越大, 图像的细节信息保留得越少。实验系统中, 用户可以根据实际情况选择不同的结构元素尺寸, 以达到最为接近水墨画的写意效果, 模拟毛笔产生的粗线条笔触。
1.3 各向异性扩散滤波
图像腐蚀运算将输入图像变得初步具有写意风格, 但此时的图像仍然不具有水墨晕化效果。水墨作品另一个重要特征是水墨在宣纸纤维中扩散, 在边缘产生晕化模糊。本方法中采用各向异性扩散滤波的方法来实现对水墨扩散的模拟。
各向异性扩散最早由Perona和Malik[7]等人提出, 基于他们提出的PM方程的一类滤波称为各向异性扩散滤波。这种方法可以模糊图像中较小的不连续的部分, 同时又能保留重要的边缘信息;另外在对比度特征中可以增强或者降低图像的局部对比度。
对于输入图像f, 图像中的像素为x, x^代表x的邻域像素, 滤波模糊半径用r表示, 则滤波函数H的定义为
式中:r的值决定了图像模糊范围的大小。图5展示了不同r的值所产生的效果对比。r的值太小达不到期望的扩散效果, 太大则导致模糊的范围过大。对于不同的输入图像, 最合适的r值也是不一样的。因此, 在实验系统中用户可以调整r的取值来达到满意的效果。
W为邻域权重函数, 决定了当扩散滤波函数迭代使用时, 图像对比度增强或者减弱的位置和区域。
式中:u (x) 是扩散补偿函数, 另一个参数σ决定了局部图像的模糊程度。
各向异性扩散滤波对于图像反复迭代使用, 迭代次数越多, 图像模糊的程度越高, 水墨扩散效果越明显。图6为扩散半径相同时不同迭代次数所产生的效果对比。迭代次数太少则达不到期望的扩散效果, 太多则导致图像过于模糊。且迭代次数越多所需要的运算时间也越长。在实验系统中, 用户可以针对不同的输入图像, 调整迭代次数, 得到不同的水墨扩散效果, 从而选择其中最优的迭代次数。
1.4 边缘提取与叠加
水墨画注重写意, 并不苛求细节, 但是一些对比度较大部分的边缘信息对于整幅作品来说仍然重要。通常人眼对强边缘的敏感性强于弱边缘, 根据人眼的这一视觉特征, 需要对图像中的边缘信息进行有选择的增强, 即保留对比度比较大的强边缘, 而不保留对比度较小的弱边缘, 以增强水墨效果的真实感。本方法采用Roberts边缘检测算子实现对灰度图像强边缘的提取, 然后将边缘图像与经过图像腐蚀和各向异性扩散后的图像叠加, 得到最终的水墨效果图像。
Roberts算子利用局部差分来检测边缘, 对于对比明显的边缘, 其检测效果好, 对于对比不够明显的边缘, 则没有很好的检测效果。这一特点符合本方法对水墨仿真效果的要求。而且其卷积模板简单, 相比其他的边缘检测方法运算速度更快。
在边缘信息与经过各向异性扩散滤波的图像相叠加时, 可能会遇到边缘线条过于明显, 导致输出图像水墨韵味不足的问题。本方法采用对边缘信息图像进行线性变换的方法来解决。设经过扩散滤波之后的图像为m (x, y) , 图像的边缘信息为n (x, y) , 则叠加后的图像L (x, y) 的生成可以表示为
式中:边缘系数k调节边缘线条在输出结果图像中的明显程度。当k<1时, 可以使边缘线条弱化。图7中可以看出不同的k值对边缘线条的调节效果。本方法通过对k值的调节, 可以实现对于边缘线条的控制。
2 实验结果
基于以上所提出的将真实场景图像自动转化为水墨风格的方法, 在硬件配置为2.4 GHz Intel Core 2 Duo处理器、2 Gbyte内存, 系统为Mac OS X 10.8.4的环境下, 使用Xcode 4.6以及Open CV 2.4为软件平台进行了实验仿真。实验系统首先输入一幅真实场景的静态图像, 然后进行图像预处理、图像腐蚀、各向异性扩散滤波以及边缘提取与叠加等步骤, 实现了水墨效果的仿真。实验选用图片为适合水墨题材的真实照片, 并且通过对参数的调整, 可以适应不同的输入图像。表1对比了本方法中可调的参数及其作用。图8为使用本文方法对一幅大小为520×360像素的真实场景图像进行水墨效果仿真的实验结果比较, 参数选择分别为:S=5×5, r=4, n=20, k=0.5。
本文的实验仿真针对于水墨艺术品, 对于艺术品的评价通常是主观的。本实验采用主观评价的方法对仿真结果进行评估。实验选择了20位 (10位男性, 10位女性) 不同年龄层次和文化背景的观察者, 分别对图8的仿真结果图像进行打分。主观质量分为5个等级, 数值分别为1~5, 如表2所示。
在相同的环境以及显示设备的测试条件下, 图像的平均得分为4.1分。从测试结果可以看出, 输出的图像具有水墨韵味, 符合水墨画的基本特征, 达到了将真实感的照片自动转化为水墨风格图像的要求。且该方法的运算速度快, 一幅640×480的图像在迭代次数为20的条件下处理所需时间仅为1.844 s, 可以实现即时性处理。
3 结论
本文提出一种基于真实场景的静态水墨风格图像生成方法, 将一幅适合中国传统水墨画效果的真实场景图像自动转换为具有水墨风格的艺术图像, 实现了对图像的水墨风格绘制, 并且能够通过对其中参数的调整实现对输出图像效果的控制。该方法与其他水墨仿真方法相比, 具有以下优点:1) 操作简单, 无需使用专业软件, 只需要调节几个简单的参数就可以实现对图像的水墨风格处理;2) 适合用户广, 用户无需具备美术功底即可完成水墨风格图像的绘制;3) 运算速度快, 处理所需的时间远少于普通渲染方法。
在以后的研究工作中, 可以考虑加入水墨作品的一些纸张纹理特征, 使输出图像更接近真实的水墨作品;同时, 可以考虑将本方法扩展到实时视频处理的领域, 通过GPU硬件加速[8]等技术, 使对视频的实时水墨风格绘制成为可能。
参考文献
[1]STRASSMANN S.Hairy brushes[C]//Proc.ACM SIGGRAPH.Dallas:ACM Press, 1986:225-232.
[2]GUO Q, KUNII T L.Modeling the diffuse painting of sumi-e[C]//Proc.the IFIP WG 5.10 Working Conference.Berlin:Springer Press, 1991:329-338.
[3]LEE J.Simulating oriental black-ink painting[J].IEEE Computer Graphics and Applications, 1999, 19 (3) :74-81.
[4]NELSON S, CHIEW L T.Real-time ink simulation[C]//Proc.ACM SIGGRAPH.New York:ACM Press, 2005:504-511.
[5]齐亚峰, 孙济州, 商毅.中国水墨画的基本艺术特征及其计算机仿真实现[J].中国图象图形学报, 2003, 8 (5) :562-566.
[6]WINNEMILLER H, OLSEN S C, GOOCH B.Real-time video abstraction[C]//Proc.ACM SIGGRAPH.New York:ACM Press, 2006:1221-1226.
[7]PERONA P, MALIK J.Scale-space and edge detection using anisotropic diffusion[J].IEEE Trans.Pattern Analysis and Machine Intelligence, 1990, 12 (7) :629-640.
图像生成 篇8
浮雕,是一种在平面背景上雕刻出凹凸起伏形象的雕塑[1]。它的艺术表现形式介于三维圆雕和平面绘画之间,相较于平面绘画,浮雕具有艺术表现力强和视觉空间延伸感突出的优势;同时,相较于圆雕,浮雕又有着得天独厚的节约空间的优点。近年来伴随着数字化浮雕研究的深入,浮雕的应用也日益广泛,可以说目前浮雕研究已经在工业生产生活中得到了越来越多的重视。根据输入的数字化数据源的类型的不同,浮雕的数字化生成算法可分为两类:一类是基于二维图像,另一类是基于三维几何模型。第一类方法通过将二维图形灰度值拓展映射为一定范围内的高度值的思想来生成2.5维的浮雕,该方法以图像作为处理对象,数据排布规则,故运算速度很快,但由于该类算法生成的浮雕细节效果不够理想,且需要较多的人机交互,自动化程度不够高。相对于第一类浮雕生成算法,基于三维几何模型的浮雕生成算法中数据源包含被抽象物体的原始几何信息,因而浮雕细节效果更佳,自动化程度更高。
本文研究一种基于三维几何模型的浮雕生成算法,这里三维模型用能表示任意复杂形状的分片线性三角网格来描述。将三维模型沿某一视角方向压缩,得到浮雕曲面模型这是一种直觉感知的方法。Cignoni等人[2]在1998年首次对此问题进行了探讨与研究,该方法利用透视投影和图形显示技术中的Z缓冲算法获得深度值并进行线性压缩,虽然能得到浮雕,但由于算法较为简单,导致细节特征缺失严重,对细节丰富的模型不能产生的好的浮雕视觉效果。因而,后来的研究人员均在考虑模型几何特征的基础上提出新的深度压缩算法。文献[3]将图像处理中的适应性直方图均衡化(adaptive histogram equalisation)方法拓展应用到三维模型上,对模型深度值这一几何信息进行梯度加权的直方图均衡化,来确定深度压缩系数。文献[4,5]借鉴高动态范围图像(high dynamic range image)压缩中一种在梯度域上的图像亮度压缩[6]思想,建立三维模型的深度与曲率高斯卷积[4]或梯度[5]之间的Possion方程,对曲率高斯卷积或梯度进行线性或非线性压缩后,求解模型的深度值,实现浮雕生成。其中文献[5]还提出将梯度根据数值的大小分成不同的频率带,对各频率带给定不同的系数,实现特征效果不同的浮雕。近期,国内文献[7,8]对原物体模型高度场梯度进行压缩,并对压缩后的梯度场进行积分求解得到曲面浮雕模型。
上述已有的算法直接对深度进行操作或在梯度域上进行操作,本文提出一种新的解决思路,即通过网格频谱分析在模型频域上对网格能量进行压缩,进而生成浮雕。
本文首先对重采样后的网格模型进行频谱分解,然后根据频率的大小对网格能量进行压缩,再将能量压缩后的频谱进行网格重构,就可得到压缩后的网格浮雕模型。在频域上,数值大的频率对应着模型的细节,对该频率的幅值进行少量的压缩,就可保留模型更多的细节。其中第一节介绍对输入模型预处理方法,第二节介绍网格频谱分析方法,第三节中着重阐述浮雕曲面生成算法,第四节对实验结果进行分析。
1 模型预处理
浮雕模型只需保留三维模型在某视觉方向的几何表面,视觉上不可见的部分并不是组成浮雕的一部分,将其删除可以提高算法效率。故在三角网格模型进行高度上的几何压缩之前,先要对输入模型进行预处理,删除不可见部位。
同时为了得到易于二维傅里叶变换处理的对于某视线方向图像二维规则化的网格曲面,本算法需要对原始三角网格进行网格重采样处理。该重采样算法简单快速,易于编程实现(图1)。其过程叙述如下:首先输入原始三角网格模型M,该三角网格模型可以由一系列的点undefined、边、面组成的集合来表示,将M记为M=(V,E,F),调整视线方向向量pv,由此得到模型上离视点最远点为模型最低点,给定分辨率定义过该模型最低点并垂直于视线方向的平面为采样图像背景平面。将原始模型M投影到背景图像平面上,计算该采样背景图像每个像素点(i,j)的高度值h,该高度值大小为该采样背景平面上某像素点与过该点作垂直于背景平面的法线nij和原始模型三角面片求交所生成新网格点Pij的距离。对采样背景上的每像素点做一次遍历,依次求得与原始模型的投影交点,对于具有视线方向高度歧义性的点(像素法线nij与原模型求交可能得到可见与不可见两类点),统一规定选取更靠近观察者的外参考点即离视点较近的可视点,最后将这些点重新生成一张网格曲面,就得到一幅规则化的深度图像。
原三维模型在网格重采样之后,网格拓扑信息被改变,局部细微特征发生微小变形,但从数字浮雕预处理模型要求的角度出发,模型的主体形状并未改变且特征细节并未丢失,考虑到数字浮雕本身属于艺术范畴,认为重采样后的模型可以应用于后续浮雕压缩的研究。不规则网格重采样转换为深度图像的网格曲面,是一种为了利于图像算法直接应用于网格而采用的折中的方法,其特征的保留程度,显然与采样频率有着直接的关系。在实际应用中发现,重采样后的模型不可避免的存在一些梯度较大的区域,见图2所示的深红色部位。在本章后续的浮雕曲面生成研究中,该区域也是提取压缩的难点。需要指出的是,该大梯度台阶区域在后文的频谱分析中,属于频谱信号的高频部分。
2 网格频谱分析
定义一张尺寸为M×N的深度图像视线方向高度函数为f(x,y),其离散傅里叶变换可由下面等式表示:
undefined
类似与一维的离散傅里叶变换,表达式中u,v的取值分别为(u = 0,1,2,…,M-1)和(v = 0,1,2,…,N-1)。同理可得,其傅里叶反变换的表达式如下:
undefined
其中,x = 0,1,2,…,M-1,y = 0,1,2,…,N-1。正如一维的离散傅里叶变换一样,以式(1)、(2)两式正好构成了二维离散傅里叶变换对。其中,变量u和v图像变换后的频谱变量,而x与y即是空间图像变量。因为对称的滤波函数利于构造,故为了方便后期滤波函数的实现,通常会在对某图像进行傅里叶变换之前先进行中心化处理。即对图像乘以(-1)x+y来进行中心变换,从而使得变换后的频率谱图像关于其自身中心对称。对于二维离散傅里叶变换后的结果,可以得到该图像的相角和频率谱:
undefined(3)
P(u,v)=R2(u,v)+I2(u,v) (4)
其中,R(u,v)和I(u,v)分别是离散傅里叶变换F(u,v)的实部和虚部。
在算法实际实现过程中考虑到算法速度的问题,采用了快速傅里叶变换(FFT)进行频谱特征的获取。FFT算法可以更快的得到同普通离散傅里叶变换结果相同的答案,按定义利用普通离散傅里叶变换算法算法复杂度为O(n2),而FFT算法的复杂度为O(nlogn)。由于FFT算法本身要求二维平面长度W和宽度H的值是2的阶乘,为了满足该需要,本算法通过扩延补零的方法即对深度图像的规则二维方向进行了补零扩充处理(图3)。算法中补零的依据是因为之前在重采样的时候定义了背景平面为高度值为0的零参考平面。如果之前定义的背景平面高度不为零,在此扩延操作中对应补上相应的背景高度值。
3 浮雕生成算法
通过以上步骤,对于规则化后的网格进行FFT处理,即可得到深度图像对应的频谱图像。浮雕网格曲面的获得,设计思想是要对频谱能量的高频区进行保留,对低频区进行大尺度的衰减。故设计一个高通滤波器是解决问题的关键。最简单的滤波器是通过截断傅里叶变换后的一段频率成分来达到滤波目的的理想滤波器,有离散傅里叶变换性质可知,该高频成分处在距离变换原点较远的位置,即距离D0取值较大的区域。定义理想二维高通滤波器,其变换函数可以表达为:
undefined
(5)
其中,D0是算法指定的非负距离值,对于理想滤波器称D0为截止频率。D(u,v)是(u,v)点相较于频率矩形原点的距离。在频率域里,定义基本的滤波模型为:
F*(u,v)=H(u,v)F(u,v) (6)
其中F*(u,v)是原离散傅里叶变换滤波后的结果。
由于理想滤波具有较大的跳跃性,通过实验发现对于规则化后的网格进行傅里叶变换得到功率谱,进行理想高通滤波,对原模型的处理造成了较大的失真,(如图4所示,图中截止频率D0长度为0.45×min(Pw,Ph),其中Pw表示规则化外延扩充后背景图像宽度,Ph表示规则化外延扩充后背景图像高度),重塑后的曲面表面噪声较大,故改进滤波器设计,采用高斯高通滤波器,其二维滤波函数由下式给出:
H(u,v)=1-e-D2(u,v)/2D20 (7)
其中,D(u,v)是(u,v)点距频率矩形的原点的距离,σ表示高斯曲线扩展的程度。若使σ=D0表达式可转变为:
H(u,v)=1-e-D2(u,v)/2D20 (8)
其中,D0表示该滤波器的截止频率,当D(u,v)=D0时,滤波器下降到最大值的0.607处。
对应于不同的截止频率D0,模型的高度会有较大的变化。对于高斯高通滤波函数,如果截止频率D0取值较大,即模型整体能量压缩就较多,对应最后模型的整体高度会较低。图5给出不同截止频率D0对应的Dragon曲面模型正面效果图。其中,重采样后的Dragon模型原始高度在进行高斯高通滤波之后模型高度变小,实验D0分别取值为0.05×min(Pw,Ph),0.08×min(Pw,Ph)与0.15×min(Pw,Ph)。注意,该Armadillo模型的Pw值与Ph值并不相同,在截止频率计算选取Pw与Ph较小值。
由图5看出,伴随着D0的增大,虽然模型的整体高度得到了较大的压缩,但同时曲面表面本身的细节的也被严重模糊。见图5(c),Dragon模型在原细节丰富部位细节纹理如头部胡须,躯干部表面鳞片缺失十分严重,同时对于原模型细节并不丰富的特征部位如四肢特征也有所减少。通过抬高频段滤波器的放大倍数可以突出部分的模型细节但同时噪声也被放大,故想要得到理想的浮雕,截至频率半径D0的选取需要多次试验尝试。对于本实验的Dragon模型,当D0为0.05×min(Pw,Ph)模型表面细节纹理较为清晰,具有进一步生成浮雕模型的潜质。正如第1节最后提到的,原网格模型在直接进行重采样之后会产生一些大梯度值的区域,而在直接应用图像频谱分析方法进行分析,该部分区域属于模型的高频信息,在最后滤波压缩函数设计的时候,无法很好的提取该部分信息进行压缩。见图6所示,对于滤波后的网格模型,将该大梯度值区域分为以下两部分:一部分是网格模型的外轮廓边界,图6中深灰色线标出,另一部分是非网格边界内的大梯度区域,下面本文称之为“墙”。由于第一部分边界属于网格模型外边界易于提取处理,在实际浮雕设计中统一定义该边界所有点高度值均为最后浮雕背景平面高度。第二部分大梯度区域即称之为墙的区域,由于墙面上点的提取与高度压缩直接决定了最后生成浮雕的品质,所以下面主要介绍对于“墙”点的提取算法与高度值压缩。
“墙”点与非墙点几何信息区别在于墙点与其一阶环临界点的高度差明显大于非墙点与其一阶环临界点的高度差。定义一表示网格点高度差的变量:
undefined(9)
其中N(i)={j|(i,j)∈E},该变量表示了网格上某点在视线方向的与其一阶环的最大高度差。设定一阈值ε用来控制墙点的取舍。如果网格上某点计算得到的κi大于阈值ε认为该点为墙点。见图7分别给出了不同阈值下墙点的分布情况。
阈值选取的越大得到的墙点个数就少,对于得到的墙点通过压缩函数将其压缩至浮雕预想高度。压缩函数选取:
undefined(10)
对于不同的模型多次试验测试,找到最合适的参数α的值。浮雕预想设计高度越低,参数α的取值越大。如图8所示,通过对数函数作用后墙的高度压缩较为明显,其中参数α取值为10,阈值ε的取值为。
4 实验结果与分析
本文作者在Microsoft Visual Studio 2008平台上通过编程实现了上述算法,硬件配置环境为:CPU Pentium(R) Dual-Core E5200 2×2.50GHz,内存2G。在对输入模型进行删除不可见部分的重采样预处理后,Dragon模型包含27165个顶点,48279个三角面片。
4.1 模型重采样后细节丢失情况讨论
拉普拉斯本章算法中的滤波器设计拟得到功率谱,并曲面的获得,总体如图9所示,在对Dragon模型进行投影重采样之后,观察模型表面细节发现原模型在视线方向可视的特征纹理并未消失,如Dragon模型的头、四肢等主体特征以及触须、鳞片等细节纹理在重采样之后依旧清晰可见。虽然网格拓扑结构虽然发生了变换,但对于本文数字浮雕生成算法研究而言该拓扑结构变换并不会对模型的频谱特征产生大的变换,所以本文提出的重采样预处理过程对于数字浮雕研究是可行的。
4.2 复杂模型实例
对Dragon模型进行浮雕压缩实验,浮雕曲面效果图如图10所示。其中D0=0.05×min(Pw,Ph),在后续的浮雕压缩实验中,α取值10,ε的取值为0.08。从最后浮雕生成效果来看,对于原先细节丰富的三维几何模型,其数字浮雕效果令人满意。生成浮雕表面细节清晰,主体轮廓分明,适合后期加工制作。
通过实验发现,本文算法对模型的边缘提取压缩效果尤为显著。对于那些本身细节并不丰富的模型本算法更为适用。见图11与12,两图分别展示了场景模型Table与Helicopter的浮雕效果。其中Table浮雕模型厚度为0.6277mm,制作的参数选择如下:D0分别取值为0.15×min(Pw,Ph),α取值10,ε取值为0.10。Helicopter模型厚度为0.7552mm,制作的参数选择如下:D0分别取值为0.15×min(Pw-Ph),α取值10,ε取值为0.15。由于该类模型本身表面细节纹理并不突出,利于大特征以及边缘特征的提取,从最后效果看,该类模型最后生成的浮雕类似于刻线浮雕。
5 总结与展望
本文提出了一种基于图像频谱分析的浮雕生成算法。该方法的核心思想是通过对原非规则网格进行规则化重采样,生成深度图像,应用图像频谱分析方法来压缩网格,从而生成数字浮雕。在图像频谱中,模型高度的主要能量集中在频谱的低频段,而梯度变化大的细节信息主要对应于频谱的高频部分,故浮雕生成算法基于频谱分析的研究可以抽象对低频部分的大尺度压缩并对高频部分进行保真处理的方式来实现。通过对多个三角网格模型实例浮雕生成的结果显示,对细节丰富和细节较不丰富的模型均有较好的效果,但该方法在细节控制,高度控制等方面还不够直接,有待进一步的改进。
参考文献
[1]http://en.wikipedia.org/wiki/Relief.
[2]P Cignoni,C Montani,R Scopigno.Computer-assisted generationof bas-and high-reliefs[J].Journal of Graphics Tools,1997,2(3):15-28.
[3]Sun Xianfang,Rosin P L,Martin R R,and et al.Bas-relief genera-tion using adaptive histogram equalisation[J].IEEE Transactionson Visualization and Computer Graphics,2009,15(4):642-653.
[4]W.Song,A.Belyaev,H.P.Seidel.Automatic generation of bas-reliefs from 3D shapes[C].IEEE International Conference onShape Modeling and Applications(SMI'07),2007,211-214.
[5]T.Weyrich,et al.Digital bas-relief from 3D scenes[J].InProc.of the 2007 ACMSIGGRAPH,2007,26(3).
[6]R.Fattal,D.Lischinski,M.Werman.Gradient domain high dynam-ic range compression[J].ACM Transactionson Graphics(Pro-ceedings of ACMSIG-GRAPH2002),2002,21(3):249-256.
[7]赵鹏,边哲.曲面浅浮雕生成算法[J].计算机辅助设计与图形学学报,2010,22(7):1126-1131.
图像生成 篇9
1 图像智能取证技术的背景分析
现阶段,信息资源储存与传输的载体已由纸质媒介逐渐向电磁存储媒介转变,社会各领域开始广泛应用数字图像,其发挥的作用非常关键,就信息采集与发布而言,数字图像的优势是非常显著的。通过对数字图像的利用,人们的工作、生活以及学习中获取的信息服务的质量、效率将更高。特别是随着互联网的发展,作为重要的多媒体信息形式,数字图像逐渐得到充分运用。当然,不可否认,科技的发展有利有弊,尽管在信息资源方面数字图像的优势非常突出,然而该项技术也暴露出一些问题和弊端。
应用数字图像不仅能够有效提升资源的质量和品质,同时还为编辑工作和修改工作提供方便,对于编辑和修改的设备要求也不高,而且通常情况下,在数字图像当中没有修改与编辑的痕迹,这就导致图像的真伪难以辨识。很多计算机犯罪就是由于有人利用非正当途径对数字图像进行编辑与修改引发的,由于数字图像内容被篡改,导致人们无法做出正确判断。如果不正当使用数字图像,对其加以伪造,那么社会的正常秩序就会受到严重影响。而通过智能取证技术,图像防伪就可以取得理想的效果,在先进技术手段的辅助之下,图像取证趋于完善,可以有效查找出图像被修改与编辑过的痕迹。如此一来,数字图像的真实性与可靠性就得到保障,并能够作为重要证据信息得到利用,使图像取证中遇到的困难得到有效解决。总而言之,面向计算机生成图像的智能取证技术,能够使取证的真实性与准确性得到有效提升。
2 图像取证技术的方法与类型分析
2.1 图像取证技术手段的类型分析
为了确保数字图像真伪得到有效鉴别,就非常有必要利用有效的图像取证技术手段,如此才能够保护好取证信息的完整性与正式性,确保其发挥作用。从图形取证的技术来看,主要有两种,一种是主动式的图像鉴别,另一种是被动式的图像鉴别。其中,前者在图像取证技术手段中的应用最为广泛,在水印与数字签名检测中这种方法具有较强的适用性,在版权保护以及证据篡改鉴定等领域当中有较为广泛的应用。而被动式的图像鉴别主要是对自然图像以及计算机生成的图像进行鉴别。二者相比而言,被动式的图像鉴别对水印和签名的嵌入检验没有特别的要求,可以直接对数字图像进行分析,从而有效查找出编辑与篡改等痕迹。如今在被动图像鉴别取证中应用比较多的技术手段已开发了数种,在多个领域都有较为普遍的应用。
2.2 数字图像主动取证
数字图像主动取证主要是为了保护图像信息的完整性与真实性,通过对数字水印技术的有效利用,可以确保图像的完整性。在实际鉴别过程中,图像内容篡改取证的数字水印和图像完整性取证的数字水印是数字图像主动取证中常用的方法。下面就针对这两种技术进行详细介绍。
首先是图像完整性取证的数字水印。这种类型的数字水印对攻击具有较高的敏感度,如果变动其比特,则无法完成图像取证。首先在空间域嵌入二值水印,该水印应是视觉上认为有意义的。与此同时,将该水印的特征和信息进行映射,并且映射是随机的,以1和0表示,从而形成一个二维的列表,作为后续程序的依据,从而实现量化空间域中的像素的目的。在相关数据得以量化之后,就需要嵌入视觉上认为有意义的二值水印模式,同时借用JPEG量化矩阵,然后对小波系数进行压缩,再加上水印,可以准确定位水印图像的篡改。在JPEG量化后,还需要借助DCT低频系数,其目的在于对原始图像进行编码,嵌入数据,从而使得图像获得理想的效果。针对该类型的数字水印,主要的研究成果就体现在上述的方法之中。
其次是图像内容篡改取证的数字水印。该类型的数字水印相对上述的数字水印而言,其选择性更强,所以也将其称为内容取证或者模糊取证,这种技术手段与半脆弱水印有一定的相似性,主要体现在鲁棒性与敏感性,也就是合法失真与不合法失真上。将鲁棒水印与半脆弱水印同时嵌入来保护图像版权,与此同时,持续进行图像完整性取证。在拍照的过程当中,利用鲁棒水印与半脆弱水印,可以在更大程度上为图像的拍摄提供安全保证。另外,如果能够在取证的过程当中充分利用MSB-LSB半脆弱水印框架,则更加有利于图像取证和版权保护。除此之外,在图像取证与版权保护中进行有效应用,还可以识别图像内容篡改。同理,该部分的研究也是图像内篡改数字水印理论研究中常用的内容。
2.3 数字图像被动取证
与自然图像篡改取证对比来说,计算机图像取证方面的技术研究和理论研究要薄弱一些。针对计算机生成图像的取证技术,主要技术手段在于分数维空间与整数维空间。其中,在整数维空间中,当需要提取小波域的统计特征时,则所要求的参数具体包括方差、偏态、空间域均值、峰态等。在分类中主要用到了特征向量方法。另外,对于分数维空间而言,自然图像与计算机生成图像相比存在一定的不同之处,计算机生成图像需要提取图像的固有差异特征,然后针对这些提取的信息进行分析,如此实现辨识真伪的目的。
虽然计算机生成图像取证技术在不断发展,但是与自然图像取证技术的研究成果相比而言,仍然存在一定的差距,还需要继续进行技术研发和提升,并且要不断完善相关理论。
3 面向计算机生成图像的智能取证技术研究
3.1 基于高阶统计量的计算机生成图像检测取证算法
首先,要明确图像的具体来源,明确其是自然图像还是计算机生成图像,提取图像的基本特征,并对其进行测试,随后还需要在分类器中输入数据,通过比较自然图像与计算机生成图像来判断图像,而算法的精准度则影响到判断的准确性。为了有效提高计算机生成图像的检测取证算法的精确性,在图像特征值这一板块,可能需要用到技术特征函数的高阶统计量。计算机生成图像是计算机对真实场景的重现加以利用,以此来提高图像真实性。该方法与自然图像物理成像对比而言,还是具有较大的不同之处的,即自然图像的连续性和相关性更为显著,而计算机生成图像在这方面就比较缺乏。在高阶统计量的基础之上,来进行计算机生成图像检测,该过程需要根据小波变换的多频率和多尺度进行,从而才更有利于提取高阶统计量特征,进而才能实现对图像来源的区别。以下是有关这种算法的具体分析。
在高阶统计量的检测算法中,Farid属于一种基础性方法。这种方法尤为注重特征提取算法,需要对样本图像进行相应的计算,然后提取其中的特征值。该过程需要对分类器模型进行针对性设计,进而才能对最终获得模型进行分类判决,然后区分图像。Farid采用了四镜像滤波器,其可以求取高阶统计量特征值,在一系列步骤后获取四个子带,选取低通子带进行重复操作。步骤是首先分析子带的差别,然后对已获得的统计特征值进行描述,随后开始特征值的计算。此外,该阶段还需要选择最优线性预测器准则,从而才能更科学地获取其他部分特征值,利用小波对系数进行三次分解,如此可以实现对误差的准确预测。在检测精度与检测取证效率的提升方面,SVM非线性分类器产生的作用是非常积极的,在AdaBoost分类器的基础上,需要输入高阶统计量特征值,并根据不同模型判决器来区分不同的图像,以实现对图像的智能取证。
3.2 基于多维特征提取的计算机生成图像检测取证算法
该算法往往需要在变换域和空间域上提取图像统计特征,尤其是3D工具对图像的生成,可以提高检测的准确性与有效性,然而受到数学模型成熟度不足的影响,其没有得到进一步的推广和普及。除此之外,Farid的高阶统计量检测取证算法仍然在应用上受到一定的限制,所以主要用于小波域计算,而没有更多地关注到时域特征。由此一来,这种算法的检测精确性会有所下降。另外,在多维特征向量的提取中,检测方法充分利用基于多维特征提取的计算机生成图像检测取证算法。这一算法更加强调图像的HSV上的颜色特征与边缘检测特征,与识别CCD噪声方法相比,这种方法具有更高的检测精度。从图像的本身来看,其颜色不只是一个基本的组成部分,而且也是一个非常关键的内容,所以必须要高度重视颜色的特征,同时获取空间域,对颜色的特征进行量化分析,并以向量的方式来表现图像的空间域特征。由此一来,才能更好地获取图像的饱和度和亮度。在平衡噪声抑制与边缘检测的过程当中,主要的程序就是利用平滑滤波的方式来处理原始图像,从而有效强化边缘,进而才能更好地进行阈值分割,然后才能实现对边缘图像的检测和获取。对于需要借助高阶统计量技术来获取的图像特征值,则更有利于后续的图像检测取证,可以提高计算机生成图像的清晰度,如此区分自然图像就更加容易。再加上仿真试验的应用,可以准确测试出图像的精确度。
4 结语
综上所述,面向计算机生成图像的智能取证技术,在图像信息的完整性与真实性保护中发挥着关键作用,该项技术能够使数字图像编辑与篡改得到有效控制。通过分析计算机生成图像的基本特点发现,借助计算机生成图像取证技术,可以提高图像的精确度,加大对基于多维特征提取和高阶统计量计算机生成图像检测取证算法的应用和研究,从而明确计算机生成图像与自然图像之间的差异。我们必须针研究图像检测取证算法,将这一科学技术充分应用到社会当中,为社会的发展与进步提供强有力的保障。
摘要:笔者分析了图像智能取证技术的背景,介绍了图像取证技术的方法与类型,针对面向计算机生成图像的智能取证技术进行研究与探讨,希望能够为信息技术的发展与进步提供理论支持。
关键词:计算机,生成图像,智能取证技术
参考文献
[1]李庆华.面向计算机生成图像的智能取证技术研究[J].信息技术与信息化,2016(1):100-102.
相关文章:
安全网格化工作制度01-07
消防安全实战化标语01-07
安全网格化管理方案01-07
人员流失对策01-07
危化安全生产责任制01-07
图像认证01-07
数字图像处理图像描述01-07
广东省公共安全视频图像信息系统管理办法(广东省人民政府令第132号)01-07
图像安全01-07
手绘线条图像立体图像的表达说课稿01-07