图像(精选十篇)
图像 篇1
边缘检测常常是进行图像分析和理解的第一步。医学图像边缘检测可以提取准确、可重复、可量化的病例数据,为生物医学研究和临床诊断提供必要的基础,它在医学图像匹配、肿瘤病变确定、造影血管检测、冠心病诊断、左心室边缘提取等方面占有举足轻重的地位。医学图像如CT图像的主要特点表现为:对比度低、组织特性具有可变性主题、不同软组织之间或软组织与病灶之间边界较模糊、形状结构复杂。针对医学图像的特点,构造既能检测到目标的精确位置,又可以抑制无关细节和噪声的算子一直是医学处理领域的难点和热点[2]。多年来,人们针对医学图像处理做了大量的研究,不断提出新的方法和算子,包括图像滤波、边缘检测、图像分割、图像增强等技术。利用均值滤波、中值滤波、自适应中值滤波等滤波方法去除图像的噪声,利用迭代法、熵阈值法[3]和Otsu[4]等阈值法对图像进行分割。
1 图像阈值分割方法简述
1.1 迭代阈值分割方法[5]
迭代法在初始条件中假设一个阈值,在对图像的迭代运算中不断更新这一假设阈值,以得到最佳阈值。初始阈值一般取灰度平均值,利用这个初始的开关函数把图像分割成为目标和背景两类区域,然后分别对其进行积分并将结果取平均以获取一新阈值,将此新阈值控制开关图像分成目标和背景,并用作新的开关函数。如此反复迭代下去,直到开关函数不再发生变化,即迭代已经收敛于某个稳定的阈值时,迭代停止。此刻的阈值即作为最终的结果并用于图像的分割。以T0初始阈值的估计,则迭代中阈值的第k次估计为:
式中L为灰度级的个数;hk为灰度值为k的像素点的个数;Tk就是得到的最佳阈值。因为医学CT图像背景是黑色的,这对利用灰度均值迭代得到最佳阈值有很大的影响,所以需先将医学CT图像从黑色的背景中提取出来,再进行颅骨与其它脑组织的分割,这样迭代得到的最佳阈值可以达到最优。考察任意像素的八连通域的像素灰度,如果均小于图像灰度均值,则该点为黑色的背景点。
改进的迭代阈值分割算法步骤:
1)求出图像中的最小、最大灰度值Z1和Zk;
2)计算图像灰度均值T0=(Z1+Zk)/2;
3)对于每一个像素,以自身为中心选取一个矩形窗口(尺寸一般是奇数),并确定与其相邻的8个邻域D(ii=1,2,...8)(不包括中心像素);
4)分别计算每一邻域像素和中心点像素的灰度值mi,若mi>T0继续2步,直到mi
5)迭代求得最佳阈值。
1.2 最大类间方差方法(Otsu法)
Otsu法[6]是一种依据类间方差最大化为最佳判别条件的分割方法,具有简单、高效的特点。基本思想:
假设目标O和目标B的概率分别为:
均值分别为:
整幅图的均值:
类间方差定义为:σB2=ω0(u0-uT)2+ω1(u1-uT)2
让t在[0,L-1]之间取值,使图像的两部分距离最大的阈值就是Otsu法的最佳阈值。
2 图像轮廓的提取方法
从本质上说,图像边缘是图像局部特性不连续性(灰度突变、颜色突变等)的反映,它标志着一个区域的终结和另一个区域的开始,这种不连续性可利用梯度算子等边缘提取算子检测得到。轮廓提取是边界分割中非常重要的一种处理,同时也是图像处理的经典难题,轮廓提取的目的都是获得图像的外部轮廓特征[7]。
创建一个结构体:
其中包括点的横纵坐标(x Wide,y Height),标志变量idx,图像点的灰度值gray。
由于医学CT图像的特性,可以使用下属方法提取图像外部轮廓,对整幅图像进行扫描,利用背景与目标物的灰度突变来获取外部轮廓的边界点信息,并将边界点信息存于一个结构体数组struct Information message[]中。
2.1 对原图像进行预处理——中值滤波
中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术[8],中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。
方法是取某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。
二维中值滤波输出为:
其中f(x,y),g(x,y)分别为原始图像和处理后图像。W为二维模板,通常为2*2,3*3区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等。
2.2 算法描述
1)设定初始值:Zmin,Zmax
2)横向扫描图像像素点f(x,y),条件:0≤x≤Im g W,0≤y≤Im g H
其中Img W为图像最大宽度;Img H为图像最大高度.
3)横向向后扫描:
若成立,则将该点的信息记录到结构体数组message[]中,并转入(4);
若不成立,则循环(3);
4)横向向前扫描:
若成立,则将该点的信息记录到结构体数组message[]中,并转入5);
若不成立,则循环4);
5)一行扫描完毕,则y++,返回循环执行3);
整张图像扫描结束后,再对图像进行纵向同理扫描(同理横向扫描)。
2.3 轮廓内点的提取
对轮廓内点的提取的方法:
1)对结构体数组message[]中的数据按照有y Height进行排序。
2)以行为基准,将[mes sage[].x Widemin,mes sage[].x Widemax]之间的点存于结构体数组message[]中。(行的范围∈[mes sage[].y Heightmin,mes sage[].y Heightmax]),扫描结束得到点集合U1。
3)对结构体数组message[]中的数据按照x Wide进行排序。
4)以列为基准,将[mes sage[].y Heightmin,mes sage[].y Heightmax]之间的点存于结构体数组message Y[]中。(列的范围∈[mes sage[].x Widemin,mes sage[].x Widemax]),扫描结束得到点集合U2。
5)整幅图像轮廓内的点的集合为U=U1⋂U2。
3 实验
按照上述图像轮廓提取的算法,将轮廓内的点运用于阈值分割算法,得到的结果如下:
3.1 医学CT肝脏图
3.2 医学CT脑颅图
对分割的结果进行的说明:如图所示,图2是全局阈值分割后的结果,图3是轮廓内区域阈值分割的结果,从对比结果可以看出,用轮廓内的阈值分割方法比用全局的阈值分割方法对肝脏医学CT图像进行分割得到的癌变区域要清晰得多,边界的轮廓也更清晰,椒盐颗粒更少。图5是全局阈值分割后的结果,图6是轮廓内区域阈值分割的结果,从对比结果可以看出,用轮廓内的阈值分割方法能够更准确的定位双眼的位置及双眼轮廓边界。
4 总结
针对肝脏CT图像特征,本文提出了一种基于轮廓的分割方法,能够更准备的分离出图像中的感兴趣的区域,即肝脏癌变区域。在对人脑CT图像的处理中,可以准备的定位人的双眼。在本文方法中,基于常用的一些方法用于图像的预处理,如图像滤波、图像增强等,基于轮廓的图像分割能够更准备对特定感兴趣区域进行定位及识别。但是,对于整幅图像的阈值分割的效果并不完整,有待改进。
摘要:医学图像分割是医学图像处理中最基本和最重要的技术,其目的是把图像空间分割成一些有意义的区域。利用现在的图像处理技术来处理医学图像,比如获取发生癌变肝脏图像的效果并不是很明显。针对如何获取较清晰的特定感兴趣区域供医生辅助判断,本项目提出了一种基于医学图像轮廓的图像分割方法。其核心思想是用一种新的算法将组织器官图像的轮廓提取出来,然后对轮廓中的区域进行阈值分割。
关键词:医学图像,图像处理,辅助判断,轮廓,图像分割
参考文献
[1]郭敬,秦茂玲,赵文莉.关于医学图像分割的综述[J].信息技术与信息化,2010,5(5):50-53.
[2]鲁胜强,刘瑞玲.基于最大目标函数的医学图像边缘检测[J].计算机与现代化,2011(6):5-10.
[3]周德龙,潘泉,张鸿才,等.最大熵阈值处理算法[J].软件学报,2001,12(9):1420-1422.
[4]OTSU N.A threshold selection method from gray-level histogram[J].IEEE Transactions on Systems Man and Cybernetics,1979(1):62-66.
[5]孟颖.医学CT图像的改进阈值分割算法研究[J].电脑学习,2008.08(4):42-43.
[6]张群会,李贵敏,蔺宝华,等.基于最大熵-方差模型的图像分割方法[J].计算机技术与发展,2011,6(6):42-46.
[7]刘浩,董超俊.融合边缘检测与区域生长的交通图像分割方法[J].Journal of Transportation Engineering and Information,2007,9(3):116-120.
数字图像处理之图像复原总结 篇2
图像采集、传送和转换过程中,会加入一些噪声,表现为图像模糊、失真和有噪声等。
图像复原技术是根据图像退化的先验知识建立一个退化模型,以此模型为基础,采用各种逆退化处理方法进行恢复,得到质量改善的图像
图像噪声模型
CCD摄像机获取图像时,光照强度和传感器的温度是产生噪声的主要原因。
噪声:不期望接收到的信号(相对于期望接收到的信号而言)图像噪声按照噪声和信号之间的关系可以分为加性噪声和乘性噪声。
加性噪声一般指热噪声、散弹噪声等,它们与信号的关系是相加,不管有没有信号,噪声都存在。一般应该考虑为高斯噪声吧
1.高斯噪声(正态噪声)----源于电子电路噪声和由低照明度或高温带来的传感器噪声,CCD噪声
高斯噪声可以通过空域滤波的平滑或者图像复原技术来消除 P(z)= 1/(sqrt(2*pi*σ))*exp(-(z-μ)^2/(2*σ^2))
2.椒盐噪声--(双极)脉冲噪声(成像中的短暂停留,例如错误的开关操作)P(z)=Pa,z=a Pb,z=b 0,other
椒盐噪声是指图像中出现的噪声只有两种灰度值,分别是a和b,这两种灰度值出现的概率分别是Pa和Pb 均值是 m = a*Pa+b*Pb
方差是 σ^2 =(a-m)^2*Pa +(b-m)^2*Pb
通常情况下,脉冲噪声总是数字化为允许的最大值或最小值。负脉冲为黑点,正脉冲为白点。因此该噪声称为椒盐噪声,去除噪声的较好方法是中值滤波
3.均匀分布噪声(模拟随机数产生器)均匀分布噪声的概率密度函数为: P(z)= 1/(b-a),a<=z<=b*Pb 0,other
均匀分布噪声的期望和方差分别为: m =(a+b)/2
σ^2 =(b-a)^2/12
4.指数分布噪声(激光成像)指数分布噪声的概率密度函数为: P(z)= a*exp(-a*z),z>=0, 0,z<0
指数分布噪声的期望和方差分别为: m= 1/a,σ^2 = 1/a^2
5,伽马分布噪声(激光成像)伽马分布噪声的概率密度函数为:
P(z)=(a^b*z^(b-1))/(b-1)!*exp(-a*z)伽马分布噪声的期望和方差分别为: m = b/a,σ^2 = b/a^2 6.瑞利噪声
空域中的滤波复原
均值滤波复原 算术均值滤波器 几何均值滤波器 逆谐波均值滤波器
可以用于消除椒噪声或者盐噪声 顺序统计滤波复原
中值滤波、最大值滤波和最小值滤波
中值滤波可以很好的保留图像的边缘,非常适合去除椒盐噪声,效果优于均值滤波 二维中值滤波 J = medianfilt2(I)
最大值滤波器也能够去除椒盐噪声,但会从黑色物体的边缘去除一些黑色像素
最小值滤波器会从白色物体的边缘去除一些白色像素 二维排序滤波 J = ordfilt2(I,order,domain)最大值滤波 J = ordfilt2(I,9,ones(3))最小值滤波 J = ordfilt2(I,1,ones(3))自适应滤波复原
wiener2()自适应维纳滤波
图像复原算法
逆滤波复原
在频域上使用退化后观察得到的图像频域值来除去退化函数,得到近似于原图像的估计图像,然后通过傅里叶逆变换得到原图像的估计值
维纳滤波复原(对运动模糊图像进行复原)deconvwnr()进行图像的维纳滤波复原
约束最小二乘法复原 deconvreg()
Lucy-Richardson复原
deconvlucy()采用加速收敛的Lucy-Richardson算法对图像进行复原
盲解卷积复原
何汶玦 图像、叙事与反图像 篇3
上世纪90年代末期,因为《水》系列,何汶玦引起了美术界的关注。但是,由于没有明确的社会主题,也不具有意识形态的指向性,因此,在一些人看来,即便《水》系列有表现性的倾向,仍然流露出浓郁的学院气息。之所以产生这样的认识,是因为1990年代的当代绘画被三种主导性的话语所支配。一种是“玩世现实主义”,即以调侃、反讽的方式面对现实。另一种是“新生代”,即以“近距离”的观照表现“无意义的现实”,以此消极80年代中期形成的宏大叙事。第三种是“政治波普”以及“泛政治波普”的流行。显然,《水》与这三种创作思潮均有很远的距离。然而,《水》却带来了一股活力,为当代绘画重新注入了抒情性。画面被悠远、深邃的蓝色,或者清澈、明亮的绿调子所统辖,宁静致远;一个游泳者荡漾在水中,身旁泛起的涟漪,在一静一动之间,显得从容自在。自1980年代初的“知青题材”之后,作为一种审美取向,抒情性被社会学叙事排斥到边缘,然而,同样是对个人存在的表达,《水》系列开始自觉地远离由犬儒、“近距离”形成的话语,呈现一种更为个人化的、自由的存在状态。
《看电影》系列标志着何汶玦创作的一次重要的转向,此后,图像成为作品的中心,既是作品的内容,也是生成叙事的起点。面对《看电影》,我们不禁会思考这样的问题,这些作品有“元图像”吗?艺术家是用什么标准选择图像的?背后的图像逻辑又是什么?何汶玦的母亲曾是一位电影工作者,受母亲的影响,耳濡目染,他很早就迷上了电影。但是,如何将电影中的图像转化为绘画,对于艺术家来说,这里必然有一个选择的问题。透过《看电影》系列,我们可以看到这些图像背后的生成逻辑,首先是艺术家从自我的青春经历,在个人化的视觉记忆中寻找那些难以忘却的画面,或者是寻找那些曾在社会上产生过重要影响的影片,如《红高粱》、《大红灯笼高高挂》等,或者直接从“大片”中选取一些视觉镜头。《看电影》逐渐发展成为一个宏大的工程,艺术家力图建立一个与电影相关的图像系统,其中,既有个人化的视觉记忆,也包括那些能反映某个时间节点的集体记忆的影像切片。在审美取向上,何汶玦延续了《水》系列中的抒情性,同时融入了古典、唯美的因素,在一部分作品中,还注入了淡淡的怀旧气息。就作品的图像表达来说,在批评家余丁看来,“何汶玦在这些作品中,极为重视对于图像的选择,那些如同影片定格的画面,充满了一种里希特式的崇高感,画面中的人物如同纪念碑一般凝重。显然,这些选择自不同电影的图像,具有强烈的叙事性,这种叙事性强化了作品的图像力量,这也是何汶玦作品在这个系列当中最重要的风格特征。”
事实上,追溯起来,当1839年摄影术发明之后,西方现代绘画就对即将到来的图像时代保持着足够的警惕。按照本雅明后来的解释,机器复制时代的图像生产既会消解艺术品神圣的“光晕”,也会让传统绘画对现实世界“模仿”的合法化危机进一步加剧。于是,从印象派的第一代艺术家开始便逐渐放弃文艺复兴以来近五百年绘画模仿和再现现实的传统,因为此时对真实世界的再现正被摄影所代替。而对于绵延了近一百年的现代主义传统来说,现代绘画必须回避表象世界,脱离被描摹的客体,惟其如此才不会丧失自身的本体价值,才不会被图像时代吞噬。正是秉承了一种精英主义的文化立场,以及对大众文化工业的图像生产的警惕,西方现代绘画立足于原创的、个人化的形式革命,希望借助“形式自律”构筑一个庞大的乌托邦世界,最终却走向了反图像的道路。西方现代主义绘画之所以要拒绝图像,实质也就是在拒绝中产阶级和大众的观看经验。更重要的是,在他们看来,中产阶级和大众的视觉与审美经验是由文化工业塑造的,是机械复制时代形成的,因此是庸俗的、低廉的。反图像因为1960年代兴起的“波普”艺术而走向了终结。波普艺术的一个重要特点,就是利用图像、占有图像,而且这些图像是批量生产的、可以复制的、性感的、可以被消费的。正是由于波普艺术的存在,图像的地位在绘画领域才重新得以合法化,尤其是那些来源于日常生活的图像才能堂而皇之地进入艺术作品中。
何汶玦的绘画并不是对表象世界的再现,严格说来,是对电影图像的转译,而且这些图像从一开始就是“二手的”,是由文化工业制造出来供大众消费的。“波普”之所以最终使图像具有了合法性,除了遵从自身的艺术史逻辑外,即对西方抽象表现主义的反驳,及其力图消解艺术与生活之间的鸿沟,同时,也得益于上世纪60年代欧美进入一个高速的图像生产与消费的时期。而实际上,何汶玦以“转译”电影图像的方式介入当代,同样也得益于1990年代后期,中国社会已进入一个由公共传媒网络所构成的“图像时代”,因为随着摄影技术向多元化方向的发展,以及视觉文化工业与互联网的进一步繁荣,例如电影、电视、摄影、绘画、广告、动漫、游戏、多媒体等,共同构成了一个强大的视觉——图像系统。今天,西方的一些理论家喜欢用“景观社会”、“仿真的世界”这些术语来概括这个建立在“视觉图像”基础上的信息时代。正是在这种社会条件下,图像在绘画中的表达才具有了新的可能,图像的叙事逻辑才能真正建立。但是,从何汶玦对图像的处理方式上看,主要还是“挪用”,亦即是说,《看电影》的每一件作品背后,都存在一个“元图像”,它能跟绘画形成一种“互文性”。因此,倘若要真正解读这些绘画背后的图像意义,就必然会涉及到两个核心的问题。第一个问题是,这些来源于电影中的图像是被文化工业生产的,是批量复制的,是供人消费的。所以,这些图像及其图像背后的叙事必然会被某种权力话语与机制所建构。然而,对于大众来讲,面对这些图像,他们只能被动地接受,而在接受的过程中,也就悄然地被某种话语所支配。这自然会引发第二个问题,因为这些绘画是“互文性”的产物,假如观众没有看过或知道艺术家所选择的是那部电影,那么,画面自身的意义就会残缺。所以,何汶玦需要妥协,他需要制造一些线索,抑或是借助画面形成的独特氛围,让观众进入画面,从而调动观众的“观看”,引诱其产生某种情绪,而在这个过程中,图像也扮演了意义索引的角色。
《日常影像》系列反映出何汶玦对图像的生产机制、话语权力、图像叙事等问题的进一步思考,也是其艺术创作轨迹推进之后的产物。当西方法兰克福学派在批评文化工业批量生产的时候,在美国艺术批评家格林伯格看来,由文化工业生产的图像大多都是媚俗的、低级的。然而,按德波和波德里亚等人的理解,西方“景观社会”的一个基本特征是,图像制造了一种现实的幻想,它们远比现实看上去更真实。实际上,当何汶玦告别《看电影》时,他就力图远离“二手的图像”。因为,那些电影画面与电影叙事是被潜在的话语权力所支配的,对于现实来说,它们在建构某种现实的表象的时候,实质也是对现实的遮蔽。在《日常影像》中,艺术家成为了真正的图像创造者,而不是《看电影》系列中被动的接受者。艺术家开始将目光投向了个人周遭的现实生活,而这些现实都是日常的、微观的、片段化的,比如台球室、手术台、打麻将等。按照过去社会主义现实主义的传统,这些片段化的现实是无法入画的,不是主题性的,也是无意义的。《日常影像》恰好反映了这样一种努力,就是要质疑过去那些由权力话语控制图像生产的视觉机制,相反呈现出置身于一个图像化的时代,人人都可以是图像的制造者,体现图像生成的平民性,日常性。从这个角度讲,图像的祛魅成为了可能。然而,多少充满悖论的是,当艺术家成为图像的生产者、编码者的时候,在《日常影像》中却隐藏着反图像的倾向。当然,这里的“反图像”与西方现代主义历程中的“反图像”是有差异的。在《日常影像》的系列中,反图像的特质来源于艺术家在创作要结束之时对此前画好的图像或画面效果进行的“破坏”。那些由刮刀留下的各种痕迹似乎具有双重的作用:一方面流露出艺术家对绘画性的迷恋,以及对新的语言和技法的探索;而另一方面则是让画面显得不完整,甚至有些残缺,从而为观众的解读设置障碍。如果说在《看电影》系列之中,艺术家是尽力让观众进入画面,使其被画面的情绪所感染,那么,《日常影像》中的“破坏”则有意让观众的观看受阻,使通畅的、一目了然的观看被迫中断。一言蔽之,《日常影像》既在生成一种反宏大叙事的图像,却又试图构建一种“无意义的意义”;在质疑既有的图像生成机制的同时,又对图像自身的真实性保持着警惕。
基于图像分类的图像美学评价研究 篇4
随着计算机智能化的程度逐步发展,计算美学(computational aesthetics)[1]走入了人们的视线,渐渐得到计算机各领域研究人士的广泛关注。但是由于美学的主观性和复杂性,图像美学的研究还处于初步探索和萌芽阶段,目前为止并没有成熟的方法。各专家学者都致力于寻找带有创造性的,对审美评估具有重大影响的美学特征描述,也试图从人类认知方式上研究如何将计算机审美智能化。但是过多的特征描述会使审美评价结果中庸化,反而失去了原本的意义,而从人类认知出发的各项研究都较为繁复,因为人的视觉系统本来就难于分析。
合适的图像美学描述[2]在对图像进行美学价值分析中具有关键作用。如何选择合适的美学描述对图像审美也起着至关重要的决定性作用。经过研究分析,从国内外各学者的实验结果中,不难发现,对于不同类别的图像,影响其美学评价的关键性描述是完全不同的。
为此,寻找图像类别与审美规则之间的关系,并以之作为突破点,建立新的图像审美方式则成为一个新的研究思路。
1 图像内容对审美的影响及分类设计
1.1 图像内容影响力验证
本课题中,提出了一种假设:图像内容对于图像的审美有着先验性的影响,不同内容的图像可划分为不同的类别,各种类别的图像审美标准也有着一定的差异。接下来的研究将对这一假设进行验证。
课题中选取了一部分具有代表性的图像特征进行审美计算,其中全局特征和局部特征各占约50%,能较好地反映图像类别与图像审美特征的对应关系,同时也能体现出全局特征与局部特征两大类图像特征在审美评价时对图像不同类别的敏感程度。对单一特征审美结果与图像标签的一致性的统计结果如表1所示。
表1说明对于不同类别的图像,各审美特征有着不同程度的影响,甚至有的审美标准与公认判断的审美标准大相径庭,因而并不应该成为这一类图像计算机审美的依据。同时,也证明了图像分类对于计算机审美有着不可忽视的重大作用,如何更好地利用图像内容的差异来帮助计算图像审美价值就成为接下来的研究重点。已有研究表明,基于图像内容将图像进行分类,作为审美评价的一种预处理是可行、且有效的。
1.2 审美特征分析
目前,大多数对图像的分类方法都是基于图像检索的图像内容分类方法,重点在于“匹配”,而图像审美则更注重于什么样的图像内容会带给人更高程度的美学感受,这是基于图像审美的图像分类方法设计首先需要考虑的问题,也是其中的关键问题之一。
通过已有研究对图像可提取的各种特征的分析可见,色彩是审美中比重很大的一部分,可以从颜色分布,颜色对比,颜色和谐性[3]等多个角度对图像进行审美。这些特征对于评价彩色图像也确实能够得到比较理想的效果,但是对于黑白图像,则完全没有作用,不仅浪费了计算时间,也由此降低了黑白图像其他特征所带来的审美效果。
除颜色信息外,图像的主体区域识别和理解也在相当程度上影响着图像审美的标准。人在审美时对于不同的图像内容多会从不同的角度去欣赏,这作为图像审美的重要依据,需要从提取图像主体区域得到全面应用,以实现更科学,更符合主体认知角度的计算机图像审美系统。
为了更好地进行计算机图像审美,图像主体区域的识别和分类不能只依托已有的用于图像检索或者图像理解的分类方法。由于计算机图像审美是一个全新的目标,就需要从以往的分类标准中,提取和构造适合图像审美特征并且能够帮助图像审美评价的分类方法。
1.3 图像分类方法设计
经过对前文研究结果的分析,以及对各种图像特征的含义进行延展,可得出用于图像审美的图像分类首先需要给出如下几个目标:
(1)明确颜色信息的有效范围;
(2)更好地运用亮度元素;
(3)将有主体图像和无主体图像区别对待;
(4)依据大众的审美习惯,将图像主体划分;
(5)分类结果要具有一定的纠错性。
基于以上原则,可将图像分为如下几类:黑白图像、夜景、静物、动物(包括人物)、人脸、风景、无主体图像。分类方法详述如下:
(1)计算图像饱和度[4]如公式(1)所示,饱和度为零的为黑白图像分类;
undefined
其中,max为RGB中最大值,min为最小值,l为亮度;
(2)计算图像亮度分布函数:
undefined
亮度较低的60%像素点的平均亮度值低于50,其分类为夜景图像。深色像素比例越高,图像为夜景图像的概率越大;
(3)用sobel算子边缘检测[5]进行前景背景分离,计算公式为:
undefined
提取图像的主体区域,无闭合边缘的图像为无主体图像;
(4) 对于有主体的图像进行内容识别[6],计算其主体属于静物、动物和人脸的概率,剩下的概率为风景内容图像;
(5) 若图像无明显主体,则将其内容定义为风景图像;
(6)对图像进行分类后,会得到一个7维向量,存储这幅图像属于上述7种图像类别的概率。
1.4 图像分类结果处理
对于以上所提出的七个图像类别,待分类图像可能不仅仅属于其中的一个类别。例如一幅图像是夜景图像的概率可能为0至1之间的任意数值,根据其像素亮度分布函数进行断定;若一幅图像有主体区域,则其内容为静物、动物、人脸、风景的概率和为1。待分类图像的分类结果为一个7维向量,记录这幅图像属于各个图像类别的概率值,7个数值的和基本上不为1。但可以将向量归一化,使7个数值的和为1。将此向量作为图像的预分类结果,即此图像属于各个分类的概率分布函数。
2 图像类别与审美特征的对应关系研究
2.1 图像类别对应的敏感特征集合确定
在进行图像类别对图像审美影响的实验时,每种图像特征根据已实现的研究都有一个基础模型,对于图像审美价值都可以附上这幅图像是“好”还是“坏”的标记。
人工分类完成,并附注了标签的图像用一种审美特征进行计算,分别记录所有“好”图像和所有“坏”图像用此审美特征进行评价所得的计算值,如果两个值有明显差异,证明此特征对于这一类图像的审美评价有影响;如果两个值差异较小,证明此特征对于这一类的图像没有审美帮助,因而不属于此类图像所对应的敏感特征集合。
2.1.1 数值特征
(1)符合单调函数规律的特征
对“好”图像和“坏”图像的特征值分别求其平均,若两个平均值之差小于特征全部平均值的10%,则认为此特征对这一类别的图像没有明显评价作用,反之则将此特征加入这一类图像的敏感特征集合。运用贝叶斯最小错误率规则如图1所示,确定分类标准,即阈值。
(2)符合门函数规律的特征
对于这一类图像特征,需要确定两个阈值以作为上、下界。本课题中首先采用平均值的计算方法,配合贝叶斯最小错误率规则进行阈值计算,但由此得到的参数并不准确和科学,且由于要确定两个参数,也要考虑这两个参数之间彼此产生的交叉影响。
经过分析和研究,决定采用以下算法实现阈值参数的迭代求取,具体步骤为:
(1)首先对所有“好”图像的特征求取平均值x;
(2)在所有图像特征分布中,以x为分界线,对小于x和大于x的“坏”图像特征值分别求取平均值a、b;
(3)坏”图像特征中心a、b与“好”图像特征中心x的差小于特征全部平均值的10%,则认为此特征对这一类别的图像没有明显评价作用,反之将此特征加入这一类图像的敏感特征集合;
(4)此时为迭代的第一轮,特征的上、下限分别为:
min1=0.5(a+x),max1=0.5(b+x) (2)
(5)以此分界线重新计算“好”图像的特征中心和“坏”图像的两个特征中心,再根据这新的特征中心计算新的阈值;
(6)迭代计算上、下限直至matlab所支持的精度,得到阈值minn和maxn作为审美的结果标准。
2.1.2 位置特征
前景、背景分离可确定主体区域的中心,三分法则和黄金分割法则都在图像中确定了4个最优点,以突出物体与这4个点的最近距离作为图像的相应特征。
边缘检测得到的图像线性元素特征,可用直线距离计算函数,计算其与两个对角线的最近距离作为审美特征。
2.2 特征集合的权值确定
对于已经确定的敏感特征集合,运用已确定的分类标准再次对图像进行审美评价,结果标注为1和-1;测试所有此类图像,统计符合此特征审美标准计算结果的图像所占总图像的比例,可得到此特征对于这一类图像审美的可靠程度。
统计图像分类的敏感特征集合中每个特征的可靠程度,归一化之后,再根据此向量值设定特征的权值。将全部七个图像类别的特征权值向量合并至一个矩阵中,则形成审美特征在图像分类前提下的权值表。
3 功能测试和系统分析
3.1 系统流程及实验结果
用于系统测试的图像共有200幅,分类的混合矩阵[7]如表2所示。
根据以上公式可计算得出系统的分类评价指数如表3所示。
由审美结果的评估数据来看,本系统较好地实现了模拟人类对图像的审美评价,其中得到的查准率尤其可观,即判定为“好”图像的审美结果就具有极大可能使用户感到愉悦。但同时查全率较低,则表示也有一部分用户认为审美价值较高的图像并没有被系统识别出来。
3.2 系统不足分析
系统在呈现了对审美有效预测的同时,也仍有着不足之处。分析归纳后,主要表现为以下几点:
(1)图像分类方法设计得不够人性化和精细;
(2)图像内容识别技术的限制;
(3)审美特征计算不够精确;
(4)图像好坏的分类标准确定得不够细致;
(5)图像的多元化理解和个人偏好造成的审美标准偏差。
4 结束语
本文首先验证了不同类别图像在审美标准上的差异性,为图像审美课题今后的研究工作提供了新的思路。文中提出了专门用于计算机图像审美的图像预分类方法,拓宽了图像审美预处理的处理范围,进行了人性化的思考,加入了人性化的分类条件和方法,不拘泥于已有的用于检索和用于匹配的图像分类方法,为今后的图像分类课题也提供了参考。
同时,又建立了“先分类,后审美”的新型图像审美系统,针对以往图像审美特征的盲目堆砌提出了更为科学的审美机制,运用模式识别方法训练数据,得到符合样本规律的审美预测程序。经过验证,确实能够在一定程度上预测人对图像的审美评价,对于设计行业、摄影行业等都能起到良好的辅助效用。
在本文工作的基础上,更加细致地进行审美特征的计算和分析,对新提出的审美特征进行运用,则有进一步提高审美效果的可能性;若能更深入地探究图像类别、图像内容与审美特征之间的对应关系,也将有利于提高审美的准确性,并适当提高审美的预测能力。
摘要:提出图像类别及图像内容在审美中的重要性,并由实验验证审美特征对于不同的图像类别体现出不同的适应性,因此确定图像类别对图像审美的影响。通过分析现有的图像审美特征的着重点,建立专用于图像审美的图像预分类方法,并确定对各个图像分类有效的审美特征,通过已标签图像的数据训练,计算各审美特征的权值,最终建立起内部先分类后审美的图像审美系统。
关键词:图像审美,审美特征,敏感特征集合,图像内容,分类
参考文献
[1]HOENING F.Defining computational aesthetics[C]//Proceedings ofEurographics Workshop on Computational Aesthetics in Graphics,Vi-sualization and Imaging.Switzerland:Eurographics Association,2005:13-18.
[2]LUO Y,TANG X.Photo and video quality evaluation:focusing onthe subject[C]//Proceeding of 2008 10th European Conference onComputer Vision(ECCV 2008).Heidelberg:Springer-Ver-lag,2008,5324:386-399.
[3]ZHANG Q,ZHAO C,GU Z,et al.A color harmony measure modelwith shape information[C]//Computational Sciences and Optimiza-tion,2009.CSO 2009.International Joint Conference on.IEEE,2009,1:627-630.
[4]宋麦玲,李欢.一种基于HSV颜色空间的图像检索技术[J].电脑知识与技术(学术交流),2007,1(1):200-201.
[5]袁春兰,熊宗龙,周雪花.基于Sobel算子的图像边缘检测研究[J].激光与红外,2009,39(1):85-87.
[6]VAILAYA A,FIGUEIREDO M A T,JAIN A K,et al.Image classi-fication for content-based indexing[J].Image Processing,IEEETransactions on,2001,10(1):117-130.
图像 篇5
中国文明是世界上现存唯一绵亘超过四千年的文明,也是唯一在这长时间中绵亘使用表意文字的文明,这两个唯一显非偶然,于是,谈中国文明,乃必得及于这文明的根源之一——汉字。
在人类学家眼中,文字的发明是文明的一大跃进,堪与比拟的只有用火、产业革命与资讯革命,而使人类从蒙昧至开启的犹赖于此。文字的发明让知识可以大量积累,后世乃能够超载一代的生理局限,直接站在历史巨人的肩膀之上。
然而,知识积累固是文字发明对文明的最根本影响,但其作用尚不止于此,它一定程度更影响了文明乃至生命的属性。
谈汉字,多数人首先连结的当然是书法。书法源自特殊的书写工具:毛笔,不过,更根柢地,则源于汉字本身的结构性使图像在规范中又有无限排列的可能,由之乃开展出丰富的线性世界,要说中国人的线性美学多缘于此也不为过。
书法被首先连结,是因它太特殊了,其实谈文字,最自然会想到的是文学。文学并不只是对语言的艺术记录,语言之外,文字本身还影响了文学的形式与内涵,这在非直接语言拼音而来的表意文字尤然,从中国诗词的对仗到文言文的精炼就都与汉字单位、孤字、表意的属性直接相关。
表意文字使文字与语言保持了一定距离,让文字能更长于凝练性的表达,这一方面成就了中国文学的特殊美感,另一方面则行塑了中华文化的特殊属性。
中华文化能绵亘数千年实因于传承者强固的历史认同,汉字在此则不仅让人可以接续前朝,连历史之原典亦可亲炙②,由此,所谓上下五千年才不至成为空话。而更甚者,就因语、文一定程度的分家,语言之分歧乃不直接导致族群的分歧,否则,以中国地缘之大、地理之复杂,若用拼音文字,怕不早已分成几十个国家!也因此,中国文明既能一统——保有稳定的共同根基,又能发展各地的特质——适应多元的环境,文化上“一元性与多元性的并存”使中国虽历经挑战却依然茁壮,而它,则缘于书同文、语多样的历史发展。
谈汉字,在美学、文化外,最终也更幽微的,是它与中国人认知思维与感悟的关联。孤字、图像化、凝练性,不仅在艺术上长于意象的表达,在认知上更使人具备直观、整体掌握的特质。汉字不因语音的连续阅读而得,观者是直就图像而起,中国哲学之常直接以拈提③触发生命,不在哲理辨析上着眼,就与此有关。而禅之所以能在中国大放异彩,也因它拯救发挥了这个特色,云门宗④以“一字关”勘验学人还曾名重禅林。
汉字的种种与中华文化如此相关,也因此,对汉字的看法常就直接反映了我们对自己的态度。“五四”以来的白话文运动,力图使语、文合一,固是对语文过度分离导致文字僵化的反抗,却也因此未能看到语文分割对中华文化所引起的`根本影响,极端者欲将中国文字拼音化,更可以说是在刨自己文化的根,而即便到中文电脑出现前,也还有许多人因电脑输入的困境大谈废除汉字,这种种都说明了:错,其实不在汉字,而在我们对自己的态度,在我们对汉字与中华文化的关系缺乏更深的了解。
曾几何时,中文电脑的问题已能解决,中国也兴起了,汉字又成为大家乐于肯定的文化资产,而在文化创意成为时潮的现在,汉字作为图像辨识、设计元素的优势更被大事标举,只是,在这情感与现实需要的转变下,我们要能真正看到汉字与中国艺术、文化乃至生命的深刻关联,并由此知道自己的定位,恐怕还需要更多的反思与观照。
【注】①林谷芳:禅者、文化人。台湾佛光大学艺术所所长,台湾文化总会副会长。此文是他为“首届两岸汉字文化节”而写的文章。②亲炙:直接受到教诲或传授。③拈提:禅林说法,拈举古则公案以开发学人之心地。④云门宗:禅宗五家七宗之一,以开山祖师云门文偃禅师(864—949)而得名。
1 .下列属于汉字特点的一项是
A.必须以毛笔为书写工具。
B.语、文一定程度的分离。
C.一元性与多元性的统一。
D.认知思维的直观、整体。
2.下列表述不符合文意的一项是
A.汉字本身的结构性使图像在规范中又有无限排列的可能,是书法形成的最根本原因,同时书法也离不开毛笔这一书写工具。
B.汉字单位、孤字、表意等,是汉字的特殊属性,它对中国古典诗词中的对仗、文言文的精炼等有直接的影响。
C.汉字使文字与语言保持距离,这塑造了中国文明既能保有稳定的共同根基,又能发展各地的特质——适应多元环境的特点。
D.现在注重文化创意,推崇汉字的优势,是因为人们看到了汉字与中国艺术、文化的紧密关联,看出了中国汉字的新兴。
图像 篇6
一、 高中地理图像的分类
1.地图。
地图是按一定比例运用符号、颜色、文字注记等描绘地球表面自然地理、行政区域、社会经济状况的地理图像,包含方向、图例、注记等要素。地图按内容可分为普通地图和专题地图,高中地理教材中的地图多为用来表示地理位置、区域范围、地理事物分布特点和规律的专题地图。
2.地理景观图。
地理景观是四周为天然界线所围绕的、性质上与其他区域有区别的地球表面区域。地理景观图是指用于反映地理事物或者地理环境的图像,它能较为真实地反映地理环境的外部特征和地理事物与环境之间的关系。
3.地理示意图。
地理示意图是用来描述和演示地理事物特征的地理图像,其特点是形式简单、概括性高,它可以用来解释地理原理和规律,演绎地理事物发生的原因、过程和影响,以及各种要素之间的关系。
4.地理统计图。
地理统计图是用来反映地理事物数量变化、地理事物间数量关系的图像和表格,其特点是形象化和数字化,它能使地理知识更加准确、更有说服力。常见的地理统计图有曲线图、柱状图、扇形图、折线图等。
5.地理影像。
地理影像是指通过现代科学技术获得的、能够准确反映地理事物特征的地理图像。地理影像既包括遥感影像、卫星影像等,还包括借助“3S”技术所获取的数字地图。
6.等值线图。
等值线图是由一组相等数值点的连线而形成的、表示连续分布且逐渐变化的图形,如等温线图、等高线图、等压线图等。等值线的走向、弯曲形态和疏密程度能够反映出所表示的地理事物的分布特征。
二、 高中地理图像教学模式的选用
1.地图教学模式。
在高中地理教学中,教师要教给学生运用地图的方法,解读地图的要素和图例。对此,教师可采用“读图—分析—归纳”教学模式,引导学生从地图中提取重要的地理信息。
2.地理景观图教学模式。
地理景观图能较为逼真地反映地理环境,增强学生对现实地理环境的认识。但由于地理景观图缺少文字描述,无法让学生更加深入地认识地理景观,因此教师要采用图文结合的教学模式,引导学生根据教材内容,从地理景观图中提取重要的地理信息。
3.地理示意图教学模式。
地理示意图的形式简单、概括性高,因此在地理课堂教学中教师可采用分解演绎教学模式,将地理示意图进行分解整合,引导学生了解地理示意图的演绎过程,理解地理原理和规律,理清思路。
4.地理统计图教学模式。
现阶段,地理图像分析能力的缺失使得一些学生无法从地理统计图中提取出有效的地理信息。对此,教师可采用图文转换教学模式,引导学生将地理图像转换为文字信息。
5.地理影像教学模式。
多媒体能够直观、准确地展示地理影像,因此在地理课堂教学中,教师可采用多媒体教学模式,借助多媒体教学工具,使学生直观地认识地理事物。
6.等值线图教学模式。
所有的等值线图都有一个共性:同一条等值线上的数值相等,且等值距相同。根据这一特点,教师在地理课堂教学中可以采用案例教学模式,选取较为典型的例题进行详细讲解,使学生做到举一反三。
图像格式变换器与图像质量的关系 篇7
常用的电视显示器件有CRT(阴极射线管)、LCD(液晶显示器)、PDP(等离子体显示器)、DLP(数字光学处理器)等。CRT基于电子束扫描工作,不是固有分辨力显示器件。平板显示屏由像素阵列及其驱动电路等构成,各像素可分别寻址和激励,是固有分辨力显示器件。
当激励固有分辨力显示屏各有效像素的信号数量与视频输入信号有效像素数量相同时,显示屏各像素分别被输入信号相应像素的数据激励,处于最佳分辨力状态。
当输入信号的图像格式与屏的像素阵列不同,或显示模式的设置和调整导致这种情况时,一般需进行图像格式变换,由参与显示的信号像素数据获得显示屏各像素的激励信号。这种缩放图像数据的芯片在计算机中称定标器(Scaler)。这种定标器无须全面测量输入信号的参数,而只需判别属于哪种标准显示格式。在数字电视中,Scaler芯片除缩放图像外,还要完成预处理和后处理等,习惯上称为格式变换器。
2 格式变换器
格式变换器是一类视频处理芯片或这类芯片中的功能模块,其图像缩放部分按固有分辨力显示器件的物理分辨力缩放不同分辨力的输入图像信号,给显示器各像素提供激励信号。图1所示功能框图是较简单的一例,实际芯片还包括模数转换等功能块。
图中的输入模块工作于输入图像信号时钟,对输入图像信号的格式进行测定,将测得参数经MCU(微处理器)接口送MCU,并从输入图像数据中提取有效像素数据。缩放模块基于由外接基准时钟锁相产生的显示时钟工作,按MCU根据屏幕菜单设置的参数及对输入与输出模式的分析、计算,在水平和垂直方向缩放图像。因数据跨越输入和输出两个时钟域,故中间需设缓存器,并防止其上下溢。时序控制部分为各模块提供同步及时序控制信号。后端处理模块完成缩放后图像的锐化、γ校正、调整和转换输出方式等[1]。缩放图像有多种算法,图2所示为较简单的双线性插值法。
这种算法对2×2像素块进行,先在水平方向做两次线性插值,再在垂直方向做1次线性插值,得插值点F,即
双线性插值法输出系数可按线性、阶跃、正弦或余弦等函数取值,如图3所示。图中横坐标与插值点位置对应,纵坐标为相应的输出系数,两者的归一化值均为0~1。为提高缩放速度,通常将其固化为插值表。
对双线性插值法,若Δx=Δy=0.5,则因黑白像素相间的水平和垂直图像细节变成单一灰色而丧失相应的图像细节。除了这种特例,一般情况也会降低清晰度并产生由变换差拍造成的伪像。若用双三次插值等较复杂的算法,参与插值计算的输入信号像素数增多,缩放后的图像虽也会某种程度地损失细节,并出现伪像,但图像主观效果可能较好。
运动图像格式变换通常还伴随扫描格式变换,其算法很多,图4是一种三维四场插补算法。插补场中的某像素A由前后4场相应位置周围信息产生,为此需进行高精度运动检测和非线性运动补偿[2]。
3 格式变换对图像质量的影响及实测结果
SJ/T 11342-2006《数字电视阴极射线管显示器通用规范》等标准要求图像重显率不低于95%[3]。笔者认为出于下列原因,这项要求对CRT显示器或投影机是必要的。首先,CRT显像管的偏转灵敏度、偏转线圈的偏转灵敏度、行和场扫描电路参数的差异等会使不同CRT的光栅幅度不同:光栅幅度太小,光栅易露黑边;光栅幅度太大,图像重显率低。另外,CRT行扫电路的分布参数可造成行扫开始有阻尼振荡,光栅左端呈现黑白相间的垂直阻尼条;场扫输出级动态范围不够会引起光栅下部卷边;行扫电路参数的不同,会引起行逆程脉冲宽度不等,将其作为机内消隐脉冲时,难以靠调整逆程电容使重显率准确为100%。将CRT显示器的图像重显率定为≥95%,可方便大规模生产,隐蔽光栅缺陷,并使绝大部分图像高质量重显。由于CRT不是固有分辨力显示器件,重显率稍低可通过电子束过扫描实现,会使观众通常感兴趣的图像中部适当放大,令这部分图像更清晰。
固有分辨力显示屏的工作机理和实测情况表明,尽管厂家可设置多种显示模式,但须有100%重显率可选状态,或允许用户能调整到这种状态。这种状态可通俗地称为“点对点”或“100%重显”状态。例如用固有分辨力1 920×1 080/16∶9屏重现1 920×1 080/16∶9 HDTV图像时,若重显率不足100%,则一方面信源的部分有效像素数据被舍弃,另一方面还要再经格式变换器上变换嵌满1 920×1 080/16∶9屏,造成图像不全、清晰度下降并出现伪像。将HDTV信号下变换为低像素屏显示时,重显率不足100%也会有类似情况。
有效像素为1 920×1 080/16∶9的显示屏100%重显1 920×1 080/16∶9 HDTV(高清晰度电视)输入信号时,无需格式变换,为最佳分辨力状态,当激励信号带宽等其他条件也满足时,水平、垂直和斜向清晰度分别可达理论值1 080,1 080和1 527电视线,且无伪像(图5)。若重显率不足100%,不仅输入信号中图像边缘的部分像素数据被舍弃,格式变换器将参与显示的输入信号像素数据上变换为1 920×1 080像素激励信号,为此所做相邻像素的加权运算,会降低清晰度并出现伪像和运动模糊等(图6)。
用低分辨力平板显示屏收看高级别数字电视节目时,笔者建议先用格式变换器将输入信号格式下变换为与屏的物理分辨力相同,再以点对点方式显示。例如用1 366×768/16∶9平板显示屏按此方式以100%重显率显示1 920×1 080/16∶9格式HDTV输入信号时,若格式变换器设计得当,激励信号通道带宽也足够,则显示的图像仍可达我国对HDTV图像水平和垂直清晰度高于720电视线的要求,但清晰度测试线簇的灰度、粗细、间距等有畸变,并呈现伪像(图7)。
4 HDTV屏显示SDTV图像
我国HDTV和SDTV图像格式分别为1 920×1 080/16∶9和720×576/4∶3。前者为方像素,后者为宽高比是1.067的扁像素。用1 920×1 080/16∶9方像素HDTV屏显示扁像素SDTV图像,有多种方式。
若在HDTV屏中部开720×576窗口显示SDTV图像,则图像宽高比虽仍为4∶3且无格式变换损伤,但图像纵向增高到1.067倍,屏幕利用得也很不充分。拟使图像无几何畸变,窗口可开成768×576,水平方向上变换显示SDTV图像(图8a),屏幕利用也不充分,且有格式变换损伤。
若把SDTV图像上变换成1 920×1 080/16∶9显示,虽屏幕充分利用,但图像横向增宽到1.33倍,且有格式变换损伤(图8b)。若纵向充分利用屏幕,在中部开窗显示1 440×1 080图像,则图像宽高比虽仍为4∶3,但纵向增高到1.067倍,且有格式变换损伤(图8c)。
为此,本文建议用1 920×1 080/16∶9方像素屏显示720×576/4∶3扁像素SDTV图像信号时,可提供一种在屏幕中部开1 536×1 080窗口的显示模式供用户选择(图8d)。这种模式不仅纵向充分利用了屏幕,而且重显率达100%,图像无几何失真。实际上这时屏幕显示的SDTV图像几何宽高比为4∶2.813,而不是4∶3,并以此弥补了HDTV和SDTV图像格式不同带来的几何畸变,水平方向也得以较充分地利用屏幕,但仍有格式变换损伤。
同理,笔者建议用1 366×768/16∶9方像素屏显示720×576/4∶3扁像素图像时,为用户设置一种在屏幕两侧各开137×768窗口,中间显示1 092×768图像的可选模式。此时,图像几何宽高比4∶2.813,重显率100%,图像无几何失真,屏幕利用较充分,有格式变换损伤。
5 小结
笔者基于对图像格式变换器的分析,建议对固有分辨力显示屏预设或允许用户把重显率调至100%,实现完整图像的点对点显示。尽管图像同心度不影响图像清晰度和伪像,但为便于调整重显率和完整显示图像,图像的同心度应设置为0%,或允许用户调整。当屏的物理分辨力或显示模式设置使屏的驱动信号数量与输入信号格式不同时,需引入格式变换器缩放图像,这会影响图像清晰度并呈现伪像。适当增加参与插补运算的像素数量,采用较好的算法,可使变换后的图像主观观看效果有所改善。笔者还针对我国HDTV和SDTV图像格式,提供了16∶9 HDTV屏显示4∶3 SDTV图像的可选方案。由以上分析,笔者还建议:生产小尺寸高点阵屏时,应减小平板显示屏像素尺寸,但生产大尺寸屏时,仍应采用大像素,以使其有效像素数与信源图像格式对应,这样不仅屏幕可工作于最佳分辨力状态,而且可提高屏幕亮度。
参考文献
[1]刘政林,邹雪城,向祖权,等.定标器的设计与实现[J].电子学报,2006,34(1):185-188.
[2]中国电子视像行业协会.解读数字电视[M].北京:人民邮电出版社,2008.
基于图像场能分析的指纹图像增强 篇8
指纹识别技术是经由图像传感器采集得到的指纹图像来获取辨别个体的特征信息的新兴技术[1]。但人体的指纹难免存在磨损、脱皮和疤痕等缺陷,而传感器也不可避免的会受到采集环境中噪声的影响,所以很难在图像采集环节获得理想的高质量指纹图像。这就需要通过指纹图像增强技术来改善原始的图像质量,以保证后续指纹特征提取及匹配的准确性[2]。在以往的实验研究中,我们曾先后将多种传统增强算法或其改进算法应用于预处理中,如Wiener滤波法、中值滤波法等等,实验结果均不理想,传统算法要么在增强指纹纹线的同时带来背景噪声的增强,要么在消减背景噪声的同时却使指纹纹线变得模糊。Lin Hong等人提出了利用带方向的Gabor滤波器来增强指纹图像的方法[3]。但低质量指纹图像中可能同时具有多种缺陷,例如纹线过浅造成的明暗对比度低,纹线断裂造成的信息缺失,以及灰度不均、脊谷粘连造成的区域性模糊等等,若采用单一步骤的Gabor滤波来增强指纹图像,则很难弥补同时存在的多种图像缺陷。
针对上述问题,本文从图像场能角度探讨了一整套指纹增强算法,其出发点是将原始指纹图像看成是一个场强和场能呈周期性变化的特殊波动场来进行图像增强方面的分析。其中描述明暗的是强度场,描述纹线脊谷变换的是梯度场,描述纹线走向的是方向场,描述纹线间隔的是频率场。指纹图像场中任何指纹纹线的走向或纹线像素,都受该场的驱使,各种场强的作用就像在支配该纹线和像素的趋势和走向。所以,分析计算原始指纹图像的场能并利用其场能大小对指纹图像进行增强处理,能达到改善图像质量的目的。
1 指纹图像场的分析
1.1 指纹图像的强度场
在指纹图像场中强度场描述的是指纹纹线在某点的明暗程度,强度场变大表示指纹纹线在该点处的明暗程度增加。不同类型的指纹传感器采集的指纹图像强度场场强类型也不同。以光学指纹图像为例,图像的场强类型也可称为灰度场强。
一张z=f(x,y)的灰度指纹图像,强度场为V,则灰度场强定义为
其中f(x,y)是指纹图像该点的灰度大小。
1.2 指纹图像的梯度场
在指纹图像场中,梯度在形象上的概念是指纹纹线隆起的最陡的程度,方向指向纹线法向,从隆起指纹纹线横截面最高点指向最低点。对该点作偏微分,该偏微分的方向就是最陡方向。设图像梯度场为T(x,y),则有:
根据偏导数的定义,记Gx(x,y)为(x,y)这点对x的偏导,记Gy(x,y)为这一点对y的偏导,那么,梯度场大小可近似表示为
1.3 指纹图像的方向场
方向场反映的是指纹图像场的中心、圆形纹线趋势场、斜角度指纹线趋势场、水平纹线趋势场及其混合趋势场等,方向场的大小是梯度场正交分解参数θ的值,其方向按右手定理垂直于梯度方向。对于理想的方向场,有
式中:i,j为正交坐标的单位向量。由三角函数公式知:
将式(4)代入式(5)中则有:
在实际的指纹图像方向场中,任何一点的像素都必须与周围像素联系起来,才能说明该点在图像中的性质。所以,将周围像素点的灰度值累加再求平均以趋近真实。为此,设:
那么方向场大小为
其中,利用模板尺寸为3×3的Sobel算子计算(x,y)的偏导数。x与y方向的Sobel算子分别表示为
1.4 指纹图像的频率场
Miao和Maltoni把指纹图像脊谷形成的横截面看成是正弦函数形状,据此,定义点(x,y)处的频率f为该点方向场垂直方向上单位长度内脊线的条数。论文采用这种方法计算图像的频率场。设V(h)为[x1,x2]区间内灰度垂直变化的总和,h(x)为点(x,y)方向场垂直方向上的灰度函数,am为近似正弦波的平均振幅,则:
2 指纹图像增强
2.1 利用梯度场分割指纹图像
常用的图像分割方法是根据指纹图像的灰度大小进行阈值分割,即双峰法。但这种方向对原始指纹图像的灰度要求较高,当图像中的目标部分和背景间亮度差较小,即灰度直方图的双峰性不明显时,在分割过程中就很难获得准确的前景区域。为此,论文讨论了一种基于梯度阈值的分割方法。
结合物理模型中的分形维数原理,即各种自然界客观存在的物质结构图形差异,可由单位区域微小要素相同但单位区域数量不同所组成图形结构之间的差异来区分。借助此原理,在图像处理上可将单位区域上的梯度看成分形维数,根据指纹图像的前景与背景上的灰度梯度差异来完成指纹图像的分割。前景区域的梯度一般较大(纹线黑白相间)而背景区域梯度较小,那么求出图像梯度后进行高度平滑去掉梯度图像中的噪声,然后选取适当的阈值就可以完成图像的分割。
算法分为三步:1)划分单位区域,计算单位区域上的平均梯度作为该划分单位区域的梯度;2)选取阈值,对于光学图像来说,平滑性比较好,阈值一般选取在30~40之间;3)设A为分割阈值,那么有:若|T(x0,y0)|>A,则点(x0,y0)在指纹图像的前景上;若|T(x0,y0)|
2.2 指纹图像的灰度规格化
灰度图像往往因为对比度不高导致图像模糊。从指纹图像场的角度看,灰度规格化的目的是通过点的灰度场强值运算,使图像在各种灰度场强上都均匀分布相等的像素点个数。对图像进行规格化处理不但能将指纹图像的灰度值的均值与方差调整到所期望的范围,同时还能消除传感器本身的噪声和手指对传感器表面的压力不均而带来的灰度差异。设I(x,y)为采集到的指纹图像像素点(x,y)的灰度值,指纹图形大小为m×n,图像的平均灰度值和方差分别为M(I)和W(I),N(x,y)为整体灰度规格化处理后的像素点(x,y)的灰度值,式(9)即为灰度规格化公式:
式中:M0与V0分别为灰度均值与方差的期望值。
2.3 指纹图像的噪声平滑
从图像场的角度看,采集环境周围的灰尘,传感器表面的污渍等等会使指纹强度场因噪声干扰而失真。为了去除指纹图像上的噪声嘈杂点,必须参考周围像素,用指纹对象周围相关像素平均模板对其进行平滑处理,即进行卷积运算。
给定指纹图像f(x,y)大小为N×N,取大小为m×m(m为奇数)的邻域模板T(i,j),模板中心T((m-1)/2,(m-1)/2)与f(x,y)对应。则卷积运算为
邻域平均平滑模板算子是表示卷积过程中权重的矩阵,按大小分为3×3与5×5两种。论文中选择3×3小模板,即
2.4 结合指纹图像方向场与频率场的图像增强
通过对指纹图像场的分析可知:局部区域的纹线分布具有较稳定的方向场和频率场。由于Gabor滤波器可以同时在空域和频域上获得最佳的分辨率,具有良好带通性和方向选择性,因此采用Gabor滤波器来实现图像增强[4,5,6,7,8]。其增强效果主要表现在:1)在指纹纹线方向上,可以在该位置的方向场θ上对指纹纹线进行收敛增强,解决指纹纹线断裂问题;2)在指纹的垂直方向上,Gabor函数正好符合指纹纹线相间的特点,可以在该位置频率场上对图像进行振荡加强。
Daugmann给出了Gabor函数在二维情况下的一般形式为
其中:(x0,y0)表示二维空间接受域的中心点,(ξ0,ν0)表示滤波器在频率域最优空间频率,α、β分别表示椭圆高斯函数沿x、y方向上的标准偏差。复数形式的二维Gabor函数包含两个正交投影:实数的偶对称余弦部分和虚数的奇对称正弦部分,分别称之为实Gabor函数(RGF)和虚Gabor函数(IGF)。令α=β=σ,将实虚部展开:
式中:he和ho分别表示偶对称Gabor函数和奇对称Gabor函数,f、θ、σ分别表示滤波器的空间频率,相位和空间常数,g(x,y,σ)是高斯函数:
奇偶Gabor函数具有不同的滤波特性,奇Gabor函数适用于分割物体边缘,偶Gabor函数适用于增强目标物体,据此,我们使用偶对称的Gabor滤波函数来对图像进行滤波增强。在滤波器的参数设计中,根据已计算出的指纹图像的频率场来确定Gabor滤波器的频率f,由已得的图像方向场确定滤波器的相位θ。而空间常数σ一般根据经验来确定,σ的值取得越大,滤波器在纹线方向上增强与连接中断脊线的能力越强;但是取得太大,又会减弱垂直于纹线方向的指纹纹线信息。这里取经验值为4.0。滤波增强后的指纹图像由式(15)得到:
式中:E(i,j)表示增强后的图像,w为滤波器窗口的大小;u、v分别为遍历图像块的行和列,卷积实现滤波;L(i-u,j-v)是图像像素值函数。至此,完成低质量指纹图像的智能增强过程。
3 实验结果与分析
实验中从光学指纹图像库中选取200幅指纹图像进行增强处理,其中包括低质量指纹图像90幅,结果表明论文中所探讨算法有很强的可行性和很好的增强效果。现以低质量指纹图像A与B为例,按照论文所述算法步骤依次对其进行处理,实验结果分别如图1及图2所示。两图中,标记为(a)的图像为原始的低质量指纹图像,标记为(b)、(c)、(d)的分别是前背景分割、灰度规格化以及图像平滑的结果,(e)所示即为最终的增强处理结果。
对比图1(a)与图1(e)发现:原始图像图1(a)中存在纹线较浅、对比度低以及纹线断裂等问题,而增强后的图像图1(e)脊谷分明,纹线清晰完整。对比图2(a)与图2(e)发现:原始图像中的灰度不均,纹线断裂,脊谷粘连等缺陷同时得到了很好的弥补,处理后的图像整体清晰度以及平滑度都有了显著改善。
为了进一步比较整套算法与传统的简单算法以及单一步骤的Gabor滤波的差别,同时对指纹图像A与B进行中值滤波、维纳滤波与单一步骤的Gabor滤波,实验结果如图3和图4所示。
图3和图4中标示为(a)的图像是本文算法的处理结果,标示为(b)的图像是中值滤波的结果,标示为(c)的是自适应维纳滤波的结果,标示为(d)的是直接Gabor滤波的结果。对比几幅图可以看出,论文提出的算法在弥补指纹图像缺陷,提高图像对比度、平滑度、清晰度等方面具有明显的优势。
4 结论
通过上述实验结果可以看出,基于指纹图像场论分析的增强算法完全符合指纹图像脊谷相间的特性,有很强的可行性,相比一般算法在衔接断裂纹线、合理分离粘连脊谷、增强图像对比度方面有很大优势,并且能很好的弥补低质量指纹图像中同时存在的多种图像缺陷。总的来说,论文中探讨的算法能有效保留原始指纹图像中的信息,在增加图像对比度、平滑性以及清晰度方面取得了较好的效果。
摘要:手指的脱皮老化以及活体指纹传感器带来的图像误差易影响指纹图像的成像质量。为此,针对低质量指纹图像中存在的纹线断裂、脊谷粘连以及手指脱皮造成的区域性模糊等问题,提出了一种基于指纹图像场能分析的指纹图像增强算法。算法分析和计算了指纹图像的强度场、梯度场、方向场和频率场,并在分析图像本身特点的基础上结合各场能具体信息以及Gabor滤波原理对指纹图像进行逐步的增强处理。实践表明,整套算法对低质量指纹图像增强效果良好,能大幅度提高指纹图像质量。
关键词:指纹图像场,梯度场,方向场,频率场,Gabor滤波
参考文献
[1]LI Qiang,ZHANG Bo.A fast matching algorithm based on image gray value[J].Journal of Software(S1000-9825),2006,17(2):216-222.
[2]SONG Yi,CUI Ping-yuan,JU He-hua.A computational optimization method of the SSD and NCC algorithms of the stereo matching[J].Computer engineering&application(S1002-8331),2006,42(2):45-48.
[3]LIN Hong,WAN Yi-fei,Anil Jain.Fingerprint Image Enhance-ment Algorithm and Performance Evaluation[J].IEEE Trans.on Pattern Analysis and Machine Intelligence(S0162-8828),1998,20(8):777-789.
[4]李利,范九伦.基于Radon变换的指纹图像滤波增强方法[J].中国图象图形学报,2009,14(3):417-421.LI Li,FAN Jiu-long.The Method of Fingerprint Image Enhancement Based on Radon Transform[J].Journal of Image and Graphic,2009,14(3):417-421.
[5]温苗利,梁彦,潘泉,等.基于Gabor函数的小波域指纹图像增强算法[J].计算机应用,2006,26(3):589-594.WEN Miao-li,LIANG Yan,PAN Quan,et al.Gabor function-based fingerprint enhancement algorithm in wavelet domain[J].Computer Application,2006,26(3):589-594.
[6]王玮,李见为,黄非非,等.基于Log-Gabor滤波的指纹图像增强[J].计算机科学,2007,34(7):241-243.WANG Wei,LI Jian-wei,HUANG Fei-fei,et al.Fingerprint Image Enhancement by Log-Gabor Filtering[J].Computer Science,2007,34(7):241-243.
[7]陈大海,郭雷,李海.基于二值指纹图像的Gabor滤波增强算法[J].计算机工程与应用,2007,43(29):4-7.CHEN Da-hai,GUO Lei,LI Hai.Gabor filter enhancement algorithm based on binarization fingerprint image[J].Computer Engineering and Applications,2007,43(29):4-7.
图像 篇9
1.1 YUV色彩空间
YUV先将描述色彩的R、G、B分量先通过变换电路得到亮度信号Y与色差信号U和V, 然后将这三个信号分量分离后独立进行编码处理, 在一个信道中进行传输。和RGB信号相比, 这是YUV信号最大的创新点。如果在接收端没有U和V分量, 只有Y分量, 在接收端就会出现黑白灰度图像, 完成彩色电视和黑白电视的兼容。
1.2 YUV存储格式
YUV数据的存放格式有两种, Packed (打包) 格式和Planar (平面) 格式。以Macro Pixels (宏像素) 阵列方式存放Y、U、V三个分量称为Packed格式。将Y、U、V三个分量分别存放在不同的矩阵阵列中称为Planar格式, 也就是Y、U、V分量以独立的平面组织在一起。
2 BMP图像
BMP图像通常是不压缩的, 所以不适合在有带宽容量限制的媒介上进行传输。BMP图像的大小由 (n/8) 所决定 (n为位深度) 。n位2n种色彩的包括调色板的BMP文件大小按下式计算:
其中, height和width单位是像素, 54为位图文件的文件头, 4*2^n是彩色调色板的大小。当位图文件中不包括调色板时, 以下是BMP文件大小的计算公式:
3 YUV转换为BMP的实现原理
在计算机图形和成像中广泛采用RGB颜色空间, 但当处理现实世界的图像时, 由于RGB对任意颜色都通过等长像素点的R、G、B 3色加以合成, 故每个像素在像素深度和显示分辨率上都有相同的3个成分。在图像传输过程中, YUV色彩空间就占据了很大的优势, 但在数据接收端, 需要BMP格式的文件。所以有必要在硬件上实现YUV图像转换为BMP格式图像, 实现语言是Verilog。
3.1 YUV数据读入
将YUV数据读入一个Height x Width x 3大小的内存中, 并且将Planar格式的YUV数据重新进行排列成Packed格式的数据, 重排结果如图1所示:
读取YUV数据的Verilog语言代码如下:
for (k=0;k<`height*`width;k=k+1)
mema[`height*`width*3-1-k*3]=memb[k];
mema[`height*`width*3-2-k*3]=memb[k+`height*`width];
mema[`height*`width*3-3-k*3]=memb[k+`height*`width*2];
3.2 YUV数据转换为RGB数据
YUV数据对应着YCb Cr数据, 即Y分量对应Y, U分量对应Cb, V分量对应Cr。首先将输入的3个8位二进制数据进行校正, 具体转换公式如式3所示。硬件转换过程中需要将式3中的系数用10位二进制数表示。
由于R、G、B的数值取值范围是0-255, 所以要对数值结果进行取整运算, 即大于255的数据修正为255, 小于0的数据修正为0。
YUV数据转换为RGB数据的Verilog语言代码实现:
3.3 RGB数据写入BMP文件
打开一个空的data_out.bmp文件, 先写入BMP文件必须的54个字节的头文件信息。对于多字节数据, 先写低位, 再写高位, 然后将转换后的RGB数据依次以从下到上从左到右的顺序写入data_out.bmp文件中。
3.4 实验结果
图3中的 (1) 和 (2) 在视频接收端视觉效果没有明显区别, 但在传输过程中 (1) 所占的带宽仅为 (2) 带宽的1/3, 这就使视频信息量大和传输带宽有限间的冲突得到有效地均衡。
4 结束语
在图像传输过程中, YUV色彩空间占据了很大优势, 但在数据接收端, 往往需要BMP格式的文件。因而将YUV数据转换为BMP图像的硬件实现就很有必要。所以, 本文所实现的YUV转换成BMP格式图像的硬件实现是很有价值的。
摘要:文章首先对YUV、BMP图像的色彩空间作了扼要的说明, 指出了YUV数据和BMP数据的存储格式, 偏重介绍了它们各自的特点, 运用Verilog语言, 实现将YUV图像转换为BMP图像这一过程。
关键词:YUV,RGB,BMP,格式转换
参考文献
[1]陆其明.DirectShow中常见的RGB/YUV格式[EB/OL].http://www.ogg.cn/info/vie-info-20.html, 2004-12-27.
[2]Datasheet.SAA7113H 9-bit video input processor[Z].1999-07-01.
图像 篇10
本文提出一种将混沌与图像合成相结合的新型加密算法, 加密算法的程序开发平台为Matlab7.0, 涉及计算机模拟环境为Windows 7/XP/2003/2010。加密算法所涉及的实时图像取自于avi视频, 加密中的混沌序列源于logistic映射。
Logistic方程为xn+1=1-μxn2, 其中μ∈ (0, 2) 、xn∈[-1, 1], 随着控制参数由小到大逐渐增长就可以演示倍周期分岔走向混沌的过程。logistic映射在混沌区, 具有伪随机性、初值敏感性、遍历性及收敛性[2]。由此可见, 给定初始值xn及μ, 由logistic映射生成混沌序列, 即可对图像进行初步置乱。本文在此基础上构造出既满足图像安全性又不给传输和存取带来过大延迟的加密程序。其基本思想是引入一张图像作为加密、解密者共享的密钥图像, 将密钥图像处理后与待加密图像合成进行logistic映射置乱加密, 从而得到加密图像。一张图像所含有的信息量庞大, 这就大大增加了密钥空间, 并且改变了原图像的像素值, 确保了图像加密的安全性。
密钥图像要与待加密图像进行合成, 如果密钥图像偏大将耗费不必要的计算量, 密钥偏小又起不到隐藏待加密图像的目的。因此, 本文将密钥图像进行预处理使其与待加密图像大小相等。matlab读入图像的数据类型是uint8, 而如果直接使用unit8进行两个图像的合成就会造成数值溢出, 因此在合成前先将图像格式转换成double型, 合成后再转换成unit8型进行存储。
logistic混沌具有初值敏感性, 初值的数量及其随机性决定了密钥空间的大小。为了增大密钥空间本算法置乱行和列的初值与参数分别设置不同的数值, 当其x0=0.78、μ1=1.932、y0=0.56、μ2=1.689时, 加密前后图像如图1:
解密过程为加密过程的逆运算, 其基本流程为首先读取加密图像, 其次利用Logistic映射复原置乱图像, 再次引入密钥图像进行预处理, 最后从已复原置乱图像中分离出原图像。
最后, 对该加密算法进行了安全性、实时性分析。首先, 进行密钥敏感性测试。该算法中密钥的一点微小变化将产生完全不同的解密效果。第二、密钥空间分析。一个好的加密方案是对密钥敏感的同时也应该具有足够大的密钥空间, 以抵抗各种攻击。在本项目的算法中, 两个方程的参数和初始值都能作为密钥。matlab默认的数据类型是双精度 (8个字节) , 数据具有16位有效数字, 因此该算法的密钥空间可以达到1064, 再加上私钥图像所占空间, 此算法具有足够大的密钥空间抵抗攻击。第三、对此加密方案做实时性分析。本文所涉及的图像加密算法包含像素的置换、图像的加合等, 虽然密钥空间较大但迭代次数较少, 因此计算速度较快, 加密一张图片仅需要0.012S。而人眼观看物体时, 视神经对物体的印象不会立即消失, 要延续1/24秒左右的时间, 人眼的这种性质被称为“眼睛的视觉暂留”[3]。可见, 本文所采用的加密算法是可以满足实时性要求的。
综上, 本文基于matlab平台将logistic混沌与图像合成相结合实现了实时图像加密。经数值仿真实验证明, 该加密算法为无损压缩, 加密效果好, 具有较强的抗攻击性, 加密效率较高, 能满足实时图像加密的要求。
摘要:本文基于m atlab平台利用循环程序从视频中读取各帧图像, 将置乱后图像与私钥图像进行合成, 应用一维logistic映射产生的混沌置乱序列, 对合成图像进行行、列置乱, 从而实现实时图像加密。
关键词:混沌,matlab,logistic映射,私钥,实时图像
参考文献
[1]赵尔凡, 赵耿, 郑昊.基于多维混沌系统的图像加密算法[J].计算机工程.2012
[2]郝柏林.从抛物线谈起—混沌动力学引论[M].上海科技教育出版社.1993
相关文章:
申请爱尔兰留学国家新政策介绍01-07
爱尔兰矿业投资环境论文01-07
爱尔兰学生签证范文01-07
爱尔兰留学签证范文01-07
【云南省新人教版英语2012届高三单元测试:16 必修4 Unit 1 Women of achievement01-07
爱尔兰风笛音乐推荐01-07
爱尔兰自由行攻略01-07
安全生产教育资料01-07
安全教育资料装修01-07