复杂背景

关键词: 序列 跟踪 图像 算法

复杂背景(精选九篇)

复杂背景 篇1

随着红外技术的发展,针对红外序列图像的小目标检测与跟踪算法的研究也不断深入,成为当前红外图像处理研究的一个热点问题。许多单帧图像如多向梯度表决融合检测算法已经可以将单帧图像的虚警个数控制在10个以内[1];许多关于序列图像点目标轨迹跟踪算法的研究也不断完善,可以保证较低虚警率的同时实现较完整的跟踪轨迹。然而,传统算法可以实现常规运动状态目标的轨迹跟踪,却不能有效解决迎头点目标的检测与跟踪问题。

众所周知,迎头目标具有最大的攻击能力,无论是对攻击方还是对预警方来说,对迎头目标的检测与跟踪研究有着极高的应用价值,也应该是常规运动目标跟踪算法必须要解决的问题。但是,迎头点目标具有运动速度快、连续性好、运动轨迹不明显等物理特点,传统算法[2,3,4,5,6,7,8]则不能输出明显的运动轨迹,就无法实时对迎头目标做出判断,不能有效解决迎头目标跟踪问题。

鉴于上述情况,作者提出了一种基于红外序列图像的帧间匹配算法来解决迎头点目标跟踪问题。实验结果表明,该算法不仅具有检测概率高、虚警率低、跟踪识别速度快等优点,还可以解决传统算法无法处理的在高噪声情况下迎头点目标的检测问题。

1 算法模型描述

依据复杂背景下迎头点目标红外成像面积小、目标像素点在序列图像中相邻两帧间位移不大等特点,算法对相邻两帧间像素点与对应像素点的邻域匹配,点对点标记匹配结果兴趣区域,点对点统计匹配成功次数,匹配过程同步显示迎头点目标。算法主要流程如图1所示。算法共三个主要步骤:第一步,输入预处理后的红外序列图像二值矩阵Di和Di-1,遍历Di中像素点与Di-1中对应点为中心的邻域匹配,完成单个相邻帧间匹配过程。第二步,取标记帧C用来记录匹配结果兴趣区域像素点。第三步,取统计帧S记录C中对应点像素值更新次数,阈值设置输出矩阵S可显示迎头目标点。

传统算法确定单个轨迹像素点需多帧图像共同匹配,且必需提前假定可能目标点位置,匹配过程判断结构复杂,信息存储量大,运算速度慢。相比之下,本算法不需要提前假定目标点位置,仅需两帧就能完成单个匹配过程,匹配结果兴趣区域点对点存储于标记帧C中,同步输出S就可以显示迎头目标,算法模型结构简单,数据存储量小,运算速度快,同步输出实时性强。

2 算法模型建立

选择红外热像仪输出的大小相同的单帧图像,预处理后的二值图像作为本算法的待输入序列图像。

1)初始化设置读取第1和2帧二值图像记为D1和D2(也可等间隔读取序列图像),可知矩阵D1、D2行列相同,且矩阵中只有像素值为1的可能目标点和像素值为0的背景点。设Di(x,y)表示当前矩阵Di中第x行y列的像素点、步长为k、Win×n(x,y)表示第i帧中以(x,y)为中心的n×n邻域(n=2k+1)、Sum[Win×n(x,y)]表示以(x,y)为中心的n×n邻域内所有像素值之和。

2)帧间匹配如果Di(x,y)=1且Sum[Wn×ni-1(x,y)]>0则称单个像素点Di(x,y)匹配成功,Di中第x行y列称为兴趣区域像素点,为可能目标点。按单个像素点匹配过程遍历Di中全部像素点Di(x,y),完成单个相邻两帧间匹配操作。取输入当前帧矩阵D2和前一帧矩阵D1的前6行与前8列(分别如表1),当k=1时,D2(2,2)=1、D1(2,2)=1、Sum[W13×3(2,2)]>0,则点D2(2,2)为兴趣区域像素点;D2(4,5)=1,D1(4,5)=0,而Sum[W13×3(4,5)]=3,则D2(4,5)也称为兴趣区域像素点。D2(2,5)=1,而Sum[W13×3(2,5)]=0,不满足帧间匹配条件,则匹配不成功,D2(2,5)不是兴趣区域像素点;D2(4,7)=0,而Sum[W13×3(3,4)]=3,不满足帧间匹配条件,则匹配不成功,D2(4,7)也不是兴趣区域像素点。

3)兴趣区域标记矩阵C是与Di相同行列的全零矩阵,如果Di(x,y)为兴趣区域像素点,则令C(x,y)=1完成对单个像素点Di(x,y)的标记。随着Di中所有像素点的匹配,标记全部兴趣区域像素点,完成对单个相邻帧间匹配结果的兴趣区域标记。顺序输入序列图像,按照算法处理流程在相邻两帧间重复上述操作,可完成对全部序列图像匹配结果的标记。当信噪比较小时(信噪比为1),输出C可得到常规运动状态的点目标跟踪轨迹。

4)统计标记次数取与C相同的矩阵S,用来点对点记录C中对应位置像素值更新的次数,阈值门限输出S,可以判断出迎头目标。迎头点目标特点是目标点移动范围在以某像素点为中心的邻域内,即此邻域内像素值更新次数比较多。设置不同阈值h时可保证不丢失迎头目标点,甚至没有虚警点。

5)匹配帧更新顺序读取第i帧待输入图像Di,Di为当前待匹配帧,释放第i-2帧图像,转入第二步帧间匹配操作,当前待匹配的相邻两帧实际为序列图像中Di和Di-1。

3 实验及工程验证

我们结合仿真和实拍照片实验,主要从检测概率、虚警点数目、背景噪声情况、运算速度等指标对算法进行工程验证;同时对单帧预处理方法选择、算法步长选取等方面对算法进行解释。

3.1 复杂背景下多个迎头点目标的检测与跟踪

试验为在典型海空背景红外图像(大小为640×480)中随机加入了密度为0.1的椒盐噪声,即每帧序列图像中都加入30 720个仿真虚警点(图2(a))。将这样30帧图像中加入三个迎头点目标M1、M2、M3中心分别位于(200,180)、(200,320)、(200,460)的十字形的点目标,三个点目标共占用15个像素。输入序列图像,执行算法流程,步长为1时,输出标记帧C(图2(b))可以看出在高噪声情况下,几乎所有的像素点都得到了标记,即在此噪声条件下本算法就无法对常规运行状态目标做出轨迹判断。

然而,不同点的标记次数有很大的差别,从输出统计帧S(图3)和表2中所列数据可以得出,当步长为1,阈值h=5时跟踪结果有506个虚警点(图2(c));h=6时有149个虚警点(图3(a));h=7时有37个虚警点(图3(b)),即有52个点像素值更新次数大于6;h=8时有4个虚警点;阈值h选取10到29中任一个整数时,可滤除所有的虚警点,得到三个迎头点目标所占的15个像素点(图3(c))。可见,本算法阈值选取范围大,可结合实际应用情况选取合适阈值,区别与传统算法阈值设置步骤复杂且易影响检测结果的现状。分析算法对实拍约25 km处飞机图像的实验结果得到,信噪比为1时,算法阈值选取5到28中任一整数时都可以成功检测出迎头目标。

理论上,迎头点目标本身占有几个像素,帧间移位变化不大,在以某点为中心的邻域内,步长为1时就可以检测出目标。结合实际情况,可通过改变步长来适应目标帧间移位大小,步长为2时,执行算法步骤,设置不同阈值对检测概率的影响统计如表2所示。数据表明本算法可以在高噪声情况下实现目标跟踪,尤其是近乎100%的检测概率、超低虚警率、大范围的阈值设置,这是传统算法不可能达到的。

3.2 实拍红外图像迎头点目标轨迹跟踪的工程验证

上节实验结果证明,本文提出的迎头点目标检测与轨迹跟踪算法是可行的、可靠的、高效的。本节我们结合光电跟踪仪在工程中的应用情况,在天空云层背景下,以距离约25 km处的飞机作为点目标对象,进行轨迹检测与跟踪的工程验证。实际工作过程中,光电跟踪仪实时地进行连续拍摄,由于目标距离远、成像面积小,运动轨迹近似迎头目标点,以适当的频率采样选取30帧图像。按照算法流程,对序列进行帧间匹配,最后实现目标的快速检测与定位。

从第1帧原始图像(图4(a))可以看出,云层背景是比较复杂的,从第一帧的多向梯度算法处理并二值化(图4(b))结果得到,存在部分噪声虚警点。迎头点目标特点之一是每帧所在的像素区域几乎相同,必然矩阵S在目标区域像素点更新值次数就多,算法在输入第12帧门限阈值为5时就可以判断出该目标为迎头点目标,随着输入图像帧数的增多其就更加确定,阈值为13在输入第30帧图像时得到迎头点目标跟踪结果如图4(c)所示。

实验结果证明,本算法能够对运动点目标有效地检测和轨迹跟踪,随着红外图像输入帧数的增加,点目标轨迹所在像素点也增加,虚警轨迹几乎不可能具有这种规则性的变化,因此,在经历若干帧的处理后,真实目标会很容易被识别出来。

4 结论

本算法是一种可靠的、高效的、实用的边跟踪边检测算法,实验结果充分验证了这一点,同时也突出了算法所具有的以下几个特点:

1)在高噪声条件下,如此高的检测概率、超低虚警率、宽范围的阈值选取是传统算法不可能达到的。

2)采取点对点标记匹配结果,点对点统计匹配成功次数,存储处理高效快捷。

3)采取遍历点对点的邻域匹配,避免了提前假定目标点位置,大大提高了检测概率。

4)对不同数量目标或不同运动状态目标的跟踪检测过程相同,算法应用范围大。

但是,该算法跟踪结果受到前期单帧图像预处理的影响,选择合适的预处理方法是完善算法值得重视的一点;其次算法可有效解决高噪声情况下迎面点目标跟踪问题,但对高噪声条件下非迎头目标的跟踪轨迹不够清晰,这是改进算法必须解决的问题。

摘要:针对传统检测跟踪算法无法有效处理迎头点目标的问题,提出了基于红外序列图像相邻两帧间匹配的检测算法。根据迎头点目标的红外序列图像特点,采取点对点标记匹配结果,点对点统计标记次数,阈值门限输出迎头点目标。算法无需假定目标点位置,检测过程不随背景复杂程度和目标点数目变化而变化,尤其解决了高噪声情况下迎头点目标的检测和跟踪问题。算法结构简单、存储量小、运算速度快,根据多次仿真和实拍照片实验,验证了该方法的可行性和有效性。

关键词:图像处理,目标跟踪,目标检测,点目标,红外图像

参考文献

[1]宗思光,王江安,陈启水.海空复杂背景下红外弱点目标检测新算法[J].光电工程,2005,32(4):9-12.ZONG Si-guang,WANG Jiang-an,CHEN Qi-shui.New detection algorithm for Dim IR point targets under complicated sea and sky background[J].Opto-Electronic Engineering,2005,32(4):9-12.

[2]王江安,康圣,叶利民.基于队列流水线的弱点目标轨迹跟踪算法[J].光电工程,2007,34(9):1-4.WANG Jiang-an,KANG Sheng,YE Li-min.The Tracking Algorithm Based on Pipelining-queue for Dim-point Target[J].Opto-Electronic Engineering,2007,34(9):1-4.

[3]YAN Xiong,PENG Jia-xiong.An Extended Track-before-detect Algorithm for Infrared Target Detection[J].IEEE Transactions on Aerospace and Electronic Systems(S0018-9251),1997,33(3):1087-1092.

[4]Caefer C E,Silverman J,Mooney J M.Optimization of point target tracking filters[J].IEEE Transactions on Aerospace and Electronic Systems(S0018-9251),2000,36(1):15-24.

[5]Succary R,Cohen A,Yaractzi P,et al.A Dynamic Programming Algorithm for Point Target Detection:Practical Parameters for DPA,in Signal and Data Processing of Small Targets[J].Proc.of SPIE(S0277-786X),2001,4473:96-100.

[6]CHEN Hua-ming,SUN Guang-fu,LU Huan-zhang.Multi-level Thresholding and Confidence Testing Detection Algorithm for Small Moving Target in Image Sequences[J].Proc.of SPIE(S0277-786X),2001,4473:520-529.

[7]Johnston L A,Krishnamurthy V.Performance analysis of a dynamic programming track before detect algorithm[J].IEEE Transactions on Aerospace and Electronic Systems(S0018-9251),2002,38(1):228-241.

复杂背景 篇2

针对光电经纬仪在飞机起飞着陆段跟踪角速度大、背景复杂的.情况,根据小波多分辨率技术,提出利用小波分层组成低频图像金字塔,利用光流技术进行匹配解算,实现由粗到精的特征点匹配跟踪.通过对飞行试验视频图像进行事后自动跟踪试验,结果表明,该算法能够稳定可靠跟踪多特征点目标,具有鲁棒性.

作 者:李宏 杨廷梧 任朴舟 李朝晖 LI Hong YANG Ting-wu REN Pu-zhou LI Zhao-hui 作者单位:李宏,任朴舟,李朝晖,LI Hong,REN Pu-zhou,LI Zhao-hui(中国飞行试验研究院,陕西,西安,710089)

杨廷梧,YANG Ting-wu(中国飞行试验研究院,陕西,西安,710089;西安电子科技大学,陕西,西安,710072)

背景复杂的性障碍,你有吗 篇3

刘胜希望我能给他些帮助。我当时绝没有想到,自己偶然间涉及到的这个事例竟具有很大的内涵,在性生理学、性心理学和性社会学各角度,均有研究价值。

即使是相交甚深的老友,谈及房事,刘胜同样有些羞涩,刚开始时并没有向我倾囊相诉,我对其各种复杂症结的发现,是一步步完成的。

刘胜的陈述从抱怨开始。初婚时,他夫人对房事亦表现出一定兴趣,但自从有了儿子之后,便对性生活持抗拒态度,非但从未主动提出性要求,而且对刘胜过夫妻生活的要求十分反感,虽然年仅30岁,却两三个月才同意过一次性生活。刘胜自然不会强迫妻子,只能压抑自己的欲望,那种痛苦是不难想像的。刘胜先入为主地认为,妻子性冷淡,他问我有什么办法使她热情提高起来。

我当时便提出,应该让王琳和他一起就医,因为夫妻性事,只通过单方面的咨询是很难下结论的。但是,刘胜说,这绝不可能。首先,他夫人认为她现在的样子很正常;其次,去看性医生是件丢人的事,不仅王琳不可能答应,刘胜自己也做不到。我便提议,我可以找熟识的医生开出一些促进女子性欲的药物,但是,刘胜又说,夫人绝对不会同意吃药的。

我告诉刘胜,如果王琳拒绝配合,真的很难有什么妙计。刘胜回家后显然一再与夫人谈及此事,不久后,他告诉我,每当他提及这个问题时,他夫人都斥他无聊,更不可能接受共同求医的主张。

我只能努力担起医生的责任了。我便告诉刘胜,女性对性生活的冷漠往往是因为高潮体验不足,所以,他应该试着通过延长性交时间和变换性姿式等方式使妻子多体验性高潮,她充分享受了,性欲自然会强的。我还借给他一些书,让他理论结合实践地“研习”。两个月后见面时,刘胜却哭丧着脸告诉我,他的所有努力都失败了,当他夫人在他的央求下同意做爱的时候,她不仅拒绝改换姿式,甚至拒绝接吻,更有甚者,刘胜说:“我想延长时间,让她达到高潮,但她自己不愿意,总说:‘你能不能快点结束?’”

王琳的“性趣”真是很“冷酷”。一个女人的性冷淡,总有些原因。因为性生活中男人的主导地位,我们往往总会在男人那里找到使女人冷淡的症结。于是我问刘胜:“你自己倒底怎么样?”

刘胜赌咒发誓地说:“我很棒。不仅器官很棒,体质也很棒,绝对应该让女人满意。”

但是,仅仅有了这些远远不足以保证让女人满意,强壮的男人有时只会让女人觉得粗暴,女人对性的感受绝不仅仅来自器官,而是一个多面体。新婚时的王琳不也是对性有些兴趣吗?我便帮助刘胜分析,会不会他无意中的某次做法,使王琳对性冷淡了呢?

刘胜想了想,说:“我不知道。”但我相信,刘胜的责任是不容排除的。

不久之后,我见到了王琳。闲聊时,王琳无意中指责刘胜:“他只顾自己高兴,从来不考虑我和孩子……”王琳的话当然是泛指,我却立即想到了他们的性生活。

几天后,我问刘胜:“性生活时,你考虑她的感受吗?

刘胜说:“我们各人顾各人。”

事情已经很清楚了。

我告诉刘胜,他必须更多地去关心妻子的感受。刘胜答应了,但是我知道,要真正成为一个好的性伴侣绝非一日之功,这其实是对一个男人整体的要求。如果不是一个善于体贴妻子,关心别人的男人,怎么可能只在性上独具温情呢?

而且,另一个重要问题是,王琳的冷漠已经形成了,刘胜在一张冷面孔下很难有施展的余地。也许,只能借助一些特殊的办法了。

我便将一盘西方性教育的录像带借给刘胜,让他与夫人同看,寄希望于激发起夫人的感觉。一个星期后,刘胜来还录像带时告诉我,第一次看时,夫人很兴奋,他便立即做爱。做爱之后,夫人便翻过身去,拒绝再看录像了。

我立即发现了刘胜的失误,他还是太注重自己的感觉了。他不应该急于作爱,而应该在王琳的欲望被录像激发得无法自持之后,再忍耐、煎熬,同时伴以爱抚、激发,之后再作爱。像他这样,录像还没放完,性事已完,怎么可能从根本上改变夫人的心态呢?

刘胜答应当晚再试,我又告诉他,这次绝对不要想自己快乐,而要尽一切可能使夫人快乐。这是他惟一的机会了,只要王琳的性欲望激发起来,他不快乐、没有高潮又有什么关系呢?王琳日后会加倍地补偿他的。刘胜笑称:“你这是让我放长线钓大鱼。”我说:“当然。聪明的男人总是通过使女人获得性享受来抓住女人的。” 刘胜答应不再只顾自己,完全让夫人享受一晚上。

第二天,刘胜打电话来,沮丧地告诉我,他又失败了。原来,昨天晚上他夫人从一开始便拒绝看录像,当刘胜自己在那里享受着视觉快感时,王琳倒头大睡,不为所动。转天早晨还郑重其事地找刘胜谈话:“还是快把录像带还了吧,这样下去就会总想这种事,犯错误。”

我惊异于王琳竟有如此强烈的罪恶感,将对性快乐的正常欲求视作洪水猛兽了。

我对刘胜私生活的“干预”进行半年之后,一次与刘胜的闲聊中,他偶然提到,夫人时常服用减肥药物,我立即告诉他,许多减肥药物在抑制食欲的同时也会抑制性欲,王琳的性冷淡,从生理上考虑可能与此不无关系。此外,一些降压药、抗溃疡药和抗抑郁药,甚至安眠、止痛类药物也可能影响到人的性欲。

刘胜说:“我这几年一直失眠,几乎每天晚上都服安眠药才能入睡,可没感觉影响性欲呀。”

我告诉他,他的失眠其实正是性欲未能满足的一种表现。而习惯性的失眠与长期的服药,不可能不影响到他的性能力,所以,他需要重新检查自己的自信。刘胜想了想承认,他最近的确感到自己欲望淡了,更多的是力不从心,时常出现阳痿。看来,一种恶性循环,已经在他身上显现出来了。

一个周日,我打电话给刘胜,他告诉我,刚刚从教堂回来。我这才记起了,刘胜和他的夫人都是基督教徒,只不过刘胜并不热衷宗教,很少谈及,所以我几乎都忘记了。刘胜在电话里告诉我:“我很久没去教堂了,但她很虔诚,每个礼拜日都去。”

我眼前一亮,思维中的某个记忆便这样被震动了:王琳是虔诚的教徒,她的父母和亲戚都是基督徒,她从小在宗教氛围中长大!

这一事实对于解释王琳的性冷淡太重要了,我无法原谅自己此前竟将它忽略了。

众所周知,基督教将性欲视为"原罪",认为亚当和夏娃之所以被逐出伊甸园便是缘于这一原罪。按着基督教的主张,教徒的性生活只有当其出于生育的目的时,才是正当的,否则便是罪恶。而在性生活中,追求感观的享受更是十恶不赦,所谓“非为乐也,是为后也”。在对人的权利剥夺最盛的中世纪,有些妻子甚至一生都不让丈夫看到或触摸到自己的裸体,性交通过睡衣中间开的一个小孔进行,一旦怀孕,便不再过夫妻生活。当然,历史发展到今天,这种过份的禁忌已经不存在了。但是,王琳从小生长在虔诚的宗教家庭里,基督教思想的耳濡目染,在她思想深处埋下根深蒂固的束缚,是显而易见的。果真如此,她对性生活的种种态度,便可以从文化角度找到依据了。

也正是在那次与王琳的见面时,我感受到,她对刘胜的许多人生态度不满,特别是缺少她自己具有的那种敬业精神。这是一个很要强的女人,她自己的事业很成功。而刘胜属于那种淡泊的人,但太淡泊了,也是一种不求进取的表现。我不能不想,王琳与刘胜人生态度迥异,她对他的不满显而易见,这种对整个人的不满是否也会影响到她的性感受呢?毕竟,影响女人感受的东西太多了。

到此,刘胜夫妇的性生活障碍,已经暴露出了他们在性生理、性心理和性社会学各领域的原因。我清楚地知道,单纯靠与刘胜单方面的谈话,是无法成功地帮助他们的。要想改变刘胜及其夫人的状况,需要太多的努力。而最大的难题是,王琳拒绝接受医生的帮助。我真的无能为力。

我设想,如果刘胜和他的太太都能够坦然接受调适,又会有什么办法好想呢?毕竟,他们间的问题太多了,根底太深了。其实,成功可能性最大的办法便是西方一些国家中实行的“代性配偶”疗法,即由专业人员分别充当男女双方的性治疗配偶,帮助通过实际的行为改变自己。但这在目前中国无疑是无法实行的。

性生活是美好的,但维护美好的性生活,需要我们做出很多具体的努力。

复杂背景下的人耳检测方法 篇4

人耳检测作为人耳识别的第一步,有着不可忽视的作用[1]。目前绝大多数人耳识别的课题研究工作都是在假定图像中的人耳己经被定位和检测的前提下进行的。为设计出人耳自动识别系统,在复杂背景下快速而高效地检测人耳是必须解决的一个关键性问题。依据Yang等对人脸检测的定义[2],我们可以把复杂静态背景下的人耳检测定义为任意给定一个图像,判定该图像中是否存在人耳,如果存在则返回其位置及空间分布。在这样一个检测过程中,由于受多方面因素的影响,检测与识别人耳受到了很大限制。其中,检测目标的姿势、背景复杂度、周围的亮度以及目标的一些具体特征(例如耳环)都将影响到检测的效果。目前已有的人耳检测方法主要是在简单背景或无背景下进行的,而复杂背景下仅有张惟等人提出的基于改进AdaBoost算法的人耳检测方法[3]。该方法主要分为两个阶段,离线级联分类器训练阶段和在线检测阶段。在离线训练阶段,采用扩充后的Haar-like型特征,依最近邻法则构造出弱分类器空间,然后根据经验选择Gentle Ada Boost(GAB)算法训练出强分类器[4],最后将多个强分类器级联成多层人耳检测器。在线检测阶段,为提高检测率,采用了调整分类器阈值和缩放检测子窗口的策略。

上述方法首次实现了复杂背景下的人耳检测,但同时也存在着一些缺点,如算法对样本的依赖性太强、离线阶段分类器的训练时间过长等。因此,本文提出一种综合利用人侧脸多种信息特征的快速人耳检测方法,通过肤色检测、侧脸区域筛选逐步排除图像中的非人耳区域,然后对图像进行多尺度边缘检测,利用人耳区域边缘的密集特性对边缘图像进行膨胀和填充,使得人耳边缘处形成边缘区域,然后对边缘图像进行基于边缘区域的搜索,得到检测目标。

1 肤色检测

1.1 基于肤色模型的肤色检测

肤色检测的前提是选择颜色空间和肤色模型[5]。本文所述算法中,我们选择常用的YCbCr作为肤色检测的颜色空间,选择简单高斯模型作为肤色检测的模型。其检测过程如图1所示。

1.2 形态学处理

人耳检测过程中,肤色检测的目的是缩小检测范围。为了尽可能保留肤色区域和排除干扰[6],我们对得到的肤色二值图进行形态学[7]处理。首先,对二值图像进行腐蚀操作。据人侧脸的先验知识可知,人耳是包括在侧脸肤色区域范围内的。如果图像中含有人耳,腐蚀后的图像不会完全消除含人耳的侧脸区域。腐蚀操作后,无意义噪声点被消除,但同时图像中可能的目标区域也会减小。考虑到肤色检测只是人耳检测的第一个步骤,而消除部分区域的不规则边界时,有可能使人耳的部分边缘特征消失,因此本实验中又对腐蚀后图像进行了重构,复原腐蚀时可能去除掉的感兴趣区域。图2所示为依据上述方法对图像进行肤色检测和处理的结果。

2 基于侧脸先验知识的区域筛选

肤色区域选取以后,我们要对图像中每个肤色区域依据人侧脸特征进行筛选,以进一步排除不含人耳的非侧脸区域,缩小检测范围。为统计复杂背景下的人侧脸特征,本文选取英国曼切斯特理工大学所建的University of Manchester Institute of Science and Technology[8](UMIST)人脸库中不同角度偏转的200幅含人耳图像以及实验室采用数码相机拍摄的90幅复杂背景图像作为统计依据。分别对侧脸的长宽比例、复杂背景下有检测意义的侧脸的相对面积、侧脸在其最小外接矩形中的肤色占有率等进行了统计,根据统计知识可知,以下这些区域中不包含侧脸,或者即使包含侧脸,也由于尺度过小或偏转角度过大而对人耳的检测和识别无太大意义:

(1)类肤色面积小于规定阈值的区域。如本文中所采集的图像大小均为1 200×1 600,则当某一候选区域的类肤色面积小于250个像素时,即认为是无意义区域。

(2)区域的长短轴之比大于4.5。由于复杂背景下部分图像的侧脸部分图像和脖子或上身的图像分界模糊,故在统计时不仅仅考虑侧脸处的比例范围。

(3)区域的最小外接矩形中,类肤色的面积占有率小于2/5或者大于3/4。对于侧脸而言,其外接矩形中包含侧脸周围的头发等形成的非肤色区域,故不可能全部被肤色填充,而其他类肤色或者部分人体肤色区域的外接矩形则可能全部被肤色填充,采用肤色占有率则可以排除该类区域。

本文对经过肤色分割的复杂背景图像进行筛选,删除一些不符合条件的类肤色区域,处理后的结果如图3所示。

3 人耳检测

利用区域筛选得到的候选区域的灰度信息,经过对各种图像边缘检测方法的适用情况的分析,选择小波模极大值方法在不同尺度空间下检测图像边缘并对得到的边缘图像进行叠加,然后依据人耳内部有丰富边缘信息的特点,对叠加后的密集边缘图像进行处理和边缘区域搜索,从而实现人耳的判断和定位。下文将通过具体例子详细介绍这一过程。

3.1 人耳检测步骤

依据对人耳边缘特性的统计,得知边缘图像中孤立的像素点或稀疏的独立边缘线都不会是人耳所在区域,故本文系统中采用以下步骤对图像进行处理,如图4中待处理图像(a),以期获得图像中感兴趣的区域。

(1)采用上文所述的区域筛选方法对图像(a)进行处理,排除不符合筛选条件的区域,得到图像(b);为了避免由于肤色分割时遮挡等造成的耳朵部分边缘漏检,选取候选区域的最小外接矩形作为目标区域,得到图像(c)。利用小波模极大值算法对图像边缘进行检测得到边缘二值图像,排除干扰可得图像(d)。

(2)采用形态学重构[9]方法进行开运算。为了消除图像中的干扰边缘,同时保持原有可能的人耳区域不被消除,在对原图像腐蚀以后再进行重构操作。由于人耳处的边缘线密集相连,所以重构过程可以很好地对其进行复原。图4中(e)显示的就是对(d)重构后的图像。

(3)对边缘图像进行膨胀[10]操作,使原本密集的人耳边缘连接成一个边缘亮区。此时图像中耳朵处的连通区域相互融合,内部形成封闭孔洞。填充图像中的孔洞,使得耳朵内部封闭的背景区域被填充为前景,而其他干扰边缘在填充过程中无面积改变。图4中,(f)为膨胀结果,(g)为填充结果。

(4)人耳区域判断。对膨胀过后的边缘区域进行迭代细化操作,直至所有边缘线细化为由单像素相连的边缘。此时对图像进行腐蚀操作,细微的边缘线被消除,如果此时图像中无亮区,我们认为该图像中无正面人耳。若腐蚀后依然存在亮区,则该区域即为我们下一步要进行定位的对象。图4中的(h)为细化结果,(i)为腐蚀结果。

(5)由重构恢复(4)中保留的区域,如图(j)即为重构结果。

(6)人耳区域定位。依据步骤(4)所得的边缘区域,在原图中将其所在的最小外接矩形作为检测的结果范围。图(k)为采用宽度为3像素的红色边缘进行人耳区域标定的结果。

3.2 人耳检测图像库

人耳检测图像库主要用于评价、比较各种人耳检测算法的性能。目前,复杂背景下的人耳检测研究比较少,还没有用于检测的标准图像库,所以在本实验中,检测用的图像库图像主要来自于数码相机拍摄的一个统一的、标准的、开放的人耳数据库Design and Construction of Chinese Ear Image Database(CEID),该数据库共采集了200个中国人的人耳图像。被拍摄人员均为重庆大学学生,年龄大多在20~30岁之间,有少数30岁以上的。被拍摄者来自全国的各个省份,其中主要为汉族人,有少数侗族、土家族、苗族、回族等民族的人。拍摄后对每一位被拍摄者的基本信息进行了记录,包括被拍摄者的姓名、性别、年龄、民族、籍贯等。这些图像分为左耳子库、右耳子库和复杂背景图像库,其中左耳子库和右耳子库均有光照变化、角度变化和遮挡变化3种模式。对于每个被拍摄者,每个子库都拍摄了16幅图像。复杂背景图像库为背景复杂多样的彩色图像,每幅图像中人耳个数不定,背景情况未知,可能存在其他肤色干扰或者类肤色物体的干扰。

本实验从数据库中采样的图像分为两组,共包含240幅图片。第一组为单一背景下的人耳图像,共200幅。其中每幅图像都只含单一的、无其他肤色干扰的、无大幅度旋转和偏转的正面人耳。第二组为背景复杂多样的彩色图像,共40幅。

3.3 人耳检测结果

实验分两部分进行,一是对简单背景下的200幅图像进行人耳检测,统计其检测效果;二是对40幅复杂背景下的人耳图像进行检测,并统计其效果。统计结果如表1所示。

由表1可知,本文算法对200幅背景相对简单的人耳图像有较好的检测效果,检测率达到100%,而对于背景较复杂的情况,检测率达到94.5%,图5所示为部分检测结果。对于复杂背景下漏检和误判的原因,分析如下:

(1)肤色造成的漏检。由于肤色分割是进行人耳检测的首要前提,如果肤色分割时造成含人耳区域的漏检,则在后续的处理中将无法弥补,如图6所示。

(2)对于多人耳图像,某些人耳可能被其他物体遮挡,造成肤色区域因面积或比例不符合区域筛选的要求而被删除,从而形成漏检,如图7所示。

(3)靠近图像边界的肤色可能在多尺度小波分解时形成伪亮区,从而造成误检,如图8所示。

结束语

针对复杂背景下的彩色图像,本文提出了一种基于肤色信息、侧脸统计知识和人耳内部边缘特征的人耳检测方法,实现了复杂背景下的人耳检测。该方法克服了以往人耳检测方法中对人耳位置、个数、旋转角度以及人耳共性特征等知识的依赖,对在二维平面内任意旋转的人耳有很好的适应性,有望为人耳识别系统的发展提供有益的参考。

参考文献

[1]张海军,穆志纯,危克.人耳识别技术研究进展综述[J].计算机工程与应用,2004,40(33):5-7.ZHANG Hai-jun,MU Zhi-chun,WEI Ke.Progress and Status of Ear Recognition Research[J].Computer Engineering and Applications,2004,40(33):5-7.

[2]YANG Jie,Waibel A.A real-time face tracker[C]//Proceedings of the3rd IEEE Workshop on Applications of Computer Vision(WACV'96),Sarasota,Florida,USA,Dec2-4,1996:142-147.

[3]张惟,穆志纯,袁立.基于改进AdaBoost算法的人耳检测与跟踪[J].中国图象图形学报,2007,12(2):222-227.ZHANG Wei,MU Zhi-chun,YUAN Li.Fast Ear Detection and Tracking Based on Improved AdaBoost Algorithm[J].Journal of Image and Graphics,2007,12(2):222-227.

[4]Paul Viola,Michael Jones.Robust Real-time Object Detection[R].TR CRL2001/01,Cambridge,UK:Cambridge Research Laboratory,2001.

[5]王金庭,杨敏.基于YCbCr空间的亮度自适应肤色检测[J].计算机系统应用,2007(6):99-102.WANG Jin-ting,YANG Min.Self-adaptive Skin Color Detection Based on YCbCr Color Space[J].Computer Systems&Applications,2007(6):99-102.

[6]王敏,穆志纯,徐正光.基于肤色模型的人耳检测系统[J].微计算机信息,2005,21(8):51-53.WANG Min,MU Zhi-chun,XU Zheng-guang.Dynamic Ear Detection Based on Skin Color Model[J].Microcomputer Information,2005,21(8):51-53.

[7]Gonzalez Pafael C,Woods Richard E.Digital Image Processing[M].Beijing:Publishing House of Electronics Industry,2003.

[8]Graham D B,Allinson N M.Face Recognition:From Theory to Applications[Z].Scotland:NATO Advanced Study Institute on Face Recognition,1998:446-456.

[9]赵于前,柳建新,刘剑.基于形态学重构运算的医学图像分割[J].计算机工程与应用,2007,43(10):238-240.ZHAO Yu-qian,LIU Jian-xin,LIU Jian.Medical image segmentation based on morphological reconstruction operation[J].Computer Engineering and Applications,2007,43(10):238-240.

一种复杂背景下的目标提取算法 篇5

图像技术发展到现在,已经渗透到了很多领域医用细胞检测就是图像分割技术的一个应用领域。比较同一种细胞在不同生理、病理或实验条件下形态的变化,可以为病理分析和病情诊断提供新的科学依据。目前的医学细胞涂片判读基本上都是由人工来完成。不过随着图像处理技术的发展,细胞自动检测系统正成为图像识别在生物医学工程领域的一个新兴课题

目标提取(细胞检测)是进行细胞面积、圆度和个数等形态的定量计算和分析的基础,其检测的结果直接影响到最终诊断结果。如果检测效果不理想,就无法进行细胞形态学分析。

目标提取采用的是图像分割技术。由于图像的不确定性以及受环境、噪声等影响,使得图像分割变成一件复杂的事。对于目标和背景颜色差异较大的情况往往易于处理,而对于目标和背景颜色差异较小的情况则处理较难。由于医用细胞涂片受采集设备所限,往往清晰度不高。这给目标提取增加了不少的困难,使得运用传统的图像分割技术难以直接达到很好的效果。本文就医用细胞检测为例,提出一种复杂背景下的目标提取算法。

1传统图像分割技术的局限性

1.1传统图像分割技术概述

图像分割多年来一直是人们高度重视的技术,到目前为止所提出的分割方法成千上万,但是没有一种万能的算法可以适用于所有领域,每种分割方法都有其自身的适用范围和优缺点。根据图像的特征可以大致将分割方法分成以下三类:

(1) 基于全图或部分图像全局信息的图像分割方法。该类方法通常用于目标和背景颜色差异较为明显的图像,用阈值法求得一个阈值,通过阈值分割背景和目标,这样做既简单又高效,但是在背景和目标颜色接近的时候提取效果不好。目前常用的阈值处理方法有直方图阈值法、最优阈值法(也称Ostu阈值法)、均值聚类法等[1]。

(2) 基于边缘的图像分割方法。通常通过边缘检测模板算子(如sobel算子),利用目标边缘的不连续性找到目标的边缘。该类方法在处理待分割的目标边缘有明显的不连续现象时分割效果较明显。但是受噪声影响较大,且分割后边缘不连续[2]。

(3) 基于区域的图像分割方法。该类分割方法采用了相似区域生长技术,把具有同一类性质的区域合成一个目标区域。如区域生长、区域分裂及合并等[3]。由于基于区域的分割方法同时考虑了图像的颜色信息和空间关联信息,因此分割效果较好,但其往往仅限于特定的图像。

1.2传统分割方法用于医用细胞图像分割遇到的困难

如果细胞检测采用基于边缘的图像分割方法会造成边缘不连续,给后续的细胞统计工作造成很大的困难。而且医用细胞图由于受到采集仪器的精度限制,必然会存在一定的噪声干扰,这就造成了基于边缘的分割算法应用于目标提取都必须增加降噪的开销,且效果不甚理想;而基于区域的分割方法,以分水岭分割为例,需要待分割目标有像素值渐变过程,不能用来直接提取目标,但是可用于目标提取之后的粘连细胞分割,往往用来作为目标提取之后的后期处理。因此,医用细胞图像的目标提取采用阈值处理的方法比较适宜。

从图1这张细胞图中可以看出,左下角区域采集情况良好,细胞和背景颜色差异很大,用阈值分割可以达到很好的效果;而其余区域细胞和背景颜色接近,简单的阈值分割无法将其从背景中分离出来。

图2为图1对应的直方图,可以看到直方图中只有1个波峰。该波峰对应之处主要为图像中的背景及一部分颜色较浅的细胞。波峰左侧的像素点基本都是细胞所在区域。因为细胞所在区域像素的灰度值没有明显的聚集区,甚至有一部分细胞所对应的像素和背景对应的像素混杂在一起,因此无论是采用直方图阈值分割,或是Ostu阈值法,抑或是两到三类的均值聚类法[4],都无法较好地将细胞从背景中提取出来。

2本文提出的目标提取算法

2.1算法原理

经研究发现,图1中细胞和背景所对应的像素灰度值只出现部分交集,并非完全混杂不可分。但是因为部分灰度值较低(即颜色较深)的细胞的存在,无论是全局阈值处理或是分块后局部阈值处理,求得的阈值总是低于真实阈值。而且由于细胞和背景之间交集的存在,部分颜色较浅细胞无法用一个阈值和背景分离开来。如果能将那些颜色较深的细胞去除,则分离剩余细胞和背景的任务就相应变得简单一些了。

本文算法采用三次阈值分割过程。设全图为S,第一次阈值分割对全图S求得一个阈值T1,将S分为两个部分S1和S2,所有小于等于T1的像素归入S1,大于T1的归入S2。这样第一次提取之后的目标为S1,主要为那些颜色较深明显有别于背景的细胞。

然后对S2中的像素进行第二次阈值处理,求得阈值T2,进行二次分割。将S2分成S21和S22两部分,所有小于等于T2的像素归入S21,其余的归入S22。因为去掉了S1,S2中的像素灰度值都较为接近,此时阈值T2能够较好地定位于目标和背景之间。这样第二次阈值处理提取的目标为S21,主要是那些颜色较浅的细胞和一些被误提取的背景。两次被提取的目标总和为S1+S21。

由于受采光条件所限,造成了部分区域的细胞灰度值反而大于另一区域的背景灰度值,也即目标和背景的灰度值存在交集。这样会造成二次分割后S21中不可避免地存在着一部分背景(通常这部分背景在细胞的外围)被当成是目标提取出来。反映在图像上就是和细胞邻近的那些背景也被当成目标提取出来了,造成了被提取的细胞面积大于其实际面积。

对于上述现象,进行第三次阈值处理。首先将S1和S21中的像素合并,然后用填充算法或是扫描算法处理全图,将所有相邻的目标像素归为一类,标记为一个连通区域Pi。所有的连通区域依次插入到链表中。对每个连通区域Pi,再次调用阈值算法统计该区域的像素灰度值,得到阈值Ti,然后将该区域中所有像素都和Ti比较,灰度值大于Ti的像素(这部分像素几乎都是被误提取的背景)全部从该目标区域中去除,归入S3中。通过这样的方法可以将那些被误提取的背景去除。这样最终被提取的目标为S1+S21-S3。

2.2算法伪代码

假设图像的背景灰度值大于目标,用g(x,y)表示图像中坐标为(x,y)点的灰度值。

算法的实现步骤如下:

用填充算法或是扫描算法记录每个连通的目标区域,放入结点Pi中并插入到链表

while(指向当前目标区域的指针不为空)

统计当前目标区域Pi中所有像素的灰度值,阈值处理,得到阈值Ti

for(Pi中每个像素(x,y))

if(g(x,y)> Ti)

将该点标记为背景并从Pi中除去

将指针指向下一个区域

3实验分析

对图1所示的灰度图,直接进行一次全图阈值处理,无论是采用何种阈值处理方法,都无法得到让人满意的结果。图3所示为全图直方图阈值法后得到的结果,部分目标没有被提取出来。在图3的基础上采用本文算法进行第二次直方图阈值分割,结果如图4所示。对比图1,明显发现提取了过多的目标,使得细胞臃肿。然后采用本文算法对每个连通区域进行第三次阈值处理,得到最终结果如图5所示。

在效率方面,新算法采用了三次阈值处理,其中第三次阈值处理最为复杂。从整体分析,第三次阈值处理(对每个连通区域阈值处理)访问的像素个数总和只是图像中被提取出的目标像素个数,因此效率反而高于一次全图的阈值处理。但是在第三次阈值处理过程中加入了一次区域填充的过程,使得效率比起一般阈值处理稍低。采用快速的连通区域标记算法[5]可进一步提高效率

4结论

经实验发现,新算法不仅适用于医用细胞分割,对于其他目标和背景有一定程度交集的图像同样有效。在图像分割有特殊要求,导致考虑边缘一阶或二阶方向导数变化规律来检测的边缘检测算子无法使用的情况下,本文提出的算法提供了一种较好的选择。而且本文算法对噪声影响较小。在用算法检测之前采用中值滤波、检测之后采用孔洞填充,可以较好地弥补噪声的影响

对于提取后的细胞粘连情况,采用距离变换后分水岭分割[6]可以较好地完成粘连细胞之间的分割。但在目标和背景颜色完全混杂不可分的情况下,采用新算法将得不到预期效果。

参考文献

[1]OTSUN.Athreshold selection method from gray-level histograms[J].IEEE Trans SMC,1979,9(1):62-69.

[2]林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报,2005,10(1):1-10.

[3]Rafael C,Gonzalez Richard E,Woods.Digital Image Processing SecondEdition[M].电子工业出版社.

[4]郭戈,平西建,胡敏,等.基于迭代的癌细胞图像自动多阈值分割[J].信息工程大学学报,2004,5(3):72-74.

[5]刘关松,吕嘉雯,徐建国,等.一种新的二值图像标记的快速算法[J].计算机工程与应用,2002,03(4):57-59.

复杂或陌生业务背景下的年报审计 篇6

一、复杂或陌生的业务与审计关系

行业中有句俗话,上市公司的经济业务越复杂,注册会计师的审计风险相对就越大。在年报审计工作中,有时注册会计师虽然能搜集到很多有力审计证据,但仍难以证明其经济业务的实质。在此种情形下,注册会计师往往需要冒很大的审计风险。企业利用复杂或陌生的业务进行舞弊的情况主要有几个方面:

1. 非正常的交易

不少上市公司为了“扭亏为盈”,或达到规定的配股条件,常常采用非常交易,如出让土地、设备、股权等,年末发生非常销售业务、收取政府补贴等,从而获取非常收益。在审计工作中,对于这些非常交易的合法性、有效性、公允性,注册会计师应当给予适当关注,否则就可能遗留下巨大的风险隐患。

2. 非货币性交易

有许多上市公司的交易业务是非货币性的,如转让土地、股权等巨额资产,没有现金流入,只是借记“应收款项”,同时确认转让利润。还有一些公司通过非法渠道将资金拆借出去,或者将资金投入子公司,这些资金或资本实际上已难以收回,也没有现金流入,却仍在以此确认利息收入或投资收益。在审计工作中,如果注册会计师发现公司的主要利润是非货币性的,其正常的生产经营能力和获利能力就应当受到怀疑。

3. 跨地区交易和涉外交易

许多上市公司的业务是跨地区甚至是跨国经营的。有的国家或地区可以以一元钱注册一个公司,进行数亿元的业务也没有法律限制;有的合同本身就是假的;还有多数上市公司在全国各地有子公司或分销点,这样就有部分致使审计范围受到限制,如何鉴定财务状况和经营成果,如何验证销售收入的实现与否,就成了严重困扰注册会计师实施审计程序的大问题。而且,有的公司没有充分认识注册会计师审计的重要性,不愿支付必要的审计费,更不要说去分销点或国外查账的差旅费了。在审计范围受到如此限制的情况下,审计风险便在所难免了。

4. 复杂的股权结构隐瞒交易

某些公司为了达到一定目的,会通过各种办法安排和改变股权结构,构建错综复杂的公司架构体系,同时,实际控制人自己又设计错综复杂、隐敝的公司架构,然后,两个不同的公司架构体系之间进行大量的、隐敝的、复杂的交易与资金往来,以达到调节利润、转移资金、粉饰报表的目的,如科龙系与格林柯尔系之间发生的关联交易。

二、复杂陌生环境下的审计对策

审计工作中,注册会计师如何真正了解、识别被审计单位复杂或陌生的业务,仍是一个我们需要探讨的话题。作为一名审计人员,必须要做到面面俱到,用合理的事实说话,有效的回避注册会计师的审计风险。在实务中,可以从以下方面取得突破口:

1. 行业背景调查

在互联网发达的今天,对拟审计的上市公司进行背景调查已经变得可行了。互联网上有很多的网站提供或多或少的公司信息搜索服务,通过这些服务,可以在线通过背景调查来鉴别大部分的上市公司实际经营管理情况的真伪。通过从网络上了解行业背景,包括国家发改委对各个行业的十一五规划、包括专家发表的行业经济分析等可以有效地了解到上市公司的一些经营情况等。

2. 了解被审计单位的工艺,包括查看生产现场

通过被审计单位的生产经营及行业对比,我们可以包括了解到设计产能、在同行业中关键设备的先进性等等,据此来收集到有效的生产经营资料,这对于上市公司审计前对上市公司有个直面的了解,让公司财务与实际经营联系起来能够有效地了解公司的部分资产情况等。

3. 了解被审计单位的盈利模式

弄清楚被审计单位靠什么产生利润,主要供应商是谁,主要客户是谁,生产工艺的行业的领先地位如何,行业竞争如何,是否具有垄断优势等是上市公司审计前需要重点掌握的领域。例如,审计人员对商品流通行业上市公司进行年报审计时,可以通过2009年度部分财经杂志报道中获取部分有价值的资料如下:有关部门出笼的对商品流通公司三份供应链最新调查报告,多处使用了这些字眼“危险”、“扭曲”、“隐患”,对沃尔玛、家乐福、国美等零售巨头现行的盈利模式进行了抨击,指出了“目前大型零售商的盈利模式主要不是依靠经营商品,而是通过向供应商收费获利。”可以通过掌握这些资讯,来分析行业风险。

4. 大量从非财务渠道了解被审计单位的生产、供应、销售等所有重大信息,以印证财务信息的真实性与完整性

审计单位的生产、供应、销售等方面的重大信息,包括并不仅限于:每周生产调度会议纪要、生产经营统计报表、每月生产经营分析、每月销售分析、每月采购分析、每月经营活动情况分析、企业领导人的内部讲话(包括总结、计划会议)等等。比如,审计人员往往容易忽略的企业收发文件登记簿,凡是企业生产经营的重大事项,包括担保、诉讼、税收纠纷等,肯定会在企业的收发文件登记簿中体现,审计人员应通过收发文件登记簿,获取企业当年度的重要收发文件。在年报审计中,审计人员需要关注的不仅仅只是企业应该提交的年报审计需要资料清单中的部分资料,比如,美国法尔莫公司财务报表舞弊作假主要源头便是一份财务人员编制时间不超过一天的存货年度盘点报告,细微处见真章。

5. 大量取得企业的内部财务资料,以印证对外报送的财务资料的真实性

企业作为一个运营的主体法人,其法人主体行为主要是由各个不同部门行使不同职能完成其各项对内和对外活动的,其本身的经营实际情况,企业管理层自身是非常清楚的,各种随机出现的经营问题及相关行业共性问题等,企业均会在各种内部资料中有所记录的。例如:内部审计情况通报、内部成本分析、内部财务分析、内部财务工作会议纪要等等,审计人员可以重点关注一下,企业自身所发现的问题,并注意这些问题是否已妥善解决、这些问题对年报的影响是否重大、相关的重大信息是否已在年报中予以披露。

判断被审计单位提供财务数据的真伪,是审计人员必须重视的基础工作。去年的“五粮液”就是一个典型的案例,作为一家知名上市公司,其品牌形象早已深入人心,但就是这样一家上市公司,的确在年报中将主营业务收入披露错误。对于可以将主营业务收入这个基本数据都可以在年报中披露错误的公司,其可信度固然是一方面,但也更加反映了注册会计师在年报审计中对于被审计单位提供的会计信息真伪的鉴定功夫亟待加强。

6. 取得企业的合同登记簿,或者是合同章、公章盖章登记簿

审计人员应关注重大合同的账务处理是否正确,例外或有事项的合同的是否及时进行了会计处理等。合格的企业生存及各项内部控制制度是否到位,对外部的合同签订至关重要,只有审计人员通过各种渠道去了解到企业的管理方法及相关资料,才能比较直白地读懂企业在社会中所处的地位等。

7. 积极利用专家的工作

曾经轰动一时的“银广夏事件”,在审计过程中,实际上有充分迹象说明天津广夏萃取产品出口收入可疑,注册会计师客观上对萃取产品一无所知,又不聘请专家协助注册会计师的工作,这是造成银广夏造假案发生的重要原因之一。

对于在注册会计师专业知识范围之外的特殊事项,如果该事项对财务报表影响重大,注册会计师应当利用专家的工作,获取充分、适当的审计证据,以证实舞弊存在或排除合理怀疑。

8. 深入了解被审计单位的经营状况

审计单位的经济状况不佳,可能影响其管理层的诚信,进而影响到财务报表的可靠性。评估被审计单位的经济状况,有赖于审计人员对被审计单位的经营及其产业的了解。经济状况包括内在及外在两个因素:(1)外在因素包括经济景气及竞争情况,(2)内在因素包括财务结构及经营绩效等。实务处理中,外在经济景气及竞争情况可能说明审计单位经济活动及经营结果的变化或发现某些个别问题,例如经济衰退可能造成催收困难,科技改变可能导致存货呆滞陈旧,同行激烈竞争结果可能使营业额(市场占有率)减少或毛利率降低。了解这些因素,有助于审计人员评估被审计单位财务报表有无遭受重大错误或舞弊的可能性,判断在审计过程可能遭遇的困难程度。

三、小结

复杂背景下光条中心提取算法研究 篇7

光切法三维表面重建技术是一种基于线结构光的光学三角法非接触式三维重建技术。其基本原理是线激光器投射的光束通过一个柱面镜在空间中形成激光平面并与物体表面相交,在物体表面产生一亮的光条,该光条受物体表面几何形状的调制而产生畸变,畸变的程度则包含了物体表面的深度信息。采集物体对光条的调制图像,通过图像分析,提取光条中心位置坐标即可得到光条的偏移量,从而得到物体表面的深度信息[1,2]。光切法三维表面重建技术以其非接触、精度高及主动受控等特点,在工业,医疗、影视、农业、计算机视觉[3,4,5]等领域,尤其在“逆向工程”中得到了广泛应用。

在重建过程中,图像处理和光条中心坐标是影响重建的关键环节,是相关研究中的热点问题。由于激光光条的光强近似服从高斯分布,因此前人的工作主要集中在提取光条的高斯分布中心位置,并提出了极值法、阈值法、重心法和曲线拟合法等光条中心提取算法[6,7]。但是,在复杂背景下,当图像受噪声严重干扰、物体表面颜色变化或纹理变化引起反射率突变时,这些方法的使用则会受到一定的限制

针对这些问题,本文研究了复杂背景下光条中心提取的图像处理方法,提出了一种改进的差影法实现光条图像的分割,采用基于极值法的灰度重心法提取了光条中心坐标。

1 复杂背景下激光图像处理

1.1 图像去噪

在实际拍摄中,受物体表面材质、颜色及激光投射角度的影响,导致反射光现象严重,同时由于外界环境中各种噪声及相机感光面的成像噪声以及采样和量化误差等众多因素的影响,使得激光图像带有大量噪音,这些噪声都给准确提取光条中心线带来了困难。因此,要提取光条中心线,首先必须对采集的原始图像进行预处理,最大可能地去除噪声。通过对图像中噪声进行分析,图像的主要噪声是椒盐噪声,所以本文采用了中值滤波[5]算法,去除了图像中的大量椒盐噪声,去噪效果较好。

1.2 差影法分割光条图像

在提取激光中心线过程中,为降低算法复杂度,需进行图像分割,提取光条图像。传统的图像分割算法,如差影法、边缘检测方法、阈值分割法、区域分割法等,在分割效果与算法复杂度上两者不能兼顾。本文通过对差影法图像分割算法的改进,较好地实现了激光光条图像的分割,算法简单。

令f1(x,y)和f2(x,y)分别表示图像序列中的相邻两幅图像,其方差分别是δ12和δ22,对这两幅图像求平均,得到图像:

其方差为δg2。

则根据统计理论有:

式(2)表明,两帧平均后,图像方差比原图像方差下降了2倍,因此采用两帧图像平均后,再采用差影法分割,显著提高精度,减小误差,还能降低噪声。

其算法描述如下:

Step1 从已经滤波的图像序列中提取出一帧无激光的背景图像,记为G;

Step2 提取图像序列中相邻的包含激光线的两帧图像,分别记为I1和I2;

Step3 将包含激光线的两帧图像取平均,即I=(I1+I2)/2;

Step4根据差影法,将I与G相减,获取激光光条图像,即S=I-G;

Step5 返回Step1处理,直至所有图像处理完毕。

采用两帧图像平均,进一步消除了室内光照环境、CCD相机内部噪声等对图像采集带来的噪声影响。利用差影法,可初步分离出激光光条,实现对光条边缘的初定位。本算法平均时间复杂度为O(n)。

2 光条中心提取

2.1 传统提取算法

由于激光平面具有一定的厚度,因此,形成的光条并非是一个单像素宽线条,所以需要对其进行细化。目前确定结构光条纹中心位置的方法主要有极值法、骨架细化法、阈值法、灰度重心法、曲线拟合法等几种,除骨架细化法外,其他几种都是基于图像灰度的方法。

极值法是依次扫描整幅图像,将每行(列)灰度的最大值点作为该行(列)的光条中心点;阈值法通过分析图像的灰度值,以灰度值大于预先设定阈值的左右两像素为起始点和结束点,二者的平均位置为光条中心。这两种方法实现简单,运算量小,可快速提取光条的中心,但是精度差,受阈值的选取和噪声的影响较大,稳定性差。

基于骨架的光条细化算法[8]是根据骨架点的判断依据来设计查找表,根据当前像素点的8邻域点的情况查表,以确定该点是否为骨架点。对于激光条图像,该方法可以有效降低因激光的散射造成的提取误差。但是,此方法没有考虑图像灰度信息,且图像细化后会发现得到的骨架会有许多毛刺和分枝,还需要进一步的形态学处理,精度低。

曲线拟合法[9]是基于激光条截面点的灰度分布近似高斯分布这一特点,利用高斯曲线或者二次曲线对每一行中现有光带上的像素点的灰度值进行曲线拟合,拟合曲线的局部极大值点即为截面的光条中心点。这种方法精度可达到亚像素级,但需要的采样点较多,不适合窄光条中心的提取,在提取宽度有变化的激光条纹中心线时,由于不能确定合适的拟合数据使得提取精度较低。

灰度重心法[10,11]的基本原理是在图像的宽度方向上对像素位置进行灰度值加权求取光条中心位置,具有处理速度快、精度较高、容易实现等优点。但当反射光现象严重或图像受噪声严重干扰时,提取结果误差较大。

针对实际情况中的各种复杂问题,学者们对光条中心的提取算法提出了改进和创新,很多改良算法相继被提出。如徐庆富[12]学者从光切法原理出发,分析浮雕测量的特殊性,提出了将亚像素细分和变阈值质心法相结合的光刀中心提取算法;赵广杰[13]学者提出了基于光条骨架的可变方向模板法;贾倩倩[14]学者根据图像灰度梯度方向与其法线方向非常接近这一特点,提出了一种用图像的灰度梯度方向代替光条曲线的法线方向的光条中心亚像素提取方法;高世一[15]学者针对高斯拟合法在提取宽度有变化的激光光条中心线时,不能确定合适的拟合数据使得提取精度较低问题,提出了变边限高斯拟合法。这些算法在一定条件下对光条中心的提取精度和速度都有很大改进,但是也只能是在特定条件下获得较好结果,对于复杂背景下光条中心的提取,上述算法并不适宜。

2.2 基于极值法的灰度重心法

一般激光器输出的激光束,既不是均匀平面光波,也不是均匀球面光波,而是一种结构比较特殊的高斯光束,如图1所示。

沿z轴传播的高斯光束的电矢量E是三维坐标x、y、z的函数,图2是E分别在z=0和z>0的光束横截面上的分布情况。由图2可见,高斯光束的横截面光斑中心最亮,向外逐渐减弱。

因此,本文将极值法和重心法相结合提取光条中心坐标。其基本原理是:每次选取光条图像每列(行)中灰度极大值点领域范围内的k个(k为经验值,10≤k≤15)像素点,采用重心法计算出该列(行)的中心。其算法描述如下:

Step1 逐列(行)扫描光条图像,搜索该列(行)灰度极大值点的位置,记为Ymax;

Step2 选取该列极大值点领域内上下各k个像素点,组成2k+1个采样点,本文经过试验选取k=15;

Step3 根据灰度重心法,取这2k+1个采样点的重心作为该列的中心,计算公式如式(3)所示:

式中,hi为图像灰度值,y为光条中心的位置。

Step4 继续搜寻下一列(行),重复上述步骤,直至所有列(行)处理完毕结束。

本算法充分利用了每列光强(灰度)最大值点附近所有点的光强信息,即便光强分布发生变化,也不会给中心提取带来很大影响。它将所处理的数据集中在光条中心附近的小范围内,提高了运算速度。

3 实验与分析

本实验采用IIIb等级的红色一字型线激光发射器投射到物体表面,通过YW7200网络摄像机获取分辨率为688×544像素的图像序列100帧。实验分别采用几何中心法、极值法、骨架细化法以及基于极值法的灰度重心法对光条中心提取。图3为采用中值滤波去噪后的图像,图4为改进的差影法分割的激光条图像,图5为基于极值法的灰度重心法提取的中心线。

表1 为分别采用本文方法和OTSU方法分割5幅激光图像用时比较表,从表中可以看出本文方法用时较少。对100幅同样大小的激光图像进行处理,实验证明采用本文方法平均用时比OTSU方法快了20%左右。

表2 为对一幅激光图像采用不同提取光条中心算法10组数据的比较表,从表中可以看出,本方法速度较快,精度较高,对多幅激光图像进行提取中发现本文方法的处理结果稳定性高。

4 结语

本文对复杂背景下激光图像的处理进行了研究,提出了一种改进的差影法分割激光光条,采用两帧图像平均的方法降低了噪声对图像的影响,与经典OTSU分割法相比处理速度提高了20%左右。研究了各类光条中心提取算法,采用一种基于极值法的灰度重心法提取光条中心,与几何中心法、极值法、骨架细化法相比,提取精度高。实验结果表明,本文提出的激光条图像处理方法算法简单,计算量小,速度快,稳定度高,对光条中心的提取精度达到亚像素级,满足三维重建的需求。

摘要:在光切法三维表面重建过程中,光条中心坐标的提取至关重要。针对复杂背景下激光图像特点,研究激光条图像的预处理和光条中心提取算法,提出一种两帧平均再相减的改进差影法,较好地实现了复杂背景下激光条图像的分割,选用基于极值法的灰度重心法提取激光条中心线。实验表明该方法实现简单,光条图像处理复杂度低,与经典OTSU方法相比较其处理速度提高了20%左右,精度达到了亚像素级水平。

复杂背景 篇8

毒蘑菇(毒菌)在中国种类繁多,分布广泛。据不完全统计,在我国被发现的毒蘑菇有250多种,其中在广东省就有112种[1]。在广大山区和乡镇,误食毒蘑菇中毒的事件时有发生,几乎每年都有严重中毒致死的报告。针对有些毒菌和食用菌的宏观特征没有明显区别的情况,将图像特征检索技术中颜色、纹理和形状3种检索方式引入毒蘑菇识别中,构建一个综合图像特征的野生毒蘑菇辅助识别平台,有助于提高人们对毒蘑菇的认识与鉴别,为科研工作者以及普通民众提供相对客观的参考借鉴。

野生毒蘑菇通常生长在环境复杂的野外,因此, 利用图像处理技术辅助识别毒蘑菇,前提是有效地将毒蘑菇图像从复杂的背景中分割出来。图像分割是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程,是图像处理到图像分析的关键步骤。如何从复杂背景中快速有效地分割出目标图像是图像技术研究中的热点。

人类的视觉系统是一个智能的识别系统,人眼观察复杂场景时,很容易区别各个物体,即很容易辨别物体的边缘,从而将各个物体区分开来。如果能在图像分割中有效引入用户的参与,可以更准确地辅助提取出目标区域。所以交互式的分割方式在图像处理中显得尤为重要。基于图论的交互式分割方法有很多, 如活动轮廓模型[2]、智能剪刀[3]、活线法和图切分方法[4]等等。本文在快速提取目标图像的基础上,采用交互式分割[5],引入水平集[6]进行自动收敛截取,得到最优目标图像。

1数字抠图

交互式分割最简单的方法之一就是数字抠图[7], 明确定义哪些属于目标图像,哪些是背景,用户围绕目标图像的边界绘制曲线,然后对该曲线进行优化。 Photoshop里面的智能剪刀和魔杖工具就是采用这种方法。

首先,需要建立一个与图像对应的加权无向图G (E,V)。图的顶点E与图像的像素对应;边V与图像的各个像素之间的联系相对应;顶点的属性与图像的灰度信息相对应;边的权值与像素之间的差别相对应。图中包含2个终端顶点:源点和汇点。其他点都称为中间点。手动选择图的目标和背景的种子点, 分别与源点和汇点相连接,设计它们的权重 α。这样可以实现最小的分割,将目标与背景分割开来。

其中,F为目标图像;G(E,V)图像对应加权无向图;α 是权重,这里取255;Cat表示最小割集。

2水平集方法

水平集方法是S.Osher和J.A.Sethian于1988年, 在研究曲线以曲率相关的速度演化时提出来的[8],用于描述曲线的演化过程。其基本思想是将当前正在演化的闭合曲线(曲面)的问题转化为更高维空间中的水平集函数曲线(曲面)的隐式解。与其他曲线演化方法相比,其最大优势是稳定性和拓扑无关性。

传统水平集方法中,为了使演化曲线得到稳定的结果,需要周期性地初始化演化曲线,这样费时而且计算繁琐。而李纯明[9]等人根据符号距离函数的特征引入一个内部能量p(φ) 纠正水平集函数与符号距离函数的误差,使演化曲线一直保持在符号距离函数附近,从而在演化过程中无需再周期性地初始化演化曲线,进而可以采用大时间步长,提高演化速度。

其中,p(φ)是水平集函数φ的内部能量泛函数; Ω 是图像区域。

3基于水平集的目标图像快速提取

基于水平集的目标图像快速提取是一种能够从粗到细将目标图像自适应分割的方法,分为3个步骤: 1) 目标对象标记,它是在较粗糙的尺度上操作,用户根据需要勾勒出目标图像的大体形状;2) 水平集自适应,它是根据用户定义的边界,自适应收缩,实现目标最优化;3) 目标图像提取,对已经收敛最佳的目标图像进行数字抠图提取。

3.1目标对象标记

目标对象的主要功能是允许用户对目标图像和背景图像进行标记,以提取用户感兴趣的区域。通过绘制直线或者曲线指定感兴趣的区域,一方面定义感兴趣的区域,明确分割目的;另一方面,标记目标图像,实际已经构建好加权无向图,初始化边界,为水平集分割提供前提和减少计算量。

3.2水平集自适应

在用户绘制的标记线条形成封闭无向图后,开启自适应,系统自动进行自适应收缩。使用定义的封闭无向图作为水平集的初始演化曲线,引入一个内部能量来纠正水平集函数与符号距离函数的误差,从而使演化曲线一直保持在符号距离函数附近,使演化范围始终保持在用户定义的区域内;同时加入外部能量提高演化速度。水平集收敛达最优时停止收敛,完成目标图像外轮廓的标记u。

3.3目标图像提取

水平集收敛的最优目标轮廓u作为快速提取算法的无向图,用式(1)对目标图像进行分割提取。在对水平集演化结束后,自动实现目标图像快速提取。所以交互操作只是对目标图像的标记,无需过多的用户交互,减少用户的工作量。

4实验结果与分析

本文对一张野外采集的毒蝇伞蘑菇图像进行实验。选取一张掺杂多个背景的图像,用不同方法分别从中提取毒蝇伞蘑菇目标图像。图1对原始图片需要提取的目标边缘进行标记;图2使用Kmeans算法自动分割;图3是数字抠图的效果;图4是数字抠图和水平集结合后的目标图像分割效果。

由图1可以看出,目标图像与周围背景混合在一起,这是野外采集标本时不可避免的情况。采用Kmeans聚类分割[10],由于光照因素,目标图像的边缘有些无法聚类到目标区域,造成目标提取的缺失。 其中小蘑菇对分析可能会造成干扰,但是聚类分割无法将其剔除。聚类、阈值分割等自动分割,在复杂背景下,存在多个阈值或中心时,无法达到很好的分割效果,交互式的分割就成为首选。快速目标图像提取的数字抠图,可以较好地快速提取目标图像,占用系统资源少,如图3所示。但是,提取的目标图像仍然存在一些小的干扰区域。经过多次截取,可以将不需要的区域缩小到最小。限于人的视觉效果,对于细小的区域很难分辨。

针对数字抠图存在的细小无相干边缘的不足,将水平集引入数字抠图。勾勒出目标区域,采用水平集自适应收缩,最终使用数字抠图分割。如图4所示, 目标图像被准确提取出来,而且保持轮廓和形状特征完好。

5结语

本文提出的基于水平集复杂背景下毒蘑菇图像提取,不但综合了数字抠图占用系统资源小、速度快等优点,而且缩小了水平集收缩的区域,极大地提高水平集的收缩速度,取得了很好的分割效果。

参考文献

[1]邓旺秋,李泰辉,宋斌,等.广东已知毒蘑菇种类[J].菌物研究,2005,3(1):7-12.

[2]陈波,赖剑煌.用于图像分割的活动轮廓模型综述[J].中国图象图形学报,2007,12(1):11-20.

[3]薛犇犇.半自动的虚拟人切片图像分割方法研究[D].南京:南京理工大学,2011.

[4]龚菲.基于图切分的快速交互式图像分割方法研究[D].武汉:华中师范大学,2013.

[5]郭丽.交互式图像分割算法的研究与应用[D].沈阳:东北大学,2008.

[6]王晓峰.水平集方法及其在图像分割中的应用研究[D].合肥:中国科学技术大学,2009.

[7]林生佑,潘瑞芳,杜辉,等.数字抠图技术综述[J].计算机辅助设计与图形学学报,2007,19(4):473-479.

[8]陈金男.基于水平集方法的图像分割研究[D].秦皇岛:燕山大学,2007.

[9]Li Chunming,Xu Chenyang,Gui Changfeng,et al.Level set evolution without re-initialization;a new variational formulation[C].In:Proc.of the IEEE Computer Society Conf.on Computer Vision and Pattern Recognition,2005:430-436.

复杂背景 篇9

运动目标的检测和分割[1,2]是计算机视觉领域中一个重要的课题,是进一步对目标进行分类、跟踪、定位、识别等技术研究的关键和基础[3]。

背景差分法[4]是解决这一问题的有效方法,是当前用的比较多的方法。可以用单高斯模型[5]来描述像素亮度值的不断变化,高斯混合模型[6]是利用混合高斯的方法对背景建模,但是每个像素的高斯分布假设都要受到参数的限制,所以后面提出了非参数的模型[4]。

在复杂背景中,基于像素的方法将不能有效地检测出运动目标,因为他们没有考虑像素间的相关性。基于区域的方法通常将一幅图像分成许多小块,计算特定块的特征。文献[7]中,对特征向量距离的进行归一化处理。在文献[8]中,计算一个块的边缘直方图作为其特征向量。所以仅仅能够粗略的检测出运动目标。

为了克服现有方法在复杂背景中的不足之处,提出了一种协方差矩阵描述子[9]。因为较大的旋转和光照的变化也会被协方差矩阵吸收,所以能够在复杂背景中有效的检测出运动目标。

1 协方差矩阵的构建

在文献[6]中,介绍了协方差矩阵描述子,主要应用在目标检测和分割中。由于受到文献[9]的影响,在背景差分中,把协方差描述子用来描述区域。为了使协方差矩阵描述子能够适合于复杂背景中的运动目标检测,构建的协方差矩阵不同于文献[9]中的方法。

I是一维的灰度图像或三维的彩色图像,F是从I中提取的W×H×d矩形特征图像。

F(x,y)=φ(I,x,y), (1)

式中,函数φ可能是亮度、纹理、梯度等的映射。已知矩形区域RF,设{fk}k=1,2n是矩形区域R中的d维特征向量。与文献[6]中方法不同,特征向量fk是通过两类属性构建的:空间属性,通过像素的坐标值表示;表面属性,通过亮度、局部二进制模型(LBP)、亮度在xy方向的一阶导数:

fk=[x,y,I(x,y),LBP(x,y),|Ix(x,y)|,|Iy(x,y)|], (2)

式中,xy是像素的坐标,I(x,y)是像素的亮度,LBP(x,y)是局部二进制模型(它是通过每一个像素与其周围领域的像素做差值得到的一个二进制),Ix(x,y)和Iy(x,y)是亮度在xy方向的一阶导数。用d×d维的协方差矩阵代替矩形区域R:

CR=1nk=1n(fk-μR)(fk-μR)Τ=(a11a1dad1add)

, (3)

式中,μR是区域R的特征向量的平均向量。在复杂背景中,协方差矩阵作为描述子有很多优点。首先,在协方差计算的过程中,噪声在一定程度得到滤除,因此协方差矩阵建模对噪声具有一定的鲁棒性。其次,对于特征的均匀变化,协方差具有不变性。例如:色度的均匀变化。再次,协方差矩阵的对角线项描述的是每一维特征的变化(方差),其他项描述的是每一维特征之间的相关性(协方差),这个性质对于复杂背景建模很重要。最后,可以通过一种快速的积分图像方法[9]来计算特征图像的协方差矩阵。

2 运动目标检测

2.1背景建模

R是以像素P(x,y)为中心的M×N矩形区域,在这个区域上构建一个协方差矩阵C作为像素P(x,y)的特征向量,用K个自适应的协方差矩阵{C1,C2Ck}构建像素P(x,y)的背景模型,每一个模型矩阵都有一个0~1之间的权值,以至于K个协方差矩阵模型的权重之和为1。其中第k矩阵模型的权重标记为ωk,

ω1+ω2++ωn=1,ωk[0,1], (4)

式中K的选取一般由计算能力和内存决定,通常选3或5,虽然更大的K的能体现更复杂的场景,但同时消耗更多的时间。

对于第1帧图像,把它作为背景模型,通过第1帧图像建立5个协方差矩阵(K=5)。其中,F是第1帧图像,C1是第1帧图像的协方差矩阵,C2是第1帧左半图像的协方差矩阵,C3是第1帧右半图像的协方差矩阵,C4是第1帧上半图像的协方差矩阵,C5是第1帧下半图像的协方差矩阵。其中,ω1=12ω2=ω3=ω4=ω5=18

2.2背景更新

新一帧视频图像中像素P(x,y)的协方差矩阵表示为C',然后计算C'与当前像素P(x,y)的K个模型矩阵的距离:

ρ(A,B)=i=1dln2λi(A,B), (5)

式中,ρ(A,B)是AB之间匹配的衡量标准。{λi(A,B)}i=1,…,dAB之间的广义特征值。

如果C′与所有的K个模型矩阵的距离大于阈值Tp,则用C′替换权值最小的那个模型矩阵,赋予一个权值低的权重;如果C′与部分模型矩阵的距离小于阈值Tp,则把这部分模型矩阵作为匹配矩阵。t时刻的匹配矩阵通过新的数据进行如下更新:

Ck,t(i,j)=abCt'(i,j)+(1-ab)Ck,t-1(i,j),ab∈[0,1], (6)

式中,ij是矩阵行和列的指标,ab是用户可设置的学习速率。而且模型矩阵的权重更新如下:

ωk,t=αωMk,t+(1-αω)ωk,t-1,αω∈[0,1], (7)

式中,αω是另一用户可设置的学习速率,Mk,t对于匹配矩阵值为1,其他矩阵值为0。背景模型的自适应速率是由abaω控制的。学习速率越高,背景更新的速度越快。

2.3前景检测

为了能够准确有效地检测出前景目标,把K个模型矩阵进行重新排列,因为权值大的矩阵,越可能成为背景模型,所以按照权值ωk从大到小顺序进行排列。结果最有可能成为背景模型的矩阵在第1位。前B个矩阵被选作为背景矩阵如下:

B=argminb(k=1bωk>ΤB),ΤB[0,1], (8)

式中,1≤BK,TB是用户可以选择性的设置的,在单模态的情况下TB可以选择较小的值,在多模态的情况下TB选择较大的值。

C'与K个模型矩阵进行比较:如果C'与K个模型矩阵的距离都大于Tp,则P(x,y)为前景像素,记为1;如果C'与部分模型矩阵的距离小于Tp,并且这些模型矩阵属于前B个矩阵,则P(x,y)为背景像素,记为0;不属于前B个矩阵,则P(x,y)为前景像素,记为1。算法的流程图如图2所示。

3实验结果及分析

协方差矩阵算法在英特尔酷睿2四核Q6600@2.40 GHz处理器、4 GB内存、操作系统为Windows XP的条件下,以VC++6.0和OpenCV1.0为软件开发工具进行试验,测试视频的分辨率为320×240像素。用2个复杂背景的场景做实验。如图3所示,第1个场景是树枝背景,特征是树枝摇摆;如图4所示,第2个场景是湖面背景,特征为起伏的波浪和漂浮的物体等。第1行是第1场景的69帧,第2行是第2场景的422帧。

从图3和图4中可以发现,当背景中出现诸如摇摆的树枝、起伏的水波、流动的喷泉、飘扬的红旗和阴影等动态背景中的一些时,由于这些复杂的背景对目标提取的影响非常大,单纯的混合高斯模型或者LBP纹理模型处理结果都不理想,出现了很多的误判断。实验结果说明,使用的算法能够较好地消除了原本运动物体产生的阴影,有效地消除一些周期性变化的动态背景的干扰信息,并且能很好地检测出运动物体。

4结束语

提出的复杂背景中目标检测方法是通过一组协方差矩阵为一个像素周围的矩形区域建模,集成了像素级和区域级的特征以及特征的相关性,所以能够有效地为复杂的动态背景建模,实验结果表明该方法满足视频图像序列中运动目标检测实时性和准确性要求,适用于广泛的场景模式,具有一定的实用价值。

参考文献

[1]林海涵,唐慧明.基于视频的车辆检测和分析算法[J].江南大学学报(自然科学版),2007(3):323-326.

[2]季白杨,陈纯,钱英.视频分割技术的发展[J].计算机研究与发展,2001(1):36-42.

[3]刘翔,吴谨,祝愿博,等.基于视频序列的目标检测与跟踪技术研究[J].计算机技术与发展,2009,19(11):179-182.

[4]ELGAMMAL A,HARWOOD D,DAVIS L S.Non-parametric Model for Background Subtraction[C]∥Copenhagen:Proceedings the 6th European ConferenceComputer Vision,2000:751-767.

[5]WREN C R,AZARBAYEJANI A,DARRELL T,et al.Pfinder:Real-time Tracking of the Human Body[J].IEEE Transactions on Pattern Analysis and MachineIntelligence,1997,19(7):780-785.

[6]STAUFFER C,GRIMSON W E L.Learning Pattern ofActive Using Real-Time Tracking[J].IEEE Trans.Pattern Analysis and Intelligence,2000,22(8):747-757.

[7]OJALA T,PIETIKANINEN M,HARWOOD D.AComparative Study of Texture Measures with ClassificationBased on Feature Distributions[J].Pattern Recognition,1996,29(1):51-59.

[8]MASON M,DURIC Z.Using Histograms to Detect andTrack Objects in Color Video[R].Washington:AppliedImagery Pattern Recognition Workshop,2001.

本文来自 古文书网(www.gwbook.cn),转载请保留网址和出处

相关文章:

复杂目标01-23

复杂交通01-23

复杂围岩01-23

复杂质量01-23

复杂构件01-23

复杂曲面01-23

复杂优化01-23

复杂创面修复01-23

复杂产品项目01-23

复杂性格01-23

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:复杂目标 下一篇:复杂曲面