匹配处理(精选八篇)
匹配处理 篇1
图像处理在许多领域越来越重要,并且现在越来越多的研究关注图像处理的实时性[1]。由于FPGA具有并行处理的特点,并且对于在图像处理算法中,每个像素具有相同操作的部分算法利用并行处理是特别有用的。对于图像旋转算法,用硬件来实现比较困难,因为只要有参数的改变,就需要对硬件进行修正[2]。
在复杂的环境中,实时图像常会有旋转、膨胀等因素的影响,从而导致跟踪算法不够准确。为了克服跟踪算法这一问题,图像匹配的模板增加为3种模板,其中3种模板包括原始模板、逆时针旋转模板、顺时针旋转模板[3]。由于图像旋转计算量大,运算过程复杂导致单纯用软件实现实时性达不到要求。但是FPGA具有硬件资源丰富和并行处理能力强等特点,在结合流水线和兵乓存储的操作,来实现图像的旋转可以达到较高的实时性和可靠性要求。
本文通过FPGA利用旋转算法来实现模板任意角度的旋转,并且将非整数坐标值扩大成整数,为适合FPGA运算,可以避免旋转图像在原始图像上找不到对应点和坐标值是小数的情况,这样处理之后的旋转算法在FPGA上实现起来更加简单和易操作[4]。
1 算法的改进和优化
1.1 图像旋转的基本原理
在跟踪系统中,实时图像发生旋转是不可避免的。要使得目标能够继续在跟踪范围内,模板也应该旋转相应的角度。假设系统计算出的需要旋转角度为θ,原始图像(x,y)坐标的像素值为f(x,y),以左上角第一个点(x0,y0)为旋转的中心,将原始图像f(x,y)顺时针旋转θ角度后得到旋转之后的图像f(x′,y′),(x,y)与(x′,y′)有如下关系
根据式(1)[5],可以通过MATLAB将原始图像f(x,y)旋转θ角度得到旋转之后的图像f(x′,y′)。但是sinθ
为了避免旋转之后图像具有斑点,可以采用逆旋转算法。从旋转图像坐标入手,计算出(x′,y′)对应的原始图像的坐标(x,y)。根据式(1),推出逆旋转公式为
通过逆旋转公式(2)[6],每一个旋转图像坐标点(x′,y′)将会找到原始图像坐标(x,y)与之对应,其旋转图像的像素值就是与其在原始图像上对应点的像素值f(x,y)。通过MATLAB验证该思路,如图2所示,消除了带有斑点的旋转图像。
但是逆旋转算法带来新的问题,该算法计算出来的值并不是整数,因此不能在原始图像中找到对应点的像素。因此采用计算出来的小数值坐标找出原始图像上附近4个点的像素点,然后计算其平均值作为该点的像素值。
1.2 算法的优化
为了使得逆旋转算法适合在FPGA上移植,应该对该算法进行优化。由于FPGA适合做整数运算并且不能完成cosθ和sinθ的运算,为此采用查表法来完成cosθ和sinθ值的获取。可以通过FPGA芯片的IP核ROM来存储所有角度的三角函数值来实现查表法,但是由于cosθ和sinθ的取值范围是-1~+1的小数,所以应该对其扩大2n倍后,再存储到ROM中,通过实验验证,n取16时实验结果最为准确。
由于FPGA存储资源有限,因此应该尽量减少数据的存储。cosθ和sinθ存在如下关系[6]
所以只需要存储0°~90°的cosθ的值,便可以得到0°~360°的任意角度的cosθ和sinθ的值,通过这样的优化可以减少存储量,并且更加快速地得到对应的cosθ和sinθ的值。
2 FPGA硬件系统
2.1 硬件框架
图像旋转的硬件系统,如图3所示,主要有外部存储器、三角函数寄存器、SAA7111模数转换、SAA7121数模转换、电源、时钟等模块构成[7]。
1) 模数转换和数模转换
本系统采用的SAA7111芯片将模拟视频信号转化为数字视频信号,SAA7111芯片除了能输出视频的数据外还输出行场信号,有利于以后FPGA对视频的处理。SAA7121芯片是将数字信号转化为模拟视频信号,然后将模拟视频送到监视器进行显示。
2) SRAM存储器和E2ROM存储器
采用2片SRAM用乒乓的方式来存储视频数据,一片SRAM在存储视频数据时,另一片SRAM用于读取数据,将数据输入到FPGA中。E2ROM存储器用于存储FPGA程序。
3) FPGA处理模块
FPGA处理模块是该系统的核心模块,FPGA除了要完成对旋转图像坐标的计算,还要完成对读写存储器的控制,以及产生各种模块所需要的时钟,对角度寄存器进行控制和配置SAA7111、SAA7121工作模式等。
2.2 软件框架
FPGA内部实现称之为软件。如图4所示,软件主要包括有:三角函数地址换算器、 cos值存储ROM、坐标的计算模块、原始图像坐标转换地址模块、数据控制模块。
1) cos值存储ROM和三角函数地址换算器
通过FPGA内部调用双口ROM IP核存储0°~90°的cosθ值,在计算旋转坐标时,能够读取ROM的同时得到cosθ、sinθ值,减少对cosθ、sinθ的复杂运算。三角函数地址换算器的主要功能是计算出cosθ的地址(cos_address)和sinθ的地址(sin_address),由于在ROM中只存储量0°~90°的cosθ值,通过公式(3)能够容易的得到cos_address和sin_address值,这样就能够快速得到cosθ、sinθ值。
2) 坐标计算模块
坐标计算模块主要功能是通过旋转图像点的坐标来计算出对应于原始图像点的坐标,并取出相应的像素值传输到数据控制模块。由于cosθ值都是小于1并且FPGA不能处理小数,所以将计算出来的cosθ值扩大216倍并且用16 bit宽的ROM存储。该模块计算出来的坐标最后再右移16 bit,就可以得到对应于原始图像的像素点。然后再按照显示的时序将旋转后图像的数据输出,便可以显示出旋转θ角度之后的图像。
3) 旋转坐标产生模块和坐标转换为地址模块
对于计算出来的坐标,首先需要转换为存储器的地址才能够对存储器进行相应的操作。旋转坐标产生模块的作用是产生旋转图像的坐标,来作为坐标计算模块的输入,通过计数器实现对坐标的自加。
4) 数据控制模块
该模块主要作用是完成对SAA7121芯片的控制信号的产生,提供了行信号、场信号、像素时钟和像素点,并且对SAA7121芯片进行I2C配置,选择合适的工作模式。
3 系统运行结果性能分析
3.1 signtap时序分析
1) 坐标计算模块时序分析
坐标计算模块是通过旋转图像的坐标计算得到原始图像对应点坐标,如图5所示,angle取30°时用查表法得到的cosθ(Cos_Rom_m|q_a)值和 sinθ(Cos_Rom_m|q_b)分别为56 755和32 768,这里cosθ和sinθ的值都是扩大了65 535倍,分别对其还原能够得到cosθ=56 755/65 535=0.866和sinθ
2) 显示时序
旋转之后的图像,通过SAA7121芯片将数字信号转换为模拟信号并送去显示,如图6所示。FPGA提供SAA7121芯片SAA7121_RCV1场信号和SAA7121_RCV2行信号,SAA7121_LLC像素时钟13.5 MHz。显示模块主要是在监视器上同时显示出原始图像和旋转之后的图像;而P_720cnt是代表对屏幕点的计数,用于选择屏幕显示的原始图像和旋转图像位置。如图6a所示,原始图像在屏幕的左边显示,show_address是原始图像的存储地址,用这个地址对原始图像数据进行读取,再将读取的值送出去显示。而旋转图像显示在右边,也就是P_720cnt在400以上的区域,如图6b所示,通过控制旋转图像存储器的读地址(rotation_rdaddress),将旋转图像数据(rotation_ima_ data)读取出来传输到SAA7121芯片中。
3.2 实验结果性能分析
图像旋转系统采用Altera公司Cyclone III系列EP3C25芯片硬件平台和Quartus II软件开发工具。这款FPGA芯片具有丰富的硬件资源和IP核资源,能够很好地利用其来构建整个系统。该系统FPGA采用了时序逻辑和流水线操作改善了整个系统,以满足实时性要求。如表1所示,整个系统的资源消耗少,整个算法完成所需要的时间只需要6.89 ms<20 ms,充分地满足了实时性的要求。
为能够较好地对比原始图像和旋转图像,最后将原始图像和旋转图像一起显示,显示器的左边显示原始图像,右边显示旋转图像。如图7所示,左边是原始图像,右边是旋转180°的图像。从实验数据和结果分析,本设计在满足实时性要求的同时显示的图像效果也满足要求,为图像匹配算法提供了旋转模板。
4 结论
本文以FPGA为硬件平台,实现对实时图像的任意角度旋转。该设计利用FPGA少量的硬件资源实现了复杂的旋转算法,并且为图像匹配算法提供旋转模板;图像匹配算法利用旋转模板做匹配,使得跟踪算法具有抗图像旋转的特性。为了适应FPGA运行环境,通过扩大坐标值和cosθ值,可以利用查表法使得FPGA在单个时钟周期完成对点坐标的计算。通过实验结果观察,该系统具有处理速度高、体积小、低功耗、可靠性高和使用灵活等特点。
摘要:为了使得跟踪算法中能够抗图像旋转,采用FPGA对模板图像进行任意角度旋转的预处理,产生满足图像匹配所需要的多种旋转模板。在FPGA上实现旋转算法,完成对模板图的任意角度旋转,重点研究了该旋转系统的硬件框架和软件框架,并在Altera公司的CycloneIII系列FPGA硬件平台对该算法进行了功能和时间测试。该设计达到实时性要求,为整个跟踪系统提供了多种旋转模板,实现了跟踪算法抗旋转性。
关键词:图像旋转,FPGA,跟踪,模板
参考文献
[1]宋海华,邵志一.基于改进型特征匹配的图像拼接方案设计[J].电视技术,2008,32(2):19-26.
[2]NOBRE H P A,KIM H Y.Automatic VHDL generation for solving rota-tion and scale-invariant template matching in FPGA[C]//Proc.Pro-grammable Logic,2009.[S.l.]:IEEE Press,2009:21-26.
[3]曹厚德,刘剑波.一种基于FPGA的图像旋转实现技术[J].计算机应用与软件,2011,28(7):89-91.
[4]黄少俊,郝禄国.一种在FPGA中设计NCO的方法[J].电视技术,2009,33(S2):113-115.
[5]高陈强,余迪虎,李强,等.视频图像中基于特征匹配的人流量统计[J].电视技术,2011,35(15):20-23.
[6]李开宇,张焕春,经亚枝.基于DEFG的高速高质量图像旋转[J].中国图象图形学报,2004(3):285-289.
匹配处理 篇2
“人岗匹配”,就是按照“岗得其人”“人适其岗”的原则,根据不同的人个体间不同的素质将不同的人安排在各自最合适的岗位上,从而做到“人尽其才,物尽其用”。众所周知,企业与个人是一个利益共同体,企业是个人职业生涯的舞台,为岗位挑选合适的人;人适合干什么,就尽量安排他到适合的岗位,充分发挥他的才能。只有这样,人才能在舞台上尽心表演,舞台才会精彩。
“人岗匹配”一方面,对人的职业发展有莫大的好处,另一方面对公司而言,把人才的作用最大化了,公司也会得到相应的回报,企业和个人才能实现真正的双赢。那么,如何实现在企业实现“人岗匹配”呢?
笔者认为:真正有效的“人岗匹配”至少需要经历:知岗、知人、匹配三步曲。
知岗:工作分析
“人岗匹配”的起点应该是知岗,因为只有了解了岗位的我们才能去选择适合岗位的人,这样才能实现“人岗匹配”。如果脱离了岗位的要求和特点,“人岗匹配”就成会成为“空中楼阁”,失去根本。
知岗最基础也是最重要工具就是工作分析。所谓工作分析,是对某项工作,就其有关内容与责任的资料,给予汇集及研究、分析的程序。
要做的“人岗匹配”,就必须对工作人员的素质先行订立标准,而为了建立人员的素质标准,就必须对工作的职务与责任加以研究。经过工作分析所产生的岗位说明书是人力资源管理科学化的基础,在“人岗匹配”中它至少有以下四个作用:1、明确岗位所需人员的条件;2、确定岗位招聘人员所需的资历;3、根据其岗位职责确定其岗位薪资;4、根据岗位所需技能制定该岗位现有人员的培训发展计划。
工作分析的内容主要包括:1、岗位名称,用简洁准确的文字对岗位的工作任务作概括。2、岗位工作任务分析,就是调查研究企业中各岗位的任务性质、内容、形式、执行任务的步骤、方法、使用的设备、器具等。3、岗位职责分析,包括工作任务范围、岗位责任大小、重要程度分析等。4、岗位关系分析,就是分析相关岗位之间有何种协作关系,协作内容是什么?他受谁监督指挥,他又去监督指挥谁?这个岗位上下左右关系如何?岗位升降平调路线方向如何?5、工作环境分析。6、岗位对员工的知识、技能、经验、体力等必备条件的分析。
工作分析是一项复杂而又细致的工作,其工作程序主要包括准备、调查、分析总结三个阶段七个步骤:1、收集背景资料:包括机构或企业现有的背景资料,如业务项目、组织图、各部门职责等。2、设计岗位调查方案,明确调查目的,调查对象和单位,确定调查项目,调查表格和填写说明,调查时间地点和方法。3、进行思想动员,说明这项工作的意义和目的,建立友好合作关系,确保大家有良好的心理准备。4、制定行动计划,根据工作分析的任务和程序,分解成若干工作单元和环节,以便逐项完成。5、试点先行,组织有关人员先行一步,学习并掌握岗位调查的内容,熟悉具体实施步骤和方法,先抓一两个重点岗位,进行试点,取得经验。6、开展全面调查,根据调查方案,对岗位进行认真细致的调查研究。7、分析总结定稿,对岗位调查结果进行深入分析和全面总结,形成岗位说明书。
工作分析的常用方法有:观察分析法、自我记录分析法、主管人员分析法、访谈分析法、记录分析法、问卷调查分析法等。
知人:胜任素质
当我们知道了岗位的特点和要求,我们就应该进入“人岗匹配”的关键环节―知人。知人的方法有很多,如履历分析、纸笔考试、心理测验、笔迹分析、面试交谈、情节模拟、评价中心技术等等。但它们或基于人,或基于事,对“人岗匹配”的帮助都不是非常明显。
在企业管理和咨询的实践中,笔者发现在知人方面,“胜任素质(Competency method)”是帮助企业实现最佳“人岗匹配”的有效工具。
胜任素质的应用起源于21世纪50年代初,著名的心理学家,哈佛大学教授麦克里兰 (McClelland) 博士是国际上公认的胜任素质的创始人。当时,美国国务院感到以智力因素为基础选拔外交官的效果不理想,
许多表面上很优秀的人才,在实际工作中的表现却令人非常失望。在这种情况下,麦克里兰博士应邀帮助美国国务院设计一种能够有效地预测实际工作业绩的人员选拔方法来解决这一难题,实现“人岗匹配”。在项目过程中,麦克里兰博士应用了奠定胜任素质方法基础的一些关键性的理论和技术。例如:抛弃对人才条件的预设前提,从第一手材料出发,通过对工作表现优秀与一般的外交官的具体行为特征的比较分析,识别能够真正区分工作业绩的个人条件。
那么企业应如何通过“胜任素质”来知人,进而实现“人岗匹配”呢?笔者认为可以通过建模、定标、评价、知人四个步骤来完成。
第一步:建模
根据自身的企业文化和业务发展,建立起了符合公司自身特点的岗位胜任素质模型。胜任素质是从品质和能力层面论证个体与岗位工作绩效的关系,是个体的态度、价值观和自我形象,动机和特质等潜在的深层次特征,是将某一工作(或组织、文化)中表现优秀者和表现一般者区分开来的基础。具体方法:1、根据岗位说明书和职位评估系统归纳总结岗位关键胜任要素,形成岗位胜任素质模型框架;2、通过管理访谈、管理层研讨,对模型框架做有针对性的调整和修正,并细化胜任特质的典型行为;在初步的胜任素质模型基础上,形成评估要素列表,制订评估框架并选择、组合评估方法,从而建立起完整的胜任素质模型。
第二步:定标
根据胜任素质模型评估各个岗位应该具备的能力。通过外部专家、内部管理人员以及需评价岗位的直接上司、在岗人员及其下属共同对对该岗位所需要的胜任素质水平做出评估,同时,参考同类组织对相应岗位的要求,建立企业所有岗位的胜任素质标准。
第三步:评价
通过对公司的管理诊断和评估,建立发展评价中心,包括心理测验(包括能力倾向测验、职业兴趣测验、动机测验、管理风格测验)、情境模拟(包括文件筐、无领导小组讨论、角色扮演、管理游戏、案例分析等)和专家面谈(包括结构化面谈、半结构化面谈和非结构化面谈)。
第四步:知人
以“人岗匹配”为原则,根据所建立胜任素质模型,应用已经建立的发展评价中心,对现有关键岗位进行人员素质评估,根据胜任素质模型和参照标准,在胜任素质的各个维度上进行比较,对不能达到任职要求的人员进行了调整和有针对性的培训。从而保证了组织调整的顺利完成,并建立起了自身独立的知人系统,将岗位胜任素质变成企业的核心竞争力之一。
匹配:知人善任
知人善任是实现“人岗匹配”的最后一步,也是能不能发现并最大限度地利用员工的优点,把合适的人放在合适的位置,尽量避免人才浪费的最关键的一步,“没有平庸的人,只有平庸的管理”。每个人都有自己的特点和特长,知人善任,让自己的下属去做他们适合的事情,这样才能充分发挥他们的工作潜能,实现人才的有效利用。
许多成功的管理者都善于识人,并把人才放在适当的位置上。
汉高祖刘邦就是一个知人善任的高手,他善于发现每一个人的特长,根据人才的特长,将其安排到合适的岗位,“人岗匹配”,让他们最大限度地、充分地发挥自己的积极性和作用,真正做到了“职得其人”“人适其职”,如用韩信带兵,张良出谋,萧何保后,都安排得有条不紊,正如他所说的:“运筹帷帐之中,决胜千里之外,吾不如子房;镇国家,抚百姓,给馈赏,不绝粮道,吾不如萧何,连百万之众,战必胜,攻必取,吾不如韩信。”这是刘邦在楚汉相争中最后获胜的根本原因。
作为一名管理者,首先要对员工的才能、兴趣等了然于胸,有了透彻的了解,才能针对某项特定的岗位选择适合的人选,让合适的人做合适的事,这样才能“岗得其人”“人适其岗”,达到人岗匹配的效果。当然,善任不是管理者的随心所欲,而是要按规律办事,在最适合的时机把最适合的工作分配给最适合的人,达到“人尽其才,才尽其用”。
牛根生曾经说过:从人本管理的角度看,人人都是人才,就看放的是不是地方,这是一个人岗匹配的问题。所以,在蒙牛选卫生工的时候,不会选那些文化程度高的,或者是家庭条件特别好的,因为这样的人对自己职业的目标绝对不是一个卫生工,也许他关心的是世界经济的发展,也许他想知道人民币汇率升降对国内投资者的影响……唯独不关心工厂的卫生,从而导致他们不会把自己全部的精力放在简单的卫生工作上。蒙牛选择的是老实敦厚的农村妇女,因为这份工作对平常基本上没有什么经济收入的农村妇女来说显得弥足珍贵,重视自己的工作,才有可能将工作做好。这才有了蒙牛工厂纤尘不染的卫生状况,才有了每天生产的“安全、卫生、营养、健康”的蒙牛食品走向全国,甚至漂洋过海。
匹配处理 篇3
关键词:线性调频,相位匹配,信号去噪,匹配滤波
1 引言
传统的信号处理方法是以信号和噪声不相关为前提的。采用信号的相关性来去除噪声恢复信号,通过时间或空间的累积提高信噪比的,现代信号处理技术多种多样,神经网络、高阶统计量估计、子波变换、时频分析、混沌分形、自适应技术等等[1,2,3,4,5],是利用信号和噪声的不同统计特征进行去噪提取信号。现实生活中噪声和信号通常是加性的,信号相位匹配[6]是一种采用不同时刻获取的信号是同相的而噪声是不同相这一条件,利用三元阵的输出采用快速傅立叶变换就可以提出某一时刻的信号,当然利用多元阵通过移相处理使信号同相后,获得方程组再取其最小二乘解,其在去噪处理方面有很大的应用前景。
2 线性调频信号
线性调频信号其瞬时频率是时间的线性函数,这种信号的发射可以得到均匀的信号带宽,它在雷达理论中通过匹配滤波可以提高距离向分辨率。在这里对这种信号在时域里进行数学表达其中t是时间变量,单位为秒,k是线性调频率,单位是Hz/s,f0是中心频率。在这里为了便于分析,中心频率采用零值。那么公式变为其相位的变化就体现在指数相的幅角的变化上[7]。由公式ϕ(t)=πKt2给出。相位是时间的二次函数,其频率为
3 信号的相位匹配
采用三元阵进行信号相位匹配,设信号与噪声有加性,那么接收到的信号可以表示为r(t)=s(t)+n(t),其中s(t)是期望得到的信号,n(t)为背景噪声。为了便于数学处理将该式写成极坐标的形式:其中ϕ、α和β分别为接收到实际信号、期望信号和噪声信号的相位角。在这里设三元阵为一个线阵如图1:
其中阵元间的距离是d,s(t)与线阵的法线的夹角为θ,在这里对于远场信号而言,波前到达的时间是不一样的,其时间差用式表示,c为波速。这样根据图1,就可以表达三个阵元的接收信号的方程组[8,9]:
其中ω=πkt2,接下来的处理方法是样期望得到的信号同相,目的是得到实际获取信号与噪声信号的方程,最终通过对噪音的设定来还原出期望的信号。
将(2)、(3)式进行变换使得其与(1)式同相,于是得到
这样方程(1)(4)(5)就组成了期望信号同相的方程组,下面对这个方程组的各个方程两边分别进行取模平方运算后消去项,得到期望信号的实部和虚部[10]:
其中
基于上面的算式(6)(7)如果背景噪声谱幅度进行估计的情况下就可以求出期望信号。
4 仿真处理与分析
仿真处理的过程是这样的,为了证明去除噪声的效果,首先制造出线性调频信号,然后通过傅立叶变换考察其频谱,在时间域中对线性调频信号加入随机高斯白噪声,信噪比为2.5分贝,然后在时间域和频域分别看其图像,最后经过相位匹配处理还原出原来的信号[11]。
5 结束语
通过仿真可以知道,利用相位匹配的方法对线性调频信号的去噪有很好的作用,该方法可以在实际工程中利用,同时配合第二级匹配滤波会得到更好的效果,但该方法的快速运算是建立在对噪声谱的等值估计之上的,对于噪声的变化性反应迟钝。
参考文献
[1]曾发林,李猛.基于神经网络的噪声品质评价方法[J].噪声与振动控制,2008,(03):131-135.
[2]吴初辉,臧小刚,凌小峰,常成,宫新保.基于谱估计的噪声调频信号检测方法研究.信息技术,2008,(05):87-89
[3]BUI T D,CHEN G.Translation-invariant denoisingusing multiwavelets[J].IEEE Trans.On SP,1998,46(12):3414-3420
[4]路鹏,李月.微弱正弦信号幅值混沌检测的一种改进方案[J].电子学报,2005,(03):527-529.
[5]LEE J C.Performance of transform-domain LMSadaptive digital filters[J].IEEE trans on ASSP,1986,(34):499-510.
[6]ORRIS G J,MCDONALD B E,KUPERMAN W A.Matched-phase noise reduction[J].JASA,1994,96(6):3499-3503.
[7]JOHN C.CURLANDER ROBERT N.McdonoughSynthetic Aperture Radar System and Signal Processing1991,John Wiley&Sons,Inc.
[8]孙轶源,朱维杰,孙进才,李志舜.利用信号相位匹配原理的正弦信号参数估计[J].自然科学进展,2001,(11):1216-1220.
[9]孙进才,朱维杰,王惠刚,肖卉.多子阵信号相位匹配原理的信号最小二乘解[J]哈尔滨工程大学学报,2003,(04):368-371.
[10]孙进才,朱维杰.信号相位匹配原理及应用[J].西安:西北工业大学出版社.2005.
匹配技术实验报告 篇4
11120528
徐晗
实验内容:
利用①相关匹配(Correlation Matching)、②基于Hausdorff距离匹配方法 及③考虑对场景图象距离变换(Distance Transform)的Hausdorff距离匹配方法,实现模板目标在场景图象中的定位。实验过程: 对于每个模板分别给出最后的目标定位位置坐标(左下角坐标为(0,0)),对于方法①与②,比较定位精度的偏差;对于方法②与③比较定位效率(时间)。实验环境:
Matlab 实验结果:
1. 程序运行结果:
(1)相关匹配
由于相关匹配是在原图上进行匹配,所以对匹配位置的像素用底片色显示,以便于观察。模板一 相关度分布图
相关度彩色网格图:
匹配结果图:
左下角位置为(0,0),以模板左上角位置为参考点,模板匹配位置在 ans =
172
即坐标(172,111)为模板左上角位置所在。
模板二: 相关度分布
相关度彩色网格图:
匹配结果图:
左下角位置为(0,0),以模板左上角位置为参考点,模板匹配位置在 ans =
174
即坐标(172,111)为模板左上角位置所在。
(2)Hausdorff距离变换匹配
模板边缘提取,用参数为0.005的log算子和canny算子:
Template_1,log算子
Template_2,canny算子
背景边缘:
模板一
Hausdorff距离彩色网格图
分割效果图:
左下角位置为(0,0),以模板左上角位置为参考点,模板匹配位置在 ans =
174
模板二
Hausdorff距离彩色网格图
变换效果图
以模板左上角为参考点,匹配点位置坐标为
ans =
175
102(3)基于场景的hausdorff变换:
边缘提取使用参数为0.006的log算子
模板一
模板二
背景:
场景距离hausdorff变换:
模板一
匹配结果彩色网格图:
匹配结果
以模板左上角为参考点,匹配点位置坐标为 ans =
172
模板二
匹配结果彩色网格图:
匹配结果
以模板左上角为参考点,匹配点位置坐标为 ans =
161
2. 效果对比
1.相关度匹配与hausdorff距离匹配效果对比:
通过对之前结果的观察,可以看出在使用模板一时,两者的匹配效果都很好,在实际程序运行结果中,实际上hausdorff距离算法得到了三个相同值的极值点,在图上只显示出一个,不过由于三个点是相邻的,非常接近,所以选用了其中的一个匹配度最高的显示出来。由于相关匹配算法应用的是原始图像进行匹配,对图像信息使用的较多,因此匹配效果更加精准;而hausdorff变换要先提取边缘,且对图像噪声很敏感,因此往往需要尝试不同的边缘检测方法和其他参数,而且由于算法的缘故,经常会出现多个匹配点,在这方面精准度不如相关匹配。
在使用模板二的计算中,相关匹配算法得到的结果比较接近实际情况,由于模板与图像不完全相同,所以无法算出具体的偏差,不过从实际效果看还是可以接受的;hausdorff算法则由于背景边缘在一些位置比较密集,而模板边缘与背景目标边缘相差较大,经常会出现判断错误的情况,但在调整好了参数之后效果与相关匹配还是比较接近的,结果也可以接受。
2.Hausdorff距离算法与基于场景的hausdorff变换效率对比:
实际测得使用hausdorff距离算法计算一次所用的时间大概为:
Elapsed time is 833.266206 seconds.由于时间较长,没有反复统计,不过一般都在700s以上,在系统同时做其他工作时时间可以超过1000s,计算量大,耗时多;
使用基于场景变换的hausdorff算法计算一次所用的时间大概为:
匹配处理 篇5
关键词:自然语言处理,分词处理,参数标注,文法规则匹配,参数提取
1 引言
随着社会信息化程度的不断提高,人与计算机系统之间的交互也变得越来越频繁。在不断地交互过程中,人们通常希望将自然语言作为人与计算机的主要沟通方式,这就使基于自然语言信息查询的对话系统成为了当前对话管理系统的研究热点。自然语言处理方法是对话管理系统的一个重要组成部分,从计算机的信息处理过程上看,其主要内容是建立一种计算模型,使计算机可以从自然语言信息中提取出决定机器理解的关键要素[1]。计算机通过识别这些关键信息,采取一定的策略控制,就可以引导人机交互的顺利进行。
基于文法规则匹配的自然语言处理方法,通过文法产生式将大量适用于相同人机交互过程的句子集抽象成规则,并在其中加入对关键信息的标注,使系统可以直接通过规则集生成的有穷状态自动机将语言信息转化为参数序列,引导至对应的信息处理方法中,从而提高了自然语言信息的识别效率,也体现了规则集的易扩展性。
2 系统模型的建立
基于文法规则匹配的自然语言处理系统的主要任务是将自然语言信息解析为机器可以理解的参数信息,其功能主要靠分词处理、参数标注和文法规则匹配三个模块来实现,系统结构模型如图1所示。
3 系统实现
3.1 分词处理(Segmentation)
分词处理是通过分词算法将句子划分为词序列的过程。在英文文本中,空格是单词之间的自然分界符,无需对句子的词边界进行确认。而中文在句子构成上没有一种明显的词边界符,所以对于中文来讲,确定词的划分是理解自然语言的第一步。
3.1.1 预处理
预处理的主要任务是对源文本进行标记与拆分,以提高分词速度和准确率。
1)预分词:在源文本中,经常会出现一些不易被分词算法正确切分的混合信息,比如浮点数、IP地址、电子邮件地址、时间和日期等。这些信息可能是影响计算机理解的重要参数,应提前进行处理,以防被分词算法错误切分。本系统通过使用正则表达式对源文本进行匹配,将符合条件的词或子句标记为参数,分词算法不用对已标记的文本进行切分。
2)分句:在中文文本中,汉语词是不包含符号的。将具有断句功能的标点符号作为分句依据,对源文本进行句子拆分,可以减少每次分词处理的信息量,提高分词速度。考虑到一些特殊参数(如IP地址)包含着影响分句的标点符号,应该将预分词处理放在分句处理之前,并将标记了参数的词或子句也作为句子拆分的依据。
3.1.2 中文分词
现有的分词方法可以分为基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法三类。其中,基于字符串匹配的分词方法也称为机械分词方法,是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法[2]。
本系统采用双词典结构的字符串匹配分词方法,除了具有大量词条的分词词典外,还包括一个由参数表构成的参数词典作为附加词典。参数词典定义了参数表的存储格式,每一个参数表应具备参数类型、参数标记符和参数词表,如表1所示。
当系统加载词典时,首先会载入分词词典中的词条,随后会读取参数词典中的参数表信息,记录参数类型与参数标记符,并对每一个出现在参数词表中的词添加参数记录。通过参数词典来维护参数表,可以集中管理参数信息,便于规则集的参数扩展。
3.1.3 后处理
后处理的主要任务是优化分词结果,提高机器的识别能力。
1)停用词处理:停用词是指文本中出现频率很高,但实际意义又不大的词,主要指副词、虚词、语气词等。本系统使用停用词表对经分词算法切分好的词序列进行遍历,去掉其中包含的停用词。
2)规范化处理:由于汉语语法的复杂性、词汇的广泛性和常用语的不规范性,通常会导致同一个意思的表达有多种方式,比如表示“今天”可以说:今天,今日,今儿,今儿个...这里采用同义词集生成的规范化映射表,可以将分词结果中不规范的词全部替换为标准词,便于机器识别。
3.2 参数标注(Parameter Tagging)
对于不同领域不同类别的问题,系统需要从中抽取出查询答案的关键信息,这些信息的集合就是系统预定义的参数集,比如在查询天气时候可以问“今天北京天气怎么样?”,这句话包含了两类参数,它们分别是时间参数“今天”和城市参数“北京”。由于参数对机器理解自然语言信息起到了较大的辅助作用,参数标注也就成为了分词结果进行文法规则匹配前的一个重要准备工作。
参数标注与词性标注类似,不过标注的内容不是词性,而是词所包含的参数类型。比如“天安门”在进行参数标注时,将被标记两个参数:[地点]和[景点],分别对应“问路”和“旅游”两个领域的信息查询。一个词可能不具备任何参数类型,也可能具备多种参数类型,这是由系统的具体应用领域决定的。
3.3 文法规则匹配(Grammar Rule Matching)
在自然语言处理过程中,对语言信息的理解可以看做是有穷状态自动机的执行过程。分词处理与参数标注得到的带参词序列将作为规则匹配自动机的输入序列,序列中每一个词元的内容或参数类型则是自动机的状态转移条件,推动其执行。若分词序列输入完毕时,状态转移至终止结点,则成功识别出一条语言信息。这种方法通过文法产生式生成可以识别特定语言信息的规则,并将规则作为生成自动机状态结点和转移条件的依据,通过不断扩充的规则集来调整自动机的结构和状态,以提高对语言信息的识别效率。
3.3.1 文法设计
定义文法G=({E,W,L},{(,),[,],{,},<,>,$,num,word},P,S)
其中P={
S→E,
E→EE,
E→(W),
W→E$E|W$E,
E→[]|[L],
E→{}|{L},
L→num,
E→
E→word}
为G产生的语言(language),,w为G产生的一个句子(sentence)[3]。在本系统中,将G产生的句子称为规则。
3.3.2 产生式解释
上述文法G所包含的产生式P可以对自然语言集进行规则抽象。对于符合文法规则的句子A1,A2,...,An,包括以下几种格式:
1)连接:“A1A2”表示两个规则A1和A2连接成一个新的规则A1A2。
2)选择:“(A1$A2$...$An)”其中n≥2,表示只需满足A1,A2,...,An其中一条规则即可。
3)可去除:“”表示可以满足规则A1,也可以不满足A1。
4)参数标记:“[L]”表示一个参数类型为L的词。
5)任意参数标记:“[]”表示一个任意参数类型的词。
6)组标记:“{L}”表示一组参数类型均为L的词。
7)任意组标记:“{}”表示一组任意参数类型的词。
根据文法产生式的格式可以定义相应的规则表达式,比如([101][102]$[102][101])<的>天气<怎么样>。其中[101]代表日期参数,[102]代表城市参数,(E1$E2)表示在进行规则匹配时E1和E2只能选择一个来匹配,<>表示所括选内容是可以去除的。由此,前面给出的规则范例可以匹配到的句子包括:
1)北京今天天气怎么样
2)明天天津的天气怎么样
3)广州昨天的天气
4)后天上海天气
……
通过文法规则,可以用少量的规则表达式来识别大量的句子组合。
3.3.3 状态转移
为了保证在语言信息识别成功时,句子所经历的状态转移路径只对应一条规则,由起始结点S出发至终止结点的自动机结构应是树状结构,其根结点为S结点,自动机为非确定有限状态自动机(NFA)。对于一个结点的一次词匹配,自动机会按照固定的顺序选择状态转移函数,如果一种状态转移函数的词匹配失败,将通过回溯法回到前面结点,选择新的状态转移函数继续匹配,直至匹配成功或所有结点的状态转移函数均匹配失败。
对状态转移函数的状态转移条件的选择顺序为:
1)具有断句功能的标点符号
2)输入词
3)任意组标记
4)与输入词参数类型一致的组标记
5)任意参数标记
6)输入词的参数类型
3.3.4 匹配成功
当自动机执行完毕时,若所在结点为终止结点,将会读取到一个规则标识。通过规则标识可以从状态转移路径经过的结点中提取出与该规则相关的参数信息,并将其保存为参数序列。至此,有穷状态自动机就完成了由分词序列到参数序列的文法规则匹配和参数提取工作。
4 规则应用举例
通过XML生成函数可以将定义好的规则内容、处理方法和自动机所需的参数提取信息转换为系统能够读取的XML格式标签。例如“([101][102]$[102][101])<的>天气<怎么样>”将会转换为
在识别句子“北京今天天气怎么样”时,系统提取出的信息为:
1)信息采集方法:Weather领域的Weathcr Search方法
2)已获得参数:City|北京;Date|今天
5 结束语
本文对中文人机对话系统中的自然语言理解技术进行了研究,提出了一种基于文法规则匹配的自然语言处理方法。根据此方法实现的系统,可以通过扩充参数词典和规则集来提高对自然语言信息的理解能力,使系统有较好的领域扩展性。对于识别效果不好的语言信息只需按照其语法结构抽象出新的规则并添加到系统中,就能够改善对这类句子的识别效果,实现起来简单而有效。
参考文献
[1]俞士汶.关于语言信息处理技术的展望[J].计算机世界,1997(1).
[2]湛燕,陈昊,袁方,王熙照.基于中文文本分类的分词方法研究[J].计算机工程与应用,2003,39(23).
[3]蒋宗礼,姜守旭.形式语言与自动机理论[M].北京:清华大学出版社,2007.
匹配处理 篇6
1 实验材料与方法
1.1 实验材料
焊接实验所用母材为Q235钢板和316L不锈钢钢板,尺寸规格均为200mm×100mm×14mm,其化学成分如表1所示。所用焊条均为不锈钢焊条,牌号分别为A132,A042和A022,其化学成分如表2所示。
(质量分数/%)
(mass fraction/%)
(质量分数/%)
(mass fraction/%)
1.2 实验方法
基于文献调研和现场实践,采用手工焊条电弧焊(Shielded Metal Arc Welding,SMAW)进行以下3组焊接实验。第1组,用E347-16(A132)+E316L-16(A022)作为堆焊材料,先在Q235坡口上堆焊A132约2~3mm,然后再堆焊A022约2~3mm,最后用A022填充焊接;第2组,先用E347-16(A132)作为堆焊材料(约3~5mm),然后用A022填充焊接;第3组,先用E309MoL-16(A042)作为堆焊材料(约3~5mm),然后用A022填充焊接。焊接工艺参数如表3所示。焊接示意图如1所示。
焊接后,选用最优质的焊接接头进行时效处理,把试样分为3组,分别做300℃×2h,500℃×2h,700℃×2h保温后,空冷时效处理。根据实验相关规范,采用金相显微镜(VMD-P3008)、万能试验机(WDW-1000)、冲击试验机(JB-30B)、显微硬度计(HV-1000)等设备对上述实验试样分别进行组织结构观察及力学性能测试。
2 结果与分析
2.1 焊材匹配对焊接接头性能的影响
2.1.1 显微组织
不种焊接工艺下异种钢焊接接头Q235熔合线与堆焊层的金相组织如图2所示。由图2可知,熔合区主要为针状组织和不易腐蚀的“白亮”带。堆焊层与Q235之间有非常清晰的熔合线,此熔合线是由合金的浓度梯度造成的,熔合线越明显表示Q235和堆焊金属结合的越不好。比较可知A042组结合的较好,而且A042组堆焊层及熔合区的组织相近且最为细密(图2(c),(f))。Q235热影响区(Heat Affected Zone,HAZ)的金相组织如图3所示。Q235 HAZ和母材晶粒都出现明显的变大,三者相比较下,A042组的晶粒要细一些。316L HAZ及填充焊缝的金相组织如图4所示。316L HAZ的晶粒大小基本相当,和母材比起来相差不大,与焊缝的金相组织相近。A042组焊缝的组织主要为奥氏体和蠕虫状的σ铁素体,其中σ铁素体是在焊接非平衡快速冷却过程中发生σ-γ转变后保留下来的σ铁素体晶核[14,15]。而其他两组在焊缝中产生了马氏体组织[16],增加了焊缝金属的冷裂倾向。这是因为A042焊条中的Cr(22.0%~25%),Ni(12.0%~14.0%)含量高于其他两组焊条的,由以上分析可知,A042焊条是3组中较好的堆焊材料。
(a),A132+A022(b),A042(c)与316L HAZ的A132(d), A132+A022(e),A042(f)的金相组织
A132(a),A132+A022(b),A042(c)and 316L HAZ A132(d), A132+A022(e),A042(f) in different welding processes
2.1.2 拉伸性能
对3组焊接焊缝试样进行室温拉伸实验,从拉伸试样可以看出断口均在Q235母材上且均为塑性断裂。不同焊接工艺下Q235/316L焊接接头的拉伸性能如图5所示。对拉伸实验数据进行分析可知,本实验采用的焊接工艺达到了强度的基本要求。堆焊材料A042组的抗拉强度最大为470MPa,同时屈服强度排
第2位,具有较好的脆韧性,其结果与金相组织分析结果相符。在相同的焊接电流、焊接电压以及人员施焊下,堆焊组A042的强度最好。
2.1.3 冲击韧性
不同焊接工艺下Q235/316L焊接接头的冲击韧性如图6所示。可知,堆焊材料为A132+A022时,Q235 HAZ和316L HAZ的冲击吸收功都是最大,焊缝中心的吸收功最小,这表明焊缝两侧韧性很好,焊缝硬度很大;在堆焊材料为A132组时,Q235 HAZ和316L HAZ的冲击吸收功都很小,焊缝的冲击吸收功最大,这表明该组试样焊缝两侧脆性很大,但是焊缝的韧性很好;A132组Q235 HAZ冲击吸收功最小,而A132+A022组较大,这是因为堆焊时,先在Q235坡口上堆焊A132,再堆焊一层A022对堆焊层和Q235具有热处理的作用;此两种试样焊缝的冲击吸收功相差不大,是因为采用了相同的焊接参数和焊材;堆焊材料为A042时,焊缝中心及HAZ的韧性都居中;综合考虑,堆焊材料为A042时,焊接接头的韧性较好。
2.1.4 硬度测试
不同焊接工艺下Q235/316L焊接接头的维氏硬度测试结果如图7所示。可知,Q235 HAZ硬度最大的是A132组,A042和A132+A022组的硬度相差不大,堆焊层的硬度都很大。堆焊材料为A132时,热影响区及其堆焊层硬度都很大,而A042组则较小,这说明焊材匹配A132不及A042,但是从A132和A132+A022组得知,焊接工艺的不同对试样硬度影响很大,原因是A132+A022组先在Q235上堆焊A132,紧接着堆焊A022时对A132具有热处理的作用,使得改组的堆焊层硬度降低。3组实验中,A132组的焊缝硬度最小,A132+A022组的最大,A042组居中。由金相分析和力学性能分析可知,A042作为堆焊焊材,A022作为填充焊材是较好的焊材匹配。
2.2 时效处理对焊接接头性能的影响
2.2.1 显微组织
焊缝区及堆焊层不同时效后的金相组织如图8所示。可知,常温下焊缝处主要以柱状晶为主,但是方向性不确定,这可能与温度梯度很小有关。焊缝中A042焊条堆焊后有柱状晶和较多的等轴晶,这可能是A042与碳钢熔合线附近的成分存在较大的差异,温度梯度也较大,因此存在柱状晶。又因合金元素提供了非均匀形核的晶核,所以存在大小不一的等轴晶粒。而A022焊条进行填充时,在焊缝中部或表面处形成非方向性的枝状晶。300℃时效后,柱状晶仍然存在,晶界更加分明,是由于从奥氏体中析出碳化物,同时还存在柱状晶和方向不大明确的枝状晶。500℃时效后,奥氏体不断地分解转变成α相,焊缝析出较多的碳化物。堆焊层A042在冷却过程中转变成的马氏体晶粒较少,是由于存在较高的镍和铬元素对奥氏体的分解存在抑制性。焊缝层A022由于合金元素较少,奥氏体分解容易,造成马氏体晶粒比堆焊层要多。700℃时效后,堆焊层和焊缝区的奥氏体晶粒都大量分解,板条状晶体变成了细小的晶粒组织,同时由于奥氏体不断地析出碳化物,冷却后,使马氏体转变温度Ms点上升,结果在较高的温度有大量的马氏体转变。尤其500,700℃时效处理后,由于碳的迁移,产生富碳区与贫碳区,易使力学性能变差。
(a)常温;(b)300℃时效处理;(c)500℃时效处理;(d)700℃时效处理
(a)at room temperature;(b)300℃ aging treatment;(c)500℃ aging treatment;(d)700℃ aging treatment
Q235与316L母材区不同时效后的金相组织如图9所示。可知,Q235焊后母材远离焊缝的区域未受焊接热影响,出现铁素体和渗碳体。316L母材远离焊缝的区域也未受焊接热影响,存在奥氏体晶粒;300℃时效处理后316L不锈钢可能有碳原子的偏聚;500℃时效处理后Q235母材中有碳化物不断聚集长大,形成条状的碳化物。316L中逐渐有碳化物从奥氏体中析出;700℃时效处理后Q235随着温度的升高和时间的延长,碳化物逐渐转到晶界附近,形成网状碳化物,对力学性能有不良的影响,此外还有铁素体晶粒;316L析出第二相形成无共格关系的碳化物成条状分布,碳化物使奥氏体合金元素减少,减弱奥氏体的稳定性,从而有马氏体和贝氏体的形成。
(a)焊后金相组织;(b)300℃时效处理;(c)500℃时效处理;(d)700℃时效处理
(a)microstructure after welding;(b)300℃ aging treatment;(c)500℃ aging treatment;(d)700℃ aging treatment
焊接接头Q235 HAZ不同时效后的金相组织如图10所示。可知,未经热处理的Q235与焊缝的熔合区在靠近熔合线的部位存在一些粗大的晶粒,而后则是极细小杂乱的铁素体与珠光体的混合组织,可能是合金元素的溶入阻碍了晶粒的长大。局部区域由于合金元素含量增高,冷却过程中推迟了珠光体的转变,有细小的针状类马氏体组织出现。另外,也有区域出现由针状铁素体或渗碳体及其间混合珠光体组成的复相组织,魏氏体组织,对焊接接头的强度、韧性都有很大的影响。300℃时效处理后马氏体分解形成低碳α相和弥散的碳化物(图10(b)黑色组织),白色区域为铁素体组织。 500℃时效处理后形成的组织是珠光体和铁素体组织。700℃时效处理后有珠光体晶粒存在,同时也有网状的碳化物分布在铁素体晶体上,造成硬度偏高,脆性增大,易使Q235 HAZ的力学性能变差。
316L HAZ不同时效后的金相组织如图11所示。可知,由于焊接时,温度梯度具有很大的差异,同时两种材料的成分差异可能导致Ms点的不同,因此316L熔合区的组织是奥氏体及其奥氏体内部凌乱的马氏体。300℃时效处理后,由于焊接后冷却速率太快,导致了过饱和马氏体的形成。而奥氏体内部的少量马氏体组织在时效后析出的碳化物分布在马氏体晶界处。500℃时效处理后,残余奥氏体不断地减少,晶界不断地弱化,这与第二相不断析出有关。第二相在700℃析出,长大的速率很快,并逐渐变成条状(图11(d)黑色组织),形成了脱离共格关系的碳化物,导致奥氏体晶粒内部有板条马氏体、铁素体和碳化物的形成。
2.2.2 拉伸性能
不同时效后异种钢焊接接头的拉伸性能如图12所示。分析可知,300℃时效处理后,试样接头的抗拉强度值大于未经热处理的,但是断后伸长率增加比较明显。然而,经过500℃时效处理后,试样接头的屈服强度、抗拉强度值均明显大于未经热处理的,但断后伸长率和300℃时效后的相比却略有减少。700℃时效处理后,焊接接头的屈服强度,抗拉强度值均小于500℃时效后的大于未时效处理和300℃时效处理的。300℃时效处理后,虽然焊接后相当于淬火的焊接应力得到了消除,使伸长率增加,但也导致了屈服强度的降低,再加上过饱和碳的析出,从而阻碍了位错的运动。此外,氢在奥氏体中的溶解度远大于在铁素体中的溶解度,因此300℃时效后能充分改善接头的抗裂性,从而增加抗拉强度。500℃时效处理后,残余奥氏体的数量不断减少,其分解的产物渗碳体尺寸细小,弥散,阻碍了位错的运动,从而导致了屈服强度的提高。碳化物以粒状和球状析出,使屈服强度降低。而残余奥氏体数量的不断减少,会使伸长率降低。700℃时效处理后,Q235 HAZ形成了网状的碳化物,导致了强度和韧性的急剧下降。
2.2.3 冲击韧性
不同时效处理后异种钢焊接接头的冲击韧性如图13所示。可知,随着时效处理温度的升高,Q235 HAZ的冲击值略有减少,这是因为焊后焊缝组织不平衡,固溶组织处于过饱和状态,特别是马氏体组织。随着时效处理温度的提高及保温时间的延长,碳原子不断析出、内应力不断消除、碳化物不断沉淀会使冲击韧性提高,但是残余奥氏体的减少又会使冲击韧性减小。焊缝中的A-M晶界与316L HAZ是氢的富集区,氢的消除让焊缝区和316L HAZ冲击韧性有所提高。500℃时效处理后,残余奥氏体开始不断分解形成球状的渗碳体和铁素体,使冲击韧性提高,焊缝的冲击值保持大致相同。而316L HAZ母材的冲击值却急剧减少,这是由于残余奥氏体的分解速率增加(残余奥氏体在钢中的作用是增加其韧性),其数量不断减少,同时在晶界处析出的第二相使晶界破坏,加剧了冲击韧性的降低。700℃时效处理后,Q235 HAZ的冲击韧性急剧减少,焊缝的冲击值略有提高,316L HAZ的冲击值明显提高。这是因为随着温度的提高和时间的延长,Fe3C尺寸不断增大,晶界和晶内大颗粒第二相不断长大,形成的网状碳化物破坏了晶界,因此导致了冲击韧性的急剧下降,而在700℃表现的最为明显;316L和焊缝是由于温度提高,Fe3C不断地溶入α基体,碳化物以MX和M23C6的形式析出并长大,与奥氏体晶粒脱离了共格关系,从而使冲击值提高。
2.2.4 硬度测试
不同时效后异种钢焊接接头显微硬度测试结果如图14所示。未经热处理的试样接头在焊缝的两侧存在两个高硬度区,对应两个熔合区,而Q235 HAZ和316L HAZ硬度比母材有所升高,结合金相组织分析可知,Q235 HAZ是由于焊缝合金元素的扩散,使该区合金元素含量升高,而后在快速冷却中该区域形成了类马氏体等淬硬组织,使该区域硬度升高;不锈钢熔合区也有合金元素扩散,并且也是由于异种材料的差异及很大的温度梯度,形成了不同的Ms点,造成了马氏体组织的不同。另一原因是,靠近Q235 HAZ形成的脱碳层造成了焊缝区间有很大的硬度差异。300℃时效处理后,试样的Q235母材、HAZ、堆焊层、焊缝硬度都有升高,特别是在HAZ到堆焊层一段硬度增加明显。结合金相组织分析可知,Q235 HAZ硬度升高的原因是,Q235晶粒粗大,显微硬度测试的压痕较小。Q235熔合区和热影响区硬度很高则是由于焊缝合金元素扩散使这两个区域合金元素含量升高,晶粒固溶强化效果明显,同时长时间保温后合金元素以碳化物形式析出,产生了弥散强化。焊缝和316L熔合区则由于晶粒粗化、增碳层的出现使硬度稍有升高。500℃时效处理后,其硬度变化趋势大致同300℃的相同,但是平均较300℃时效后的试样小。特别是在Q235 HAZ,由于形成了等轴的铁素体晶粒,冷却后形成铁素体和少量粒状渗碳体,因此马氏体结构减少或消失,使硬度逐渐下降。700℃时效处理后,其硬度变化趋势与其他时效处理后的大致相同,在堆焊层硬度达到最大值,这是由于经高温时效处理后,碳的扩散使熔合区附近变成富碳区,硬度升高,邻近熔合区的母材变为贫碳区,硬度下降;同时碳的扩散也导致了316L增碳层的出现,使硬度升高。由金相分析与力学性能分析综合可知,经300℃时效处理的焊接接头的综合性能较好,能够达到规范要求。
3 结论
(1)在Q235/316L异种钢的焊接中,采用A042(高Cr,Ni含量)焊条堆焊时,可以得到性能优良的异种钢焊接接头,此接头的焊缝组织主要为奥氏体基体上分布有一定数量的蠕虫状的σ铁素体。
(2)相对于500,700℃时效处理以及不进行时效处理的异种钢焊接接头,经300℃×2h保温,空冷时效处理的异种钢焊接接头由于铁素体、珠光体的存在使其屈服强度和抗拉强度得到了较大提高,同时由于氢的消除及逆转变奥氏体数量的增加也使焊缝区和316L HAZ冲击韧性有所提高。
基于模糊匹配的多级车牌匹配技术 篇7
随着智能交通技术的发展,城市交通管理系统和公路交通管理系统的自动化、智能化水平在不断提高,视频监控设备、电子拍照设备、移动监测设备被广泛地布设在路网中的观测站、收费站及重要路口,通过车牌自动识别技术可以从这些设备获取图片、视频中提取车牌信息。当前,我国城市路网和国道、省道等公路网每天都在获取超过百万计的车辆检测信息,包括车牌号、车辆通过路口的时刻、路口ID等。然而这些信息却没有得到足够的重视和高效的利用,当前的车牌利用停留在车速测量、不停车收费、交通违章的初级阶段,未能从网络化、全局化、轨迹化的角度来分析利用车牌数据,造成了车牌资源的很大浪费。
近年来,ITS技术的发展使牌照自动识别技术更加完善,车牌捕获率和识别率有了显著提高,车牌号作为全世界惟一对车辆身份进行识别的标识,它的特殊性和重要性决定了车牌识别系统成为城市智能交通管理系统中不可或缺的重要组成部分。通过对比同一辆车经过上下游路口车牌被识别到的时刻,可以对一辆车连续通过两个路口的旅行时间进行计算[1],可以分析该路段的交通状态[2,3]、延误、路段服务水平等交通分析评价指标,还可以分析车辆的出行轨迹[4]等,而这些分析的前提是要对得到的车牌号进行匹配、处理。
现在的车牌识别系统虽然有了很大的发展,但是由于车牌的污损、模糊、遮挡、天气等原因,识别车牌的准确率达到100%是不可能的。如果车牌没有被正确读取,精确的车牌匹配会损失掉这部分数据,影响后续工作的完成,因此选用合适的方法对车牌进行匹配显得尤为重要。
本文设计的车牌匹配方法采用多级匹配策略:一级匹配,限定车牌经过上下游交叉路口的时间间隔;二级匹配,车牌模糊匹配、设定阈值,增加匹配成功率;三级匹配,异常数据剔除。通过北京市某路段的实测数据进行验证。图1为车牌多级匹配流程框架图。
1 限定时间间隔
车牌数据为车辆通过停车线后检测区域时识别得到,车辆通过每个路口时,其车牌将被识别并存储。车辆正常行驶,经过上下游路口的间隔时间是在一定范围内的,如果间隔时间过大,则不能进行有效地车牌匹配数据。原因在于:上下游交叉口获取的相同车牌数据可能来源于车辆的二次出行,甚至是多次出行。在限定的时间间隔内进行车牌匹配,可以有效地减少这种情况的发生。对于交通量大的路口,每天都有海量的车牌数据,在匹配之前限定范围,可以大大减少车牌匹配的工作量,加快匹配速度。车牌识别系统中可能出现如“京A12345”、“京A12845”,这种情况有可能源于车牌系统识别错误,将3识别为8,也有可能本身就是两个不同的车牌,限定时间间隔可以减少这种情况出现的匹配误差。限定车牌经过上下游交叉路口的时间间隔可以很好地提高基础数据的质量。
假定当前路口有一要匹配的车牌A,在下游路口选取10 min(可以根据上下游路口的路段长度及交通状况等进行调整)内的车牌数据进行匹配,这样减少了匹配的工作量,同时提高了匹配的准确率。
2 模糊匹配算法
现阶段的车牌匹配大多采用精确匹配,车牌的精确匹配是指查找的车牌与搜索到的车牌完全相同,是最理想的匹配方式。但是,这种方法匹配要求严格,存在一些弊端,当车牌识别错误时,无法返回匹配结果,不能满足研究的需要,故需要寻找一种匹配率较高的方法。
车牌其实就是一串字符串,可以通过研究各种字符串的匹配算法实现车牌的匹配。字符串匹配[5]可以分为精确匹配和模糊匹配。本文的车牌匹配采用后一种,即模糊匹配[6]。
2.1 编辑距离的定义
本文拟采用“编辑距离”[7,8]的概念实现模糊字符串的匹配。通俗地讲,编辑距离算法是指两个字符串之间,由一个字符串通过一些编辑操作可以变换成另外一个字符串所需要的最少编辑次数。这里的编辑操作包括从字符串中删除、插入、更改一个字符,称为一个编辑距离,它能够体现两个字符串的差异。
起始的编辑距离是0,然后操作一次编辑距离就加1,直到这个字符串已经完全变成另外一个字符串。操作的次数越多,那么编辑距离就越大,最少操作次数代表了最精确的操作,也就是变换过程中的最优解。
例如将变换成 ,可以按照这样的步骤转变:
( 1 )将kid中的第三个字符d变成n ( kid→kin );
(2)在kin的后面添加g(kin→king)。
经过了2次编辑操作,那么kid到king的编辑距离为2。
通过计算编辑距离,可以得出最佳匹配。
2.2 算法实现
车牌字符串具有如下的特点:
(1)汽车牌照的位数固定,一般为7位,最多的如武警车牌(WJ01-12345)等极少数为9位。
(2)对汽车牌照进行模糊匹配时与字符串有所不同,字符的匹配顺序不能颠倒。
基于车牌的特性,车牌匹配的编辑操作不能有删除、插入,只考虑从字符串中将一个字符改为另一个字符的操作。
假设现在已求得A的前i - 1个字符编辑成B的前i - 1个字符的最短编辑距离,此时如果A、B的第i个字符相同,显然无需任何字符操作就可以在原来的基础上得到A、B的前i个字符相 同 ,此时的编 辑距离就 是D(i) = D(i - 1) ;如果A、B的第i个字符不相同,则可以通过更改A的第i个字符为B的第i个字符,此时也可以在原来的基础上使得A、B的第i个字符相同,由于只做了一个修改操作,因此D(i) = D(i - 1) + 1。
综上所述D(i) 的递推公式如下:
假定待匹配的车牌号是A,它是一串字符串设为A{a1,a2,…,ai,…,am}( 7 ≤ m ≤ 9),在数据库中等待要匹配的车 牌号有n个 ,放在集合S{B1,B2,…,Bj,…,Bn} (0 < j ≤ n) 中 ,每一个车 牌号是一 串字符串 设为Bj{b1,b2,…,bi,…,bm} ,将字符串A中的一个字符编辑成字符串Bj所需的最小操作数记为D(A,Bj)。
算法的思想是将待匹配的车牌号A的第一个字符与数据库中的Bj的第一个字符进行匹配,若相等,则D(1)= 0;若不相等,则D(1)= 1。继续比较A的第二个字符和Bj的第二个字符;依次比较下去,直到字符串匹配完成,得到A和Bj的编辑距离D( j)。车牌数据库中有n个待匹配的车牌,需要依次求出A与这n个车牌的编辑距离,编辑距离越小,其匹配度越高,要想得到一个与A匹配度最高的车牌,需要取A和Bj的编辑距离的最小值, 即D(A,Bj)= min{D( j)}。
用C#代码来实现A和某一Bj的编辑距离,如下:
2.3 匹配方案
如何从海量的数据库中搜索出需要匹配的车牌。 解决这个问题之前,必须首先解决串的相似性如何定义。俄国的Vladimir Levenshtein在1965年就提出了用编辑距离[5]的概念来描述两个字符串的相似程度,因此编辑距离又称Levenshtein距离。编辑距离越小,其相似程度越高。编辑距离越大,其相似程度就越低。假设字符串的最大长度为L,编辑距离为D(A,Bj),相似度为S,那么:
在当前技 术下 ,车牌识别 系统的识 别率达不 到100% ,在车牌识别中可能将车牌“京CE0192”识别为 “京CEQ792”,这实际为同一车牌,为了提高匹配的效率,设定其相似度在一定的范围。将阈值设为0.6,即S > 0.6时,两个车牌之间是匹配的。其中S = 1时,A到Bj的操作次数是0,也就是完全匹配。
在交通流量比较大的路口,车牌数据比较多,每一次匹配都是海量数据,车牌匹配速度的快慢影响其设计系统的效率。车牌具有一些其他字符串没有的特性,“京B12345”和“京C83345”在第4个字符时编辑距离为3,相似度已经超过了设定的阈值0.6,为了提高速度,这两个车牌没有必要匹配下去,可以大大的提高其效率。
3 异常数据剔除
经过上述方法匹配之后的车牌,依然会出现异常数据,这些异常数据可以用行程时间来进行剔除。出现异常行程时间数据主要有以下因素:系统误差,由于采集车牌装置出现误差;异常交通行为,车辆在道路上偶然停车、车辆从道路上离开正常行驶轨迹等。一些异常的交通行为对交通流量产生震荡,从而导致行程时间突变。这些数据都会显著影响对路段旅行时间的估计,需要应用一定的筛选算法将其从数据中剔除,以便提高输出数据的质量。
四分位数法[9](Quartile)是统计学的一种分析方法, 用于描述任何类型的数据,尤其是偏态数据的离散程度。简单地说,就是将全部数据从小到大排列并分成4等分,处于三个分割点位置的数值就是四分位数,使用四分位数间距来反映变异程度的大小。其中,四分位数间距指的是:上四分位数与下四分位数之差。相关文献给出了一种基于四分位数法的异常数据的处理方法:凡是超出此区间范围之外的数据,都被认为是异常数据需要剔除:
式中:Z表示有效数据区间;Q0.25表示位于1 4位置的数值,叫做下四分位值;Q0.75表示位于3 4位置的数值, 称为上四分位值;R表示四分位极差。
四分位数法的计算比较简便,计算速度较快,图2为四分位数法处理前后的效果。由图2可以看出,通过四分位数法可以较好地处理掉旅行时间过大或过小的异常数据,为后续的统计分析等提供高质量的基础数据。
4 实例分析
利用北京市利泽东二路口北向南和利泽东街口北向南的实测车牌识别数据进行三级匹配策略的实例分析,路口情况如图3所示。
利用文中设计的匹配算法,对2014年2月6日24小时内经过两个路口的车牌进行匹配。经人工匹配成功的有110对,经多级匹配之后成功的有106对,精确匹配的只有88对。
设定该路段的时间间隔为10 min,车辆京K06276在09:22:55经过利泽东二路口,在18:49:55经过利泽东街口,间隔时间大于设定的路段时间间隔,该算法可以很好地避免这种情况下的错误匹配。
按照设定的相似度阈值,匹配结果(去除精确匹配部分)如表1所示,为了对比实验结果,人工做了车牌的匹配,匹配结果(去除精确匹配部分)如表2所示。
实验结果表明,精确匹配的匹配率为80%,如果只通过精确匹配,则会遗漏掉表2中的数据。多级匹配的匹配率为96.36%,比人工实际的匹配结果少了4对,这4对车牌的相似度依次为0.43,0.43,0.29,0.57,超过设定的阈值,仅占整个匹配车牌的3.64%,说明设定的相似度阈值0.6是合理的。相似度阈值设置过小,会导致一些车牌不能匹配,达不到理想的匹配率。阈值设置过大,会导致匹配的错误率提高,速度降低。
5 结语
基于层次式匹配的最佳路径匹配算法 篇8
随着电子地图和导航系统的迅速普及,城市内出行变得越来越方便。但是现有导航系统的缺陷———单纯以几条固定路径的导航选择并不能让很多出行者绕开拥堵路段,而且还使得某些拥堵路段更加拥堵。另外,大量的定位系统使各个系统保存了大量的轨迹数据,如何从这些轨迹数据中挖掘有效信息,从而给不同爱好的出行者提供更加合适的出行线路是当前城市计算领域研究的热点之一。
路径优化是路径规划的核心问题,目前最有影响力的流行算法是Dijkstra在1959年提出的最短路径算法,Dijkstra算法,用于寻找两个点之间的最短路径。但是由于其算法的计算复杂度太高。很多学者对该算法进行了改进,提出了基于启发式搜索的A*算法以及基于记录历史路径的D*算法。因此,在城市内汽车保有量的不断剧增,以及影响交通情况的诸多因素影响下,上述研究方案在实际使用过程中并不能发挥很好的作用。
二、算法框架
本课题旨在以城市内的出租车定位轨迹数据为基础进行数据挖掘,挖掘城市内两个站点之间的最佳路径。为了实现这个目标,本文将从两个目标角度对出租车定位数据进行挖掘。首先,根据轨迹数据统计每个路段在不同时间段的进度和出度,并在此基础上计算基于信息熵的聚类分析,以构成整个城市的不同交通集中区域;接着,根据区域间的相连轨迹固定每个区域之间的最短距离,结合每个区域所在位置到区域出口之间的路径,就可以得出两个点之间的最佳路径规划。
为了提高检索效率,本文采用分层处理方式来提高检索速度,即按不同层次对整个城市进行逐层划分,从而使得整个城市的空间区域变成一个典型的树结构。按照上面的实现思想,本系统的实现流程如下:
(一)数据初始化
系统先将出租车轨迹数据(定位信息)按照每个路段划分成路径片段,即出租车经过每个路段的信息(路段编号,进入时间,离开时间),并导入公路网络信息。
(二)基于信息熵的区域划分算法
每个路段都有入度和出度(由于路段内有停车场或小区,单位时间内出度并不等于入度),如果将单位时间内每个路段的出入度之差作为该路段在该单位时间的信息熵,那么一些相邻路段之间的组合就是区域,如果将每个区域的向外的出入度之差作为该区域的信息熵,那么城市区域的划分就是将这些路段组合起来,使得整个系统的信息熵最低,就是我们所需要的区域划分。
(三)构建基于轨迹频繁模式挖掘和层次匹配的最佳路径模式库
按照传统的轨迹数据挖掘算法将出租车轨迹数据进行频繁模式挖掘,然后将挖掘获得频繁模式来构建两个点之间的最佳路径。其实现过程可以分为以下几个步骤:
1.按照上一个阶段获取的区域,结合历史轨迹数据,挖掘任何两个区域之间在不同时刻的最佳频繁路径,构建模式库;并确定每个区域连接其他区域的出入口,将其定义为关键点。
2.根据轨迹数据挖掘区域内不同时刻内、每个路段到每个关键点的最佳频繁路径模式。
3.上述两个模式集合构成整个最佳路径模式库。
(四)层次式最佳路径模式库的搜索
1.一旦用户输入起始位置和目标位置之后,系统会自动根据当前时间以及对应特征(比如周末、非周末等)进行路径频繁模式匹配。整个过程将以顶层为参数按照下面的流程递归调用。
2.将传入层作为当前层,系统按照输入的起始点和终点判断两个点是否处在同一个子区域。
3.如果两个点处在同一个子区域,且该区域已经没有子区域,那么直接对起始点和目标点进行匹配;如果匹配,则返回此两个点的匹配路径;如果还存在子区域,则递归进入下一层。
4.如果没有找到,则直接使用百度地图的路径导航。
随着电子地图、移动设备和定位技术的迅猛发展,越来越多的导航系统开始左右人们的出行。但是当前大多导航系统还停留在一些规定好的固定路径作为导航线路,这使一些拥堵路段变得更加拥堵。而本文则是采用历史轨迹数据挖掘,将大多数人采用的行走路径作为导航路径,这种方案给出行者提供更加灵活多变的优化路径。同时,为了提高历史路径的匹配效率,本文还采用层次式匹配思想来提高匹配效率,提供算法的实时性。
摘要:提出了以分段的轨迹数据为基础,结合时空数据挖掘技术,挖掘基于带时效的频繁模式。并基于这个频繁模式给出行者提供最佳的行车路线。同时,为了提高算法效率,提出了一种基于层次式模式匹配的思想,用分层的思想来过滤大量模式之间的匹配。
关键词:路径规划,交通控制,轨迹聚类
参考文献