识别与分类(精选十篇)
识别与分类 篇1
形状是图像的核心特征之一,也是人类视觉系统进行物体识别时所需要的关键信息之一。图像的形状信息不随图像颜色的变化而变化,是相对稳定的特征,因此可以利用形状特征,实现形状比较明显的各类图像库的检索。另外,对于颜色和纹理不够丰富的图像,基于颜色和纹理的检索方法是无能为力的,而基于形状的检索可以弥补其不足。
本文以几何图像为对象,从图像的形状特征出发,对图像形状特征的提取和描述方法进行了较深入地研究,详述了目前已有的形状特征描述方法,并对一些特征参数提取方法进行了改进,然后选取其中一部分特征值,分别利用BP神经网络和支持向量机进行形状识别,取得令人满意的实验效果。
2 基于概念的形状分类
自然界中的物体有着复杂的形状,人们对物体形状的认识有其复杂的认知过程,形状概念的形成就是人们对物体形状长期感知的结果。在中文中有许多描述物体形状的词,代表了某类形状的概念。我们收集了中文日常用语中有关形状概念的词,分析其含义,结合图像分析的特点,对所指形状相同的词归为同义词,按形状词对常见简单的基本形状进行分类,即基于概念的常见形状分类,如图1。
3 形状识别
3.1 形状特征的描述
对图像中感兴趣区域的形状描述可以从两方面进行,即利用区域内的象素集合和利用区域的边界,因此对形状的特征表达和描述可以分为两类:基于内部参数(区域)的形状描述和基于外部参数(边界)的形状描述[1]。
基于区域的内部参数描述主要是通过利用区域内的所有像素的集合来获得用以描述形状特征的参数。本文采用了七个不变矩、区域面积、矩形度、主轴方向、扁度、圆形度、球形度、欧拉数等几个参数。
基于边界的外部参数描述法主要是对包围物体区域的轮廓的描述,通过对轮廓的描述,可以来查询具有相似轮廓的目标图像。本文使用基于逼近多边形的参数来识别形状。
1)逼近多边形:由于噪声、采样等的影响,数字图像的边界常常会有许多较小的不规则处,这就对图像的形状测量和描述有干扰作用。为了减少这些干扰,可以通过多边形去逼近边界[2]。
逼近多边形是用一系列线段去拟合逼近任意边界,用尽量少的线段表示边界的基本形状,然后计算多边形的参数,从而使对边界的描述变得简单。常用的逼近多边形表达方法有三种:基于收缩的最小周长多边形法、基于聚合的最小均方误差线段逼近法和基于分裂的最小误差线段逼近法。本文采用基于聚合的最小均方误差线段逼近法[2]。
2)基于多边形的特征参数:在对图像进行逼近多边形处理后,就得到了拟和图像边界的和原来形状相似的一个多边形。利用该多边形的一些特性来对图像的形状进行描述。本文采用的多边形的特征参数主要有顶点数、凹点数和凸点数、内角方差、内角直方图、凹度等。
3.2 形状识别策略
根据这些形状的自身特点,利用前面的形状描述参数,来对图像进行形状识别和分类。分类原则是:采用层次化多种方法分类,对形状参数有明显区别的形状(如条形的扁度、圆形的圆形度、矩形的矩形度、多边形的凹凸度等),采用形状参数直接识别;对单个形状参数难以区分的形状,分别采用BP神经网络或支持向量机SVM进行模糊分类。采用形状参数直接识别的优点是提高了识别效率,减少了模糊分类的数目,提高了利用神经网络和支持向量机进行模糊分类的准确率。
3.2.1 利用BP神经网络识别形状
BP神经网络指基于误差反向传播算法(BP算法)的多层前向神经网络,是神经网络中使用最广泛的一类。BP算法是由D.E.Rumelhart和J.L.McCelland[3]在1986年提出的。典型的三层BP网络包括输入层、隐含层和输出层,各层之间采用全连接如图2。
本文利用matlab6.5里的神经网络工具箱,设计BP神经网络来进行形状的模糊识别。
3.2.2 利用支持向量机识别形状
支持向量机(Support Vector Machine,简称SVM)起源于统计学习理论,它建立在统计学习理论的VC维理论和结构风险最小化原理基础之上,它的基本思想是:对于一个给定的具有有限数量训练样本的学习任务,如何在准确性(对于给定训练集)和机器容量(机器可无错误地学习任意训练集的能力)之间寻求最佳折衷,以期获得最好的推广能力。支持向量机可以分为两种情况[4,5]:
1)线性可分:SVM方法是从线性可分情况下的最优分类面提出的。对于线性可分二分类问题,SVM的基本思路是在两个类别的样本集之间寻找一个最优分界面(Optimal Hyperplane,最优超平面),将两类分开,并使两类的分隔距离最大。以二维空间为例,如图3。
图3中,实心点和空心点分别表示两类训练样本,是将两类没有错误的分开的分类线,与分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。所谓最优分类线就是要求分类线不但能将两类无错误的分开,而且要使两类的分类间隔最大。
2)非线性可分:以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面,如图4。
因此,在最优分类面中采用适当的内积函数可以实现某一非线性变换后的线性分类,而计算复杂度却没有增加。SVM分类函数形式上类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量。
3.2.3 形状识别步骤
1)根据形状的扁度将其分为条形(扁度>0.98)和块形;
2)根据内角在[1200,2400]内的比率将块形分为弧边形(比率>75%)和多边形;
3)在弧边形中,根据圆形度识别圆(圆形度>0.85),再根据欧拉数(环形的欧拉数为0)识别环形;对其它弧边形,分别利用BP神经网络和支持向量机来模糊识别椭圆、圆弧形、扇形、心形、柳叶形和月牙形;其它作为任意弧边形;
4)在多边形中,根据形状的凹度将其分为凸多边形和凹多边形(凹度>0.55);
5)在凸多边形中,根据矩形度(矩形度>0.7)识别正方形和矩形,再根据扁度区分正方形和矩形(扁度>0.2);对其它凸多边形,分别利用BP神经网络和支持向量机识别三角形、梯形、四边形、五边形;其它作为任意凸多边形;
6)在凹多边形中,分别利用BP神经网络和支持向量机识别丁字形、十字形、五角星形、北极星形;其它的作为任意凹多边形。
3.2.4 形状识别实验结果分析
根据以上形状识别方法,我们对560幅形状图像进行了识别实验,利用准确率和正确率作为评价实验结果的参数。准确率和正确率定义如下:
准确率(Precision)=正确识别的图像数/应正确识别的图像数
正确率(Accuracy)=正确识别的图像数/所有识别出的图像数
1)实验一:利用单个形状参数对12种简单形状进行分类实验,结果如表1。
2)实验二:利用BP网络来对形状进行模糊分类识别
选取7个不变矩作为描述图像形状的参数,作为神经网络的输入矢量,神经元隐藏层的传递函数采用对数Sigmoid函数,输出层神经元的传递函数采用Purelin函数,使用Trainlm函数进行样本训练。
(1)对6种弧边形(椭圆形、圆弧形、扇形、心形、月牙形、柳叶形)分类,结果如表2。
(2)对4种凸多边形进行分类,采取三种方法进行实验。三种方法均采用4种输入,包括三角形、梯形、四边形和五边形,其中每种训练样本为20幅,测试样本也为20幅。三种方法不同的是,方法一中采用4种输出,即三角形、梯形、四边形和五边形。方法二中采用3种输出,即三角形、梯形和其它凸多边形。方法三种采用2种输出,即三角形和梯形。实验结果如表3。
(3)利用BP网络对4种凹多边形进行分类识别,采取三种方法进行实验。三种方法均采用4种输入:丁字形、十字形、五角形和四角形,每种训练样本20幅,测试样本为20幅。三种方法不同的是,方法一中采用4种输出,即丁字形、十字形、五角形和四角形。方法二中采用3种输出,即丁字形、十字形和任意凹多边形。方法三种采用2种输出,即丁字形和十字形。实验结果如表4。
3)实验三:利用支持向量机对形状进行模糊分类识别
选取7个不变矩作为描述图像形状的参数,作为支持向量机的识别依据。
(1)对三角形、梯形的识别实验结果如表5。
(2)对丁字形、十字形识别实验结果如表6。
(3)对6种圆弧形(椭圆形、圆弧形、扇形、心形、月牙形、柳叶形)进行分类识别实验,采用三个支持向量机分别进行两类识别实验。3个支持向量机SVM1、SVM2、SVM3的编码如表7,实验结果如表8。
从实验结果上看,采用简单的单个形状参数直接识别,准确性比较高。对于难以用简单的形状参数识别,采用BP神经网络和支持向量机进行模糊分类,在分类数较多时,分类的准确性明显下降。造成错误分类的原因主要有以下几点:一是每一类训练样本和测试样本都是手工绘制的,不是严格意义上的该形状,因此,有些形状虽然分属两类,但它们的参数可能很相近;二是测试结果和提取的形状特征参数有关,形状特征参数选取不合适也会造成识别错误,因此,需要对形状特征参数提取和选取做进一步的研究。实验表明,采用支持向量机进行二分类,比BP神经网络的效果好。为了系统的实用性,在以后的工作中,应当再多增加样本的数量和多样性。
摘要:基于内容的图像检索已经成为图像检索的一个重要研究方向。其中利用形状特征可以实现形状较为明显的各类图像库的检索。该文对图像形状特征的提取和描述方法进行了较深入地研究,选取其中一部分特征值,分别利用BP神经网络和支持向量机进行形状识别,取得令人满意的实验效果。
关键词:形状分类,形状识别,BP神经网络,支持向量机
参考文献
[1]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.
[2]夏德深,傅德胜.现代图像处理技术与应用[M].南京:东南大学出版社,1997:138-142
[3]许东,吴铮.基于MATLAB6.x的系统分析与设计——神经网络[M],2版.西安:西安电子科技大学出版社,2002.
[4]史忠植著.知识发现[M].北京:清华大学出版社,2002.
珍珠的分类及识别 篇2
美玉只有通过雕琢才能显示出它的魅力,而一粒珍珠,当它从贝壳里出生的时候,就将其迷人的美展现在世人眼前,千百年来,珍珠一直被当作美好的装饰品,受到女士们的喜爱,因此在珠宝世界里享有“珠宝皇后”的赞誉。?
目前,市场上销售的珍珠品种繁多,但归纳起来只有三类:养殖珍珠、天然珍珠和珍珠膺品。养殖珍珠又分为淡水养殖珠和海水养殖珠两种。淡水养殖珠无核,是在湖泊、池塘等水深不超过4米的环境中人工养殖的;海水养殖珠产于热带或亚热带的浅海水域中,均采用有核培殖法;天然珍珠多呈圆粒状,核极小,通常肉眼看不到。确切地区别天然珍珠和淡水养殖珍珠一直是珠宝鉴定中的难题,但专家根据珍珠层的结构、珍珠的密度、荧光和透明度等特征,可准确地将二者区分开来。对于消费者来说,简易的识别办法是:天然珍珠因核极小,肉眼下无核;海水养殖珠有核、核较大;淡水养殖珠无核。人工养殖珠(淡水珠、海水珠)透明度好,具半透明的凝胶状外表,而天然珠透明度较差,外观凝重;人工养殖珠表面常有突起和凹坑,天然珠外表光滑。?
珍珠膺品又称仿珠,最常见的仿珠有三种———充蜡玻璃仿制珠:在空心的圆形乳白色小球中充满石蜡,这种珠密度小重量轻,用手一掂即可区别,用针探测珠的.内部有软感,
资料
其外表光滑,用针刻不动;实心玻璃仿制珠:将白色实心玻璃球浸泡在“真珠液”中而成,用针从钻孔处拨动,其外表会成片地脱落,不见细小鳞片状粉末;塑料镀层仿制珠:在乳白色塑料珠外镀一层“真珠液”,用针挑拨钻孔处,外表亦会成片脱落,不见细小鳞片状粉末,用针刺外表可感觉出表皮下非玻璃材料。通常,将两粒珍珠相互摩擦,其表面有砂感,而仿珠之间相互摩擦,感觉很光滑,没有砂感———这是鉴别珍珠真伪的一个最简易的方法。?
珍珠的颜色很多:有白、金、银、粉、红、黑、蓝、灰等颜色,其中以白色稍带玫瑰红色为最佳,以蓝黑色带金属光泽为特佳,但若见到明显的黑色、灰色珍珠,就应引起警惕,有可能是染色珠。区别染色、真色珍珠的方法是:天然黑珍珠并非纯黑色,而是略带彩虹样闪光的深蓝黑色,或带有青铜色调的黑色;染色珍珠呈灰黑色和黑色,颜色单调、光泽差,若用布蘸少许5%左右的稀硝酸擦洗珍珠,则布上会留有黑迹。消费者在购买贵重的黑色珍珠时,要分外留意。
识别与分类 篇3
[关键词] 风险 识别 矩阵 方法
一、引言
风险识别是风险管理的基础和起点,也是风险管理者首要的或许是最困难的一项工作。它是在各类风险事件发生之前运用各种方法对风险进行系统、连续地辨认和鉴定的过程,其主要任务是辫认项目所面临的风险有哪些并确定各种风险的性质。只有通过风险识别发现项目隐含的各种潜在风险,才有可能进行风险度量、评价并选择最适当的风险管理对策,避免被动自留风险而给项目带来损失。
早期的风险识别主要是依靠风险管理者个人的工作经验进行。1978年,Boehm认为依照风险源清单( Risk Checklist),可发现项目中大多数严重的风险因素。1993年,Marcin等提出了“基于分类的风险辨识”思想。1995年,Haimes等提出了“层次全息模型(HHM)”风险辨识思想。2001年,Schmidt等认为有效的风险因素序列有助于项目管理者把握风险的本质和类型。
现有的风险识别方法大致可以划分为两类,一类是基于静态的风险识别方法,如财务报表分析法、分类结构法、风险源清单、风险档案表、条件——转换——后果(Condition- Transition- Consequence)图等;二是动态风险识别方法,如流程分析法、阶段风险报告法等。在实践中,管理者往往通过权衡风险辨识成本与收益的关系选用合适的辨识方法。
项目活动实施是一个动态的连续过程,在活动实施的不同阶段,可能存在着同一类别特征的风险,比如因人的因素引起的风险,但其质和量可能完全不同;另一方面,不同类别特征的风险在项目实施的同一阶段也可能同时存在,从而呈现出一种不同类别特征的风险与项目活动实施不同阶段动态交织的复杂局面。因此,需要寻求一种能够同时对项目活动各类风险在不同阶段的表现均能够进行系统识别的结构化方法。
二、基于实施流程与分类结构的风险识别矩阵原理
1.风险识别的分类结构法与流程分析法
分类结构法是最常用的一种风险识别方法。它是按照某种特征,运用风险源清单或风险档案表,对项目活动实施过程中的风险进行系统归类的风险识别方法。运用该方法时首先要确定风险的类别特征,并对其进行清楚的界定;然后,要制定项目风险清单或风险档案表。本方法以风险的聚类性与复合性特征为基础,符合风险识别的分类分层识别原则。
流程分析法也是最常用的一种风险识别方法。它是通过一系列的流程图展示项目活动实施的全过程,对过程的每一个阶段和环节逐一进行调查分析,运用风险源清单或风险档案表等确定项目风险的一种方法。这种风险识别方法基于风险的动态性特征,符合持续动态识别的原则。
以上两种风险识别方法易受风险源请单和风险档案表的影响,可能误导管理人员只注重风险源请单或风险档案表中的潜在问题,从而忽视了检查表以外风险的存在,使风险识别的全面性不足,以至留下隐患。
2.风险矩阵的风险识别方法
风险矩阵是在项目实施之前,对项目风险(风险集)进行系统识别并对项目风险(风险集)重要性进行评估,以便采取有效改进策略的一套系统性、预防性的结构方法。这种方法是美国空军电子系统中心(ESC. Electronic Systems Center)于1995年4 月提出的。1996年以来,ESC的大量项目都采用风险矩阵方法对项目风险进行识别与评估。为了改进风险矩阵方法的应用,美国的MITRE公司还开发了一套风险矩阵应用软件,能够自动交叉检查风险矩阵所分析出的风险等级。在ESC所提出的风险矩阵中,风险矩阵的栏目包括需求栏、技术栏、风险栏(risks)、风险影响栏、风险概率栏以及风险等级栏等。
项目风险是指某些不利事件对项目目标产生负面影响的可能性或可能遭受的损失。在风险矩阵中,风险是指采用的技术或工程过程不能满足项目需要的概率。风险矩阵识别项目风险的主要思想是通过考察项目需求与技术可能这两个方面,以此为基础来分析辨识项目是否存在风险,如果可采用技术不存在或不够成熟,从而不能满足需求则表明项目在这有方面存在风险。需求栏一般包括两个部分即高级操作要求和项目管理需求,前者如项目操作要求文件,后者如项目管理指南中所列出的需求方面。技术栏列出了根据项目具体需求可以采用的技术。
风险矩阵通过对项目需求栏与技术栏的比较来确定项目活动是否存在风险。但如何确定项目需求和项目技术,对于一个复杂的动态系统而言,却不是一件容易的事情。另外,该方法并不适用于大量的非技术类风险的识别,正因为如此,风险矩阵目前多用于工程技术类项目的管理,因为这类项目的需求与技术比较容易判断。
3.基于实施流程与分类结构法的风险识别矩阵
通过对风险识别的分类结构法、流程分析法以及风险矩阵方法的分析,根据项目实施风险的特征以及风险识别的要求,基于实施流程与分类结构的风险识别矩阵方法的原理可以这样进行描述:首先,对原始风险矩阵风险识别的部分进行重新构造,即风险矩阵中的项目需求栏作为矩阵的列向量,风险矩阵中的项目技术栏作为矩阵的行向量。然后,风险矩阵的列向量以项目实施过程的时间维度即不同实施阶段表示,风险矩阵的行向量以项目实施过程的风险类别特征表示。这样,行向量与列向量的交叉之处就是不同的风险类别特征在项目实施不同阶段产生的具体风险项。
这种风险识别矩阵主要考察项目实施的进程阶段与项目风险的类别特征两个维度,以此为基础来辩识项目实施的某阶段是否存在某种特征的风险,从而能够系统、持续地对不同类别的项目风险项进行动态识别。另外,由于项目风险识别的流程分析法与分类结构法都是比较成熟的方法,因而本方法在具体操作上也是可行的。风险识别矩阵见表1。
表1 基于流程分析与分类结构法的风险识别矩阵表
另外,利用矩阵分解的思想和方法,如果将项目实施阶段和风险特征进一步进行细分,可以深度挖掘不同层面的风险项。比如,对阶段1进一步细分为阶段11、阶段12、阶段13等,将风险特征A进一步细分为风险特征A1、风险特征A2、风险特征A3等,按照风险识别矩阵的原理,可以构造一个子矩阵,利用这个子矩阵能够对深一层次的风险项进行挖掘,这也是风险矩阵识别方法的又一大优势。风险识别子矩阵见表2。
表2 基于流程分析与分类结构法的风险识别子矩阵表
三、项目风险识别矩阵的运用
1.运用风险识别矩阵识别项目实施过程中存在的风险,应当依据下列的程序进行。
(1)成立专家小组。专家小组的任务是对项目实施过程中的风险进行识别。专家小组由管理咨询专家、项目实施单位相关人员和项目服务提供方的专业人员组成。专家小组人数一般为10人~12人,为了便于做出决策,以11人为最佳。
(2)提出初步风险清单。由专家小组成员分别单独就每一个风险类别特征在项目实施的每一个阶段可能引起的风险进行识别,然后以每个专家识别出的风险项为基础,再结合相关研究资料或其它类似项目的实践信息,按照风险项不重复的原则整理成初步风险源清单。
(3)确定项目风险源。基于初步风险源清单,按照专家意见法的原理,进一步征求各位专家的意见,当多位专家(6位)认为某风险项存在时,即确定该风险项为项目实施过程中的风险项。
2.按照上述风险识别程序,以人员特征为例,运用风险识别矩阵对人的因素在项目实施不同阶段引起的风险项进行识别,形成如下的风险源清单:
(1)项目规划阶段的风险项:决策者素质风险、管理者经验风险、信息管理能力风险等。
(2)项目合作联盟建立阶段风险项:信息收集能力风险、服务提供商选择风险、沟通风险、价格谈判风险、合同条款风险等。
(3)项目实施阶段的风险项:服务提供人员素质风险、服务接受者的素质风险、项目活动管理者的素质风险、领导支持风险、沟通风险等。
(4)项目总结评估阶段的风险项:领导重视风险、评估者的素质风险、信息收集风险、员工支持风险等。
四、结束语
项目风险管理是提升项目绩效的重要手段。目前,理论研究与实践中对项目风险识别方法研究重视不够。本文以流程分析和分类结构法为基础,对原始风险矩阵进行适当改造,提出基于项目实施进程和风险类别特征的项目风险矩阵识别思想和方法,运用该方法能够对项目风险进行系统、持续的动态识别,比较好的解决了项目风险识别的问题。
参考文献:
[1]朱启超等:风险矩阵方法与应用评述[J].中国工程科学,2003年1月:89-94
[2]洪锡熙:风险管理[M].暨南大学出版社,1999:28
识别与分类 篇4
地理国情监测是测绘事业科学发展的新战略, 地表覆盖信息作为地理国情监测的重要数据源, 是开展地理国情综合统计分析, 揭示经济社会发展和自然资源环境空间分布及内在关系的基础。依据高分辨率卫星影像数据采集的地理国情地表覆盖数据分为10个一级类, 部分要素要求细分到三级类;要求数据精度在5-10个像素以内;同时作为监测的基础数据, 要求数据采集周期要尽量缩短;不同于先建立解译样本的传统地表解译流程, 解译样本在外业核查的时候才采集, 内业进行解译时没有解译标志使用。以上种种要求, 使地理国情地表覆盖内业分类与识别在技术上和操作上均具有一定难度, 本文通过在研究区域开展地表覆盖内业解译试验, 对地理国情地表覆盖内业分类与识别的方法进行了初步探讨。
1 研究区概括及资料收集
研究区为成都市辖区及阿坝州都江堰市区, 如图1所示, 经济发达, 特别是成都在全国经济发展中占有重要地位。区域自然资源丰富, 森林和水利资源丰富, 气候适宜, 年均气温16-17℃, 岷江和青衣江贯穿境内、两岸以平原和河流冲积平坝为主, 东部地形平缓, 是成都平原的主体, 西部相对起伏较大。
研究区主要资料情况如下:
(1) 全色卫星影像地面分辨率为0.5米, 多光谱卫星影像地面分辨率为2米的World View-2卫星影像, 获取时间为2011年至2012年;全色卫星影像地面分辨率为0.6米, 多光谱卫星影像地面分辨率为2.4米的Quick Bird卫星影像, 获取时间为2011年至2012年。多光谱数据包括红、绿、蓝和近红外波段。
(2) 其他数据包括:1:10000地形图数据, 成图时间为2006年至2011年;高精度数字高程模型数据, 成图时间为2006年至2011年;其他专题数据资料。
2 地表覆盖内业分类与识别方案简介
文章所采用的地表覆盖分类与识别方案是以遥感正射影像数据为基础, 充分应用已有基础地理信息数据和地理国情要素数据, 采用专业软件自动分类与人工解译相结合的方式进行分类, 基本流程如图2所示。影像数据采用了融合数据和未融合数据两种形式;矢量数据包括1:1万基础地理信息数据, 以及人工采集的地理国情道路、河流等要素数据。
将采集到的国情要素中道路 (以路宽做缓冲区) 和面状居民地加入e Cognition软件中辅助进行交互式自动解译, 自动分类不易提取到的要素类别 (如园地、构筑物、人工堆掘地) , 则在自动解译的基础上, 以融合影像为背景, 进行人机交互判读解译。最后对分类的图斑进行合并、拆分、重构等编辑, 提取相关属性, 完成地表覆盖初步成果。
3 基于e Cognition的交互式解译技术
针对研究区的地理国情地表覆盖内业分类与识别的主要技术难点在于利用软件进行自动解译, 为了提高解译效率和解译精度, 文章提出一种基于e Cognition的交互式解译方法, 其技术流程如图3所示。其中关键技术包括分类特征选择、分类规则建立、规则封装与解决方案搭建、基于SVM的分类。
3.1 分割
图像分割是高分辨率遥感影像面向对象信息提取的前提和基础, 图像分割的质量直接影响后续分类与识别的精度。文章利用e Cognition进行多尺度分割, 并对融合后的影像、设置不同分割权重的未融合影像分别进行分割试验。在不使用融合影像分割的情况下, 全色分割权重设置为8, 多光谱各波段权重设置为1得到的分割分类结果较可靠。
3.2 基于特征的分类
面向对象的分类体系中, 对象具有丰富的信息, 包括:光谱特征、形状特征、纹理特征、拓扑特征等, 以及基于层次网络的影像对象之间的关系特征。针对本研究区的地理国情监测地表覆盖信息, 文章提出了满足生产要求的分类特征, 如表1所示。通过分类特征的有效组合开发分类规则集 (如图4右侧部分) , 确定影像对象和语义类层的关系, 将每一影像对象分类到某一具体的影像类别中。
3.3 规则封装与解决方案搭建
在基于特征的分类中, 不同的影像对应不同的解译特征参数, 为了提高解译效率, 文章采用e Cognition软件的规则封装方法, 利用特征参数变量, 建立快速操作模式界面, 搭建研究区分类与识别解决方案, 如图4所示。在这种快速操作模式的解决方案下, 解译人员可以不用考虑规则集, 只需在快速操作界面上输入本次解译影像相应的特征参数, 点击按钮便可进行对象分类。
3.4 基于SVM的分类
支持向量机 (support vector machine, SVM) 是20世纪90年代中后期在统计学习理论的基础上发展起来的一种最新的机器学习方法。如果仅从分类的角度来说, 支持向量机是在线性分类器的基础上, 通过引入结构风险最小化原理、最优理论和核方法演化而成。SVM在小样本学习、抗噪声性能、学习效率与推广方面都优于最大似然、神经网络等分类器, 能够有效地克服分类中样本不足带来的Hughes现象。在支持向量机中, 采用不同的内积核函数, 可以构造不同类型的学习机器。针对研究区域, 文章主要采用线性核函数K (xixj) =xiTxj构造学习机器, 在第一次分割和分类的基础上对影像对象进行二次分割后, 通过训练样本对影像对象进行分类。
4 实验结果及精度评价
4.1 单幅影像地表覆盖分类精度评估
精度评价中, 误差矩阵是一种描绘分类精度十分有效的方法, 用于表示分为某一类别的像素个数, 与地表实际检验为该类别数的比较矩阵, 通过误差矩阵可以科学的得到全局精度 (Overall Accuracy, OA) 、生产者精度 (Producer's Accuracy, PA) 、用户精度 (User's accuracy, UA) 以及kappa系数。
Kappa系数则作为分类精度评价的综合指标, 其计算公式如下, 其中aij为误差矩阵中对角线像素总和;ai为误差矩阵中第i行的像素个数总和;n为影像像素总数;k为矩阵列数。可以依据Feinstein提出的kappa系数分类标准 (表2) [1,2]来评价分类精度。
选择研究区域中融合影像数据, 经过e Cognition交互式分类与识别得到分类结果后, 在影像上随即选取评价点, 通过目视判读确定采样数据, 得到统计结果如表3所示。解译效果如图5所示。
4.2 多幅影像地表覆盖分类精度评估
在研究区选择十幅影像数据, 采用全色分割权重为8, 多光谱各波段权重为1的多尺度分割和e Cognition交互式解译得到分类结果的Kappa系数结果如图6所示。
5 总结和结论
通过研究表明, 利用本文提出的基于e Cognition的地理国情地表覆盖内业分类与识别方法, 在解译精度上能够满足“适中”的要求, 同时具有一定区域普适性, 在研究区域内均采用一个解决方案, 其解译精度均能够稳定在“适中”。该解译方法能够提高解译效率, 同时较少人工目视判读的主观性误差因素。通过利用融合影像和未融合影像分别解译, 认为融合影像的解译精度优于未融合影像, 但在e Cognition中对未融合影像采用全色分割权重为8, 多光谱各波段权重为1的多尺度分割后再分类, 其解译精度能够大大提高, 并接近融合影像解译精度。文章提出的方法在地理国情监测地表覆盖信息提取中具有一定的借鉴意义。
参考文献
[1]Feinstein A R, Cicchetti D V.High agreement but low Kappa:1.The problems of two paradoxes[J].Journal of Clinical Epidemiology, 1990, 43 (6) :543-549.
[2]Cicchetti D V, Feinstein A R.High agreement but low Kappa:2.Resolving the paradoxes[J].Journal of Clinical Epidemiology, 1990, 43 (6) :551-558.
[3]宫鹏, 黎夏, 徐冰.高分辨率影像解译理论与应用方法中的一些研究问题[J].遥感学报, 2006, 1:1-5.
识别与分类 篇5
危险废物分类、识别、监控一体化管理技术研究概述
研究运用环境统计信息系统(ESIS),建立黑龙江省典型危险废物的数据库系统,使其具备系统、完善的查询与追踪功能;提出危险废物易燃性、腐蚀性、反应性和毒性方面定量化的定义,建立基于危险废物成分分析基础上的分类体系,使危险废物的处理与处置具有良好的.可操作性;开发危险废物在线识别技术,促进对危险废物进行监管及预警的时效性和有效性;运用GPS、GSM、GPRS、GIS、计算机网络通信和数据处理等监控技术,实施对危险废物运输车辆的远程在线监控;提出危险废物收集、贮存、分离、运输、处理、处置、回收利用过程中的管理法律、法规,促进危险废物全过程管理的有效实现.
作 者:王忠伟 张彦涛 Wang Zhongwei Zhang Yantao 作者单位:王忠伟,Wang Zhongwei(黑龙江省环境监测中心站,黑龙江,哈尔滨,150056)张彦涛,Zhang Yantao(黑龙江省环境保护科学研究院,黑龙江,哈尔滨,150056)
刊 名:环境科学与管理 英文刊名:ENVIRONMENTAL SCIENCE AND MANAGEMENT 年,卷(期): 32(8) 分类号:X327 关键词:危险废物 分类 识别 监管 在线监控识别与分类 篇6
摘要:本文研究针叶植物数字图像自动识别分类的方法。根据针叶植物不同科(松、杉、柏科)和种叶片/叶小枝的形状特征差异设计了15个特征描述符,以适量样本检验这些描述符以及它们组合使用对于划分针叶植物科和种的有效性,并对这种有效性做评估和排序。实验表明,凹陷密度,凸包欧拉数、凸包面积与同参数三角形面积相对差等,对辨别松科植物有效;叶图斑长宽比、凸残差面积方差、凹陷密度、凹陷平均短长轴比等对划分杉、柏科植物有效。通过这些描述符,可以将至少34种针叶植物分为松、杉、柏3个科和17个种。用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。
关键词:针叶植物;图像分类;形状;数学形态学;特征频数
基金项目:国家自然科学基金项目(41071275)资助
中图分类号: TP391.41 文献标识码: A DOI编号: 10.14025/j.cnki.jlny.2016.06.020
植物数字图像自动分类是植物分类学领域备受关注的新技术“基于内容的图像检索”(Content-Based Image Retrieval, CBIR)是该技术的代表之一,通过把用于植物图像的CBIR软件植入手机等智能移动设备,有可能在野外对植物进行实时分类。已经出现了少量移动设备版植物图像分类/检索软件,如Nam等2005年开发的“三叶草”系统,可以根据植物叶轮廓图检索植物类;Belhumeur等2008年研发的改进型系统,可以查询植物图像与在线植物样本的相似性等。但由于专家知识植入图像自动分类/检索系统比较困难,这类软件目前能够正确辨识的植物种类比较有限,其他类似的CBIR系统还在不断完善中。
据检索,植物图像分类的研究主要集中于阔叶类植物。阔叶植物的属种远比针叶植物的丰富,这可能是它吸引较多关注的原因。另一方面,植物图像分类主要依靠植物叶特征,阔叶类植物的叶特征(包括叶形、叶缘、叶脉等)远比针叶植物的丰富,不同属种之间的特征差异比较显著和易于提取,使得阔叶植物先于针叶植物在图像分类领域取得了较大进展。例如基于叶片形状、基于叶脉和叶缘信息的植物图像分类。
与阔叶植物相比,针叶植物种属间的特征差异不够分明。根据Science Director、Springer Link Journals、中国知网等中外期刊论文数据库的检索,尚未检出针叶植物叶片/叶小枝数字图像自动分类方面的研究文献。本文主要根据松、杉、柏科植物叶片/叶小枝的形状特征差异,设计特征描述符;并以图像分类/分割方法检验这些描述符以及它们的组合,对于辨识不同科和种的针叶植物图像有效。
1 实验数据
研究中使用的植物叶图像样本来自野外自采集和中国植物图像库。野外自采集区域为上海市区和浙江天目山地區,采样设备为普通单反变焦数码相机。自采样本约占总样本数的90%。野外共采集样本近340个,包括了上海市绿地和天目山地区典型的针叶树种。表1列出了实验样本属种和数量。在描述符测试中随机选择其中180个样本构成训练集,其余160个为预留的测试样本。
2 方法
2.1 概述
本文的研究对象为松、杉、柏科植物,由于南洋杉科植物在上海绿化地很少见,仅采集到“智力南洋杉”和“大叶南洋杉”两种,故合并到杉科中。依据松、杉、柏科多种植物叶的表观特征和图像特征,设计了能够将三者及其具体种分开的图像特征描述符。它们中的大多数依据形态测量学设计,能够定量描述叶形特征;还有一小部分根据特征频数统计值设计,如邻域暗细节密度等,用于描述叶片/叶小枝凹陷的密度。通过在这些描述符组合的特征空间里做图像监督分类,可以评估各描述符及其组合的有效性。工作流程见图1。
2.2 针叶图像预处理
针叶植物叶图像预处理的有效算法包括平滑化、维纳滤波、锐化、大津法阈值计算和二值化、形态学开启和闭合、凸(凹)噪声面积过滤、Gaussian滤波和边缘检测等。实验表明,对针叶植物叶图像有效的预处理包括:降噪,去毛刺,闭合裂隙、填补凹陷等,它们能给出比较完整的叶片二值图,以便特征提取和描述符值计算。图2以雪松为例说明该过程。
2.3 描述符设计
形状是叶片图斑的主要特征。常用的形状特征包括图斑面积、图斑的短长轴比、凸包面积、凸残差特征、形状系数、边缘密度、分维等。针叶植物叶形通常具有如下特征:松叶形简单,针状,常2针、3针或5针一束,叶节点无分叉;柏枝叶复杂,分支明显,单叶小而呈鳞片状(或鳞叶、针叶混生);杉多为线形叶等。可以用凸包或凸残差、几何形状、细节频数等描述这些特征,设计出适用的描述符。表2给出部分经实验证明有效的描述符,所有描述符都归一化到值域[0, 1]。
2.4 描述符测试和精度评估
图3和表3~6给出以决策树(DT)评估描述符组合分类精度的实例。如针叶科分类时,随机选择8个描述符构成初始特征向量,训练样本数为180,其中松、杉、柏科植物样本分别为55、61、64。训练中DT自动选择对样本适应性较好的5个描述符构成决策树t(图3);随后以t对测试集图像分类,并以混淆矩阵评估分类精度。
3 描述符的设计依据
表2中的描述符设计基于叶图斑的某些图像特征,例如凸残差、图斑凹陷、图斑面积对称性、图斑密度对称性、图斑几何图形轴对称性、图斑与同参数几何图形的相似性等。下面分别展开讨论。
3.1 凸残差
凸包(convex)是将图斑边界的凸顶点连线形成的外多边形。用凸包减去原图斑得到凸残差(convex deficiency)。实验表明,根据凸包和凸残差设计的描述符对于表征针叶植物叶轮廓形状和叶小枝的分布规律、密度和复杂程度等有效。基于凸残差的描述符有:(见表2)。图4以侧柏、墨西哥落羽杉、白皮松为例,显示这类描述符参变量的提取方法。表7为基于凸残差描述符的分割阈值范例。
(a),(d)分别为龙柏和水杉叶小枝二值图,真元素个数即叶小枝图斑面积;(b),(e)为暗细节二值图,SE均为3×3菱形;(c),(f)为凹陷尺寸大于阈值的图斑,可以通过测量其中面积较大的主凹陷的密度、短长轴比、形状系数等,获得有参考价值的分类特征。由图可见,龙柏的暗细节尺寸较小、细节短、分布密度(单位面积细节个数)较大;而水杉的暗细节尺寸较大、细节狭长、分布密度较小。
3.2 圖斑凹陷
暗细节是叶图像上尺寸较小的暗调元素或叶图斑的孔洞(凹陷),可以通过形态学“低帽变换”提取。它是用闭合操作消除比结构元素(SE)尺寸小的暗细节,获得背景估计b;然后从b中减去原图像I就能获得暗细节集da。
3.3 叶图斑对称性
叶图斑对称性通常以叶小枝某些统计值的上下对称性表述。可用的统计值包括面积、密度和几何图形轴长等。面积和密度的统计对象主要为叶图斑、凸包、凸残差等的二值图。表达式的主要形式为差比值,比如 (见表2)。几何图形轴对称性利用了与叶图斑有关的几种几何图形,如外接矩形、内接圆等。
3.4 图斑与同参数几何图形的相似性
典型的松、杉、柏叶小枝的外轮廓与某些几何图形接近,比如松与三角形、杉与矩形/椭圆、柏与扇形/椭圆相像。利用叶图斑凸包二值图与同参数(高/长轴、宽/短轴等)的几何图形面积的差比值,表征叶图斑凸包接近这些几何形状的程度,可能用于划分不同科的针叶植物,表9列出部分基于图斑对称性的描述符的性能和范例阈值。这些描述符包括(见表2)。
4 结论
本文研究针叶植物叶片或叶小枝图像按科和种分类的方法,设计了14个新的描述符,并评估了各自和组合使用的有效性。上述实验和统计分析支持如下结论:(1)基于凸残差、图斑凹陷、图斑对称性和图斑与同参数几何图形相似性设计的描述符对于识别针叶植物科和部分种有效。(2)适当数量和不同功能的描述符组合,有助于改善分类精度。(3)用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。由本实验还可以看出,要划分更多的属种还有待进一步增加植物样本,并继续深入描述符和分类空间设计等方面的研究。本文的分类方法主要依据的是植物外形特征,而未严格遵守植物学分类规则,比如中国植物志中将日本冷杉划分为松科,而本文根据其形状特征将其划分到杉中,这一点望读者理解。
参考文献
[1]Geng SL (耿生玲). Tian F (田芳). The principle and realization of picture sharpening and smoothing[J]. Journal of Qinghai Normal University(Natural Science) (青海师范大学学报(自然科学版), 2003(03):62-65
[2]Zhu J (朱静),Tian XJ (田兴军),Chen B (陈彬) et al. Computer Recognition System of Plant Leaf-shape[J]. Chinese Bulletin of Botany (植物学通报), 2005,22(05):599-604
作者简介:田超,华东师范大学地理科学学院,在读硕士,研究方向:遥感图像分析与空间数据挖掘。
通讯作者:周坚华,硕士,华东师范大学地理信息科学教育部重点实验室,副教授,研究方向:城市与生态遥感。
网络出版时间:2016-3-10 17:07:45
识别与分类 篇7
关键词:深海摄像,高清,生物,识别,分类
1 系统介绍
该系统由硬件和软件部分组成。硬件部分主要包括光纤通信系统, 水下测控系统。系统框图如图1。
视频采集模块将两路高清相机的视频数据通过千兆网交换机经光纤收发器传给上位机进行实时监控。水下测控系统根据上位机控制命令打幵或关闭水下相应的高清摄像机、照明灯和高度计等水下设备, 并通过水下传感器定时采集系统电压, 水下温度, 漏水情况, 离底高度, 和拖体姿态, GPS等状态信息, 并将此状态信息通过网络转串口模块转换成网络数据通过网络将其反馈给上位机。
软件部分设计, 在windows系统下使用visual c++语言, vc6.0环境下开发。上位机界面如图2所示。
该软件实现了两路视频图像和传感器数据的实时显示, 两路视频的录像, 历史录像回放, 抓图。
2 传统的深海视频监控系统与改进的深海视频监控系统
传统的视频监控系统采用模拟摄像头, 图像分辨率低, 采用串口通讯, 传输速度慢, 而改进的深海高清视频监控系统采用德国imagesorcing高清网络摄像机, 使得图像分辨率提高到1600*1200, 采用千兆网交换机, 每个端口可达2000Mbps的传输速度。通讯方式采用基于tcp-ip的socket网络通讯, 代替传统的串口通讯, 上位机作为服务器端, USR-TCP232-E45作为客户端, 进行通讯。使得数据传输速度大大提高。对于软件中抓图后获取的的图片, 能从中提取到生物的轮廓根据轮廓信息进行识别和分类。
3 识别和分类
3.1 形状提取
由于海洋生物形状各异, 所以本文利用形状特征进行识别。目前基于形状的描述方法有基于轮廓的方法和基于区域的方法, 基于区域的描述方法抗噪能力更强, 更完整的描述了生物的形状信息。常用的基于区域的形状描述方法有:形状的面积, 几何矩, 正交矩, 傅里叶描述算子等。其中正交矩可以构造任意的高阶矩, 包含形状的信息全面, 但是在计算高阶矩需要将图像归一化到单位圆内, 计算量大, 傅里叶描述子的很好地描述形状的信息, 但是也要进行归一化处理。由于生物在运动过程中形态会发生变化, 比如旋转, 随着摄像机的运动会发生放缩, 而Hu不变矩具有旋转, 放缩, 平移不变性, 所以本文采取Hu不变矩对于生物性状进行描述。
3.2 形状提取过程
首先对输入的视频进行帧提取, 本文选取的视频源来自2008年深海摄像的资料, 本文选取具有代表性的七种常见的海洋生物进行识别与分类。帧提取结果如图3。
因为深海环境复杂, 原始图像往往含噪声, 不清晰, 所以要对原始图像进行去噪和图像增强等预处理, 预处理后进行灰度化和二值化, 进行连通区与检测, 找出面积周长最大的连通区域, 即为目标生物的轮廓, 绘制出轮廓后, 进行区域填充, 即可得到生物的形状。以下以鱼的形状提取为例, 图3为原始图像, 图4为一条鱼的形状提取过程。
4 形状特征描述
4.1 Hu不变矩
几何矩是由Hu (Visual pattern recognition by moment invariants) 在1962年提出的, 定义如下:
(1) (p+q) 阶不变矩定义:
对于灰度分布为f (x, y) 的图像, 其 (p+q) 阶矩定义为
(2) (p+q) 阶中心矩定义为:
归一化中心矩:
归一化的中心矩具有旋转, 平移, 缩放不变性。Hu利用二阶和三阶中心矩构造了七个不变矩
4.2 Hu矩提取结果
如表1所示。
5 分类
5.1 BP神经网络分类
BP (back propagation) 神经网络是一种按误差反向传播算法训练的多层前馈网络, 能学习和存储大量的输入/输出模式映射关系, 无需事前描述这种映射关系。针对Hu矩提取特征值的分类采用3层BP神经网络, 其中输入层7个节点, 对应Hu矩的7个特征值, 隐含层5个节点, 输出层7个节点。网络结构见图5。
5.2 支持向量机分类
支持向量机 (Support Vector Machine, SVM) 是Corinna Cortes和Vapnik等于1995年首先提出的, 它在解决小样本、非线性及高维模式识别中表现出许多特有的优势, 并能够推广应用到函数拟合等其他机器学习问题中。支持向量机原理图如图6。
支持向量机将向量映射到一个更高维的空间里, 在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。建立方向合适的分隔超平面使两个与之平行的超平面间的距离最大化。其假定为, 平行超平面间的距离或差距越大, 分类器的总误差越小。
5.3 分类结果
本文采用以上两种方法进行分类, 训练样本选取200个, 测试样本选取70个, 分类结果如图7。
5.4 结果分析
图7中, 红色代表预测分类结果, 蓝色代表实际分类结果, 两者不重合即为分类错误, 重合则为分类正确, 采用BP神经网络分类的正确率为82.85%, 而SVM分类的正确率为92%, 原因是BP神经网络结构简单, 但进行分类时具有不稳定性, 因为每次训练的时候选择的阈值不同。而支持向量机是以统计学理论为基础和结构风险化最小化为原则, 从而保证了机器学习具有良好的泛化能力。所以分类效果由于神经网络。
6 总结
目前对于形状差异较大的生物基本能实现正确的分类。但是由于水下复杂的环境使得生物目标轮廓提取不够准确, 对识别有一定的影响。此外, 海洋生物种类繁多, 形态各异, 基于矩的形状特征描述得方法还不够全面。目前只能识别形状差异较大的生物, 对于形状相似的容易造成分类错误, 还须进一步研究。
识别与分类 篇8
1 基于机器视觉的工件特征识别方法
1.1 机器视觉检测特征及图像阀值分类方法
机器视觉分类识别技术主要应用于工业领域, 用来提取产品的形状特征, 这种特征提取也被称之为对分割区域的描述。特征提取主要通过利用数学公式或特征描绘子等方式, 对分割区域的形状属性进行表达和描述。特征提取的关键环节在于图像分割, 图像分割实际上完成的组成区域像素集合的划分, 即将其划分为区域内部和区域外部。对区域内部进行形状特征提取, 主要包括傅里叶描绘子、拓扑描绘子、矩描绘子以及几何描绘子等内容, 对区域外部进行形状特征提取, 主要包括边界傅立叶描绘子、边界几何表示、Hough变换表示、B样条表示等内容。图像特征的提取需要借助分割方法, 图像分割方法主要有区域提取法、边缘检测法和灰度阀值法三种, 最常用的就是灰度阀值法, 即根据图像灰度值的分布特性来确定形状特征的阀值, 然后以阀值作为门限再对图像进行分割[1]。
1.2 机器视觉分类识别技术特征选择的平台设计
确定阀值方法, 完成特征选择后, 便可以对待分类目标图像进行采集, 程序会对采集后的图像进行自动分割, 并选择相应的特征对目标图像加以计算, 最终将计算结果显示出来, 以供选择。特征选择主要按照两个基本方法来进行, 一个是直接选择法, 具体操作如下:
式中, xi1, xi2, , xid表示n个原始特征中的任意d个特征, 从获得的n个原始特征中任意选择d个特征x1, x2, xd, 便可以求得判断J的值。
另一个是变换降维法, 该种方法为了能够使判断J取最大值, 要对n个原始特征进行坐标转换, 然后再取其子空间, 目标特征是通过x向子空间投影而获取的[2]。
2 基于机器视觉的工件特征分类方法
2.1 基于机器视觉的模板匹配算法
模板匹配算法是将样本模式集中在一起, 各样奔都能够成为标准模板, 将待测样本与这些标准模板进行比较, 从这些标准模板中找出与待测样本最接近的标准模板, 待测样本便归于此类。模板匹配算法在原理上遵循了近邻准则, 应用比较简单、而且比较容易实现, 是目前机器视觉进行分类识别的首选方法。但是模板匹配算法也存在很大的缺点, 无论是计算量还是系统资源开销等比较大, 因此, 有必要对其进行改进, 使模板匹配能够更好地应用于工业产品的在线识别。在此, 提出了改进型的模板匹配算法, 以便进一步提高模板匹配的计算效率。基于机器视觉的快速模板匹配算法, 对于分类识别的计算总量应满足以下公式:
计算总量=标准模板数×搜索位置数×相关计算量
式中, 标准模板数表示的是样本集中后的标准图像模板数量, 搜索位置数表示的是某一标准模板相关计算的位置数, 相关计算量是根据改进后模板匹配的效率来确定的。模板匹配算法的改进实际上遵循的是分层搜索的思想, 大大缩短了图像模板在实时图像上所消耗的时间, 也使得分类识别的运算时间得以降低, 而且能够达到在线识别的要求[3]。
2.2 基于机器视觉的神经网络分类器
神经网络结合了生物脑的若干特性, 对其进行了人工模拟, 基于神经生物学建立起来的神经网络分类器实际上是由大量神经元构成的非线性动力系统, 通过非线性映射来整体各变量之间的关系, 借助阀值和权重来对图像特征进行分类。基于机器视觉的神经网络分类器不仅不会对数据分布提出附加要求, 还能够有效解决非线性评价问题, 因此被引入识别领域并被广泛应用。但是这种分类器也存在着一定的缺陷, 例如学习算法比较复杂, 无法计算隐藏单元的误差, 因此有必要对神经网络分类器进行改进。鉴于神经网络分类器依照的是BP三层前馈神经网络的基本原理, 对其进行改进, 实质上就是要加强BP三层前馈神经网络的设计, 在设计中应注意以下问题:其一, 样本集中的训练样本要能够出图像特征空间整体分布的代表性;其二, 在训练过程中应注意对学习结果进行实时识别;其三, 应增加神经网络的层次以降低误差;其四, 应增加隐藏节点的数目来提高分类器的识别精度[4]。
3 结论
综上所述, 机器视觉分类识别技术在工业领域的应用越来越广泛, 已经成功取代了传统人工检测的方法。现阶段, 分析和研究机器视觉的工件特征识别与分类方法, 对机器视觉分类识别系统的构建具有重要的理论指导意义,
参考文献
[1]潘武, 张莉彦, 徐俊成.基于机器视觉的工件的在线检测[J].组合机床与自动化加工技术.2012, 14 (7) :75-77.
[2]管经纬, 周虎, 杨慧斌.基于机器视觉的工件自动分拣系统的研究[J].机械工程师.2014, 15 (8) :18-20.
[3]朱代先.基于双目视觉的工件定位与抓取研究[J].计算机测量与控制.2011, 13 (1) :92-94.
识别与分类 篇9
关键词:模式识别,中药,质量管理,指纹图谱
中药不被国际所接受,主要原因是中药的成分不清、药效不明、质量不可控。当前推广的指纹图谱(finger-print)技术有效地运用了全面质量管理的理念,采用现代分析技术,利用UV、IR、HPLC、GC、MS等方法获得中药不同个体的化学成份信息,能对中药复杂体系特性做出科学的表达,进而进行进一步的分析和研究[1]。中药的指纹图谱相当复杂,人工判断很容易影响结果的准确性。将其与图谱解析和模式识别技术(pattern recognition)结合,再利用数学的思想和方法对该类数据进行特征提取,进而对药材进行分析、判断,实现从定性到科学的定量研究[2,3,4,5]。
黄丽萍[6]运用多元数据法聚类方法对11 种植物品种按照固有科属进行了准确归类,补充了传统聚类分析方法的应用。徐永群、黄昊、周群[7]用径向基函数人工神经网络法预测了43个黄芩样本的产区;类似地,李雨、李骁[8]等用基于人工神经网络方法进行中药性判别研究。
相比之下,中成药(Traditional Chinese Medicine Patent Prescription)的分析和鉴定工作比单一药材进行分析、判断更加困难,中成药是以多位中草药为原料,经制剂加工制成各种不同剂型的、大量生产的中药制品,所以中成药的化学成分甚为复杂。 中成药的药效是多种成分协同作用的结果, 而不仅仅是其中某几个有效成分的个别功效[9],鉴定工作不能只针对几种成分。因此中成药的鉴定和检测工作需要更系统的理论依据和严谨的技术路线。如何系统、全面地利用和解释中成药的指纹图谱,进而对药品质量进行整体监测和管理,成为中成药全面质量管理和监测的重要工作。
1 质量鉴定技术路线设计
中成药的成分较多,有效成分不十分明确。质量鉴定流程的目的是通过对数据进行科学合理的筛选与比较,进而鉴定判别产品的质量,并比较其稳定性、一致性。
鉴定时首先要排除数据中大量微量和无效信息的干扰。主成分分析( Principle component analysis, PCA)是一种将多个变量化为少数几个综合新变量的多元统计分析方法。其中心思想是将统计数据降维,因此可以排除众多化学信息相互重叠,剔除冗余信息,更直观地看到数据的结构。分析流程先对数据进行主成分分析,合理地提取代表样本特征的有效信息。主成分分析计算步骤如下。
1) 计算相关系数矩阵
在式中,rij (i,j=1,2,…,p)为原变量的xi与xj之间的相关系数,其计算公式为
2) 计算特征值与特征向量
首先解特征方程|λI-R|=0,通常用Jacobi求出特征值λi(i=1,2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…≥λp≥0; 特征值越大,主成分贡献率相对越大。
3) 计算主成分贡献率及累计贡献率,主成分zi的贡献率为
累计贡献率为
主成分提取完成后,进行分类和质量鉴定工作。首先中成药的指纹图谱信息具有“整体性”和“模糊性”的特点;其次假设没有研究对象的先验数据,中成药的质量信息也是未知的。因此实验需要一种探索性的、无指导的分析过程。聚类分析( Cluster analysis, CA)满足这种分析要求,聚类分析将一组数据按照本身的内在规律较合理地分为几类,并不需要先验的经验。这就能降低主观判断所造成的误差,使数据分析结果更具客观性。所以鉴定流程主体部分采用聚类分析方法对提取筛选的有效信息进行分析,进行样品分类与质量鉴定。
样品聚类通常称为Q型聚类分析,其出发点是距离矩阵,用样品点之间的距离来衡量样品间的相似性程度。实验就是计算品类间的相似性,根据相似程度大小把样品归类。
设d(xi,xj)是样品xi和xj之间的距离,一般要求它满足下列条件。
1) d(xi,xj)≥0,且d(xi,xj)=0↔xi=xj;
2) d(xi,xj)=d(xj,xi);
3) d(xi,xj)≤d(xi,xk)+d(xk,xj)。
在聚类分析中,有些距离不满足3),在广义的角度上仍称它为距离。经过比较,实验采用欧氏距离,欧氏距离是对二维平面和三维空间距离的推广。其表达式为
而类与类之间的距离采用平均距离计算。树合并的选择方法是决定层次聚类算法性能的主要因素。类平均距离的思想同等地看待每个数据点在簇间距离计算中的贡献,同样不需要先验的知识的指导,这样可以解决算法对噪声点的敏感问题。
设Dpq表示树Gp和Gq类平均距离计算公式如下:
假设聚类分析结果能为有监督的模式识别提供先验信息。验证部分则可以采用成熟的有监督的模式识别方法——自组织神经网络法(Self-Organizing Maps Neural Network, SOM)。SOM网络的优点是可以实时学习,网络具有自稳定性,无须外界给出评价函数,能够识别输入向量空间中最有意义的特征,抗噪音能力强等。由于这些特征,采用SOM网络进行验证,非常适合成分复杂且不稳定的中成药分类鉴定,如图1所示。
SOM 网络能将任意维输入模式在输出层映射成一维或二维图形,并保持其拓扑结构不变。网络的结构,分为上下2 层,下层为输入层,上层为输出层,输入层中的神经元节点数量与其包含的变量数一致,其功能是获取数据。输出层神经元构成一维或二维网格,表示数据模式识别或聚类分析的结果。采用SOM 网络方法验证
综上原理和方法,确定了中成药标准分类、鉴定流程的技术路线如图2所示。
2 案例:六味地黄丸的分类与质量鉴定
中成药包括丸、散、膏、丹各种剂型,六味地黄丸是中药方剂和中成药的统称,由六位中药材(熟地黄、山茱萸、山药、泽泻、丹皮、茯苓)组成,其中熟地黄为君药,故名为六味地黄丸[10]。按照上述拟定的标准技术路线,以六味地黄丸为案例,进行质量鉴定。
2.1 数据采集及预处理
实验的六位地黄丸的采样分别来自6个国内知名生产厂家。九芝堂、仲景、修正药业使用浓缩丸的生产工艺;999药业、同仁堂、仙河药业采用水蜜丸生产工艺。数据来源为中国科学院长春应用化学研究所。
指纹图谱采集了样品的质谱数据,得出质谱图,质谱图纵坐标表示原子或离子的相对丰度,横坐标表示相对原子质量(无机质谱)或离子的质荷比(m/z)(有机质谱)。根据实际情况,实验结果横坐标取值为59—400,共对六个厂家149个样品取样。再将所得数据结构转化为149×342的数学矩阵,xi(i=1,2,3,…,149)表示样品,yj(j=1,2,3,…,342)表示纵坐标指标值。
数据预处理部分的目的是消除由于数据变换的幅度和范围以及数据分布的非正态性对数据分析结果产生的影响。设计采用z-score函数(零-均值规范化),进行数据标准化操作。
2.2 主成分分析
观察矩阵数据,纵列大部分指标为零,表示谱图上无峰,即为无效率信息,提取有效数据和简化数据是工作的必要任务。经过计算,提取了累计贡献率为80%的前14个主成分信息,代表样品的整体信息。数据化为149×14的新矩阵。图3给出了贡献率较大的前10个特征向量表征在观测量总方差中所占的百分数(explained),其中前3种主成分的方差贡献率均在10%以上。
2.3 系统聚类分析
利用系统聚类分析方法实现样品的分类,其分类结果如图4所示。
聚类过程首先将149个样品各划成一类,然后每次将具有最小距离的两类合并,合并后重新计算类与类之间的距离,这个过程一直继续到所有样品归为一类为止。通过对聚类树的样品追踪观察,样品最终大致聚为六类。六个厂家中,九芝堂、修正、仲景和同仁堂各自聚类效果较好,可推断其质量较为稳定。其中生产浓缩丸的九芝堂,仲景和修正药业的样品之间距离小,能较好地聚为一大类。初步说明浓缩丸的质量稳定,相似度高,质量具有一致性。而生产水蜜丸的999,、仙河和同仁堂的同类聚类效果较差。
2.4 SOM神经网络验证
按照一定的拓扑连接关系和邻域函数,经自组织算法多次训练后,输出成不同节点代表不同的分类模式,输出神经元在空间中构成二维网格。实验经过调试,最终将训练次数设在500次。
利用MATLAB程序,创建函数,得出149个样品输出值,结果绘成12×12的二维网格,形象的展示验证输出结果,如图5所示。
注:A—仲景, B—999, C—九芝堂, D—同仁堂, E—仙河, F—修正 A/C/F网格区域为浓缩丸
分析自组织神经网络检验结果,在生产工艺上,以A,C, F代表的浓缩丸较好地交叉相聚在一个区域,说明浓缩丸在大类上成分稳定、高度相似。采用水蜜丸制作工艺的厂家中,只有仙河与999的样品在一个区域,与同仁堂相聚较远。整体上水蜜丸聚类效果比浓缩丸的差。在品牌上,样品九芝堂、修正,仲景和同仁堂聚类效果好一些。利用神经网络做的分类效果相似于主成分聚类的效果,从而验证了实验分析的准确性。说明设计的技术路线能达到复杂中成药分类与鉴定的要求,具有准确性和一致性。
3 分析与结论
实验结果已经表明浓缩丸的成分与水蜜丸相比,成分稳定,质量更具有一致性。究其原因是传统中药剂型水蜜丸只是将药材粉碎,用蜂蜜或水等作为黏合剂制成的。而浓缩丸的标准现代生产工艺是由三部分组成——浸膏、药粉和科学提取的有效成份,因此最大限度地提纯、保留有效成分。而且水蜜丸制造过程,质量还会受药材原材料的质量、厂家独特制作配比等方面的影响,成分差异较大,因此不同厂家的产品成分不同,不具有一致性。
浓缩丸的生产工艺与现代技术结合,机械标准化生产,产品质量稳定,在质量鉴定过程中,样品也能较好地聚为一类,也说明了中药的机械化生产便于药材的全面质量管理。
实验结果还证明了如下结论。
(1) 指纹图谱提供的数据的具有系统性、特征性和稳定性,能够科学地用于数理统计,能充分反应样品质量信息。
(2) 在中药复方质量控制方面,理化方法结合,使判别流程更加合理,增加可信度,能为中成药的质量控制和监测提供了理论依据。
上述设计路线还存在一定缺陷,不能解决化学成分和药效相关性的关系,假设分析的中成药中含量在千分之一以下的某种微量成分,却具有主要疗效。在主成分分析中其成分特征可能被剔除掉,遗漏相关信息。这种情况还需要进一步分析和探讨。
参考文献
[1]刘文,蒋世云.中药指纹图谱研究与应用进展.中国药房,2011;(19):1819—1822
[2]王旋,郝海平,王广基.化学计量学在中药复方整体研究中的应用研究进展.中国天然药物,2009;(3):234—240
[3] Tistaert C,Dejaegher B,Heyden Y V.Chromatographic separationtechniques and data handling methods for herbal fingerprints:a re-view.Anal Chim Acta,2011;690(2):148—161
[4] Cordella C B Y,Leardi R,Rutledge D N.Three-way principal com-ponent analysis applied to noodles sensory data analy-sis.ChemometricsIntell Lab,2011;106(1):125—130
[5] Boutemedjet S,Ziou D,Bouguila N.Model-based subspace cluste-ring of non-Gaussian data.Neurcomputing.2010;73(10—12):1730—1739
[6]黄丽萍,左坚,纪从兰.多源数据聚类分析在植物分类和中药鉴定中的应用研究.中国药房,2009;(30):2360—2362
[7]徐永群,黄昊,周群,等.红外指纹图谱和聚类分析法在赤芍产域分类鉴别中的应用.分析化学,2003;(1):5—9
[8]李雨,李骁,薛付忠,等.基于人工神经网络的中药性判别研究.山东大学学报(医学版),2011;(1):57—61
[9]于礼斌.现代中成药科学管理的探讨.中国卫生事业管理,2011;(12):126—128
识别与分类 篇10
随着web2.0的快速发展, 社交网络逐渐从各个方面影响着中国网民。微博成为了社交网络中社交工具的典型代表。网民使用微博在互联网上的活动主要是获取信息与发布信息, 发布的信息含有自己对某事物的看法、观点、感知等个人情感。
它们主要以文字, 表情符号 (新浪微博默认表情及标点符号) 形式出现。通过用户之间的互动传播 (一个微博用户具有双重角色, 即博主与粉丝) , 这种社交网络媒体具有传播速度快, 传播范围广等特点。因此对微博情感识别与分类就显得尤为重要。
对微博文本的情感进行识别与分类, 不仅能让企业及时了解客户需求寻找到潜在的客户群体, 通过实时、准确地评估其情感。能够获得客户市场反馈信息及客户的消费习惯, 帮助企业进行有效的需求管理及企业战略调整, 从而快速应对市场变化, 提高企业竞争力。还能帮助政府部门实时监控民众情绪, 对负面情绪及时采取措施, 防止不法分子企图通过微博平台传播谣言, 以此保证社会的和谐稳定, 政府了解民意, 为制订国家政策提供参考。
同时也能协助医生分析心理障碍者, 及时掌握患者情绪波动, 准确对患者病情进行有效的对症下药。避免了患者不能准确描述病情, 而带来的不相关治疗。
因此对微博情感进行研究具有重要的理论与实践意义。文章意在为政府或企业等利用到微博情感分析数据的领域提供基础。
鉴于自主采用Java语言开发的新浪微博的情感识别与分类系统, 对中文微博的情感进行识别与分类研究。系统使用爬虫技术[1], 抓取微博的文本内容, 然后进行分词, 去停用词, 文本规范等预处理操作, 再抽取情感特征, 对文本情感识别与分类, 最终输出分类结果。
一、相关工作
1.1文本获取及预处理
对微博数据资源的获取有两种形式, 一种是用户以普通文本形式直接在系统前台相应位置输入待分析的文本, 系统可以自动进行情感识别与分类;另一种是用户以微博文本URL形式输入, 系统对用户输入URL连接采用网络爬虫技术抓取微博正文内容。
网络爬虫结构先将用户输入URL作为爬虫起点, 通过web协议 (主要是HTTP协议) 采集页面, 使用多线程或并列技术获取网页数据信息, 网络爬虫结构也提供了链接过滤模块 (过滤掉不符合URL规范的链接) , 页面数据库模板 (存储已经爬取到本地的原始页面数据, 以备预处理阶段建立索引使用) 。
为了提高分类的准确率, 减少获取文本内容不必要干扰, 对文本进行预处理操作十分必要。系统的预处理操作主要包括:
1.文本规范化处理, 判断待处理的文本是否含有由两个#组成的话题标签, 若有则删除两个#及它们之间的文字内容。
2.使用正则表达式判断微博文本是否含有以下三种含@微博标签, 若有将它们删除 (1) 以@开头, 以:结尾 (2) 以@开头, 以空格结尾 (3) 以回复@开头以:结尾。
3.判断英文词语是否含有感情色彩, 删除不必要的英文词语。
4.用中文描述替代含有感情的“?”和“!”去除一些标点符号。
5.使用得到普遍认可的支持Java开发语言的ICTCLAS分词工具分词, 去除停用词。
1.2文本特征抽取
文本特征抽取[2,3]是从文本中选取一部分能够反应其内容信息的特征词汇并计算其特征权重。特征抽取的主要目的是为了降低向量空间的维度, 消除无关特征的噪音, 通过选择可区分性强的少量特征来提高分类器的分类精度和效率。常用的特征选取方法有:文档频率、信息增益法、期望交叉熵等。文档频率[4] (Document Frequency) 一种简单的特征约减技术, 常用自动特征选择, 通过设置目标特征的文档频率阈值来进行特征的抽取。DF是含有该目标特征的文档数与所有文档数的比值, 可表示为
信息增益法[5]是指文本包含该特征项与不包含该特征项时的信息熵的差值, 根据所获信息增益的多少筛选有效特征, 已成为机器学习领域应用较为广泛的特征选择方法。信息增益法计算公式可以表示为:
其中, k为文档分类数, p (cj) 为类别cj的概率, 为特征n出现的概率, p (n) 为特征未出现的概率, 为未出现的特征属于cj的概率。
由于当特征数目较少时, 使用该方法得到的数据稀疏, 分类结果会不理想, 因此本文首先对预处理后待分析的文本里出现的每个词计算其信息增益, 设置一个阈值, 抽取特征词, 按照信息增益值降序选择特征项组成特征向量。[6]
期望交叉熵[6] (Expected Cross Entropy) 反应了文本类别的概率分布与在出现了某个词条的情况下文本类别的概率分布之间的距离。
词条的交叉熵越大, 对文本类别分布影响也就越大。所以选CE最大的K个词条作为最终的特征项。
期望交叉熵计算公式:
为了提供特征词抽取的时间效率, 针对微博的数据量很大的特点, 使用期望交叉熵和TF-IDF求方差的方法抽取情感特征词。
TF-IDF函数为:Wi, j=TFi, j*IDFi (4)
其中, Wi, j是Dj中词条i的权重, TF是词条i在文本Dj中出现的次数, IDF是逆文档系数, N表示待分析文本中所有文档数, ni表示出现特征项n的数量。
1.3文本情感识别与分类
采用基于朴素贝叶斯主客观句识别方法[7]和支持向量机的分类方法[8,9,10,11]对文本分类。朴素贝叶斯方法是一种基于事件概率简单而误差率较小的分类方法。基本原理是:在事件相对独立的条件下, 事件A在事件B发生的条件下的概率且与事件B在事件A发生的条件下概率是不相同的。及文档A属于Bi类概率表示为
系统应用思想:对有已知类别集合S (x1, x2, …, xn) , 求在待分类项出现的条件下, 集合中各个类别出现的概率, 哪个类别的概率值大, 就认为待分类项属于那一类别。并将对每个特征项主客观句的条件概率计算结果输出, 作为支持向量机分类器的输入值。
系统的工作流程图如图1所示。
二、实验分析
使用第二届自然语言处理与中文计算机会议所提供包含4000条已经标注是否含有情感色彩的中文微博语料, 含有13252个句子, 且主观句中又表明了所属具体情感类。情感类别分为7个类别, 分别是:喜好、安乐、惊奇、厌恶、悲哀、愤恨和恐惧。
选择这些数据作为系统测评数据主要是与系统测试结果进行比较, 核实评价实验结果的召回率 (R) , 准确率 (P) , 性能评价指标F值。求解公式如下所示:
系统将实验测评数据首先进行预处理, 对其进行规范化、分词去除停用词、抽取情感特征, 然后采用朴素贝叶斯方法, 使用其公式计算结果来识别主观句, 支持向量机方法先将抽取的特征词转换成向量形式, 再将向量化后的文本放到向量机的模型中, 最终输出分类结果。通过计算支持向量机的情感分类方法召回率达到74.4%, 准确率高达63.76%, F值达到0.6534.
实验中采用准确率, 召回率, F值测评指标, 对常见的情感特征抽取方法[16]实验结果进行了对比, 见表1, 通过对比朴素贝叶斯和支持向量分类方法对主客观句的识别结果, 得出结论:本实验中对主客观句的识别朴素贝叶斯方法比支持向量机方法的实验结果更好。因为支持向量机方法准确率虽更高, 但召回率较低。
实验结果见表2。对已识别的主客观句, 我们采用支持向量机的一对一的多步分类方法及一对其余的一次分类方法进行情感分类。
实验结果见表3。实验结果表明:一对一多步情感分类方法效果优于一对其余一次分类。因为一对其余分类方法可能出现重叠现象或因不可分类现象而引起数据集的抖动。因此实验最终选择支持向量机的一对一多步分类方法。
三、结语
微博作为网民在互联网主要活动之一, 逐渐从各个方面影响着人们, 网民带有情感的言论对各行各业都有着不可估量的使用价值。因而对微博文本的数据分析研究有一定的社会意义。
通过查阅文献发现基于朴素贝叶斯识别主客观句的方法及基于机器学习支持向量的方法有较高的精度。而由于针对中文微博的研究大部分是理论性的研究, 因此本文通过构建系统, 将基于朴素贝叶斯的识别主客观句个方法及支持向量机的方法的研究思路实践化。实验结果对企业、政府及广大网民均有重要的社会意义。
展望:
1.后期会打破仅在初步解决微博文本的情感识别和分类问题的研究, 接下来会投入对用户的图片信息, 链接的视频声音信息进行研究。
相关文章:
建筑安全玻璃使用规范02-11
浅析建筑物拆除爆破的安全控制探讨02-11
《建筑物的防雷与安全用电》电子教案02-11
建筑安全玻璃使用规定02-11
地下与地面建筑物的安全控制措施有哪些?02-11
土木施工中绿色建筑材料的使用02-11
剖析建筑使用电气质量监管论文02-11
建筑工地的安全用电02-11
建筑起重机械使用登记02-11