识别标志(精选十篇)
识别标志 篇1
交通标志识别是图像处理和模式识别领域的一个研究热点, 广泛应用于无人驾驶汽车、车载导航等领域, 具有很强的实际应用价值[1]。虽然交通标志的图形结构较为简单, 但对自然环境下的交通标志进行识别, 面临着遮挡、噪声、光照多变性、形状失真等多方面的严峻挑战, 因此交通标志识别是模式识别领域的重点研究内容之一[2]。
本文采用三种常见的机器学习方法对交通标志进行识别, 分别是卷积神经网络 (CNN) 、BP神经网络和支持向量机 (SVM) 。通过在同一个交通标志样本集上进行实验, 根据识别率及运行时间对实验结果进行对比分析。
2 三种机器学习方法简述 (Three kinds of machine learning methods)
2.1 卷积神经网络 (CNN)
卷积神经网络是近年发展起来, 并引起广泛重视的高效识别方法, 由于其能够直接输入原始图像, 避免了对图像的复杂前期处理, 成为众多科学领域的研究热点[3]。
卷积神经网络的基本结构一般包括两层:卷积层和子采样层。每一个卷积层后有一个用来求局部平均与二次提取的子采样层, 这种特有的两次特征提取结构减小了特征分辨率, 减少计算时间。此外, 由于一个映射面上的神经元共享权值, 因而减少了网络自由参数的个数[4]。局域感受野、权值共享和子采样, 是卷积神经网络实现位移、缩放、扭曲不变性的三种方法。
2.2 BP神经网络
BP神经网络是一种按误差逆传播学习算法训练的多层前馈网络, 能学习和存贮大量的输入—输出模式映射关系, 是目前应用最为广泛的神经网络模型之一。
BP神经网络的学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播的方向为输入层→隐层→输出层, 每层神经元的状态只影响下一层神经元, 在输出层获得响应, 若实际输出与期望输出不符, 则进入误差反向传播阶段。误差反向传播阶段是从输出层经过隐层向输入层反传, 并逐层修正权值, 不断提高正确率[5,6]。两个过程的交替进行, 是网络误差函数达到最小值, 从而完成信息提取和记忆过程。
2.3 支持向量机 (SVM)
支持向量机是通过最大化分类间隔或边缘提高分类性能, 主要针对小样本情况, 通过训练一组称为支持向量的特征子集, 使得对支持向量机的线性划分等同于对整个数据集的分割, 既降低了运算复杂度, 又保证了分类识别的精度[7]。SVM使用核函数进行预测, 可以避免BP算法中的局部极值和过学习问题, 同时具有很强的学习能力和泛化性能, 利用优化方法得到的结果是全局最优解, 能有效加快训练过程。
3 仿真实验及分析 (Simulation experiments and analysis)
本文的实验数据来源于GTSRB数据库, 如图1所示, 是德国交通标志识别基准, 专门用于交通标志识别研究的数据库。从该数据库中随机选取500个 (共10类) 图像为训练样本, 再随机取100个 (每类10个) 图像作为测试数据, 其中所有样本大小均为28*28。
3.1 卷积神经网络识别交通标志
由于卷积神经网络可直接处理原图像, 并不需要对原始图像做过多的预处理, 所以本实验直接将28*28大小的图片输入到卷积神经网络中。同时, 根据卷积神经网络的结构特征, 确定卷积核大小、网络层数、批量训练样本数、神经网络迭代次数、卷积层的特征图数为本实验中的重点。
(1) 卷积核大小及网络的确认
卷积核是进行卷积运算时的权值矩阵, 行列均为奇数, 且为对称的, 如3×3、5×5、7×7。卷积核的作用是提取输入图像的特征, 因此提取出的特征与卷积核的大小息息相关。若使用3×3的卷积核, 网络的层数相对增加, 系统工作时间增加;若使用5×5的卷积核, 网络层数可为4层;若使用7×7的卷积核, 虽然网络结构变小, 但是提取的特征不具有代表性。因此, 本实验采取5×5的卷积核大小。
(2) 批量训练样本数、迭代次数及特征图数的确定
由于本实验的训练样本较多, 因此将全部训练样本分成若干组, 每组单独训练, 批量训练样本的个数以5的倍数递增, 根据实验, 批量训练样本数越少, 正确率越高, 所以本实验的批量训练样本数为5。在此基础上, 对迭代次数进行测试, 可知迭代次数越多, 识别率越高, 且时间花费较长, 综合时间与识别率, 本实验设置迭代次数为20。通过设第一个及第二个卷积层的特征图数的取值范围均为[7,8,9,10], 依次组合, 根据实验的最高识别率得出最优组合。实验结果如图2所示。
根据图2可知, 当第一个卷积层的特征图数取4, 第二个卷积层的特征图数取8时, 该卷积神经网络的识别率能达到最高为93%, 且运行时间为5min。
3.2 BP神经网络识别交通标志
(1) 图像预处理
预处理的目的是提高图像对比度, 增强有用信息。本实验的预处理操作是灰度转换 (自适应阈值法) 及二值化。
(2) 特征提取
特征提取是通过降维获得最能反映样本本质的低维特征。本实验采用粗网格特征提取。首先采用最临近插值法将样本缩放至70×50, 再将样本划分成10×10大小的网格, 统计每个网格中像素值, 形成35维的特征向量。
(3) BP神经网络的设计
BP算法可应用于四层或更多的前馈网络, 却更易陷入局部极小点而不收敛, 因此选用三层BP网络, 同时选用有动量因子介入的训练方法, 避免陷入局部极小值。
对于激励函数的选择, 通常采用对数S函数、双曲正切S函数及线性函数。MATLAB中提供三种传递函数与上述激励函数相对应:logsog函数、tansig函数和线性purelin函数。鉴于本文实验输出, 选用tansig函数。
迄今为止, 对隐含层节点数目的选择仍无法用完备的理论解决, 但是要在满足精度要求下尽可能紧凑神经网络的结, 即尽可能减少隐层节点数。一般情况下, 隐层结点个数根据具体训练结果确定。
对于训练函数的选择, 本文采用traingdx函数, 是在动量法的基础上集合自适应学习速率法, 自动调节学习率, 能够有效缩短训练时间。
设置本实验的最大迭代次数1000, 期望目标1e-5, 动量因子0.95。实验结果详见表1。
上述实验结果表明, 本实验所建立的BP神经网络在该测试集上的最高识别率为79%, 且识别时间为22min50s。
3.3 支持向量机识别交通标志
为解决交通标志的多分类问题, 本文将多个两类SVM分类器组合在一起实现多类分类, 即1-a-1的多类分类方法来解决手写体数字的分类识别问题。
由于SVM是一种基于核的机器学习方法, 核函数和核参数对SVM的性能影响较大, 本文采用高斯核函数 (RBF核函数, 也称径向基函数) 的SVM分类器, 具有较强的学习能力。
目前常用的核参数选择方法是网格搜索法, 利用二维网格每个节点作为一组候选核参数, 然后利用交叉验证方法获取各组核参数的验证精度, 选择验证精度最高的核参数作为最优核参数[8]。启发式算法能够更快的寻找到全局最优解, 而不用遍历所有参数点, 即遗传算法参数寻优和粒子群优化算法参数寻优。遗传算法参数寻优是将训练集进行交叉验证下的准确率作为遗传算法中的适应度函数值;粒子群优化算法参数寻优是计算智能领域蚁群算法外的另外一种基于群体智能的优化算法, 不用进行选择、交叉、变异的操作。
本实验的训练集是依次将每个样本图片像素存至一行, 形成500×784的Train Data, 同理形成Test Data, 在Train Data上进行训练并调整SVM参数直至最优, 再对Test Data进行分类识别, 获得最佳识别率。在同一训练集上分别进行网格搜索法、遗传算法、粒子群优化等参数寻优的对比验证, 结果如表2所示。
实验结果表明, 网格搜索法优化过程非常慢, 达不到实时处理要求。采用粒子群优化算法参数寻优, 在训练时间相似的情况下, 识别率能到达最高水平。
从上述表格可以看出, SVM的训练时间总体均长于BP神经网络算法和CNN算法, 识别率最高为卷积神经网络, 所以, 在500张训练样本、100张测试样本的数据上, 卷积神经网络在识别率及识别时间上均能达到实验最优效果。
4 结论 (Conclusion)
本文首先简要介绍了交通标志识别的发展, 并采用卷积神经网络、BP神经网络、支持向量机在GTSRB数据库上进行对比试验, 并对结果进行分析。在相同样本的情况下, 基于粒子群寻优的SVM方法虽然识别率比较高, 但是一般针对小样本二分类问题, 多分类时运行时间较长;BP神经网络虽然运行时间较SVM短, 但是识别率较低;卷积神经网络识别时间比BP神经网络和SVM均短, 识别率均高于BP神经网络和SVM。综上所述, 卷积神经网络具有训练时间短、识别率高的优势, 因此本论文对今后卷积神经网络的研究具有很大的意义与价值。
参考文献
[1]房泽平, 等.基于特征颜色和SNCC的交通标志识别与跟踪[J].交通运输系统工程与信息, 2014, 14 (1) :47-52.
[2]王洋.一种基于模板匹配的交通标志识别方法[D].吉林大学, 2013.
[3]V.Rehrmann, R.Lakmann, L.Priese.A Parallel System for Realtime Traffic Sign Recognition[C].Peking, China, Proceedings International Workshop on Advanced Parallel Processing Technologies95, 1995:72-78.
[4]彭岳军.道路交通标志检测与识别技术研究[D].华南理工大学, 2013.
[5]张潘潘.道路交通标志检测与识别算法的研究[D].山东大学, 2012.
[6]郝梦琳.交通标志识别方法的研究与实现[D].太原科技大学, 2013.
[7]王跃明, 等.三维人脸识别综述[J].计算机辅助设计与图形学学报, 2008, 20 (7) :819-829.
[8]Sheila Esmeralda Gonzalez-Reyna, Juan Gabriel Avina-Cervantes.Eigen-Gradients for Traffic Sign Recognition[J].Mathematical Problems in Engineering, 2013.
[9]García-Garrido Miguel A, Oca a Manuel, Complete visionbased traffic sign recognition supported by an I2V communication system[J].Sensors, 2012, 12 (2) :48-69.
总结沉积环境的识别标志 篇2
资勘111宋杰摘要:判别沉积环境涉及很多反面的知识。沉积环境分析是对具指示环境的成因标志进行综合分析,然后与沉积模式进行比较,从而恢复古代沉积环境的方法。成因标志是指具有成因意义、能反映其形成条件的各种特征。概括起来为物理、化学和生物的3个方面标志。
关键词:沉积环境沉积构造地球化学标志生物标志
正文:沉积构造是相判别最重要的依据,也是最直接的证据,因此,沉积环境分析中特别强调沉积构造的观察与描述。此外沉积环境的判别标志还包括地球化学标志、生物标志和粒度标志等。
一、沉积构造标志
根据其形成时间划分为:原生沉积构造与次生沉积构造。
原生沉积构造:沉积物沉积时、沉积后不久、固结前形成的构造。能反映沉积时的沉积介质类型和能量条件。是判别沉积相(沉积环境)的重要标志。
次生沉积构造:在沉积物压实或成岩过程中生成的沉积构造,它反映成岩环境。
根据沉积构造的成因性质可分为三类:
1、物理成因的沉积构造
2、化学成因的沉积构造
3、生物成因的沉积构造
物理成因的沉积构造:在流体流动、重力等物理因素作用下而产生的沉积构造(原生)。其包括:层面构造(波痕、细流痕剥离线理、冲刷痕等)、层理构造(水平层理、平行层理、交错层理、递变层理、均匀层理、复合层理等)、准同生变形构造、暴露构造等。
化学成因的沉积构造:由结晶、溶解、沉淀等化学作用形成的沉积构造,其中,大多数是在沉积物压实和成岩过程中生成的, 属于次生沉积构造。其包括:结晶构造(鸟眼构造、示顶构造、晶痕)、压溶构造(缝合线构造)、增生与交代构造(结合构造、葡萄状构造)生物成因的沉积构造:生物活动或生长而形成的构造(原生)。其包括:生物遗迹构造与生物生长构造等。
二、物理化学标志
沉积地球化学在古环境分析中的应用主要包括元素地球化学和稳定同位素地球化学两个方面。
三、生物标志
生物化石不仅可以用来鉴定地层的地质年代,而且是进行沉积环境分析的重要标志.。根据对现代沉积环境中生物的观察,生物群的分布及其生态特点严格受环境控制,在一定的沉积环境内均有与之相对应的特殊生物组合。因此,利用地层中的生物化石的组合面貌和生态特特征可以分析其环境的盐度、古水深、底层性质和海水浊度等。
四、粒度标志
沉积物的颗粒大小称为粒度。粒度分布特征可以反映沉积介质的流体力学性质和能量,故是判断沉积环境的水动力条件的重要物理标
志,而且对于油气沉积储层的评估也有重要的意义。
结束语:通过对这些沉积环境的识别标志的学习,有利于为阐明地球表面环境变迁和大地构造演化等重大问题提供依据,为查明沉积矿床和油气资源的分布提供资料和理论依据。
道路交通标志识别研究现状 篇3
一、交通标志的有关知识
(一)路标概述
路标是图形、符号与颜色的结合,有的包含少量文本,主要起指示、提示和警示作用。交通标志是一种常见而且比较规范的人工路标。在道路上,我们可以看到各种各样的交通标志。它们用图案、符号和表达特定的意思,提醒驾驶员和行人注意附近环境。常见的交通标志主要有警告、禁令和指示标志等三类。
(二) 基于路标的先验知识
路标不仅要考虑对比度对视认性的影响,还要考虑颜色所能表达的抽象概念。图形符号信息在辨认速度和辨认距离上比文字信息要优越。分辨力受诸多因素的影响,包括细节尺寸、细节间的间隔以及观察距离影响。因此交通标志可以从颜色、形状和尺寸和安放位置四个方面来细述:
a) 警告标志:黄底、黑边、黑图案(仅“叉形符号”除外)。
顶角朝上的等过三角形(仅“叉形符号”除外)。
其设置地点与到危险地点的距离有关,警告标志
到危险地点的距离,应根据计算行车速度确定。
如受实际地形限制,可酌情变更。但其设置位置
必须明显,并不得少于安全停车视距。
b) 禁令标志:白底、红圈、红斜杠、黑图案、图案压杠(仅“解除禁止超车”、“解除限制速度”这两种除外)。
圆环形、八角形(仅“停车让行”一种)、顶角向 下的等边三角形(仅“减速让行”一种)。
设于距禁制事项附近的适当地点,一般需设置在最醒目的地方,并随标志设置目的而改变。
c)指示标志:蓝底,白图案。
内部背景形状分为圆形或者方形。
一般设于行车道的入口处。
二、交通标志识别过程
交通标志识别一般分为检测和识别两个模块。检测阶段一般是利用交通标志的色彩和形状特征检测出可能包含交通标志的区域,然后将感兴趣的区域进行大小不一规则化,在识别阶段进一步判定交通标志区域的有效性及其含义。
(一)检测
检测方法可分为其于颜色的检测和其于形状的检测两类。基于颜色的检测方法是最为基本的检测方法。这类方法又可分为三类:(1)彩色阈值分割法,在这类算法中,色彩空间的选择是很重要的。最直观的方法是选择RGB空间,直接通过设定的阈值进行分割。(2)基于神经网络学习的方法。为克服空间转换的非线性以及噪声的影响,可采用基于神经网络学习的方法。(3)基于视觉模型的方法。为克服各种视觉条件的影响,通过视觉模型对交通标志进行检测。
虽然基于颜色的检测方法具有直接聚焦的特点,但由于受到外界环境影响比较多,仅仅依靠颜色信息不能精确检测出交通标志的区域,而利用图像梯度的基于形状的方法能对以上事件进行有效的补充。因此,两种方法结合,是交通标志检测的最适合的办法。基于形状的方法又可分为基于边缘轮廓和基于模板的匹配方法。
(二)识别
在检测到可能包含交通标志的区域上,一般还要将区域的大小不一转化为固定的大小并采取其他的一些预处理技术来消除噪声、运动模糊、光照等影响,然后采用分类器技术进行识别。在识别技术中常用的方法有:(1)最近邻域方法。它的基本思想是根据类别之间的最近距离对待识别模式进行分类。(2)径向基函数方法。径向基函数网络的实质降维映射,因而在交通标志的分类中获得应用。(3)多层决策树分类法。采用多层结构的决策树分类,比采用单分类器分类能加快处理速度、提高分类结果的精度,而且通过将相关特征分解到各层简化分类器的设计。(4)神经网络方法。神经是一种非线性的映射,在模式识别方面,神经网络方法和传统的方法比较,具有较强的容错性,能够识别带有噪声或变形的输入模式,具有很强的自适应学习能力,采用并行分布式信息存储预处理,识别速度较快。(5)匹配投影法分类。能过离线对测度集进行匹配投影,找到能代表交通标志的一组基元。只需和由基元组合而成的模板进行匹配。(6)支持向量机分类。是一种基于数据库的优化分类模型,左传于结构风险最小化原理,具有结构简单、泛化能力强等特点。(7)句法分类。对于复杂性的目标,只提取它的数值特征构成特征向量,往往不能全面对其进行描述,这是因为这些数值特征对目标进行描述和识别的句法模式识别方法,在交通标志识别中也是人们关注的重点之一。
三、展望
以后的研究将更多地从人的视觉特征、视觉模型出发去考虑,充分利用交通标志的颜色,并应当注意更多地采用智能方法来解决问题,另外,采用智能方法后还可以考虑将检测与判别这两个环节有机地结合起来。
(作者简介:荣慕华(1977-),女,辽宁省宽甸县人,研究生,讲师,沈阳理工大学,研究方向:计算机技术。)
基于颜色规格化的交通标志识别 篇4
道路交通标志识别(Traffic Sign Recognition,TSR)是“智能交通系统(Intelligent Transportation System,ITS)”ITS研究领域中尚未解决的难题之一,也是难度较大的实时图形识别问题之一[1]。TSR系统主要包括两个基本技术环节:首先是交通标志的检测与定位,其次是交通标志的判别。本文讨论的是后者。
目前TSR研究中存在的不足之处主要有:识别对象单一、样本数少,大多数实验对象都是标准图、针对实景图的很少;以灰度图为对象的多、以彩色图为对象的少。实际拍摄的道路交通场景中的交通标志存在着严重的颜色失真和不同程度的几何失真,而交通标志的几何形状就是由颜色界定的。由于失真,不同颜色的灰度值之间存在着严重的交叉现象(例如红色与蓝色),因此,彩色实景交通标志转换为灰度图像之后必将进一步扩大几何失真。实际上,颜色辨识本来就是人类智能活动中最频繁最基本的重要内容之一[2,3]。人类视觉系统对颜色非常敏感,人眼能区分的颜色可达35000多种;而尽管图像的灰度有256级,但人眼能分辨的灰度只有20多级[4]。彩色图像比灰度图像能提供更多的视觉信息,因此,充分利用图像中的颜色信息来进行图像处理应该比利用灰度信息更为有利。采用智能方法来解决TSR问题是一个很有价值的方案,人们已经做了一些有益的尝试[2,3,5]。神经网络具有很强的非线性映射能力、容错能力和柔性的网络结构,在模式匹配、模式分类与模式识别等方面具有良好的应用价值。本研究采用神经网络群构成多级分类器,针对实景图判别问题进行了大量的实验研究。
1 交通标志特征及其样本
交通标志是一种专供道路交通使用的标志,通过其特有的形状、颜色、图符等将某些特殊的道路交通信息及时地传递给道路交通的使用者。
1.1 分类特征
与交通安全有关的交通标志主要有三大类,即禁令标志、指示标志和警告标志。本研究使用了23个标准图形样本,均为24位彩色位图,如图1所示(本文的交通标志图像均采自日本,与我国的交通标志有所不同)。其中,1~11#为禁令标志共11个;12~17#为指示标志共6个;18~23#为警告标志共6个。另外,本研究还使用了531个实景图样本,这些样本采自于70个场景、包含了20种标志。其中,禁令标志有11种计347个,指示标志有3种计86个,警告标志有6种计98个。图2给出了20种实景标志的示例,其中只有10种与图1所示的23个日本交通标志标准图是相同的,其余均不相同。
1.2 颜色特征
相对于交通标志的背景区域,交通标志的颜色大都是鲜艳醒目的,与周围区域形成了较强的颜色对比。由图1可知,交通标志共有五种基本颜色:红、蓝、黄、黑、白。但图2所示的实景图却未能将这些颜色鲜明地体现出来。这主要是由于这531个实景图的光照条件比较复杂造成的。这些实景图包括从早晨到黄昏的各个时段,晴天、阴天、多云等多种天气状况,正光、背光、阴影下、强反射等多种光线,从而使得实景图在颜色上与标准图有很大差别,具有严重的颜色失真。
2 基于颜色规格化的交通标志识别模型
以图1所示的23个标准图作为训练集、以图2所示的531个实景图作为测试集,分别采用BP网络和M-SVMs网络(多类支持向量机)构成的两级智能分类器进行粗分类(具体方法参见下文)的实验结果如表1所示,识别率数据取自15组不同实验(隐单元数为2~61,其余参数相同)的平均值。可见,识别结果并不理想。尽管M-SVMs总体上明显优于BP网络,但禁令标志的平均识别率反而略低于BP网络。由以上实验以及本研究所做的其它实验可知,颜色复杂性造成的颜色失真是影响识别率的主要因素。因此,本研究提出了一种简化问题的新方案:先通过颜色规格化方法简化颜色信息,然后再利用两级智能分类器实现分类。图3给出了基于颜色规格化的交通标志识别模型。
2.1 颜色规格化的智能方法
颜色规格化的目的是大幅度简化交通标志图像颜色信息的复杂性,然后再用于交通标志识别。可以为交通标志的每种颜色定义一个颜色规格,5个颜色规格就构成了一个简单的颜色规格库,它是建立颜色规格化模型的基础。颜色规格化的实质在数学上就是复杂空间到简单空间的非线性映射:24位彩色位图的16,777,216种颜色构成了一个复杂的原始空间,而仅有5个元素的颜色规格库就是简单空间的模型。于是,只要在预处理时将实景图中失真的颜色重新规格化为上述5种颜色,就可以达到大幅度简化颜色信息的目的。
考虑到BP网络具有高度的非线性映射能力和较好的容错能力,且回想速度快,因此,本研究采用BP网络实现了颜色规格化。由于BP网络本身固有的局限性,使得BP网络具有一个特点:待解决问题的规模越大,则网络的收敛速度越慢、分类与识别的效果越差;反之,待解决问题的规模越小,则网络的收敛速度越快、分类与识别的效果越好。因此,可以将一个复杂任务分解为若干个简单任务来解决,以达到扬长避短的效果。交通标志的颜色规格化本身就是一个典型的小规模分类问题[5],具体实现方案如下。
交通标志5种颜色的分类构成了一个五分类问题,每个颜色样本仅由一个像素点构成。于是,BP网络颜色分类器的结构为:输入单元为3个,分别对应于一个像素的RGB值;输出单元为5个,每个输出单元对应于一种颜色。这样就构成了分别对应于5种颜色的5个输出向量,如表2所示。可见,由于样本非常简单,因而使得网络结构也非常简单。这样就有利于扬长避短,充分发挥BP网络的优势。于是,BP网络就实现了从16,777,216种颜色构成的复杂空间到仅有5个二值向量(分别对应5种颜色)的简单空间的映射。
在进行颜色规格化之前,首要问题就是建立一个正交性良好的颜色规格库模型。该规格库由5个RGB向量构成,分别代表5种基准颜色,作为表2所示的BP网络的5个有效输出向量各自对应的颜色映射值。表3给出了两个可行的颜色规格库示例。表3中的第一列“序号”为颜色规格库中的元素序号,分别与BP网络颜色分类器的输出单元序号相对应。第二列“颜色”为交通标志的基本颜色,每种颜色为规格库中的一个元素。表3中的数据为各元素的RGB向量值,两个颜色规格库中只有黄色的RGB向量值不同。
此外,另一个非常重要的问题就是训练集样本的采集。训练集既要尽量保证信息的广泛性,又不宜过大。本研究采用了多个训练集分别进行了实验。这些训练集分别由100~225个颜色样本构成,每种颜色的样本数相同,其中均包括23个标准图中每种颜色的1个样本。其余样本取自于531个实景图。考虑到BP网络具有较好的容错性,故同一种颜色的样本采集可以只考虑颜色差别相对较大的那些像素。因此,颜色规格化所需的训练集规模并不大。
颜色规格化的过程实际上就是用训练好的BP网络(颜色分类器)对一幅图像逐点进行扫描回想——即逐点实现上述映射、逐点进行颜色规格化,以便最终实现一整幅图像的颜色规格化。BP网络的映射过程非常简单,即其回想过程。
2.2 交通标志的分类
TSR问题是一个大规模识别的复杂问题。为将TSR问题的判别环节简化,可以采用神经网络群构成多级智能分类器,将判别环节分解为两大步骤来进行,以达到扬长避短的效果。首先用第一级智能分类器进行粗分类,即确定待识别对象是属于禁令标志、指示标志、警告标志中的哪一类;然后再用第二级智能分类器进行细分类,即确定这个待识别对象是哪一种具体的交通标志。交通标志的分类问题依然可以采用BP网络实现[5]。第一级智能分类器由单个BP网络组成,用于实现交通标志的三分类功能;第二级智能分类器由三个BP网络组成,分别用于实现三类交通标志中具体标志的识别。当经过训练的两级智能分类器输入一个识别对象时,第一级分类器首先确定该对象所属的类别,然后按所属类别将该对象送至第二级分类器中相应的分类器,去完成最后的识别任务并将识别结果输出。以上过程如图3所示。
3 实验结果
3.1 颜色规格化
需要进行颜色规格化的交通标志图像共有554个,即图1所示的23个标准图和图2所示的531个实景图。当训练集为175个样本、BP网络的隐单元数为6、训练精度为0.01、隐层和输出层的学习因子均为0.6时,采用表3所示的1#规格库进行颜色规格化的效果如图4所示。
为便于比较,这里给出的是实景图与标准图相同的10种标志,且实景图的几何失真很小。其中,第一行为规格化前的实景图,第二行为实景图规格化后的对应图形,第三行为规格化前的标准图,第四行为规格化后的标准图。可见,规格化后的实景图(第二行)与规格化前的标准图(第三行)已经非常相似了。实验表明,利用BP网络的非线性映射能力实现颜色规格化,具有很好的实时性和鲁棒性。例如,隐单元数在4~20范围内、学习因子在0.1~3.0范围内选择时,颜色规格化的效果基本相同。
3.2 交通标志分类
两级智能分类器的4个BP网络均采用单隐层结构,训练精度均为0.01。综上所述可知,4个BP网络的输入单元都是20×20×3=1200个,而输出单元的个数则不同。第一级分类器的输出单元为3个,用于粗分类。第二级分类器中各个判别器的输出单元数取决于实景图相关类别样本的种类数:禁令标志为11个,指示标志为3个,警告标志为6个。
以规格化后的23个标准图作为训练集,以规格化后的531个实景图作为测试集,采用BP网络进行粗分类的平均识别率均达到了100%。该数据不仅仅是通过一组颜色规格化的样本集、而是通过17组不同的颜色规格化样本集得到的。这充分说明采用颜色规格化方法后,BP网络分类器具有良好的泛化能力。同时,无论是对于网络结构参数或网络训练参数、还是对于交通标志的颜色失真或几何失真,这种方法都具有很好的鲁棒性。例如,隐单元数可在2~100范围内选择,而学习因子可在0.1~10范围内选择。
4 结束语
本文提出了一种基于BP网络非线性映射能力的颜色规格化方法,大幅度简化了实景图颜色信息的复杂性,对实现识别率为100%的粗分类起到了关键作用。本研究的另一个重要特点是颜色规格化与交通标志分类均采用BP网络实现,而没有采用任何其他方法。当然,这并不是唯一的选择,也未必就是最佳选择。其重要意义在于这两部分的BP网络应用有一个共同特点:就是先将问题简化后再进行处理。这充分说明,只要进行合理的预处理,BP网络依然具有一定的实用价值。总之,从发展的观点来看,由于模式识别是人类的一项基本智能活动,因此,未来的机器识别技术中,智能方法必将逐渐占据主导地位。不过,目前的智能方法还比较“幼稚”,不能指望它们现在就能解决比较复杂的问题。因此,“简化复杂问题、改进传统方法、基于颜色信息、采用智能方法”将是今后解决TSR问题的必由之路。
摘要:采用神经网络群构成的分类器解决实景交通标志识别问题时,识别率普遍较低。分析可知,颜色复杂性造成的颜色失真是影响识别率的主要因素。遵循“简化复杂问题、基于颜色信息、采用智能方法”的基本思路,提出了一种新的解决方案:先通过颜色规格化方法将交通标志中复杂的颜色信息简化为5种基本颜色,然后再利用两级智能分类器实现分类。采用BP网络实现了颜色规格化;实验表明,这种方法具有很好的鲁棒性。
关键词:道路交通标志识别(TSR),颜色规格化,神经网络,图像检测,分类器,机器识别
参考文献
[1]朱双东.ITS中的图象测量及其处理技术.2000年计量测试学术交流会论文集,2000:512-516.
[2]Escalera Ade la,Armingol J M,Mata M.Traffic sign recognition and a-nalysis for intelligent vehicles.Image and Vision Computing,2003,21(3):247-258.
[3]Zhu Shuangdong.The Classification of Traffic Sign Base on Fuzzy Char-acteristics Training set.Fifth World Congress on Intelligent Control andAutomation(WCICA2004),Conference Proceedings of WCICA,2004,6(6):5266-5270.
[4]张引,潘云鹤.彩色汽车图象牌照定位新方法.中国图像图形学报,2001,6A(4).
识别标志 篇5
基本信息
【英文名称】Type, main dimension, material and marking of mechanical seals 【标准状态】被代替 【全文语种】中文简体 【发布日期】1986/8/5 【实施日期】1995/10/1 【修订日期】1994/12/27 【中国标准分类号】J22 【国际标准分类号】21.140
关联标准
【代替标准】GB 6556-1986 【被代替标准】GB/T 6556-2016 【引用标准】GB/T 1804,GB 10444
适用范围&文摘
识别标志 篇6
关键字:慈善机构 视觉形象 标志设计
一、标志
虽然这个世界上有五千多种语言,但有了图像符号即所谓的标志,交流便基本没有了障碍,人们会凭靠着经验来识别设计语言的含义。简单来说,标志是用一种特殊文字或图像组成的大众传播符号。
慈善机构标志设计是慈善机构存在的视觉符号代表,其在设计领域具有鲜明的个性特征,区别于商业机构的标志,以更好的吸引公众的视觉,激发公众的内心感知,引发公众对于慈善机构的关注为责任,标志是观众之间无需语言、无需文字的最好沟通载体。
标志形象正是基于标志这种特殊符号而产生的表现形式,标志形象符号传达信息,并且给予人们一种综合的感性印象,人们对标志形象信息交流的方式、形象信息含义的感受和理解各有不同,这就构成了标志形象的多元化感受,但基于慈善组织这一特殊的组织机构形式,更应该找寻人们共知共感的图形图像来表现与表达。
二、慈善机构标志设计的表现手法
慈善机构作为慈善事业的组织依托,国家社会保障的得力外援,是慈善事业赖以存在、发展的机制保障。在我们身边,从天灾人祸到贫困饥饿,慈善组织常常以各种不易察觉的方式存在,无微不至地协助政府解决社会问题。
慈善机构的功能性决定了慈善形象的特殊性,基于这种特殊性,标志设计的图像寓意就显得尤为重要,所以其表现的手法一般分为以下几种:
1.表象性表现
表象性表现是忠于客观存在的自然形态,是对表现对象进行通俗的概括与提炼的一种手段,是人类集体潜意识的集中表现。
国际奥比斯组织是一个致力于为世界各国盲人和眼疾患者恢复光明的国际性慈善机构,它的宗旨是“使全球失明者重见光明”。可以看到,其标志(图1-1)便以机构致力方向的核心——眼睛,为设计主体,将眼睛抽象化,生动的表现了组织机构的特性与特征。
国际人类栖身地组织是位于佐治亚州的阿梅里克斯的一个通过慈善和自助相结合的方式为低收入人群建造住房的慈善机构。正是机构的主要特性与建造住房相关,标志(图1-2)正生动地表现了房屋与人之间的关系,层叠的人物形象,牢实的房屋结构,让人对于组织的职能一目了然,使人印象深刻。
联合国儿童基金会于1946年12月11日创建,其目的是满足战后欧洲与中国儿童的紧急需求,如今它的工作扩展到满足全球所有发展中国家儿童和母亲的长期需求。基于儿童与母亲的形象,标志设计(图1-3)便以一位女性身份的角色将一个孩童高高举起,在地球的背景下深深怀抱的形象来体现机构的职能特性,同时展现了机构致力于实现全球各国儿童的生存、发展、受保护和参与的权利的目标,希望全人类参与创建一个保护儿童的环境,寓意与图形完美融合,提高了观众的认知度。
小结:表象性表现一般较多的是针对于专一型慈善机构的标志设计,专一型的慈善机构是致力于某一项慈善事业而建立起来的慈善机构,专项事业的表象针对性较强,故这一特性易于表象化,是此类型机构标志设计的一贯设计手法。
2.象征性表现
象征性表现就是采用视觉图形符号,唤起人们对于某一抽象意义、观念或情绪的记忆。象征性是建立在特定的文化和宗教基础之上的。在慈善机构里,人们对于慈善文化的认知影响着标志的识别度。由于语言文化的不同,图形的象征或有错误性传达的特征,故在采用此方法时,要考虑到许多的客观因素。
狮子会是一个全球性的慈善服务组织,在联合国经社理事会享有资深地位。狮子会的标志徽章(图2-1)是在1919年正式采用的。标志的顶部为“狮子”的英文拼写“LIONS”,底部为“国际”的英文拼写“INTERNATIONAL”,中心是“LIONS”的首字母“L”,处于紫蓝色的圆形的正中心。标志徽章的两边各有一只狮子的侧面头像,这也是象征表现的重点,狮子在基督教图案中象征着善的一面,代表威猛、勇敢和慷慨,是权威与力量的象征,可作为圣徒之侣或英雄之友,有着保护的寓意,将狮子用在这里,给人一种安全感。狮子不同的面向代表不同的寓意,面向左边者寓意回顾过去,面向右边者表示展望未来。
香港公益金是香港著名的慈善机构之一,成立于1968年11月8日,机构的标志设计(图2-2)以宝塔为形。在源远流长的中国文化中,宝塔是被赋予灵气的建筑物,是佑护黎民百姓的功德。层层叠叠的宝塔渐渐成为行善积福的象征。与建一座宝塔,鲜有靠一夫之力可为,需集合众人的努力,齐心一致方能成功。公益金选用宝塔作为会标,呼吁市民每人付出一点力量,聚沙成塔,集腋成裘,为香港有需要的人士带来幸福和希望。可以说,历经四十年,公益宝塔见证香港无数变迁,依然屹立不倒,象征着香港人守望相助,团结共融的精神。
红十字国际委员会于1863年2月9日创立于日内瓦,其使命是为战争和武装暴力的受害者提供人道保护和援助。目前国际红十字会已成为世界性的组织,现拥有148个成员国。红十字国际委员会是一个独立、中立的组织,其标志符号“十字”带有基督教的宗教象征(图2-3),为宗教图腾符号,在广泛的传播下现在并且还具有法律效益。
救世军是一个成立于1865年的基督教教派,以慈善活动、社会服务著称。东华三院则是香港历史最久远及最大的慈善机构,起源于1870年代,致力为大众市民提供多元化的服务,包括医疗服务、教育服务及社区服务,是一个混合型慈善机构。通过(图2-4)可以看到,两个慈善机构虽地域不同,起源不一,但其标志选取了一个共同的外形为标志设计主体——盾牌,也可以称为纹章盾,纹章在古代是专属于某个个人,家族或团体的识别物,具有象征身份的寓意,而作为慈善机构,盾牌形状也具有保护、担当的意味在里面,体现了其象征寓意。
小结:象征性表现是所有慈善机构都常用的一贯手法,对于慈善机构的形象设计来说,象征性的表现力较为强烈,可以选取的素材较多,但其中要考虑到、涉及到的顾忌也比较多,如地方性、宗教性因素,所以在设计之前,要做好完善的调研工作的准备。
3.比喻性表现
比喻就是采用一个或一组视觉符号,表达相平行的另一层相关含义,是慈善机构标志设计中常用的另一种手法,若将A比作B,A与B必须有某种联系存在,其中A为抽象概念,B为具象体现,并且是人们脑海中已经形成认知的事物。
李嘉诚基金会是香港认可的慈善机构,基金会主要致力于教育、医疗、文化等其他公益事业,尤以教育事业为重,李嘉诚先生希望能够通过教育强人强国,故可以看到基金会标志(图3-1)的整体形象用树的形态来作为比喻物,一方面寓意着树的枝繁叶茂、茁壮成长,另一方面,用爱心拼成的树,又寓意着爱心如树叶般遮风挡雨,庇护人们。
美国慈善机构美国心脏协会的标志(图3-2)也采用的了这种比喻性表现手法,可以看到,标志以心脏图形为主体图形,并在心脏中竖立一个正在熊熊燃烧的火炬,用火炬比喻心脏跳动的动力,明确的体现了机构的职能。
运用比喻性表现的还有世界宣明会,世界宣明会是一个发扬人道与博爱精神的国际慈善团体,其机构创立于1950年,其宗旨是以爱心服事贫苦及有需要的人们,与他们一起面对贫穷和灾难,合力克服困境,使其走上幸福之路。机构的标志(图3-3)用星星作比作物,处于标志图形的右上方正闪闪发亮,意指宣明,也正体现了机构的博爱与人文精神。
小结:比喻性表现方法同样也是慈善机构常用的一贯手法,适用于各种类型的慈善机构,比喻的喻体一般为人们知晓的事物,或是约定俗成的事物,若非如此,观众无法理解比喻的寓意在哪里,而体现行业的特征与传达的信息又是什么。
三、总结
慈善机构的标志设计是慈善机构视觉识别系统中的重要组成部分,也是最具有传播力及感染力的一部分,视觉识别系统是基于视觉传播之上,将CI系统中的理念识别、行为识别等非可视化内容转化为静态的视觉符号,以无比丰富的多样的应用样式,利用广泛的层面进行最直接的传播。视觉是人们接收外部信息最重要和最主要的通道,而标志设计的作用,一方面能够令旧形象获得更新或升级,使其更符合时代审美性,一方面则是统合所有视觉传达,使其更富有一体感和持续感。形象系统是基于标志设计之上展开的,所以,标志表现的统一而创意大部分就决定了形象系统整体的视觉感受,要规范标志的用法法则,要统一一致,但是协调一致并不意味着完全同一,要通过统一的声音、统一的战略来协调,在此基础上还有富有创意性。
参考文献:
[1]杨团.中国慈善发展报告2011[R].北京:社会科学文献出版社,2011.
[2]郑功成等.当代中国慈善事业[M].北京:人民出版社,2010.
[3]山田理英,编译部译.企业形象丛书[M].台湾:艺风堂出版社,1992.
[4]杨仁敏,李巍.CI设计[M].重庆:西南师范大学出版社,2006.
[5]沃利奥林斯.沃利奥林斯的品牌术[M].刘兴华译.北京:清华大学出版社,2012.
[6]王绍强.品牌100[M].成都:四川美术出版社,2010.
[7]李毅.视觉传达中的企业形象设计:CIS的深层揭示[M].北京:机械工业出版社,2012.
[8]中元西男.塑造当代新的企业形象[J].国际广告,1994(1).
识别标志 篇7
2002年我国科技部正式启动了智能交通系统关键技术研究项目,其中一个主要的研究项目就是汽车的主动安全技术。交通标志识别技术是汽车主动安全技术的一个重要组成部分,它是利用车辆上安装的摄像头实时获取道路各种交通标志图像所表达的内容,然后通过机器视觉和图像处理的方法实时获取这些信息,依靠这些有用的信息协助驾驶员预测可能存在的一些安全隐患,同时能够及时的发出相关警示警告驾驶员提前采取相关预防措施以避免不必要的伤害,。依据相关资料发现最近三年造成的交通事故中有超过70% 的是由于车辆的超速行驶所引起的。因此,本文将主要研究道路限速标志图像的识别方法。
目前国内外研究人员对道路限速标志的识别方法主要是模版匹配法和神经网络的识别。日本大阪大学的研究人员提出了模板匹配的限速标志识别方法, S.Estable等人提出用训练好的统计分类器对限速标志识别。2005年,瑞典学者提出了一种利用图像的轴对称特征和形状特征来判断质心的坐标的方法来对图像进行分类的交通标志识别系统。刘旭东提出了利用BP神经网络对限速标志进行识别的方法,刘玉洁提出一种结合二叉树和支持向量机对限速标志图像分类识别的算法。
本文提出了一种将在线字典学习算法和稀疏表示的识别方法相结合,即基于在线字典学习的分类稀疏表示限速标志识别方法。
1 在线字典学习
在线字典学习算法是由Mariral[6] 等人提出的一种新的字典学习算法,为了表达方便,我们将其定义为ODL(Online Dictionary Learning),这种算法能够充分的利用样本的结构关系,因此其效率要高于传统的字典学习算法。其算法的流程可以分解为如下步骤 :
⑴初始化 :我们选择从输入训练样本矩阵集中随机选取K个列向量作为初始的字典,构造训练样本矩阵集, 为样本的大小,为样本的数量,迭代次数T。定义矩阵, 为字典原子数。定义矩阵,初始化A、B为零 ;
⑵迭代 :,重复下面的流程 :
1稀疏编码 :从训练样 本矩阵集Xt中依次提 取样本 ,利用稀疏编 码的方法 求稀疏系数αt ,即 :
2在每一次迭代中,通过下式更新矩阵A和B
3更新字典D,通过下式依次更新第列的数据。
⑶循环到最大迭代次数时,输出更新后的字典D。
2 基于稀疏表示的限速标志识别方法及其改进方法
假定在由常见的k (10) 种限速标志数字组成的样本集上做实验,将采集到的图像都经过相同的预处理,同时将所有限速标志样本都归一化为大小的灰度图像。把这些限速标志图像分为训练样本图像和测试样本图像两类,如果每一类限速标志图像的训练样本数目为n1 (i 为限速标志的编号 ),则剩下的样本图像都作为测试样本。我们逐列提取每幅图像的像素就可以组成一个大小为的列向量,通过这个列向量就可以表示这副图像p。这样就可以将所有的第类限速标志组成的训练样本表示成。其中为第i类限速标志的第j个样本图像组成的列向量。
a. 直接求解稀疏表示的识别方法流程如下 :
1) 输入这k种限速标志图像组成的训练样本矩阵,其中,A1 为第i类限速标志图像的训练样本矩阵,k为训练样本的类别数,同时输入待测试的样本图像y ,并将A1的各列和y都进行归一化处理。
2) 利用正交匹配追踪算法求解方程Ax=y的稀疏系数,其中计算出待测试样本在整个训练样本集合上的稀疏系数。
3) 然后利用最小距离公式其中,是一个系数向量,只提取出中和第i个类别所对应的系数值,其它的系数都置为零。最后将最小的所对应的类别作为最终识别的结果。
b. 分类求解稀疏表示的识别方法流程如下 :
1) 输入这k种限速标志组成的训练样本矩阵其中, A1为第i类限速标志图像的训练样本矩阵,k为训练样本的类别数,同时输入待测试的样本图像y,并将 A1的各列和y都进行归一化处理。
2) 利用正交配追踪算法分别在每个类别的训练样本中求解得到其对应的稀疏系数。
3) 然后再利 用最小距 离公式,最后将最小的所对应的类别作为最终识别的结果。
c. 本文的识别方法的流程如下 :
1) 输入这k种限速标志组成的训练样本矩阵,其中,为第i类限速标志图像的训练样本矩阵,k为训练样本的类别数以及测试样本y。
2) 对原始训练样本,分别利用在线字典学习算法求出其对应的学习字典
3) 利用正交配追踪算法在每类训练字典分别求解得到其对应的稀疏系数。
4) 计算训练样本中各个类别的残差它表示待测试图像y与各类训练样本之间的分辨度。
5) 通过比较得到的k个残差,将最小残差对应的这类样本作为识别的结果。
3 实验结果和分析
本文的实 验环境为 :安装有Matlab2010b的Intel 2.20GHz内存2.0GB的PC机上进行实验。部分示例图像如图1所示。
利用从道路上采集到的限速标志图像作为实验样本,并将其分成训练样本和测试样本二部分,其中在本实验直接求解稀疏表示的方法和分类求解稀疏表示的方法中每类限速标志数字是随机选择了200张图像作为训练样本,且图像都归一化成10×10大小的灰度图像,因此训练样本集就是100×200的矩阵,剩下的图像都作为测试样本。本文的方法是选择400张图像作为训练样本库,为了保证训练样本集也是100×200的矩阵与直接求解和分类求解有相同的计算量和存储空间,因此在使用在线字典算法中将的值设为200就可以得到。这三种方法的实验结果所对应的识别率如表2所示 :
定义识别率的方法为 :
识别率 = 识别正确的样本数 / 总的测试样本数
通过表2数据可以清楚的看到,通过大量测试样本来验证这三种不同的方法在限速标志识别的实验中,用分类求解稀疏系数的方法比直接求解稀疏系数的方法识别率要提高很多,在计算量和存储空间相同的情况下本文方法比使用分类求解的方法识别率也有一定的提高,平均识别率也提高了,证明了本文方法的有效性和准确性。
4 结束语
本文通过介绍在线字典学习算法更新字典的流程,提出了一种基于在线字典学习的分类稀疏表示识别算法,并应用于限速标志的识别实验中,结果取得了不错的识别效果。但是,在字典学习方面还可以研究利用其它的字典学习方法来得到字典,使学习字典与原始训练样本数据之间有更强的相似度,减小差异性,更能准备表达出原始训练样本数据的信息。
摘要:限速标志识别是模式识别领域中一个重要的研究课题。目前,利用稀疏表示识别图像是一个流行的方法。为了提高限速标志图像的识别率,通过对在线字典学习(ODL)算法的研究,将在线字典学习算法和稀疏表示的识别方法相结合,提出了一种基于在线字典学习的分类稀疏表示限速标志图像识别算法。将该方法与直接求解稀疏表示的方法和分类求解稀疏表示的方法作对比,实验结果表明:该方法能够取得很好的识别效果,证明了该方法的有效性和可行性。
识别标志 篇8
关于蛋白质相互作用和典型的通路已经很容易从数据库中检索到, 如KEGG, HPRD, Pathway Commons等。这些数据库中包含了文献中已经被研究的蛋白质相互作用的集合。然而, 值得一提的是, 这些被记录的相互作用数据是在不同的生物条件和细胞类型中观察到的。因此, 纯粹的基于网络重构研究的文献面临着关于细胞或组织类型缺失的情况。由于技术的局限, 假的蛋白质相互作用出现的概率很大, 如通过基因组规模的双杂交或共沉淀网施加相互作用。因此, 对于相互作用的置信度具有很高的研究价值。另外, 大部分人认为, 到目前为止只有少数的相互作用是已知真实的。这些有限的网络重构研究对生物标志物的发现为进一步研究提供了有价值的数据。
另外, 以数据为中心的方法是与传统的机器学习方法紧密相关的。这种思想偏重于在机器学习框架内的基因选择过程, 用这种方法可以较好地选择出相关联的基因。关于这种方法有两种主要的技术: (1) 要构建一种基因表达数据的数学方法, 即核方法, 嵌入网络图空间。然后, 可以应用基于核的特征选择算法, 如SVM-RFE; (2) 修改特征选择过程本身, 即通过强加在学习参数上特别的规则。
二网络化方法
1. 网络特征
一种方法, 它注重网络结构本身, 是要选择基于蛋白质相互作用网的拓扑特征的基因。这种例子在Taylor等人的论文中出现过。这种方法的思想是将注意力集中在网络的hub结点, 即具有特别高相互作用水平的蛋白质。在Taylor等人的论文中显示了hub蛋白质表达的平均皮尔逊相关系数和与它发生作用的蛋白质, 通过他们的方法能可靠地预测乳腺癌病人的生存期, 他们的方法没有任何基于变量的机器学习或特征选择过程。
集成了网络知识的另一种方法是总结从数据库中获取预定义的已知途径的表达水平, 如KEGG, 成为一个值, 如取平均值或中间值。这些新的被构建、可注释的特征是要运用传统的机器学习技术预测的与临床显型有相互关系的。Guo等人的论文中报告了功能表达谱通过取标注基因的平均表达而极大地丰富了基因本体论 (GO, 基因本体协会) 范畴, 并提高了分类器的稳定性, 分类器能正确区分四种癌症类型。
2. 不同的子网
与只关注预定义好的经典途径或GO组不同, 另一类思想是更多地关注测量的数据, 通过这些数据重构全基因的蛋白质产物的相互作用网, 然后通过实验数据来识别不同表达的子网。Chuang等人在这个方面做了一些工作。他们的算法开始于在网络中表达上具有很大差异的“种子”蛋白质。在每一个“种子”蛋白质周围的蛋白质不断地被加到一个子网中, 直到利用贪婪算法使该子网达到一个局部最大值, 其中值的测量是通过结合临床输出变量和正规化的基因表达均值等交互信息来计算的。在论文中, Trey Ideker以及他的合作者展示了他们的方法不仅能清楚地区分乳腺癌患者“好”与“坏”的诊断, 而且与传统的机器学习相比提高了预测能力。类似的识别不同子网的贪婪算法, 还有许多人进行了研究。
尽管上面提到的这些方法都有良好的表现, 但是, 这些方法都是启发性的, 因此, 不能确保找到不同的优化子网。Chowdhury等人通过分支和绑定的方法, 而Dao等人则通过穷举的方法试图获得优化的子网。在蛋白质交互网中计算了每一个结点不同表达的得分后, 作为一个奖励收集斯坦利最小树问题的实例, 他们解释识别不同优化子网的问题, 通过整数线性规划的方法解决最优性。同时, 他们也展示了获得与临床弥漫大B细胞淋巴瘤显型关联密切的最优子网, 但是关于算法预测的准确性并没有被严格地确认。
一般来说, 一个优化有识别能力子网的识别是一个NP难问题, 因此, 算法面临着计算超级多项式的时间复杂度, 这使他们面对一个棘手的、巨大的数据集。一个在计算速度和达到最优分离子网目标的折中的方法最近被Dao等人提出。他们的算法是基于颜色编码规范, 允许识别优化分离子网直到一定程度的误差率的产生。后来一些研究人员利用3-NN分类器依据每个子网的平均表达水平来分类乳腺癌患者对化疗的不同反应。
3. 数据中心方法
前面提到的所有方法都是以处理蛋白质交互作用网为核心。相反, 数据中心方法更多地关注实验数据。核技术是联合网络信息和实验数据的优雅的数学方法。对于支持向量机分类器来说, 核起着关键的作用。
一般来说, 核函数K:X×X→R可以作为特定在任意对象x∈X之间相似性度量, 同时要满足一些数学要求, 即对称性和半正定性。在其他许多领域, 核函数也有应用, 如在基于随机游动的图或网络中的结点。随机游动是一个随机过程, 由一系列的运动组成, 这一系列的运动具有按一定概率分布运动的图结构。扩散核是一特定类似的对于图中结点的量度, 这个图通过联系结点x或y来考虑随机游动路径, 但是每一条路径的权重依赖于路径的长度。这是一个以指数方式减少的方法。扩散核在数学上等价于物理上的热方程的基本解, 它描述了热在一定区域及边界条件下的变化。
三结论
总之, 到目前为止, 我们所了解到的各种方法都存在利和弊, 具有很强的系统经验的依赖性。Cun等人对14种分类算法做比较 (8种是使用网络知识) , 利用这些算法对6个基因芯片数据库的数据来预测乳腺癌患者早期和晚期的复发率。他们发现不同的算法对于这些数据集预测的结果明显不同, 但是, 基于网络的算法没有任何普遍的优势。Zhu等人利用基于网络的SVM方法得到了许多稳定的结果, 但仅显示了一个比较低的预测效果, 而RRFE在相关基因、途径和药物靶向方面有更好的表现。在研究中, 平均途径表达与好的预测算法藕联后会产生更确切的标注。
本文中的方法都是针对某种疾病 (主要是乳腺癌) 在某一特定的临床环境下 (如早期复发的预测) 被评估的。为了得到更完整的图片、更可理解的研究, 需要更多临床的问题和疾病样本, 这样才可以指导医生在不同的条件下哪些方法是好的选择。但是, 总是有数据集会对某种算法有特定的依赖, 这种情况无法解释。因此, 假设条件是算法成功应用的先决条件。
摘要:一般来说, 可以将对蛋白质相互作用网络的研究方法分为两类:第一, 以建立蛋白质相互作用网为途径, 这类方法是以基因表达数据为基础, 构建蛋白质相互作用网, 然后在疾病组中识别差异性或不同的子网, 或直接进行统计计算通路活动;第二, 传统的分类器被用来做基于子网基因表达谱的预测。
识别标志 篇9
从视频图像中识别限速标志, 尤其是实时的限速标志识别, 对于道路安全具有重要意义。本文提出了一种基于统计特征的实时限速标志识别算法, 可以识别视频中的限速标志。首先按照分区优先搜索策略确定需要处理的图像区域。其次, 利用SVF向量滤波器对图像进行滤波处理, 并利用RGB颜色空间进行颜色分割。再次利用先验知识排除非限速标志, 从而最终确定感兴趣区域ROI。最后在最终确定的感兴趣区域中提取数字, 并利用纵横投影的七段码“8”字型手写数字识别方法对提取的数字进行识别。
2 限速标志识别算法
2.1 限速标志的检测
限速标志的检测包括分区处理、SVF滤波和颜色分割几个过程。
2.1.1 分区处理策略
交通标志一般都处于道路右侧上方, 根据这一情况, 我们并不直接对图像的所有像素点进行处理, 而是有选择性的针对某一区域进行搜索。由汪哲慎[1]的分区优先搜索策略的启发, 本文对其搜索策略进行改进, 对图像的像素进行有选择性的处理。分区示意图如图1:
图1中的W、H分别为图像的宽度与高度。通常情况下, 交通标志出现在图像的1级搜索区域中, 如果在此区域内搜索失败, 则扩大搜索范围, 在2级搜索区域内进行搜索, 如果搜索失败, 则在3级搜索区域, 即全图搜索。
图2便是从视频中提取的单帧原始图像init Img的搜索区域以及分割后的子图sub Img示意图, 交通标志处于1级搜索区域中, 即图中的红色矩形区域内, 我们的后续工作都是在此区域中进行。
2.1.2 预处理
由于RGB三分量的相关性, 对原始图像的预处理往往会改变像素点的颜色, 从而造成识别错误。为了尽量保留像素的颜色信息, 我们将在后面的各个步骤中对噪声进行去除。本文利用Asakura等人[2]提出简单向量滤波器 (SVF, Simple Vector Filter) 对搜索区域进行滤波, 以此来去除非彩色区域, 以减少后续工作需要处理的像素。首先创建与sub Img大小相同二值图b Img_SVF, 再将b Img_SVF中与子图sub Img中彩色的像素点对应位置的值赋值为1, 否则为0。
2.1.3 基于RGB空间的快速颜色分割
在去掉非彩色的图像基础上进行颜色分割, 考虑到实时性, 本文使用RGB颜色空间。经过大量实验, 本文采用杨修铭[3]的RGB空间分割方法, 满足如式 (3.1) 的像素点被认为是红色像素:
这里R、G、B表示像素点的亮度分量。我们在图像sub Img中找到满足公式的像素位置, 并将二值图b Img_SVF中相应位置的像素置为1, 否则为0。利用这种方法对图像进行进一步分割, 得到二值图b Img_RGB。再利用形态学开操作对图像进行去噪处理, 得到二值图b Img_OPEN。结果如图3:
2.2 根据先验知识排除非限速标志
仅仅依靠颜色分割只能找到红色的区域, 而不能准确定位那些区域为限速标志区域。所以我们需要在颜色检测的基础上进行进一步处理。首先我们对b Img_OPEN进行连通区域标记, 然后根据限速标志的形状特征的特点, 对非限速标志进行排除。排除时需要利用限速标志的统计特征。所以下面先进行限速标志分析。
2.2.1 限速标志形状分析
本文允许的交通标志的最大形变程度为交通标志max (w, h) 与min (w, h) 的比值
其中w、h分别为是外接矩形的宽度和高度。下面我们对极限情况下的变形交通标志进行分析, 未变形的交通标志可以看作是变形交通标志的特例。不失一般性, 我们用图4来进行分析:
图4中的红色矩形框为交通标志的外接矩形, A、B分别为代表交通标志外部和内部形状的两个椭圆。按照上图所示, 交通标志红色像素占外接矩形面积的比例
SA与SB分别为椭圆A与B的面积, SRA为椭圆A外接矩形的面积。我们假定极限情况下椭圆B的长短轴分别为A的一半, 则Rr=0.5890。另外, 我们记录SB与交通标志外接矩形面积的比值
在上图中, Rn=0.1963。此外, 计算内部椭圆B外接矩形中所包含的红色像素数量与交通标志外接矩形面积的比值
SRA、SRB为椭圆A与B外接矩形的面积。在上图中, Ri=0.0537。Rn与Ri这两个数值将在数字识别与非限速交通标志排除的过程中使用。
2.2.2 排除非限速标志
首先对b Img_OPEN进行连通区域标记, 然后按照如下规则进行排除:
(1) 如果连通区域的像素面积小于300, 则认为不是交通标志, 否则进行下一步判断。
(2) 本文允许的最大形变量Rd≤2, 若Rd>2, 则认为不是交通标志, 否则进行下一步判断。
(3) 交通标志中的红色像素的数量占其外接矩形面积的比例是一定的, 若比例超过阈值Tr的连通区域可以认为不是交通标志。根据上一节计算得到的, 我们可以将Tr赋值为Rr, 即若连通区域内的白色像素个数与外接矩形面的比值大于Rr, 则认为不是交通标志, 否则进行下一步判断。
(4) 计算圆形度。圆形度可以在一定程度上反映图像与圆的近似程度。圆形度定义为metric=4πS/C2, metric∈[0, 1], 其中, S为连通区域的面积, C为连通区域的周长。当填充后的连通区域为圆形时, metric=1。根据Rd≤2, 我们可知, 理论上限速标志的填充连通区域的圆形度不会低于metrics=4πSA/CA2, , 其中SA为椭圆A的面积, CA为利用近似公式π (3 (a+b) /2- (ab) 1/2) 计算得到的椭圆A的周长, 其中a, b为椭圆的半轴长度。根据圆形度计算公式, metrics=0.8402。考虑到噪声影响, 如果某填充后的连通区域圆形度低于0.8, 则认为不是交通标志, 否则进行下一步判断。
(5) 限速标志的内部不含有红色像素, 所以我们在b Img_OPEN中连通区域外接矩形中的固定区域x∈[w/4, 3w/4]且y∈[h/4, 3h/4]中进行搜索并对白色像素进行统计, w、h分别为连通区域外接矩形的宽度和高度。如果白色像素数目与连通区域外接矩形的面积之比超过Ti, 则认为不是交通标志。Ti的取值为前面得到的Ri=0.0537, 但由于考虑到噪声影响, 我们将Ti设为0.06。
(6) 尽管除了限速标志之外, 还有很多交通标志中间没有红色像素, 但是其内部的图案与限速标志差异很大, 在禁令标志中, 只有限速标志内部图案的高度相似, 而其他交通标志的内部连通区域的高度相差很大。所以我们首先提取b Img_OPEN中黑色像素面积最大的连通区域作为交通标志内部区域, 在内部区域中将原始图sub Img中对应的部分进行灰度化, 并进行灰度变换以增强对比度, 然后进行二值化处理、去噪并提取连通区域。
2.3 数字识别
2.3.1 数字图像预处理
由于数字部分可能由于拍摄角度的不同, 可能使数字产生倾斜。本文采用最小二乘法对图像进行倾斜校正。并利用统计直方图对数字图像进行字符分割。之后将分割后的数字进行归一化为24行16列, 并提取其骨架。
2.3.2 数字识别
接下来, 本文对纵横投影的七段码“8”字型手写数字识别[4]的方法加以改进, 并用该算法对数字进行识别。该算法的基本思想是根据数字的外形特征将数字在七段码“8”字的各框上进行投影, 将其规范化为标准数字再进行识别。
该方法首先将数字骨架投影到“8”字型的7个字框上, 然后按照一定规则将投影规范化, 最后根据判别策略进行判别和匹配。
由于数字不规范等情况造成的变形会使同一个数字存在不同的投影, 某些数字如1, 4, 6, 9并不只有唯一的字框投影。而原算法针对每个数字只有一个对应的模板, 本文对该算法进行改进, 对于可能发生变形的数字设置了多套模板进行匹配。
3 实验结果
图5是从不同视频中提取的帧图像。图像中的右下角为检测出的限速标志的内部区域图。
J.Miura等人[5]中的识别系统包括一个广角镜头和一个长焦镜头, 由长焦镜头对广角镜头中的感兴趣区域进行放大, 接着利用YUV空间进行颜色分割, 并利用Hough变换确定标志形状, 最后利用模板匹配识别限速标志。该系统的每帧识别速度约为440-520ms, 限速标志的检测成功率为97.2%, 识别率为46.5%。S.Estable等人[6]通过神经网络进行颜色分割, 接着对形状进行轮廓分析, 最后对交通标志的特征图 (Pictogram) 利用训练好的统计分类器进行识别。该系统的识别速度则低于200ms, 整体检测成功率约为90%。
本文利用Matlab对算法进行仿真, 尽管第一帧识别速度较慢, 约为1.3630s, 但是后续帧的识别速度大大提高, 可以达到0.1440s。限速标志检测成功率约为90%, 数字识别率约为70%。如果利用硬件加速, 则可以进一步提高处理速度[7]。
4 结语
本算法可以在视频图像中识别限速标志, 由于没有采用过于复杂的算法, 所以除了第一帧识别速度较慢之外, 后续帧的识别速度较为理想。然而在视频图像过于模糊或噪声干扰强烈的情况下, 感兴趣区域ROI以及交通标志内部连通区域的提取将会受到影响, 导致本算法的识别率降低。但是随着车辆行驶, 限速标志的可视面积不断增大, 本算法仍然可以达到理想的效果。
参考文献
[1]汪哲慎.复杂场景下交通标志检测技术研究: (硕士学位论文) .厦门:厦门大学, 2006.
[2]马碧燕, 郑胜林, 赵全友.纵横投影的七段码"8"字型手写数字识别.广东工业大学学报, 23 (3) :113-117, 2006.
自然环境下交通标志牌的检测与识别 篇10
1.1研究的背景及意义
随着汽车数量的急剧增长,常规化的人力道路交通管理方式已经逐渐不能满足目前的交通道路需求,尤其是疲劳驾驶,醉驾等因驾驶员对路况的关注度太低而造成的交通事故比比皆是,这不仅给交通带来了诸多不便,也给人们的生命安全造成了威胁,因此智能交通行业越来越得到人们的重视。至2012年以来,中国的城市智能交通市场一直保持着高速的增长态势。
因此我们结合智能交通技术,设计本文所述的交通标志识别系统,可以及时提醒和警示驾驶员,使其了解行驶途中需要注意的交通标志,尽量避免事故的发生。
1.2国内外的研究现状
1.2.1国内研究现状
中国的智能交通研究开始于20世纪70年代末,最开始是在上海,北京,广州等经济相对发达的大城市进行了智能交通信号控制的研发。近年来,我国的ITS研究取得了丰硕的成果。然而虽然国内已经有一些自主开发的交通管路体制系统, 但整体性能和国外同类系统相比较仍然有较大差距,这是不容我们忽视和否认的,目前许多城市在智能交通控制方面仍然采用引进的国外系统,像SCOOT和SCATS系统。因此我们也应该认清到当前的严峻局势,在智能交通控制方面仍有许多进步的空间,等待我们去研究和开发。
1.2.2国外研究现状[1]
1994年在巴黎召开的智能交通大会成为发达国家正式研究和开发智能交通的标志性事件,经过不断地发展,智能交通在发达国家和发展中国家中都得到了突破性的发展。目前,国际ITS已经形成了美国、欧洲和日本三足鼎立的局面,其他国家像新加坡、澳大利亚、韩国等国家智能交通也具备了一定的规模。
2交通标志识别设计思路
2.1设计思路
通过简单的观察总结就可以发现,交通标志牌绝大多数为三种,即禁止标志(红色)、警告标志(黄色)、指示标志(蓝色),因此颜色是一个很好的切入点,我们可以最开始从颜色特征来出发,现将交通标志牌按颜色归类,再在相应的库中匹配, 这样不仅提高了效率,而且简化了算法,根据颜色分类以后,我们就可以进行匹配前的处理,也就是对目标进行截取。最后选择一种匹配成功最高的算法进行匹配分析,那么交通标志识别的任务也就基本完成了。
3交通标志牌检测
3.1常见的色彩模型介绍[2]
3.1.1 RGB模型[2]
我们知道我们人眼所能见到的颜色都是有红、绿、蓝三种基色按照不同的比例混合产生的,也就是RGB模型。三种基色的分量都是0时,为黑色,三种分量都为1时是白色,任一一种分量的改变都会使颜色产生变化,我们常见的彩色显像管就是根据三原色的基理工作的,但不得不提的观点是:它并不适合人眼的视觉特点。
3.1.2 HSV模型[2]
HSV模型,H-色相,S-饱和度,V-亮度
HSV颜色模型通常用一个圆锥体来形象地表示。纵轴表示亮度,用V表示,数值越大亮度越大,而半径表示饱和度,用S表示,半径值越大表示饱和度越高,角度表示颜色,红色对应于角度0°,绿色对应于角度120°,蓝色对应于角度240°,不同的角度分别表示不同的颜色。
由于交通标志牌位置是固定不动的,因此常用的获取目标的方法。例如背景差分法在此已经不再适用,无法通过利用背景作差来获取交通标志,因此我们对交通标志的检测运用了颜色模型的方法,由于RGB模型不适合人的视觉特点,而HSV颜色空间刚好与人眼的视觉特点相同,因此本文使用的颜色空间是HSV模型。
3.2色彩模型之间的转换
3.2.1 RGB向HSV模型的转换
前面已经详细介绍过RGB、HSV模型了,下面介绍RGB转化到HSV的算法,因其他转换算法与本文无关,因此这里不作介绍:
RGB转化到HSV的算法
4交通标志的阈值分割
4.1禁止标志的分割
禁止标志为都为红色的,因此如果要识别禁止标志,第一步就是把它从被自然景物包含的图像中检测并分割出来。检测方法上一节已经提到过了,运用颜色模型。
将RGB模型转换为HSV模型
核心代码如下所示:
Hsv=rgb2hsv(I); %将图像由RGB颜色空间转化为HSV颜色空间
d1=Hsv(:,:,1);%H分量信息保存于d1
d2=Hsv(:,:,2);%S分量信息保存于d2
经过RGB模型转换成HSV模型后,H分量和S分量都是0-1之间的值,而且H是实际度数除以360度得到的值,色调正是以0到360度之间的不同度数来表示不同的颜色的。
4.1.1利用颜色阈值将红色显示为白色
1)核心代码:
因为大红色部分在HSV模型中,参数范围基本为:H为0~0.1,0.8~1,S为0.4~1,因此我们要运用roicolor函数将符合这一参数要求的像素区域都标志为白色,其他区域均为黑色。经过上述代码之后,色调范围在0~0.1,0.8~1,饱和度范围在0.4~1的像素区域值均被置为1,其他为0,完成了对要识别图像的二值化。
2)roicolor函数简要介绍
功能:可以根据颜色选定区域。
用法:BW = roicolor(A,a,b)
A中的像素值如果在[a,b]范围内,则像素值全返回1,否则返回0.且BW的大小和A相同,得到的是一个二值图像。
4.1.2标注二值图的连通区域,求出最大值
核心代码
该段代码首先要对连通对象的各个分离部分进行标注, bwlabeln函数可以完成这个功能,然后再获取标记图像中所有区域的面积和最小包围矩阵,最后求出连通区域的最大值,也就是我们所要的禁止标志所在位置。
3)Regionprops是用来度量图像区域属性的函数。
1'Area':即面积,简单地说就是对不同的连通区域都记录下它的区域中像素的总个数。
2'Bounding Box':记录的是包含连通区域的最小矩形的相关信息:左上角横坐标、纵坐标以及长和宽。
对警告和指示标志牌的分割道理相同,在此不作重复叙述。
5交通标志的识别
5.1颜色特征[4]
对计算机视觉来说,特征提取的算法尤其重要,只有能够提取图像中的特征信息,计算机才能进行识别,从而做出人们要求的反应。然而,通常的特征提取算法都要大量的数据来换得更好的效果,而颜色特征却只需要根据像素值进行转换,计算量比较低,因此是一个较好的特征。
5.2颜色直方图
颜色直方图反映的是图像颜色的分布情况,从直方图可以直观地看到各个颜色在图片中所占的比例。常常提取颜色特征,利用两幅图的颜色直方图来比较两幅图像的差异。而且如果背景颜色和前景颜色有较大的差异的话,颜色直方图会呈现出双峰的形状。
但颜色直方图的缺点也很明显,那就是它只能反映图像的颜色分布情况,却完全丢失了图像中各像素点之间的位置关系,因此可能会造成错误识别的情况,即两幅图像的颜色直方图分布十分相近,但它们的像素点之间的位置关系却截然不同,这样的话,若是利用颜色直方图去识别图像,就有可能判断错误,误以为是相匹配的图像。
5.3 Pearson相关系数
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。于是, 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Cor-relation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
设(X,Y)是二维随机变量,则称
为X与Y的相关系数。
5.4基于计算图像在两个方向上的相关系数的交通识别
本设计的识别方法是通过提取标准图片和待识别图片的水平、垂直方向的灰度分布,进行Pearson相关系数的计算,并设定一定的阈值,在待识别图片与所有标准图片都进行过Pearson相关系数计算后,相关系数取得最大且大于所给阈值的则视为匹配成功。
1)核心代码如下所示:
2)MATLAB中相关函数corrcoef的用法
corrcoef(x,y)表示序列x和序列y的相关系数,得到的结果是一个2*2矩阵,其中对角线上的元素分别表示x和y的自相关,非对角线上的元素分别表示x与y的相关系数和y与x的相关系数,两个是相等的。
对于核心代码的运行结果,我们可以从matlab中查看:
遍历每一行,比较目标图和标准图的每一行,得出一个相关系数值,正相关是正值,负相关是负值,相关程度越大,绝对值也越大。
这两句代码是把相关系数值都累加起来,且不加自相关的系数1,通过比较得到相关系数的最大值的那个标准图片作为识别的结果(累加的相关系数值必须大于指定阈值可以)
6结论
本文先是对交通标志识别的背景和历史意义进行了阐述, 接着又分析了国内外的研究现状,本设计的设计流程图,还有交通标志的检测、截取、识别,详细说明了在设计这个交通标志识别系统的详细过程。整个交通识别系统做起来并不容易,尤其对截取目标图像的方式和识别算法的选择最为重要,需要不断地进行尝试,才能知道正确率如何,可实施性如何,但这个系统仍是不成熟的,许多方面需要进行改进。
摘要:交通标志的识别系统是智能交通(ITS)的重要组成部分。随着现代化的进步,汽车逐步走进千家万户,然而也带来了交通拥堵,事故频发等一系列亟待解决的问题。发展具有主动安全技术的智能车辆已经成为各国政府、研究机构的研究重点方向,交通标志识别系统正是智能车辆和无人驾驶目标实现的重要技术需求之一。本文进行了交通标志牌识别的研究,包括以下三个方面的内容:1)交通标志的检测;2)交通标志的提取;3)交通标志的识别。
关键词:交通标志识别,颜色特征,相关系数匹配,Matlab
参考文献
[1]国外智能交通系统的发展情况http://www.docin.com/p-545672525.html
[2]RGB和HSV颜色模型-知行知的专栏-博客频道.CSDN.NEThttp://blog.csdn.net/liuying_1001/article/details/7363353
[3]HSI颜色模型_360百科.http://baike.so.com/doc/1607662-1699477.html