告警信息预处理

关键词:

告警信息预处理(精选七篇)

告警信息预处理 篇1

关键词:监控信息量,变电站,电压越限,监控效率

0 引言

随着“大运行”体系建设完成,变电设备运行集中监控业务纳入调度控制中心统一管理,实现了调控一体化。随着调控业务的融合,监控信息接入不规范、信号量大[1],特别是电压越限信号频发,严重干扰监控员对电网的监控,影响到调控快速、准确地处理事故。如何尽可能减少无效信号的频发,提高监控效率是调控人员急需解决的问题。

为了协调解决调控业务运转初期出现的各种新问题,某省电力公司调控中心每月组织召开监控运行分析会,针对监控信息优化率、每站日均四类告警信息量、缺陷处理及时率、缺陷流程上线率、监控远方操作成功率、遥控误操作次数、OMS(电网调度管理系统)值班日志使用等指标进行通报,指标纳入“调度工作同业对标”体系。

经调查某地市公司在“省公司电网设备监控运行分析”工作中,每站日均四类告警信息量指标得分较低,排名靠后,在“调度工作同业对标”中被考核扣分。

该地市公司监控班肩负着60多座变电站的监控工作,每月有14万条告警信息,其中电压越限信息占60%以上,信号量较大,经过分析,其中有大量的信号是监控人员无需处理的,这些信号直接影响到对重要信息的提取,严重影响监控效率。

1 现状分析

1.1 监控信息量分析

为找到问题症结,调取2014年10月至2015年3月的监控信息进行对比,经过统计分析,平均每站日均信息量为68条,其中每站日均电压越限信息量为47条,占比较大,达到67.44%,见表1。

根据表1中的监控信息量,绘制每站日均信息量曲线图,如图1所示。由每站日均信息量曲线图可以看出,每站日均总信息量曲线随着每站日均电压越限信息量的变化而变化。

1.2 指标规定

根据省公司及调控中心相关指标要求,每站日均四类告警信息在30条以内为满分,该地市供电公司每站日均总信息量要降至30条,需减少38条信息量,由前面的分析可知:造成每站日均总信息量大的主要原因是电压越限信息量大,因此,可以将每站日均电压越限信息量(47条)减少38条来降低总信息量(47-38=9条),即每站日均电压越限信息量降至为9条。

2 原因分析

调取母线电压频繁越限的变电站的母线电压告警信息,发现电压波动幅值在0.1 k V范围内,越限时间较短,在几十秒后自动恢复正常。本文选取了某一变电站某一时段的电压变化作为采样值进行分析,如图2所示。

表2为某一时段电压采样值统计表,根据采样表可知,大部分母线电压会在5~30 s恢复正常。

恢复时间统计表见表3。根据母线电压变化情况(表2、表3),由式(1)可以计算各时间段内动作复归的信号频率累计。如图3所示,有96.97%的母线电压越限频繁波动信号会在30 s内复归。由此可以确定电压波动周期为30 s。

3 解决方案

通过分析,最终提出两个解决方案:建立集中监控专家处理系统、建立电压越限预处理模型。

3.1 建立集中监控专家处理系统

该系统采用人工智能技术和计算机技术,将多个专家提供的知识和经验构造成专家系统知识库,模拟人类专家对告警信息进行推理、判断和处理[2],其结构见图4。当变电站母线电压越限时,电压越限告警信息传送至告警预处理器,处理成专家系统能够识别的告警信息并发送至综合数据库,然后推理机从数据库中接收告警集合,根据知识库中系统告警集和系统事件集的信息[3],判断母线电压是否是短暂波动,若是短暂波动,则不发告警信号;若不是,则启动AVC(自动电压无功控制)系统进行电压调节,若已无调节措施或AVC系统动作次数越限闭锁,则发出电压越限告警信号,提示监控员手动调节母线电压,并给出参考处理方案。

优点:能够在第一时间内对告警信息做出准确判断及处理。缺点:(1)构造专家系统知识库需要将告警信息进行分类、整理,并经多位专家反复交流,是一个费时费力的过程;(2)知识库中知识的质量和数量决定着专家处理系统的水平;(3)怎样将专家知识转换为计算机能够识别的程序,也是一个浩大的工程。

3.2 建立电压越限预处理模型

该模型采用延时措施,对电压越限告警信息进行预处理,其结构如图5所示。当变电站母线电压越限时,电压越限信息传送至调控主站数据库,然后与预处理模型中的电压限值集对比,同时启动延时计时器,在整定延时时间内,若电压恢复正常,则不发告警信号;若电压未恢复正常,则发告警信号,提示监控员进行电压调节,电压限值和延时时间可以通过相应的管理器进行整定。

优点:(1)原理简单,可操作性强;(2)通过分析电压曲线,即可确定延时时限,耗时短;(3)该模型无需大量的程序汇编,易实现。缺点:只针对电压短暂波动有效,针对性强。

通过以上方案分析,经过表4的对比,最终选择方案二建立电压越限预处理模型。

通过以上分析计算,并经相关专业专家讨论和评估,最终决定采取整定延时30 s时间来躲过母线电压的短暂波动。通过对母线电压的分析,发现大部分电压会在0.1 k V范围内波动,且为保证电压合格率,要求监控员在母线电压越限5 min时,必须及时进行母线电压调整,所以在电压越限预处理模型中设置越上限和下限范围0.1 k V,这样既能屏蔽绝大部分短暂波动信号,又不影响设备的正常运行,其逻辑图如图6所示。

4 方案实施

在OPEN3000调度技术支持系统数据库中,将母线电压频繁越限的变电站设置为母线电压越限延迟30 s报警,和越上限和下限范围0.1 k V,躲过母线电压短时间、小范围内频繁波动,以减少告警信息量。本文以10 k V为例来具体说明方案实施过程。在OPEN3000调度技术支持系统数据库中,设置10 k V母线电压的正常上限值10.7 k V、正常下限值10.0 k V、越上限和下限范围0.1 k V、延迟时间30 s。在母线电压大于正常上限值10.7 k V,小于“上限10.7 k V+越上限范围0.1”时,延时30 s若电压还在此范围,报越上限。若母线电压大于“上限10.7 k V+越上限范围0.1”时,不判断延时,直接报电压越上限。在母线电压小于正常下限值10.0 k V,大于“下限10.0 k V-越下限范围0.1”时,延时30 s若电压还在此范围,报越下限。若母线电压小于“下限10.0 k V-越下限范围0.1”时,不判断延时,直接报电压越下限。

5 电压越限预处理模型实施效果

2015年07月1日,该地市公司所辖变电站采用电压越限预处理模型,将母线电压延时报警时间和越上限和下限范围进行整定,采用延时30 s,越上限和下限范围0.1 k V,经过一个月的运行,并将2015年7月的监控系统母线电压越限信息量与2014年7月、2015年4—6月进行对比,如表5所示,发现7月份采用电压越限预处理模型后,变电站母线电压越限告警信息量降至15 372条,平均每站日均电压越限信息量降至8.7条,大大降低了告警信息量。

6 结语

本文通过对监控信息量的分析,找出变电站母线电压越限告警信息量大的原因,并提出了两种解决方案,经过比较分析,最终确定采用第二种方案——建立电压越限预处理模型。采用该模型后,极大程度地降低了变电站母线电压越限告警信息量,解决了电压越限信号量大影响监控效率的问题,保证了电网安全可靠运行。

参考文献

[1]袁建党,易炳星,李军,等.精简监控系统遥测越限告警信号量[J].四川电力技术,2014,37(2):45-47.

[2]黄朝圣,姚树新,陈卫泽.浅谈专家系统现状与开发[J].信息安全与技术,2013,4(2):71-74.

铁塔动环告警处理手册(模版) 篇2

一、低压配电(交流配电箱)

二、开关电源

1、交流输入频率过低 1)原因分析:

交流输入多为市电引入,出告警即市电频率超越门限告警,低于48Hz。2)处理方法:

将数字型万用表测试档位置于Hz档,再将两根表笔分别接入信号源两端,测量信号源频率值是否低于48Hz。3)、协议解析不正确,导致误告警,需要设备升级解决此问题。

2、电池充电过流告警 1)原因分析:

当充电电流超过0.1C时可认为是过电流充电。2)处理方法:

3、电池熔丝故障告警

1)原因分析:

蓄电池熔丝未连接牢固或检测线未检测到蓄电池熔丝 2)处理方法:

(1)检查蓄电池熔丝是否连接牢固

(2)检查检测线是否和蓄电池熔丝良好接触

(3)开关电源显示屏是否有熔丝告警提示(如果没有,可能是平台数据不更新导致,或者开关电源协议解析不正确)。

4、防雷器故障告警

1)

原因分析: 防雷器本身出现破损等故障或防雷器未插紧 2)处理方法:

(1)防雷器本身出现破损等故障则需要更换防雷器(2)将防雷器插紧,保证接触良好

(3)核实是否在交维测试时做的告警一直未消除。

5、负载熔丝故障告警

1)原因分析:

接了负载但空开未推上去;接了负载但负载未加电; 2)处理方法:

(1)若是负载设备暂时不上电,可以先去掉设备电源接线;

(2)接了负载的空开推上去供电;

6、交流输入停电告警及电池供电告警 1)原因分析:

交流停电导致蓄电池开始供电 2)处理方法

恢复市电供电

7、交流输入缺相告警 1)原因分析:

开关电源输入三相电中有一相或两相没电或电压过低 2)处理方法:

检查开关电源输入的三相电接线是否牢靠,测试输入的电压值,若过低需排查前面市电供电是否正常 3)注意迷你机柜一般都是单相电压,不存在交流缺相

8、整流模块通信状态(通信失败)告警

1)原因分析:

整流模块通信不正常或模块未接电 2)处理方法:

检查整流模块是否插好

确认整流模块供电指示灯亮(如不亮多为开关电源输入单相电,部分整流模块没电引起,需要输入空开上并线,保证整流模块有电)

9、整流模块故障(丢失)告警 1)原因分析:

整流模块风扇未正常运行、故障或整流模块本身硬件故障

2)处理方法:

检查整流模块风扇是否正常运行,查看风扇是否被阻挡运行,检查整流模块风扇是否故障,如是则需更换风扇; 整流模块本身硬件故障则更换整流模块

3、)模块未插到位,或者模块坏。

10、交流电压过低告警、交流电压过高告警 1)原因分析:

市电输入电压不正常,超出范围引起 2)处理方法:

检查市电输入的电压值,保证其处于正常范围

11、开关电源通信状态告警

1)原因分析:

开关电源和FSU未正常通讯 2)处理方法:

检查开关电源侧通讯线是否正确接线、有无松脱; 检查FSU开关电源程序是否正确对应

3)检查开关电源通信模块是否正常,串口是否正常,参数设置是否和FSU一致等。开关电源不告警、或者出现开关电源通信中断,要检查开关电源接线是否正确,是否松动,具体检查位置为红色标注地方,如果接线无问题,就需要用笔记本电脑连接上设备检查设备通道是否打开,编码是否配置正确

12、直流输出电压过低告警

1)原因分析:基站停电,电池持续放电,导致蓄电池总电压小于设定的值限。

2)处理方法:给基站发电,或等市电来电后,给电池充电,告警自动消失。

三、蓄电池组

1、电池组中间点电压不平衡 1)原因分析:

电池组前半组和后半组电压值相差过大或程序解析问题

2)处理方法:

看中间点是否接错位置(在第12节和第13节电池中间)用万用表检测前、后半组电压值,如不正常需检测每节蓄电池电压值,看是否有蓄电池连接不牢导致或个别蓄电池电压不正常引起(如是,需要更换该节蓄电池); 3)设备采集值是否和电池电压值一致,如果不一致需要修改采集值参数或者检查接线。

厂家FSU程序解析有问题则需要重新调整解析

2、总电压过高告警 1)原因分析: 蓄电池组总电压超出门限值; 程序门限设置或程序本身有问题; 2)处理方法:

用万用表检测每节蓄电池电压及总电压,看是否哪一节蓄电池不正常,如是需要更换;

检查程序门限设置是否合理,不合理则需要修改; 若电压数值明显不正常,则需要厂家检查程序是否有问题

3、总电压过低告警 1)原因分析:

蓄电池组因放电总电压值低于门限;

蓄电池组接线不正常,导致总电压低于门限; 蓄电池检测模块故障或未正常连接导致检测到的电压低或测不到电压 2)处理方法:

蓄电池放电导致则需要尽快恢复市电供电;

检查蓄电池组接线是否牢靠,用万用表检测电池组电压是否正常;

若万用表检测电压正常,则检查蓄电池检测模块是否正常、正确连接

四、机房环境

1、温湿度告警 1)原因分析:

温湿度高于或者低于门限值引起。

2)处理方法:

(1)目前已将温度过高设置为40°C,温度超高设置为45°C,温度低过设置为15°C,湿度过高设置为80%rh,湿度过低设置为10%rh,此设定根据季节合理设定。

(2)确认一体化机柜的空调运行正常。

(3)一体化机柜门上的空调建议温度不要设的过低,以免机柜内外温差过大,引起内部湿度过大

2、烟雾告警 1)原因分析:

设备或线路起火等烟雾浓度高引起;传感器故障引起 2)处理方法:

灭火、排查线路,降低烟雾浓度;

若是传感器本身引起,则检查接线或更换烟雾传感器

3、红外告警 1)原因分析:

有人或移动物体进入探测范围引起; 传感器灵敏度过高或干扰引起; 接线问题或传感器本身故障引起 2)处理方法:

有人或移动物体进入探测范围引起属正常告警; 降低红外传感器灵敏度(将图中旋钮逆时针旋到底降低灵敏度),红外安装远离风扇、空调、热源等易引起干扰的设备,安装位置离机柜门不宜过近防止引起自激; 确认红外接线正确,如本身有故障则需更换红外传感器

4、水浸告警 1)原因分析:

机房进水、空调漏水引起传感器短路 2)处理方法:

排出积水(若空调漏水则修复或更换空调)

五、普通空调

1、普通空调通信状态告警 1)原因分析:

空调通讯接线不正确或不可靠; 空调实际未安装但信息录入配置了导致 2)处理方法:

检查确认空调通讯接线正确、可靠;

空调实际未安装但配置录入了信息需要删除配置和告警

2、工作异常告警 1)原因分析:

空调故障 2)处理方法:

修复或更换空调

六、智能电表(交流)

1、交流输入停电告警

1)原因分析:

交流输入停电引起 2)处理方法:

检查电表进线、恢复市电供电

2、智能电表通信中断告警

1)原因分析:

智能电表通讯接线不正确或不可靠 2)处理方法:

确认智能电表通讯接线正确、可靠

七、门禁系统

1、门磁状态告警 1)原因分析:

机房门被打开或门磁接触不好未吸合 2)处理方法:

关闭机房门、确保门磁接触及吸合良好

2、智能门禁通信状态告警 1)原因分析:

门禁通讯接线不正确或不可靠 2)处理方法:

确认门禁通讯接线正确、可靠

八、FSU设备

1、FSU离线告警 1)原因分析:

FSU设备故障引起; 流量卡流量用完欠费引起;

市电停电,且无油机发电,最终蓄电池二次下电引起; 无线信号不稳定引起; FSU ID变化引起 模块故障引起 2)处理方法:

FSU故障引起需排除故障或更换FSU设备; 欠费引起需要续交话费;

市电停电引起需要恢复市电供电或采用油机发电; 无线信号不稳定引起需要采用最好的运营商信号或开通基站;

告警信息预处理 篇3

1 激光告警图像预处理

1.1 红外图像的盲元补偿算法

本文采用自动检测方法来确定盲元, 该方法通过参考邻域像元的像素值进行盲元的判断。具体的确定步骤如下所示:

(1) 确定探测器上的可疑亮点。设定亮点判断阈值为α, 通过遍历对比确定可疑亮点; (2) 对可疑亮点进行逐个判断, 通过邻域对比确定是否为盲元。本文采用交叉平均法来确定阈值α。首先, 选取探测器当前采集图像的左右两边各一列数值, 然后对两列数据进行求和平均, 求出平均值设为β, 然后, 在平均值β上增加一个判断值ε, 即为阈值α。具体计算公式如式 (1) 所示。

上式中, 判断值ε的确定将影响到探测器判断亮点和识别盲元的精确度, 在实际工程中采用专家经验法来选取。探测器探测到目标后进行图像的多次采集, 经过统计分析, 将幅值小于等于β的像元作为背景过滤掉, 幅值超过β且大于阈值α的像元作为可疑亮点保存留待后续盲元识别。逐个将可疑亮点与其邻域像元进行对比分析, 幅值突变量超过或低于ε的像元即可判断为盲元。

盲元确定后, 需要采用盲元补偿算法进行修正。为保证红外激光告警系统的时效性, 采用的补偿算法应在保证计算精度的同时, 尽量减少计算的复杂度。因此, 本文采用均值法进行盲元补偿, 即提取确定盲元的上下邻域的像元值求和平均来进行补偿。假设盲元像素点为m (i, j) , 则盲元补偿计算方法如式 (2) 所示。

采用均值法进行盲元补偿, 既能保证探测精度, 也能满足实时性要求, 同时, 还可以避免由于探测器自身的非均匀性等外部因素带来的精度影响。

1.2 图像滤波

对探测图像进行滤波以便于目标的识别, 本文通过对比度增强即采用直方图均衡化算法进行图像滤波。具体计算流程如下所示:

(1) 采用指数平滑递推公式进行平滑处理。其中, Ej为平滑后灰度级的频数, 且E0的初值为E0=n0, a为平滑系数, nj为平滑前灰度级的频数; (2) 灰度间距均衡处理。将平滑处理后的像元灰度范围按等间距映射到数值区间[0, 255]; (3) 中值滤波。计算像元邻域内的灰度值并求和平均, 该平均值为图像中像素点的灰度值。

2 激光目标的识别

2.1 目标识别的算法流程

对探测的激光进行参数识别的计算流程: (1) 在图像预处理的基础上, 获取目标的激光衍射光斑; (2) 对图像进行分割, 分别计算光斑中心, 最后计算获取目标的激光参数等信息。

2.2 基于区域生长法的图像分割

本文基于改进的区域生长法对探测图像进行分割。首先通过图像预处理确定亮点, 提取亮点后对各个亮点进行区域生长判断实现图像的分割。具体实现过程如下所示。

(1) 通过前文确定的阈值, 进行亮点判断, 并将确定的亮点坐标信息保存为亮点数组; (2) 对亮点数组中的所有元素采用区域生长法。将亮点数组中的第一个元素作为种子, 并记录到数组temp中, 并对应的将亮点数组的该元素数值变为0; (3) 完成第 (2) 步后, 判断亮点数组中的非零元素, 并确定其实为数组temp中某一元素的邻近元素, 如果是, 则将该元素保存至数组temp中, 并对应的将亮点数组的该元素数值变为0; (4) 循环计算。当亮点数组中的所有非零元素均不是数组temp中元素的相邻元素时终止计算。循环上述过程, 直至亮点数组中的全部元素都被分配到不同的数组中, 则完成了图像的区域分割。

2.3 来袭激光参数计算

为计算来袭激光的参数, 首先采用灰度重心法计算激光光斑中心。灰度重心法是形心法的改进, 并增加了灰度值作为加权值, 该方法能够有效的反映出来袭激光光斑的特点, 并且计算方法简单快速, 有利于红外激光告警系统的时效性。本文计算图像B[i][j]的灰度如式 (3) 所示。

通过式 (3) 计算出光斑中心点坐标后, 再结合成像特点就能计算出来袭激光的其他参数信息。

3 结语

本文通过盲元补偿算法和滤波算法进行了红外激光的图像预处理, 并采用基于区域生长法的图像分割进行了红外激光的目标识别, 最后采用灰度重心法来获取来袭激光的参数。本文对红外激光告警系统的图像预处理及目标识别算法的研究将有助于提高红外激光告警系统的精度和降低虚警率, 有助于红外激光告警系统的工程实际应用。

摘要:随着红外激光技术在军事领域的应用和发展, 新型的红外激光武器已成为研究热点和武器装备。在目前的国际军事形势中, 红外激光武器的应用已经构成了新的军事安全威胁。面对新的威胁, 有必要针对激光武器开展对抗技术研究, 研制激光告警系统来应对。本文基于此应用背景对红外激光告警系统的图像预处理及目标识别算法进行了研究。

关键词:红外激光,告警系统,图像预处理,目标识别

参考文献

[1]陈健.基于激光侦察告警器的激光告警技术研究[J].光机电信息.2011 (3) :6-12.

光传输设备告警信息的查询及应用 篇4

光设备的告警一般可以在设备或网管上进行查看或查询。

1.1设备上的查询

设备上查询告警有两种方法:一种是通常设备机柜最上端装置有机柜告警灯, 提示维护人员有告警发生;另外一种方法, 可以查看设备硬件板子上面的告警指示灯, 比如用指示灯闪烁频率或颜色变化来显示正常状态或故障状态, 设备上指示灯显示模式数量较少, 告警信息显示不完全, 通过设备查看告警只能了解到是否有告警以及告警的级别, 不能有效的反映当前设备故障的详细情况, 需要在网管上进行查询。

1.2网管上的查询

任何一种光传输设备提供的网管系统给维护人员的工作带来了极大的便利, 使用网管查询光设备的告警信息, 可以查询到全网所有的各种告警, 也可以查询某一个单独网元的告警信息, 进一步可以查到单独的一块板上 (如华为光板S L16光板) 的告警信息。网管上告警信息包括以下内容:告警种类, 告警位置, 告警数量, 告警产生的时间等。

1.3告警信息提示

还可以通过声光报警设备发声光报警信号进行提示。

二、光传输告警查询的一般步骤, 显示告警板图标的直接查询

由于在设备上只能查看有限的告警信息, 因此本文将详细说明在网管上进行告警查询的方法, 步骤, 因为本单位使用华为设备比较全面, 以华为Optix imanager T2000综合网管为例来阐述告警信息的查询步骤:

2.1首先对全网告警进行核对

确保网管上显示内容与光设备上产生的告警相一致, 保证看到的告警全面。

2.2紧急告警的查询

在主拓扑图右上角有“显示告警板”图标, 后面的红色方块表示紧急告警, 点击查询此方框, 全网的紧急告警全部出现, 一般是硬件光缆断或者是硬件板子故障。通过查看告警级别、名称、告警源、定位信息、告警时间迅速判别告警出现的网元、位置进行故障消除, 能在网管上利用软件来消除的告警迅速处理;需要其他维护人员配合处理的, 立即调动人员前去处理, 直至消除当前出现的紧急告警。如果某个紧急告警不是由于网络不正常产生的, 比如光板的某个光口没有使用而引起的紧急告警, 这种紧急告警可以不用处理或进行屏蔽。

2.3再次核对全网告警后, 查询重要告警

重要告警是主拓扑图上“显示告警板”后面的橙色方块, 点击该方块也是通过查看告警级别、名称、告警源、定位信息、告警时间这些信息, 判别告警出现的网元位置, 进行适当的处理, 如支路板的2M出现的T-ALOS告警, 可以先通过当前支路板端口上进行“内环回”或者“外环回”来判断故障段, 也可在DDF架上通过2M连线进行环回判断故障段, 当前的所有的重要告警。同样, 也可以忽略或屏蔽某些不是由于网络不正常而产生的主要告警。若有网络倒换提示告警, 应尽快处理。虽然网络倒换时并不引起业务中断, 但表明已有故障产生, 而且网络的安全级别已经下降。

2.4次要告警也要进行全网告警核对

次要告警是“显示告警板”后面的黄色方块, 通过故障处理。同样, 也可以忽略或屏蔽某些不是由于网络不正常而产生的次要告警。次要告警虽然不影响业务, 但次要告警往往预示着网络已经产生故障, 并可能随时产生可以中断业务的故障, 也需要定时巡视、及时处理这些告警

光设备网络中随着网元的增多, 通信网的覆盖面越来越广, 告警信息种类、数量很多, 使得告警分析和故障定位无从下手。这时候可以通过合适的查询步骤, 尽快实现告警分析和定位, 同时也不会遗漏某些危险告警。

三、光传输设备告警查询的具体应用

传输设备种类多, 还是以华为设备和网管为例, 进行查询光传输设备告警操作。

3.1查询全网告警信息

1、首先同步全网告警, 在主视图中的"故障"菜单栏中选择"同步全网告警"命令

2、当出现的"操作进度"对话框中进度条达到100%后会出现”操作结果”对话框。如果提示操作成功单击[关闭]按钮即可。若提示操作失败, 可单击[详细信息]按钮查看出现什么错误, 排除故障再进行步骤1的操作

3、点击主视图中菜单栏上的"故障"菜单栏, 选择"当前告警浏览"命令, 即可查询全网所有告警。

4、在出现的告警列表中点选某条告警, 在视图中部就会出现相应的文字提示, 在视图最下部也可进行相应的[同步]、[核对]、[确认]、[删除]等操作。其中, ”同步”表示重新查询全网所有的告警并在网管上显示出来;“核对”表示将网管上选中的告警与相应的设备上的告警重新对比, 并将网管上的告警按照网元上的实际告警进行刷新;“确认”表示操作人员己看到该告警, 如果该告警已经结束, 则该告警会在视图中消失, 进入历史告警库:”删除”表示在网管上删除该告警, 但设备上此告警信息依然存在。

3.2查询单个网元的告警信息

1、在主视图中右键单击某网元, 在出现的下拉菜单中单击"同步当前告警"命令, 进行告警同步操作。

2、告警同步顺利完成后, 右键单击该网元, 在出现的下拉菜单中单击"当前告警浏览"命令, 查询此网元所有告警。

3、选中某条告警, 在视图中部的"告警的详细信息"和"告警原因"窗口中会对告警信息和产生原因进行说明, 在视图最下部也可进行相应的[同步]、[核对]、[确认]、[删除]等操作。

3.3查询单板的告警信息

以查询中心站网元OPTIX OSN 3500设备的光板N2SL16的告警信息为例进行描述:

1、在主视图中双击打开该中中心站网元的面板图:

2、右键单击N2SL16板, 在出现的下拉菜单中单击"告警浏览"命令, 即可查询此单板的所有告警, 并根据提示进行操作, 单板上的告警查询和处理需要小心谨慎, 一定要在正确的判断后在进行操作。

四、告警信息告警原因及消除方法

常见告警信息的查询和熟练掌握是一个优秀的通信维护人员应有的素质, 故障的排查能力体现了维护人员的业务水平, 熟练掌握告警信息能迅速定位故障和恢复通信网的通信能力, 下面以我们丹东供电公司信通中心应用较多的华为设备为例, 介绍几种常见的告警信息。

1、“BD—STATUS”单板不在位, 为重要要告警。此告警的常见原因为单板未插、单板故障、单板与母板之间通信故障或单板正在复位重启中。产生此告警, 将影响本板上所有业务, 一般产生PS, TU-AIS关联告警。消除方法:因为有ps保护, 所以进行拔插单板或者更换板子操作。

2、“R-LOS”表示光接收信号失败, 为紧急告警。产生此告警的原因为本端接收机故障, 尾纤或光缆中断, 对端发送机故障, 线路光衰耗大收光功率低于接收机的接收灵敏度。一般产生PS, TU-AIS, LTI等关联告警。消除方法:在本端查询光收、发光功率, 发光正常, 而无收光, 使用OTDR测试本端到对端的光缆, 确认光缆中断的大致位置, 线路维护人员迅速赶往现场熔接处理。

3、“FAN--FALL”。表示风扇故障。消除方法:把风扇拔出来除尘或者更换新的风扇。

4、“T-ALOS”表示2M信号接收失败, 为重要告警。产生此告警的原因有2M板未接对端设备, 用户侧 (如远动侧) 无信号发出, 对端线缆中断或2M板故障。消除方法:用环回法逐段判断, 在硬件DDF架上通过2M连线向设备侧环回, 告警消失则说明设备侧正常, 需处理用户侧;告警不消失, 采用软件内环回设备里, 告警消失则设备支路板和业务板无问题, 判断是设备到DDF架之间连线故障, 处理恢复。

5、“TU-AIS”表示2M业务配置错误, 为次要告警。产生此告警的原因为配置时隙没有对应, 对端业务信号丢失, 2M板故障, 交叉板故障。TU-AIS产生后, 对应的2M通道将失效。消除方法:检查业务时隙重新删除该电路业务, 再重新做业务, 或者对端接入业务信号。

6、“PS”倒换告警, 为主要告警。产生此告警的常见原因为设保护的网络光板光路中断, 主用板子故障等。消除方法:迅速接续光路, 处理光板后自动倒换回主用电路。

7、还有一些如POWE-FALL电源故障ETH-LOS, 以太网接收信号失败;JO J1 C2字节失配;LTI跟踪时钟源丢失;SYN-BAD时钟源劣化告警, 这些告警信息也及时的消除。

五、告警查询的注意事项

查看告警属于查询类操作, 一般不存在危险操作, 但需注意以下情况:

5.1告警时间要保证准确

告警产生时间提取的是网元本身的时间, 所以要将所有网元的际时间一致, 告警上报时才能反映出实际的故障时间, 有利于分析处理。

5.2告警确认、删除要慎重

当有告警产生时, 若没有找出故障原因, 不允许对告警确认或删除, 否则将给处理故障带来不便。所以网管维护人员操作权限有分级, 一般的监控网管人员只有低权限, 只能查看, 不能进行删除操作, 这是本着对通信网安全运行的考虑。

5.3查询告警后, 对网管数据进行数据备份。

六、光传输设备告警信息查询的意义

光传输SDH设备在电力系统应用广泛, 通信维护人员进行告警信息的查询, 才能准确地判断和处理故障信息, 节省检修人员不必要的劳顿。作为电力通信维护人员, 告警信息的及时查询, 是维护人员的工作职责之一;告警信息的及时查询和处理, 才能保证通信网上所带的电力业务稳定运行;才能有效的利用网络, 排除故障、恢复网络的正常运行, 也只有不断不断提高维护水平, 才能保障通信网运行的安全稳定。做到这些, 通信维护人员不但要有高效、快捷的服务;还必须有仔细、认真的态度;有创新的思维, 简捷、迅速的方法;还需要不断地进行通信业务的学习和培训, 这是我们当代维护人员必须具有的素质。

摘要:通信发展到今天, 出现了高速迅捷的光纤通信, 而光纤通信设备承载着电力系统多种多样的业务需求, 所以及时发现通信设备的异常状态, 需要及时可靠的查询告警信息, 对告警信息进行正确分析、及时处理处理显得尤为重要, 是保证电网安全稳定运行的有效手段电力光传输设备种类越来越多, 我们先后采用了了武汉NEC光传输设备、北京三维光传输设备、深圳华为OPTIX系列光传输设备、深圳中兴光传输设备、ECI光传输设备等等一系列的光设备, 在维护这些设备的工作过程中, 各种告警信息的及时查询和处理是我们维护光传输网络的重要工作。所以本文我着重论述光传输设备告警信息的查询及应用。文章介绍了光传输设备的查询方法、光传输告警查询的一般步骤、光设备常见的告警信息及告警原因、光传输设备告警查询的具体应用、产生告警信息的告警原因及消除方法、告警查询的注意事项、告警信息查询的意义几个方面。

关键词:光传输设备,光纤,告警信息,紧急告警,重要告警

参考文献

[1]《华为光传输系统维护手册》

[2]《本地网光缆线路维护读本》

告警信息预处理 篇5

民航旅客服务信息系统是国家民航业重要信息系统,承载着民航大量的重要业务,需要保持每天24 小时无间断的持续运行,并具有安全性、可靠性、高效性和实时性等特点。系统的瘫痪甚至某个应用的服务中断、进程的丢失等都可能会导致多个民航业务的瘫痪。因此,国家和民航局对民航旅客服务信息系统的安全可靠运行提出了很高的要求。目前,日志记录是实现系统及应用软件全流程监控的一种重要方式,业务系统每天的运行情况都会记录到日志文件中。其中包含了非常重要的业务运行数据以及故障事件的前因后果等重要信息。尤其当系统发生故障时会出现大量的告警信息,这使系统维护人员不能及时准确地发现根源告警信息,更难以发现告警数据之间的关联关系,系统维护任务困难且繁重。所以科学合理研究分析告警数据之间的关联关系,显示根源告警信息,过滤掉根源告警引起的其他告警数据,实现故障的诊断、预测[1]和报警处理的智能化,对于及时处理故障、维护系统安全具有重要意义。

1 国内外研究现状

目前国内外很多学者提出了各种基于告警关联规则挖掘的方法,提高了相关性分析的效率和准确性。Gao等研究如何从大量告警数据中挖掘的关联规则[2]。Yan等[3]提出基于数值约束的方法来进行网络告警关联规则发现。徐前方[4]提出了一种基于相关度统计的告警关联规则挖掘算法。由于民航信息系统的告警信息的非结构化特性导致上述方法无法直接对数据进行规则挖掘,另外对于时间维度上告警信息如何处理成待挖掘数据集也是一个难点。本文针对告警数据的特殊性,运用滑动时间窗口模型,针对窗口大小和步长进行探讨,来生成事务集,并对事务集进行告警关联规则挖掘。

2 安全监控系统及告警数据特征分析

2. 1 安全监控系统

安全监控系统是监控民航旅客服务信息系统各个应用子系统的平台。监控系统在每个应用子系统上部署一个Agent端点,每当应用子系统发生故障就会发出告警信息,Agent端点负责信息采集,监控系统把告警信息进行简单分析然后把相应的告警发送给维护人员。同时,监控系统也把告警数据存放到日志文件中去,告警监控示意如图1 所示。

2. 2 安全监控系统告警数据特征

安全监控系统采集的各个应用子系统的告警数据有着不同于其他行业数据的特点,它存储于日志文件中,属于一种非结构化数据。通过分析和研究监控系统的告警数据将其特征总结如下:

1) 海量数据。由于民航业飞速发展,应用子系统越来越多,而且联系越来越紧密,设备与设备、系统与系统之间的关系也越来越复杂。这造成一个设备出现故障,可能会引发其他设备也发出告警信息,系统拓扑结构是产生大量告警信息的主要原因。

2) 时序性。告警数据的产生在时间上是呈现为先后顺序的,也就是说根源故障总是先发生,继而导致后续故障发生。它们有很强的时间关联,这也是确定告警根源的一个重要依据。

3) 关联性。由于应用子系统之间和设备之间的关联关系,告警之间的激发关系,所以使得告警数据之间存在有意义的关联关系,此特性是挖掘分析与研究的重点。

4) 非结构化。告警数据存放于日志文件中,它是一种文档格式,没有固定结构,只存在一定的格式标准。同时故障中存储的信息也是多种多样,不只告警信息,这就造成通常挖掘算法不能直接应用到原始日志文件中,必须对日志文件进行预处理,把告警数据处理成结构化数据,方便挖掘。

3 告警关联问题描述及挖掘算法模型介绍

3. 1 告警关联问题描述

3. 1. 1 告警数据处理

告警数据存储在日志文件中,日志文件的非结构化形式存储使得通用挖掘算法不能直接应用于此告警数据,必须得经过数据预处理,提取告警数据将其转化为结构化数据,使其能够被挖掘算法所处理。数据预处理是数据挖掘过程中重要且关键的一步,数据预处理的好坏决定着关联规则挖掘的质量与效果。告警关联分析模型如图2 所示。

用正则表达式提取日志文件中具有XML形式的告警数据,并保存XML格式的文本。用Dom4j框架解析保存好的XML文本,提取各个应用子系统的告警信息,去除噪声数据( 即缺失关键字段信息的告警数据) 并保存为结构化形式数据。每条数据按D = { Event_hostname,Event_name,Event_id,Source,Info,Time,Level,Agent_name} 形式存储到数据库中,其中Source表示告警发生源头,实际就是告警所发生的主机的IP地址,Info表示告警信息,Time表示告警发生的时间,Level表示故障等级。

3.1.2相关问题描述

定义1告警序列[5,6]

告警序列S是由告警信息集合上的多个有序的告警组成,表示为S = { s,Ts,Te} ,Ts为告警序列起始时间,Te为告警序列终止时间。如图3 所示,告警序列由多个告警事件( A,t) 组成,A代表告警信息,t代表告警发生时间。

定义2 告警窗口[7,8]和滑动步长。

对于给定告警序列S = { s,Ts,Te} 上面的一个告警子序列,可以表示为Sw= { w,ts,te} ,ts> Ts,te< Te,w = te- ts表示窗口宽度,图3 第一个告警窗口内发生的告警事件有< A,B,C > 。滑动步长为当前告警窗口向后滑动的距离,这里用d表示。

定义3 告警关联规则。

给定一个告警序列S ,告警情景 α 是告警序列组成的告警集合,设定告警窗口宽度w ,滑动距离d 。遍历整个告警数据库序列集。若告警情景 α 发生的频繁程度大于给定的最小支持度Min Sup ,则说明告警情景 α 是频繁的。

告警情景的置信度定义为:

若告警情景,情景 α 、β 都是频繁告警序列并且满足conf大于最小置信度Min Conf ,则可以得出一条告警关联规则: 若情景 α 出现,则在一个告警窗口内,情景 α 出现的概率为90% 。

定义4 告警偏序关系[9]。

下面介绍告警序列中告警信息间的三种偏序关系( 如图4所示) 。

( 1) 串行关系

根据告警数据的时序性,告警序列间发生告警是有先后引发关系的。当一种告警事件发生时,会引发另外一种或多种告警事件发生,且这种关系是固定不会逆转的,即,但不存在 βα ,则称这种关系为串行关系。

( 2) 并行关系

对于告警情景 α 、β ,α 发生 β 也发生,β 发生 α 也发生,即它们之间没有严格的时间先后关系,总是同时发生,则称这种关系为并行关系。

( 3) 混合关系

告警情景( c) 由告警事件E、F和G组成,且通常告警E和F共同发生后会引起告警G发生,那么E、F和G为混合关系。其实混合关系也是串行关系与并行关系的一种综合关系。

3. 1. 3 时间窗口宽度和滑动步长选择

时间窗口宽度和滑动步长是影响规则挖掘结果的两个重要因素。时间窗口宽度过小会使一些有关联的告警事件无法被挖掘出来,时间窗口过大会造成原本没有关联的告警事件当作关联规则被挖掘出来。本文时间窗口宽度设置依据是,统计整个告警数据集上告警事件的持续时间,并根据时间分布比例来设置窗口宽度大小。

滑动步长的选择以保证相邻窗口有足够的重叠为原则[10]。滑动步长越小,相邻时间窗口内告警相关性越强,挖掘的关联规则越多。滑动步长越大,相邻的两个时间窗口内告警重叠越少,告警相关性越弱,挖掘的关联规则越少。滑动步长取值范围为Smin< d < ΔW 。其中Smin表示告警事件内不同情景间隔的最小值,ΔW为告警事件持续时间的长度。

3. 2 基于时间滑动窗口的关联规则挖掘算法

本算法主要分为两个主体部分: ( 1) 生成告警关联数据集;( 2) 告警关联规则挖掘。其中在生成告警关联数据库部分,为了压缩告警数据,提高挖掘告警关联规则的效率,运用了有效时间窗口的思想。

3. 2. 1 生成告警关联数据集

首先设定时间窗口的大小以及窗口滑动距离,遍历整个数据预处理后的告警数据集,产生告警关联数据集。由于告警数据集的告警字段很多,为了提高算法的挖掘效率,对字段进行缩减,只提取那些对告警关联规则挖掘紧密相关的字段。本算法主要提取四个字段: ① 发生告警的主机IP; ② 产生的告警信息,描述发生了何种告警信息,包括故障类型,产生原因; ③ 告警发生时间; ④ 告警发生等级。最终生成了告警数据库,每个时间窗口内发生的告警事件作为一条数据集,每条数据集记录了告警信息,告警发生时间、告警数据所发生在的主机IP地址以及在窗口内发生的次数。

由于系统并不是时时刻刻都在告警,有些告警数据中间的时间差比较大,这样就会造成时间窗口在数据集上按照时间维度滑动时,有些时间窗口内并没有告警事件发生,这样就产生了空时间窗口,称为无效时间窗口。整个时间序列上有效窗口的个数为:

其中,| W( S,W) ' | 表示无效窗口数。显然,在生成频繁项集过程中需要扫描数据库,无效窗口浪费了很多扫描时间,占用了大量空间。本算法去掉所有无效时间窗口,基于时间窗口的思想进行实验,大大提高了算法的效率。由式( 1) 可知,时间窗口数量| W( S,W) | 减小,支持度也提高了。

分析告警数据时发现在一个时间窗口中,同一个告警事件在一个时刻发生了多次,而且在不同时刻也发生了多次。为了压缩告警数据库,同时避免一个告警事件在一个窗口内发生频繁而其他时间窗口极少发生而被计算成频繁项的情况,本算法采用如下处理模型,一个时间窗口中同一个告警事件发生了多次被记录一次。为了保证原有告警数据的时序性,严格按照告警事件发生的时间顺序进行记录。

3. 2. 2 告警关联规则挖掘

本文采用FP-Tree的序列模式挖掘算法[4],通过两次扫描数据库,构造FP-Tree,在以后发现频繁项集的过程中,不需要产生候选项集,效率明显强于Apriori算法。基本思想为: 首先通过FP-Tree的改进,将告警数据压缩到FP-Tree上,然后对FP-Tree自底向上查找频繁告警项集,最后挖掘告警事件间的时序关系。算法的输入输出如下:

输入: ( 1) 告警序列S; ( 2) 滑动窗口宽度w和滑动步长d( 3) 最小支持度Min Sup; ( 4) 最小置信度Min Conf。

输出: S中满足Min Sup和Min Conf的关联规则。

4 实验测试及结果分析

在CPU为Intel 2140-1. 6 GHz,内存为2 GB,操作系统为Window7的计算机环境下,用Java对数据库SQL Server 2008 里存储的已预处理的告警数据进行了实验。对2013 年12 月1 日到2013 年12 月21 日的告警数据的告警事件持续时间进行统计分析,对告警事件按持续时间进行划分,不同持续时间的告警事件所占比重如图5 所示。

由图5 可知,持续时间在16 分钟以内的告警事件大约在整个告警数据集中95% 左右,也就是说绝大部分告警事件会囊括在宽度为16 分钟的时间窗口内。实验中设置滑动窗口的宽度为16 分钟,滑动距离大小为8 分钟,设置最小支持度为8% ,置信度为85% 。实验数据为民航旅客服务信息系统连续三周的告警数据,大约46 000 条告警记录,27 种告警类型。实验挖掘出的告警关联规则如表1 所示。

以第一条规则为例解释挖掘出关联规则的含义: 当IP地址为10. 6. 141. 16 的子系统下发生了ALARM_TLOG_RESTART这个告警时,在时间窗口大小16 分钟内,IP地址为10. 6. 141. 16 的子系统下发生ALARM_TLOG_ERROR这个告警的概率为91.3%。

为了验证挖掘出关联规则的准确率,进行了另外一组验证实验,验证数据是2013 年12 月22 日到2013 年12 月31 号产生的告警信息。把告警信息与关联规则前件进行匹配,如果告警信息和规则后件描述一致,则规则匹配成功,否则匹配失败。部分关联规则准确率如表2 所示。

根据上面提到的关联规则之间的偏序关系,对挖掘出来的告警关联规则进行意义及应用分析。比如表1 中第一条告警关联规则满足串行关系,其意义有两点: ( 1) 追溯故障源,把告警规则的前件当作故障源来处理; ( 2) 压缩冗余的告警数据,系统在发生告警时会报出大量数据,除了故障源之外,与故障源关联的其他系统也会报出告警数据,这样在下次系统发生规则前件的告警时,让安全监控系统的Agent只提取出规则前件的告警信息,其余告警信息过滤掉。表1 中的第二、三条告警关联规则属于偏序关系中的并行关系,当规则前件的告警事件发生时可以预测另外IP地址下的子系统将要发生的告警。第七条规则属于混合关系,规则前件的事件都发生后来预测规则后件的告警。这些规则的意义对于维护人员来说可以提前采取措施进行处理,及时恢复系统。

5 结语

本文根据民航旅客服务信息系统产生的告警数据的特征进行了数据预处理并用基于事件窗口滑动的框架模型进行了告警关联规则的挖掘并取得有效的实验结果。系统维护工作的繁杂使得告警关联规则的挖掘很有必要。挖掘出的告警关联规则对于系统维护人员进行故障定位、告警数据压缩以及告警事件的预测起到了决策支持的作用。下一步将对支持度以及置信度等参数的设置对实验结果影响做更细致和深入的研究。

摘要:告警关联规则挖掘是进行系统故障诊断、定位的重要方法。由于民航旅客服务信息系统的各子系统之间的关联关系,子系统一旦出现故障,会报出大量甚至海量的告警信息,使得维护人员在大量告警数据面前无法准确进行故障定位。针对故障诊断、定位等难题,提出基于滑动时间窗口框架的关联规则挖掘方法,在大量告警信息中寻找故障源、故障因素之间的关联。实验结果表明,提出的方法能准确、快速地发现有价值的告警关联规则,为系统维护人员提供决策支持。

关键词:滑动时间窗口,告警关联,规则挖掘,频繁项集

参考文献

[1]张现飞,侯思祖.电力通信网监控系统告警关联分析[J].电力系统通信,2009,30(1):47-50.

[2]Gao H S,Li Y M.An efficient communication network SDH alarm association rule mining algorithm[J].Advanced Materials Research,2014,926-930:1870-1873.

[3]Yan H,Zhang T.Association rules mining based on numeric constraint[J].Advances In Information Sciences and Service Sciences,2012,4(23):634-642.

[4]徐前方.基于数据挖掘的网络故障告警相关性研究[D].北京邮电大学,2007.

[5]徐前方,阚建杰,李永春.一种具有时序特征的告警关联规则挖掘算法[J].微电子学与计算机,2007,24(3):23-26.

[6]Li T,Li X.Novel alarm correlation analysis system based on association rules mining in telecommunication networks[J].Information Sciences,2010,180(16):2960-2978.

[7]李国辉,陈辉.挖掘数据流任意滑动时间窗口内频繁模式[J].软件学报,2008,19(10):2585-2596.

[8]Hou S,Zhang X.Alarms association rules based on sequential pattern mining algorithm[C]//Proceedings-5th International Conference on Fuzzy System and Knowledge Discovery:2008:556-560.

[9]刘康平,李增智.网络告警序列中的频繁情景规则挖掘算法[J].小型微型计算机系统,2003,24(5):891-894.

[10]李彤岩,李兴明.基于双约束滑动时间窗口的告警预处理方法研究[J].计算机应用研究,2013,30(2):582-584.

[11]陈辉,邓庆山,杨兵.挖掘数据流最近时间窗口内频繁模式[J].小型微型计算机系统,2009,30(12):2404-2408.

告警信息预处理 篇6

1.1 监控系统现状

珠海供电局自实行“调控一体”模式以来,将主网调度、配网调度及自动化系统进行了统一化管理,全部信息汇总到调度监控中心。在这种运行模式下,调度监控员能更加直观地、全面地掌握和控制电网设备的运行、异常信息,从而能方便迅速地分辨设备的运行健康状态。但是也会使得DF8003系统的报警信息量大大增加。尤其在大型电网故障或者台风等恶劣天气下,告警系统能在几秒钟内瞬间涌入几万条告警信息,此时会使得调度监控员根本无法从不停刷屏的显示界面中找出有效的告警信息,不但会延误事故的处理,而且很容易遗漏关键的事故告警信息。

1.2 原因分析

通过统计分析,珠海供电局调控中心的调度监控员平均每天要在DF8003告警信息系统中翻阅确认的告警信息接近6万余条。当珠海地区发生雷雨等恶劣天气或跳闸故障时,DF8003系统在一小时内会上传十万多条事故信号(台风“伟森特”期间一小时内上传信号共计13万余条),但按照相关规定,监控员必须在5分钟内,从不断刷屏的告警信息栏中找出具体的故障点并报告给上级调度值班人员,庞大的告警信息量严重影响了故障信息准确、快速地查找与上报。经过对DF8003系统告警信息的初步分析后发现,在大量的告警信息中能真实反映设备跳闸,保护动作等重要故障或缺陷的信息只占到所有告警信息的5%,而其余95%的告警信息则属于类似瞬时动作有复归的非重要信息,对于这类告警信息只是属于辅助判断信息,不需要通知检修或继保专业到站处理。

在调度监控员日常工作中,发现DF8003系统信息告警系统中有以下几点不足。

(1)由于站内设备检修或者通讯设备故障等引起的某一设备或者间隔的告警信号频繁动作又复归,在此类信号刷屏过程中,监控人员容易遗漏夹杂在内一起显示的重要告警信号,延误故障的处理时间。

(2)电网发生大的故障或者遇到大的系统扰动的时候,系统中会有大量的告警信息上送并不断滚动刷屏显示,将重要的跳闸或保护动作信号淹没在其中,造成调度监控员无法在短时间内提取出有效的告警信息,不能快速对事故的根源进行判断,影响了事故处理时间[1]。

对于95%的非有效告警信息的处理,目前的做法也是和设备异常告警信息一样的方式处理,即“在报警窗口中发现,到调度界面上禁止”,对报警信息的筛选查询也不够直观快捷。为此,提出对现有的报警信息进一步优化分析,挖掘其潜在信息,利用这些信息尝试对上述几个问题进行研究,并最终开发出告警信息优化系统——NAX。

2 告警信息优化系统NAX功能介绍

2.1 NAX系统概述

NAX是Net Alarm e Xtension的缩写,即网络报警扩展系统。该模块主要实现功能有:报警系统信息的时间抽屉显示方法;对报警点的禁止/启用,人工置入,禁止/激活刷新等操作;按厂站或间隔对报警点的即时过滤显示;报警注释,按时段禁止/启用报警;报警界面人工设置;报警点的历史查询等。

NAX主要是面对调度和监控人员而开发的一个报警处理补充模块,其主要目的是简化操作人员的日常工作,方便快捷地处理值班人员在监盘过程中遇到的问题。同时对报警信息的深入挖掘,给报警信息提供了注释功能,也为值班人员提供了一种新的事项处理模式。

综合来说,NAX具有以下创新点:

(1)抽屉式显示方式,即相同时间的报警信息项,只显示其第一条事项的时间,保持界面简约化;

(2)即时报警操作,在报警信息窗口上直接对报警点进行报警许可/禁止,人工置入/禁止报警,激活刷新等操作;

(3)即时报警查询,在报警窗口上直接对报警点所属子站、间隔进行报警过滤查询;

(4)报警注释,对任何报警信息进行用户化信息注释;

(5)报警预定时间段禁止和启用功能;

(6)即时历史事项查询,针对报警事项所属报警点按子站,间隔,关键字等条件在指定时段区间的历史事项查询,查询结果按树形结构显示。

NAX是基于DF8003系统平台研发的一套独立的模块功能,因此对DF8003报警系统中已有的功能,NAX并没有去重复,NAX关注的,恰恰是当前报警系统中没有的功能,或者调度/监控人员在DF8003报警系统中操作不太方便的功能改进。

如图1所示,NAX和DF8003报警系统中的报警来源和报警处理数据流都是DF8003的SCADA系统,因此在NAX的一些操作,会体现到DF8003系统的SCADA或报警处理界面上,如告警确认,删除,报警点禁止,人工置入等;而在SCADA或DF8003报警系统上的报警操作,也可能会反过来反映到NAX界面上。

但是,NAX和DF8003报警系统之间并不存在相互依赖关系,即NAX并不依赖于DF8003报警系统而存在,它可以单独显示和处理自己的报警,也可以和DF8003ALARM并行运行而互不干扰。

2.2 NAX优化告警信息实现原理

针对95%的非重要告警信息的进一步研究分析发现,可以分为以下几类。

(1)调控一体化系统会输出大量的频发信息,其中绝大部分都属于一般性的告知信息,一般情况下对于变电站设备监视并无太大意义,但在某些特定情况下又有可能成为重要信息,如远动机、前置机和主站切换产生的重复信号等,故既不能弃之不用,又不能让其占据有限的屏幕资源和牵扯监控人员的过多时间和注意力[2]。

NAX系统能对此类的频繁动作又复归,但对监盘工作来说又没有太大意义的告警信息进行分析和统计,通过程序的算法和过滤信息的规则将其进行“压缩”,将频繁动作告警的同一信息装在同一个“抽屉”里。使得在有限的告警信息显示界面留出空间,来显示更重要的告警信息,避免了此类信号刷屏的弊端。

NAX主窗口主体背景为深蓝色,显示内容为当前电网运行状态下系统的详细报警信息,报警信息的展示以时间为排序依据。为简约起见,NAX并没有将不同类型或优先级的告警设计成不同的颜色,避免使用者因颜色过多而失去注意力。在这里,黄色表示动作已确认报警,红色表示动作为确认报警,绿色表示复归已确认报警,浅青色表示复归已确认报警。当前选中报警则以灰底色,蓝前景色表示。若一条报警为未确认状态,则在报警时间与报警信息描述之间会以暗红色“*”闪烁提示,如图2所示。

若相邻的两条报警发生日期相同,则NAX会隐藏先前一条报警的日期,只显示其发生时间,这样,NAX把相同日期的报警放在一个“抽屉”里,给监控人员一种一目了然的感觉,NAX把这种显示模式称之为“抽屉式”显示模式。

(2)由于电力系统扰动造成电压、电流、有功、无功等遥测突变信息或者现场测控、通信装置的故障、时钟对时中断等因自动化设备抗干扰能力有限而误发的抖动信息或频繁动作告警信息,此类信息通常经几秒或几分钟后会自动复归,只有长时间动作才表明现场设备确有异常[3]。

对于此类干扰类信号,在NAX系统中采用的解决方案是通过简单的告警栏颜色来区分,在告警确认栏中,黄色表示动作已确认报警,红色表示动作为确认报警,绿色表示复归已确认报警,浅青色表示复归已确认报警。当前选中报警则以灰底色,蓝前景色表示。若一条报警为未确认状态,则在报警时间与报警信息描述之间会以暗红色“*”闪烁提示。

对一条告警执行确认操作,其执行确认的逻辑与DF8003ALARM保持一致:

1)若该告警信息状态为已确认且未复归,则告警确认栏中显示为黄色,确认操作简单返回,不做什么处理;

2)若该告警信息状态为未确认但已复归,则在限定时间内(如控制回路断线”延时5 s、“弹簧未储能”延时20 s、“、“通讯中断”延时20 s等)确认后该告警被确认并从界面上删除,如超过规定时限后信号未进行确认操作且信号无再次发出,则从告警确认栏中自动删除;

(3)变电站站内正常的计划检修测试工作所引起的大量相关设备或间隔的一二次设备告警信息,以及经现场设备由于存在故障或者缺陷但尚未处理期间产生的告警信息,此类信息有部分也会频繁告警又复归,导致在告警界面不停刷屏。NAX能对该设备的报警状态进行设置,使其暂时不上传时序告警窗。

如图3所示,通过对相应设备的报警许可属性设置,可以实现自动禁止上传该设备相关报警信息到告警信息确认栏,但在后台会有记录,方便日后查询。

2.3 NAX告警信息查询统计分析功能

在NAX系统中,当选择显示当前厂站或间隔报警后,NAX会记住这些条件,并对以后新产生的报警信息以此条件过滤显示。如图4所示为选择“大港新站220 k VI母主二保护B网通讯终端恢复从动作”报警的“当前间隔报警”过滤条件后的查询结果。

报警查询条件可以叠加,比如用户可以先选择某条告警信息的“当前厂站报警”,NAX会过滤显示报警点所属厂站的报警信息,再在查询结果中查询选中报警的“当前间隔报警”,则会过滤出属于该厂站和间隔的报警信息。

通过此项功能,调度监控员可以针对某一设备或间隔进行查询,能快速和清晰地了解和分析近期该设备或间隔的运行状态,无需逐条查看所有告警信息,就能快速对设备的健康状态进行一个综合性的分析,大大缩短了调度监控员对事故异常的处理时间,提高了工作效率。

3 NAX系统投入运行后的效果检查

经统计分析,采用NAX系统后,珠海电网的告警信息系统界面的日平均告警信息量从原来的43000条降低到平均15090条。与原DF8003系统告警系统相比,复杂故障的判断时间可缩短45 s以上。且告警信息量越大越复杂,新系统的效率就越高,准确率提升越明显。

4 结论

NAX系统的研发和投入运行,有效解决了珠海调度监控人员既要查看确认大量告警信息又不能遗漏重要信息的问题,大大缩短了对事故判断处理的时间,提高了监控的工作效率。减轻了调度监控人员大量的告警信息人工筛选工作,避免了跳闸,保护动作等重要告警信息的遗漏,降低了设备运行留下安全隐患的几率。大大提高了珠海电网的供电可靠性,为珠海、澳门地区的经济发展做出了贡献。

摘要:随着调控一体化系统的建设与发展,珠海供电局在2009年正式使用DF8003系统,然而调度监控员在海量信息中提取出有效的设备告警信息并能及时、准确做出判断,成为了现今一个急需要解决的难题。针对珠海供电局调度监控系统日常告警信号的分析研究,研发出基于DF8003系统平台的NAX告警信息系统。随着NAX的应用,调度监控员日常工作的监控效率和准确率都得到大幅的提高,从而提高了珠海电网的供电可靠性。

关键词:调控一体化,珠海电网,信息告警优化

参考文献

[1]施正钗,张雯燕.电力调度监控一体化系统的信息告警优化研究[J].浙江电力,2013(06):67-69.

[2]周琬津.关于调度自动化系统告警信息优化处理的探讨[J].电子世界,2014(06):105-106.

[3]辛耀中.新一代电网调度自动化系统[J].电力系统自动化,1999(2):1-4.

[4]王勇,陈新,王瑛.基于多智能主体的电网监控与指挥调度集成系统[J].计算机应用,2006,26(7):1721-1723.

[5]赵艳光,常倩.集控站系统与电网调度自动化[J].油气田地面工程,2008,27(1):59-60.

告警信息预处理 篇7

1 监控信号的有关规范

1.1 监控信号名称

监控信号名称可以通过这个公式来表达出来, 先是变电站的名称, 再次基础上加入电压基本以及设备的名称, 然后再加入信号规范以及间隔名称。监控信号规范主要是将信号按照具体的情况表达出来。因为这样才能让工作人员及时的掌握到电力系统的运行情况。

1.2 监控信号类别划分

在划分监控信号的时候, 应该按照特定的规律来划分, 通过对信号的划分, 可以方便工作人员监控信号, 尤其是关键的信号。在监控信号的过程中知道电网的运行状况。现阶段我们在将信号划分的时候, 主要分为三个类型:第一个类型是因为操作行为不合理, 或者是运行的设备出现故障时发出的信号, 上述的2 个问题使设备在运行的时候, 有安全隐患。第二种类型是电网设备在运行的时候, 运行状况不稳定, 还有设备的本身存在问题等情况而发出的信号。第三种信号类型是反映出设备在运行时的具体情况, 以及运行的方式。

2 信号监控工作的类别

调控一体化最主要的环节就是合理的监控信号, 然后分析信号。如果能够做好信号的监控工作, 那么在调控的时候, 调控工作开展的很顺利。这也是电力系统开展电控工作的重要前提。电力调控中心每天都会有很多的监控信号, 而且信号的数量与天气变化有关, 如果天气恶劣, 那么监控的信号会更多, 而且电力检修也与信号的监控有关。因为每一天收集到的信号很多, 对信号的处理就很难, 在开展工作的时候, 还要保证效率。所以我们需要将信号划分, 根据不同的信号, 开展的采集工作也更容易。

2.1 实时信号监控

本篇提到的监控信号实际上就是监控人员划分信号的类型, 有些信号属于紧急信号, 那么工作人员需要马上处理。监控人员在收集到信号的时候, 能够将所获取的信息合理的分析, 从而了解系统中的情况, 尤其是系统中的问题, 并为系统排除隐患。保证电力调控工作的进行。从而使工作人员在处理电网事故的时候更容易。

2.2 后台信号分析

收集以及分析信号的工作都是在后台进行的, 在后台进行的信号分析工作更深入, 而且具有广泛性。在后台开展的监控工作可以知道系统中出现故障的位置, 尤其是常见的电网系统。然后有针对性的管理好信号, 并做好系统的防护工作。

3 监控信号的显示方式

信号在监控的时候, 会展现出不同的形式, 而我们能做的就是科学的设计出信号的展现形式。这样才能保证监控信号及时, 而且做好分析工作。在开始监控信号的时候, 要分清哪些信号是关键的信号, 然后保证这些信号能够全部并且详细的传递给监控人员。因此在监控信号的时候, 要划分其类型。

(1) 系统中的开关位置出现跳闸等事故, 出现的信号是变位信号, 通过这个信号可以知道开关的位置出现了异常。 (2) 在出现事故的信号区域, 这类信号属于一类信号, 信号反应出了电网设备跳闸的位置, 还有哪些位置可能会影响变电站运行。 (3) 出现异常的信号区域, 这一区域主要是反映了哪些信号有异常, 还有哪些位置属于硬节点。 (4) 体现信号运行状态的区域, 这一部分主要是反映了设备在正常运行的状态, 这类信号属于三类信号。 (5) 遥测越限区, 这一区域主要是反映了区域内的负荷以及电压, 还有电流以及功率的变化。 (6) 综合信号区域, 这一区域主要是能够反映出整体电气的信号, 包括试验信号以及AVC事项信号等。 (7) 如果系统中的一些信号出现了越限信息, 那么会出现报文报警。

4 异常信号的管理

4.1 装置定值不合理的异常信号

系统内的保护装置在启动的时候会发出信号, 同时也有返回数值, 这两种数值会在某一范围内重合。再出现重合的时候, 设备的运行就会异常, 同时也向控制中心发出信号。因此在解决这个问题上, 要与调整数值的工作人员沟通, 而且为数值的调整制定一个合理的范围, 以免再次出现信号重合的可能。

4.2 操作伴生信号

设备在运行的时候会出现伴生信号, 而这个信号是伴随着设备运行而出现的。这种信号有一个明显的特征就是复位快。因此在监控的时候, 要将伴生信号过滤, 从而屏蔽该信号。当监控人员在接收到信号的时候, 接收到了伴生信号, 那么监控中心会将这种信号放在缓存区域。然后查看系统是否出现了复归事宜, 如果是在较短的时间内就有复归事宜, 那么监控中心会将信号继续留在缓存区域, 不能将其报出。

4.3 遥测越限频报信号

工作人员也对遥测越限信号开展了研究工作, 在研究中发现, 系统出现遥测越限信号是因为系统中的载流量变化, 载流量改变但是遥测越限信号却没有变化, 而电力系统还是按照最初的限制范围来限制信号。还有一个原因是因为系统中的负荷上升, 其负荷数值已经超过限制, 因此出现了越限问题。在出现越限信号的时候, 信号的报告会有误差, 这使得很多的越限信号不能及时的接收。

5 结束语

当前经济建设的加快以及生产力水平的提升, 都对用电有了越来越高的要求, 这就要求电力系统在之前的基础上必须进行进一步的完善提升, 以达到更高的标准。电力系统应该在确保供电质量符合社会要求的情况下, 对于系统本身的安全性能加以增强。因此在先进信息技术的支撑下, 要实施调控一体化的管理工作, 实现对电网系统运作的实时监管控制, 这样能够在第一时间找出电网系统运行过程中出现的问题及隐患, 进行及时的处理和排查工作。

参考文献

[1]田新成, 尹秀艳, 韩宝民, 杜鹏, 班阳.调控一体化.系统信号与监控界面优化分析[J].电工技术, 2013, (1) :28-30.

[2]朱秀萍, 肖恺.对电力系统中电网调控技术应用的探讨[J].中华民居 (下旬刊) , 2013, (1) :252-253.

[3]刘健, 谢旭, 牛四清, 江长明, 张哲, 张文斌.电网调控仿真培训系统设计与实现[J].电力系统自动化, 2013, (13) :127-131.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:心理状况分析 下一篇:智慧党建云平台对提升党建工作成效和促进生产工作开展的研究——以广州地铁运营事业总部运营三中心实践为例