车流量预测

关键词: 交通流量 预测 交通 规划

车流量预测(精选十篇)

车流量预测 篇1

本文采用线性回归方法实现对某条道路或者某片区域内的车流量及拥堵情况的预测, 为道路交通的管理决策提供参考依据, 为出行者的行车路线进行前期规划, 亦可为道路设计、红绿灯时间设置等提供设计依据。

1 车流量预测模型

1.1 系统综述

如图1所示, 用户首先输入所要预测区域的卡口编号, 然后输入所要预测流量变化的时间区间, 即可实现车流量的预测, 并将车流量的预测结果展示在页面上, 方面使用者直观的查看。

具体如下:

输入:输入用户需要查询的卡口号、起止时间及时间间隔, 对过车的平均速度进行查询。

选择卡口:通过在GIS上选择要查看的卡口, 将卡口号代入到流量预测页面的卡口输入框中。选择要预测的卡口号, 点击确定按钮进入过车流量预测页面;点击取消按钮重新选择卡口。

起止时间:选择对卡口流量预测的开始时间与结束时间。

预测:对输入的卡口进行车流量预测。

车流量预测展示:将分析的结果以曲线的形式展示出来。如果输入历史时间, 则黑线是预测出的车流量, 红线是实际的车流量;如果输入未来时间, 结果将用黑线展示出来。其中横轴代表的是预测的时间段, 纵轴代表的是卡口的过车流量。

1.2 实现原理

本系统首先对卡口系统中的过车数据作数据清洗等预处理操作, 然后根据处理后的过车数据得到实际车流量曲线。然后采用时间序列方法结合最小二乘法对车流量预测模型进行建模, 其流程图如图2。

步骤如下:

(1) 对数据进行特征变换及归一化处理, 并将历史数据集与处理后的实时数据集合并在一起。

(2) 通过主成分分析方法对预测模型的各个特征属性对最终预测结果的影响值进行计算。

(3) 将各特征属性的主成分计算结果按从大到小的顺序进行排序, 通过设定阈值得到车流量预测模型的特征属性, 达到特征选择的目的。

(4) 确定包括历史流量特征属性在内的车流量预测模型的法方程。

(5) 利用最小二乘法对车流量预测模型的法方程进行求解, 从而确定最终的车流量预测模型。

1.3 测试结果

该车流量预测模型已在平安城市的卡口系统中应用, 其应用结果如图3。

图中横轴代表的是预测的时间段, 纵轴代表的是卡口的过车流量, 红线为实际的车流量值, 黑线为车流量的预测值, 水平红线为数据缺失时间段。由图3可知, 在数据缺失的情况下, 系统仍然有较高的预测精度, 可见该车流量预测系统具有较好的鲁棒性。

2 结束语

综上所述, 本系统针对当前城市中日趋明显的交通拥堵问题, 将基于时间序列的线性回归建模方法应用于道路车流量的预测进而得到城市道路中的拥堵点, 并可将预测得出的离散拥堵点合并为区域性的拥堵子区域。该系统可广泛应用于自动导航系统的路线规划以及城市道路交通的管理中, 有效提高道路的利用率、避免车辆进入拥堵区域。

参考文献

[1]郇洪江, 宫宁生, 胡斌.改进的BP神经网络在交通流量预测中的应用[J].微电子学与计算机, 2010, 27 (01) :106-108.

[2]杨兆升.城市交通流诱导系统理论与模型[M].北京:人民交通出版社, 2000.

[3]郑应文.基于信息融合的交通拥堵智能预警系统研究[C]第十一届中国人工智能学术年会, 2005年, 会议记录ID:6145707.

春运进出京客流量预测报告 篇2

20春运共40天,将于明年1月13日开始,至2月21日结束,是近五年来最早的春运。根据预测,年春运期间进出京客流总量预计达4191.9万人次,同比增长3.4%。由于学生、务工、探亲流三大客流相互叠加,客流高峰将一直处于较高水平。

2017年春节较20早11天。各大中专院校寒假放假日期在春运运输期限内(在京各高校放假时间为1.9―1.23),形成学生、务工、探亲流三大客流相互叠加,客流高峰呈现来得早、时间长、峰值高的特点。

据预测,客流将一直处于较高水平,并于节前3至5天形成客流最高峰;节后返程客流高峰相对集中,第一个返程客流高峰主要集中在农历正月初四至初六,第二个返程客流高峰正月十五前后三天,第三个返程高峰在春运最后一周,学生、务工人员多种客流交织叠加。

市内交通压力将持续增大。一方面,铁路增开临客79对,其中夜间18对;民航同时增加了夜间飞行航次。另一方面,极端天气出现的概率加大,极易发生临客及航班因故晚点到达或在地铁停运后到达的情况,对铁路、民航、市内交通之间协同配合做到无缝衔接,提出更高的要求。

据悉,为更好地满足广大人民群众出行需要,全市成立了春运工作协调小组,将统筹协调全市春运工作。

春节继续实行高速小客车免费

据北京市交通委通报,根据预测,2017年春运期间进出京客流总量预计达4191.9万人次,同比增长3.4%;其中铁路2866.3万人次、民航1105.6万人次、公路省际客运220万人次。

针对北京市内公共交通情况,据介绍,北京春运期间公共汽电车预计运送乘客3.2亿人次;轨道交通预计运送乘客3.2亿人次。

春节期间,将继续实行高速公路小客车免费通行的政策,会影响500公里范围内的出行结构和出行时间。

除夕前两至三天,高速公路出京方向车流逐渐增多;除夕凌晨至上午,可能会出现瞬时的车流高峰。正月初五、初六的高速公路进京方向,可能会出现持续时间较长的车流高峰,遇有恶劣天气、交通事故,极有可能造成局部路段的严重拥堵,公路交通将面临巨大压力。

铁路、民航、省际客运保障出行

2017年春运期间,铁路方面提早赶前、精心组织、深入挖潜,力争通过采取优先补充图定运行线能力、重点安排能力紧张方向高铁临客、客流较大方向安排普速临客、提高车底使用效率,满足旅客出行。

北京地区图定始发客车达到478对,较年春运节前增加23对。具体为:北京站103对,同比增加3对;北京西站169对,同比增加10对;北京南站206对,同比增加10对。作为春运节前重点地区,北京地区安排始发终到长途临客运行线:节前79对(同比减少1对),节后74.5对(同比增加2对)。

各站始发长途临客方案具体为:北京站:节前29对(同比减少1对)、节后27对(同比减少1对)。北京西站:节前29对、节后28.5对(同比增加2对)。北京南站:节前18对、节后17对(同比增加1对)。北京东站:节前1对(同比增加1对)、节后1对(同比增加1对)。昌平北站:节前2对(同比增加2对)、节后1对(同比增加1对)。

根据预测,2017年春运期间北京地区首都机场和南苑机场计划进出港航班7.28万架次,比2016年预计增长2%。为更好地满足春运旅客出行需求,民航华北管理局将继续支持各航空公司在北京地区调整航线航班,尤其是今年冬春航季民航将航班审批改为了备案制,更便利航空公司自主调整运力,增加航班密度等。在保障旅客运输的基础上,将对重点物资及节日急需物品优先予以安排保障。

春运期间,全市10个省际客运站在确保正班运力不减少的基础上,计划开行加班车2950个班次,筹措备班运力787辆。针对节前出京和节后返京出现的客流高峰,各客运站将增加工作人员,做好客流的组织疏导。

此外,还将组织骨干企业373辆旅游客车支援省际班线备班运力,保障省际客运行业高峰客流运输需求;春节黄金周期间可投入运力6500余辆,保障运力充足。北京旅游集散中心组织运营世界文化遗产游、市内观光游等7条旅游热点线路,满足散客旅游出行需求。

公共汽电车日均安排运营15万余车次 邮政保障快递服务

春运40天,公共汽电车计划安排运营633万余车次,日均15万余车次;对始发和途经火车站、机场和省际客运站的36条夜班车,配备相应数量的公交机动车和机场巴士运营车辆,确保火车站、机场接续运输运力充足,重点做好节后返京客流高峰火车站、机场和省际客运站接续运输服务保障工作。

针对新线(段)开通后的客流特点,春运期间市地铁运营公司、轨指中心、京港地铁公司将根据春运组织实施阶段各时段客流情况,精细运行调度;出租汽车将加强运营调度,重点做好机场、火车站和主要客流集散地的运力保障。

针对节前货物运输需求量大、抢运任务重的特点,春运期间将加强对货运市场的监测,统筹货运物流及城市配送企业运力,做好煤、粮、油、气等重点物资和特运任务的运输,以及鲜活农产品、生活必需品等节日物资运输,满足企业生产和居民生活需要。

基于长相关网络流量预测分析 篇3

关键词:长相关;小波;AR;预测

中图分类号:TN711文献标识码:A文章编号:1007-9599 (2010) 09-0000-01

Analysis of Network Traffic Based Long Range Dependence

Chen Bo,Cai Ranran

(Sichuan TOP Vocational Institute of Information Technology,ChengDu611743,China)

Abstract:Based on the fact that wavelet transform can remove its relevant characteristics,and the improvement for Linear Prediction Model,this paper will tell how to accurately predict the long range dependence traffic.

Keywords:Long Range Dependence(LRD);Wavelet;AR;Predict

一、引言

传统的认为网络流量是服从Possion分布或近似为Markov过程,所以大都是基于线性模型来近似处理流量的发展趋势,主要有基于自回归(AR)或自回归滑动平均(ARMA)的预测模型。但是近年来对网络流量研究发现,实际流量表现出明显的自相似、长相关[1][2]特性。实际流量的分形特性不仅具有统计意义,并且对网络性能与网络控制有重要影响,尤其在网络资源有限的情况下,建立一个有效的网络模型来预测网络负载,并及时做出处理,将会极大的提高网络的性能与服务质量。在时域不容易解决的问题可以转化到频域中来。对于某些非平稳时间序列,其小波分解后的流量可以平稳时间序列来处理,这样就可以采用传统的预测方法]对分解后的时间序列进行预测,从而为某些非平稳时间序列的预测提供了一种新的方法。

二、小波变换的流量分解与合成

本文利用离散小波变化进行,小波基采用db小波和墨西哥小波进行试验。

设 表示其在第j层的尺度系数、 表示第j层的小波系数,由小波变换的系数递推可以得出:

(1)

三、实际流量预测算法

假定研究的过程x(n)是由一个输入序列u(n)激励一个线性系统H(z)的输出,H(z)是一个因果的线性不变离散时间系统,其单位抽样响应h(z)是确定性的。输出序列x(n)可以是平稳的随即序列,也可以是确定性的时间序列。若x(n)是确定性的,那么u(n)是一个冲激序列,若x(n)是随机的,那么u(n)应是一个白噪声序列。不论x(n)是确定性信号还是随机信号,u(n)和x(n)之间总有如下的输入、输出关系:

(2)

(3)

上面两个公式有不同的应用场合,公式(2)主要应用于确定性信号,而公式(3)主要用于随机信号。

若 全为零,则(3)式变为:

(4)

经过Z变换之后可得:

(5)

(4)、(5)式给出的模型就是自回归AR模型,它的含义就是该模型的输出是现在的输入和过去p个输出的加权的和。

大量研究已经证明实际数据是具有分形特性,并且是长相关的,由于AR模型不适用于长期预测,对具有长相关的数据不能准确预测,而小波变换正好能够近似去除数据的长相关性,因此这里可以考虑首先利用小波变换对实际数据作出处理,然后再利用AR模型进行预测,以此提高预测的精度。其具体算法如下:(1)首先选取合适的小波基对实际数据进行分解,得到相应的小波系数和近似系数。(2)其次,对每一层小波系数作为AR模型的原始数据,分别进行参数估计,然后用小波系数来驱动一个正态分布的信号,得到预测后的小波系数。(3)最后采用逆小波变换合成预测之后的数据。

四、性能分析

前面一节中给出了对长相关流量的预测模型,改进的思想主要利用了小波变换能够近似去除网络流量的相关性,对实际流量进行处理之后再建立相应的预测模型。这里我们利用Matlab中自带的FBM模型来产生长相关数据,然后分别利用改进后的AR模型和FRAIMA模型进行预测。设FBM模型产生一组H=0.96的长相关流量LD_DATA,长度为1000。同时使用改进后的AR模型与FRAIMA模型进行预测。

为了进一步将预测结果数字化,这里将两组预测的结果进行残差分析,得到的结果如表1所示。

从预测结果和残差分析的结果可以清楚看出,改进后的AR模型和FARIMA模型对长相关数据的预测都具有一定的精度,由此可以看出改进后的模型是有效的。

五、结语

本文针对实际流量表现出的自相似、长相关特性,结合小波变换能够去除流量的相关性,对现有的AR模型进行改进,使其对长相关流量具有一定的預测精度。同时对比FRAIMA模型对长相关流量的预测结果,验证了改进之后模型的有效性。

在后续研究中,可以考虑利用小波技术对多重分形下实际网络流量的分析与建模进行研究,以此建立适合实际流量特性的网络模型。

参考文献:

[1]洪飞,吴志美.基于小波的多尺度网络流量预测模型.计算机学报,2006,1

[2]王伟,彭锡涛.基于mallat算法的自相似网络流量随机建模[J].计算机应用.2003:4-8

车流量预测 篇4

随着我国经济的快速发展, 交通需求量逐年增加, 近些年来全国各地都加强了交通基础设施和智能运输系统的建设, 交通流量的预测是公路项目立项, 规划和设计建设的重要依据, 也是交通规划和交通诱导的前提和关键。交通流量预测按照时间跨度可以分为长期交通流量预测和短期交通流量预测, 按预测对象可以分为交叉路口流量预测和高速公路流量预测。短时交通流量预测是智能运输的核心内容, 准确的短期交通预测对于合理诱导和控制交通、减少交通拥挤等有着重要的作用。

为适应交通的快速发展, 达到比较理想的预测效果, 许多学者进行了深入的研究, 文献[1]采用三层结构的反向传播网络对全国公路客运量进行预测, 用神经网络预测的结果比传统方法更加准确;文献[2]采用三层结构的RBF来构造组合预测模型, 将两种单一预测方法得出的预测结果, 作为RBF网络的输入, 实际历史数据作为网络的期望输出, 提高了预测精度;文献[3]把遗传算法应用到智能交通运量预测的模型选择问题中, 有效地对数据进行了预测;文献[4]提出了一种新的短时交通流量智能组合预测模型, 得出组合模型的预测精度高于单项预测模型各自单独使用时的精度, 发挥两种模型各自的优势。

灰色GM (1, 1) 模型利用累加生成后的新数据建模, 其作用是弱化原始数据的随机性, 容易找出数据变换规律, 更加容易逼近非线性函数。BP神经网络具有自学习、非线性映射和并行分部处理的能力。结合两种预测方法的优点, 提出一种基于灰色神经网络模型的短时交通流量预测, 并利用遗传算法对其参数进行优化, 通过仿真验证方法的有效性。

1 道路交叉口模型与结构

图1为城市路网中典型的独立交叉口的交通流示意图。其中, q1 (k) 、q2 (k) 、q3 (k) 、q (k) 分别为东进口左转车流、北进口直行车流、西进口右车流转以及南出口车流, 在[ (k-1) T, k T]内的交通流量 (T为预测周期时间) , 得到下一时段[ (k) T, (k+1) T]内的交通流量:

其中, f (·) 为一非线性函数。同理, 可以得到北出口、东出口以及西出口的交通流量关系式。

由于交通系统是一个非常复杂的大系统, 具有高度的动态时变性、不确定性和非线性, 很难构精确的表达式, 为此, 提出了一种短时交通流量智能组合预测模型。

2 基于灰色神经网络的智能预测模型

2.1 灰色GM (1, 1) 预测模型

灰色预测方法是根据过去及现在已知的或非确知的信息, 建立GM (1, 1) 模型。它是以原始数据序列为基础建立的微分方程。灰色理论是将无规律的原始数据生成后, 使其变成较为有规律的生成序列, 然后用典型曲线拟合该曲线。设有原始序列:

对x (0) (t) 作一次累加生成数列得:

根据新的数据序列x (1) (t) , 建立白化方程:

式中, a, b为待辨识的参数。

将式 (3) 离散化后得到矩阵形式:

式中, Y为序列变量矩阵;X为一阶累加函数矩阵;B为估计量矩阵。

对方程 (4) 按最小二乘法变换, 得:

其中,

则微分方程的解为:

为x (1) (k) 序列的估计值, 对做一次累减得到x (0) (k) 的预测值:

2.2 BP神经网络

BP神经网络又称误差反向传播神经网络, 它是基于模仿人类大脑神经结构和功能而建立起来的一种多层前馈型信息处理系统。它具有吸引性、耗散性、非平衡型、高维性、广泛联结性和自适应性等。BP神经网络对交通流量的预测是十分有效的。典型基本结构以及神经元模型如图2所示。

在训练神经网络的学习阶段, 设有n个训练样本, 隐含层第j个神经元的输入变量为第j个节点的输出为upj=f (netpj) , 其中f (·) 为S函数, 一般情况输出层函数值为:y=f (net) , 定义神经网的输出误差为

2.3 灰色理论与神经网络的融合

神经网络模型具有短期预测精度高, 可以任意精度逼近非线性函数的优点, 但是需要大量、各种情况的全面的数据, 否则训练出来的神经网络误差比较大, 外延性较差;灰色GM (1, 1) 模型利用累加生成的新数据建模, 最主要的优点是可以减弱原始数据的随机性, 使得更加容易的找出数据变化的规律, 需要的样本数据少。结合两种模型的优点, 构造一种基于GM模型和BP神经网络模型的灰色神经网络交通流量预测模型。

GM (1, 1) 模型微分方程为:

对其求解, 得:

由文献[5]修正为:

将修正后的式 (8) 映射在BP神经网络中, 对其进行如下变换:

网络结构如图3所示, x为输入参数序号;w21, w22, …, x2n, w31, w32, …, w3n, 为网络的权值;y为网络预测值;LA、LB、LC、LD分别表示灰色神经网络的四层。

隐层和输出层权值赋值为:w11=a, w21=b1, w22=b2, …, w2n=bn, w31=w32=…w3n=1+e-at。LA, LB层神经元函数为线性函数;LC层神经元激活函数为Long-sigmoid函数:

灰色神经网络的学习流程:

(1) 用原始数据组成数列分别建立GM (1, 1) 模型。

(2) 根据训练数据特征初始化网络结构, 初始化参数。

(3) 计算网络权值和神经网络每层输出。

(4) 计算网络预测输出与期望输出的误差, 并根据误差采用BP学习算法调整权值和阈值。

(5) 判断训练是否结束, 若没有结束, 返回步骤 (3) 。

3 仿真分析

研究表明, 城市交通路网中交通路段上某时刻的交通流量与本路段前几个时段的交通流量有关, 并且交通流量具有24h内准确周期特性。首先采集4天的交通流量数据, 每隔15min记录一次该段时间内的交通流量, 用前三天的交通流量数据分别训练BP神经网络和灰色神经网络, 最后用训练好的BP神经网络和灰色神经网络预测第4天的交通流量。软件采用Matlab2009b, BP神经网络、灰色神经网络预测交通流量结果分别如图4、图5所示。

可以看出, 灰色神经网算法在跟随性和预测准确性上明显优于BP算法。误差分析如表1所示, 可以看出, 采用灰色算法的神经网络 (最小相对误差2.44%, 平均相对误差绝对值11.16%) 比BP神经网络 (最小相对误差5.67%, 平均相对误差24%) 在预测的精确度上更高。

4 结语

实验证明该方法在预测精度上明显高于单纯的BP神经网络交通量预测方法, 是一种能够准确有效地预测交通流量的方法。

摘要:结合灰色系统的思想和BP神经网络模型的特点, 对两种模型进行有效的组合, 构建一种基于灰色神经网络的交叉口交通流量预测方法。仿真实验结果表明, 该预测模型较单纯的BP神经网络模型具有更好的预测精度。

关键词:灰色模型,BP神经网络模型,组合预测,短时交通预测。

参考文献

[1]李驰宇, 李远富, 梁冬.基于人工神经网络的交通运量预测[J].交通标准化, 2005, (5) :130-132

[2]覃大坚, 李志蜀.基于神经网络的时间序列组合预测模型研究及应用[J].计算机应用, 2006, 26:129-131

[3]李学伟, 张江.基于遗传算法的智能交通运量预测方法[J].交通运输系统工程与信息, 2004, 4 (1) :18-22

[4]沈国江, 王啸虎, 孔祥杰.短时交通流量智能组合预测模型及应用[J].系统工程理论与实践, 2011, 31 (3) :561-568

[5]周志刚.灰色系统理论与人工神经网络融合的时序数据挖掘预测技术及应用[D].成都:成都理工大学

车流量预测 篇5

《超声波流量计市场调研及中期发展预测报告》主要从国内外市场现状及我国超声波流量计行业发展背景、市场生产供需关系、竞争格局、品牌建设、渠道发展、价格战略等方面入手客观公正分析行业状况,通过科学的数理模型推测未来市场规模,对产品的发展趋势进行预测,并给出行业发展的建议。本报告将展现给客户一副完整的超声波流量计行业全景图,为企业的经营决策提供高质量的市场信息服务。

君略研究报告网以君略产业研究院为依托,拥有专业的研究团队和多年行业分析经验,每一份投资咨询报告都出自具有丰富投资经验的专家组亲自执笔,由高级专家审核的专业报告,可为客户提供全面的、客观的.、可靠的市场分析和行业发展趋势意见,是各类相关企业进行科学决策的重要依据。

【目录】

第一章 超声波流量计行业发展概况

第一节 超声波流量计行业定位与主要产品

一、行业定位

二、产品构成

第二节 超声波流量计行业发展概况

一、行业沿革与生命周期

二、行业发展特点

三、行业产销规模

四、行业企业竞争格局

五、行业技术现状

车流量预测 篇6

(1.武汉理工大学a.能源与动力工程学院;b.航运学院,武汉 430063;2.交通运输部 中国海上搜救中心,北京 100736)

0 引言

船舶交通流量的准确预测有助于提高海事管理的效能,是船舶通航、航路规划与设计的重要参考依据.船舶交通流量实际上具有很大的随机性,月度船舶交通流量数据构成一个典型的非线性时间序列[1-2],采用线性回归、曲线方程等对其进行回归分析往往难以奏效.而人工神经网络具有极强的非线性映射能力,对非线性系统有良好的识别、预测能力,在信息预测领域已经得到广泛应用.以BP神经网络为例,由于其具有极强的非线性映射能力,对非线性时间序列具有很好的拟合能力,但过度拟合将导致其外推能力不佳,测试和预测精度变差,甚至出现与实际变化趋势相反的现象.为协调两者的矛盾,本文用神经网络对交通流量进行仿真及预测,从控制仿真残差入手设计和构建具有合适结构和预测精度等的网络,并应用于实际问题.

1 基本原理及流程设计

残差是指在回归分析中的实际观察值与回归估计值之差,以δ表示.显然,有多少对数据,就有多少个残差.针对交通流量这样的非线性系统,可通过建立合适的神经网络代替常规的回归方程,从而实现对该类特征系统的仿真及预测.神经网络对样本数据的仿真也会存在一定的偏差,因此将交通流量的观测值与按神经网络进行的仿真值之差定义为本文所指的残差.

残差分析[3-4]就是通过残差所提供的信息,分析出数据的可靠性、周期性或其他干扰.对残差的基本要求或残差分析的基本原理是:δ遵从正态分布N(0,σ2);δ与 σ 之比,称为标准化残差,以 δ*表示;δ*遵从标准正态分布N(0,1).实验点的标准化残差落在(-2,2)区间以外的概率≤0.05,若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点.

用神经网络替代回归方程的功能,结合残差分析,本文设计的基于BP神经网络与残差分析的船舶交通流量预测及分析流程见图1.

图1 基于BP神经网络与残差分析的交通流量预测流程

2 应用实例

2.1 初步仿真

采用上述流程对月度船舶交通流量进行仿真及预测.结合所做项目,调研得长江九江大桥观测线2008年8月—2011年7月之间月节点上船舶交通流量数据,见表1.

[5]和[6],本文用前3个月的交通流量数据预测第4个月的交通流量,如用2008年8—10月的交通流量数据,预测2008年11月的交通流量数据,即输入为[620504529],输出为[406].依次类推,从而表1的36个月度节点的原始交通流量数据构成33组原始样本.将前30组用作网络训练样本,后3组用作网络测试样本,则样本构成见表2.

表1 长江九江大桥观测线月度船舶交通流量

表2 原始数据样本分组列表

根据数据分组及输入输出的对应,设计网络结构为3-8-1的3层BP网络:其中输入层为3个神经元,输出层为1个神经元[7],中间隐含层神经元数为 8[8],见图 2.

图2 设计的BP网络结构

神经网络的建立及仿真通过MATLAB软件实现.[9]主要设置为:隐层传递函数为“tansig”,输出层传递函数为“purelin”,训练函数为“trainlm”,训练目标为“0.1”学习速率,输入层权值阈值、网络层权值阈值均采取默认值(将训练目标分别设置为1e-2和1e-4,学习速率设置为0.01时分别进行训练,得到训练样本很高的拟合精度,但对测试样本仿真效果很差,甚至出现负值,故此处仅以最后一次的训练及仿真过程为例进行分析,其他情形的描述、图表等不再列出).在最后一次仿真过程中,采用33组样本时网络经过3步训练就达到设定的目标(0.1)要求.该网络经训练是否适合于对测试样本的仿真以及对未来交通流量的预测,可借助下面的残差分析判定.

2.2 残差分析

残差分析可利用MATLAB或SPSS软件实现.用MATLAB画出残差和标准残差分布相关性特征,见图3和4[10];用SPSS画出残差和标准残差的正态统计性特征,见图 5 和 6[11].

由图3可知:用神经网络对船舶交通流量仿真的残差和标准残差均落在0线附近的带状区域内,且无明显的趋势[3],初步说明该网络能够较好地拟合过去的流量数据;标准残差绝大多数落入[-1,1]区间,且几乎全部落入[-2,2]区间内,说明在95%置信度下该网络的拟合过程几乎没有异常点.由图4可知,残差和标准残差的自相关因数具有明显的截尾性,说明残差和标准残差时间序列已不存在相关性,可判定残差和标准残差为白噪声序列[12].根据图5和6,残差和标准残差具有相同的概率分布特征,且其概率分布与期望的正态分布检验直线基本吻合,故判断该网络拟合结果的残差和标准残差时间序列符合正态分布[13].

综上分析,采用前面建立的神经网络,得到交通流量仿真的残差和标准残差为正态白噪声时间序列,所建立的神经网络在95%的置信度水平下对历史数据的仿真较好,因此可以尝试利用该网络对交通流量进行仿真及预测.

2.3 预测结果分析

采用前述训练好的网络对所有样本进行仿真,画出相对误差((预测值-观测值)/观测值)曲线,并对未来12个月的交通流量进行预测.对长江九江大桥观测线2011年8月—2012年7月12个月节点上的船舶交通流量预测结果见表3(小数点后数字均省略,在整数位进1);仿真及预测结果见图7,其中第31~33节点处的值分别为测试样本的观测值和仿真值.

表3 长江九江大桥观测线船舶交通流量预测

由图7可知,该网络能很好地拟合出前30组样本所反映的交通流量变化趋势,特别是对后3组测试样本,该网络也已仿真出交通流量“升高—滑落”的局部变化.另外,分析图7的相对误差曲线可知,所有样本仿真的相对误差在0.05左右波动,并没有出现较大的偏离或异常值.在预测部分,最先的两个预测值体现出交通流量的短时下降(在第35个节点处的值最小),其后的交通流量体现出较为平稳的波动变化,这与实际情况相符.由仿真及预测的效果可见,本文建立的网络能用于对交通流量的仿真及预测,网络输出值能够作为实际交通流量的参考.同时,其仿真和预测效果也与文中所述的残差分析和控制相呼应,即在控制残差的前提下设置神经网络的训练参数(如设置训练目标为0.1),以协调“过度拟合”与“预测误差”之间的矛盾.

3 结束语

从应用角度出发,以解决实际问题为目的,尝试将神经网络拟合与残差分析相结合,从控制残差为正态分布、残差通过白噪声检验[14]等方面协调神经网络的“拟合精度不够”与“因过度拟合导致预测误差偏大”之间的矛盾,以使所建立的BP神经网络能够较好地拟合过去时段的数据,又能对未来作出较合理、可信的预测.

将基于BP神经网络与残差分析的船舶交通流量预测应用于长江九江大桥观测线交通流量分析中,从预测效果分析可知,该方法可行,结论具有较高的参考价值.交通流量预测结果可作为海事管理部门合理配备海事管理资源的参考依据,以规范航行秩序、保障通航安全.

参考文献:

[1]曾慧,郑彩萍,王涛涛.基于(残差)Auto-Regressive模型利用MATLAB解决经济非平稳时间序列的预测分析[J].佳木斯大学学报:自然科学版,2008,26(1):71-74.

[2]王丽娜,肖冬荣.基于ARMA模型的经济非平稳时间序列的预测分析[J].武汉理工大学学报,2004,28(2):133-136.

[3]王敏.残差分析在统计中的应用[J].江苏统计,2000(8):24-25.

[4]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.

[5]周少龙,周锋.基于时间序列的港口货物吞吐量GRNN预测模型[J].上海海事大学学报,2011,32(1):70-73.

[6]飞思科技产品研发中心.神经网络理论与MATLAB 7实现[M].北京:电子工业出版社,2005.

[7]朱武亭,刘以建.BP网络应用中的问题及其解决[J].上海海事大学学报,2005,26(2):64-66.

[8]严鸿,管燕萍.BP神经网络隐层单元数的确定方法及实例[J].控制工程,2009,16(S1):100-102.

[9]朱凯,王正林.精通MATLAB神经网络[M].北京:电子工业出版社,2010.

[10]张善文,雷英杰,冯有前.MATLAB在时间序列分析中的应用[M].西安:西安电子科技大学出版社,2007.

[11]杨小平,刘刚,赵晋.统计分析方法与SPSS应用[M].北京:清华大学出版社,2008.

[12]于宁莉,易东云,涂先勤.时间序列中自相关与偏相关函数分析[J].数学理论与应用,2007,27(1):54-57.

[13]宗序平,姚玉兰.利用Q-Q图与P-P图快速检验数据的统计分布[J].统计与决策,2010(20):151-152.

黄河龙门径流量预测模型研究 篇7

关键词:径流预测,生命旋回模型,神经网络,混合模型,预测

0 引 言

河川径流的预测预报在水资源规划、跨流域调水和水利工程运行管理等方面具有十分重要的作用[1,2],但由于径流变化的复杂性,目前国内外对其进行的研究仍处于探索阶段。常见的径流预测方法主要有:随机模型[3]、门限回归模型[4]、神经网络模型[5]、混沌理论[6]、local modeling模型[7]、灰色系统理论[8]、支持向量机[9]等。这些模型主要从某一变化特性出发,一般称为单一预测法。单一预测模型相对简单,但有时预测精度不高,不能充分挖掘原始数据信息,为此,出现了组合预测方法[10,11,12]。组合预测综合了各种预测方法的优点,在一定程度上能充分利用现有的各种信息,从而提高了预测的精度和可靠性。中国科学院院士翁文波教授于20世纪80年代中期曾提出生命旋回预测理论与模型,它是针对事物生命总量有限体系,从系统辨识理论和控制论的观点出发,从时间流中考察年径流量变化的非线性系统特征,为一种功能模拟模型,只要系统的输出能达到所需的精度,模型的实用性也就肯定[13]。赵雪花[14]曾把生命旋回模型用于黄河上游径流长期动态变化的趋势预测,为了消除河川年径流量的周期性和随机性影响,文中以10年均值为预测变量,取得了较为满意的结果。但由于仅用生命旋回模型进行河川径流预测时,得到的数列是一条光滑的曲线,只能基本反映出径流序列的趋势性特征,很难反映径流序列的周期性和随机性波动变化。人工神经网络借鉴了神经科学的基本成果,是基于模仿人类大脑结构和功能而构成的一种信息处理系统,是一个高度复杂的、非线性动力学系统,具有学习、记忆、联想、归纳、概括和抽取、容错以及自学自适应的能力,能很好解决径流变化过程的随机性。为了能客观反映径流序列的波动性变化,提高生命旋回模型的预测精度,本文根据生命旋回模型和人工神经网络模型的优点,探讨了2种生命旋回模型与人工神经网络组合的预测模型:并联型和串联型生命旋回神经网络模型,并将其用于黄河中游龙门水文站径流预测。经验证,两种模型精度明显高于单一生命旋回和神经网络模型,这样一种新的信息处理方法是有效可行的。

1 生命旋回模型及求解

生命旋回模型进行预测时既适用于单调递增或递减的非线性随机系统,也适用于两者共存的非线性随机过程。方法为:假设年时间序列值Q(t)在随时间t的变化过程中,正比于tn次方函数兴起,又随着t的负指数函数衰减。这种过程可以用式(1)表示:

{Q(t)=Atne-tt=(y-y0)/c(1)

式中:Q(t)为拟合或预测的年时间序列值;t为离散时间,a;y为待预测的时间,a;y0为预测的起始时间,a;A,n,c为待定参数。

关键是模型参数的求解。令B=y-y0,则式(1)可表示为:

Q(t)=b×tn×eat(2)

式中:b=A/cn,t=B,a=-1/c

对式(2)两边取对数得:

lnQ(t)=lnb+nlnt+at(3)

式(3)中包括3个未知数a,n,b,因此需要列出三元联立方程求解。一般需将预测目标历史数据分成三组,经统计分析,得到包含三个未知数的联立方程;然后通过求解方程,计算得出预测模型的三个参数。设总的历史数据为(m1+m2+m3)个,第一组为m1个,第二组为m2个,第三组为m3个,通过统计分析可得下列方程组:

{i=1m1lnQ(t)=m1lnb+ni=1m1lnti+ai=1m1tii=m1+1m1+m2lnQ(t)=m2lnb+ni=m1+1m1+m2lnti+ai=m1+1m1+m2tii=m1+m2+1m1+m2+m3lnQ(t)=m3lnb+ni=m1+m2+1m1+m2+m3lnt1i+ai=m1+m2+1m1+m2+m3ti(4)

求解方程组(4)即可得出未知数 。

2 神经网络模型

1985年,PDP小组发展了BP网络学习算法,是BP网络模型成为最具有应用前途的神经网络模型。BP网络的学习过程如下:

(1)给所有的权值和阈值赋[0,1]区间的随机值。

(2)每个样本对(Xp,Yp)进行如下操作:①将样本向量Xp送入输入层,进行正向逐层计算,先计算各个节点的输入值,再由S型函数求出各相应节点的输出;②进行误差反传计算,并调整权值;③重复步骤②,直到能量函数值小于或等于给定误差,BP网络学习完毕。本文的程序实现于Matlab环境下,采用Matlab神经网络工具箱[15]中的函数编程求解。

3 生命旋回神经网络的2种模型

根据生命旋回模型与神经网络的结合方法,以及模型对数据的处理特点,将生命旋回神经网络分为2类:并联型(parallel life cycle neural network, PLCNN)、串联型(series life cycle neural network, SLCNN)。

3.1 并联型生命旋回神经网络

在这种模型中,首先采用生命旋回模型与神经网络分别进行预测,然后对预测结果加以适当有效的组合作为实际预测值。

PLCNN组合预测模型实质是综合利用各种方法提供的信息,避免单一模型丢失信息的缺憾,减少随机性,提高预测精度。根据组合预测原理,可以有3种不同的组合预测方式,即:算术平均组合、几何平均组合和调和平均组合,其组合公式分别为:

y^t=y^t1+y^t22,t=1,2,3,,n(5)y^t=k1y^t1+k2y^t2,t=1,2,3,,n(6)y^t=1k1/y^t1+k2/y^t2,t=1,2,3,,n(7)

式中:n为待预测数据总数;y^t1,y^t2分别为使用生命旋回模型和神经网络模型的预测值;k1、k2分别为2种预测模型的加权系数。

预测模型的加权系数k1、k2如何确定是一个关键问题。本文根据文献[16]进行确定,其思想如下:

At=1-|yt-y^tyt|=1-|yt-k1y^t1-k2y^t2yt|(8)

式中:At为组合预测的精度序列;yt为实测值。At的均值E与均方差σ分别为:

E=1nt=1nAtσ=1nt=1n(At-E)2(9)

定义组合预测方法的有效度为:

S=E(1-σ)(10)

S越大,说明预测模型的精度越高,预测误差越稳定,模型越有效。

At1和At2分别为使用生命旋回模型和神经网络模型预测的精度序列,则由式(5)、(6)可求出两模型的有效度S1和S2,将S1和S2归一化作为加权系数k1和k2,即:

ki=Sij=12Sj,i=1,2(11)

3.2 串联型生命旋回神经网络

针对生命旋回模型能很好得出序列趋势和神经网络能反映序列波动性的特点,可以先由生命旋回模型得出序列的趋势,再由神经网络进行修正,此即为串联型神经网络模型。

4 生命旋回神经网络模型的预测实例

4.1 单纯生命旋回模型拟合

根据黄河龙门水文站1957-2001年的年径流数据,由MATLAB程序应用最小二乘法计算得出模型参数a=-0.021 6,n=0.209 3,b=309.847,预测方程为:

Q(t)=309.847×t0.2093×e-0.0216t(12)

单纯的利用生命旋回模型进行对黄河龙门水文站径流序列预测的结果见图1及表1。可看出,单纯生命旋回模型只能对径流序列变化趋势进行分析,进行逐年预测时误差较大。

4.2 单纯神经网络模型的拟合

神经网络为3层BP人工神经网络,输入层、隐含层传递函数为Sigmoid型,输出层为线性传递函数。取1957-2001年共45个数据作为样本训练网络,由于Sigmoid函数的值域为[0,1],为了提高网络收敛速度,对样本进行规范化处理,变换到[0,1]之间。设置最大学习次数为8000次,学习速率为0.01,学习目标取误差平方和为0.1,设置网络连接权的初始值为[-1,1]的随机数。调用Matlab工具箱有关BP神经网络函数,编写网络训练程序并仿真,训练结果见图2,计算结果见图1及表1。单纯神经网络模型很好反映了径流的波动性变化,但预测精度不能达到预报要求。

4.3 并联型生命旋回模型的拟合

根据前两节中的计算值,由式(5)~(11)计算得出生命旋回模型的加权系数k1=0.514 1和神经网络模型的加权系数k2=0.485 9,得到并联组合模型的拟合结果见图3。并联模型的平均精度为89.05%,合格率为91.11%,优于单一模型。

4.4 串联型生命旋回模型的拟合

根据式(12)计算出预测值后,再采用BP神经网络对残差(生命旋回模型计算值与实测值之差)进行分析,BP神经网络参数同前。用BP神经网络对残差进行拟合后,和生命旋回模型预测值进行迭加,得出修正后的拟合结果见图4。串联模型的平均精度为91.22%,合格率为93.33%,预报方案达到甲级。

4.5 种模型的预测及检验

黄河龙门水文站共统计有49年径流资料,在并联模型和串联模型中应用神经网络进行预测时,前45个数据用于样本训练,网络均采用3层BP人工神经网络,收敛后用该BP网络预测后4个数据;生命旋回模型建模使用的序列长度也为45,采用等维信息处理方式[17],得到预测值。统计得出4种预测模型的预测结果如表2所示。可以看出,生命旋回神经网络模型的预测结果明显优于单一的生命旋回模型和神经网络模型,可以用于径流预测。

5 结 论

河川径流预测是一个十分复杂的问题,生命旋回模型在进行径流趋势预测时具有对资料要求少、计算简单等优点,但由于模型方程的限制,进行预测时得到的序列很难反映径流序列的随机波动变化,且存在预测结果精度不高的缺点。本文在此模型基础上提出了并联型和串联型生命旋回神经网络预测模型。并联型模型首先采用生命旋回模型和神经网络分别进行预测,而后对结果加以组合作为实际预测值;串联型模型首先采用生命旋回模型预报河川径流的趋势项变化,而后采用神经网络对径流进行修正。新方法能充分发挥生命旋回模型和神经网络的优点,减小利用单一模型进行预测时的误差。以黄河龙门水文站径流1957-2005年共49 a资料进行验证,并联型模型的拟合精度为89.05%,预测的平均相对误差为8.36%,串联型模型的拟合精度为91.22%,预测的平均相对误差为2.42%,表明生命旋回神经网络模型精度较高,是一种新型实用的信息处理方法和径流预测模型。

高速公路短时交通流量组合预测 篇8

本文依托“江苏省高速公路交通数据采集与服务系统”研究项目, 设计了一种短时交通流量组合预测模型。该模型利用加权系数将自适应指数平滑预测模型和RBF神经网路预测模型组合起来, 加权系数根据基本预测模型在之前时段的预测误差均方差来进行动态调整, 一个模型在之前时段表象越好, 即均方差越小, 就会在下一时段获得更高的加权系数, 借助这样的方法使组合模型在整个预测过程中均能保持较好的预测精度, 适合于高速公路短时交通流量的预测。

1. 组合预测模型

组合预测就是将多个预测模型有机结合起来, 综合利用各个模型的优点, 得到更高的预测精度, 增加预测可靠性。组合预测可以分为线性组合预测和非线性组合预测。依据发展情况, 非线性组合预测方法由于具有高度的复杂性, 研究进展较缓慢;线性组合预测方法由于逻辑清晰、计算简便, 理论研究也较为深入, 因此, 本文将基于线性组合预测模型, 给出相应的预测方案。

若时间序列{Yt}={y1, y2, ..., yt, ...}可由预测模型产生其中的任一预测模型为:

式中:yt——t时段的实际观测值;

yt, k——第k个预测模型t时段的预测值;

et, k——第k个预测模型的误差。

则由K (K≥2) 种预测模型构成的线性组合预测模型可以表示为:

式中:zt——t时段线性组合预测模型的预测值;

wk——第k个预测模型的加权系数, k=1, 2, ..., K, 。

2. 组合模型中加权系数的确定

根据式 (2) , 基本预测模型的选择和各模型加权系数的确定是线性组合预测方法中的两个关键因素, 决定了预测模型的精度和适用性。数据融合方法中, 加权系数通常可以分为两种:权值固定不变和权值动态调整。相比较而言, 权值动态调整的方法由于考虑了各模型在不同交通条件下的预测精度, 往往可以得到更好的预测效果, 因此, 本文在确定加权系数时, 采用权值动态调整的方法, 根据各模型预测误差的均方差对加权系数进行动态调整, 时段预测模型的加权系数为:

根据式 (3) , 预测模型k在T+1时段的权值取决于其在前T个时段内的预测表现, 与其在T个时段的均方差呈倒数关系, 均方差越小, 所赋予的权值越大, 反之越小。

3. 组合模型中基本预测模型的选择

考虑到交通流比较平稳情况下, 基于解析数学的模型预测性能较稳定, 而在交通流变化波动较大的情况下, 基于知识的智能模型又具有较好的预测性能的机理, 本文从这2类预测模型中各选一种, 作为参与组合模型的单个预测模型, 综合2类模型的优点, 使组合模型可以适应不同交通条件。本文选取的2种预测模型分别为自适应指数平滑预测模型和RBF神经网络预测模型。

(1) 自适应指数平滑预测模型。

(1) 基本原理。指数平滑法是时间序列平滑预测方法中的一种, 为常用的交通参数预测方法之一。对于时间序列{Yt}={y1, y2, ..., yt, ...}, 一次指数平滑法预测公式为:

式中:St为一次指数平滑值, 也就是t+1时段的预测值, S0为初始值, 可选取第一期数据, 也可选取最初几期数据的平均值;α为加权系数, 0<α<1。

(2) 加权系数自适应调整。加权系数α的大小体现了指数平滑过程中新旧数据的重要性和对信息的修正程度, α越大, 修正程度越大, 预测结果越倚重近期数据;而α越小, 修正程度越小, 近期数据的影响也就随之减小。为了使预测能跟上短时交通流量的变化规律, 采用对加权系数进行自适应调整方法, 故引入误差跟踪信号, 根据预测误差对α值不断进行调整。误差跟踪信号定义及α值的调整方法为:

t时段, 定义两个误差信号分别为:

式中:Et为平滑误差;At为平滑绝对误差;r为第二平滑常数, 一般取0.1~0.2;et为t时段预测误差et=yt-St-1, yt为t时段的实际值, St-1为t时段的预测值。

定义时段的跟踪信号为:

当建立的预测模型适宜时, Et总是在0附近波动, 跟踪信号Ct→0;当预测模型不适宜时, 会较大, 说明预测模型偏离了实际过程, 没有跟上预测目标的变化, 此时可将取值变大, 取:

这样αt就可以根据跟踪信号自适应调整, 使预测模型能快速跟上实际过程的变化。

(3) 预测流程。采用自适应指数平滑预测模型预测高速公路短时交通流量, 其预测流程如图1所示。

(2) RBF神经网络预测模型。

RBF神经网络是基于函数逼近理论构造的一种前馈反向传播网络。与BP神经网络相比, RBF神经网络在局部逼近能力和学习速度方面具有明显优势。RBF神经网络将作为组合模型中的另一种预测方法。

(1) 基本原理。RBF神经网络具有三层结构 (输入层、隐含层和输出层) 的神经网络, 其结构如图2所示。

根据图2, 输入层节点传播输入信号x= (x1, x2, ..., xm) T到隐含层, 经过一系列映射处理后, 得到输出节点y= (y1, y2, ..., yn) T。

输入层到隐含层。在RBF神经网络中, 输入层到隐含层实现的是从x→μ (x) 的非线性映射, 采用的激活函数为径向基函数。最为常用的径向基函数为高斯函数, 假设有q个隐含层节点 (以下简称隐节点) , 那么采用高斯函数隐节点j (j=1, 2, ..., q) 的输出可表示为:

式中:cj为径向基函数的中心向量, cj=[cj1, cj2, ..., cjm]T; 为欧几里德范数, 为第j个高斯函数的方差。

隐含层到输出层。输出层实现的是从μ (x) →y的线性映射。输出层节点k (k=1, 2, ..., n) 的输出可表示为:

式中:wkj——隐节点j到输出层节点k的连接权值, 可通过监督学习来调整。

(2) RBF神经网络预测流程。采用RBF神经网络预测高速公路短时交通流量, 其预测流程如图3所示。

4. 预测性能评价

为了验证组合预测方法的效果, 分别对自适应指数平滑预测、RBF神经网络预测和组合预测进行预测性能评价。根据南京机场高速公路收费站实际交通流量数据, 采用Vissim仿真得到2012年9月3日到7日路段上以10min为间隔的交通流量数据。将9月3日到9月6日4天的数据作为训练样本对各模型进行训练, 进而对9月7日的数据进行预测, 选用08:00~14:00时间段内的36组数据进行预测性能评价。

(1) 评价指标。

为了评价各个预测方法的预测精度, 引入误差指标如下:

平均绝对误差:

平均误差百分比:

式中: 为第j交通流量预测值;qj为第j交通流量实际值。

(2) 结果分析。

在进行预测时, 首先用Matlab对基本预测模型进行编程。RBF神经网络预测模型使用Matlab中自带的神经网络工具箱, 以预测时段之前5个时段的交通流量作为输入变量, 以预测时段的行程时间作为输出变量, 即输入变量为5个, 输出变量为1个, 径向基函数的扩展速度SPREAD取0.135。自适应指数平滑预测模型中, 初始值S0取第1时段的实际值, 第二平滑常数取r=0.2。分别采用单个模型进行预测, 然后将预测值代入到组合模型中进行组合预测。统计的实际流量值以及采用3种预测模型得到的预测值如图4所示。

根据图4, 采用3种预测模型计算得到的大多数预测值与实际值的拟合性都是比较好的, 图5给出了3种预测模型的预测相对误差比较。

根据图5, 自适应指数平滑预测模型和RBF神经网络预测模型分别在不同时段有着较好的预测性能, 组合预测模型并非在所有时段预测性能都好于2种基本预测模型, 但整体上组合模型的预测稳定性更好, 在所有时段其预测误差都是小于2种基本预测模型或在2种基本预测模型预测误差之间, 因此, 综合2种模型的优点, 预测精度不会出现太大的偏差。

根据式 (11) 、 (12) 计算得, 各预测模型在36个时段的整体预测误差如表1所示。

根据表1, 组合预测模型的整体预测精度好于两种基本预测模型, 平均误差百分比较小, 且从误差分布的概率来看, 其保证相对误差在10%范围内的概率高于两种基本预测模型, 也证明其拥有更好的预测稳定性。

5. 结论

本文应用所提的基于自适应指数平滑和RBF神经网络的组合预测模型, 对观测尺度为10min的短时交通流量预测进行研究, 得到以下结论。

(1) 应用基本预测模型前一时段的预测误差均方差动态调整组合模型的加权系数, 能够充分发挥各基本模型在不同时段的预测优势, 使预测精度进一步提高。

(2) 采用组合预测模型虽然不能保证预测精度在所有时段均是最好的, 但是该模型可以综合基本预测模型的优点, 得到一个较好且更为平稳的预测精度。

参考文献

[1]贺国光.ITS系统工程导论[M].北京:中国铁道出版社, 2004.

[2]徐伦辉, 傅惠.交通信息智能预测理论与方法[M].北京:科学出版社, 2009.1.

[3]姜桂艳.道路交通状态判别技术与应用[M].北京:人民交通出版社, 2004.

基于误差校正的网络流量组合预测 篇9

随着网络技术迅速发展, 网络业务种类越来越多, 通过对网络流量的预测, 可以了解网络的流量情况和趋势, 决定网络的拥塞控制, 降低网络拥塞带来的信息丢失和延迟, 并能发现潜在的攻击和入侵行为, 从而更有效地进行网络优化, 提高服务质量[1]。

网络流量预测最初主要借助于数理统计中时间序列分析, 一般多采用基于自回归 (AR) 或自回归滑动平均 (ARMA) 的预测模型[2,3], 但这些模型都是假设网络流量的变化是线性的, 而随着网络规模的增大和用户上网行为的影响, 使网络流量呈现出非线性、突变性和非平稳性等特点, 因此这些传统的网络流量预测模型的预测准确率比较低, 已经无法适用于当前网络流量建模与预测。差分自回归移动平均 (ARMA) 融合了时间序列分析和回归分析的优点, 在网络流量预测中得到了广泛应用[2,3], 但是ARMA只能用于处理齐次的非平稳性过程, 不能对网络流量进行长期预测, 应用范围受限[4]。随着非线性技术的发展, 以神经网络为代表的机器理论建模方法在网络流量预测中取得了一定的研究成果, 获得了较高的预测精度[5]。常用的神经网络模型有BP神经网络、RBF神经网络、Elman神经网络等[6,7,8]。其中BP神经网络是目前应用最广泛的神经网络模型之一, 但其存在对初始权阈值敏感、容易陷入局部极小值、收敛速度慢等问题。为了提高网络流量预测精度, 一些学者基于组合优化理论, 将多种单一预测方法组合在一起, 提出许多网络流量的组合预测模型, 并取得了不错的预测效果[9,10]。

为了提高网络流量预测精度, 利用ARMA和BP神经网络 (BPNN) 的优点, 提出一种误差校正的网络流量组合预测模型 (ARMA-BPNN) , 并通过仿真实验测试ARMA-BPNN的有效性和优越性。

2 ARMA和BPNN神经网络

2.1 ARMA模型

自回归移动平均模型 (ARMA模型) 也称Bo Jenkins方法, ARMA模型通过从数据自身当中提取各种因素来解释序列的变化规律。这种方法一方面认为序列可以由其自身的某些滞后序列进行解释, 这样形成AR模型;另一方面认为时间序列由若干个白噪声序列的某种组合, 这样形成了MA模型, AR和MA进行结合形成ARMA模型。对于非平稳的序列, 可以通过差分或季节差分以及各种变换进行平稳化处理后再采用, 这样处理过的模型称为ARMA模型, ARMA模型的形式为

式中, a0为常数项, p和q是模型的自回归阶数和移动平均阶数;ai和bi是不为零的待定系数;et是独立的误差项;Yt是平稳、正态、零均值的时间序列[11]。

2.2 ARMA模型建模步骤

2.2.1 数据观察和预处理

对收集的数据进行观察和检验, 把握时间序列发展变化的特征。对数据的观察和检验可以通过图形方法或统计检验方法实现。检验时间序列样本的平稳性、正态性、周期性、零均值, 进行必要的数据处理变换。通过转换, 一方面能够使序列的特征体现得更加明显, 利于模型分析的选择;另一方面将非平稳的时间序列转换为平稳的时间序列。

2.2.2 模型识别

模型识别阶段主要通过自相关图法, 通过读ACF和PACF图进行目标序列定阶, 然后采用AIC (AkaikInformation Criterion) 或SBC (Schwartz Bayesian Criterion) 准则进行模型筛选, 其计算式如下:

式中, n为带估计参数, T为可用的观测值个数。

采用最大似然估计或最小二乘估计等方法估计相关参数值, 从而获得模型的最优参数。

2.2.3 模型预测

假如某个观察值序列通过序列预处理, 可以判定为平稳非白噪声序列, 我们就可以利用模型对该序列建模。

2.3 BP神经网络

BP神经网络[2] (Back-Propagation network, 反向传播网络) 是一种多层前馈神经网络。网络结构如图1所示, 由输入层、输出层、一个或多个隐含层组成。每层由许多并行计算的简单神经元组成, 层与层之间的神经元采用全互连的方式, 两层之间的每个神经元都关联一个权值, 同层神经元之间无连接。各神经元的传递函数通常为连续可微的S型函数, 它可以实现从输入到输出的任意非线性映射[12]。

BP神经网络模型的主要思想就是使网络输出层的误差平方和达到最小。在网络的学习训练过程中, 网络首先随机产生一组神经元之间的连接权值和阈值, 训练样本输入网络通过正向传播产生一个输出结果, 将它与期望值比较, 若两者误差未达到设定的误差, 误差信号沿原路反传回来, 同时修正各层神经元的权值和阈值, 以减小误差, 正向传播的输出计算与反向传播的权值修正反复交替进行, 直到网络的实际输出与期望输出之间的误差值达到要求, 从而得到满意的连接权值和阀值。

设输出层有m神经元, BP网络的实际输出是y, 期望输出是y’, 函数E为:

每个权值的修正值为:

式中, Wij是从神经元i到神经元j的连接权值, η是学习速率, Ij是中间第j个隐藏层的传输函数。这就是BP网络使用的梯度下降算法。

3 ARMA-BPNN网络流量预测模型

网络流量受到多种因素影响, 单一ARMA或BPNN均难以获得较高精度的网络流量预测结果。ARMA-BPNN网络流量预测模型的基本思想为:首先, 建立ARMA的网络流量预测模型, 得到网络流量预测的初步预测结果, 然后采用BPNN对ARMA的预测结果进行校正, 得到网络流量预测最终预测结果, 具体如图2所示。

4 仿真测试

4.1 数据来源

采用某网站大型服务器2013年3月1日至3月30日的每小时网络流量进行仿真实验, 具体如图3所示。在相同条件下, 选择单一的ARIM、BPNN进行对比仿真实验。

4.2 拟合能力对比

4.2.1 ARMA的网络流量拟合

ARMA对训练样本进行拟合, 其拟合值与实际值如图4所示。由图4可知, ARMA对网络流量变化趋势拟合效果一般, 结果表明, ARMA可以对网络流量基本变化趋势进行刻画, 但其无法准确反映描述网络流量时变性、非平稳性, 拟合精度待进一步提高。

4.2.2 BPNN对ARMA的残差拟合

将ARMA预测残差输入到BPNN进行学习, 并进行拟合, 得到的拟合结果如图5所示, 同时采用BPNN对训练集进行拟合, 拟合结果如图6所示。

从图5和图6可知, ARMA-BPNN的拟合精度达到98.12%, 远远高于ARMA模型的85.99%和BPNN的92.043%, 说明ARMA和BPNN进行融合, 可以进行优势互补, 克服各自的缺陷, 提高了网络流量的拟合精度。

4.3 泛化能力对比

评价一个预测模型的好坏, 主要考察其泛化能力, 而不是拟合能力, 各种模型对测试集的仿真实验结果如图7所示。从图7可知, 相对于单一ARMA和BPNN, ARMA-BPNN的预测精度更高, 这表明, AR-MA-BPNN可以更好描述网络流量的变化趋势, 提高了网络流量的预测精度。

5 结语

网络流量由于受到外界环境影响, 具有突发性、周期性、和非线性变化规律, 单一预测模型的预测精度难以到达网络流量应用的实际要求, 为此, 提出一种基于ARMA-BPNN的网络流量预测模型, 首先建立ARMA的网络流量预测模型, 然后对预测误差形成的随机序列建立BP神经网络预测模型, 并用BP神经网络的预测误差进行修正, 仿真实验结果表明, ARMA-BPNN能够对网络流量进行准确、有效预测, 是一种精度高的网络流量预测模型, 具有更好的实用价值。

摘要:为了提高网络流量预测精度, 提出一种误差校正的网络流量组合预测模型。首先对网络流量数据进行预处理构建网络流量学习样本序列, 然后采用自回归移动平均建立网络流量预测模型, 并采用神经网络对自回归移动平均预测误差进行校正, 最后对模型性能进行仿真测试。结果表明, 网络流量组合预测模型提高了网络流量的预测精度, 预测结果具有一定实用价值。

铁路客运专线客流量预测分析 篇10

1 客流预测方法分析

1.1 一般预测方法的特点

目前大部分高速铁路客运量预测所采用的预测方法主要有以下2类:一是时间模型[1],研究社会经济变量(各交通小区的GDP或人口)与客流量之间的关系,进而以时间为自变量预测客流量;二是相关因素模型[2],建立客流量和各种影响因素之间的函数模型,进而得知某个因素变化后客流的变化情况,常用的方法是重力模型法。

前者用于增长稳定型的客流预测,这种客流一般与经济发展或人口增长直接相关。后者用于通道网络形成条件下,由于某种影响因素变化使客流在方式划分中的比重发生相应变化的情况。二者的共同特点是把客流看成一个整体,建立这个整体与各种因素之间的函数关系,从而得到预测值。

1.2 客运专线客流的特征

从国外的经验来看,在高速铁路建成初期,会引起客流量在短期内急剧增长,这种现象区别于客流的逐年渐增模式。文献[3]显示,日本东海道新干线开业后一年,静岗至滨松间运量产生阶梯性跳跃,比开业前增长52%,东海道新干线全线客流量开业后第二年猛增66%。这种带有显著特点的变化,在客运专线客流预测中要充分考虑。

从客运专线的客流构成来看,客流可以分为:趋势客流量,诱发客流量和转移客流量。这三部分客流主要影响因素不尽相同,客流变化的特征也各有差异,且在客运专线运作的不同时期三者构成比例会发生变化。在预测研究中如果把客流作为一个整体来分析,在预测值上会有较大的偏差,所以本文把客流分别预测,根据各自特点采用相应的预测方法,这样更能体现整体客流的正常变化特征。

2 客运专线客流量的预测

2.1 趋势客流量

趋势客流量是指由社会、经济水平决定的旅客运输需求。这部分客流的变化一般呈渐进的连续增长状态,与地区经济的发展呈正比关系,所以采用前文所述的第一类方法建立时间序列模型,反映出趋势客运量随时间延伸与社会、经济发展的一种变化趋势。这部分是构成未来客运专线的主要客流量,记i,j间的趋势客流量为Qij0,这部分是预测的重要一步,关于这方面的研究很多,在此不做具体分析。

2.2 诱发客流量

诱发客流量是指由于一种新的线路的建成,在运输供给和服务特性上有较大的改善,如在运输能力、安全性、经济性、舒适性、方便性等方面有所提高,将人们的一种“隐性”需求,转化为“实际”需求,从而带来的客流量。即诱发客流量的产生主要是由于运输供给和服务特性的改变,因而,对其的预测要能反映出此种因素,用重力模型进行分析,根据重力模型,设i,k间的客流量为Qij,则

Qij=k(EiEj)αRijβ.

式中:EiEjij节点客流影响因素,称为势能因素;kαβ为参数;Rijij间的运输阻力。

运输阻力Rij为旅客从ij所付出的代价,包括旅行时间、票价、疲劳度等,它是运输服务特性的综合反映,取为

Rij=Gij+ΤijW+Sij.

式中:Gijij间的运输费用,元;Tijij间的旅行时间,h;Sijij间的疲劳损耗,元;W为时间价值,元/h。

设:既有铁路的运输阻力为Roij,客运专线的运输阻力为Rdij,则

ΔQij=Qdij-Qoij.

式中:Qoij为在预测年度未建成客运专线,ij间的铁路客流量;Qdij为在预测年度建成客运专线,ij间的铁路客流量。

ΔQij表示客运专线建成后,由于Rij变化所引起的客流量变化,即为诱发客流量,则

ΔQij=k(EiEj)αRdijβ-k(EiEj)αRoijβ=k(EiEj)αRoijβ[(RoijRdij)β-1]=Qoij[(RoijRdij)β-1]

令:rA为诱发率,rA=(RoijRdij)β-1,则:ΔQij=Qoij·rA.

根据文献[4]的介绍利用回归分析可以求出模型的参数kαβ,参考已有的时间价值W的预测值,即可推算出既有铁路和客运专线的运输阻力RoijRdij,从而计算出诱发率rA和诱发客流量ΔQij

2.3 转移客流量

转移客流量是指由于客运专线的修建以及其较好的服务特性使本来选择其他运输方式的旅客改选乘坐客运专线而形成的吸引客流。产生这种客流的根源在于通道内客流量在各种方式间的分担率发生了变化,故预测针对这一点展开。用改进的重力模型进行分析:

设运输通道内有N条运输线路,分配到K线路的客流量为Qijk,则有

Qijk=QijRkij-βi=1ΝRlij-β.

式中:Qijij间运输通道中的总客流量;Rlijij间第l条运输线路的运输阻力;β为模型参数。

定义rfkk方式的分担率rfk=Rkij-βi=1ΝRlij-β,则:

Qijk=Qij·rfk.

k方式的服务特性改善,运输阻力由原来的Rijk变为Rijdk,分担率由rfk变为rfdk。设运输阻力变化后k方式分担的客流量为Qijdk,则

Qijdk=Qijrfdk=Qijkrfkrfdk=Qijkrfdkrfk=Qijk+Qijk(rfdkrfk-1).

定义转移率为rB=rfdkrfk-1,于是,转移客流量记为ΔQij,得:ΔQij=Qij·rB

同上文分析,线路的运输阻力可以计算得知,故可求得转移率rB和转移客流量ΔQij

2.4 客运专线客流量的确定

根据以上三部分的分析可以知道,客运专线的客流即为三部分的总和。也就是说ij间客运专线客流量Q=Qij0QijQiji。此预测能够反映出不同时期客运专线客流随各种影响因素变化的情况,能为建成初期的急剧增长情况提供较合理的预测值。

3 结论和思考

1)客运专线的客流预测在建成初期和运营稳定之后会有很大的不同,所以把客流量看成一个整体进行预测必然会在某个时期出现较大的偏差。针对三部分客流的变化根源因素对客流分别预测,在每一时段综合精确性上有一定的改进。

2)对诱发、转移客流量的预测采用改进的重力模型,鉴于重力模型的研究在目前比较成熟,计算模型及参数的标定都是可行的。

3)文章虽然界定了三部分客流量的范围,但是从实际来讲,三者之间的界限不可能完全划分清晰。转移客流和诱发客流在实际中会有极少部分和趋势客流相重合,同时还会有其他因素形成的微小客流而不被归入这三部分。但是在整个客流构成中这些成分所占的比重很小,故影响不大。在客运专线客流预测中还有待进一步研究,使预测客流能更客观的反映现实,为客运专线的规划、运行、站场的规模设计等提供更为合理的依据。

摘要:客流预测是客运专线各项工作得以顺利进行的基础研究课题。首先分析了一般客流预测方法的特点,然后按照客运专线客流的形成原因将其分为趋势客流、诱发客流和转移客流,根据各部分客流的自身变化特点,分别采用不同的模型或方法进行预测,最后给出了总体客流量预测的计算方法。

关键词:客运专线,诱发客流,转移客流,预测

参考文献

[1]冷俊峰,陆凤山.对我国高速铁路客运量预测的探讨[J].西南交通大学学报,2001,36(1):88-91.

[2]张康敏,刘晓青.高速铁路客运量预测方法选择[J].综合运输,2007(7):65-67.

[3]高旭敏.高速铁路客流量预测研究[J].系统工程,1994,12(5):68-72.

[4]高峰,刘明君.石太客运专线客流预测研究[J].铁道运输与经济,2007,29(5):30-32.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:检测车流量 下一篇:胸主动脉瘤