指数预测

关键词:

指数预测(精选十篇)

指数预测 篇1

公路客运量预测,按时间长短分为短期、中期和长期预测. 短期预测是制定年度、季度运输生产计划的基础,而中期( 3 - 5年) 和长期预测是制定企业经营运输方针、企业技术改造等运输规划的基础. 常用的预测方法有加权平均法、 增长率算法、回归分析法、灰色模型预测、神经网络模型预测等. 在实际工作中,采用上述方法进行预测,效果不太理想,原因是公路客运量常常受多种因素的影响,如工农业生产总值、人均收入、人口数、道路建设水平等,更主要的是同时还受季节、周期、趋势、随机因素的影响. 这里季节变动是一个非常重要的因素. 比如,每年的二、三季度春暖花开,气温升高,外出旅游、打工、贩运活动增多. 由于人们的出行习惯比较稳定,因此在很长一段时期内,这种季节变动呈现一定的规律性. 通过对这种规律性的研究,可以使我们进一步了解和掌握客运量的变化规律,进而为编制营运计划、合理配备运力,提高企业经济效益提供可靠依据.

本文利用2003—2012年长春市公路客运量年度数据, 建立三次指数平滑模型,利用季节指数修正预测值,并进行误差分析,对未来两年长春市公路客运量进行预测.

历史数据的收集、分析与处理,见《利用灰色模型预测长春市公路客运量》一文,发表于《数学的学习与研究》 ( 2014. 18) ( 作者纪跃芝,胡凡,秦喜文) .

二、指数平滑模型及预测方程

指数平滑预测模型属于时间序列模型,是一种加权移动平均的预测方法,它的原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均. 在加权平均中,用到了新数据xt,体现了重视近期数据的思想,也用到了老的平滑值,一定程度上抵掉了新数据xt中包括的随机干扰,起到了平滑数据、显示规律的作用.

1. 模型及预测方程

根据图2,我们采用三次指数平滑模型预测,并利用季节指数修正趋势预测值.

其中S( i)t表示第t期的i次指数平滑值,i = 1,2,3,xt表示当前数据,α 是平滑系数,反映预测者对当前数据的重视程度. 预测方程为:

其中T表示从基期t到预测期的周期数,t + T表示第t + T周期的预测值,at,bt,ct为预测方程的系数,它们的估计值可以用三次指数平滑法求得:

2. 利用季节指数修正预测值

由图2可见,客运量随季节而变化,而预测方程预测的是大趋势,与客运量起伏不相符合,因此,必须对初步预测值用季节指数进行修正. 季节指数的确定方法如下:

取收集的历史数据,做算术平均值作为趋势估计值,再按公式对同一季节取平均,便得到季节指数的估计值,再用季节指数乘以相应的趋势预测值,便得到客运量的预测值.

三、误差分析

预测误差是大家都很关注的问题,我们总是希望预测结果误差尽可能的小,同一个项目可能采取几种不同的预测方法,对于这些方法的评价和选择,应以预测误差的大小为判断依据. 这里我们 用平均绝 对百分误 差MAPE = E (e / x)来衡量:

当MAPE≤10% 时,为高精度预测; 当10% < MAPE≤ 20% 时,为良好预测; 当20% < MAPE ≤50% 时,为可行预测; 当MAPE > 50% 时,为错误预测.

四、实证分析

平滑系数 α,反映预测者对当前数据的重视程度,是预测能否成功的关键. α 越小,对数据的平滑能力越强,但对数据变化的敏感性越差,α 越大,对数据的平滑能力越差, 但对数据变化的敏感性越强. 经过多次分析比较,最后确定平滑指数 α = 0. 2. 预测方程为

利用上述指数平滑模型,取2005年第一季度为k = 1起始点,计算各季度客运量的一至三次指数平滑值. 结果见附录.

由附录,可算出at= 330. 66,bt= - 5. 39,ct= - 0. 46,预测方程为

其中 τ = - 31,- 30,…,0,对应2005年第一、二季度, …,2012年第四季度客运量预测值.

在预测方程( 1) 中,分别取 τ = 1,2,…,8,得2013、2014年客运量的初步预测值,结果见表2. ( 单位: 万人次)

季节指数修正初步预测值取2003 - 2012年各季度客运量,以= 316. 26( 万人次) 作为趋势估计值,按公式对同一季节取平均,便得季节指数的估计值. 结果见表3.

用季节指数修正后的预测值t + τ见表4.

误差分析在预测方程( 1) 中,取 τ = - 11,- 10,…,0, 得到初步预测值,利用季节指数进行修正,并进行误差估计,结果见表5.

作出2010 - 2012年各季度客运量与预测值对比图4, 可见,客运量明显随季节而改变,经季节指数修正的指数平滑模型能够很好地反映客运量随季节的变化.

算得平均绝对百分误差MAPE = 3. 8% ,表明用该模型进行预测,效果为高精度预测.

五、结论

客运量的预测方法还有很多,如回归分析预测、弹性系数法预测、增长率统计算法等等. 每种方法都有各自的优缺点和局限性. 如灰色模型预测法,其优点不仅简单而且能达到比较准确的预测效果,而指数平滑法,属于时间序列平滑预测法中的一种,其优点是克服了移动平均法需要数据存储大的缺点,保持了移动平均法的优点,它只需要最近一期的实际客运量即可预测下一期的数值; 缺点是预测值受实际值大小的影响较大,取值不当,预测值会出现较大偏差.

影响客运量的因素有很多,比如天气、季节、节假日、假期等,它们之间的关系错综复杂. 为了提高预测结果的精度,我们可以选择几种方法的组合进行预测. 这样可以大大提高预测结果的精度和可靠度.

摘要:本文选取2003-2012年吉林省长春市公路客运量数据,建立三次指数平滑模型,利用季节指数修正平滑预测值,并进行误差分析.同时,对2013年和2014年长春市公路客运量进行预测.

指数预测 篇2

针对目前航天领域在对运载火箭遥测数据进行监控过程中,人工监测反应速度慢、工作量比较大这一问题,提出了对遥测数据进行趋势预测的思想,并采用自适应指数平滑法进行趋势预测研究.仿真实验证明:该方法预测精度较高,跟踪速度较快,实时性较好,能够实现对遥测数据的实时趋势预测.应用该预测方法可提前预测潜在的故障趋势,为指挥员正确决策提供理论支持.

作 者:余国浩 蔡远文 YU Guohao CAI Yuanwen 作者单位:余国浩,YU Guohao(装备指挥技术学院,研究生管理大队,北京,101416)

蔡远文,CAI Yuanwen(装备指挥技术学院,航天装备系,北京,101416)

基于Eviews上证综合指数预测 篇3

【关键词】指数预测  时间序列  ARIMA模型

一、模型构建

(一)样本选取

本文选用上证指数时间跨度为2000年1月28日至2015年10月30日的月份数据,剔除节假日和个别不交易的数据,样本容量为191。其中,选取2015年11月上证指数收盘价作为模型预测的估计量,所有交易数据来源于同花顺官方网站。

(二)数据处理

由于上证指数数据较大,故本文通过对数化处理得出上证指数的收益率LNXt=lnXt,式中Xt为第t个交易日上证指数的月收盘价,LNXt表示上证指数在第t个交易日的收益率。

(三)平稳性检验

一般而言时间序列数据都具有某种趋势,是非平稳的,用单位根检验方法(ADF检验)可验其平稳性,本文用单位根检验的三种设定形式分别检验上证指数的平稳性。

模型1:

模型2:

模型3:

表1 上证收益率LNX的ADF检验结果表

由表1可以看出,无论在哪一种模型形式下,上证指数收益率序列LNX非平稳,无法对其建立ARIMA模型。

为了得到平稳的收益率序列,对其进行一阶差分得D(LNXt)=LNXt-LNXt-1。

对差分序列DLNX进行ADF检验(表2),上证指数收益率1阶差分序列通过了ADF检验,该序列是平稳的,ARIMA模型中滞后阶数d=1,可对DLNX建立ARIMA模型。

表2 DLNX的ADF检验结果表

(四)模型估计

作收益率1阶差分后滞后20期的自相关——偏自相关图,发现收益率1阶差分后的序列自相关图是截尾的,偏自相关图是截尾的,对收益率差分序列建立ARIMA模型,估计结果如表3。

表3 ARIMA(11,1,11)估计结果

估计方程:

ARIMA(11,1,11)模型参数在10%的水平下都是显著的,其中,AR(11)和MA(11)在1%显著性水平在显著,常数项在10%显著性水平下显著,AR特征根0.96和MA特征根0.99都在单位圆之内,是平稳的。

(五)模型诊断

对模型ARIMA(11,1,11)残差进行检验,得到残差单位根检验结果(表4)。残差通过了ADF单位根检验,故残差序列是白噪声。

表4 残差ADF检验结果表

二、样本外预测

本文采用静态预测,依据模型对上证指数收益率进行预测,结果见表5。

表5 上证指数预测结果

三、结论

本文利用ARIMA模型对上证指数月度数据进行预测,真实值与预测值对比情况见表5,预测结果在允许的误差内,从而ARIMA(11,1,11)模型对大盘指数有较好的预测性。选取的月度数据未包含一个月内影响指数变动的诸多因素,故有一定的误差。此模型对大盘走势进行的短期预测,可为投资者提供一定的投资决策依据。

参考文献

[1]刘云.ARIMA对我国上证指数的预测研究[J],现代商贸工业,2012(16).

[2]柯文泉.ARIMA模型在上证指数预测中的应用[J],现代商业,2008(13).

指数预测 篇4

1 计算

1.1 分子拓扑指数1T的计算

对于所研究的对象, 饱和脂肪酮分子可看作烷烃中含有1个极性基团羰基的化合物, 即其色谱保留值与羰基所处的位置有关, 与酮分子中烷基的碳原子多少、分支等有关联, 因此我们提出了以邻接矩阵为基础而建立的分子连接性拓扑指数1T, 1T=∑ (δiδj) -0.5, 即1T为分子中碳原子及杂原子的特征值δi、δj乘积的2次方根倒数的加和值。

1.2 官能团距离拓扑指数Dco的计算

官能团距离拓扑指数Dco是指脂肪酮中羰基上的氧原子到其他各碳原子的拓扑距离之和。

本文计算了18种脂肪酮的1T、DCO和XCH3, 其值列于表1。2结果与讨论

将18种脂肪酮气相色谱保留指数实验值分别与1T、DCO和XCH3参数相关联, 建立多元线性回归模型为:

1.2.1 在固定相及其他条件不变的情况下, 气相色谱保留指数与化合物的结构有关。

此模型相关系数r=0.9968为优级。说明RI与1T、DCO、XCH3有很好的相关性。

1.2.2 从表1可看出拓扑指数1T、RI随着碳原子数的增多而增大, 1T越大, RI值越大。

对于同分异构体, 1T、RI随着连接羰基原子的支化度的增加而减少。烷基中碳原子越多, DCO值越大, XCH3越大, 分子的分支度越大。构建的1T、DCO和XCH3较好地反映了分子中烷基的碳原子多少、分支及羰基所处的化学环境, 它们从不同的角度反映了分子的结构信息。此模型预测饱和脂肪酮化合物的气相色谱保留指数具有较好的稳定性和准确性。

指数预测 篇5

综合增长指数法在工业废水排放量预测中的应用

摘要:介绍了综合增长指数法的建模方法,并应用该方法对我国珠江三角洲某市不同区域工业废水排放量进行预测.实际检验结果表明,该预测模型精度较高,且使用方便,适用于总量控制区域内初始排污指标按区分配时,对各区进行规划期内工业废水排放量的预测.作 者:王丽芳 吴纯德 阮梅芝 范平 WANG Li-fang WU Chun-de RUAN Mei-zhi FAN Ping 作者单位:华南理工大学,环境科学与工程学院,广州,510006期 刊:工业用水与废水 ISTIC Journal:INDUSTRIAL WATER & WASTEWATER年,卷(期):,39(3)分类号:X708 O242关键词:工业废水 排放量 综合增长指数法

居民消费价格指数的统计分析与预测 篇6

关键词:居民消费价格指数;统计分析;理论知识;预测

一、引言

近几年,随着我国经济的不断发展,我国居民的物质消费水平也越来越高,居民消费价格指数也越来越得到人们的重视。居民价格消费指数是反应人们消费水平状况的重要指标,注重对居民的消费价格指数的研究可以增加政府对我国居民消费状况的了解,对我国政府的政策制定、经济宏观调控等都有重要的参考价值。

二、居民消费价格指数的理论知识

居民消费价格指数英文全称为Consumer Price Index,缩写为CPI,它是度量消费商品及服务项目价格水平随着时间变动的相对数,反映居民购买的商品及服务项目价格水平的变动趋势和变动程度。居民消费价格指数在整个国民经济价格体系中占有重要的地位,对于我国经济宏观调控具有正要的指导作用。

另外,CPI的计算采用的是是固定权数按加权算术平均指数公式计算,CPI=(一组固定商品按当期价格计算的价值/一组固定商品按基期价格计算的价值)×100%。同时,居民消费价格指数还与经济通货膨胀有关,加深对居民消费价格指数的研究可以一定程度上抑制经济通货膨胀。有学者认为,当居民价格指数>3%就表示本地区已经发生了通货膨胀。

三、居民消费价格指数的统计分析

下面我们以我国今年来的居民消费价格指数为例从总体、结构、影响因素、以及动态预测四个方面进行深入分析。

1.居民消费价格指数的总体分析

近几年,我国居民消费价格指数一直处于飞速上涨的状态,据国家统计局发布的数据显示,单2012年12月份全国居民消费价格指数同比上涨2.5%,涨幅比上月扩大0.5个百分点。下图是节选我国2008年—2012年我国统计局统计的CPI的增长率:

总体分析,我国居民消费价格指数上涨有以下三个明显的特征:(1)我国物价涨幅逐步的扩大;我国近几年居民消费价格指数的运行轨迹一般都呈现前低后高的态势。以肉类为代表,我国猪肉价格一直处于稳步上涨的状态。(2)全国居民消费价格指数结构性上涨明显;(3)促进我国居民消费价格指数上涨的因素变多。

2.居民消费价格指数的结构分析

我国居民消费价格指数在结构上包括食品、饮酒、居住、医疗保健个人用品等。近几年我国居民消费价格指数结构性涨幅很大,并且结构性涨幅不平衡。例如2011年全国居民消费价格指数个部分构成与所占比重是:食品31.79%,烟酒及用品3.49%,居住17.22%,交通通讯9.95%,医疗保健个人用品9.64%,衣着8.52%,家庭设备及维修服务5.64%,娱乐教育文化用品及服务13.75%。2012年5月份,全国居民消费价格总水平同比上涨3.0%。其中,城市上涨3.0%,农村上涨2.9%;食品价格上涨6.4%,非食品价格上涨1.4%;消费品价格上涨3.6%,服务项目价格上涨1.7%.1-5月平均,全国居民消费价格总水平比去年同期上涨3.5%。

3.居民消费价格指数的影响因素分析

影响我国居民消费价格指数增长的因素有很多,总结概括起来,我认为主要由以下几点:

(1)近几年经济发展的推动是居民消费价格指数增长的重要因素之一;经济的发展,我国制造业飞速发展,对于原材料需求量很大,这就促进了人们对于资源的需求和消费。

(2)国际市场价格的导向作用;我国加入世贸组织之后,我国经济进一步融入了世界市场,国际市场物价的波动同样会带动我国物价的浮动。近几年,世界粮食和石油价格一直处于持续上涨的状态,这也带动了我国国内相关产业物价的上涨。

(3)受我国国内供需不平衡的影响;受近几年我国自然灾害的影响,以及国际市场的影响,我国很多地方市场都总体呈现出供求失衡的状况。例如像生猪养殖业,近几年瘟疫发生,养殖户减少,导致猪肉市场供低于求,猪肉价格持续上涨。

4.居民消费价格指数的动态预测分析

从以上推动价格上涨的因素来看,我国在最近的一段时间里,物价还是会持续上涨,尤其是资源类的产品。从物价稳定的因素来具体分析,近几年我国政府在经济调控方面也出台了一系列的政策,继续实施适度从紧的财政和货币政策,像2008年央行连续多次上调存款准备金率和存贷款利率,运用特别国债等财政政策,这些宏观调控“组合拳”。这些政策都将有利于缓解货币流动性过剩问题,避免经济过热,同时对稳定我国市场的物价水平起到举足轻重的作用。

总而言之,要想从根本上控制我国物价水平,我国应该对目前的企业经济制度做更深一层次的改革。否则,在未来的时间内我国物价还将处于飞速增长的状态,像房地产,虽然国家多次出台控价规定,但是依旧飞速增长。

四、总结

总之,我国统计部门应该注重对CPI的研究分析工作,并且根据CPI反映的居民消费状况,研究、制定并调整我国的消费政策、居民工资政策、物品价格政策以及我国货币政策等,这才是CPI研究的真正意义所在。

参考文献:

[1]国家统计局城市社会经济调查司.走近CPI.中国统计出版社,2010.

上证指数短期预测的数学模型 篇7

股票市场在我国日渐繁荣,逐渐成为证券业乃至金融业的重要组成部分。股市综合指数、股票价格的预测一直是学术界的一个焦点备受研究者关注,同时股票市场的高额回报也促使了股票市场预测的发展[1,2,3]。在传统的预测研究中,时间序列分析例如ARIMA,ARCH/GARCH[4,5],而股票市场是一个复杂的非线性动力系统[6],市场的行为受到很多因素的交互影响,具有很强的非线性和时变性的特征,而时间序列是基于统计学理论的,很难揭示股票的内在规律。本文提出一种基于粗糙集-神经网络相结合股票预测模型。

2 粗糙集与神经网络

粗糙集(Rough Set,RS)理论是波兰数学家Pawlak于1982年提出的一种处理模糊性与不确定性数据分析方法,在处理大量数据,消除冗余信息方面都有良好的效果[7]。粗糙集理论是基于不可分辨性的思想和知识简化的方法,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以模拟人类的抽象逻辑思维对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。

人工神经网络(Artificial Natural Network,ANN)的研究,可追溯到1957年Rosenblatt提出的感知模型(Perception)[8],是对人脑若干基本特征的抽象和模拟,利用非线性映射的思想和并行处理的方法,通过自学功能、联想存储功能高速寻找优化解。

神经网络一般不能处理具有语义形式的输入,粗集理论可以输入定性、定量、或者混合性信息。神经网络可以实现无导师聚类学习,但不能确定哪些知识是冗余的,哪些知识是有用的。本文首先采用粗糙集相结合的属性约简算法对决策表属性进行归约,去掉冗余的属性,并得到决策规则。然后利用模糊神经网络相结合的技术对现存的人工神经网络算法进行改进和优化。选择合适的神经网络输入层、隐含层和输出层,使决策输出结果有较高的精度和可信度。

3 建立短期预测模型

首先建立了对股市有影响的因子库;然后,用粗糙集方法对信息进行预处理,即把粗糙集作为前置处理系统,再根据处理后的信息结构,构成粗糙集-神经网络信息处理系统。具体步骤为:第一,对训练数据样本离散化;第二,根据需要,采用属性约简方法删除冗余的属性;第三,确定神经网络的结构,选择训练参数,进行训练,获得连接权值;第四,存储连接权,形成预测知识库。

3.1 影响上证指数的因素

股票市场受政治、经济、社会、政策、心理等多种因素影响,中国经济处在转型压力期,通货膨胀、经济减速和企业盈利能力下滑,影响中国股市的因素有次贷危机、CPI上升、央行升息、提高准备金率、限售股解禁、再融资压力、印花税、基金减仓、宏观政策趋紧等诸多因素。

3.2 选择决策信息

粗糙集理论基于对数据的近似处理以及对数据中不必要信息的约简,根据有关专家的分析及相关文献研究成果,表1为本文所构造的决策表的条件属性。并选取2007年6月19日到2008年6月20日共255天的实际数据进行因素重要度分析(图1)。然后数据进行模糊分区处理,形成上证指数和影响上证指数的约简矩阵。

通过以上对不同指定条件因素的设置,根据粗糙集数据挖掘软件的运行结果可以确定CPI指标、准备金率、交易量、宏观调控是提高对上证指数最重要的因素。这些因素也得到了验证,如表1。

3.3 系统设计与实现

3.3.1 网络结构

模糊神经网络的结构(图2)可以分为输入层,用向量d=(x1,x2,…,xd)表示,隐藏层用用向量m=(h1,h2,…,hm)表示,根据logistic激活函数得到输出层u=(y1,y2,…,yc)用表示,因为g'(a)=exp(a)/(1+exp(a),所以输出层用函数。

3.3.2 网络训练算法

误差函数,学习过程可以用如下函数表示:

3.3.3 训练结构和评价

粗糙集处理后的网络训练样本为255个,输入节点数255个,隐含层数1个,输出节点数21个,将已简化后的BP网络中相应的指标值分别送入BP网络中训练。按上述网络结构,把两次简约后的数据信息表输入到神经网络中训练,训练时间为5分20秒,训练次数895/50000,经训练后的最大误差为30.485,平均误差为13.938。

3.3.4 模型预测

我们以2008年6月22日—2008年7月18日的上证指数进行预测,该模型的实际输出与期望输出误差不大,预测结果与实际情况较为吻合(图3),并且结论直观。

4 结语

本文将神经网络与粗糙集理论相结合,建立了基于粗糙集人工神经网络的上证指数的短期预测模型,并对2008年6月22日-2008年7月18日了实证验证,得出了较理想的评价结果。基于粗糙集神经网络的上证指数模型,由于其评价速度快、精度高,所采用技术的智能化、科学化能力强,为股市决策提供了新的思路和方法。

摘要:本文通过对上证指数K-线图、准备金率、CPI、宏观政策等进行分析,得到一些对上证指数有影响的因子,利用人工神经网络与粗糙集理论的优势,先采用粗糙集对数据进行处理,然后利用人工神经网络构造出上证指数短期预测模型,并以此模型进行分析,最后应用于股票市场,在股票的交易中取得了很好的效果。

关键词:神经网络,粗糙集,上证指数股票预测

参考文献

[1]EugeneF,Fama,Market Efficiency,Long-Term Returns and Behavioral Finance.[J],1998,49.

[2]Jiangjiao Duan,A prediction algorithm for time series based on adaptive model selection[J],Expert Systems with Applications 2008,8.

[3]Philip M.Tsang,Design and implementation of NN5 for Hong Kong stock price forecasting,[J],2007,453.

[4]Chermozhukov V,Aspects of Model ad Estimation[J],Empirical Economies 2001,26.

[5]王振龙.时间序列分析[M],北京中国统计出版社,2000

[6]M.H.Ghiassi,A dynamic artificaial netural network model for forecasting series events,[J],Forecast.21,2005.

[7]胡纯.粗糙集理论及其在知识发现中的运用[Z].首都师范大学,2006.

[8]P.H.Franses,On forecasting exchange using neural network.[J] Appl.Financial Econ.8,1998.

基于指数增长模型的全国人口预测 篇8

关键词:人口增长率,指数增长模型,递归模型

0 引言

我国人口一直呈持续增长趋势, 为了发现人口增长的规律, 以便于国家对人口政策作出合理调整, 所以应该对未来人口进行预测, 人口的预测与控制是一个较为复杂的问题, 在不考虑资源与环境等干扰因素的影响下, 最简单的人口增长与预测方案是人所共知的指数增长模型[1]。

1 指数增长模型

1.1 模型的原理

指数增长是经济学理论中重要的分析工具, 当一个变量在一定时期内按固定比率增长时, 指数 (或几何) 增长就发生了。例如:当数量为200的人口每年以3%的比列增加时, 在起始年份 (第0年) , 人口为200, 第1年人口数为200× (1+0.03) ^1;第2年人口数为200 (1+0.03) ^2;……;第n年人口数为200× (1+0.03) ^n;……按此类推。

1.2 模型的建立

本文我们在排除一切外界干扰因素的影响下, 建立了指数增长模型[1]:标记当年人口为x0, l年后人口为xl, 年增长率为r, 则

显见, 公式 (1) 中的年增长率r保持不变。

我们令t年的人口数目为x (t) , 当考察一个国家的人口时, x (t) 便是一个很大的数。利用微积分学这一数学工具, 不妨把x (t) 视为一个连续可微的函数, 令初始时刻t=0年的人口为x0, 假设r为常数, 即单位时间内人口变化率等于r乘以x (t) , 于是, 得到x (t) 满足微分方程

简单求解, 得

r>0时, (3) 式表示人口按照指数规律随时间无限增长, 因此, 我们得到了以指数增长为依据的人口预测与控制模型。

1.3 模型参数r的估计

为了估计指数增长模型 (2) 或 (3) 中的参数r和x0 (1975的人口总数) , 需将 (3) 式取对数, 得

y=rt+b, y=ln x, b=ln x0 (4)

用MATLAB等软件对人口统计数据进行拟合, 可得到参数r。

2 人口的预测

我国1972年开始实行计划生育政策, 根据全国人口普查数据, 为了使预测结果更加精确, 我们节选1975-2010年的全国人口普查数据[2], 每隔五年抽取一组, 得到8组数据, 分别为:1975年919.7百万人, 1980年987.05百万人, 1985年1058.51百万人, 1990年1160.02百万人, 1995年1212.1百万人, 2000年1295.33百万人, 2005年1306.28百万人, 2010年1370.53百万人。

将上述数据代入指数模型之中, 并使用MATLAB等软件进行分析, 我们得到的值为0.0577 (5年) , 根据公式 (3) 计算, 求得1975年—2010年中每5年的全国预测总人口数目, 整理并分析得出的结果, 并通过对实际和预测人口数据作比较, 求得其预测误差为2.5%, 与原有模型的预测误差相比, 可以认为该模型相当满意。

所以, 我们运用指数增长模型对未来40年我国人口总数进行预测, 得出结果如下:2015年人口的总数目1389.2百万人, 2020年1425.5百万人, 2025年1455.9百万人, 2030年1479.9百万人, 2035年1502.3百万人, 2040年1518.0百万人, 2045年1523.0百万人, 2050年1527.7百万人。

不难发现, 在短时间内, 我国人口总数随着时间的增长而不断增大。

3 结语

运用指数增长模型对人口数目进行短期预测是相当准确的。但该模型中人口的数量将随着时间的增长无限制增长, 显然, 是与实际情况不符的, 在资源与环境等因素的干扰下, 某个地区的人口是不可能无限制增长的, 当增长到一定的数量后, 增长速率将会慢下来, 因此, 为了更好的预测我国人口的发展, 我们亟需引进更贴近实际状况的模型来解决此类问题。

参考文献

[1]姜启源.数学模型[M].北京:高等教育出版社, 2011.

[2]国家人口发展战略研究课题组国家人口发展战略研究报告[R].2012.

[3]付加锋中国东部沿海地区产业结构预测及其结构效益评价[R].2006.

基于指数平滑法的需求预测 篇9

如上图所示,最终用户将销售预测数据,反馈给底层的分销商,底层的分销商再往自己上一层的分销商反馈数据,这时,他往往会根据自己的经验或主观判断,将从最终用户处得到的数据增加或减少一定数量。在随后从最上层分销商到批发商,从批发商到生产商,再到供应商的每一个信息传递的环节中,都会重复这种行为。最终到达供应商处得销售预测数据为,其中的大小对销售预测的准确性有着重要的影响。

大多数生产制造企业都会保留历史数据用来对未来的数据进行预测。通常来说,产品或物料的需求数量,是随着时间的移动呈一定趋势发展的。所以在进行预测的时候,单纯地通过将所有历史数据进行平均来对未来时期的需求进行预测,并不能体现需求发展的趋势,势必造成预测与实际数据的较大偏差。

指数平滑法能够较合理地反映需求数据发展的趋势,预测的数值更多的是由靠近所预测时间的历史数据决定。离预测时间越远的历史数据,对预测数据的影响越小。

令Ft+1为t+1时期的预测数据,Dt为t时期的需求数量

其中,α为平滑参数,0<α<1。

由此我们可以推出,Ft+1=αD+α(1-α)Dt-1+(1-α)2Dt-1+(1-α)3Dt-3+…

指数平滑模型实际上是一个加权滑动平均模型。从上式可以看出,由于α的值是介于0和1之间的,因此越靠近当前时期的数值权重越大。

由Ft+1=αDt+(1-α)Ft可以推出Ft+1=Ft+a(Dt-Ft)

对于α的取值,一般要根据历史数据的特点来决定。当历史需求数据波动不大的时候,一般α的取值会在0.05到0.2之间,这样就相应地增加了远离当前时期的历史数据的权重;当历史需求数据波动很大,有明显的上升或者下降的趋势时,α的取值会相对较大,一般在0.3到0.5之间,这样靠近当前时期的数据将对预测数据有着较多的决定作用,预测值将会比较合理。在实际计算中,一般会对α有若干取值,再根据最小二乘法的原理,在不同α值条件下求得实际数据与预测数据之间的误差平方和S,其中S的最小值相对应的α取值将是合理的α值。T

根据公式Ft+1=Ft+a(Dt-Ft)对T+1时期进行预测,令α=a1;a2;a3,可得到计算列表如下:

在S1、S2和S3中选取值最小的,其所对应的α取值将是预测模型中α的值。

在实际生产中,需求数据会受到发展趋势,季节等多方面因素的影响,预测模型需要考虑到实际情况的复杂性。在表述趋势和季节等多方因素的预测模型中,最常见的是Winter模型,该模型不仅体现出历史数据的层级,并考虑到其发展趋势,以及季节变化对需求数据的影响,Winter模型需要引入3个参数,层级L、趋势T和季节因素S。

在Winter模型中,我们除了决定层级的参数α以外,还需要引入β作为趋势因素所决定平滑值的平滑参数,以及决定季节性因素的平滑参数γ。

尽管指数平滑模型尽量考虑到了预测的合理性,但是预测数据总是和实际需求数据是有偏差的。因此,对预测误差进行估算将会帮助我们对预测数据的可利用性及风险性有一个大概的认识,使预测数据更具参考价值。通过比较历史实际需求数据和同时期的预测数据,可以估算出预测模型的偏差。

将t时期的预测误差定义为

在实际情况中存在许多预测误差的模型,这些模型都有着不同的侧重点。

首先要介绍的是平均绝对值偏差法(Mean Absolute Deviation=MAD),这是在许多制造企业中广泛运用的计算预测偏差的方法。在n段时期中,其中是偏差Et的绝对值,这种预测误差模型将实际需求数据与预测数据之间的不管是正值还是负值的偏差都进行了捕捉分析,进一步完善了预测模型。

第二种预测误差模型称为均方误差(Mean Squared Error=MSE)。和简单地将历史误差进行平均的预测误差模型相比,均方误差将误差值进行平方,这就使与实际需求数据偏差较大的误差获得更多的权重。

指数平滑法只是一种预测工具,在实际生产生活中,预测远比模型要复杂得多。依靠历史数据和预测模型而得出的预测数据,还需要结合社会发展、经济贸易的活跃程度等多方因素进行分析,才能使预测更加科学合理,给供应链中的各个环节尤其是生产环节带来实际的参考意义。

摘要:销售及需求预测是现代供应链的重要构成,有参考价值的预测能给采购和计划环节带来时间上的优势,并节约了物流仓储环节的成本,从而提高整个供应链的效率。文中介绍了在预测中常用的指数平滑法,通过对历史数据以时间序列为标准进行权重分配,并综合考虑发展趋势和季节等多重因素,从而得到的较为合理的,有一定参考价值的预测数据。

关键词:需求预测,需求管理,指数平滑法

参考文献

[1]Niels Agatz Demand Management in E-Fullillment,Amsterdam,2009.

[2]John T.Mentzer,Mark A Moon,Dominique Estampe,Glen Margolis Demand Management,2006.

[3]George Lawrie,Best practices:Demand Management,2007.

[4]James D.Blocher,Vincent A.Mabert,Ashok K.Soni,Munirpallam A.Venkataramanan,Including an Introduction to Forecasting using the SAP R/3 System,2004.

[5]杨淑伶,陈沛愈,江欣怡.存货管理与需求预测之整合及其应用.明道管理学院,2005.

[6]罗新星,吴翀.供应链中牛鞭效应的定量分析与有效控制[J].中南大学,2006.

指数预测 篇10

计算机科学在最近十几年中有了突飞猛进的发展,各种各样的软件已经无处不在,成为推进全球经济全面快速发展的驱动器,并加速了科学技术革命,新军事变革与知识经济的飞速前进。今天,许多软件产品功能越来越强大,软件结构也越来越复杂。然而正是由于系统功能的强大和复杂程度的不断提高,随之产生的系统可靠性与稳定性等问题便日益突出,特别是在一些高危险性的应用领域如航空航天、核反应堆、军事控制系统以及汽车、石油、通信、金融、半导体和制药等与国民经济相关的重要领域。

在过去的几十年里,众多的软件可靠性模型被提出,虽然它们在一定程度上提高了软件的生产率和可靠性,但在实际工程应用中仍存在诸多问题,所以建立新的高精度模型或提高现有模型的精度势在必行。在传统软件可靠性理论中,软件失效过程被认为是一个完全随机系统,文献[1]对软件失效机理进行了详细考察,得出的结论是软件失效行为除了具有随机性,同时也具有混沌性。因此,我们可以应用混沌理论来解决软件可靠性预测问题。

现有的基于混沌的软件可靠性模型[2]主要存在两方面的问题:第一,混沌预测基本只能做短期或中期的预测,只有在一个有限的时间段内它的预测才是有效的,但现有模型没有指明这个时间段有多长;第二,只在标准数据集(Musa数据集)上进行了模型验证,而没有在实际观测得到的软件失效数据上进行验证。鉴于此,本文以模拟法庭教学软件系统为实验环境,以Matlab为编程工具,对采集到的软件失效数据建立了基于最大Lyapunov指数的混沌预测模型,进行了软件失效预测,通过分析预测结果,并将该模型的预测误差与现有其他混沌预测模型的预测误差做了比较,证明了该预测模型具有较高的预测精度。

1 最大Lyapunov指数及其求解

1.1 最大Lyapunov指数的定义

Lyapunov指数是对整个相空间中初始条件不同的两条相邻的轨迹随时间推移按指数规律分离的比率的定量描述。在一维动力系统xn+1=F(xn)中,导数|F′(x)|的值决定了初始两点迭代后是相互分离还是靠拢。当|F′(x)|<1时,迭代后的两点相互靠拢,而当|F′(x)|>1时,迭代后的两点相互分离。在迭代的过程中,|F′(x)|的值是不断变化的,为了从整体上描述系统的分离情况,必须对迭代次数求平均,因此不妨引入不同局部因子的一个适当的平均,即参数λ,如图1所示。于是原来相距为ε的两点经过n次迭代后的距离可由下式求得:

εe(x0)=|Fn(x0+ε)-Fn(x0)|

当取极限ε→0,n→∞,上式变为:

λ(x0)=limxlimx01nln|Fn(x0+ε)-Fn(x0)ε|=limx1nln|dFn(x)dx|x=x0

通过变形计算可化简为:

λ=limx1ni=0n-1ln|dF(x)dx|x=xi

由上式看出,初值的选取不会影响λ的变化,因而被认为是系统不变量,在动力学系统中把λ称作是原动力系统的最大Lyapunov指数[3]。如果最大Lyapunov指数是正数,说明系统的变化具有发散性,即系统具有混沌特性。

1.2 最大Lyapunov指数的求解

最大Lyapunov指数是对系统变化轨迹发散性的定量描述,为混沌预测提供了依据。由1.1节对最大Lyapunov指数的描述可以知道,从时间序列提取Lyapunov指数的方法很多,其中小数据量方法具有操作方便、计算量小、对小数据量比较可靠等优点,所以本文采用小数据量方法[3]来计算时间序列的最大Lyapunov指数。图2描述小数据量方法的整个计算过程。

(1) 对时间序列(x1,x2,…,xn-1,xn)进行FFT变换,计算出平均周期P;

(2) 用G-P算法计算关联维数D,并确定嵌入维数m,用C-C算法求出时间延迟τ,重构相空间{Yj,j=1,2,…,M};

(3) 找相空间中每个点Yj的最近邻点Yi,并限制短暂分离,即:

dj(0)=miniYj-Yi|j-i|>p

(4) 对相空间中每个点Yj,计算出k个离散时间步后的距离:

dj(k)=|Yj+k-Yi+k| k=1,2,…,min(M-j,M-i)

(5) 对每个k,求出所有j的lndj(k)的平均y(k),计算公式如下:

y(k)=1qΔtj=1qlndj(k)

其中q是非零lndj(k)的数目。计算完成后用最小二乘法做线性拟合:建立一个线性模型y=f(x)=ax+b,其中ab是待定系数,通过实验数据(xk,yk)确定ab,最小误差原则是保证ykf(xk)之间距离的平方和最小。

下面就讨论系数ab的求法,考虑下面的误差函数:

Δ(a,b)=k=1n[yk-f(xk)]2=k=1n[yk-(axk+b)]2

可以发现Δ(a,b)是关于ab的二次函数,Δ(a,b)最小的必要条件是Δ(a,b)a=0Δ(a,b)b=0同时成立,从而有:

{k=1nxk[axk+b-yk]=0k=1n[axk+b-yk]=0

求解这个关于ab的方程组,解出ab,该直线的斜率a就是最大Lyapunov指数。求出这个值以后,就能定量描述相空间中初始相邻两点随轨道的分离速度,为混沌时间序列预测提供理论依据。

2 基于最大Lyapunov指数的软件失效预测

预测就是从过去与现在的信息中寻找规律,以得知未来的变化。现有的大部分预测方法都属于数理统计学方法,是建立主观模型进行计算与预测的。而混沌理论的出现,使得我们可以直接根据由时间序列本身所求解出来的客观规律进行预测,不需要主观假设。这样预测结果的人为主观性也可以避免,预测精度和可信度得以提高。混沌时间序列预测方法有以下几种:全域法、局域法、基于神经网络的时间序列预测方法以及基于Lyapunov指数的时间序列预测方法等[4]。目前,前三种方法已被应用于软件失效预测中,其中基于神经网络的方法取得了最好的效果;而基于最大Lyapunov指数的软件失效预测还没有人研究。

最大Lyapunov指数作为量化初始轨道指数发散性的混沌量,是混沌系统的一个很好的预测参数。最大Lyapunov指数预测的理论基础仍然是基于对时间序列的相空间重构技术[5,6]。该方法在边坡移位、电力系统、转子剩余寿命等许多领域的短期预测中有着广泛的应用[4,7]。由于信息就隐藏在任一分量的运动过程中,这种运动过程是高维空间下的一种运动轨迹[7],轨迹的变化存在一定的规律性,而这种规律可以从一个分量的时间序列数据中提取和恢复出来。由于上面提到的前三种预测方法只对一步预测比较有效,而对多步预测误差比较大,所以选用基于最大Lyapunov指数的预测方法来预测软件失效。

在1.2节中,讨论了最大Lyapunov指数的求解方法,可以用该方法求出软件失效数据的最大Lyapunov指数,然后依据Lyapunov指数建立软件失效预测模型。

对于观测得到的软件失效时间序列x1,x2,…,xi…,xn,假如需要预测xn+k,则取相空间中一点Xp=(xn-(m-1)τ,xn+1-(m-1)τ,…,xn)为预测中心点,其中p=n-(m-1)τ。在对时间序列重构相空间以后,设相空间中Xp的最近邻点为Xl,则Xl∈{X1,X2,…,Xp-1};设 XpXl 的距离为d,则有:

d=minjXp-Xj=Xp-Xl

确定Xp的最近邻点Xl之后,根据XpXl的进一步演化Xp+1和Xl+1,得到:

Xp-Xp+1‖=‖Xl-Xl+1‖eλ1

其中λ1为软件失效时间序列x1,x2,…,xi…,xn的最大Lyapunov指数。式中只有Xp+1的最后一个分量xn+1未知,故xn+1是可预测的;如果要对xn+k进行预测,解决了一步预测,k步预测可以递推。这就是基于最大Lyapunov指数λ1的软件失效预测模型。由于相空间中的点会随轨迹的运动出现一定速度的分离,所以预测时间也是有限的,最大Lyapunov指数模型的有效预测时间范围一般通过1/λ1来确定。应用上述方法,可以预测在1/λ1时间内的软件失效行为,只要预测精度足够高,就可以为软件恢复和故障排除提供依据。

3 实验过程、结果分析及结论

3.1 软件失效数据采集与降噪

本文选用实验室自主开发的模拟法庭教学软件系统为研究对象。为了对该软件进行失效预测,首先要采集系统的软件失效数据,采集工具使用JBFDCollector。采集过程耗时102天,采样间隔为1小时,共获得2408个样本点,构成了软件失效时间序列。所有后续实验均是在这些数据的基础上进行的。注意,软件失效数据并不是只与软件本身有关,还受整个系统软硬件配置的影响,所以在不同的时段同一配置或不同的配置同一时段下采集到的数据肯定是不同的。

由于实际获得的时间序列通常包含噪声,噪声的存在会淡化系统的混沌特性,即降低确定性规律的显著性,会影响时间序列分析效果,所以要对时间序列进行降噪处理。在本实验中主要采用简单的非线性降噪法,其核心思想是使用观测时间序列的局部平均值代替时间序列的中间值[8]。对于嵌入向量x=(xn-m,xn-m+1,,xn-1),修正过的中间值x^n-m/2可以通过计算uε(xn)的平均值得到,即:

x^n-m/2=1|uε(xn)|xjuε(xn)xj-m/2

在计算完成后,所有参与过计算的xn都被替代为x^n。重新调整搜索半径,依次迭代,这样就可以得到降噪后的时间序列{x^n}n=1Ν

3.2 软件失效数据的混沌分析

对软件失效时间序列进行相空间重构时,实验选用C-C算法求解时间延迟τ[4],用Matlab程序实现C-C算法,对降噪后的数据进行求解,图3描述了C-C算法求解时间延迟τ的结果,得到软件失效时间序列的时间延迟τ=7。

接着使用G-P算法,得到相关维数D=2.416,嵌入维数m=8,图4描述了这个过程,充分说明了软件失效时间序列的混沌特性。

3.3 计算最大Lyapunov指数

依据1.2节介绍的方法和3.2节得到的时间延迟和嵌入维数,编程求解降噪后的软件失效时间序列的最大Lyapunov指数,如图5所示,最大Lyapunov指数的值即为图中回归直线的斜率,即λ1≈0.0274。

最大Lyapunov指数的值大于零,说明相邻点最终要分离,状态空间中轨线是发散的,即该软件的失效是可预测的。这是该模型建立的基础。

3.4 预 测

最大Lyapunov预测模型的预测时间通过1/λ1来确定,从而可以计算得到软件失效时间序列预测长度1/λ1=41。依据最大Lyapunov指数预测模型,利用软件失效时间序列的前2 367个样本数据进行模型检验,对第2 367个样本以后的41个数据值进行预测。

本文取平均相对误差MAPE作为预测效果的判断依据,即

ΜAΡE=1ni=1n[|A(i)-F(i)|A(i)]×100%

式中,A(i)和F(i)分别表示实际数据和预测数据,n表示预测数据的个数。根据上述预测理论,进行实验后,结果分析如表1所示。计算出预测数据的平均相对误差为9.53%,误差小于15%的占76%,而误差小于10%的占68%。图6显示了每个预测数据的相对误差情况,可以看到预测模型的预测误差较低,具有相当好的预测精度。同时可以看出,在有效预测长度附近,预测误差已经比较大,预测结果开始变得不可信;如果超出有效预测长度,误差将会更大。

对同样的软件失效数据采用基于神经网络的混沌预测方法进行预测,其中预测长度为50(Hour)。预测结果情况如表2所示,对比表1可以看出,相对于本文方法,神经网络混沌预测方法的最大相对误差更小,但平均相对误差更大,所以基于最大Lyapunov指数的预测方法在软件失效预测中取得了更稳定的预测效果,平均相对误差更小说明总体的预测效果也更好;并且本文方法的最大误差出现在最大有效预测长度附近,若适当减少两三步的预测,那么平均相对误差和最大相对误差都会大大优于神经网络混沌预测方法。

由以上实验可知,基于最大Lyapunov指数的预测模型,其实是在最大Lyapunov指数的计算结果的基础上建立起来的,因此该模型用于短期预测和中期预测时比较准确。

参考文献

[1]邹丰忠.软件可靠性理论分析与计算[D].武汉水利电力大学,1999.

[2]邹丰忠,李传湘.软件可靠性混沌模型[J].计算机学报,1999,24(3):281-291.

[3]Rosenstein M T,Collins J J,De Luca C J.A practical method for cal-culating largest Lyapunov exponents from small data sets[J].PhysicalD,1993,65:117-134.

[4]吕金虎,陆君安,陈士华.混沌时间序列分析及其应用[M].武汉:武汉大学出版社,2002:57-109.

[5]周金勇.混沌时间序列预测模型研究[D].武汉理工大学,2009.

[6]李海波.混沌时间序列预测应用研究[D].中国科学技术大学,2009.

[7]粱志珊,王丽敏,付大鹏,等.基于Lyapunov指数的电力系统短期负荷预测[J].中国电机工程学报,1998,18(5):368-371.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:浅谈爱情与婚姻范文 下一篇:爱情与婚姻英文演讲稿LOVE and MARRIGE