上证指数股票预测(精选七篇)
上证指数股票预测 篇1
一、上证指数的实证预测分析
分析的数据是上证指数自2013 年9 月24 日至2013 年12 月10 日的7 日移动均线数数据收盘价格,研究的目的是希望能够对其运行趋势在短期内做出一个判断。希望预测的是一种短期的趋势而不是精确的未来每一天的股票收盘价,所以对采用简单移动平均的方法对收盘价数据进行了一定程度的降噪处理,从而较为及时准确地反映中国股市的行情动态。
(一)ARIMA建模分析
差分运算有很好的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质,这时我们称这个非平稳序列为差分平稳序列。对差分平稳序列一般使用ARIMA模型进行拟合。
在我们所选择的研究的样本区间,上证指数的波动性较强,是典型的非平稳序列,不能直接使用ARMA模型进行拟合,所以考虑使用ARIMA模型。
下面我们按照ARIMA建模流程展开研究。
(二)获得数据
分析的数据是上证指数自2013 年9 月16 日至2013 年12 月10 日的收盘价格。经过简单移动平均的降噪处理,获得的数据。
(三)判断序列的平稳性及进行差分运算
通过对其做时序图来直观地观察序列的平稳性可以看出上证综合指数原始时间序列有着明显的波动,易知为非平稳序列,需对原始时间序列进行平稳化处理后再进行建模。因为原序列呈现出近似先下降后上升的趋势,为消除其趋势因素,可以采用差分的方法。对原序列进行一阶差分运算后,得到新的时间序列,新序列无明显趋势或周期,波动较为稳定。
(四)对平稳的1 阶差分序列进行白噪声检验
在上证综合指数白噪声检验输出结果中显示,在检验的显著性水平为0.05 的条件下,统计量的P值远小于0.05,所以有很大把握(置信水平>95%)断定该序列属于非白噪声序列。
结合前面的平稳性检验结果,说明该序列不仅可以视为是平稳的,而且还蕴含着值得提取的相关信息。下面我们对该序列进行建模和预测。
1 阶差分后序列的自相关图已经显示出该序列有自相关系数1 阶截尾的性质。偏自相关图显示出一定的截尾性,所以考虑用ARMA(1,2)模型拟合1 阶差分后序列。考虑到前面已经进行的1 阶差分运算,实际上是用ARIMA(1,1,2)模型拟合原序列。
(五)模型定阶、参数估计与检验
通过在IDENTIFY命令中增加一个可选命令MINIC,就可以获得一定范围内的最优模型定阶。结果显示,在p=2,q=4 时,BIC函数值最小,执行ARIMA过程的Estimate p=2,q=4 命令做参数检验,结果未能通过参数检验。对之前经验估计的ARMA(1,2)模型,即p=1,q=2 时同样做参数检验,最终该模型通过参数检验。
从上面模型的检验结果可以看到,其为有效模型,且ARMA(1,2)模型的AIC为253.3724,SBC为260.5096。
在最小二乘估计原理下,由于MU常数项未通过检验,拟合结果等价于:
(六)对残差序列进行检验
对残差序列进行整理,结果(如下表所示)。
显然,拟合检验统计量的P值都显著大于显著性水平0.05,可以认为该残差序列可视为白噪声序列,系数显著性检验结果显示常数项未通过检验,即不存在常数项。这说明ARMA(1,2)模型对该序列建模成功。
(七)拟合与预测
我们的目标是进行短期预测,所以预测步长设定为10,即预测未来10日内7日移动均线的走势。
所得到的拟合与预测效果图如下:
以上主要是应用ARIMA模型进行建模分析,由上图看,未来7日均线有下降的趋势,这就提示我们注意风险。
二、总结
由于股票价格的波动性往往呈现出异方差性和波动聚集性,而且异方差的函数形式通常是未知的,但由于个人能力有限,无法利用GARCH模型对指数短期趋势序列进行进一步的探讨而有效地处理异方差性。这是本次论文的一个不足之处。
上证指数股票预测 篇2
预测目的:
“上海证券综合指数”它是上海证券交易所编制的,以上海证券交易所挂牌上市的全部股票为计算范围,以发行量为权数综合.上证综指反映了上海证券交易市场的总体走势 股票价格指数是证券指数重要的组成部分,指是用以反映整个股票市场上各种股票市场价格的总体水平及其变动情况的指标,简称为股票指数。它是由证券交易所或金融服务机构编制的表明股票行市变动的一种供参考的指示数字,是衡量一个国家政治经济气候的晴雨表。证券综合指数可以作为参考指标,来观察、预测社会政治、经济发展形势,股价指数是反映股票市场中股票价格变动总体水平的重要尺度,更是分析、预测发展趋势进而决定投资行为的主要依据。因此对证券综合指数的研究和预测对我国的政治形势的预测以及对经济发展的把握具有重要的意义。
预测原理:
首先我们先对现有的和过去的上海股市上证指数进行查找和分析,并从与股市上证指数有关的论文中确定影响股市上证指数的国家财政收入、贸易进出口总额,居民储蓄存款余额等14个相关的因素。
再确定影响因素之后,接着就是确定获取原始数据的年限范围,由于预测的是未来五年上海股市上证指数,根据预测的原理,不仅要考虑到预测数据的准确度,还要兼顾数据的可靠性,因此选取了1992年至2011年共19年的数据。然后对该因素所涉及的19年的数据进行收集,收集的主要渠道从北京市2011年年鉴中获得。对缺少的历史数据则采用平均增长率计算补全,获得完整的数据。
之后,使用EXCEL对数据进行处理。求出每个因素的在每个历史年代的增长率进而得到平均增长率。
基于Eviews上证综合指数预测 篇3
【关键词】指数预测 时间序列 ARIMA模型
一、模型构建
(一)样本选取
本文选用上证指数时间跨度为2000年1月28日至2015年10月30日的月份数据,剔除节假日和个别不交易的数据,样本容量为191。其中,选取2015年11月上证指数收盘价作为模型预测的估计量,所有交易数据来源于同花顺官方网站。
(二)数据处理
由于上证指数数据较大,故本文通过对数化处理得出上证指数的收益率LNXt=lnXt,式中Xt为第t个交易日上证指数的月收盘价,LNXt表示上证指数在第t个交易日的收益率。
(三)平稳性检验
一般而言时间序列数据都具有某种趋势,是非平稳的,用单位根检验方法(ADF检验)可验其平稳性,本文用单位根检验的三种设定形式分别检验上证指数的平稳性。
模型1:
模型2:
模型3:
表1 上证收益率LNX的ADF检验结果表
由表1可以看出,无论在哪一种模型形式下,上证指数收益率序列LNX非平稳,无法对其建立ARIMA模型。
为了得到平稳的收益率序列,对其进行一阶差分得D(LNXt)=LNXt-LNXt-1。
对差分序列DLNX进行ADF检验(表2),上证指数收益率1阶差分序列通过了ADF检验,该序列是平稳的,ARIMA模型中滞后阶数d=1,可对DLNX建立ARIMA模型。
表2 DLNX的ADF检验结果表
(四)模型估计
作收益率1阶差分后滞后20期的自相关——偏自相关图,发现收益率1阶差分后的序列自相关图是截尾的,偏自相关图是截尾的,对收益率差分序列建立ARIMA模型,估计结果如表3。
表3 ARIMA(11,1,11)估计结果
估计方程:
ARIMA(11,1,11)模型参数在10%的水平下都是显著的,其中,AR(11)和MA(11)在1%显著性水平在显著,常数项在10%显著性水平下显著,AR特征根0.96和MA特征根0.99都在单位圆之内,是平稳的。
(五)模型诊断
对模型ARIMA(11,1,11)残差进行检验,得到残差单位根检验结果(表4)。残差通过了ADF单位根检验,故残差序列是白噪声。
表4 残差ADF检验结果表
二、样本外预测
本文采用静态预测,依据模型对上证指数收益率进行预测,结果见表5。
表5 上证指数预测结果
三、结论
本文利用ARIMA模型对上证指数月度数据进行预测,真实值与预测值对比情况见表5,预测结果在允许的误差内,从而ARIMA(11,1,11)模型对大盘指数有较好的预测性。选取的月度数据未包含一个月内影响指数变动的诸多因素,故有一定的误差。此模型对大盘走势进行的短期预测,可为投资者提供一定的投资决策依据。
参考文献
[1]刘云.ARIMA对我国上证指数的预测研究[J],现代商贸工业,2012(16).
[2]柯文泉.ARIMA模型在上证指数预测中的应用[J],现代商业,2008(13).
上证指数短期预测的数学模型 篇4
股票市场在我国日渐繁荣,逐渐成为证券业乃至金融业的重要组成部分。股市综合指数、股票价格的预测一直是学术界的一个焦点备受研究者关注,同时股票市场的高额回报也促使了股票市场预测的发展[1,2,3]。在传统的预测研究中,时间序列分析例如ARIMA,ARCH/GARCH[4,5],而股票市场是一个复杂的非线性动力系统[6],市场的行为受到很多因素的交互影响,具有很强的非线性和时变性的特征,而时间序列是基于统计学理论的,很难揭示股票的内在规律。本文提出一种基于粗糙集-神经网络相结合股票预测模型。
2 粗糙集与神经网络
粗糙集(Rough Set,RS)理论是波兰数学家Pawlak于1982年提出的一种处理模糊性与不确定性数据分析方法,在处理大量数据,消除冗余信息方面都有良好的效果[7]。粗糙集理论是基于不可分辨性的思想和知识简化的方法,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以模拟人类的抽象逻辑思维对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。
人工神经网络(Artificial Natural Network,ANN)的研究,可追溯到1957年Rosenblatt提出的感知模型(Perception)[8],是对人脑若干基本特征的抽象和模拟,利用非线性映射的思想和并行处理的方法,通过自学功能、联想存储功能高速寻找优化解。
神经网络一般不能处理具有语义形式的输入,粗集理论可以输入定性、定量、或者混合性信息。神经网络可以实现无导师聚类学习,但不能确定哪些知识是冗余的,哪些知识是有用的。本文首先采用粗糙集相结合的属性约简算法对决策表属性进行归约,去掉冗余的属性,并得到决策规则。然后利用模糊神经网络相结合的技术对现存的人工神经网络算法进行改进和优化。选择合适的神经网络输入层、隐含层和输出层,使决策输出结果有较高的精度和可信度。
3 建立短期预测模型
首先建立了对股市有影响的因子库;然后,用粗糙集方法对信息进行预处理,即把粗糙集作为前置处理系统,再根据处理后的信息结构,构成粗糙集-神经网络信息处理系统。具体步骤为:第一,对训练数据样本离散化;第二,根据需要,采用属性约简方法删除冗余的属性;第三,确定神经网络的结构,选择训练参数,进行训练,获得连接权值;第四,存储连接权,形成预测知识库。
3.1 影响上证指数的因素
股票市场受政治、经济、社会、政策、心理等多种因素影响,中国经济处在转型压力期,通货膨胀、经济减速和企业盈利能力下滑,影响中国股市的因素有次贷危机、CPI上升、央行升息、提高准备金率、限售股解禁、再融资压力、印花税、基金减仓、宏观政策趋紧等诸多因素。
3.2 选择决策信息
粗糙集理论基于对数据的近似处理以及对数据中不必要信息的约简,根据有关专家的分析及相关文献研究成果,表1为本文所构造的决策表的条件属性。并选取2007年6月19日到2008年6月20日共255天的实际数据进行因素重要度分析(图1)。然后数据进行模糊分区处理,形成上证指数和影响上证指数的约简矩阵。
通过以上对不同指定条件因素的设置,根据粗糙集数据挖掘软件的运行结果可以确定CPI指标、准备金率、交易量、宏观调控是提高对上证指数最重要的因素。这些因素也得到了验证,如表1。
3.3 系统设计与实现
3.3.1 网络结构
模糊神经网络的结构(图2)可以分为输入层,用向量d=(x1,x2,…,xd)表示,隐藏层用用向量m=(h1,h2,…,hm)表示,根据logistic激活函数得到输出层u=(y1,y2,…,yc)用表示,因为g'(a)=exp(a)/(1+exp(a),所以输出层用函数。
3.3.2 网络训练算法
误差函数,学习过程可以用如下函数表示:
3.3.3 训练结构和评价
粗糙集处理后的网络训练样本为255个,输入节点数255个,隐含层数1个,输出节点数21个,将已简化后的BP网络中相应的指标值分别送入BP网络中训练。按上述网络结构,把两次简约后的数据信息表输入到神经网络中训练,训练时间为5分20秒,训练次数895/50000,经训练后的最大误差为30.485,平均误差为13.938。
3.3.4 模型预测
我们以2008年6月22日—2008年7月18日的上证指数进行预测,该模型的实际输出与期望输出误差不大,预测结果与实际情况较为吻合(图3),并且结论直观。
4 结语
本文将神经网络与粗糙集理论相结合,建立了基于粗糙集人工神经网络的上证指数的短期预测模型,并对2008年6月22日-2008年7月18日了实证验证,得出了较理想的评价结果。基于粗糙集神经网络的上证指数模型,由于其评价速度快、精度高,所采用技术的智能化、科学化能力强,为股市决策提供了新的思路和方法。
摘要:本文通过对上证指数K-线图、准备金率、CPI、宏观政策等进行分析,得到一些对上证指数有影响的因子,利用人工神经网络与粗糙集理论的优势,先采用粗糙集对数据进行处理,然后利用人工神经网络构造出上证指数短期预测模型,并以此模型进行分析,最后应用于股票市场,在股票的交易中取得了很好的效果。
关键词:神经网络,粗糙集,上证指数股票预测
参考文献
[1]EugeneF,Fama,Market Efficiency,Long-Term Returns and Behavioral Finance.[J],1998,49.
[2]Jiangjiao Duan,A prediction algorithm for time series based on adaptive model selection[J],Expert Systems with Applications 2008,8.
[3]Philip M.Tsang,Design and implementation of NN5 for Hong Kong stock price forecasting,[J],2007,453.
[4]Chermozhukov V,Aspects of Model ad Estimation[J],Empirical Economies 2001,26.
[5]王振龙.时间序列分析[M],北京中国统计出版社,2000
[6]M.H.Ghiassi,A dynamic artificaial netural network model for forecasting series events,[J],Forecast.21,2005.
[7]胡纯.粗糙集理论及其在知识发现中的运用[Z].首都师范大学,2006.
[8]P.H.Franses,On forecasting exchange using neural network.[J] Appl.Financial Econ.8,1998.
上证指数股票预测 篇5
一、本文用到的理论基础
(一) Hodrick-prescott滤波
在宏观经济中, 人们更加关心趋势。HP滤波是一种被广泛使用的办法, 我们简要介绍下这个方法的基本原理。
设{Yt}是包含趋势成分和波动成分的经济时间序列, {YtT}是其中含有的趋势成分, {YtC}是其中含有的波动成分。则:Yt=YtT+Ytc, t=1, 2, …, T
计算HP滤波就是从Yt中将YtT分离出来。一般地, 时间序列{Yt}中的不可观测部分趋势{YtT}常被定义为下面最小化问题的解:
式中:c (L) 是延迟算子多项式。
将上式带入最小化问题求解, 则HP滤波就是使下面损失函数最小, 即:
最小化问题用[c (L) YtT]2来调整趋势增量的变化, 并随着λ的增大而减小。HP滤波依赖于参数λ, 该参数需要先验地给定。这里存在一个权衡问题, 要在趋势要素对实际序列的跟踪程度和趋势光滑程度之间作一个选择。随着值的增加, 估计的趋势越光滑。当λ趋于无穷大时, 估计的趋势将接近线性函数。一般经验, 本文的月度数据取14400较好。HP滤波的运用比较灵活, 它不像阶段平均法那样依赖对经济周期波峰和波谷的确定。HP滤波把经济周期看成是宏观经济对某一缓慢变动路径的一种偏离, 该路径在期间内是单调增长的, 所以称为趋势。HP滤波增大了经济周期的频率, 使周期波动减弱。
(二) 指数平滑法
指数平滑法有很多分类, 分别包括单指数平滑法, 双指数平滑法, Holt-Winters (乘法模型, 加法模型, 无季节性模型) 。单指数平滑法是指数平滑法的基础, 所以在此简单介绍下单指数平滑法。
单指数平滑法适用于序列值在一个常数均值上下随机波动、无趋势及季节要素的情况。时间序列的平滑序列, 计算公式如下:
式中:, α为平滑因子, α越小, 越平缓。重复迭代, 可得到:
由此可知为什么这种方法叫做指数平滑, 预测值是yt过去值的加权平均, 而权数被定义为以时间为指数的形式。单指数平滑的预测对所有未来的预测值都是常数, 这个常数为 (对所有的k>0) , T是时间序列的最终点。
二、实证部分
为了预测上证指数, 首先要搜集上证指数的时间序列数据, 本文的数据均来自RESSET金融研究数据库。数据是由2013年6月28日至2016年4月1日的上证指数收盘价的月度数据。处理数据的软件使用Eviews7.2进行。
1.运用HP滤波对数据进行处理。因为是月度数据, 所以依据经验法则, λ=14400, 得出结果如下:
从图中可以看出, trend即趋势线基本上是线性向上的, cycle即波动线在2014年末2015年初波动很明显, 在2016年初也波动很明显。但是在2013年6月至2016年4月, 总体的趋势是波动中向上增长。并且用原始数据得到了趋势值和波动值作为数据存储在Eviews中。
2.对2016年下半年的上证指数收盘价进行预测。第一, 进行未来大体趋势判断。HP滤波将原始数据分解出趋势数据和波动数据, 对趋势数据进行扩容, 使之时间跨度2013年6月至2016年4月变成2013年6月至2016年9月, 先用指数平滑法预测趋势数据, 得到:
可以很明显的看出剥离波动影响, 趋势是稳中向上的。
第二, 利用指数平滑法预测接下来几个月的收盘价。和上面一样, 首先在Eviews上, 对样本容量进行扩容, 使之时间跨度2013年6月至2016年9月, α, β, γ的取值由Eview s自动选择, 并且由于是月度数据, 所以cycle for seasonal选择12, 然后对原始数据进行指数平滑法预测。几种类别的指数平滑法都做一遍, 哪个得出的误差和残差平方和最小并且基本趋势向上的就是最合适的预测值。经过预测与比较得到如下结果最恰当:
α机选0.999, 则说明按照这个值做出来会使得误差平方和达到最小, 人为令α设为0.5, 0.6, 0.7, 0.8, 做出来的结果发现确实机选的0.999使误差平方和最小。而α趋于1说明序列趋近于随机游走, 最近的值对估计将来值最有用。所以预测数值选取的时间跨度不能太大, 否则会影响到预测的精度。
经过比较Holt-winters无季节性模型更加适合, 几种指数平滑法的α值都基本接近于1甚至等于1, 符合上证指数收盘价随机运动的性质。其中Holt-wintous乘法模型得出趋势朝下的预测值, 依据我们对HP滤波分离出来的趋势线预测, 应该是稳定向上的趋势, 所以不能用乘法模型来做。单指数模型做出的结果中, 2016年5月到2016年9的4个月收盘价都是同一平均值, 明显不符合实际, 没有指导意义。剩下的加法模型, 无季节模型, 双指数平滑法做出来的趋势都是向上, 而其中无季节模型做出来的结果标准误差和残差平方和最小, 所以选择Holt-wintous无季节模型的结果作为预测值。我们得到的2016年5月至9月的预测值分别如下:
将原始值和预测值放在同一折线图中, 看一下预测效果。
可以看出预测的收盘价平稳缓速上升。
三、结论
第一, HP滤波在做数据时, 分离出趋势线, 并对趋势线未来进行预测, 是一种比较好的预测未来大体趋势的方法, 因为这样规避了波动成分的影响。
第二, 在判断清楚未来趋势走向的情况下, 结合趋势运用指数平滑法对未来的上证指数数据进行预测, 会排除一些未来大体趋势和趋势线相反的指数平滑类别, 在判断哪种指数平滑法更优时, 很有参考价值。
第三, 同时我们也要看出本文的劣势, 因为HP滤波分离出了趋势线和波动线, 我们主要以其中的趋势线作为判断未来走势的重要根据, 而抛弃了波动线的影响其实也是有失偏颇的。因为往往有的时候突发性大事件和巨灾风险等等的冲击也会瞬间改变上证指数的趋势甚至使其上涨下跌趋势逆转。读者观看本文的时候一定要下意识的提醒自己非系统性风险的影响。
第四, 根据月度数据, 未来几个月的上证指数稳中有升, 但是升的幅度有限, 只能说明目前空头多头基本实力相当, 多头有轻微优势, 需要观望一段时间再做决定。
第五, 由于上证指数的数据基本符合随机运动所以每过一个月就要把新的月度数据加进去, 重新用指数平滑法预估趋势, 离现在越近的值对估计将来值越有用。预测数值选取的时间要尽量用到现在的时间点, 否则会影响到预测的精度。如今是2016年6月底了, 可以用最新的5月和6月的数据来验证下我们的预测, 我们观察到2016年5月的上证指数基本维持在2830点左右至2930左右上下波动, 比较稳定, 并且靠近6月的时候缓慢上升, 大体符合我们预测的结果。而到了6月份, 我们也可以看到由6月1日的2913缓慢上涨到6月8日的2927, 但是由于离英国公投时间6月23日越来越近, 由此大事件开始渐渐影响到我国的资本市场, 利空恐慌开始逐渐蔓延, 甚至到了离公投还有一周的时候, 大部分投资者已经开始持资观望, 股票市场交易慢慢冷却, 特别是到了6月23日, 公投结果确定英国脱欧, 上证指数瞬间暴跌, 从前一日的2905点暴跌到2891点, 24日继续暴跌至2854点, 上证指数彻底被重创。这个就是H P滤波分离出的波动线对数据影响过大, 使趋势线出现逆转的情况, 在此时就需要用指数平滑法依据英国公投前后时间的数据进行再预测了。
参考文献
[1]徐华轩.基于HP滤波的股指期货跨期套利模型研究[D].南京大学, 2014.
[2]徐建新, 严勇, 严富海.指数平滑法在典型城市GDP预测中的应用[J].水利科技与经济, 2008, 07:551-554.
上证指数股票预测 篇6
一、ARIMA模型简介
ARIMA方法是一种以随机理论为基础的时间序列预测方法。它将预测对象随时间变化形成的序列,看作是一个随机序列。也就是说,出去纯属偶然原因引起的个别序列值外,时间序列是依赖于时间t的一族随机变量。其中单个序列值具有不确定性,但整个序列的变化,却呈现一定规律性。这一串随时间变化而又相互关系的数字序列,可以用相应的模型加以描述。ARIMA模型的一般形式为:
其中,p为自回归模型的阶数,p为移动平均的数目,为白噪声序列,B为滞后算子,有。某一序列经过d阶差分化为平稳序列后建立的ARMA (p, q) 模型称为ARIMA (p, d, q)模型。
二、建立A R I M A模型的一般步骤
(一)检验原序列的平稳性。检验的严格统计方法是单位根检验。若序列不满足平稳性条件,通常采取差分变换或对数差分变换使数据平稳化。
(二)模型定阶。通过计算一些能描述时间序列特征的一些统计量,如自相关系数(ACF)和偏自相关系数(PACF)来确定A R I M A模型的阶数。再综合考虑AIC和SC等信息准则进行模型识别。
(三)估计模型参数,并通过参数的t统计量检验其显著性。
(四)通过LB统计量检验残差序列是否为白噪声,考核模型的优劣。如为白噪声,则模型是合理的,可用于预测,否则,对模型进行改进。
三、A R I M A方法建立上证指数预测模型
(一)数据来源与描述。
本文以上证综指(000001)收盘价的历史数据作为观察对象进行分析,选用时间跨度为2006年1月4日至2008年5月27日作为样本区间,采样间隔为天,剔除节假日和个别不交易的数据,样本容量为563。前562个数据用于建立ARIMA模型,留下的第563个数据也即2008年5月27日的收盘价用于计算预测精度。数据来源于Wind资讯金融数据终端。用Eviews5.0绘制上证综指的时间序列图,得图1。从中可以看出序列呈明显的非平稳性。
(二)序列的平稳性处理。
对变量进行对数化处理, 记为LX, 一阶差分的序列记为DLX, 可由时间序列图粗略地判断此序列具有平稳性。在一个正式的判别水准上, 用单位根方法即ADF检验其平稳性。ADF检验的模型有如下三种设定形式:
其中p的取值Eviews 5.0根据SC准则自动给出最优阶数。检验结果见表1。
由上表可看出,无论哪一种模型形式,P值均远小于0.05,有足够证据拒绝零假设,因此DLX是一个平稳序列。也即LX为一阶单整过程,有LX~I (1) 。可对平稳序列D L X建立A R M A模型。
(三)模型的识别。
为确定ARMA (p, q)模型中的p和q, 得DLX的ACF和PACF图。由图知,序列D L X的A C F和PACF在滞后3阶、4阶和11阶时均显著不为0。由AR模型PACF的截尾特性和MA模型ACF的截尾特性,p和q的取值至多均可为11,可尝试建立AR (11)、MA (11)、ARMA (11, 11)等模型。
但在具体的模型识别中,还要结合参数的显著性检验进行模型的初步选择。若模型参数的显著性检验通过的情况下综合考虑AIC准则。AIC准则从两方面考察一个模型的好坏,一是常用来衡量拟合程度的似然函数值,二是模型中未知参数的个数。自变量越多,模型拟合的准确度就会越高,但同时参数越多,参数估计的估计的精度就越差。AIC准则是拟合精度和未知参数个数的综合配置。AIC值越小,说明模型的综合拟合效果越好。
以AR (11)模型的建立为例,对模型进行估计后,除AR (3)、AR (11)项外的其它项的系数均没有显著性,因此可考虑剔除系数不显著的项重新进行估计。
需要注意的是,由于是对上证指数收盘价取对数后的差分序列DLX进行建模,也即对整个股市的收益率进行建模,故考虑无风险收益率建模时应加入常数项。
(四)模型的估计。
通过模型阶数的多次选择,最终选择的模型有两个,估计结果如下:
模型拟合的其他相关估计结果见表2
(五) 模型检验。
对所得模型的残差序列进行随机性检验。如果残差序列是白噪音,可以接受这个模型的拟合;如果不是,则残差序列可能还存在有用信息没被提取,需进一步改进模型。
残差序列是白噪声的检验的零假设和备择假设分别为:
检验统计量为LB统计量:
对上面拟合的两个模型的残差序列进行白噪声检验的结果见表2。可以看出,当滞后阶数m=15时,模型1的LB统计量的P值为0.343,大于给定的显著性水平0.05,没有足够证据拒绝各滞后相关系数联合为零的假设,也即认为残差序列为白噪声。模型2也通过了显著性检验。
(六)样本外预测。
分别由模型1和2对2008年5月27日的收盘价进行静态预测,结果如表3所示:
由上表可知模型2的预测精度更好,同时AIC值较模型1更小,故最终选定的模型为模型2。由模型2对整个样本区间做预测,得实际值X与模型预测值XF对比图,见图3。
由图3可看出模型2对上证综合指数的拟合效果确实不错, 故对上证综合指数收盘价进行短期预测的模型为:
四、结束语
通过以上对上证综合指数收盘价的分析可知,所建立的大盘对数收益率的MA (11)模型也即ARMA (0, 11)模型有较好的预测效果。用此模型对大盘走势进行短期预测,可为投资者提供投资决策的依据。
参考文献
[1]、易丹辉.统计预测-方法与应用.北京:中国统计出版社, 2001.
[2]、庞皓.计量经济学.北京:科学出版社, 2007.
[3]、王燕.应用时间序列分析.北京:中国人民大学出版社, 2005.
[4]、张晓峒.Eviews使用指南与案例.北京:机械工业出版社, 2007.
[5]、蒋涛, 吴俊芳.ARIMA模型在基金指数预测中的应用.统计教育, 2007 (7) .
[6]、龚国勇.ARIMA模型在深圳GDP预测中的应用.数学的实践与认识, 2008 (2) .
上证指数股票预测 篇7
股票市场是一个复杂的非线形系统, 市场受到来自政治, 社会, 经济, 心理等方面的影响, 因而对其运动行为很难建模。但是, 正如技术分析所假设的“市场是有趋势可循的, 市场价格反映了一切, 历史往往会重演”, 这也就是说明尽管复杂, 但市场还是隐含着某些规律性。股价的历史轨迹形态对未来价格趋势特别是短期趋势有着重要的预测价值, 这不仅得到市场上许多技术分析者的支持而且一些研究结果也证实了这一点。
股票的价格走势直接影响着投资者的经济利益, 以及不同行业的景气状况, 也影响和反映着国家的宏观经济政策。因此正确的建立相关的模型进行股票价格预测有着重大意义, 本文选取的变量是能够反映A股的综合波动趋势的上证A股指数, 目的在于试图找到一种较为理想的模型可以以一定的精确度来描叙现实股票市场价格波动的现象, 并得到一些有意义的结论。
二、模型描述
1、Box-Jenkins方法 (博克思-詹金斯法) ——ARIMA
模型。其基本思想是:某些时间序列是依赖于时间T的一组随机变量, 构成该时间序列的单个序列值虽然具有不确定性, 但整个序列的变化却有一定的规律可以用相应的数学模型近似描述。该方法不考虑以经济理论为依据的解释变量的作用, 而是依据变量本身的变化规律, 利用外推机制描述时间序列的变化, 能达到最小方差意义下的最优预测, 是一种精度较高的时序短期预测方法。
Box-Jenkins方法用变量Xt自身的滞后项, 以及随机误差来解释该变量, 具体形式可表达成ARIMA (p, d, q) 。其中p表示自回归过程阶数, d表示差分的阶数, q表示移动平均过程的阶数。
若时间序列是平稳的, 可直接运用ARIMA模型:
若时间序列是非平稳的, 则需要经过d阶差分, 将非平稳时间:将非平稳时间序列转换成平稳时间序列。
其中, 模型的假设条件为: (1) 线性假设; (2) εt是白噪声序列; (3) 假定:E (Xt, εS) =0 (t
三、建模过程——利用eviews软件
1、数据的选取
本文原始数据来源于东方财富网 (h t t p://d a t a.eastmoney.com) , 通过整理可以获得月度上证A股指数平均值, 其中, 选取了2008年1月到2012年5月的数据。由于2008年金融危机的影响, 股票大盘指数暴跌, 给投资者带来了严重的损失, 本文通过对后金融危机时期的A股指数走势的分析, 对危机后的中国股市做一个大致的了解, 并对指数走势进行短期预测。其中, 用Xt来表示月度A股指数序列。
2、数据的平稳性检验
从图1曲线的走势可以看出2008年有一个骤降, 之后的走势都很平稳。下面, 通过ADF检验来验证它的平稳性。从表1中可以看出, 变量通过了单位根检验, 数据在5%的显著性水平下是平稳的, 因此, 上证A股指数的时间序列数据是零阶单整的, 所以可以直接建立ARMA模型。
3、模型的识别与选择
模型的识别可以通过自相关和偏自相关图来判别。为了更好地拟合模型, 本文首先采AIC准则及模型显著性检验进行ARMA (p, q) 的选择。选取拟合效果较好并且不太繁杂的模型作为最优模型。AIC准则可以在模型极大似然的基础上, 对模型的阶数和相应参数同时给出一种最佳估计。
由图2中ACF和PACF拖尾的性质可以初步判断应建立A R M A模型。通过对A R M A (1, 1) 、A R M A (2, 1) 、ARMA (3, 1) 、ARMA (1, 2) 、ARMA (2, 2) 、ARMA (3, 2) 、ARMA (3, 3) 模型的比较可以看出, MRMA (2, 1) 优于其他模型 (表2) 。所以如果通过检验, 就认为模型MRMA (2, 1) 可以视为最优模型。
4、模型检验和确定
由上表2中的参数估计的P值和t统计量可以看出, ARMA (2, 1) 通过了显著性检验。接下来, 需要对这个拟合模型的残差序列进行白噪声检验, 若属于白噪声序列, 则认为该拟合模型显著有效。
从图3可以得出序列的相关分析结果:1.可以看出自相关系数始终在零周围波动, 判定该序列为平稳时间序列。2.看Q统计量的P值:该统计量的原假设为残差的1期, 2期……k期的自相关系数均等于0, 备择假设为自相关系数中至少有一个不等于0, 因此如图知, 该P值都>5%的显著性水平, 所以接受原假设, 即序列是纯随机序列, 即白噪声序列。因此, 模型ARMA (2, 1) 是合理的。
可以得出模型的表达式为:
四、模型的拟合与预测
静态预测是采用滞后因子变量的实际值而不是预测值来计算一步向前的结果, 所以Eview软件的静态预测所得结果比动态预测更加准确。因此本文采用的是动态预测, 根据所建立的ARMA (2, 1) 模型对未来三个月的上证A股指数的平均值进行预测:
利用eviews软件检验真实值与模型估计值的拟合程度并作出对未来三个月的数据预测图, 结果如图4: (图中红线曲线代表估计值的变化趋势, 蓝色代表真实值的变化趋势。其中, 红色曲线多出来的一部分是利用eviews软件对未来6、7、8月份的预测值。)
表4展示了最后十个月份的实际值与估计值之间的相对误差:
以上主要是应用ARMA模型来进行建模分析, 由最终的拟合与预测效果图 (图4) 来看, 拟合的效果是相当好的, 从表4也可以看出相对误差是很小的, 说明估计值具有一定的精确度。而且从对未来三个月的预测值可以看出, 曲线是上升的, 基本可以判断出在未来三个月上证A股指数具有上升的趋势。
五、结论与缺陷分析
本文利用ARMA模型, 采用eviews软件对月度上证A股指数进行预测分析, 该方法可以对现实生活中具有明显趋势的经济数据进行建模, 研究其内在规律, 更好地把握其未来的发展趋势。
从结果可知, 对于短期预测来说, ARMA模型具有一定的可行性, 但其只限短期预测, 对于长期趋势或者突发情形就会表现出局限性, 预测的偏差会比较大, 因为影响股票价格波动的因素很复杂, 有些也很难量化, 包括如宏观经济政策因素、政府政策、国际环境影响等。这些因素在ARMA模型中只能以随机扰动项表示, 而在预期的期望值中却无法表现出来。另外, 这种传统的多元回归模型均为齐方差性模型, 且假定模型残差的均值为零、方差为常数, 但实际上我国股价指数序列往往存在异方差现象。
鉴于此, 我们可以采用其他用途更加广泛的模型, 例如ARCH模型、GARCH模型、EGARCH模型等, 这些模型考虑的综合因素更多更全面, 从而得到的相关的预测结果更加贴近实际, 能给人以更好的参考。
参考文献
[1]李子奈.计量经济学 (第三版) [M].北京.高等教育出版社, 2009年8月
[2]史代敏, 谢小燕.应用时间序列分析[M].北京.高等教育出版社, 2011年5月
相关文章:
货币指数01-12
《指数与指数函数》练习题及答案01-12
股票指数预测01-12
成本指数01-12
高一立体几何题型总结01-12
2016年初级会计职称《初级会计实务》知识点:发出存货的计价方法每日一讲(11月23日)01-12
有线电视宽带的接入网技术论文01-12
智能小区的宽带接入技术01-12
宽带接入服务协议01-12