一、引言
(一) PM2.5基础知识
PM2.5即细颗粒物, 指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物。它能较长时间悬浮于空气中, 其在空气中含量浓度越高, 就代表空气污染越严重。虽然PM2.5只是地球大气成分中含量很少的组分, 但它对空气质量和能见度等有重要的影响。
与较粗的大气颗粒物相比, PM2.5粒径小, 面积大, 活性强, 易附带有毒、有害物质 (例如, 重金属、微生物等) , 且在大气中的停留时间长、输送距离远, 因而对人体健康和大气环境质量的影响更大。
(二) 时间序列分析与预测
时间序列就是将某一指标在不同时间上的不同数据, 按照时间的先后顺序排列而成的数列。由于前后时刻数据的相关性, 往往呈现某种规律性变化, 因此时间序列里蕴藏着其他信息形式所不能代替的知识[1]。时间序列分析是统计学分支之一, 主要研究随机数据序列的统计规律, 主要侧重于研究序列前后的相互依赖关系。本文主要研究成都市PM2.5含量与时间的潜在关系, 通过一系列的时间序列分析, 对未来做出预测。
(三) 数据来源
数据来源于真气网 (https://www.aqistudy.cn/historydata) , 选取成都市2014年1月到2018年10月的空气质量指数的月统计历史数据。主要指标有月份和PM2.5两个指标。采用的分析软件为R软件, 采用R语言进行本文的数据分析。
二、数据选择与模型确立
(一) 数据展示
选取的数据为时间 (年/月) 与PM2.5含量。
见表1。
(二) PM2.5时间序列模型确定
本次数据选取仅有时间与PM2.5含量两个变量, 属于单变量分析, 因此采用如下模型对数据进行时序分析与预测。
三、PM2.5时间序列分析
(一) 时间序列图
时间序列图:以PM2.5含量值为纵轴, 以时间为横轴作图, 对PM2.5过去和现在的含量数值进行分析, 如图2所示。图中的PM2.5变动近似以年为周期的一个向下抛物线, 并且年峰值随时间呈现下降趋势。
(二) 时间序列的成分
时间序列的成分有:
(1) 长期趋势。长期趋势是时间序列在一段较长时期内呈现出来的变化趋势。根据长期趋势可以看出一个时间序列是否有显著地变化趋势。
(2) 季节变动。月份变动图是指时间序列在一年中呈现的以年为周期的上升或下降, 并且每年如此。
(3) 循环波动。它是时间序列呈现出的非固定长度的周期性变动。
(4) 不规则波动。它是时间序列中除去趋势、季节变动和周期波动之后剩余的波动, 具有不可预测的性质。
对PM2.5时间序列的成分进行分析, 如图3所示成都市的PM2.5含量近似呈现逐年下降的趋势, 且PM2.5的含量在每年的1或2或12月份达到年最大值。
图3的第一部分为原始数据图, 第二部分“seasonal”为季节变动图, 第三部分“trend”为趋势图, 第四部分为不规则波动图。
(三) Holt-Winters指数平滑法做预测
指数平滑法中, 所有先前的观测值都对当前平滑值产生了影响, 但它们所起的作用随着参数的幂的增大而逐渐减小。
那些相对较早的观测值所起的作用相对较小。
在一定程度上, 指数平滑法就像是拥有无限记忆且权值呈指数级递减的移动平均法。Holt-Winters模型是经简单指数平滑方法改进后适应趋势和季节周期数据的模型。
利用Holt-Winters模型对一年后的PM2.5进行预测, 得到的预测结果如图5所示。红色的虚线代表Holt-Winters模型的拟合值与预测值, 蓝色的虚线代表预测值的上下界。
成都市在2018年11-12月, 2019年1-10月的PM2.5 (μg/m3) 预测值:44.37300、62.01043、76.62283、63.65588、52.50941、41.64328、35.90494、29.45091、24.44093、24.20393、23.40740、31.62497。
(四) 平滑方法再一次对预测数据进行检验
使用移动平均法、加权移动平均法和指数平滑法[3], 预测2018年10月后的PM2.5, 实际数据曲线与预测曲线如图4所示。得到三种方法的均方误差分别为:579.3405、527.9165、46.10869。由图4可以看出, 预测曲线逐步接近真实数据, 说明Holt-Winter指数平滑法是可取的。
四、总结
此次研究, 主要针对成都市的PM2.5做时间序列分析与预测, 通过时间序列分析可知, 成都市的PM2.5总体逐年呈现下降趋势并且PM2.5具有周期性, 同时在每年的12、1和2月份PM2.5达到年最大值。通过时间序列预测可以预测成都市在2018年11-12月, 2019年1-10月的PM2.5的最大、最小值为:76.62283 (2019年1月) 、23.40740 (2019年9月) 。
摘要:自中国实行改革开放政策以来, 中国国内的经济、军事、政治、文化建设得到了迅速的发展, 同时, 快速的经济发展不可避免地带来了环境问题。近些年来, 中国正在尽力解决空气污染问题, 虽然已取得初步成效, 但与国际上相比, 空气质量问题依然严峻。PM2.5是当前我国大部分城市面临的首要大气环境问题。本文从2014年1月到2018年10月对成都市的PM2.5进行时间序列分析与预测, 首先将成都市PM2.5月平均含量按年月顺序进行记录构成时间序列, 然后对序列进行观察研究, 找寻它的变化和发展规律, 预测将来的趋势就是时间序列分析。
关键词:成都,PM2.5,时间序列,分析预测
参考文献
[1] 刘劲松.数据挖掘中的现代时间序列分析方法[J].信息技术, 2007 (07) :100-101+149.
[2] 薛毅, 陈立萍编著.R语言在统计中的应用[M].北京:北京邮电出版社, 2017:4.
[3] 袁世荣, 刘睿.犯罪预测的双重移动平均法和指数平滑法模型[J].中国刑警学院学报, 2003 (04) :24-25.
相关文章:
基于FAVAR模型通货膨胀的成因研究02-19
基于组织学习的企业技术创新模型研究02-19
软件工程与能力成熟度模型CMM论文02-19
基于大数据的宽带用户预测模型研究02-19
基于价值链的企业知识管理模型研究02-19
基于XML的数据交换模型之研究02-19
软件开发工程师能力层次模型02-19
基于结构洞理论的石化企业监管分离模型研究02-19