逐步回归

关键词: 经济模型 指标

逐步回归(精选九篇)

逐步回归 篇1

财政收入是我国国民经济核算体系的一项重要指标。建立科学合理的财政收入统方法, 是加强国民经济核算和宏观调控的需要, 也是评价财政工作优劣的重要依据。长期以来, 我国对财政收入的统计分析主要基于预算收入法及其以此为基础的财政收入占GDP比重。但是, 就当前我国财政收入的实际情况来看, 仅仅依靠这种统计分析方法, 不仅有失偏妥, 也给各级财政工作带来了被动。这就需要建立合适的政府财政收入统计方法。

逐步回归分析法就是一种自动地从大量可供选择的变量中选择那些对建立回归方程比较重要的变量的方法, 它是在多元线性回归基础上派生出来的一种算法技巧。逐步回归分析法在筛选变量方面较为理想。故目前多采用该方法来组建回归模型。该方法也是从一个自变量开始, 视自变量对Y作用的显著程度, 从大到小地依次逐个引入回归方程。但当引入的自变量由于后面变量的引入而变得不显著时要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量, 为逐步回归的一步。对于每一步都要进行F值检验 (F值检验的具体含义在下一节做介绍) , 以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。这个过程反复进行, 直至既无不显著的变量从回归方程中剔除, 又无显著变量可引入回归方程时为止[1]。

本文旨在运用应用统计软件SPSS V17.0, 基于逐步回归法建立国家财政收入的回归模型, 分析影响国家财政收入的可能因素。

2 利用逐步回归法建立国家财政收入的回归模型

2.1 变量的选取与筛选

在使用回归分析建立模型时, 首先遇到的一个重要问题就是自变量的选择问题。一方面为了获取全面信息, 总是希望模型中包含的自变量尽可能的多;另一方面, 考虑到收获很多自变量的观测值的费用和实际困难, 则希望模型中包含的变量是最重要的, 且尽可能的少。理论上可以证明:当自变量数目过大时, 模型计算复杂并且往往会扩大估计方差, 降低模型的精度。因此, 最优的线性回归模型应理解为: (1) 该模型中包含所有对因变量有显著影响的自变量; (2) 该模型中包含的自变量个数尽可能的少; (3) 当有几个模型都满足这两方面的要求时, 方差的无偏估计中以最小者为优。

根据实际情况, 本文中考虑的自变量包括: (1) 工业总产值 (亿元) ; (2) 农业总产值 (亿元) ; (3) 建筑业总产值 (亿元) ; (4) 全民人口数 (万人) ; (5) 社会商品零售总额 (亿元) ; (6) 受灾面积 (万公顷) 。因变量为国家财政收入。

在决定一个新的变量是否有必要进入模型或判断某个变量是否可以从模型中剔除, 首先要解决的问题是:这个变量对因变量的影响是否显著?解决该问题的正规方法是偏F检验, 设有n个自变量采用这n个自变量拟合的全模型为

2.2 计算过程及结果

本文选取的可能影响国家财政收入的因素有:工业总产值 (亿元) 、农业总产值 (亿元) 、建筑业总产值 (亿元) 、社会商品零售总额 (亿元) 、人口 (万人) 、受灾面积 (万公顷) 等。数据来源于《中国统计年鉴》[3], 选取了1997年—2011年近15年的数据使用SPSSV17.0进行处理。

相关分析如表1所示 (只选取了部分数据) , 显示各变量间的泊松相关系数和显著性检验单尾P值及每个变量的个数。从表中我们可以看到国家财政收入跟工业生产总值, 农业生产总值, 建筑业生产总值, 人口还有社会商品零售总额都有很强的相关性, 但与受灾面积相关性比较弱。

表2为方差分析表, 为回归拟合过程中每一步的方差分析结果。列出了回归平方和、残差平方和、自由度等。Sig.为大于F值的概率。方差结果表明, 当回归方程包含不同自变量时, 其显著性概率值均小于0.001。因此回归方程应该包括这两个自变量。

表3为回归系数表, 包括B、Beta分别为非标准化和标准化的回归系数, t为偏回归系数为0时的假设检验的t值, Sig.为偏回归系数为0时的假设检验的显著性水平、B的95%置信区间、偏回归系数等。在逐步回归过程中, 利用偏回归系数平方和来判断一个自变量对因变量影响的显著程度。某因素的偏回归系数平方和越大, 该因素对因变量的作用就愈大。从表中分析可以看到:逐步回归的最优回归子集为模型2, 回归方程为::;方程中的常数项为-7533.154, 偏回归系数b1为0.273, b3为1.808, 经t检验, b1、b3的P值分别为:0.000, 0.000, 按α=0.05水平, 均有显著意义。

2.3 图表总结分析

实验结果表明, 在利用逐步回归法建立方程的过程中, 引入了两个自变量x1和x3, 即工业总产值和建筑业总产值, 且它们与因变量y财政收入具有显著的线性相关性, 其结果有显著性意义, 而其它自变量均未能引入方程。分析给出的散点图, 得到这一结果的原因是显而易见的:一些自变量如农业总产值, 虽然其散点图也基本为线性, 但此线性关系不如建筑业总产值和工业总产值的强, 同时它与建筑业总产值又具有高度相关性, 因此它最终成为不需要被引入的因素;还有一些散点图如受灾面积与财政收入散点图比较凌乱, 不能判断它们与因变量的关系, 但显然是非线性的。此外, 选取的年份较少及由于知识背景不足而使得某些重要因素未被考虑等, 可能是影响实验精度的主要原因。

3 模型解释说明

从上面的分析我们得到了两个对财政收入影响较显著的自变量:工业生产总值和建筑业生产总值。即工业生产总值和建筑业生产总值对我国财政收入有显著的影响。在工业方面, 国家对工业的发展给予了高度的重视, 对产业结构进行了重大的调整, 国民经济保持着快速健康发展的势头。工业生产快速增长, 财政收入迅速增加。而另一方面在政府积极的财政政策运用过程中, 尤其是在大规模的基础设施建设拉动内需和扩大就业过程中, 建筑业是受益较大的产业, 促进了建筑业的极大发展。中国建筑业进入了健康、快速发展的轨道。近年来中国的建筑业总产值一直呈高速增长态势, 对国家财政收入起着积极的促进作用。因此, 工业生产总值和建筑业生产总值是国家财政收入的两个重要来源。

最后我们运用模型对2011年的财政收入进行检验, 2011年我国的工业生产总值为188470亿元, 建筑业生产总值为31943亿元。运用上面的回归方程我们可以得到2011年我国的财政收入为:0.273*188470+1.808*31943-7533.154=101672亿元。而实际的国家财政收入为103874亿元。我们可以认为得到的回归方程拟合的效果较好。

本模型在一定程度上体现了与选取的自变量之间的线性关系, 并能对因变量做出近似的预测。综合来看, 数据模型基本达到了预期的目的。对国家或地方财政模型建立、经济现象的分析有很好参考意义。

参考文献

[1]孙海燕, 周梦, 李卫国, 冯伟.应用数理统计[M], 北京:北京航空航天大学出版社, 2004 (9) .

[2]周复恭, 黄运成.应用线性回归分析[M], 北京:中国人民大学出版社, 1989 (8) .

逐步回归 篇2

新华财经7月16日电(李童)国务院新闻办今日举行新闻发布会,国家统计局新闻发言人、国民经济综合统计司司长盛来运介绍2014年上半年国民经济运行情况并答记者问。数据显示,2014年上半年国内生产总值269044亿元,按可比价格计算,同比增长7.4%,分季度看,一季度同比增长7.4%,二季度增长7.5%。在谈到上半年我国房地产市场出现回落的态势时,盛来运表示,这是一种向理性回归的正常反应。

今年上半年我国的房地产市场出现了分化调整的态势,国家统计局公布数据显示,2014年1-6月份,全国房地产开发投资42019亿元,同比名义增长14.1%,增速比1-5月份回落0.6个百分点,其中,住宅投资28689亿元,增长13.7%,增速回落0.9个百分点。在商品房销售和待售方面,1-6月份,商品房销售面积48365万平方米,同比下降6.0%,商品房销售额31133亿元,下降6.7%。由此可见,上半年我国房地产开发和销售均出现了回落的态势。

逐步回归 篇3

魏立华:目前业内对我们有很多称呼,比如价格杀手、搅局者,我本人更喜欢“破局者”这个称呼。做奶粉并不是什么高科技,做的还是良心,我希望用优质优价,为中国爸妈节省奶粉钱。

《中国经济周刊》:不走实体店选择电商可以降低成本,但是100多元的价格比起洋奶粉和其他品牌还是很低,君乐宝的低价路线会一直坚持吗?

魏立华:除去各种花费,130元一罐奶粉还有3%~4%的净利润。在3年前奶粉业务中,电商渠道一般只占销量10%,而目前可以占到24%,电商、手机端APP、微商城等成为一种渠道趋势。

目前,君乐宝已与苏宁红孩子以及我买网达成协议开设网购平台。我相信未来中国奶粉市场价格能够逐步回归理性,正是这些不断进步、勇于创新的民族乳业在发力。毕竟君乐宝在奶粉行业里还是一个新品牌,所以2016年主要会把目标放在增强品牌知名度、扩大品牌影响力上面。

《中国经济周刊》:目前君乐宝已经发展成为国家农业产业化重点龙头企业和国家级高新技术企业,您对君乐宝发展有什么样的期待?

魏立华:我是石家庄人,每次开会、培训大家都会提到三聚氰胺,我觉得很没面子,觉得一定要把乳业做起来,给河北一个正面的形象。现在提起河北乳业,我会很自豪,不蒸馒头争口气,必须得拿出这种精神来。在君乐宝乳业的收入结构中,分为酸奶、常温奶、奶牛、奶粉,这四驾马车正在带领着君乐宝乳业驶上快速发展的道路。

逐步回归 篇4

在经济模型的建立中, 由于经济指标较之一般指标更为综合, 包含信息交互性强, 指标间多重共线性现象在经济模型建立过程中不可避免。多重共线性的存在, 一方面使得入选的经济指标作为其他指标的综合反映, 无法独立反映与经济总量之间的结构因果关系;另一方面, 多重共线性使得统计检验失效, 回归模型缺乏稳定性, 可靠程度低。因而在进行经济模型建立时, 必须充分考虑经济指标变量间的多重共线性问题, 保证变量间的相互独立。

最常用于克服模型变量的多重共线性问题有三类方法:排除引起共线性的变量;差分法;减小参数估计量的方差。后两类方法都只能减轻多重共线性对模型的影响, 而第一类方法, 从根本上寻找引起多重共线性的解释变量, 将其排除出原模型, 因而更为有效。本文将该原理的应用——逐步回归方法引入财政收入模型的建立问题中。

逐步回归法的基本思想是:从所有解释变量中先选择影响最为显著的变量建立模型, 然后再将模型之外的变量逐个引入模型;每引入一个变量, 就对模型中的所有变量进行一次显著性检验, 当原引入的变量由于后面变量的引入而变得不再显著时, 将其剔除;逐个引入——剔除——引入, 反复这个过程。直到既无显著变量引入回归方程、也无不显著变量从回归方程中剔除为止。

2. 逐步回归建模过程与分析

变量与数据的选取

一个国家财政收入的状况要受到诸多经济规模因素的影响。本文以财政收入为因变量y (单位:亿元) , 对于参与逐步回归建模的自变量的选择, 则是鉴于数据的可得性以及对财政收入可能产生影响的几个经济因素:国家工业总产值x1 (单位:亿元) 、农业总产值x2 (单位:亿元) 、建筑业总产值x3 (单位:亿元) 、社会商品零售总额x4 (单位:亿元) 、全国人口总数x5 (单位:万人) 和受灾面积x6 (单位:万公顷) 共6个因素为自变量的候选变量。数据样本区间选择1989—2003年, 数据来源于中国统计年鉴, 详见下页表1。具体的逐步回归建模过程基于EVIEWS软件下进行。

计量经济模型的建立

设财政收入函数为:y=a0+a1x1+a2x2+a3x3+a4x4+a5x5+a6x6+ut, 根据表1数据, 在EVIEWS软件下, 利用OLS法估计模型, 估计结果如下:

(-0.4381) (0.39) (-8.5088) (0.07517) (3.7719) (0.6214) (-1.4560)

方程的R2很高, 说明方程整体上是合理的, 能很好地拟合数据。但x1, x3, x5, x6的参数t值都小于临界值, 无法通过检验。出现这种情况的原因可能是由于解释变量之间存在多重共线性。下面进行相关系数检验:在EVIEWS软件的命令窗口键入CORY X1 X2 X3 X4 X5 X6, 输出的相关系数矩阵如表2:

从表2可看出:五个解释变量x1, x2, x3, x4, x5均与被解释变量y高度相关, 而且五个解释变量x1, x2, x3, x4, x5之间也是高度相关的, 说明模型确实存在多重共线性。

为了消除变量间的多重共线性, 下面采用“向前逐步回归法”, 根据新变量的引入造成原有变量的显著性变化状况来决定是否保留该变量。

首先, 运用OLS方法逐一求对各个解释变量的回归。利用EVIEWS软件即得以下六个一元回归模型:

从以上六个模型的统计检验并结合模型 (1) 和表2, 经综合分析, 可知财政的收入y与社会商品零售总产值x4的线性关系最强, 拟合程度好, 说明社会商品零售总额对财政的收入影响最为显著, 所以选择模型 (5) : 作为最基本的模型。

其次, 在以上基本模型中分别引入其它五个解释变量, 得到以下五个二元回归模型:

从以上五个二元模型可以看出:模型 (9) 为较优模型。原因是:在基本模型 (5) 中引入变量x2后, 方程的拟合优度从0.950747提高到0.996923, x4的t值也有所提高, 模型的拟合效果得到进一步的改善。同时, 模型 (9) 的拟合优度较之其它四个二元模型高。

最后, 在模型 (9) 的基础上, 继续以同样方式逐个引入解释变量, 建立三元回归模型。经检验, 所得四个三元回归模型不能再使模型的拟合效果得到进一步提高。最终确定的财政收入模型为模型 (9) : 。

2.3 模型的检验

为了检验模型的性能及有效性, 对模型进行统计准则检验和计量经济学准则检验。

统计准则检验:从模型 (9) 回归结果可以看出, 模型的拟合优度高, 各解释变量显著, 拟合优度和t检验都能通过。说明模型通过统计准则检验。

计量经济学准则检验: (1) 异方差检验。采用White检验法检验回归残差的异方差。在EVIEWS软件的方程窗口中点击:ViewResidual TestWhite Heteroskedasticity, 得结果如下表3:

有nR2=3.067972

模型的解释

从最初的模型 (1) 到最后确定作为财政收入的模型 (9) , 我们利用逐步回归法剔除了解释变量x1, x3, x5和。实际上, 从表2相关系数矩阵可看出:x1和x3的相关系数为0.999;x1和x4相关系数为0.996;x3和x4相关系数为0.993;x2和x5相关系数为0.953。x1, x3, x4之间高度相关具有多重共线性, 同样x2和x5之间高度相关也具有多重共线性。所以, 变量x1和x3可以用模型中的变量x4来代替表述, 而变量x5可以用模型中变量的x2来代替表述, 解释变量x6对被解释变量y影响不显著, 直接剔除。这样略去不重要的变量之后, 被略去的变量对被解释变量的解释作用由与它高度相关的其它解释变量承担, 既简化了模型, 又消除了多重共线性。

从我国实际情况看, 工业的发展为建筑业的崛起提供了基础, 而建筑业的兴旺又会拉动工业总产值的增长, 两者之间的物资交换过程经过社会商品零售总额反映出来。同时, 由于我国农业生产力相对落后, 农业人口占总人口的比重过大, 农业总产值与人口总数有直接关系。这些说明模型 (9) 有合理的实际意义。

模型的经济分析

利用逐步回归方法我们得到两个对财政收入影响较为显著的经济因素, 即农业总产值和社会商品的零售总额。从模型 (9) 可看出:农业总产值每增加1亿元, 财政收入会减少0.812亿元, 即农业总产值的增加对财政收入的增加产生负的影响。从表1结合我国国情可知, 2003年农业总产值与1996年的水平接近, 农业总产值增长较为缓慢, 如果再考虑到物价上涨因素, 其实际增长率是很小的。同时, 财政收入中农业税收入总额在这期间变化不大, 而财政支出中的农业总支出却逐年增长, 因此, 出现了农业总产值的增加对财政收入的增加产生负的影响的现象。从模型 (9) 还可看出:社会商品零售总额每增加1亿元, 财政收入会增加0.723亿元, 可见社会商品零售总额对财政收入的影响是很大的。我国将在各项政策措施积极作用下, 继续以扩大内需为主要引导的经济增长方式, 不断刺激消费, 使国内消费市场活跃, 拉动国民经济稳定增长。另外, 把2003年我国农业总产值14 870.1亿元和社会商品零售业总额45 842亿元代入模型 (9) , 可得值为:21 588.92亿元, 而实际财政收入为21 715.25亿元, 两者相差不大。因此所得回归方程拟合的效果较好。

3 结束语

本文通过逐步回归分析, 克服了变量的多重共线性, 剔除了不显著的解释变量, 使得模型中仅含有对因变量有显著影响的自变量。这样, 得到财政收入模型形式变得更为简洁, 拟合的效果又好。

参考文献

[1]易丹辉.数据分析与EVIEWS应用[M].北京:中国统计出版社, 2002, (10) .

[2]李子奈.计量经济学[M].北京:高等教育出版社, 2000, (7) .

[3]李长风.经济计量学[M].上海:上海财经大学出版社, 1996.

[4]杨有, 李晓虹.多重共线性的逐步回归检验分析[J].重庆:重庆三峡学院学报, 2006, (3) :39-41.

逐步回归 篇5

大坝变形是大坝安全监控的重要物理量,因此实现变形监测、预报和利用变形值拟定安全监控指标是大坝安全重要发展方向。变形值在水位、温度和时效因素的作用下,既呈现一定的周期波动,同时又存在一定的趋势变形。灰色系统模型是一种不确定的模型,将灰色系统应用与大坝安全监测和变形预报已有大量的文献,但灰色系统存在边缘效应,同时没有考虑因变量的影响。常规逐步回归模型具有建模简单,能表示自变量和因变量的显式函数关系和使用广泛等优点,但逐步回归模型在因变量测值波动较大时拟合和预报误差加大,而马尔科夫链模型具有适应大波动的优点,为此将逐步回归与马尔科夫链模型相结合,提出一种高精度的变形预报模型,并利用某大坝的实测资料进行验证。

1 逐步回归模型

逐步回归模型是大坝安全分析建模中最简单常用的一种模型,通过建立模型因子和统计检验方法选择对模型因变量影响大的因子。

1.1建模原理

根据文献[1]可知,大坝位移主要受水压、温度及时效的影响,因而大坝的任一点位移可表示成:

式中:ƒ(H)、ƒ(T)和ƒ(θ)分别表示位移的水压、温度和时效分量;δ 为由统计模型获得的位移值。

1.1.1水压分量

根据力学分析和应用经验,用多项式拟合水压分量得:

式中:αi为拟合系数;n为多项式项数,根据大坝的实际情况,n一般取为3~4,具体是重力坝取3,拱坝取4;H是水位荷载,采用水位高程减大坝基面高程。

1.1.2温度分量

对已经运行多年的老坝,坝体温度基本呈准稳定温度场变化的情况,温度因子可选用不同周期的谐波因子来拟合。即:

式中:m为谐波次数;b1i、b2i均为回归系数;i为相对初始时刻的时间(天)。

1.1.3时效分量

大坝时效位移综合反映坝体混凝土和基岩的徐变、基岩构造的压缩变形和坝体裂缝等综合影响,目前还难以用理论分析方法得到精确解答,现一般采用统计模式:

式中:C1、C2均为回归系数;θ 为监测日至始测日的累计天数除以100,每增加1 d,θ 增加0.01。

1.1.4逐步回归模型的表达式

由上述分析可得,坝体位移的逐步回归模型的表达式为:

1.1.5模型的参数估计

根据已经采集到的大坝实测资料序列,利用式(5)求出δ各个分量的统计(预报)值δi与对应实测值yi的差值Ri:

并令

要使Q最小,则必须满足下列条件:

由式(8)可求得各个参数及剩余均方差S,从而得到各模型参数αi,b1i,b2i,C1,C2,再通过逐步回归F检验即可获得由显著因子建立的统计模型。

上述统计模型尽管利用了最小二乘原理,使得残差平方和最小,但是由于应用的线性最小二乘是在假设测值服从正态分布的条件下获得的整体模型,是所有观测数据的“集中平均”体现,由于大坝的动态特征,使得模型本身是动态的,上述统计模型得到的残差并不服从正态分布,有时甚至出现比较大的跳动。

2 马尔科夫预报模型

马尔可夫过程是随机过程的一个分支,根据模型的阶数可以分成1阶、2阶甚至P阶马尔可夫过程。马尔可夫链是状态和时间均离散的马尔可夫过程,对离散的大坝测值而言实际上可以认为残差为1阶马尔可夫过程。应用马尔科夫链在水位等方面的预报已有文献[2],但在大坝安全监测方面确很少见到,本文借鉴文献[2]的思路,将马尔科夫链方法应用到大坝安全监测上来。

根据马尔科夫链[2]将数据序列分成若干状态,以E1,E2,…,En来表示,按时序将转移时间取为t1,t2,…,tn,Pij(k)表示数列由状态Ei经过k步变为Ej的概率,即:

式中:ni j(k)表示状态Ei经k步变为Ej的次数;Ni表示状态Ei出现的总次数。则k步状态转移概率矩阵为:

若初始状态Ei的初始向量为V(0),则经k步转移后,向量V(k)为:

将实测资料和统计模型由式(6)获得的相对残差进行分类,参照文献[2]即可建立相应的残差预报模型。

3 逐步回归马尔可夫模型

逐步回归马尔可夫模型是将逐步回归模型和马尔科夫模型组合在一起的组合模型,即先利用实测资料建立逐步回归统计模型,再利用马尔科夫建立残差预报模型,将2种模型进行组合即获得逐步回归马尔可夫模型。具体步骤如下:

(1)对原始序列(i=1,2,…,n为观测值序列长度)建立逐步回归模型,根据模型表达式(5),经过因子选择和复相关系数F及剩余标准差S的分析判断,获得逐步回归模型,将实测值和逐步回归模型相减,得到残差序列。

(2)将实测值和逐步回归模型获得的模型值相减,由式(6)得到相对残差序列r={r1 r2,…,rn},根据相对误差大小得到各年残差相对比例所处的状态。

(3)根据文献[3]提供的试算法确定状态转移概率矩阵P(k),对由式(6)得到的残差序列建立马尔科夫模型,利用状态转移矩阵,根据各状态及对应最大转换概率即可求出对应k步转移概率,利用最大概率即可利用马尔可夫模型得到预测残差修正值。本文以-12%,-6%,-2%,2%,6%,12%为界限,将相对误差序列划分为7个区间,相对误差的概率状态见表1。

根据表1所示区间,可以得到残余差序列所处状态,由残差序列状态及上文可得1,2,…,7步状态概率转移矩阵,预报值计算公式如下:

(4)最终的修正预报方程为:

式中:X为逐步回归马尔科夫模型的预报(模型)值,相对于逐步回归模型,由于多考虑了残差的建模,因此逐步回归马尔科夫模型精度要更高。

(5)对建立的逐步回归马尔科夫模型进行后误差检验,合格者可用于极值预报[2]。

4 工程实例

本文对某大坝18号坝段坝顶1978~2006年径向水平位移年极值实测资料、逐步回归模型和逐步回归马尔可夫模型计算结果进行比较分析,表2是部分年份的实测值和预测值的比较。通过各模型拟合和预测的比较,可见逐步回归马尔可夫模型与实测值的差别比采用常规逐步回归模型与实测资料的差别小得多,因此逐步回归马尔可夫模型对峰谷值精度具有明显的改善。笔者将飞来峡大坝变形监测数据建立模型后,也得到同样结论。这为将该模型整编进入大坝自动监测系统的数据分析软件,实现飞来峡大坝安全的高精度预报奠定了基础。

5 结语

本文充分利用逐步回归和马尔科夫模型的特点,建立逐步回归马尔科夫大坝变形监控模型,并用具体大坝的实测数据进行了检验。实际情况表明新的模型兼有逐步回归模型能显示表达自变量和因变量的关系的优点,以及马尔科夫链适合于测值波动较大值的情况,模型拟和预报精度高,下一步将该模型整编进入大坝安全数据分析软件,与自动监测系统实现有机结合,从而为实现水库大坝的安全管理服务。

注:表中的实测数据由自动人工采用垂线坐标仪获得,逐步回归模型的值由常规逐步回归模型获得,逐步回归-马尔可夫模型的值由本文模型得到。

摘要:常规逐步回归模型具有建模简单、能表示自变量和因变量的显式函数关系和使用广泛等优点,但逐步回归模型在因变量测值波动比较大时拟合和预报误差大,而马尔科夫链模型具有适应大波动的优点,为此将逐步回归与马尔科夫模型相结合,提出一种高精度的变形预报模型。在介绍逐步回归模型和马尔科夫预报模型概念的基础上,利用某大坝的实测资料进行建模分析。实践表明,变形预报值能很好地吻合了实测结果,表明该模型可以用于大坝安全监控。

关键词:大坝,安全监控,逐步回归,马尔科夫链,模型,变形预报

参考文献

[1]方卫华.基于峰值识别理论的大坝安全监控模型[J].水电能源科学,2008,26(5):12~16.

[2]董胜,刘德辅.年极值水位的灰色马尔科夫预报模型[J].水利学报,1999,(1):11~15.

逐步回归 篇6

可以看出, 建国初山东粮食总产量为870万吨, 到1978年总产量为2288万吨。2001年左右, 出现了大幅度减产, 主要是由当年粮食价格低, 许多粮农转种其他作物以及干旱灾害引起的。2008年总产量增至4260.5万吨, 名列全国第二, 且连续六年增产, 成为我国重要的粮食生产基地。

然而, 由于人口的不断增加, 耕地的减少和退化, 水资源的缺乏及农业环境污染等问题的存在, 山东省粮食生产和供给能力无法进一步提高, 粮食问题仍然是山东省面临的首要问题之一。因此, 有必要对山东省粮食产量的影响因素进行分析研究。

一、数据来源及建模过程

1、影响因子的选取与数据来源

影响粮食产量的因素很多, 由于研究方法和地理范围的不同, 研究结果亦有很大差异。本文结合山东省实际情况选择了七个因子作为分析对象, 即:X1—粮食单产 (公斤/公顷) 、X2—种粮劳动力数量 (万人) 、X3—生产资料与粮食价格指数之比 (以1978年为基期) 、X4—化肥用量 (万吨) 、X5—农业机械总动力 (万千瓦) 、X6—成灾面积 (万公顷) 、X7—有效灌溉面积 (万公顷) 。其中, 本文数据来源于《山东省农业统计年鉴》、国家发改委和科技部相关网站。

2、分析思路

(1) 数据的多重共线性检验。利用Evivews6.0软件, 通过O LS方法计算七因素的相关系数矩阵, 见表1。

可以看出, 解释变量之间的共线性严重, 可用逐步回归法消除多重共线性的影响。

(2) 逐步回归分析。利用Eviews6.0软件, 运用OLS方法求出七因素的基本回归方程。根据经济理论意义可知, X1是最重要的解释变量, 故选择第一个基本回归方程作为分析的第一步, 然后通过逐步回归进行修正, 得到最优结果, 见表2。

故最优回归模型为:

(3) 模型检验。 (1) 方程拟合优度检验:通过回归分析得R2=0.838899, 通过检验。 (2) 方程显著性检验 (F检验) :F=70.29854, 查F分布得临界值F0.05 (3, 30) =2.92, 因F>F0.05 (3, 30) , 故模型通过F检验。 (3) 解释变量t检验:经回归分析得所有t的数值均大于t0.025 (30) =2.092, 所以所有解释变量均通了t检验。 (4) 序列相关性检验:用杜宾—瓦森 (Durbin-Watson) 检验法, 查表得dL=1.18, dU=1.46, 由于dU<D.W.<4-dU, 因此序列不存在一阶自相关性。

综上所述, 该模型通过了检验, 是较为理想的模型。

二、建模结果及影响因素分析

所建模型表明, 粮食单产和生产资料与粮食价格指数比是影响山东粮食产量的最主要因素。其中粮食单产每变动一个单位, 粮食总产变化0.4764个单位;生产资料与粮食价格指数比每变化1%, 粮食总产变化13.75%。图2为粮食总产实际值与模型拟合值的对比曲线, 可以看出模型拟合值与实际值具有很高的拟合度, 最大拟合误差仅16.5%。

1、粮食单产

图3为山东省粮食总产及单产的变化曲线。

可以看出, 山东省粮食总产及单产呈现出很好的正相关关系;山东省粮食总产及单产总体呈上升趋势, 2001年左右, 粮食单产也出现了大幅度下降。

由于山东省土地资源有限, 提高单位面积粮食产量是提高山东省粮食总产量的最有效途径。

在1979—2008年有效灌溉面积几乎没有发生变化的情况下, 粮食单产从1979年的2835kg/公顷增长到了2008年的6391kg/公顷, 增长了2.68倍。据测算, 在应用机械耕整地、精耕细作、机械化旱作、节水农业等农业机械新技术的产粮地区, 由于粮食单产的提高可使粮食增产11%~15%。

目前, 尽管山东省的小麦、玉米、水稻、甘薯等粮食作物的平均亩产已经远远超过了全国的平均水平, 但与全国其他高产区相比仍有较大的差距, 只就山东省内而言, 亦有高产区和中低产区之分。例如在一些高产区的小麦产量已经达到了1200斤/亩, 但也有部分中低产区的小麦产量仅每亩几百斤, 因此将中低产区尽快转化为高产区, 山东省的粮食单产仍有很大的提升空间。

2、生产资料与粮食价格指数比

图4为粮食总产和生产资料与粮食价格指数比的变化趋势曲线。

可以看出, 生产资料与粮食价格指数比与粮食总产的变化趋势呈近似负相关对称分布, 符合现实情况。

农产品的生产和其他工业品的生产一样, 农民要根据投入与产出比来决定自己的农业行为。当农业生产资料价格上涨或者农产品价格下跌时, 农民的预期福利就会下降, 理性的农民就会选择少种地或者减少对土地的投资。如减少化肥用量、少购买高产作物、购买高科技机械的动机降低等, 于是就会导致来年粮食生产总量的下降;当市场出现相反的情况时, 农民就会采取相反的措施, 于是促使来年粮食生产总量的上升。

另外, 在经济较发达的山东省, 大多数农村都离城市很近, 这就为农民进城打工提供了便利, 农民很容易在进行农业生产和进城打工之间进行选择, 这就使得生产资料和粮食价格变化在影响农民种粮积极性并且影响粮食总产上显得更为突出。

3、种粮劳动力数量

在粮食生产的历史上, 人口的增长曾经是粮食总量增长的主要因素。但近年来, 农业机械化代替了人的劳动。山东省的大多数农村都出现了农业劳力的闲置, 人均耕地不到两亩, 农村劳力的增加已不是提高粮食产量的主要途径。即使农村劳力继续增加, 由于土地总量、土地生产能力等的限制, 粮食总量也不可能按人口增加速度增长下去;反之, 由于人口政策的影响, 当未来人口逐渐减少时, 粮食总产量也不会因为人口的减少而迅速降低。

4、化肥用量

目前, 山东省化肥施用水平已经较高, 特别是在一些高产地区, 其增产作用已经较小, 受边际效益递减规律的影响, 化肥投入在粮食增产方面的能力逐渐下降。

另外, 由于施肥方法落后、偏施和过施, 导致长期以来化肥利用率只有30%左右, 其中磷肥为10%~20%, 钾肥为45%~50%, 远低于发达国家。因此, 盲目增加化肥的施用量并不能从根本上增加粮食产量, 关键是要提高化肥的利用率。

5、农业机械总动力

农业机械的增加也曾是粮食增产的主要因素。然而, 目前山东省的机械化已经达到了较高的程度。据统计, 2008年上半年, 全省拖拉机增长4.1万台, 比上年同期增长24.2%, 其中大中型拖拉机增加1.5万台, 比上年同期增长40.2%, 特别指出的是50马力以上的拖拉机增加8000多台, 同比增幅达135.3%;大中型和小型拖拉机增长比由上年同期的0.48:1增长到0.57:1, 同比增长18.8%;联合收获机增加1.1万台, 同比增长12.2%。高度的机械化带来了另外一个问题, 大部分农业机械并没有充分发挥应有的作用, 尤其在非农忙时节, 农业机械大都被闲置, 农业机械的增加实际上加快了农业劳动的速度, 减轻了农民的体力劳动, 而在粮食增产上效果并不明显。

6、面积

西北师范大学地理与环境科学学院的潘护林基于《山东省农村统计年鉴》1991—2005年的有关统计数据, 对山东省15年的主要农业气象灾害及综合灾情进行了统计和灰色关联分析。结果表明, 山东省农业气象灾害总体上呈年均受灾面积大、成灾率高且波动幅度大的特点;在各主要气象灾害中, 以旱灾年均受灾和成灾面积最大, 低温冻害年均受灾和成灾面积最小;但从对种植业总产值的影响来看, 又以涝灾影响为最大, 其次是风雹、低温冻害与旱灾相对较小。能看出, 仅从受灾或成灾面积的角度不能准确判断某种气象灾害对农业生产的经济影响, 还需要从农作物种植制度、价格等人为因素角度进行综合分析。

7、有效灌溉面积

自1979年以来, 山东省的农业有效灌溉面积基本没有变化, 其主要原因是受耕地面积和淡水资源的限制。

三、结论及认识

第一, 利用Eviews6.0软件, 通过逐步回归分析方法建立的模型具有较好的拟合效果, 最大误差仅为16.5%。所建模型表明, 粮食单产和生产资料与粮食价格指数比是影响山东省粮食产量的最主要因素。其中粮食单产每变动一个单位, 粮食总产变化0.4764个单位;生产资料与粮食价格指数比每变化1%, 粮食总产变化13.75%。

第二, 在耕地资源有限的情况下, 提高粮食单产是提高山东省粮食产量的最有效途径;采取增加科技投入、改进现有耕作方式和耕种技术、改良农作物管理方式, 以及通过常规杂交和生物技术培育良种等方法来提高粮食单产, 可有效地增加粮食产量。

第三, 农民的种粮积极性也是影响粮食产量的重要因素, 而决定农民种粮积极性的主要因素是生产资料和粮食的价格。采取适当措施以稳定、提高粮食价格, 降低农业生产成本, 增加种粮补贴来提高农民的种粮积极性, 对粮食增产具有重要意义。

第四, 农业机械化代替了人的劳动, 农村劳力的增加已不是提高粮食产量的主要途径;高度机械化的同时带来农业机械的闲置, 农业机械的增加实际上加快了农业劳动的速度, 而在影响粮食产量上效果并不明显。

第五, 受边际效益递减规律的影响, 化肥投入在粮食增产方面的能力逐渐下降;施肥方法落后、偏施和过施现象普遍存在, 盲目增加化肥施用量并不能从根本上使粮食增产, 关键是要提高化肥的利用率。

参考文献

[1]Javier Blas、Geoff Dyer:世界和中国都面临粮食问题大挑战[J].中国投资, 2009 (5) .

[2]李妍:中国粮食生产影响因素及地区差异分析[J].经济研究导刊, 2009 (13) .

[3]王海燕:河南省主要影响粮食产量的因子分析[J].中国商界, 2009 (174) .

[4]田德斌、车明诚:黑龙江省粮食产量波动分析与政策建议[J].农业现代化研究, 2009 (3) .

[5]刘定惠、朱超洪:安徽省粮食生产变化特征及其影响因素分析[J].安徽农学通报, 2009 (5) .

[6]赵慧江:基于回归分析的粮食产量影响因素分析[J].怀化学院学报, 2009 (2) .

[7]姜长云、蓝海涛、张艳平:我国农产品成本上升的问题亟待引起高度重视——以粮食和生猪产品为例[J].中国经贸导刊, 2008 (22) .

[8]朱万红:我国农产品价格大幅波动的负面效应及其对策研究[J].价格理论与实践, 2009 (1) .

[9]唐凡、姜珊珊、邱灿华:对完善我国粮食补贴机制的研究[J].价格理论与实践, 2009 (2) .

逐步回归 篇7

一、数据收集

本文选取的数据是2001—2015年三亚市旅游总收入与国内游客人数和入境游客人数的样本数据,如表1所示。

数据来源:三亚旅游官方政务网。

从表1中可以看出,2001—2015年三亚市旅游收入逐年递增,国内游客人数高于入境游客人数,也逐年增加,但入境游客人数近两年呈下滑趋势。

二、三亚市旅游总收入的多元线性回归分析

设三亚市旅游总收入的多元线性回归模型是:

上式是一个二元线性回归模型,里面有两个解释变量。其中,因变量表示三亚市旅游总收入,自变量x1表示历年三亚市y国内游客人数,x2表示历年三亚市入境游客人数,β0为回归常数项,β1、β2称为偏回归系数。?为随机误差项,也是一个随机变量,满足下面两个前提条件,即:

1. 多元线性回归方程中引进剔除变量分析

a.预测变量:(常量),国内游客人数(人次)。b.因变量:旅游总收入(亿元)。

从表2可以得出:在模型1中相关系数R=0.997,判定系数R2=0.993,调整判定系数R2=0.993,接近1,说明回归方程对样本数据的拟合优度较高,国内旅游人数与旅游总收入具有强正相关性,旅游人数的增加能带动旅游收入的提高。估计值的标准误差是7.865 65。

2. 回归方程中的方差分析

a.预测变量:(常量),国内游客人数(人次)。b.因变量:旅游总收入(亿元)。

从显示的回归方程方差分析表中可以看出,模型1中F=1919.713,P=0.000,在显著性水平?为0.05时,概率P值小于?,则拒绝原假设,认为回归系数与零有显著差异,被解释变量三亚市旅游总收入与解释变量国内游客人数的线性关系显著,说明可以用国内游客人数变化来解释预测旅游收入的变化趋势。

三亚市旅游收入模型的回归方程为:

经t检验,在0.05检验水平下,P=0.000,常数项β1和回归系数β2均有显著性意义。由回归方程可知,三亚市国内游客人数每增加1人,旅游收入将增加2 240元。

3. 回归方程中的残差分析

综上所述,三亚市旅游总收入与国内游客人数之间存在强正相关关系。当国内游客人数增加或减少时,相应地,旅游收入也会增加或减少。根据公式(2)可知三亚市国内游客人数每增加1人,旅游收入将增加2 240元。三亚市旅游总收入与入境游客人数之间不存在线性关系,入境游客人数对三亚市旅游收入的影响较小。近15年来,入境游客人数占总游客人数比例非常小,其增加或者减少并没有引起旅游收入的明显变化。运用上述回归模型可知三亚市旅游总收入与游客人数之间的关系,分析三亚市游客消费情况,并且可以通过国内游客人数来预测未来的三亚市旅游收入。

三、对策建议

积极发展以三亚市旅游度假饭店为平台,集住宿、餐饮、购物、休闲娱乐为一体的旅游消费综合体;做大婚庆度假、低空飞行、游轮游艇等三亚市旅游新产品、新业态。加快三亚市旅游业与三亚其他特色产业、支柱产业和重点新兴产业的融会贯通,推进海洋与旅游、医疗与旅游、农业与旅游、体育与旅游、文化与旅游、商贸与旅游的融合发展。在夏季推出多元化旅游产品和优惠旅游产品,从国内市场做起,解决三亚市旅游产品淡旺季明显、夜间旅游产品单调等问题,延长游客消费和体验时间。借道“海上丝绸之路经济带”,做大航空入境旅游经济。积极利用第三、四、五航权,争取开通更多国际航线,构筑三亚市入境旅游航空路网。以东南亚、中亚、西亚、俄罗斯、德国、英国为重点目标市场,开发以三亚市为直接目的地的直飞旅游服务,携手“丝绸之路”国内重点城市开发以三亚市为最终目的地的一程多站式旅游服务。

参考文献

[1]薛薇.统计分析与SPSS的应用[M].北京:中国人民大学出版社,2014.

[2]王征征.山东旅游黄金周收入分析及政策研究[J].调查与思考,2013,(1).

[3]张桥,蔡道成.酒店实习效果影响因素的逐步回归分析[J].科技和产业,2014,(8).

逐步回归 篇8

关键词:软件工程,多元逐步回归分析,回归方程,知识复用,情形属性

1. 引言

在生产活动、科学实验与经济现象中, 我们研究的变量往往受多个因素的影响。处理这类问题, 我们常常借助于统计学中的回归分析方法。该方法能够支持研究和分析因变量与自变量之间的关联关系及相关关系的强弱, 并且通过回归方程的形式描述和反映出这种关系。所以, 它帮助人们准确地把握变量受其它一个或多个变量影响的程度, 进而为控制和预测提供科学依据。然而回归分析法必须采用人工选择回归因子, 这不仅需要预测者有较为丰富的工作经验和较高的判断能力, 而且可能会由于人的主观原因最终无法得到因变量和自变量之间准确的相互关系, 影响了预测的公正性及准确性。而多元逐步回归分析理论给出了一种筛选影响因子的方法, 它支持将所有可能的影响因素都代入到计算机处理程序中, 由计算机从中优选出那些对因变量影响较大的影响因子。

我们将影响软件工程知识的各种因素称为情形[1], 它反映了软件工程中的不同知识在不同条件下的适用性。知识情形要素[2,3]包括:软件工程项目特征、软件工程组织特征、软件工程过程特征、软件工程知识效用和软件工程知识特征等五个维度, 包含110余项的情形因素。这些因素已经基本形成了可用于软件工程知识情形适用性评价[4~6]的指标集。针对较少的情形要素时, 工程师可根据经验判断高适用性知识, 但针对大型集成软件系统庞大的软件工程项目很难凭经验挑选。所以, 本文从知识复用角度出发确定软件工程知识复用有显著影响的关键情形因素, 达到在新项目情形中快速选用高适用性的软件工程知识的目的。

2. 显著情形属性的识别

软件工程知识情形适用性评价解决问题如下:

1) Yi={Yi1, Yi2, Yi3, …, Yin}属性集合的确定, 包括软件工程知识显著影响的情形属性;

2) Yi={Yi1, Yi2, Yi3, …, Yin}属性集合weight (权重) 的确定。权重必须反映情形属性对知识复用的显著程度。

2.1 情形属性集的建立

情形属性集X={x1, x2, …, x10}。其中x1:软件工程项目可用性, x2:软件工程范围, x3:软件工程产品类型, x4组织与客户关系, x5软件工程领域熟悉度, x6:软件工程中需求工程

过程效用指标, x7:软件工程项目成本, x8:软件工程用户参与度指标, x9:软件工程过程效率指标, x10:软件工程组织标准规范性指标。

情形指标的适用性指标评价术语集E={e1, e2, …, em}, 其中ej (j=1, 2, …, n) 表示由高到低的各级评分。本文中取n=5。其评价分为1.绝对适用 (e1) ;2.比较适用 (e2) ;3.大部分适用 (e3) ;4少部分适用 (e4) ;5.完全不适用 (e5) ;确定的评价等级集合为E={e1, e2, e3, e4, e5}。为了量化评估分析确定评语等级分值分别为:0.9 (e1) , 0.7 (e2) , 0.5 (e3) , 0.3 (e4) , 0.1 (e5) 。

2.2 模型建立

设情形属性与各个适用性指标之间存在多元线性回归关系, 则我们可构造线性回归模型为:

由方程可知Y为因变量, Xi为自变量。

因变量Y与各个自变量Xi之间都存在较强的相关性, 如果我们剔除了属性集中的某一个元素, 则回归分析的优良性将会受到影响。所以我们采取将情形属性集中的各个元素全部带入到我们建立的回归方程 (1) 当中, 即建立了全模型的回归系数方程。

则我们可以得到回归方程如示:

为了使我们得到的回归方程能达到一种最优的效果, 则我们选取得自变量必须满足以下两个条件:

1、在线性回归分析模型中, 要包括所有对因变量有影响的自变量Xi, 同时我们必须将那些对因变量没有显著影响的自变量Xj剔除。

2、在我们建立的模型中, 所有的自变量之间不能够存在线性或类线性关系。

为了进一步对问题进行优化, 我们在这里引入逐步回归分析方法。此方法如下:

Step1) 将xk1引人回归分析方程, xk1是所有xi (i=1, 2, …, n) 中对变量y贡献率最大的一个变量, 记为:。

残差平方和Q与回归平方和U, 记, 其中值是与观测值相对应的理论计算值。

使用Ft进行显著性检验, 式中为去掉第k个因子的回归平方和。在实际的应用中, 须软件工程范围、服务对象等情况确定标志检验水平的阀值Fa。若Ft大于Fa时, 说明该因子xk1对y有显著影响, 说明这个xk1引人成功。

Step2) 引入情形属性集中因子xk2

其中xk2是所有xi (i=1, 2, …, n) 中与xk1配合时, 对y独立贡献最大的一个变量, 也就是最显著的因子。倘若此时Ft大于Fa时, 说明该因子xk2对y有显著影响, 这个因子引人成功;若相反, 则说明该回归方程只有因子xk1, 逐步回归过程结束。

Step3) 比较调整因子

调整xk1和xk2, 考虑xk1在xk2配合下的独立贡献。倘若此时Ft小于Fa时, 则剔除因子xk1;否则, 则认为已引入两个因子的变量组合, 继续下一步计算。

Step4) 逐步回归验证影响因子

引人第3个变量……重复循环Step2, Step3步骤。

Step5) 当引入与剔除因子完毕后, 得到逐步回归分析方程。该方程依照已有评价数据逐步反复回调存在的潜在显著因子并最终得到最好的回归方程。

从表4列出了被引入回归方程的自变量, 即回归方程中引入自变量X2, X1, X6, 也就是情形属性集合当中的项目类型适用性, 项目规模适用性, 需求工程过程效用适用性。

3. 分析与讨论

将逐步回归模型Y=Y=-0.361+0.601X2+0.599X1+0.347X6应用到实际当中, 当X2=0.9, X1=0.7, X6=0.5, 可以得到Y=0.7727, 这与实际的指标集0.7相差了0.0727, 所以我们可以认为建立的模型拟和程度是优良的。我们可以通过次方法从情形属性集合中挑选出显著性水平较好的情形属性。

参考文献

[1]张小帝.应用回归分析[M].杭州:浙江大学出版社, 1991.8, 22-23

[2]于秀林、任学松.多元统计分析[M], 中国统计出版社, 2001

逐步回归 篇9

1 粮食产量现状

1.1 粮食种植结构现状

松原市目前种植的粮食作物主要有玉米、水稻、小麦、谷子、高粱和大豆, 后4类作物种植比例较小。通过对1999—2009年各县区平均粮产统计可知, 一是各县区玉米种植的比重最大, 尤以扶余县比例最大 (占83.87%) ;其次是水稻, 尤以前郭县所占比例最大, 占总产的近1/3。玉米和水稻两大作物产量占全市的86.56%。二是各地其他类作物占总产的比例不一, 长岭县最大 (19.75%) , 扶余县最少 (9.09%) 。三是各地粮产对全市总产的贡献排序依次为扶余县、前郭县、长岭县、乾安县、宁江区。四是玉米单产排序最高的是长岭县 (9.75 t/hm2) , 最低的是宁江区 (7.38 t/hm2) ;而水稻单产最高的是前郭县 (10.92 t/hm2) , 最低的是乾安县 (5.56 t/hm2) 。

1.2 总产和主产品状况

通过分析1995年以来的全市粮食总产和玉米产量的资料, 发现如下特征:一是玉米产量占全市总产量的70%以上, 年产量在400万t左右波动, 玉米单产8.26 t/hm2, 均方差为2.17, 变差系数 (均方差与均值比) k=0.26。玉米单产变幅 (%) = (当年单产量-上年单产量) /当年产量×100, 体现粮食增减产情况。二是自2000年以后, 虽然干旱年份较多, 但粮食单产或玉米单产均有大幅度提升, 且总产已逐步跨过400万、500万、600万t的阶段性水平, 每增加100万t的平均时间为3年, 间接体现出了种植业科技水平和管理能力等因素的提高。三是粮食减产2成以上的年份共6年, 均为大旱年 (1997、1999、2000、2004、2007、2009年) , 这6年中全市4—9月平均降水量仅为307.2 mm, 较历年平均值偏少近100 mm, 而多雨的1998、2005、2008年均为大丰收年。由此说明, 干旱是松原市粮食生产的主要自然灾害。

2 粮食产量预报模型

2.1 粮食产量模型结构

一般粮食产量的模型为:

式中:Y为实产, YT为社会趋势产量, YW为气象产量, △Y为随机项。

2.2 粮产趋势产量和气象产量的提取方法

社会趋势产量 (YT) 实际上是指生产水平在“中性”气象条件 (即对作物既无利又无弊的气象条件) 下的产量, 而气象产量是指农业气象条件对作物有利或不利而形成的绝对增 (减) 值。趋势产量一般可通过多项式或线性方程数学方法来描述[1,2,3]。此处采用线性方法建立的全市粮食总产趋势方程:

方程的样本数N=15, 相关系数r=0.552≥r0.05=0.514检验水准, t为以年为变数的值 (1995年开始年份序数为1, ……2009年序数为15) 。

气象产量采用等权重滑动公式:

式中:Yi为滑动平均序列, Wt为权重系数, Xi+t为资料序列, 这里令W均相等 (W=1/m) 。

因玉米产量占松原市产量比重最大, 且受天气条件的影响最直接, 故将玉米产量代入 (3) 式得出3、4、5年不等间隔滑动平均值序列与实产序列相关系数达0.885, 通过0.001信度水准[4,5]。

取滑动序列的平均值为8.37 t/hm2, 它与实际单产的差值分离出的气象产量见表1。由表中的气象产量序列与粮产变幅比较, 可看出两者有较好的一致性, 间接反映出由气象条件优劣可确定粮食产量丰歉年景。

3 粮食产量预报方程的建立

分析玉米单产气象产量, 由18个因子与气象产量序列采用逐步回归数学方法筛选组建的预报方程如下:

(t/hm2)

式中:K6、K8、K9为水热系数, Ri、Ti分别为某年某月的降水量和月平均温度, R、T为该月历年平均降水量和平均温度, 凵初为初霜日期 (以9月1日为序数1计算, 如霜出现在9月25日, 则凵初=25, 出现在10月3日, 则凵初=33) 。

方程 (1) 的复相关系数回归方差与剩余方差比F=12.670 6, 剩余标准差Sy=1.043 5。用方程 (4) 计算结果减去对应年份气象产量验证结果:平均绝对误差△ε=0.08, 平均相对误差<1% (0.007 9) , 证明方程拟合效果非常好 (表2) 。

分析松原市水稻单产 (1999—2009年, n=11) , 得到rym=0.979 8, F=7.996 4, Sy=0.562 9, F1=F2=2.5, (r110.001=0.847 1) ;Y=10.172 55-2.431 6 K8+0.698 2 K9+2.302 2 K6-8。

松原市粮食总产 (1995—2009年, n=15) , 得到:ry M=0.902 1, F=10.929, Sy=61.763 4, F1=F2=2.5;Y赞=153 9.737+150.348 3 K9+0.510 7 R6-8-0.340 7T≥10℃-1.811 2 R8。

4 粮产预报基本思路

一是做粮产预报前, 应收集当年各地各类作物播种面积情况。二是对当年农业气象条件进行评价。三是利用以上相关公式进行计算。预报方程中未出现的因子可用气象台提供的预报值替代。四是根据总产= (玉米单产×播种面积) + (水稻单产×播种面积) + (其他作物播种占总产比例) 的方法确定。

5 小结

经分析表明, 玉米和水稻是松原市粮产中的大宗商品粮, 平均产量分别占总产量的74.13%和12.43%。采用等权重不等距离滑动法得出的气象产量序列与实际丰歉年景有很好的一致性, 该结果间接说明干旱是制约松原市粮产的主要自然因素。使用逐步回归数学方法组建的玉米气象产量预报方程, 经历史回代检验, 绝对误差仅0.08 t/hm2, 相对误差仅1%。其他10个预报方程复相关系数均通过0.001信度水准检验。通过合理应用主要粮产品种和总产基础预报工具, 综合分析得出的结论, 可实现逐步回归数学方法在制作粮产预报中的应用, 并为粮产与气象条件的关系研究提供参考。

参考文献

[1]刘汉武, 任永富.昌都地区粮食产量预报方法探讨[J].昌都科技, 1994 (1) :2-34.

[2]郑洪初.安康地区粮食产量预报模型研究[J].陕西农业科学, 1993 (6) :1-3.

[3]刘振忠, 徐梅.三江平原地区粮食产量预报模型研究[J].农业工程学报, 1999, 15 (4) :14-18.

[4]陈丛斌, 李昶泰.最优非线性预报方程在粮食产量预报中的应用[J].国外农学:杂粮作物, 1999, 19 (1) :51-56.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:逐步深入 下一篇:逐步实现共同富裕