逐步回归方法(精选八篇)
逐步回归方法 篇1
1 粮食产量现状
1.1 粮食种植结构现状
松原市目前种植的粮食作物主要有玉米、水稻、小麦、谷子、高粱和大豆, 后4类作物种植比例较小。通过对1999—2009年各县区平均粮产统计可知, 一是各县区玉米种植的比重最大, 尤以扶余县比例最大 (占83.87%) ;其次是水稻, 尤以前郭县所占比例最大, 占总产的近1/3。玉米和水稻两大作物产量占全市的86.56%。二是各地其他类作物占总产的比例不一, 长岭县最大 (19.75%) , 扶余县最少 (9.09%) 。三是各地粮产对全市总产的贡献排序依次为扶余县、前郭县、长岭县、乾安县、宁江区。四是玉米单产排序最高的是长岭县 (9.75 t/hm2) , 最低的是宁江区 (7.38 t/hm2) ;而水稻单产最高的是前郭县 (10.92 t/hm2) , 最低的是乾安县 (5.56 t/hm2) 。
1.2 总产和主产品状况
通过分析1995年以来的全市粮食总产和玉米产量的资料, 发现如下特征:一是玉米产量占全市总产量的70%以上, 年产量在400万t左右波动, 玉米单产8.26 t/hm2, 均方差为2.17, 变差系数 (均方差与均值比) k=0.26。玉米单产变幅 (%) = (当年单产量-上年单产量) /当年产量×100, 体现粮食增减产情况。二是自2000年以后, 虽然干旱年份较多, 但粮食单产或玉米单产均有大幅度提升, 且总产已逐步跨过400万、500万、600万t的阶段性水平, 每增加100万t的平均时间为3年, 间接体现出了种植业科技水平和管理能力等因素的提高。三是粮食减产2成以上的年份共6年, 均为大旱年 (1997、1999、2000、2004、2007、2009年) , 这6年中全市4—9月平均降水量仅为307.2 mm, 较历年平均值偏少近100 mm, 而多雨的1998、2005、2008年均为大丰收年。由此说明, 干旱是松原市粮食生产的主要自然灾害。
2 粮食产量预报模型
2.1 粮食产量模型结构
一般粮食产量的模型为:
式中:Y为实产, YT为社会趋势产量, YW为气象产量, △Y为随机项。
2.2 粮产趋势产量和气象产量的提取方法
社会趋势产量 (YT) 实际上是指生产水平在“中性”气象条件 (即对作物既无利又无弊的气象条件) 下的产量, 而气象产量是指农业气象条件对作物有利或不利而形成的绝对增 (减) 值。趋势产量一般可通过多项式或线性方程数学方法来描述[1,2,3]。此处采用线性方法建立的全市粮食总产趋势方程:
方程的样本数N=15, 相关系数r=0.552≥r0.05=0.514检验水准, t为以年为变数的值 (1995年开始年份序数为1, ……2009年序数为15) 。
气象产量采用等权重滑动公式:
式中:Yi为滑动平均序列, Wt为权重系数, Xi+t为资料序列, 这里令W均相等 (W=1/m) 。
因玉米产量占松原市产量比重最大, 且受天气条件的影响最直接, 故将玉米产量代入 (3) 式得出3、4、5年不等间隔滑动平均值序列与实产序列相关系数达0.885, 通过0.001信度水准[4,5]。
取滑动序列的平均值为8.37 t/hm2, 它与实际单产的差值分离出的气象产量见表1。由表中的气象产量序列与粮产变幅比较, 可看出两者有较好的一致性, 间接反映出由气象条件优劣可确定粮食产量丰歉年景。
3 粮食产量预报方程的建立
分析玉米单产气象产量, 由18个因子与气象产量序列采用逐步回归数学方法筛选组建的预报方程如下:
(t/hm2)
式中:K6、K8、K9为水热系数, Ri、Ti分别为某年某月的降水量和月平均温度, R、T为该月历年平均降水量和平均温度, 凵初为初霜日期 (以9月1日为序数1计算, 如霜出现在9月25日, 则凵初=25, 出现在10月3日, 则凵初=33) 。
方程 (1) 的复相关系数回归方差与剩余方差比F=12.670 6, 剩余标准差Sy=1.043 5。用方程 (4) 计算结果减去对应年份气象产量验证结果:平均绝对误差△ε=0.08, 平均相对误差<1% (0.007 9) , 证明方程拟合效果非常好 (表2) 。
分析松原市水稻单产 (1999—2009年, n=11) , 得到rym=0.979 8, F=7.996 4, Sy=0.562 9, F1=F2=2.5, (r110.001=0.847 1) ;Y=10.172 55-2.431 6 K8+0.698 2 K9+2.302 2 K6-8。
松原市粮食总产 (1995—2009年, n=15) , 得到:ry M=0.902 1, F=10.929, Sy=61.763 4, F1=F2=2.5;Y赞=153 9.737+150.348 3 K9+0.510 7 R6-8-0.340 7T≥10℃-1.811 2 R8。
4 粮产预报基本思路
一是做粮产预报前, 应收集当年各地各类作物播种面积情况。二是对当年农业气象条件进行评价。三是利用以上相关公式进行计算。预报方程中未出现的因子可用气象台提供的预报值替代。四是根据总产= (玉米单产×播种面积) + (水稻单产×播种面积) + (其他作物播种占总产比例) 的方法确定。
5 小结
经分析表明, 玉米和水稻是松原市粮产中的大宗商品粮, 平均产量分别占总产量的74.13%和12.43%。采用等权重不等距离滑动法得出的气象产量序列与实际丰歉年景有很好的一致性, 该结果间接说明干旱是制约松原市粮产的主要自然因素。使用逐步回归数学方法组建的玉米气象产量预报方程, 经历史回代检验, 绝对误差仅0.08 t/hm2, 相对误差仅1%。其他10个预报方程复相关系数均通过0.001信度水准检验。通过合理应用主要粮产品种和总产基础预报工具, 综合分析得出的结论, 可实现逐步回归数学方法在制作粮产预报中的应用, 并为粮产与气象条件的关系研究提供参考。
参考文献
[1]刘汉武, 任永富.昌都地区粮食产量预报方法探讨[J].昌都科技, 1994 (1) :2-34.
[2]郑洪初.安康地区粮食产量预报模型研究[J].陕西农业科学, 1993 (6) :1-3.
[3]刘振忠, 徐梅.三江平原地区粮食产量预报模型研究[J].农业工程学报, 1999, 15 (4) :14-18.
[4]陈丛斌, 李昶泰.最优非线性预报方程在粮食产量预报中的应用[J].国外农学:杂粮作物, 1999, 19 (1) :51-56.
逐步回归方法 篇2
魏立华:目前业内对我们有很多称呼,比如价格杀手、搅局者,我本人更喜欢“破局者”这个称呼。做奶粉并不是什么高科技,做的还是良心,我希望用优质优价,为中国爸妈节省奶粉钱。
《中国经济周刊》:不走实体店选择电商可以降低成本,但是100多元的价格比起洋奶粉和其他品牌还是很低,君乐宝的低价路线会一直坚持吗?
魏立华:除去各种花费,130元一罐奶粉还有3%~4%的净利润。在3年前奶粉业务中,电商渠道一般只占销量10%,而目前可以占到24%,电商、手机端APP、微商城等成为一种渠道趋势。
目前,君乐宝已与苏宁红孩子以及我买网达成协议开设网购平台。我相信未来中国奶粉市场价格能够逐步回归理性,正是这些不断进步、勇于创新的民族乳业在发力。毕竟君乐宝在奶粉行业里还是一个新品牌,所以2016年主要会把目标放在增强品牌知名度、扩大品牌影响力上面。
《中国经济周刊》:目前君乐宝已经发展成为国家农业产业化重点龙头企业和国家级高新技术企业,您对君乐宝发展有什么样的期待?
魏立华:我是石家庄人,每次开会、培训大家都会提到三聚氰胺,我觉得很没面子,觉得一定要把乳业做起来,给河北一个正面的形象。现在提起河北乳业,我会很自豪,不蒸馒头争口气,必须得拿出这种精神来。在君乐宝乳业的收入结构中,分为酸奶、常温奶、奶牛、奶粉,这四驾马车正在带领着君乐宝乳业驶上快速发展的道路。
逐步回归方法 篇3
财政收入是我国国民经济核算体系的一项重要指标。建立科学合理的财政收入统方法, 是加强国民经济核算和宏观调控的需要, 也是评价财政工作优劣的重要依据。长期以来, 我国对财政收入的统计分析主要基于预算收入法及其以此为基础的财政收入占GDP比重。但是, 就当前我国财政收入的实际情况来看, 仅仅依靠这种统计分析方法, 不仅有失偏妥, 也给各级财政工作带来了被动。这就需要建立合适的政府财政收入统计方法。
逐步回归分析法就是一种自动地从大量可供选择的变量中选择那些对建立回归方程比较重要的变量的方法, 它是在多元线性回归基础上派生出来的一种算法技巧。逐步回归分析法在筛选变量方面较为理想。故目前多采用该方法来组建回归模型。该方法也是从一个自变量开始, 视自变量对Y作用的显著程度, 从大到小地依次逐个引入回归方程。但当引入的自变量由于后面变量的引入而变得不显著时要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量, 为逐步回归的一步。对于每一步都要进行F值检验 (F值检验的具体含义在下一节做介绍) , 以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。这个过程反复进行, 直至既无不显著的变量从回归方程中剔除, 又无显著变量可引入回归方程时为止[1]。
本文旨在运用应用统计软件SPSS V17.0, 基于逐步回归法建立国家财政收入的回归模型, 分析影响国家财政收入的可能因素。
2 利用逐步回归法建立国家财政收入的回归模型
2.1 变量的选取与筛选
在使用回归分析建立模型时, 首先遇到的一个重要问题就是自变量的选择问题。一方面为了获取全面信息, 总是希望模型中包含的自变量尽可能的多;另一方面, 考虑到收获很多自变量的观测值的费用和实际困难, 则希望模型中包含的变量是最重要的, 且尽可能的少。理论上可以证明:当自变量数目过大时, 模型计算复杂并且往往会扩大估计方差, 降低模型的精度。因此, 最优的线性回归模型应理解为: (1) 该模型中包含所有对因变量有显著影响的自变量; (2) 该模型中包含的自变量个数尽可能的少; (3) 当有几个模型都满足这两方面的要求时, 方差的无偏估计中以最小者为优。
根据实际情况, 本文中考虑的自变量包括: (1) 工业总产值 (亿元) ; (2) 农业总产值 (亿元) ; (3) 建筑业总产值 (亿元) ; (4) 全民人口数 (万人) ; (5) 社会商品零售总额 (亿元) ; (6) 受灾面积 (万公顷) 。因变量为国家财政收入。
在决定一个新的变量是否有必要进入模型或判断某个变量是否可以从模型中剔除, 首先要解决的问题是:这个变量对因变量的影响是否显著?解决该问题的正规方法是偏F检验, 设有n个自变量采用这n个自变量拟合的全模型为
2.2 计算过程及结果
本文选取的可能影响国家财政收入的因素有:工业总产值 (亿元) 、农业总产值 (亿元) 、建筑业总产值 (亿元) 、社会商品零售总额 (亿元) 、人口 (万人) 、受灾面积 (万公顷) 等。数据来源于《中国统计年鉴》[3], 选取了1997年—2011年近15年的数据使用SPSSV17.0进行处理。
相关分析如表1所示 (只选取了部分数据) , 显示各变量间的泊松相关系数和显著性检验单尾P值及每个变量的个数。从表中我们可以看到国家财政收入跟工业生产总值, 农业生产总值, 建筑业生产总值, 人口还有社会商品零售总额都有很强的相关性, 但与受灾面积相关性比较弱。
表2为方差分析表, 为回归拟合过程中每一步的方差分析结果。列出了回归平方和、残差平方和、自由度等。Sig.为大于F值的概率。方差结果表明, 当回归方程包含不同自变量时, 其显著性概率值均小于0.001。因此回归方程应该包括这两个自变量。
表3为回归系数表, 包括B、Beta分别为非标准化和标准化的回归系数, t为偏回归系数为0时的假设检验的t值, Sig.为偏回归系数为0时的假设检验的显著性水平、B的95%置信区间、偏回归系数等。在逐步回归过程中, 利用偏回归系数平方和来判断一个自变量对因变量影响的显著程度。某因素的偏回归系数平方和越大, 该因素对因变量的作用就愈大。从表中分析可以看到:逐步回归的最优回归子集为模型2, 回归方程为::;方程中的常数项为-7533.154, 偏回归系数b1为0.273, b3为1.808, 经t检验, b1、b3的P值分别为:0.000, 0.000, 按α=0.05水平, 均有显著意义。
2.3 图表总结分析
实验结果表明, 在利用逐步回归法建立方程的过程中, 引入了两个自变量x1和x3, 即工业总产值和建筑业总产值, 且它们与因变量y财政收入具有显著的线性相关性, 其结果有显著性意义, 而其它自变量均未能引入方程。分析给出的散点图, 得到这一结果的原因是显而易见的:一些自变量如农业总产值, 虽然其散点图也基本为线性, 但此线性关系不如建筑业总产值和工业总产值的强, 同时它与建筑业总产值又具有高度相关性, 因此它最终成为不需要被引入的因素;还有一些散点图如受灾面积与财政收入散点图比较凌乱, 不能判断它们与因变量的关系, 但显然是非线性的。此外, 选取的年份较少及由于知识背景不足而使得某些重要因素未被考虑等, 可能是影响实验精度的主要原因。
3 模型解释说明
从上面的分析我们得到了两个对财政收入影响较显著的自变量:工业生产总值和建筑业生产总值。即工业生产总值和建筑业生产总值对我国财政收入有显著的影响。在工业方面, 国家对工业的发展给予了高度的重视, 对产业结构进行了重大的调整, 国民经济保持着快速健康发展的势头。工业生产快速增长, 财政收入迅速增加。而另一方面在政府积极的财政政策运用过程中, 尤其是在大规模的基础设施建设拉动内需和扩大就业过程中, 建筑业是受益较大的产业, 促进了建筑业的极大发展。中国建筑业进入了健康、快速发展的轨道。近年来中国的建筑业总产值一直呈高速增长态势, 对国家财政收入起着积极的促进作用。因此, 工业生产总值和建筑业生产总值是国家财政收入的两个重要来源。
最后我们运用模型对2011年的财政收入进行检验, 2011年我国的工业生产总值为188470亿元, 建筑业生产总值为31943亿元。运用上面的回归方程我们可以得到2011年我国的财政收入为:0.273*188470+1.808*31943-7533.154=101672亿元。而实际的国家财政收入为103874亿元。我们可以认为得到的回归方程拟合的效果较好。
本模型在一定程度上体现了与选取的自变量之间的线性关系, 并能对因变量做出近似的预测。综合来看, 数据模型基本达到了预期的目的。对国家或地方财政模型建立、经济现象的分析有很好参考意义。
参考文献
[1]孙海燕, 周梦, 李卫国, 冯伟.应用数理统计[M], 北京:北京航空航天大学出版社, 2004 (9) .
[2]周复恭, 黄运成.应用线性回归分析[M], 北京:中国人民大学出版社, 1989 (8) .
四川省住房需求逐步回归模型研究 篇4
1 住房需求的度量
商品房是房地产开发商开发的一种产品, 通过市场买卖关系来实现其价值和使用价值, 属于完全的市场经营行为。也即是说, 商品房具有商品的基本属性, 是一种特殊的商品。经济上某商品的“需求”, 是指在某一时期内和一定市场上按照某一价格愿意并且能够购买的该商品或劳务的数量。类似的有商品房的需求:在某一时期内和一定市场上按照某一价格愿意并且能够购买的住房量。商品房销售总面积, 从总量上直接反映了住房需求的主要特征。因此, 本文选择四川省年度的商品房销售总面积作为该年度的住房需求特征指标, 以此建立住房需求模型。
本文参考国家统计局网站的国家年度统计年鉴和国研网上的年度宏观数据整理得到原始数据。经分析, 1991-1997年期间, 四川省的商品房销售面积平缓增加;除了在2008年出现短暂的回落, 自1998年至今, 基本都保持较快的增长趋势。造成这种现象的主要原因可能在于1998年取消福利分房推行住房分配货币化政策的颁布以及2008年汶川地震对房地产市场的冲击。本文的数据选择时段取为1998至2009年。
2 需求影响因素初步分析
根据微观经济学的基本理论, 影响商品需求的因素包括商品价格, 消费者收入, 消费者偏好, 人们对商品价格的预期, 企业的促销策略, 人口及其构成的变动等。住房作为特殊的商品, 也不例外, 其需求的影响因素也包括这些。除此之外, 还涉及其他社会经济方面的因素。
房地产经济学认为影响房地产行业的因素主要分为两类: (1) 一般因素, 即是一般的、普遍的、共同的因素, 表现为经济因素、社会因素、行政因素以及心理因素; (2) 区域因素, 该类因素为某一特定区域内的自然条件与社会、经济、行政、技术因素等产生的区域性特征, 具体如商服繁华因素、交通便捷因素、城市设施状况因素、环境因素等。
基于该观点, 同时结合文献[4]和[5]的成果, 本文收集整理四大类共18项可能影响因素。 (1) 经济因素:商品房销售价格、国内生产总值、人均国内生产总值; (2) 社会因素:总人口数、城镇总人口数、城镇年末从业人员数; (3) 消费因素:城镇家庭平均每人全年消费性支出、城镇家庭平均每人可支配收入、城镇家庭平均每人全年实际收入、在岗职工平均工资; (4) 财政金融因素:货币、储蓄存款、城镇家庭恩格尔系数、定期存款、流通中现金、准货币、其他存款、利率。
基于经济学原理挑选出来的需求因素具有一定的主观性, 其确定还需要对进一步分析。统计学中的双变量相关分析, 主要是分析两个变量之间是否存在线性相关关系。经SPSS计算, 分别对上述各因素与商品房销售面积进行双变量相关分析, 结果详见表1所示。
注:表中18项因素分别与上一段分析中的因素顺序一致。
由统计学知识有, 相关系数的数值介于-1和1之间, 符号为正意味着二者为同向变动, 否则为反向变动, 而且绝对值的大小反映了相关的程度。由于同类因素之间具有较强的相关性, 本文遵循信息最大化原则, 也即是在每一类中挑选正相关最强的因素和负相关最强的因素。基于该原则, 初步选取住房需求的影响因素分别为:商品房销售价格、城镇总人口数、城镇家庭平均每人可支配收入、储蓄存款、城镇家庭恩格尔系数。
3 模型建立
在上一节中, 依据房地产经济学的观点从经济方面、社会方面、消费方面以及财政金融方面选取18项可能因素。同时基于信息最大化原则, 在每一类中挑选正相关最强和负相关最强的因素, 初步筛选商品房销售价格、城镇总人口数、城镇家庭平均每人可支配收入、储蓄存款、城镇家庭恩格尔系数5项主要指标。本节建立住房需求与上述5项指标之间的数学模型。
利用已有的数据, 以年度的商品房销售总面积为因变量, 影响需求的5项指标 (X1, X2, …, X5) 为自变量, 基于经济学理论, 建立住房需求的回归模型。
undefined
式中, D (t) 为第t期的住房需求;Xj (t) 为第j个影响因素在第t期的值, α0, αj (j=1, 2, …, 5) 为回归系数;ε刻画了随机波动, 服从正态分布。
该模型表明:住房需求量的均值完全由其影响因素相应时期的值决定, 而与其他时期的数据无关, 当然也与其他时期的住房需求无关。
4 模型求解
对于多个自变量对因变量的影响程度, 可以用多元回归方法进行分析。事实上, 尽管住房需求的影响因素很多, 这些因素之间也还可能存在着高度的相互依赖关系, 这就会给回归系数的估计带来不合理的解释。逐步回归分析算法是从一个自变量开始, 视自变量对因变量的作用显著程度从大到小地依次逐个引入回归方程。当引入的自变量由于后面变量的引入变得不显著时, 就要将其剔除掉。该方法可以有效地从众多影响因变量的因素中挑选出贡献最大的变量, 在它们和因变量的观测数据基础上建立最优的回归方程。
针对1998-2009年5项影响因素和商品房销售面积的年度数据, 利用SPSS软件中的逐步回归功能进行分析。第三步回归分析结果:拟合优度为0.985, 修正相关系数平方为0.990, 标准误为0.046, 因此逐步回归分析效果很好。经检验, 回归模型的F值远大于理论值。结果表明, 住房需求模型的效果显著。
因此, 对于第2节中初步确定的住房需求的5项影响因素, 由于因素之间表达信息的重叠, 也即是共线性影响, 采用逐步回归分析方法进行剔除。本文最终确定住房需求模型影响因素为:城镇总人口数;商品房销售价格;城镇家庭恩格尔系数, 共3项。
基于以上的分析, 本文将第三步回归的模型作为住房需求模型, 即为:
lnD (t) =-18.201+0.903lnX5+1.041lnX1-1.152lnX3
模型中因变量 (单位:万平方米) , 三个自变量依次为城镇总人口数 (单位:人) 、商品房销售价格 (单位:元) 、城镇家庭恩格尔系数。这个顺序也是逐步回归过程中自变量添入的顺序。该模型表征了:城镇总人口指标和商品房销售价指标, 都与住房需求呈同向变动;城镇家庭恩格尔系数指标与住房需求呈反向变动。
5 结论
本文研究了四川省住房需求模型问题。在该问题研究过程中, 需求影响因素的确定是关键。本文的处理思路为:首先, 依据房地产经济学的观点从经济方面、社会方面、消费方面以及财政金融方面选取18项可能因素;其次, 基于信息表达最大化的原则, 在每一类中挑选正相关最强和负相关最强的因素, 初步筛选了其中5项;再其次, 采用逐步回归法, 最终选取城镇总人口数、商品房销售价格、城镇家庭恩格尔系数三项作为需求影响因素。另外, 以四川省年度的商品房销售总面积作为该省当年度住房需求的特征指标, 基于对数线性回归建立住房需求模型。实例计算验证了模型的正确性和合理性。
参考文献
[1]中华人民共和国国家统计局, 年度数据[EB/OL].http://www.stats.gov.cn/tjsj/ndsj/, 2012-4-10.
[2]国研网, 年度数据[EB/OL].http://www.drcnet.com.cn/DRC-Net.OLAP.Web/NewSelect/Se lectMacro.aspx?version=Inte-grated, 2012-4-10.
[3]窦坤芳.房地产经济学基础[M].重庆:重庆大学出版社, 2007:14-109.
[4]中国人民银行营业管理部课题组著.北京市房地产市场研究:金融视角的分析[M].北京:中国经济出版社, 2004:68-116.
逐步回归方法 篇5
大坝变形是大坝安全监控的重要物理量,因此实现变形监测、预报和利用变形值拟定安全监控指标是大坝安全重要发展方向。变形值在水位、温度和时效因素的作用下,既呈现一定的周期波动,同时又存在一定的趋势变形。灰色系统模型是一种不确定的模型,将灰色系统应用与大坝安全监测和变形预报已有大量的文献,但灰色系统存在边缘效应,同时没有考虑因变量的影响。常规逐步回归模型具有建模简单,能表示自变量和因变量的显式函数关系和使用广泛等优点,但逐步回归模型在因变量测值波动较大时拟合和预报误差加大,而马尔科夫链模型具有适应大波动的优点,为此将逐步回归与马尔科夫链模型相结合,提出一种高精度的变形预报模型,并利用某大坝的实测资料进行验证。
1 逐步回归模型
逐步回归模型是大坝安全分析建模中最简单常用的一种模型,通过建立模型因子和统计检验方法选择对模型因变量影响大的因子。
1.1建模原理
根据文献[1]可知,大坝位移主要受水压、温度及时效的影响,因而大坝的任一点位移可表示成:
式中:ƒ(H)、ƒ(T)和ƒ(θ)分别表示位移的水压、温度和时效分量;δ 为由统计模型获得的位移值。
1.1.1水压分量
根据力学分析和应用经验,用多项式拟合水压分量得:
式中:αi为拟合系数;n为多项式项数,根据大坝的实际情况,n一般取为3~4,具体是重力坝取3,拱坝取4;H是水位荷载,采用水位高程减大坝基面高程。
1.1.2温度分量
对已经运行多年的老坝,坝体温度基本呈准稳定温度场变化的情况,温度因子可选用不同周期的谐波因子来拟合。即:
式中:m为谐波次数;b1i、b2i均为回归系数;i为相对初始时刻的时间(天)。
1.1.3时效分量
大坝时效位移综合反映坝体混凝土和基岩的徐变、基岩构造的压缩变形和坝体裂缝等综合影响,目前还难以用理论分析方法得到精确解答,现一般采用统计模式:
式中:C1、C2均为回归系数;θ 为监测日至始测日的累计天数除以100,每增加1 d,θ 增加0.01。
1.1.4逐步回归模型的表达式
由上述分析可得,坝体位移的逐步回归模型的表达式为:
1.1.5模型的参数估计
根据已经采集到的大坝实测资料序列,利用式(5)求出δ各个分量的统计(预报)值δi与对应实测值yi的差值Ri:
并令
要使Q最小,则必须满足下列条件:
由式(8)可求得各个参数及剩余均方差S,从而得到各模型参数αi,b1i,b2i,C1,C2,再通过逐步回归F检验即可获得由显著因子建立的统计模型。
上述统计模型尽管利用了最小二乘原理,使得残差平方和最小,但是由于应用的线性最小二乘是在假设测值服从正态分布的条件下获得的整体模型,是所有观测数据的“集中平均”体现,由于大坝的动态特征,使得模型本身是动态的,上述统计模型得到的残差并不服从正态分布,有时甚至出现比较大的跳动。
2 马尔科夫预报模型
马尔可夫过程是随机过程的一个分支,根据模型的阶数可以分成1阶、2阶甚至P阶马尔可夫过程。马尔可夫链是状态和时间均离散的马尔可夫过程,对离散的大坝测值而言实际上可以认为残差为1阶马尔可夫过程。应用马尔科夫链在水位等方面的预报已有文献[2],但在大坝安全监测方面确很少见到,本文借鉴文献[2]的思路,将马尔科夫链方法应用到大坝安全监测上来。
根据马尔科夫链[2]将数据序列分成若干状态,以E1,E2,…,En来表示,按时序将转移时间取为t1,t2,…,tn,Pij(k)表示数列由状态Ei经过k步变为Ej的概率,即:
式中:ni j(k)表示状态Ei经k步变为Ej的次数;Ni表示状态Ei出现的总次数。则k步状态转移概率矩阵为:
若初始状态Ei的初始向量为V(0),则经k步转移后,向量V(k)为:
将实测资料和统计模型由式(6)获得的相对残差进行分类,参照文献[2]即可建立相应的残差预报模型。
3 逐步回归马尔可夫模型
逐步回归马尔可夫模型是将逐步回归模型和马尔科夫模型组合在一起的组合模型,即先利用实测资料建立逐步回归统计模型,再利用马尔科夫建立残差预报模型,将2种模型进行组合即获得逐步回归马尔可夫模型。具体步骤如下:
(1)对原始序列(i=1,2,…,n为观测值序列长度)建立逐步回归模型,根据模型表达式(5),经过因子选择和复相关系数F及剩余标准差S的分析判断,获得逐步回归模型,将实测值和逐步回归模型相减,得到残差序列。
(2)将实测值和逐步回归模型获得的模型值相减,由式(6)得到相对残差序列r={r1 r2,…,rn},根据相对误差大小得到各年残差相对比例所处的状态。
(3)根据文献[3]提供的试算法确定状态转移概率矩阵P(k),对由式(6)得到的残差序列建立马尔科夫模型,利用状态转移矩阵,根据各状态及对应最大转换概率即可求出对应k步转移概率,利用最大概率即可利用马尔可夫模型得到预测残差修正值。本文以-12%,-6%,-2%,2%,6%,12%为界限,将相对误差序列划分为7个区间,相对误差的概率状态见表1。
根据表1所示区间,可以得到残余差序列所处状态,由残差序列状态及上文可得1,2,…,7步状态概率转移矩阵,预报值计算公式如下:
(4)最终的修正预报方程为:
式中:X为逐步回归马尔科夫模型的预报(模型)值,相对于逐步回归模型,由于多考虑了残差的建模,因此逐步回归马尔科夫模型精度要更高。
(5)对建立的逐步回归马尔科夫模型进行后误差检验,合格者可用于极值预报[2]。
4 工程实例
本文对某大坝18号坝段坝顶1978~2006年径向水平位移年极值实测资料、逐步回归模型和逐步回归马尔可夫模型计算结果进行比较分析,表2是部分年份的实测值和预测值的比较。通过各模型拟合和预测的比较,可见逐步回归马尔可夫模型与实测值的差别比采用常规逐步回归模型与实测资料的差别小得多,因此逐步回归马尔可夫模型对峰谷值精度具有明显的改善。笔者将飞来峡大坝变形监测数据建立模型后,也得到同样结论。这为将该模型整编进入大坝自动监测系统的数据分析软件,实现飞来峡大坝安全的高精度预报奠定了基础。
5 结语
本文充分利用逐步回归和马尔科夫模型的特点,建立逐步回归马尔科夫大坝变形监控模型,并用具体大坝的实测数据进行了检验。实际情况表明新的模型兼有逐步回归模型能显示表达自变量和因变量的关系的优点,以及马尔科夫链适合于测值波动较大值的情况,模型拟和预报精度高,下一步将该模型整编进入大坝安全数据分析软件,与自动监测系统实现有机结合,从而为实现水库大坝的安全管理服务。
注:表中的实测数据由自动人工采用垂线坐标仪获得,逐步回归模型的值由常规逐步回归模型获得,逐步回归-马尔可夫模型的值由本文模型得到。
摘要:常规逐步回归模型具有建模简单、能表示自变量和因变量的显式函数关系和使用广泛等优点,但逐步回归模型在因变量测值波动比较大时拟合和预报误差大,而马尔科夫链模型具有适应大波动的优点,为此将逐步回归与马尔科夫模型相结合,提出一种高精度的变形预报模型。在介绍逐步回归模型和马尔科夫预报模型概念的基础上,利用某大坝的实测资料进行建模分析。实践表明,变形预报值能很好地吻合了实测结果,表明该模型可以用于大坝安全监控。
关键词:大坝,安全监控,逐步回归,马尔科夫链,模型,变形预报
参考文献
[1]方卫华.基于峰值识别理论的大坝安全监控模型[J].水电能源科学,2008,26(5):12~16.
[2]董胜,刘德辅.年极值水位的灰色马尔科夫预报模型[J].水利学报,1999,(1):11~15.
逐步回归方法 篇6
1 研究对象与方法
1.1 研究对象
丽水学院在校女大学生62人, 年龄为18~22岁, 身高163.85±4.49cm, 体重54.35±5.72kg。
1.2 研究方法
采用国家认定的体质测试仪器测定女大学生的身高 (cm) 、体重 (kg) 、颈围 (cm) 、胸围 (cm) 、腰围 (cm) 、臀围 (cm) 、右上臂放松围 (cm) 、左上臂放松围 (cm) 、右下肢放松围 (cm) 、左下肢放松围 (cm) , 派生指标BMI和腰臀比。利用生物电阻抗分析法 (韩国产INBODY 720身体成份测试仪) 测定内脏脂肪面积 (cm2) , 对测试对象的要求是:着贴身衣物, 空腹 (早餐前) , 排空大小便, 测试前静立5min, 室内温度25℃, 测试前24h内不进行剧烈运动和大量饮水。所有数据均采用SPSS 11.0统计软件进行逐步回归分析。显著性水平设置于P<0.05。
2 结果
测得内脏脂肪面积31.266±11.706cm2, 以女大学生内脏脂肪面积 (y) 为因变量作逐步回归, 当取Pin =0.05、Pout=0.10时, 可得如下计算结果:
注:*** P <0.001
注:** P <0.01, *** P <0.001
从表1可知两个模型的拟合优度都较高, 方差分析也达到了显著性水平。表2给出了两个模型的回归方程系数, 两个模型的t检验都达到了显著性水平。据此, 得到以下两个模型的回归方程为:y^=-130.624+2.316×腰围, y^=-53.867+2.482×腰围-0.539×身高。
3 讨论
建立的回归预测模型以女大学生内脏脂肪面积为因变量, 方程1以腰围为自变量, 方程2以腰围、身高为自变量, 预测效果都比较好, 利用回归方程可以方便有效的估算女大学生的内脏脂肪面积, 从而更方便女大学生的肥胖程度和健康状况。
参考文献
[1]邓树勋, 王健, 乔德才.运动生理学[M].北京:高等教育出版社, 2002 (7) :246
[2] Rosa Morínigo, Melina Musri, Josep Vidal, et al.Intra-ab-dominal Fat Adiponectin Receptors Expression and Cardiovascu-lar Metabolic Risk Factors in Obesity and Diabetes.ObesitySurgery, 2006, 16 (6) :745-751
[3] Toshihiro Ogura, Tomohiro Tachikawa, Yoshiko Nishimu-ra, et al.Study of intra-abdominal fat distribution in sigmoidcolon cancer in Japanese patients by use of MDCT data.Radio-logical Physics and Technology, 2009, 2 (2) :205-209
[4]周吉海, 徐杨.译.内脏脂肪蓄积型肥胖与缺血性心脏病[J].日本医学介绍, 2006, 27 (2) :77-78.
[5] Koda M, Senda M, Kamba M, et al.Sonographic subcuta-neous and visceral fat indices represent the distribution of bodyfat volume.Abdominal Imaging, 2007, 32 (3) :387-392
[6]徐晓峰, 徐英美, 蔡缨, 等.低血糖指数膳食对代谢综合征患者体重指数、腰臀比值及内脏脂肪的影响[J].东南国防医药, 2008, 10 (4) :261-263
[7] Demura S, Sato S.Prediction of visceral fat area at the um-bilicus level using fat mass of the trunk:The validity of bioelec-trical impedance analysis.Journal Of Sports Sciences, 2007, 25 (7) :823-833
[8] Inamori M, Akiyama T, Takahashi H, et al.Visceral fat anddigestive disease.Nippon Shokakibyo Gakkai Zasshi TheJapanese Journal Of Gastro-Enterology, 2008, 105 (12) :1722-1727
逐步回归方法 篇7
一、数据收集
本文选取的数据是2001—2015年三亚市旅游总收入与国内游客人数和入境游客人数的样本数据,如表1所示。
数据来源:三亚旅游官方政务网。
从表1中可以看出,2001—2015年三亚市旅游收入逐年递增,国内游客人数高于入境游客人数,也逐年增加,但入境游客人数近两年呈下滑趋势。
二、三亚市旅游总收入的多元线性回归分析
设三亚市旅游总收入的多元线性回归模型是:
上式是一个二元线性回归模型,里面有两个解释变量。其中,因变量表示三亚市旅游总收入,自变量x1表示历年三亚市y国内游客人数,x2表示历年三亚市入境游客人数,β0为回归常数项,β1、β2称为偏回归系数。?为随机误差项,也是一个随机变量,满足下面两个前提条件,即:
1. 多元线性回归方程中引进剔除变量分析
a.预测变量:(常量),国内游客人数(人次)。b.因变量:旅游总收入(亿元)。
从表2可以得出:在模型1中相关系数R=0.997,判定系数R2=0.993,调整判定系数R2=0.993,接近1,说明回归方程对样本数据的拟合优度较高,国内旅游人数与旅游总收入具有强正相关性,旅游人数的增加能带动旅游收入的提高。估计值的标准误差是7.865 65。
2. 回归方程中的方差分析
a.预测变量:(常量),国内游客人数(人次)。b.因变量:旅游总收入(亿元)。
从显示的回归方程方差分析表中可以看出,模型1中F=1919.713,P=0.000,在显著性水平?为0.05时,概率P值小于?,则拒绝原假设,认为回归系数与零有显著差异,被解释变量三亚市旅游总收入与解释变量国内游客人数的线性关系显著,说明可以用国内游客人数变化来解释预测旅游收入的变化趋势。
三亚市旅游收入模型的回归方程为:
经t检验,在0.05检验水平下,P=0.000,常数项β1和回归系数β2均有显著性意义。由回归方程可知,三亚市国内游客人数每增加1人,旅游收入将增加2 240元。
3. 回归方程中的残差分析
综上所述,三亚市旅游总收入与国内游客人数之间存在强正相关关系。当国内游客人数增加或减少时,相应地,旅游收入也会增加或减少。根据公式(2)可知三亚市国内游客人数每增加1人,旅游收入将增加2 240元。三亚市旅游总收入与入境游客人数之间不存在线性关系,入境游客人数对三亚市旅游收入的影响较小。近15年来,入境游客人数占总游客人数比例非常小,其增加或者减少并没有引起旅游收入的明显变化。运用上述回归模型可知三亚市旅游总收入与游客人数之间的关系,分析三亚市游客消费情况,并且可以通过国内游客人数来预测未来的三亚市旅游收入。
三、对策建议
积极发展以三亚市旅游度假饭店为平台,集住宿、餐饮、购物、休闲娱乐为一体的旅游消费综合体;做大婚庆度假、低空飞行、游轮游艇等三亚市旅游新产品、新业态。加快三亚市旅游业与三亚其他特色产业、支柱产业和重点新兴产业的融会贯通,推进海洋与旅游、医疗与旅游、农业与旅游、体育与旅游、文化与旅游、商贸与旅游的融合发展。在夏季推出多元化旅游产品和优惠旅游产品,从国内市场做起,解决三亚市旅游产品淡旺季明显、夜间旅游产品单调等问题,延长游客消费和体验时间。借道“海上丝绸之路经济带”,做大航空入境旅游经济。积极利用第三、四、五航权,争取开通更多国际航线,构筑三亚市入境旅游航空路网。以东南亚、中亚、西亚、俄罗斯、德国、英国为重点目标市场,开发以三亚市为直接目的地的直飞旅游服务,携手“丝绸之路”国内重点城市开发以三亚市为最终目的地的一程多站式旅游服务。
参考文献
[1]薛薇.统计分析与SPSS的应用[M].北京:中国人民大学出版社,2014.
[2]王征征.山东旅游黄金周收入分析及政策研究[J].调查与思考,2013,(1).
[3]张桥,蔡道成.酒店实习效果影响因素的逐步回归分析[J].科技和产业,2014,(8).
逐步回归方法 篇8
关键词:体脂肪率,人体质量指数,回归分析,学生,少数民族, 畲族
肥胖已在全球范围内广泛流行, 1999年WHO已正式宣布肥胖是一种疾病[1]。目前国内外比较公认的简单易行的判定肥胖的方法是BMI, 但真正衡量肥胖的指标是体脂百分比 (PBF) [2]。近年来研究发现, 体脂含量的增加以及后期肥胖的发生会带来许多负性的健康效应[3]。体脂百分比计算公式为:体脂百分比 (%) =身体脂肪重量/体重×100%[4]。体重是很容易测得的, 但身体脂肪分布于皮下、内脏周围甚至一些非脂肪细胞内部, 必须借助特殊方法测得, 测量手续繁多, 费用较高, 难以进行大规模的测试。故迫切需要一种类似身体质量指数的简单计算方法, 来估算体脂百分比。有学者对汉族大学男生的身体体脂百分比回归模型进行了优选[2,5];有调查发现, 畲族女大学生与汉族女大学生的体脂百分比存在明显差异[6,7]。本研究以在校畲族女大学生的常用体质指标为自变量, 以生物阻抗测得的体脂百分比指标为因变量, 进行逐步回归分析, 筛选出回归效果较好的回归方程。
1 对象与方法
1.1 对象
从丽水学院2008年9月入学的大一年级新生中随机抽取6个班的畲族女生 (父母双方均为畲族) 共159名进行测试。
1.2 方法
本研究利用生物电阻抗分析法 (韩国产INBODY 720身体成份测试仪) 测定体脂百分数。对测试对象的要求是:穿贴身衣物, 餐前、排尿、排便后参加测试, 测试前24 h内不进行剧烈运动和大量饮水。并利用2005年国民体质检测指定的好家庭仪器, 按照2005年国民体质检测的规定, 对测试对象进行身体形态、机能和素质指标的测试。
1.2.1 形态指标
身高、体重、体质量指数、体重/身高×100、胸围、腰围、臀围、腰臀比、皮褶厚度 (上臂部、肩胛部、腹部) , 其中上臂皮褶厚度为右侧上臂肱三头肌皮褶厚度。
1.2.2 生理功能指标
安静时脉搏、血压、肺活量、台阶指数、坐位体前屈、握力、握力体质量指数、背力、纵跳、1 min仰卧起坐、闭眼单脚站立、选择反应时、800 m跑。
1.3 统计学处理
所有数据均采用SPSS 11.0统计软件进行处理。
2 结果
以体脂百分比 (undefined) 为因变量, 以形态指标和生理功能指标为自变量作逐步回归, 当取Pin=0.05、Pout=0.10时, 可得如下计算结果。从表1可知, 3个模型的拟合优度都较高, 方差分析也达到了显著性水平。表2给出了3个模型的回归方程系数, 3个模型的t检验都达到了显著性水平。据此, 得到以下3个模型的回归方程为方程1:undefined;方程2:undefined体重/身高×100;方程3:undefined体重/身高×100+0.040×800 m跑。
注:**P<0.01。
3 讨论
畲族是我国少数民族之一, 散居在我国东南部福建、浙江、江西、广东、安徽境内, 其中90%以上居住在福建、浙江广大山区[8]。新中国成立后, 在浙江省丽水地区景宁县建立了景宁畲族自治县。根据2000年第五次全国人口普查统计, 畲族人口
注:*P<0.05, **P<0.01。
数为709 592人[9]。畲族女大学生体脂百分比为 (27.61±4.57) %[6], 说明体成分超标的畲族女大学生占相当大的比例。本研究建立的回归预测模型以畲族女大学生体脂百分比指标为因变量, 方程1以BMI为自变量, 方程2以BMI、体重/身高×100为自变量, 方程3以BMI、体重/身高×100和800 m跑为自变量, 预测效果均较好。利用回归方程可以方便有效的估算畲族女大学生的体脂百分比, 从而更方便了解畲族女大学生的肥胖程度和健康状况。
参考文献
[1]ALLISONDB, FAITHMS, HEO M, et al.Meta-analysis of the effect ofexduding early deaths on the estimated relationship between Body massindex and mortality.Obes Res, 1999, 7 (7) :342-354.
[2]贺杰, 漆正堂, 罗艳蕊.大学生体脂百分比测量及回归方程的优选.中国临床康复, 2006, 10 (48) :28-30.
[3]HANK-KHAN RI, WISE RA, FLEG JL.The effect of gender on therelationship between body fat distribution and lung function.J ClinEpidemiol, 2001, 54 (4) :399-406.
[4]邓树勋, 王健, 乔德才.运动生理学.北京:高等教育出版社, 2002:255.
[5]罗军, 陈志强.大学男生身体体脂百分比回归模型的优选研究.浙江体育科学, 2008, 30 (5) :102-105.
[6]岳文雨.大学生体成分和体质健康相关性的研究.绍兴文理学院学报, 2008, 28 (8) :96-98.
[7]占叶俊.畲族女大学生体成分与身体形态指标关系的研究.中国学校卫生, 2009, 30 (3) :268-269.
[8]施联朱.畲族风俗志.北京:中央民族学院出版社, 1989:1-2.
相关文章:
分层分类逐步做好新农村规划建设02-11
氯碱工业逐步实现了绿色化02-11
教师工资待遇逐步提高 两年调整一次02-11
病案首页信息系统02-11
和平梦作文02-11
逐步结转分项结转例题02-11
楼市逐步回归理性 房价区域分化调整已现02-11
杨柳依依逐步情散文02-11
全球基础化学品市场产能逐步过剩02-11
中心城市功能逐步完善02-11