多层线性模型分析(精选五篇)
多层线性模型分析 篇1
一、独立学院学费差异形成的理论分析框架
专业差异、学校差异和地区差异是当前我国独立学院学费差异的三种最主要的表现形式, 也是学费差异形成的重要影响因素。
1. 教育成本不同带来的学费专业类别的差异。
不同专业之间, 同一专业的不同学校之间, 甚至同一类别的学校不同地域之间, 由于专业性质的不同, 学校质量标准要求的不同, 各地生活费和物价标准的不同, 专业的培养成本都存在明显的差异。比如工科院校和专业, 因为购置教学实验设备费用大, 实验和实习费用高, 学生培养成本就会相对高一些, 而一些文科院校和专业, 培养成本就会相对低一些[6]116。据国外教育经济学家的估计, 培养一个文科学生的费用仅占培养一个理工科学生费用的1/4[6]132。而在我国, 据有关资料统计显示, 理工科每个学生的费用是每年1.4万至1.6万元, 人文学科是1.2万至1.4万元, 理工科的培养成本同样要高于文科类的培养成本[7]。在其他条件不变的情况下, 生均成本的差异必然会反映在学费标准的差异上。
2. 学校声望差异与学费学校类别差异的产生。
独立学院和母体公办普通高等院校之间总是存在千丝万缕的联系。母体高等学校或在师资、管理、资源、校舍上给予直接支持, 确保了独立学院的教育质量, 而教育质量是人力资本投资预期收益获得的基础。母体高等学校或凭借自身的品牌优势, 给予独立学院以间接的支持。在高等教育质量信息获得方面, 独立学院显然具有明显的信息优势, 信息不对称的存在使得广大的学生和家长对民办学校天然的存在怀疑, 担心民办学校利用信息优势谋求自身的最大利益而损害学生的利益。为了避免人力资本投资的失败, 人们在学校选择时更加注重学校的声誉。这都使得一些声誉较好的普通高等学校举办的独立学院需求更大, 市场供求影响的学费标准也相对较高。
3. 地区经济发展不平衡与地区学费差异的形成。
与注重教育机会公平分配的普通高等学校不同, 独立学院是为了满足人们对高等教育超额需要而存在的, 在产品性质上“私人产品”的特点更为明显。与实行成本分担与补偿的公立学校不同, 独立院校作为自筹资金、自负盈亏的独立办学实体, 在定价方式上以市场定价为主, 学费反映的是市场价格, 是由市场供求决定的。在独立学院供给受国家教育规划制约缺乏价格弹性的背景下, 地区学费差异的形成主要就来自于需求方面的变化。首先, 地区经济发展水平越高, 地区居民可支配收入能力也相对较高, 高等教育作为一种正常品, 当居民收入能力提高时, 会有更多的居民想要接受高等教育, 从而刺激高等教育需求的增加, 这会带来学费水平上涨的压力。其次, 地区经济发展水平越高的地区, 市场化程度相对较高, 产业结构水平也越高, 对高素质劳动者的需求也越大, 人力资本投资预期收益也越高, 这会刺激人们对作为投资品的高等教育的需求。第三, 在基础教育投资分级办学、分级管理、以县为主的制度设计下, 地区教育发展水平和地区经济发展水平之间高度相关。地区经济越发达的地区, 基础教育普及程度越高, 人们对中等后教育的需求也越强烈。最后, 地区经济发展水平越高, 普通高等教育财政拨款越充足, 居民接受普通高等教育需要支付的学费水平相应较低, 相对价格的变化会使人们更加愿意接受普通高等学校的教育, 而不愿选择没有财政补贴的民办高等教育。
二、分析工具与数据
在前文的讨论中, 我们分析了独立学院专业差异、校际差异和地区差异形成的原因。显然, 这里包含了对独立学院学费三个层次上的影响因素的分析。要分清三个层次上的影响作用、量化其作用程度大小、并探讨各层次间复杂的关系, 需要有特殊的数据结构和新的分析工具。
1. 分析工具。
在社会科学和行为科学研究中一个常见的现象就是数据结构多呈分层嵌套形式, 即低一层的数据嵌套在高一层的结构中[8]。如本文研究的问题, 大学专业学费是嵌套于不同学校, 而学校又是嵌套于不同地区, 从而构成一个三层线性模型。忽视学费研究中嵌套数据结构的特点, 采用常规的回归分析或方差分析处理, 忽视数据独立观察的假定, 在实践中往往容易导致两个方面的不足:一是标准误较小, 导致Ⅰ型错误扩大化;二是不利于对不同层次变量不同作用进行详尽的探讨。分层线性模型通过明确的数据分层, 对个体变量和组别水平变量进行分层综合分析, 有效地克服了上述弊端[8], 同时也能对大学学费差异的形成原因进行更准确的预测和更合理的解释。对本文研究我们采用的是HLM随机截距模型、使用HLM6.0软件进行分析。
2. 数据来源和变量说明。
第一层次数据:独立学院专业学费数据来源于2010年江西省高等教育招生计划上所披露的独立学院学费数据。我们共搜集了来自全国29个省、自治区和直辖市231所独立学院的2756条学费数据。由于无法获得和这些专业学费数据相对应的教育成本数据, 我们在考察专业层面的影响因素时, 选择了专业类别 (文史类、理工类、艺术类和体育类) 来代替。第二层次的数据 (学校层面的数据) , 我们将独立学院的母体高等学校分为两类:即有博士学位授予权的重点高校和没有博士学位授予权的普通高校。第三层次的数据 (地区层面的数据) 主要包括:反映地区经济发展水平的数据, 我们用人均地区生产总值来衡量;反映地区居民人均可支配收入水平的数据, 由城市居民的可支配收入和农村居民的人均纯收入的加权平均数获得 (权数是各省的城镇化比率) , 相关数据由《中国卫生统计年鉴2010》获得;反映地区市场化程度的数据, 我们用国有产值的比例来代替;反映地区产业发展水平的数据, 我们用第三产业从业人数的比例来代替, 经济方面的数据来自中国经济统计年鉴;反映地区高等教育需求状况的指标, 我们用普通高中阶段的毛入学率和普通高等学校在校生占高等学校在校生总数的比例来反映;反映地区公立学校学费水平的数据, 我们用地方普通高等学校生均学杂费水平来代替。教育方面的相关指标来自中国教育事业统计年鉴和中国教育经费统计年鉴。
三、分层线性模型的分析结果
1. 方差分析模型。
方差分析模型又称零模型, 即各层都没有预测变量的模型[9]。方差分析模型虽然简单, 但它却是我们进行分层线性分析的起点和基础。
从表2零模型的分析可以看出, 独立学院学费专业间、学校间、地区间都存在统计学意义上的显著差异 (p<0.000) , 并且学校水平的变异可以解释学费总变异的程度为2114214.1/ (2114214.1+1995574.6+14133535.5) =11.6%。同理可计算出地区差异可解释学费总差异的77.5%, 而专业本身的差异只解释了学费总差异的10.9%。因此, 在专业层面上建立起学校层面因素的分析, 在学校层面上引入地区层面的分析都是十分必要的。
2. 只有层1、层2有预测变量的随机截距模型[10]。
在零模型和完整模型之间, 多层线性分析有许多变化的模型, 随机截距模型就是其中常见的一种变化。该模型的特点是将低层模型的截距设为随机的, 而将自变量的系数设为固定的[10]。表3是我们进行随机截距模型分析的结果。
注:括号内的数字为标准误*p<0.05, **p<0.01, ***p<0.001
从表3模型1中可以看出:独立学院学费依专业类别的不同存在显著的差异, 艺术类专业学费最高, 相比作为对照组的文史类专业要高3189.3元。其次为体育类专业学费, 比文史类专业平均高出1140.1元。理工类和文史类专业学费水平相近, 两者平均相差424.7元。在层1中引入专业类别变量之后, 层1的方差由1995574.6减少到1340328.0, 消减比例达到32.8%。在模型2中, 我们在保持层1模型的基础上, 在层2模型中引入独立学院母体学校声望变量。结果发现在学校层面上, 独立学院学费水平和母体学校的声望显著相关。重点大学举办的独立学院学费水平比非重点大学举办的独立学院平均高出406.2元。在层2模型中引入学校声望变量后, 层2方差消减了18.2%。
3. 完整模型。
在前述估计模型2的基础上, 我们在层3方程中继续引进解释独立学院学费地区差异的因素从而构成完整模型, 模型分析结果见表4。从表4中可以看出导致地区学费差异的主要因素是第三产业从业人数的比例、普通高校学生比例以及人均地区生产总值。在控制层1专业类别、层2学校声望、层3其他变量之后, 第三产业从业人数比例每提高一个百分点将使地区独立学院的学费水平平均提高192.9元。这个结果符合我们的预期。第三产业比例反映的是一个地区产业结构水平, 产业结构水平越高的地区对高素质劳动者的需求越多, 高等教育人力资本投资的预期收益也越有保障, 人们也愿意为高等教育支付较高的学费水平。普通高校学生比例每提高一个百分点将使独立学院学费水平下降173.8元。这说明增加普通高等教育供给, 减少人们对高等教育的超额需求是有利于抑制独立学院学费增长的。人均地区生产总值每增加1000元, 地区独立学院学费水平下降219元, 说明当前独立学院学费水平的负担落后地区高于经济发达地区, 这对经济落后地区独立学院的发展十分不利。表4结果还向我们展示了以下几个方面的信息:一是对普通高等学校学费地区差异有重要影响的人均居民可支配收入, 对独立学院学费水平的影响效果并不显著。这说明独立学院学费水平的决定, 公平因素并非优先考虑的因素。二是普通公立学校的学费水平对独立学院的学费几乎没有影响, 这说明当前独立学院和普通高等学校之间相互替代的作用并不明显。由于独立学院没有财政支持, 学生接受独立学院教育的成本较高, 而就业、继续升学等方面的歧视和自身教育质量的低下使得学生人力资本投资的收益较少。因此, 人们在进行高等教育入学选择时会优先考虑选择普通高等学校就读, 而无论普通高等教育学费的高低, 只有在个人无法达到普通高等学校录取条件的情况下才会选择去独立学院就读。在引入地区层面的解释变量之后, 层3的方差从14133535.5减少到1712357.3, 方差消减比例达到87.9%, 这说明上述变量较好地解释了独立学院地区学费差异的形成。
注:*p<0.05, **p<0.01, ***p<0.001
四、主要结论
第一, 独立学院学费依专业类别、学校声望、地区差异而呈现出显著的差异。其中地区层面的差异解释了学费差异的77.5%, 学校层面的差异解释了学费差异的11.6%, 专业层面的差异解释了学费差异的10.9%。
第二, 母体普通高等学校的学校声望对独立学院学费校际差异的形成具有显著影响。研究结果表明重点大学举办的独立学院学费水平要普遍高于非重点大学举办的独立学院。这或者是由于独立学院获得重点大学师资、管理上的支持确保了其教育质量, 或者是由于重点大学的品牌效应形成的。但都说明普通高等学校的无形资产是有价值的, 在独立学院转型、明晰产权的过程中, 无形资产的价值需要计算在内。
第三, 与普通高等学校学费地区差异主要受教育成本、人均居民可支配收入的影响不同, 独立学院学费地区差异更多地受市场供求变化的影响。在独立学院供给受国家教育规划制约缺乏价格弹性的背景下, 学费的变化更多地体现了地区需求方面的影响。研究结果表明高等教育预期收益越高、高等教育超额需求越大的地区学费水平也相应地较高。
第四, 独立学院学费制定过程中实践的是效率优先, 公平的考虑容易被忽视。从居民学费负担水平来看, 经济落后地区高于经济发达地区。人均居民可支配收入对独立学院学费的影响效果不显著。
第五, 由于高等教育财政投资体制安排、大学生就业歧视等问题的存在使得高等院校学费和收益相分离, 高等教育成为一个层级分化的分割市场。普通高等教育收益高、学费低, 民办高等学校 (包括独立学院) 收益低、学费高, 导致民办高等学校始终处于竞争的不利地位。
参考文献
[1]独立学院很难独立[J/OL].http://magazine.caijing.com.cn/2011-05-08/110712525.html.
[2]张人杰.论大陆公立高校的学费[J].学术研究, 2003 (02) .
[3]袁连生.我国居民高等教育支付能力分析[J].清华大学教育研究, 2001 (03) .
[4]李文利, 魏新.高等教育规模的扩大与合理的学费水平[J].教育发展研究, 2000 (03) .
[5]陈爱娟, 万威武.关于我国高等学校学费标准的实证分析[J].高等教育研究, 2002 (06) .
[6]柴效武.高校学费制度研究[M].北京:经济管理出版社, 2003.
[7]中国大学收费的三个难解之迷[EB/OL].http://finance.sina.com.cn/stock/t/20060110/0835488098.-shtml.
[8]张力为.哪些研究问题需要用分层线性模型回答[J].天津体育学院学报, 2002 (02) .
[9]张雷, 雷雳, 郭伯良.多层线性模型应用[M].北京:教育科学出版社, 2005:13.
多层线性模型分析 篇2
微观接触颗粒岩土非线性力学分析模型
建立了一个基于细观层次数值分析研究具有内部粘连接触特征的岩土材料非线性力学行为的力学模型,给出了细观非线性问题分析,尤其是考虑了粘连接触面的求解技术,在此基础上给出了加载条件下不同内摩擦系数的`宏观介质的非线性力学行为,研究了两种不同细观颗粒排列介质在剪切性能上的差别.研究成果可以作为材料与其他相关科学研究工作的借鉴.
作 者:张洪武 作者单位:大连理工大学,工程力学系、工业装备结构分析国家重点实验室,辽宁,大连,116024 刊 名:岩土工程学报 ISTIC EI PKU英文刊名:CHINESE JOURNAL OF GEOTECHNICAL ENGINEERING 年,卷(期):2002 24(1) 分类号:O241 TU43 TU45 关键词:颗粒材料 粘连本构模型 接触 细观分析一类微分经济模型的非线性动力分析 篇3
引言
国内外有不少学者专家对经济周期模型进行了研究分析,取得了非常丰富的研究成果。1930年法国的Corbeiller提出可以基于非线性动力学的混沌分岔理论对经济系统进行分析。随后,基于非线性动力学理论对经济微分系统进行分析成为学界的共识。1950年,Goodwin通过改进希格斯的消费函数,并结合时滞系统的思想,建立了一个非线性“乘数-加速数”经济周期模型,在该模型中,他通过非线性动力学理论研究了系统的分岔和混沌现象,并发现系统在参数变化时会出现周期极限环等典型的非线性动力学特征。随后,Puu同样以希格斯消费函数为基础建立了一个考虑非线性投资函数的周期经济学动力系统模型,重点对该模型的局部和全局动力学现象进行详细研究。
我国学者也对经济系统的非线性动力学展开了广泛的研究。李伟通过对综合消费函数和投资函数进行综合考虑,并考虑自发性函数项,建立了一类新的经济动力学模型。文献研究时考虑了时滞项对系统的影响,得到了系统发生Hopf分岔的判别式条件,从而研究了系统的周期与非周期特性。
综上所述,包含消费函数、投资函数、时滞等因素的经济学动力系统,往往包含有周期项,导致系统出现了典型的周期倍化分岔、Hopf分岔、极限环等多种非线性响应。在参数变化时,系统随着动力学参数的变化,经济模型动态响应也随之改变。
本文针对一类非线性周期经济动力学系统,建立了考虑多种参数的经济学微分方程,重点研究了基于借贷模式的经济周期的非线性模型,通过非线性动力学理论对系统的微分方程进行求解分析。本文的研究对于宏观经济政策决策有一定的理论指导意义。
基于借贷消费的经济周期模型
借贷消费起源于美国,近年来在中国开始逐渐研究借贷消费对我国经济发展的影响。特别是经济危机的出现,使得越来越多的专家学者开始对借贷消费的优劣更多关注。因此,如何合理利用和控制借贷消费,成为经济学领域研究的热点之一。
式(6)表示的系统中,外部激励项f为国家宏观调控的力度,下面研究系统随该参数变化时系统的非线性动力学特性。当f连续变化时,以f=0.4275为系统的周期倍化分岔临界值。在分岔点附近,系统的轨线的拓扑结果有实质性的差异,焦点由稳定变为不稳定,极限化由无到有,由大到小,且极限环的周期性发生了明显改变从周期2变为周期4,如图2a~b所示。
(一)f=0.4275是系统分岔临界值,可以发现,该系统随着系数的波动出现了模型的周期性波动,而且随着参数改变,系统的周期同样明显改变。这与世界经济发展确实存在周期波动完全一致。
(二)f=0.423左右,系统在该参数没有出现周期解。出现了明显的混沌现象,这样的现象说明,系统在该参数下是混沌的,暗示这样的参数条件下该系统可能爆发经济危机。由于经济危机比如影响到世界经济的正常发展和前进,而且这样的状态具有随机遍历性,因此对任何经济系统都是十分危险的。需要努力去控制,因此,使得中国的经济发展处于混沌状态。因此,要避免经济危机对中国经济发展的危害,保证经济的持续增长,宏观调控的力度一定要保持在0.4230以上。
(三)当f的取值从依次减小时候,极限环的半径也在依次变大。这说明f的值越大,发生一个经济周期所经历的时间越长,即经济发展相对稳定。
(四))f的值越小,发生一个经济周期所经历的时间越长,而且经济发展的波动性较大。
综上,我们可以发现外部干扰f对系统的影响较大,我们可以通过加以较小的外力干扰就可以使经济由混沌状态进入到确定状态。随着f的变化,要想使得经济由混沌状态进入到确定状态,需要施加的外力 也需要不断增加。在现实中,这就说明当宏观调控力度较小时,政府使用比较单一的经济调控手段就可以控制经济的发展方向,而当 较大时,政府需要联合使用较多的经济调控手段才可以控制经济的发展。
结论
本文建立了考虑借贷消费及借贷投资的经济周期模型,对模型的动力学参数进行估计,在此基础上,分析了外部干扰项对该系统的分岔和混沌行为的影响规律,得到参数变化时系统动力学响应的变化和转迁规律,研究发现选择合理的外部控制项,能够对系统的周期与非周期性产生十分明显的作用,达到控制借贷消费率及借贷投资率的目的,从而对我国的解决发展起到明显的促进作用。
多层线性模型分析 篇4
网上购物的便利性和低成本等优点, 促使网上购物的网民越来越多, 网购已成为人们一种新的生活方式。影响产品成交量的因素不仅是多方面的而且是多层次的, 如果我们能清晰地了解到哪些因素对产品的成交量是重要的, 哪些是次要的, 商家就可以采取相应措施, 制定相应策略, 提高产品的产品成交量。
二、模型选取与假设
1. 模型构建
影响成交量的因素有很多, 本文认为成交量的重要影响因素有产品水平上的价格, 信息描述, 默认排名, 以及商家水平上的卖家信用度和卖家好评率。据此本文选取了四种多层线性模型对影响成交量的因素进行分析, 这四种研究模型是零模型, 随机系数模型, 截距预测模型和斜率预测模型。
(1) 零模型
在多层线性模型的研究分析中, 本研究推论产品水平和商家水平的变量会对产品的成交量产生直接效果的影响。为了验证本研究假说, 研究将变量的变异成分分为组内变异和组间变异两部分, 且组间变异必须不为0。用来确认各产品的成交量是否会因为总体层次的不同而有所差异。
零模型的估计具有以下目的:考验各组之间是否有差异, 估计总变异中有多少变异是由组间的变异所造成、以及提供初步信息, 以作为进一步分析其他模型时的比较基础。在本模型研究, 主要弄清以下问题:
(1) 不同商家在成交量上是否有显著差异?
(2) 成交量的总变异中有多少的百分比是由于商家间的变异所造成的?
(2) 随机系数模型
各个商家的因素对成交量的影响力是不同的, 故定义随机系数模型, 以确定水平1的那些回归系数在水平2上是随机变异的。用产品价格、信息描述和默认排名作为自变量, 产品成交量作为因变量建立的不包括第二层预测变量的二层线性随机系数回归模型。主要弄清一下问题:
(1) 54个商家所形成的54条回归方程式的平均截距 (各商家平均成交量的平均值) 以及平均斜率 (价格, 信息描述和默认排名对成交量影响的平均值) 为多少。
(2) 上述54条回归方程式中, 彼此的截距 (各商家平均成交量) 和斜率 (价格, 信息描述, 默认排名对成交量的影响) 是否有差异。
(3) 截距预测模型
该模型检测截距项的存在是否可由第二层次上的变量 (即卖家信用度和卖家好评率) 加以解释, 希望弄清下面的问题:
(1) 卖家信用度和卖家好评率是否会影响产品成交量?
(2) 除去卖家信用度和卖家好评率所能解释的变异量之后, 成交量是否仍然会有显著的差异?
(4) 斜率预测模型
由以上建立的随机系数回归模型, 可知道不同商家的斜率是否存在显著差异。本研究进一步分析斜率的变异成分是否可由第二层 (商家水平) 的变量所解释。希望弄清的问题:
(1) 卖家信用和卖家好评率是否可以解释第一层次斜率的变异成分?
(2) 如果问题 (1) 成立, 则解释量有多少?
3. 研究假设
本文提出如下假设:
(1) 不同商家之间的成交量具有明显的差异。
(2) 价格与成交量成负相关, 价格越低, 成交量越大。
(3) 信息描述与成交量的关系式正相关, 信息描述越详细, 成交量越大。
(4) 默认排名与成交量成正相关的关系, 默认排名得分越高, 成交量越大。
(5) 卖家信用度影响产品成交量。加强信息描述与成交量的正向关系, 对价格和成交量的关系也产生影响。
(6) 卖家好评率对产品的成交量产生正向影响, 加强价格和成交量的负相关系, 加强产品信息和成交量的正向关系。
三、数据与数据处理
1. 数据收集
(1) 样本
本研究的研究对象是淘宝网上加入消费者保障计划的商家与其产品。产品和商家的相关属性有很多, 譬如产品价格, 产品收藏人气, 产品浏览量, 产品默认排名, 产品信息描述, 产品数量, 卖家信用度, 卖家好评率, 买家信用度, 买家好评率等。本研究探讨的是成交量的影响因素, 收集数据的时候挑选了消费者购物最可能考虑的产品价格, 产品信息描述, 产品默认排名, 卖家信用度和卖家好评率五个因素。收集数据时, 商家选取按商家等级进行。淘宝网商家等级分为红心, 钻石, 皇冠, 金冠四种等级, 其中每个等级又分为5个小等级, 金冠等级比皇冠高, 皇冠等级比钻石高, 钻石等级比红心高, 而同一等级 (譬如同为金冠等级) , 5级又比1级高。等级越高, 卖家信用度越高。等级划分参考表1:
样本1:为了减少分析时的误差, 数据收集时, 选取的商家剔除了最低级别的“红心”等级和最高级别的“金冠”等级, 在“钻石”和“皇冠”等级中选取。其中1钻商家5个, 2钻1个, 4钻商家9个, 1皇冠商家15个, 3皇冠商家7个, 4皇冠3个, 5皇冠商家14个, 合计商家54个。
样本2:产品的选取按网上商品类型进行。网络商品类型分为搜索型、体验I型 (非耐用品, 如服饰等) 、体验II型 (耐用品, 如手机等) 、信任型4大类。
在样本1所选取的商家中, 选取合适的商品。搜索型产品61条数据, 体验I型的产品171条数据, 体验II型的产品101条数据, 信任型的产品138条数据。
手工收集的部分原始数据如下:
(2) 变量的初步筛选
参考以往关于影响消费者网上购物因素的结论, 初步确定了影响产品成交量的产品水平变量和商家水平变量, 如下:
产品水平变量:产品价格, 产品信息描述, 产品默认排名
商家水平变量:卖家信用, 卖家好评率
产品成交量、产品价格、产品浏览量、卖家信用、卖家好评率的数据可以通过软件在淘宝网上直接抓取, 但产品信息描述无法直接获取数据, 所以本研究设计了产品信息描述的评分标准, 具体情况如下:
统计完后, 将产品的功能说明, 使用说明, 常见问题处理, 照片说明, 其他信息的得分相加, 就是该产品的信息描述得分。
产品的默认排名是按百分制根据每个产品的默认排名评分。默认排名第一, 则该产品默认排名得分为100, 默认排名第二, 则该产品默认排名得分为99, 如此类推, 默认排名第100位则得分为0分。
(3) 原始数据初步处理
本研究采用采用手工方式进行原始数据的收集, 用excel表储存数据, 用SPSS对数据进行标准化。在本研究中, 成交量, 价格, 好评率三个因素采用的是网站收集的原始数据, 信息描述和默认排名是根据一定的评分指标收集的, 卖家信用在进行分析前用SPSS进行了T分数处理。本研究运用SPSS160和HLM6软件进行所有的统计分析。
2. 数据处理及模型优化分析
(1) 样本描述性信息
(2) 零模型的数据处理
(3) 随机系数回归模型数据处理
从表9可以看出, 价格的相关系数为β=0.006732, P=0.816>0.05, 默认排名的相关系数为β=0.240224, P=0.153>0.05。
在该模型中, 价格和默认排名对成交量的影响不显著。在此基础上调整随机系数回归模型, 对随机系数回归模型进行优化, 将默认排名的随机部分固定为常数, 优化后的模型如下:
该模型的最大特点是默认排名的随机部分固定为定值, 即是说默认排名在不同商家水平上没有明显的差异。
优化后的模型运行结果如表10:
(4) 截距预测模型数据处理
截距预测模型研究的主要问题是卖家信用度和卖家好评率是否会影响产品成交量, 除去卖家信用度和卖家好评率所能解释的变异量之后, 成交量是否仍然会有显著的差异。该模型有模式1和模式2两种模型, 模式1先考虑卖家信用度是否会影响产品的成交量, 模式2在模式1的基础上加进变量卖家好评率, 进行进一步的探讨。模式1的处理结果如表11:
(5) 斜率预测模型
斜率预测模型模式1的结果运行结果见表13:
从表13可以看出, 卖家信用度对价格和成交量的关系影响不显著 (β=0.000580, p=0.800) , 并减弱价格和成交量的负向关联程度。即卖家好评率对价格和成交量的影响也不显著 (β=-0.044278, p=0.246) 。这样的结果显然是不符合实际的, 优化斜率预测模型模式1, 得到优化后的模型。
优化后的斜率预测模型模式1:
优化后的斜率预测模型模式1的运行结果如表14:
从表14可以看出, 优化后的模型, 卖家好评率对价格和成交量的负向相关关系产生显著的影响 (β=-0.038217, p=0.008) 。卖家好评率系数的符号与价格系数的符号相同, 表示卖家好评率加强价格和成交量的关联程度。
在优化后斜率预测模型模式的基础上, 优化斜率预测模型模式2, 得到以下模型。
优化后的斜率预测模型模式2:
优化后的斜率预测模型模式2的运行结果如表15。
从表15, 可以看出卖家信用度对信息描述和成交量的关系产生显著影响 (β=0.120227, p=0.023) , 加强信息描述和成交量的正向关联程度。卖家好评率对信息描述和成交量的关系也产生显著的影响 (β=0.693421, p=0.015) 。卖家好评率系数符号为正, 与信息描述的系数符号相同, 加强信息描述和成交量的正向关联程度。
在优化后的斜率预测模型模式2的基础上, 优化斜率预测模型模式3。在第一层加入默认排名变量时, 要注意优化后的随机系数回归模型中, 验证了默认排名在不同商家之间没有显著的差异。所以在优化后的斜率预测模型模式3将默认排名的系数设定为固定值。
优化后的斜率预测模型模式3:
优化后的斜率预测模型模式3的运行结果见表16。
四、结论
1. 零模型结论分析
从表8中可看出最大概似估计的结果中, 各商家成交量平均数估计值是20.144199, 估计标准误是5.801820。商家间的方差分量达0.01的显著水平, 代表各商家在成交量上有显著的差异。由商家间变异 (τ00) 与产品水平上的变异 (σ2) 可以算出内在组别相关系数
代表成交量的总变异中, 有14.9203%是由商家所造成的。另外, 各个商家的样本平均数的信度计算公式为:
整体信度指标, 为各个商家样本平均数的信度估计值的平均数:
本研究共有411个样本, 根据公式 (5.2) 和 (5.3) , 计算出, 表示以各个商家的样本平均数估计值作为真实商家平均数的指标时, 可信度不高。
2. 随机系数模型结论分析
从表10可以看出成交量的总平均值为19.595359, 标准误为5.522514, 与表4.11中的20.144199相当接近。产品价格是一个显著的负向因子, 对成交量有显著的负向影响 (β=-0.044756, P=0.003) 。在保持其他变量恒定的情况下, 价格每增加一个单位, 成交量就平均减少0.044756个单位。这意味着价格是有效预测成交量的变量。信息描述是一个显著的正向预期因子, 对成交量有正向影响 (β=1.349501, P=0.04) , 在其他变量恒定的情况下, 信息描述每增加一个单位, 成交量就平均增加1.349501个单位。从表中可以看出, 默认排名对成交量的影响不显著 (β=0.301158, P=0.112>0.05) 。价格和信息描述能解释成交量变异的百分比= (5588.36120-4051.28044) /5588.36120=27.51%。
此外, 在随机效果中, 价格的, 达0.01显著的水准, 表示各商家间价格对成交量的影响有显著的不同。信息描述的, 达0.01显著水准, 表示各商家间信息描述对成交量的影响有显著的差异。
3. 截距预测模型结论分析
从表11可以看出, 卖家信用度对成交量有显著的影响 (T=2.239, P=0.029) , 卖家信用度所能解释的成交量变异的百分比=
然而, 当去掉卖家信用度所能解释的变异量29.81%之后, 各商家的成交量仍有显著差异 (τ00=687.86646, df=52, X2=95.74230, P<0.01) 。此表示成交量上的差异, 尚待其他变量来解释。此时, 。即卖家信用度对成交量总体变异的解释量为10.96%。
从表12可以看出, 卖家好评率对成交量有显著的影响 (T=2.230, P=0.030) , 卖家好评率和卖家信用度所能解释的成交量变异的百分比=
然而, 当去掉卖家信用度和好评率所能解释的变异量之后, 各商家的成交量仍有显著差异 (τ00=690.94054, df=52, X2=93.57749, P<0.01) 。此表示成交量上的差异, 尚待其他变量来解释。此时, 。即卖家信用度和卖家好评率对成交量总体变异的解释量为10.98%。
在这模型中, 考虑了卖家好评率对成交量的影响, 解释量由原来的10.96%变成现在的10.98%, 说明卖家好评率确实对成交量产生影响。
4. 斜率预测模型
从表16可以看出卖家信用度会对信息描述与成交量的正向关系产生显著的影响 (β=0.109876, p=0.029) 。在其他变量恒定的情况下, 卖家信用度每增加一个单位, 信息描述对成交量的影响 (斜率) 就增加0.109876个单位。卖家好评率加强价格和成交量的关联强度, 在其他变量恒定的情况下, 卖家信用度每减少一个单位, 价格对成交量的影响 (斜率) 就减少0.053333个单位。卖家好评率加强信息描述与成交量的正向关联, 在其他变量恒定的情况下, 卖家信用度每增加一个单位, 信息描述对成交量的影响 (斜率) 就增加0.599006个单位。
从表10和表16中提取数据, 可以计算出商家变量所解释的方差成分和比例, 详细见表17。
表17显示了商家水平上的变量对不同变异所解释的方差比例, 价格和成交量的关系在不同商家之间的变异有59.8361%被卖家信用度变量解释;信息描述和成交量的关系在不同商家之间的变异有18.7268%被卖家信用度和卖家好评率解释。
参考文献
[1]中国网络购物行业发展报告简版2008-2009.
[2]刘红云, 孟庆茂.教育和心理研究中的多层线性模型.心理科学进展.2002 (10) 2:213-219
[3]林丰勋.心理学纵向研究方法的新进展.济南大学学报.2005, 15 (5) :492-431
[4]张雷, 雷雳, 郭伯良, 多层线性模型的原理及应用, 教育科学出版社, 2003
[5]吴佩勋, 黄永哲, 电子商务网站客户购买意愿影响因素研究———以中国电信电子商务网站为例, 中山大学学报 (社会科学版) , NO.32oo6, Vo1.46, General No.201
多层线性模型分析 篇5
关键词:多元线性回归模型;影响因素分析;统计分析;R软件
1问题的背景与分析
美国作为世界头号强国,在科技、文化、经济等各方面的发展都具有较强的竞争优势,然而其居高不下的谋杀率却在一定程度上威胁着美国人民及世界人民的安全。本文即以美国50个州的六项指标数据,包括谋杀率、人口、文盲率、平均收入、结霜天数、地理面积为研究对象,探究谋杀率的主要影响因素。数据来源为R软件自带数据包state.x77。值得强调的是,由于搜集近期数据具有一定难度,尽管本文所用数据的年限已久,不具有时效性,但是所用的研究方法却具有普遍性与可靠性,可广泛应用于不同时期的数据统计分析,不受时间年限的约束。
2模型的建立与求解
2.1多元线性回归模型的理论
多元线性回归主要是研究一个因变量与多个自变量之间的线性相关关系,模型的形式为:
其中n为观测的数目,k为预测变量的数目。建立多元线性回归模型的目标是通过减少响应变量的真实值与预测值的差值来获得模型参数。具体而言,即使得残差平方和最小:
同时,随机误差必须满足以下四个条件,多元线性回归方程才有意义:
①正态性,即随机误差必须是符合正态分布的随机变量;
②无偏性,即随机误差的期望值为0;
③同方差性,即所有随机误差的方差都相等;
④独立性,即所有随机误差都相互独立。
2.2模型的建立与求解
2.2.1变量的选择
运用向后逐步回归方法对五个自变量进行筛选,依据的准则是AIC准则。运行结果如下:
开始时模型包含五个自变量,然后每一步提供了删除一个自变量后模型的AIC值。经过三步后,自变量结霜天数、平均收入、地理面积依次被删除,其间AIC持续下降,直到达到92.28后,选择程序终止。因此,自变量人口和文盲率为最终选定的回归自变量。
2.2.2多元线性回归模型的建立
由上一步的结果,将谋杀率作为因变量,以人口和文盲率为自变量拟合回归方程,得到回归方程:,并进行显著性检验,结果如下:
从表中可以看出,在α=0.05的水平下,F统计量的估计值为30.75,对应的P值为2.89e-09,说明回归方程是显著的,可决系数R2=0.8668,修正的可决系数R2=0.8484,说明方程的拟合效果较好;同时从回归系数的检验表中可以看出,自变量x1、x2的回归系数显著不为0,表明当控制其他变量不变时,Population、Illiteracy与Murder的线性相关关系显著,即建立的多元线性回归方程
具有统计学意义。
2.2.3回归诊断
2.2.3.1正态假设检验
首先通过残差分析对模型的正态假设进行检验,绘制出相应的学生化残差的Q-Q图和分布图:
由图可以看出,出了一个明显的离群点Nevada,误差很好地服从了正态分布,这表明正态性假设符合的很好。
2.2.3.2复共线性检验
复共线性可用统计量VIF(方差膨胀因子)进行检测。一般原则下,就表明存在复共线性问题。用R软件中的vif()函数计算各自变量的VIF值,结果如下:
由表中可以看出,所有自变量的均小于2,故模型中不存在复共线性问题。
3综合评价
由以上建模过程和结果可以看出,影响美国各州谋杀率的主要因素为人口和文盲率。通过分析可知,在人口相对较多的州部,发生谋杀案件的可能性较大,同时,犯罪率随文盲率的增加而增加,人民受教育的水平越低,则犯罪的可能性越大。除此之外,通过查阅相关的资料可得,美国的枪支合法制度也是造成美国谋杀率居高不下的重要原因之一。
参考文献:
[1][美]Robert I.Kabacoff,R语言实践,人民邮电出版社,2014版.
[2]张鹏辉,孙晚华,多元线性回归在影响分析中的应用,北方交通大学,2000.
[3]董跃娴,影响高校教师教学质量的多元线性回归分析与思考,北京:北京农学院,2009.