主成分分析模型

关键词: 分析模型 竞争力 引言 产业

主成分分析模型(精选十篇)

主成分分析模型 篇1

产业竞争力, 指某国或某一地区的某个特定产业相对于他国或地区其他产业在生产效率、满足市场需求、持续获利等方面所体现的竞争能力。竞争力实质上是一个比较的概念, 因此, 产业竞争力内涵涉及两个基本方面的问题:一个是比较的内容, 一个是比较的范围。具体来说:产业竞争力比较的内容就是产业竞争优势, 而产业竞争优势最终体现于产品、企业及产业的市场实现能力。因此, 产业竞争力的实质是产业的比较生产力。所谓比较生产力, 是指企业或产业能够以比其他竞争对手更有效的方式持续生产出消费者愿意接受的产品, 并由此获得满意的经济收益的综合能力。为解决产业竞争力的评估, 重点要确定被评估产业的要素, 在确定要素的情况下需要建立一个合理的分析评价模型, 最后是收集各个受比较地区产业要素的数据。其中以数据模型的建立最为关键, 本文着重研究基于主成分分析评价模型的设计与实现。

2、主成分分析基本思想和评价模型

2.1 基本思想

主成分分析也称主分量分析, 旨在利用降维的思想, 把多指标转化为少数几个综合指标。在实证问题研究中, 为了全面、系统地分析问题, 我们必须考虑众多影响因素。这些涉及的因素一般称为指标, 在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息, 并且指标之间彼此有一定的相关性, 因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时, 变量太多会增加计算量和增加分析问题的复杂性, 人们希望在进行定量分析的过程中, 涉及的变量较少, 得到的信息量较多。主成分分析正是适应这一要求产生的, 是解决这类问题的理想工具。

2.2 评价模型

设有n个待评价的行业, 竞争力评价指标数为p个, 样本数据矩阵为:

为了消除不同指标间的量纲影响和正、逆指标的影响, 将样本数据按下式标准化, 得标准化后的矩阵为, , 其中。

主成分分析就是设法将原来众多具有一定相关性的p个指标, 重新组合成一组新的相互无关的综合指标来代替原来指标, 即将分散指标信息集中化, 以尽可能少的指标来表示原来指标的全部信息。由此, 用标准化后的矩阵的p个向量作线性组合:

则F1, F2, …, Fp, 就为p个主成分。我们希望这些主成分中, 越在前面的包含原有指标的信息越多, 而包含信息的多少一般用方差来表示, 所以主成分F1, F2, …, Fp需要满足以下条件:

1) Fi与Fj (i≠j, i, j=1, 2, …, p) 不相关;

2) F1是X1, X2, …, Xp的一切线性组合中方差中最大的, F2是与F1不相关的X1, X2, …, Xp的一切线性组合中方差中最大的, ……, Fp是F1, F2, …, Fp-1都不相关的X1, X2, …, Xp的一切线性组合中方差中最大的。

可以证明, 满足上述条件的主成分F1, F2, …, Fp线性组合中的系数向量 (a1i, a2i, …api) , i=1, 2, …, p恰好是Y的协方差矩阵∑的特征值对应的特征向量。当协方差矩阵∑未知时, 可用其估计值S (样本协方差矩阵) 来代替。

而相关系数矩阵:R=(rij)其中

由于Y1, Y2, …, Yp已标准化, 所以有

计算时为简单起见, 不妨取R=YTY, 因为这时的R与只相差一个系数, 显然YTY与的特征根相差n倍, 但它们的特征向量不变, 并不影响求主成分。

设相关系数矩阵R的p特征值为λ1, λ2, …, λp, 称第一主成分的贡献率为, 它是第一主成分的方差在全部方差中的比值, 这个比值越大, 表明第一主成分综合原指标X1, X2, …, Xp信息的能力越强。前两个主成分的累计贡献率为, 前k个主成分的累计贡献率为。如果前k个主成分的累计贡献率达到85%, 表明取前k个主成分基本包含了全部测评指标所具有的信息, 这样既减少了变量的个数, 又便于对实际问题进行分析和研究。

最后, 将累计贡献率达到85%的k个主成分F1, F2, …, Fk做线性组合, 并以每个主成分Fi的方差贡献率α1作为权数构造一个综合评价函数:

v=α1F1+α2F2+…+αkFk

以v为评估指数, 依据对每个评价对象计算出的v值大小进行综合排序。

3、产业竞争力的主成分分析实证评价

依据上述思想和方法, 选取销售值、增加值、利润总额、出口值、资产总额、负债合计、权益合计、实收资本、净资产利润率、总资产利润率、资本收益率、资产负债率、全员劳动生产率、出口收入占销售收入的比重等14个指标作为评价指标体系, 并以宁波部分工业行业某年数据 (如表3-1所示) 为实证研究对象。

通过开发的模型软件对原始数据标准化后的数据矩阵进行相关分析, 计算出特征根和累计贡献率表3-2。

由表3-2看出:当在特征根和累计贡献率表中, 因子列中表示因子的序号;特征根列中列出的是各个主成分的特征值, 特征根可以看成主成分影响力度的指标。表中列出了所有的主成分, 它们按照特征根从大到小的次序排列。第一个主成分的特征根11.2730, 它解释了信息量的86.71%。第二个主成分的特征根为1.3464, 它解释了信息量的8.42%。依次类推, 得到各个主成分的特征根以及解释信息量的百分比。观察特征根列, 我们发现只有前二个主成分的特征根大于1, 按照Kaise准则只保留特征值大于1的因子, 只需要提取出前二个主成分即可。观察累计贡献率, 我们发现前二个主成分的累计贡献率为95.13%, 满足了累计贡献率大于90%的要求。累计贡献率列中的各个值表示各个因子的特征值占总方差的累计百分比。

最后计算出综合力得分表3-3

由表3-3排序结果可以看出, 在分析的10个行业中, 石油加工、炼焦等加工业、纺织服装、鞋、帽制造业、化学原料及化学制品制造业生相对较强, 其生存能力、适应能力、发展能力好于其他行业, 是宁波发展的支柱产业。

4、结论

我们在刻画某个事物时, 经常会用到多个变量, 但是由于这些变量之间往往具有相关性, 会给研究的问题带来一些不便, 同时也影响了结论的真实可靠性, 主成分分析法可以从几个变量中找出主要的变量, 同时能尽可能的避免变量的重复, 因此使研究问题变的简便和真实, 比层次分析法等更具有科学性和可操作性。

参考文献

[1]余乐安, 汪寿阳, 黎建强.基于主成分分析的社会和谐发展综合评价模型及实证分析[C].和谐发展与系统工程——中国系统工程学会第十五届年会论文集, 2008.

[2]周亚部.产业竞争力:理论创新与上海实践[M].上海:上海社会科学院, 2007.

[3]管于华.统计学[M].北京:北京高等教育出版社, 2005.

主成分分析模型 篇2

运用主成分回归分析法,将影响公路客运量的众多相关因素简化为少数不相关因素,消除因变量过多导致的多重共线性,可构建公路客运量预测模型.实例证明,该模型具有较高的`精度,适合影响因素指标发展较为明确的客运量短期预测.

作 者:李晓刚 贾元华 敖谷昌 LI Xiao-gang JIA Yuan-hua AO Gu-chang 作者单位:李晓刚,贾元华,LI Xiao-gang,JIA Yuan-hua(北京交通大学交通运输学院,北京,100044)

敖谷昌,AO Gu-chang(北京交通大学交通运输学院,北京,100044;重庆交通大学交通运输学院,重庆,400074)

主成分分析模型 篇3

关键词:核主成分分析;综合素质;评价

中图分类号:G647 文献标识码:A 文章编号:1000-8136(2009)27-0005-02

教师综合素质评价是教育管理部门对教师进行全面公正客观考核的有效手段,在各级各类教育单位已经广为实施。为了加强学校教学工作管理,促进教师评价改革,适应新时代学校教育教学管理工作的需要,实现学校教育教学工作的规范化和科学化,提高教育教学质量,激励先进,鞭策后进,促进教师队伍素质的全面提高,使教育教学工作又好又快发展,建立一个比较公正客观的评价模型是非常必要的。目前用来进行教师综合素质评价的数学模型主要有:层次分析法[1]、模糊综合评判法[2]、主成分分析法[3]等。本文建立了教师综合素质评价的核主成分分析(Kernel Principal Component Analysis,简称KPCA)模型,为教师综合素质评价提供了一种新的方法。

1核主成分分析

核主成分分析是在确保系统原有数据信息量丢失最小的原则下,在各个变量相关关系研究的基础上,将多个变量的信息压缩为几个能反映原问题特征的综合变量指标,并据此特征信息指标对系统进行综合分析,可以有效地来处理变量间的非线性关系,为解决多指标的综合评价提供了一种很好的手段。[4]其基本思想是:通过一个非线性映射,将输入数据映射到一个特征空间,再在特征空间上进行线性主成分分析。

设有l为变量x1,x2,…,xl的n组观测数据:(xil,xi2,…,xil),i=1,2,…n,核主成分分析通过一个非线性函数φ(•)将样本x1,x2,…,xl映射到特征空间中。不妨假设特征空间中的样本Ф(x1),Ф(x2),…,Ф(xl)已标准化。为了在特征

空间中做主成分分析,计算协方差矩阵 ,求

出C的特征值λ≥0及相应的特征向量V∈F{0},满足λV=CV。由于特征值对应的非零特征向量都位于数据Ф(x1),Ф(x2),…,Ф(xl)的张集上,即V∈span{Ф(x1),…,Ф(xl)},所以存在一组系数α1,α 2,…,α l使得:

(1)

因此λV=CV等价于λ(Ф(xk)•V)=(Ф(xk)•CV),k=1,2,…,l。

由此得到:

,

k=1,2,…,l(2)

通过定义一个l×l的核矩阵 ,(2)式可写为Ka=lλa(3)

所以确定特征向量V而求取系数αi(i=1,…,M)的问题就仅依赖于特征值分解核矩阵K。

在F中归一化特征向量V,等价于λk(αk•αk)=1;而为

了放宽 的假设,这只需将核矩阵替换成 =K-IM K

-KIM+IM KIM,其中 。

最后提取主成分,采用下式计算Ф(x)在特征向量Vk上的投影

(4)

常用的核函数主要有径向基核函数K(x,y)=exp(-||x-y||2/2σ2)、多项式核函数K(x,y)=(x•y)d、Sigmoid核函数K(x,y)=tanh(γ(x•y)+θ)等,其中σ、d、γ、θ均为核参数。

核主成分分析的综合评价函数[5]为:

(5)

其中,r为提取的核主成分个数,ωk为第k个核主成分的贡献率。

核主成分分析的基本步骤[4]是:

step 1 将原始数据X标准化,记为X*;

step 2 将标准化后的数据矩阵X*进行核变换,记变换后的核矩阵为K;

step 3 按下式求矩阵K*:

K*=K-AK-KA+AKA

step 4 求矩阵K*/l的特征值λi和特征向量vi,i=1,2,…,l;

step 5 求出累计贡献率超过85 %的前n个主成分;

step 6 利用n个主成分对每个样本求出评价函数,进行综合评价。

2基于核主成分分析的教学质量评价

2.1样本数据

要对20名教师的业务素质进行综合评价。各位教师的综合素质评价指标值[3]如表1所示,其中,教学计划与备课X1,课堂讲授X2,考试成绩X3,辅导答疑教学改革X4,论文论著X5,科研项目X6,教书育人X7,获奖情况X8。

2.2多重共线性诊断

度量多重共线性严重程度的一个重要指标是方阵XTX的条

件数,即: 。

资助项目:湖北省教育厅科研项目(编号:Q20091809);武汉工业学院校项目(编号:08Y30)。

其中λmax(XTX),λmin(XTX)表示方阵XTX的最大、最小特征值。一般地,若k<100,则认为多重共线性程度很小;若100≤k≤1 000,则认为存在中等程度或较强的多重共线性;若k>1 000,则认为存在严重的多重共线性。

经计算,本问题的矩阵条件数k=11 063>1 000,可认为变量x1,x2,…,x8之间存在严重的多重共线性,可以利用核主成分对数据降维。

表1教师综合素质评价指标

教师

编号 教学情况 科研学术 工作态度

X1X2X3X4X5X6X7X8

11 3942 505758 14417128436

22 8491 258804 83915151 2348

31 0921 250754 72117166973

48321 387904 134181741910

52 7932 397804 91116141 8407

62 0142 334864 14516141 2404

72 4625 343879 28019131 6423

85 1551 925755 94321172 0266

93 5242 249766 61916139162

102 1602 320805 85715144334

115 0021 527905 14517142 2075

123 0021 034784 34416151 3677

135 3812 699768 25018161 3961

141 6061 314805 10518165542

153641 815855 3401311646

16630942744 47516143242

171 2061 261855 14918187165

181 0001 208724 39619176001

191651 445865 76314121059

208341 469705 34819174281

2.3利用核主成分分析提取变量的主成分

对样本数据进行核主成分分析,为便于比较,同时进行主成分分析。核主成分分析的核函数选择多项式核函数,即核函数为K(x,y)=(x•y)d。经试验,相应的核参数d=4。

表2KPCA和PCA前4个特征值及贡献率(%)

No特征值贡献率 / %累计贡献率 / %

PCAKPCAPCAKPCAPCAKPCA

12.6 8772.56e+3233.5 95880.03433.5 95880.034

22.1 9095.47e+3127.3 85917.0 76360.9 81697.1 102

31.5 2516.95e+3019.0 6432.170080.0 45999.2 802

40.7 9511.97e+309.9 3890.613589.9 84899.8 937

从表2可以看出,采用PCA的前4个主成分累积贡献率为89.9848 %,而采用KPCA方法前2个主成分累积贡献率就已经达到97.1102 %,因此KPCA获得了比PCA更好的降维效果。

由KPCA求出每位教师的综合得分以及排序如表3所示。为便于对比,表3同时给出了PCA综合得分和PCA综合排名

表3教师综合素质评价排名

教师

编号核主成分F1核主成分F2PCA

综合

得分PCA

综合排名KPCA

综合

得分KPCA

综合

排名

分值排

序分值排

1-1.7 44818-0.3 7039-0.0 90911-1.4 59718

21.1 30912-0.3 05970.6 70940.8 52912

31.5 3054-0.7 72514-0.2 205131.0934

41.7 0331-0.8 348170.6 76131.2 2061

50.7 70913-0.1 82360.3 70970.5 85913

61.3 9095-0.6 197110.4 09961.0 0746

7-8.6 978201.0 7274-0.8 70217-6.77820

8-1.0 866171.9 5642-0.9 77518-0.5 35516

9-0.862160.6 7975-0.2 41714-0.5 73817

100.5 19614-0.3 997100.2 33190.3 47614

11-0.0 032151.1 93330.3 46880.2 01215

121.3 4358-0.3 69580.4 43751.0 1215

13-6.0 358194.6 1161-1.1 70220-4.0 43219

141.3 14210-0.6 59512-0.3 587150.9 3929

151.3 7976-0.8 983191.2 88120.9 5088

161.6 9592-0.8 466180.0 703101.2 1272

171.3 6577-0.7 27713-0.1 165120.9 6877

181.6393-0.8 02716-0.8 223161.1 7473

191.3 10711-0.9 215201.35410.8 91611

201.3 3569-0.8 02615-0.9 952190.9 31910

3结束语

对教师综合素质评价的原始数据,运用矩阵条件数对各个变量进行了多重共线性诊断。用核主成分分析法建立了教师综合素质评价模型,消除了测评指标间相互关系影响,提高了降维效果。与线性主成分的结果对比表明,核主成分分析不仅能够反应指标间的非线性关系,而且能够用更少的成分更多地反映原始指标的信息,从而减少了指标选择的工作量。

参考文献

1 刘 平.高校教师综合素质评价研究[J].管理工程学报,2002.16(10):115~118

2 唐晓静、张圣梅、徐小君.教师综合素质评价模型的研究[J].长春理工大学学报,2004.27(1):113~115

3 谢爱荣、田 盈.加权主成分分析法在教师素质考评中的应用[J].中国教育导刊,2007.6:49~51

4 李冬琴、王丽铮.核主成分分析方法在船型方案综合评价中的应用[J].船海工程,2007.36(2):1~3

5 Bernhard Scholkopf, Alexander Smola, Klaus-Robert Muller. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998.10(5):1299~1319

Evaluation Model for Teachers’ Comprehensive Qualities

Based on Kernel Principal Component Analysis

Chen Gaobo

Abstract:In this paper, the matrix condition number is used to diagnosis the multi-collinearity among the index for evaluating Teachers’ Comprehensive Qualities, and a kernel principal component analysis(KPCA)evaluation model is build. Compared with principal component analysis(PCA), the results from KPCA show that KPCA can extract less components which reflect the original index information.

基于主成分分析法的特征价格模型 篇4

1.1 特征价格模型

特征价格模型 (hedonic price model, HPM) , 是一种国外处理异质产品差异特征与产品价格间关系经常采用的模型。美国学者Lancaster (1966) 提出的消费者理论与美国经济学家Rosen (1974) 提出的供求均衡模型构成了HPM的理论基础[1]。20世纪80年代以来, 很多学者将HPM应用于房地产市场的研究, 分析了房地产的区位特征、邻里特征和房地产本身结构特征等因素与房地产价格之间的关系。如Robert Cervero (1994) 就专题研究城市轨道交通对周边房地产价值的影响程度[2]。

HPM的基本思路是, 消费者愿意为一件商品支付的价格取决于他能够从商品的各种属性中获得何种程度的享受。Hedonic定价指的是在竞争性市场的均衡条件下, 商品购买者所支付的价格应当补偿其各种特征所能带来的舒适度。假设所有家庭的偏好和收入水平类似, 那么这个市场中所有某商品的价格应当是这些特征值的一个函数, 即p=h (X1, X2, …, Xn) , 式中p为该商品的价格;X1, X2, …, Xn是商品的各个特征。这就是hedonic定价模型[3]。特征函数有线性方程、半对数方程、双对数方程、对数方程和其它非线性方程形式。

若将hedonic定价模型用于房地产定价, 那么住宅特征xi的隐含价格定义为:在其他因素不变的情况下, 特征xi每增加一个单位所导致的价格p的改变, 即:

1.2 特征价格模型在房地产领域的应用

房地产产品由于其空间固定性而导致其异质性非常明显, 产品之间各种构成使用价值的特征也存在明显的差异。因此, 特征价格模型在房地产领域得到了广泛的应用。体现在:

(1) 编制各种房地产价格指数;

(2) 对传统城市经济学模型进行改进;

(3) 推断特征的隐含价格和估计特征的市场需求;

(4) 对房地产、非市场物品的价值进行评估;

(5) 政府部门用来计算不同政策方案的成本和效益。

1.3 模型应用中存在的问题与解决方法

本文试图利用特征价格模型, 确定大连轻轨3号线各站点周围2.5km范围内, 新建住宅项目的销售均价, 然后开发商可以据此确定每栋楼的均价, 最后根据各套住宅的特征属性调整销售价格。但是在应用中存在如下问题:

(1) 本文以住宅项目整体为样本对象, 影响定价的特征属性选取整体特征、环境特征等;

(2) 样本数据局限在轻轨站点2.5km范围内, 并且以住宅项目整体为单位, 因此样本数据规模较小, 数量有限;

(3) 部分住宅特征属性间存在较高的相关性。

对于后2个问题, 如果直接建立住宅价格与特征属性的计量经济模型, 在一定置信度下, 不少消费者能明显体验到的, 能够反映住宅特征的解释变量可能不会出现在模型中。为此, 需要寻找一种方法, 对众多可能相关的住宅特征属性施行变换, 由较少的、相互独立的、能集中全部原始变量较多信息的若干综合属性, 替代原始变量进行建模分析。主成分分析法是一种客观的较理想的方法, 将主成分分析引入房地产特征价格模型, 建立基于住宅特征属性主成分分析的住宅项目特征价格模型[4]。

2 基于主成分分析法的特征价格模型

2.1 住宅项目特征属性的主成分分析

设n个样本住宅项目的m个特征属性量化值构成的矩阵为:

对上述矩阵进行标准化处理, 令:

其中:变化后的特征属性向量为y1, y2, …, ym;样本值为y1j, y2j, …, ymj;j=1, 2, …, n。

设原始观测数据矩阵X的相关系数矩阵R的特征值为λ1>λ2>…>λm;λi对应的特征向量为:ci= (c1i, c2i, …, cmi) T, i=1, 2, …, m。

因素矩阵经标准化处理后矩阵Y的主成分为:

若主成分累积贡献率:则选择前k个主成分为主分量。F1, F2, …, Fk这K个主分量相互独立, 反映了原始变量中较多信息, 可作为进一步建立住宅项目特征价格模型中的解释变量。

2.2 基于主成分分析法的特征价格模型

以住宅项目单位销售均价对数ln p为自变量, 以其特征主分量F1, F2, …, Fk为解释变量, 采用半对数特征方程建立住宅项目特征价格模型:

对样本数据ln pj, y1j, …, ymj;j=1, 2, …, n;经计算得主分量模型样本数据ln pj, F1j, F2j, …, Fkj, j=1, 2, …, n。

利用此样本数据, 采用最小二乘法与逐步回归技术, 对式 (4) 在设定的置信度下, 选择显著的解释变量进行参数估计;不失一般性, 设经参数估计后的模型为:

将式 (3) 与式 (1) 分别代入模型式 (5) 估计结果, 得到基于主成分分析的住宅特征价格模型:

3 实证分析

本文以大连市轻轨3号线沿线各车站周围2.5km范围内的住宅项目为分析样本, 建立基于主成分分析法的特征价格模型。

3.1 模型的建立与参数的估计

3.1.1 样本项目特征属性的选择与量化

项目所选的因变量、特征属性自变量及原始数据见表1。各特征属性所代表的意义如下:

(1) 建筑物属性:

X1—规划用地面积 (万m2) :采用实际数据;

X2—楼盘总建筑面积 (万m2) :采用实际数据;

X3—楼盘类型:根据各楼盘定位不同, 高档取5, 中档取3, 低档取1, 混合型则取相应平均值;

X4—装修程度:根据实际情况, 精装修取5, 初装修取3, 清水房取1;

X5—容积率:采用实际数据;

X6—是否现房:根据实际情况, 已入住2年以上取5, 入住2年以内取3, 正在建设或拟建设取1;

X7—停车场:根据实际情况, 有充足的停车位取5, 有停车位但不充足取3, 无停车场取1;

(2) 环境属性:

X8—绿化率:采用实际数据;

X9—步行10分钟范围内是否有公园:根据实际情况, 小区内部有公园取5, 附近有公园取3, 没有公园取1;

X10—500m范围内是否有水景:根据实际情况, 近海或近河流取5, 小区内部建设的取3, 无水景取1;

X11—步行十分钟是否有中小学:重点学校取5, 一般学校取3, 没有学校取1;

X12—步行十分钟是否有知名大学:重点学校取5, 一般学校取3, 没有学校取1;

X13—2km范围内是否有市二级以上的医院:市级重点医院取5, 市级普通医院取3, 小区内门诊或社区医院取1;

X14—2km范围内是否有大型体育馆或健身中心:社区内有健身房取5, 大型体育馆取3, 没有健身设施取1;

X15—步行十分钟是否有大型超市或商场:临近商业中心取5, 有大型超市取3, 社区附近稍大型超市取1;

(3) 可达性属性:

X16—到CBD距离 (km) :采用实际数据;

X17—样本到副CBD的距离 (km) :采用实际数据;

X18—2km范围内是否有2个及以上副CBD:采用哑元变量, 若有2个及以上副CBD取1, 若没有取0;

X19—步行十分钟范围内的公交线路状况:采用哑元变量, 若有3条线路以上的公交车取1, 若3条以下取0;

X20—到最近轻轨车站步行距离 (m) :采用实际数据;

X21—到大连火车站的运行时间 (秒) :采用实际数据。

3.1.2 样本特征属性的主成分分析

将轻轨3号线沿线24个楼盘对应的21个特征属性的样本数据, 运用统计分析软件SPSS进行主成分分析, 其相关系数矩阵R的特征值和累积贡献率见表2。前7个特征值的累积贡献率为85.9%, 超过85%, 故对于形如 (3) 式的主成分, 选择前7个为分量, 此7个主成分系数 (即前7个特征值对应的特征向量) 见表2右半部分。原始样本数据及样本均值与标准差 (见表1) , 经过变换 (2) 代入各主分量表达式中, 得到7个主分量的样本数据:F1j, F2j, …, F7j, j=1, 2, …, 24。

3.1.3 基于主成分的特征价格模型及参数估计

以主分量F1, F2, …, F7为特征价格模型的解释变量, 以项目销售均价的自然对数为因变量, 选择线性形式特征方程建立如下模型:

用最小二乘法与逐步回归技术进行参数估计, 得到式 (7) 对应模型的估计式:

将主分量F1、F3、F4、F5关于yi如形式 (3) 的表达式代入式 (8) , 再将由表1最后两行数据确定的变换式 (1) 代入, 最后得到由24个样本项目数据建立的基于主成分分析的住宅特征价格模型:

3.2 模型的经济意义及应用

式 (9) 中, 特征属性前的系数为其隐含价格, 反映了特征属性对项目销售均价的影响的大小;系数前的正号表明某属性对销售均价有正的影响, 而负号表明有负的影响。如X20的负号说明楼盘与其距离轻轨车站的远近是负相关, 也就是说楼盘与车站越近其售价越高。

利用模型对24个样本数据进行测算, 预测值及与样本原始值相对误差列入表1;除少数几个样本数据外, 多数预测误差在10%以内。预测模型效果稍差的原因: (1) 特征属性对应的样本值数量级差别较大、量纲不同; (2) 特征属性间存在一定的相关性; (3) 特征属性对应的某些样本值带有一定的主观性。以上原因都会在一定程度上影响回归模型的预测效果。

利用模型对新建项目进行定价, 某项目将于2008年2月开盘, 相关属性为普通清水房, 其它属性均列入表1“新”一行。将数据代入式 (9) 得到均价预测值为6080元。开发商可以以此作为依据, 在销售时根据每套房子的不同特征属性进行价格调整。

4 结论

(1) 引入主成分分析法建立特征价格模型, 可以尽量减少特征属性间存在的相关性, 得到较好的模拟效果, 并且将选中的特征属性留在模型中, 便于根据具体项目的特征属性进行定价。

(2) 应用此模型时, 应考虑地域与时间的限制。定价模型应根据具体情况进行建立, 不能一概而论。

参考文献

[1]贾生华、温海珍:《房地产特征价格模型的理论发展及其应用》[J];《外国经济与管理》2004 (5) :42-44。

[2]Robert Cervero.Rail Transit and Joint Development:Land Market Impacts in Washington.DC and Atlanta.Journal of the American Planning Association, 1994, 60 (1) :83-94.

[3]张红:《房地产经济学讲义》[M];清华大学出版社, 2004 (09) :138-139。

中国出口商品结构的主成分分析 篇5

中国出口商品结构的主成分分析

对外贸易对经济增长的推动作用是很大的,作为对外贸易的基础,出口对经济增长的推动作用更加明显.按产品附加值大小可以将出口商品划分为十类,对按结构划分的`中国出口产品进行主成分分析,可以发现中国出口数据的规律性.通过对数据分析,说明中国应扩大出口,进一步优化出口商品结构,以促进中国经济的快速发展.

作 者:蒋茂军 JIANG Mao-jun 作者单位:河北经贸大学,商学院,河北,石家庄,050061刊 名:经济与管理英文刊名:ECONOMY AND MANAGEMENT年,卷(期):200519(10)分类号:F259.23关键词:商品结构 附加值 主成分分析 累计贡献率

基于主成分分析的超市商品结构研究 篇6

[关键词] 超市商品结构 主成分分析 指标体系

一、商品结构的理论研究

目前理论界关于商品结构的研究还很少,基本的提法都是品类管理,品类管理中的品类结构就是狭义的商品结构,因此超市商品结构定义为指卖场有哪些品种商品,各种类型的商品占总量的比例多少。超市商品结构定位是否准确,关系到超市的经营方向和特色问题,简而言之,就是规定了这个超市卖什么、不卖什么的问题。

依据品类管理中的品类结构可以将商品结构分为四类,分别是:

1.大分类

它是连锁超市中最粗的分类。如生鲜、日配品、日用百货、家用电器等大分类。为了便于管理,连锁超市的大分类一般不宜过多。

2.中分类

它是大分类中细分出来的类别。例如:小家电可以分为吸尘器/空气清洁器/电扇,烹调器具,厨房用具,电熨斗/卫生间用品,电话/应答机/传真机,手表/闹钟/配件等。

3.小分类

它是中分类中进一步细分出来的类别。如厨房用具分为:抽油烟机、微波炉、碾磨机、开饮机、燃气灶、洗碗机、消毒柜、烘碗机、烘烤机、快餐炉、电水壶、电水瓶、水果榨汁机、多士炉、搅拌机、咖啡炉等。

4.单品类

单品是商品分类中不能进一步细分的、完整独立的商品品项。如青岛可口可乐饮料有限公司生产的355毫升听装可口可乐、1.25升瓶装可口可乐就是属于两个不同单品。一般情况下,把品类的结构分为大分类、中分类、小分类。

二、指标体系的建立

根据超市商品结构理论以及商品考核原则还有超市商品小分类方法,本文将定量基准分为8个指标和小分类商品种类(本文以厨房用品为例)。

1.销售额指标

销售额指标要细分为大分类商品指标、中分类商品指标、小分类商品指标及一些特别的单品项商品指标。现在大部分门店的销售系统与库存系统是连接的,后台电脑系统都能够整理出门店的每天,每周,每月的商品销售额。

2.商品贡献率

商品贡献率目的在于找出门店的商品贡献率高的商品,并使之销售得更好。

3.毛利率指标

根据超级市场品种订价的特征,毛利率指标首先是确定一个综合毛利率的指标,这个指标的要求是反映超市的业态特征控制住毛利率,然后分解综合毛利率指标,制定比例不同的类别商品的毛利率指标并进行考核。

4.客单价

客单价影响超市营业额高低的主要因素。

5.库存商品周转天数指标

这一指标主要是考核配送中心库存商品和门店存货的平均周转天数。

6.商品有效销售发生率指标

在超市市场中有的商品周转率很低,但为了满足消费者一次性购足的需要和选择性需要,这些商品又不得不备,但如果库存准备的不合理损失就很大。商品有效销售发生率就是考核配送中心档案商品(档案目录)在门店pos机中的销售发生率。如低于一定的发生率,说明一些商品为无效备货,必须从目录中删除出去并进行库存清理。

7.新商品引进率指标

为了保证各种不同业态模式超级市场的竞争力,必须在商品经营结构上进行调整和创新.使用新商品引进率指标就是对新的供应商和新商品的开发能力。

8.商品淘汰率指标

由于门店的卖场面积有限,又由于必须不断更新结构,当新商品按照考核指标不断引进时,就必须制定商品的淘汰率指标,一般商品淘汰率指标可比新商品引进率指标低10%左右,即每月低1%左右。

9.通道利润指标

一般通道利润可表现为进场费,上架费,专架费,促销费等。通道利润就成为一些超市的主要利润来源,这种状况在一些超市竞争激烈的地区已经发生。

10.商品损耗率

它将直接影响商品的贡献毛利。例如:日配商品的毛利虽然较高,但是由于其风险大,损耗多,可能会是赚得不够赔的。

三、主成分分析综合评判过程

运用主成分分析法,首先对原始数据进行标准化处理,计算变量之间的相关系数,形成相关系数矩阵,接着计算特征值和特征向量,据此计算贡献率和累积贡献率,一般取累积贡献率达85%以上的特征值为对应的主成分(主因子),然后计算主因子载荷量,最后根据特征向量和主因子载荷量计算各变量的主因子得分。在分析实际问题时,可只取前K个以累积贡献率达85%以上的特征值为对应的主因子来代表原变量的变差信息,以减少工作量,这是主成分分析法。

根据主成分分析的分析原理及步骤,运用SPSS统计分析软件包中的因子分析法,并采用主因子分析法提取公因子,计算出相关系数矩阵、因子载荷矩阵等,最终求得综合评价值,并据此进行排序。

本文采取10个指标,对某超市厨房用具进行分类得到了16种用具,应用主成分分析法对相关数据进行分析,得到了累计贡献表和因子载荷矩阵表。如表1。

表1完全变量解释表

由表1可以看出主因子个数为3个,满足累计方差贡献率83.311%大于75%。通过表2可以看出第一公因子则基本反映了客单价、商品损耗率、销售额指标、通道利润指标;第二公因子的含义较为清晰,基本反映了商品贡献率、商品淘汰率指标、毛利率指标、新商品引进率指标;第三公因子则基本反映了库存商品周转天数指标和商品有效销售发生率指标。这样,将每个公因子与对应的方差百分比进行线性加权求和,即可得出某一种类商品的综合评价,公式表示如下:

(i代表商品,i=1…16)

表2因子载荷矩阵

表3各商品综合评价及排序

四、结论

由表3可知各厨房用具中排名依次是抽油烟机、燃气灶、微波炉、烘烤机、洗碗机、消毒柜、电水壶、烘碗机、快餐炉、电水瓶、搅拌机、碾磨机、水果榨汁机、开饮机、咖啡炉及多士炉。这样就为厨房用具采购时提供了可行的依据,优化了超市的商品结构。同理,主成分分析可以应用到超市所有商品分类中。如何进行超市商品结构的优化,主成分分析起到了至关重要的作用。

参考文献:

[1]任若恩王惠文:多元统计数据分析——理论、方法、实践[M].国防工业出版社,1997

[2]于秀林任雪松编著:多元统计分析(第一版)[M].1999

[3]商界杂导社:中国零售业主要业态发展状况.销售与市场,2001 年第 9 期:24~36

[4]倪瑜唬霍佳震:超市品类管理及研究现状[J].上海管理科学,2002.5

主成分分析模型 篇7

关键词:财务风险,主成分分析法,累计贡献率

一、引言

根据相关网站统计,2007年美国资产超过10亿美元的大公司倒闭个案创20年来新高,达21家,其中包括著名的环球航空公司、Sunbean公司和Loews公司等。而在我国,每天倒闭的企业数以万计,其中不乏大企业。企业倒闭的原因大多都是因为企业资金流的断裂,导致企业经营失败。这种失败,实质上是企业缺乏财务风险防范能力,在财务风险面前显得软弱无力。企业财务风险是指使企业不能实现预期财务收益,从而产生损失的可能性。财务风险存在于企业财务管理的全过程并体现在多种财务关系上,时刻威胁着企业的生存和发展。因此,研究如何应对财务风险是现代企业不能回避的重要课题

本文所指财务风险是广义上的财务风险,即在企业的经济活动中受主客观因素的制约,影响企业正常经营和持续再生产能力的一系列不确定性因素相互作用,从而导致实际财务状况偏离预期目标的可能性。

为便于收集资料数据,以及使研究结果具有一定的代表性,本文的研究对象限定为上市公司,并从审计的角度把上市公司被特别处理(ST)作为企业财务风险恶化的标志。

二、主成分分析模型的构建

1. 主成分分析法的引入。

(1)主成分分析法的基本原理。主成分分析法是把原来多个变量简化为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。如果原来的变量指标为X1, X2,…,Xp,它们的综合指标及新变量指标为Z1, Z2,…,Zm (m≤p),则式中Z=(lijxi) m×p,系数按下列原则来决定: (1) Zi与Zj (i≠j;i, j=1, 2,…,m)不相关; (2) Z1是X1, X2,…,Xp的一切线性组合中方差最大者,Z2是与Z1不相关的X1, X2,…,Xp的所有线性组合中方差最大者,Zm是与Z1, Z2,…,Zm-1都不相关的X1, X2,…,Xp的所有线性组合中的方差最大者。这样决定的新变量指标Z1, Z2,…,Zm (m≤p)分别称为原变量指标X1, X2,…,Xp的1, 2,…,m主成分。其中,Z1在总方差中所占的比例最大,Z2至Zm的方差依次递减。

(2)主成分分析法的基本步骤。

第一步:设估计样本数为n,选取的财务指标数为p,则由估计样本的原始数据可得矩阵X=(xij) m×p,其中Xij表示第i家上市公司的第j项财务指标数据。

第二步:指标的标准化处理。进行标准化处理后,可得到新的数据矩阵Y=(yij) m×n,其中:yij= (i=1, 2,…,n;j=1, 2,…,p)。Xj为第j项财务指标数据的均值,为第j项财务指标数据的方差。

第三步:计算相关系数矩阵R。其中,Rij (i, j=1, 2,…,p)为原来变量Yi与Yj的相关系数,其计算公式为:

因为R是实对称矩阵(即Rij=Rji),所以只需计算其上三角元素或下三角元素即可。

第四步:计算特征值与特征向量。解特征方程誆λE-R誆=0,求出特征值λi (i=1, 2,…,p)。因为R为正定矩阵,所以其特征值λi都为正数,将其按大小顺序排列,即λ1≥λ2≥…≥λi≥0。特征值是各主成分的方差,它的大小反映了各个主成分在描述被评价对象上所起的作用;然后根据方程誆R-λ誆U=0可确定特征向量的矩阵U。

第五步:计算主成分贡献率及累计贡献率,确定主成分个数。主成分Zi的贡献率为

一般取累计贡献率达80%~95%的特征值λ1,λ2,…,λm所对应的1, 2,…,m (m≤p)个主成分。

第六步:计算主成分载荷,解释主成分。因子载荷量是主成分Zi与原始指标Xi的相关系数R (Zi, Xi),因子载荷量揭示了主成分与各财务比率之间的相关程度,利用它可较好地解释主成分的经济意义。在确定了选择m个主成分之后,关键的一步是要对主成分做经济解释,即要对各主成分赋予新的意义,给出合理的解释,这个解释应该根据主成分的计算结果结合定性分析进行。主成分是原始财务指标的线性组合,在这个线性组合中各变量的系数有大有小、有正有负。一般而言,线性组合中系数绝对值大的财务比率表明其对该主成分的属性做出了较大的贡献,若几个财务比率系数相当时,则应认为这一主成分是这几个财务比率性质的综合。

第七步:构造企业财务综合评分函数。企业财务综合评分函数即为各主成分因子的线性函数。

其中,W1, W2,…,Wm为主成分的贡献率。根据该函数计算出上市公司的综合值,并进行降序排列。

2. 样本的选取。

研究财务风险评价模型时,样本的合理选择很重要。考虑到样本数据的采集及我国企业的现状,本文研究样本全部选用深市A股上市公司。样本组公司选择的原则主要是遵循可比性原则,即考虑同行业、同时期、同规模的A股上市公司。“同行业”是指根据中国证监会颁布的《上市公司行业分类指引》的规定,选取属于同一行业的明细板块;“同时期”指的是选取的ST公司和非ST公司的研究变量在时间上具有一致性;“同规模”即选择的ST公司和非ST公司在总资产规模上相差不大。

本研究将公司被“ST”作为陷入财务危机的标志,除上述原因外,还有两点理由: (1) “ST”是客观发生的事件,具有很强的度量性; (2) 从摆脱“ST”的公司来看,大部分公司是通过大规模的资产重组才摘帽的,说明ST公司确实在一定程度上陷入了财务危机。所以,上市公司一旦被“ST”,就意味着陷入了财务危机

这种配比原则主要用于控制财务困境组与控制组之间由于报告季节性、行业特征和公司规模的差异所可能带来的模型偏差,但也许配比原则本身信息量的缺失可能会使模型的适用度降低。本文研究选取了90家上市公司作为研究样本,用于建立主成分评价模型,其中包括30家ST公司,60家非ST公司。数据来源于样本公司2006年年报。本文研究选取的样本公司涵盖了十个主要行业,基本符合我国上市公司的分布情况,有一定的代表性。

3. 指标体系的构建。

根据财政部工商类竞争性企业效绩评价指标体系,选择了18个指标。具体见表1。

4. 基于主成分分析法的财务风险评价模型。

下面运用SPSS统计软件对样本组企业(共90家)2006年的财务比率数据进行主成分分析。首先计算特征值、贡献率、累计贡献率,确定主成分,可以得出前面九个主成分的累计贡献率达89.95%,则取主成分的个数m为9,即取9个主成分代替原来的18个财务指标,这9个主成分所包含的信息占原来所有信息的89.95%。采用最大方差法对因子载荷矩阵进行旋转,根据旋转后的因子载荷矩阵,可以得到各主成分因子与原始财务比率指标的主成分模型:

我们可以从因子载荷矩阵中根据各个财务指标在主成分中占的比重,对该主成分作出合理的经济解释。

对于第一个主成分来说,其中占较大载荷量的指标是每股收益、总资产报酬率、每股净资产、资产负债率,可以把第一主成分概括为综合主成分。

对于第二个主成分来说,其中占较大载荷量的指标是速动比率、流动比率、现金流动负债比,可以概括为短期偿债能力主成分。

对于第三个主成分来说,流动资产周转率、应收账款周转率、总资产周转率占较大比重,因此可以概括为营运能力主成分。

在第四个主成分中,资本保值增值率、资本积累率所占比重最大,两者都反映净资产的情况,故可以概括为资本主成分。

在第五个主成分中,已获利息倍数、存货周转率占的比重较大,可以概括为长期偿债能力主成分。

营业利润率在第六个主成分中所占比重最大,我们可以将第六个主成分概括为营业收入盈利能力。

总资产增长率在第七个主成分中所占比重最大,因此可以将第七个主成分概括为总资产发展能力主成分。

净资产收益率在第八个主成分中所占的比重最大,故第八个主成分可以概括为盈利能力主成分。

营业收入增长率在第九个主成分中的比重最大,将第九个主成分概括为营业收入发展能力主成分。

在确定了各主成分的经济意义之后,根据因子得分系数矩阵和各个主成分的贡献率来确定最后的企业财务综合评分函数。

将数据代入公式(4)中,我们可以得到所选择样本公司的综合财务评分。最后我们可以根据各上市公司的得分进行排序然后得出结论,结论显示得分最高的是长城开发和ST双汇,说明其综合财务状况最好,最具有投资价值,值得投资投资;得分最低的是ST方向、ST朝华、ST星美、ST商务等,说明它们的财务状况最差,投资风险也大。

三、实证研究

1. 样本的选取。

检验组公司的选取不像样本组公司的选取那样严格。为了验证所建立的模型的正确性和普遍性,检验组公司的选择应该具有随机性,同样在ST公司和非ST公司里面进行选择,在深市随机抽取2006年的20家ST公司和40家非ST公司进行模型检验。

2. 模型的应用。

(1)统计检验组公司的18个财务指标的初始值,原始数据略。

(2)利用SPSS统计软件对原始数据进行标准化处理,进而得到Y矩阵(附表略)。

(3)把Y矩阵带入公式(3)中,计算出每个公司的因子得分矩阵Z(附表略),这一步可以利用Excel软件中的函数功能计算出来。

(4)把Z矩阵代入公式(4)中计算检验组每个公司的综合评分,然后进行统计,得出每个公司的综合评分。

3. 评价区域确定。

将检验组上市公司的各项财务比率进行标准化处理后的数据代入上面各式计算得到各上市公司的综合评分值,对预测结果进行排序,对上述P值进行频数统计,结果如表2所示。

用建立的模型对60家检验组公司的综合得分进行分类,当P=0时,ST公司评分值小于0的有18家,占该类公司总数(20家)的90%;非ST公司评分值大于0的有32家,占该类公司总数(40家)的80%,总体预测精度为85%。考虑到选择样本公司时是随机的,并不是选择上市公司中财务状况最好和最差的,同时有的ST公司正在进行资产重组或改制,财务指标不具有稳定性,此类公司并不是真正意义上财务风险最大的公司,同时非ST公司也并不是完全没有财务风险,这些原因使得原始样本的预测值未达到100%的准确率,但这种随机取样恰恰反映了我国证券市场的基本情况,因此把评价区域的临界值定为0具有较强的适用性。据此把0作为这两类公司的一个分水岭,可以得出评价区域,见表3。

4. 模型的检验。

从综合评分的结果和实际比较可以看出,ST公司有2家误判,误判率为10%;非ST公司有8家误判,误判率为20%;准确率为85%。故可得出结论:该模型在预测上市公司财务风险方面具有较大的可信度。

四、总结

从述分析我们可以看出,该模型具有以下优点:

第一,简便性。主成分分析法用SPSS软件和Excel软件进行处理分析,使得计算变得相对简单、可行。

第二,可行性。上市公司按照规定公开披露的财务报表,为该模型的初始数据来源提供了保障,使其变得可行。

第三,合理性。对财务比率原始数据进行了标准化处理,使得各财务比率之间具有可比性和可加性。

第四,科学性。根据各主成分的贡献率来确定各主成分在评分函数中的权数,弥补了传统定性研究中存在主观因素影响的不足。

在运用主成分分析法对上市公司财务风险进行识别与研究时,也存在着一定的局限性,主要表现在:

主成分分析法对原始变量与分量的关系都是按线性关系处理,然而有时二者之间可能是非线性关系,用线性方法进行处理可能会导致偏差。因此,主成分分析法可以和其他综合分析法一同使用,以增强分析结果的可靠性。

从行业、发展阶段的角度来看,不同行业、不同发展时期的财务比率都存在着一定的差异,不能一概而论,忽略了这种差异,有可能造成分析误差。笔者建议后续研究能够针对不同行业、不同发展时期建立更精确的财务风险评价模型。

参考文献

[1].陈静.上市公司财务恶化预测的实证分析.会计研究, 1999;4

[2].晏静.现金流量信息功能研究:理论分析与实证.广州:暨南大学出版社, 2004

[3].吴世农, 卢贤义.我国上市公司财务困境的预测模型研究.经济研究, 2001;6

主成分分析模型 篇8

关键词:煤矿安全,安全评价,主成分分析,聚类分析

0引言

煤炭生产过程包含物流过程以及多种形式的物料与物质的流动,这些共同组成了煤矿生产物流系统,是煤炭生产的主体部分。影响煤矿生产物流系统安全状态的因素复杂且具有模糊性等不确定特征。如何针对这种不确定性进行全面的分析和评价,以不断提高中国煤炭行业安全生产的持续稳定性,成为煤炭行业亟待解决的问题。

目前许多学者在煤矿安全评价方面做了大量研究。吴开兴等[1]根据4M-C-I构建了煤矿安全评价指标体系,对影响煤矿安全事故的因素进行灰色关联度分析,明确了各影响因素间的耦合及关联关系。曾晟等[2]将广义线 性方法与SAS(Statistics Analysis System,统计分析系统)相结合,建立了基于GLM(General Linear Model,一般线性模型)理论的模糊评价模型,结合模糊综合评价方法得出煤矿的安全生产状况。陈兆波等[3]利用人因分析和分类系统,分析调查发现管理过程漏洞和管理文化缺失是重大煤矿安全事故发生的主要原因。王汉斌等[4]认为煤矿安全文化评价的关键在于影响因素的确定和指标 体系的构 建,而PSR(Press-StateResponse,压力-状态-影响)模型为煤矿安全文化评价指标体系的建立提供了一种新思路。李亚东等[5]对近5年煤矿事 故进行了 统计,成功地将PCPR(Prevention-Control-Protection-Rescue,预防-控制-防护-应急救援)煤矿安全体系运用到常村煤矿。王金凤等[6]分析政府与煤矿企业间的利益关系,从政府角度建立其与煤矿企业的博弈模型,对煤矿安全管理提出建议。H.Kinilakodi等[7]采用安全性能 指数来评 估煤矿的 相对安全 风险。N. Lilic等[8]讨论了人工智能方法在矿山环境安全分析中的应用。

国内外学者的研究集中在煤矿安全状态指标识别和影响因素等方面,大多采用灰色关联分析、模糊评价法等评价方法。煤矿安全生产受众多因素影响,而这些方法过度依赖指标数据,忽略了指标的实际含义,且存在反映同一信息的多个重复指标,使安全评价指标体系过于庞杂。主成分分析可从众多复杂指标中找出主要指标,以反映原来多个变量的大部分信息,并消除评估指标之间的相关影响;聚类分析可按照性质上的相似程度对样本或变量进行分 类,由此发现其共性与个性。本文在建立煤矿安全评价指标体系的基础上,综合运用主成分分析与聚类分析建立煤矿安全评价模型,对煤矿企业的安全状态进行分类测评,分析各煤矿企业的相似性与差异性,明确其优势和差距,便于煤矿企业有针对性地制定提高其安全状态的具体对策。

1煤矿安全评价模型

1.1煤矿安全评价指标体系

煤矿生产物流系统是人-机-环-管相互交融的复杂系统,安全影响因素之间、影响因素与整体以及整体与环境之间相互作用,其安全水平受人、机、环境及管理水平等多因素制约。因此,以人-机-环管为纽带,将煤矿生产物流系统安全影响因素分为人的行为、安全管理、装备设施、自然条件、安全技术与监管机制5大类,再根据对煤矿典型事故案例的分析及相关文献的研究,确定这5大类的三级指标:

(1)在人的行为二级指标下,可分为矿工的安全素质X1、从业年限X2、文化程度X3、生理心理因素X4[9]三级指标。

(2)在安全管理二级指标下,可分为危险源管理X5、劳动组织管理X6、设备管理X7、安全教育培训X8[10]三级指标。

(3)在装备设施二级指标下,可分为通风排水系统X9、支护系统X10、供电系统X11、采掘设备X12三级指标;

(4)在自然条件二级指标下,可分为顶板条件X13、水文地质条件X14、热害与火灾X15、瓦斯及煤尘X16三级指标。

(5)在安全技术与监管机制二级指标下,可分为政府安全监察体系X17、安全关键技术研究X18、 开采设计X19、超能力生产X20[9]三级指标。

1.2煤矿安全评价模型

综合运用主成分分析和聚类分析,按照主成分得分对研究样本排序,再依据提取的主成分,将其作为新的评价指标做聚类分析,对样本分类排名。该方法称为主成分聚类分析方法。

本文利用构建的煤矿安全评价指标体系,采用主成分聚类分析方法建立煤矿安全评价模型,具体步骤如下[11,12]。

(1)煤矿安全样本数据标准化处理,以消除指定变量的量纲或单位的影响。设有n个煤矿,煤矿安全评价指标为p个:x1,x2,…,xp,得原始数据:

标准化公式

式中:xij*为xij的标准化数据,i=1,2,…,n;j=1, 2,…,p;xj,sj分别为第j个指标的样本均值和标准差。

( 2 ) 求解煤矿安全样本标准化数据的相关系数矩阵

(3)求解相关系数矩阵R的全部非零特征值 λ1,λ2,…,λq(q<n),并按大小排序:λ1≥λ2≥…≥λq(其余p-q个向量的特征值为0)。

(4)选择煤矿安全指标的主成分个数。主成分确定原则:累计贡献 率达到或 超过85%;特征值大于1。

主成分对原始指标数据的方差贡献率为, 由其求出主成分个数m ( m <n )。 m满足

(5)计算指标Xj在主成分t(t=1,2,…,m)上的因子负载矩阵bjt。

把这m个向量作为列向量,即组成主成分的载荷矩阵:

求解特征值λt对应的特征向量ut=[ut1ut2… utp]T, 其中

(6)计算并确定主成分取值。主成分表达式为

以这m个主成分构建煤矿安全综合评价函数:

根据式(5)计算各个煤矿企业的各主成分得分和综合得分,并按得分高低排序。

(7)对新数据进行系统聚类分析。首先,根据各个煤矿企业的m个主成分得分,将煤矿安全状态相似的企业归为一类,煤矿安全状态相差较大的企业归于不同的类别;其次,计算各个类中主成分的平均得分,依据各类间得分高低进行类间排序;最后,根据主成分的得分对各类中煤矿企业进行排序,并与类间排序结合,进行新的排序,得出聚类分析结果。

(8)综合评价。综合分析评价函数F和聚类分析的结果后,对各煤矿企业的安全状态进行综合排序,以评价各煤矿企业的优点与不足,以及企业之间的相似性与差异性。

2实例分析

2.1数据收集及处理

随机抽取中国某省40个煤矿为研究对象,采取定性分析和定量分析结合的方法搜集指标数据。定性指标数据的收集采取专家打分法,选取各专家评价的平均得分作为指标最终得分。定量指标数据源于该省煤矿安全监察局2013年煤矿安全程度标准化考核结果,其中矿工的安全素质指标为煤矿安全培训占培训总次数的比例,从业年限指标源于各个煤矿企业的统计结果,文化程度指标为大专以上学历人数占从业人数的比例,安全教育培训指标为安全培训资金占教育资金的比例。样本指标数据见表1。

2.2模型求解

将选取的20项评价指 标的原始 数据导入SPSS19.0中进行数据标准化处理,得到各指标之间的相关系数,各成分的特征值、方差贡献率、累计贡献率和主成分载荷,见表2—表4。

从表2可看出,煤矿安全评价指标间的相关性较大,需要先消除不同指标之间的相关性或重复性。 通过计算得出各个成分的特征值、方差贡献率和累计贡献率,第一成分 到第五成 分的特征 值分别为10.814,1.686,1.369,1.291,1.151,均大于1,且方差累计贡献率达85.549%,即这5个成分包含的信息量占原始数据信息量的85.549%,可反映原始数据的大量信息。因此,本文选取前5个成分作为评价各煤矿企业安全状态的主成分[13,14]。

根据表3和4,将主成分对应的特征根开方,用主成分载荷矩阵中每列的系数矩阵及其特征根开方相除,得到的相应数据代入式(4),得到主成分:

综合得分F=0.5506 9F1+0.094 30F2+0.088 44F3+0.064 53F4+0.057 54F5。

根据主成分及综合得分表达式,计算40个煤矿企业的各个主成分得分和综合得分,并按得分高低排序,见表5。

最后,用SPSS19.0对5个主成分进行聚类分析并排序。以序号代替煤矿企业样本名称,则聚类结果为{3,25,10,20,15,37,5},{23,11,30,33,31, 7,24,12,35,22,8,13,14,27,9,32,1},{29,26}, {34},{40,2,6,21,18,39,19,17,16,28,38,4,36}。 然后根据各个类别中主成分的得分进行排序,结果为{40,2,6,21,18,39,19,17,16,28,38,4,36,3,25, 10,20,15,37,5,29,26,23,11,30,33,31,7,24,12, 35,22,8,13,14,27,9,32,1,34}。

2.3结果分析

第一类{40,2,6,21,18,39,19,17,16,28,38,4, 36},其主成分平均得分为0.661 5,分析表明这些煤矿企业非常重视自然灾害引发的安全事故,并针对该方面的安全管理制定了相应的预防措施,该方面的评价得分较高。

第二类{3,25,10,20,15,37,5},其主成分平均得分为0.123 3,分析表明这些煤矿企业在安全教育培训方面做得较好,但在顶板安全管理方面尚有待提升,因此需要采取合理的开采方法和支护措施,有效防范顶板事故。

第三类{29,26},其主成分平均得分为-0.065, 分析表明这些煤矿企业在劳动组织管理方面有较大投入,但在矿井热害与火灾防治方面存在不足,因此需要完善通风安全信息系统,同时进一步加大生产事故赔偿力度,提高对伤亡人员的赔偿标准。

第四类{23,11,30,33,31,7,24,12,35,22,8, 13,14,27,9,32,1},其主成分 平均得分 为 -0.470 3,分析表明这些煤矿企业在遏制超能力生产方面做得较好,但在瓦斯及煤尘防治方面有待提高,需要进一步加强瓦斯煤尘的综合防治,加大安全检查力度,突出“一通三防”的安全监察,严格现场管理。

第五类{34},其主成分平均得分为-0.995,分析表明其安全管理能力较差,因此该煤矿应针对自身存在的安全问题,制定并贯彻落实相应的安全管理防治措施,防止安全事故的发生。

3结语

主成分分析模型 篇9

Vki表示第i个被评价上市公司的第k个指标的评价值, k=1, 2, …, m, i=1, 2, …, n0取第k个指标的最佳值Vk0=Optimum (Vki) 作为参考数列的V0的第k个分量。本文所采用的正向指标, 其最佳值取公司财务数据的最大值, 由于所选用的指标量纲并不是统一的, 需要对评价指标的数值进行规范化处理。将理想上市公司各指标的财务数据组成的向量V0规范化后得到X0= (X10, X20, Xm0) 的作为参考数列, 并将Xi作为比较数列, 计算被评价上市公司的各指标与理想公司相应指标的关联系数:

其中, ζ称为分辨系数, ζ∈[0, 1], 按惯例ζ取值为0.5。

应用主成分分析法, 对标准化后的指标提取主成分因子Yi, 使这些主成分因子包含原始数据的信息总量达到90%以上, 同时得到Yi对应的特征向量λi, 综合得分T0i计算公式如下:

计算Tk和T0的绝对关联度ε0k以及相对关联度η0k进而得到Tk和的综合关联度ρ0k

按照ρ0k (k=1, 2, …, m) 的大小排序, 排名越靠前的指标赋予该指标的权重越大, 再利用关联系数矩阵E和权重矩阵求出关联度:

由于理想上市公司的各项指标均由最优的指标构成, 所以某上市公司与理想公司的关联度越大, 说明绩效越优。

二、上市公司绩效评价的实证分析

本文选取了交通运输行业具有代表性的10家上市公司, 评价其在2010年上半年的综合绩效水平, 公司绩效指标规范化处理后的数据见表1:

从上表数据可以计算出上市公司各个指标与理想上市公司各指标关联系数γki的值, 由于宁沪高速近几年发展比较平稳, 且财务数据较全, 选之作关联优势分析来确定整个评价体系各指标的权重, 应用主成分分析法, 对宁沪高速对应的11个指标提取三个主成分子因子Y1, Y2和Y3, 三个主成分因子所包含的原始信息总量为97.40%, 其对应的特征值λ1, λ2和λ3分别为6.5894, 3.2605和0.8638, 然后计算出k第个指标Tk和T0之间的绝对关联度、相对关联度和综合关联度以及权重, 赋权后的关联系数和关联度见表2:

由此得到交通运输行业各上市公司综合绩效排名, 如表3所示:

三、评价结果分析

整体来看, 排序靠前的现代投资、中国远洋、中国国航等均显示出了较强的盈利能力、成长能力和扩张能力, 尤其是现代投资, 自2005年以来的净利润平均增长率为47.58%, 近五年每股收益平均增长率为34.67%, 高居公路与铁路行业排名第一位。排名第二的中国远洋2010年上半年总资产周转率和营业收入分别为0.59和207.88亿元, 显示出公司强大的规模优势, 经营期间总资产的运营效率优于交通运输行业其他上市公司。中国国航的优势则体现在营业收入和净资产收益率两个指标上面, 分别为196.11亿元和17.95%。公司在国内上市航空公司中拥有国内最完善的航线网络和最大的国际航线网络, 受到出境游人数快速增长和国际经济环境持续复苏的推动, 公司盈利水平稳步提高。

四、讨论

上市公司绩效评价是一个系统而复杂的问题, 本文利用灰色关联模型和主成分分析相结合的方法, 既有效解决了信息条件不完全的小样本系统的分析局限, 又克服了灰色关联模型的主观赋权问题。实证分析表明, 交通运输行业上市公司发展呈现不均衡的状态, 行业龙头公司业绩优良, 而规模较小的企业由于其盈利能力, 资产管理效率都不及龙头企业的表现, 这表明本文建立的评价体系和方法符合实际, 具有一定的参考意义。

摘要:通过选择合适的评价体系和研究方法, 科学地选取评价指标, 建立灰色关联模型, 并借助主成分分析法解决灰色关联主观赋权的缺陷, 得出一个根据指标内部结构关系确定的综合评价体系, 对交通运输行业上市公司进行评价和排序。实证分析表明, 交通运输行业上市公司发展呈现不均衡的状态, 行业龙头公司业绩优良, 而规模较小的企业其盈利能力、资产管理效率都不及龙头企业的表现。

关键词:灰色关联模型,主成分分析,绩效评价

参考文献

[1]邓聚龙.灰理论基础[M].武汉:华中科技大学出版社, 2002

[2]梅国平.论上市公司绩效评价体系[J].企业经济, 2003 (10) :189-190

主成分分析模型 篇10

一、指标体系构建

研究表明, 经济增长不仅是经济总量的增加, 还包含经济结构的转变、优化和产业结构的升级调整。此外, 政策性因素如投资、财政和税收的放松或管制, 外资的涌入导致具有比较优势的产业获利, 缺乏竞争力的产业受到冲击, 均被认为是影响收入差距的重要因素。笔者用广西人均地区生产总值增长率、第一、二、三产业占GDP比例等指标量化表示经济增长水平;用外贸进出口总额占GDP比重作为对外贸易依存度的变量;地方财政用于教育、社会保障和就业支出表示政府支持低收入群体的力度;居民消费价格指数CPI代表物价上涨通货膨胀的影响;城镇登记失业率代表就业程度等等。以上各指标代表的地区经济社会发展水平即收入差距形成的成因, 构成本文建模时重点考虑的变量。

本文利用基尼系数测算结果作因变量, 影响广西城镇居民收入差距的14个因素作自变量:X1:人均GDP增长率;X2:全社会固定资产投资总额占GDP比例;X3:外贸进出口总额占GDP比例;X4:外商直接投资额占GDP比例;X5:地方财政总支出占GDP比例;X6:地方财政用于教育支出占比;X7:地方财政用于社会保障和就业支出占比;X8:医疗保健支出占人均GDP比;X9:居民消费价格指数CPI;X10:商品零售价格指数;X11:城镇登记失业率;X12:第一产业占GDP比;X13:第二产业占GDP比;X14:第三产业占GDP比。

众多指标之间可能存在一定的相关性, 笔者先采用主成分分析法找出上述影响因素的若干主成分, 采用其主成分得分作为自变量拟合回归方程, 进而揭示各个主成分乃至各因素对广西城镇居民收入差距的影响方向及其程度。

二、主成分分析模型的建立

KMO和Bartlett球形检验结果显示:KMO测度值为0.612, Bartlett检验值为524.196, 概率值P=0, 证实模型适合使用主成分分析方法。

表1按照特征值从大到小的次序列出了所有主成分。按照特征值大于1的原则, 第一个主成分的特征值为4.861, 解释了总变异的34.722%;第二个主成分的特征值为3.999, 它解释了总变异的28.567%;依此类推。而其他特征值小于1 (省略列出) , 说明这些主成分的解释力度不如原始变量。根据主成分个数确定原则可确定三个主成分, 其累计方差贡献率达到84.184%, 概括原始变量包含信息的84.184%, 较好代表14个影响因子。

从表2可见, 第一公因子F1在全社会固定资产投资总额占比、地方财政总支出占比、地方财政用于社会保障和就业支出占比及第一、第二产业占比上都有较大的载荷, 故可以认为F1是较全面地反映各项经济因素的综合指标。将其归为“经济环境因素”。

第二公因子F2在居民消费价格指数、商品零售价格指数、人均地区生产总值增长率上都有较大的载荷, 将其归为“指数增长因素”。

第三公因子F3在外贸进出口总额占比、外商直接投资额占比上都有较大的载荷, 将其归为“对外开放因素”。

结合主成分得分系数矩阵, 写出用原始变量表示的主成分的线性表达式:

同理可得F2、F3的表达式。

三、多元回归分析模型的建立

为进一步对前述分析结果进行科学评价, 再建立多元回归分析模型, 对影响城镇居民收入差异的主要因素进行定量分析。取基尼系数为因变量, 考查城镇居民收入差距是否受到解释变量“经济环境因素”、“指数增长因素”、“对外开放因素”的影响

建立回归模型如下:JN=β0+β1F1+β2F2+β3F3+μ, μ为除这3个变量以外的一些不可估计量的影响, 设定模型的显著性水平为0.05。

对模型进行检验, 通过拟合优度检验来看, 调整后的R平方达到0.838, 表明拟合效果很好, 解释程度较高。显著度检验F值等于37.26, 说明模型估计的整体效果尚好。sig.值小于0.001, 变量值均通过t检验, 回归方程具有统计学意义。

JN=0.368+0.587F1-0.201F2-0.690F3+μ, μ为残差因子

从回归模型可知:衡量广西城镇居民收入差距的指标基尼系数除了受到“经济环境因素”、“指数增长因素”和“对外开放因素”三大因素长期影响外, 同时还受到外在诸多随机因素的影响, 如一些自然因素, 政治因素等突发不确定信息, 因数据获得有限, 未得到充分提取和利用, 导致模型拟合精确度因受到外在短期随机因素的冲击有所降低。

为详细考察每个影响因素对城镇居民收入差距的影响情况, 现将多元回归方程中的主成分用其表达式代入, 整理如下:

四、结语

回归方程表明, 在影响城镇居民收入差距的14个因素中, 除了X2、X5、X7、X8、X13和X14的回归系数为正数, 其他因素的回归系数均为负数。

X5, X7, 地方财政总支出占GDP比例、地方财政用于社会保障和就业支出占比系数为正。通常认为政府主导的财政支出政策对改善民生具有积极作用, 可减少收入差距。实证研究结论却相反, 原因可能是当前社会保障支出结构不够合理, 保障体系不完善, 保障水平偏低, 覆盖面狭窄, 具有收入调节功能的地方财政措施落实不到位。因此, 需要各级地方政府有针对性地采用财政手段进行干预调节, 利用财政收入的转移支付功能等措施来确保低收入群体的基本生活。

X1因子对收入差距的影响系数为负, 经济环境发展得越快, 收入差距越小。尽管收入差距伴随着经济的高速增长而出现, 但经济增长过程中的收入差距拉大属正常现象。一方面, 经济增长本身并不会直接导致收入差距的扩大, 两者之间关系不能简单称为因果;另一方面当经济增长的效率高, 结构效益向好的时候, 就能够改善居民收入分配状况, 使群众有机会分享经济发展成果, 提高居民生活水平。

X12、X13、X14, 三个表示产业结构的指标系数一负两正, 说明优化产业结构, 降低第一产业比重, 加大对第二、三产业的投入, 在当前一定时期内会扩大广西城镇居民收入差距。收入差距与产业结构调整和升级直接相关, 产业的变动过程中导致劳动力的大量转移, 引发下岗、失业现象, 会加大收入差距, 但劳动力转移过程中也会带来就业机会、技术及人才自由流动, 从而缩小收入差距, 这取决于在产业结构优化过程中资源配置的合理性

X9, 居民消费价格指数指标的系数为负, 说明某种程度的物价上涨会给居民收入差距的加大带来一定的压力。发生物价上涨时, 政府为了维持社会稳定, 采取措施加大对低收入阶层的补助;收入差距与CPI之间的传导机制需要经过一段时间才能发挥作用, 短期内所看到的只是表面关系。因此, 我们不能够以过高的物价上涨幅度来实现缩小居民收入分配差距。

X4, 对外贸易依存度指标的系数为负, 说明随着开放的深入, 广西城镇居民收入差距将逐渐减小。广西充分发挥出海大通道和西部桥头堡的区位优势, 积极实施“走出去”战略。通过调节资金引进的方向, 引导资金流入到制造业、与贸易相关的金融业和服务业, 同时贸易开放战略如能有针对性地向农业等落后产业倾斜, 增加贸易政策决策的民主化, 将更能发挥贸易缩小收入差距的作用。

摘要:经济体制和社会经济结构发生的深刻变化, 在带来积极效应的同时, 也带来了新的问题:收入差距不断加大, 低收入居民增收困难的矛盾突出等。本文运用19912012年广西统计数据进行实证研究, 通过主成分分析和回归分析建立模型, 定量分析宏观环境对广西城镇居民收入差距所带来的影响影响程度。

关键词:城镇居民,收入差距,主成分,多元回归

参考文献

[1] .陈宗胜, 周云波.再论改革与发展中的收入分配[M].北京:经济科学出版社, 2002

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:浅析中药有效成分现代提取技术研究进展的论文 下一篇:主要成分分析