快速主成分分析

关键词: 流通 货架 水果 消费者

快速主成分分析(精选十篇)

快速主成分分析 篇1

随着人们生活水平的提高以及营养知识的普及,消费者对食品安全日趋重视。水果货架期是指水果结束储藏状态,进入经营环节并最终被消费者食用的流通期[1],流通期间环境因素对水果品质变化的影响大。目前,国内外在水果保鲜领域的基础研究很多,如何延长食品的货架期以及实现快速对食品的货架期进行预测和检测是其中一项重要内容。预报微生物学方法[2]、加速货架期试验(Accelerated Shelf-life Test,ASLT) [3]及电子鼻技术[4]等在食品货架期预测和检测领域中有较多应用。

近红外光谱技术已被广泛地用于水果内部品质的定性、定量分析,以及品种、产地的鉴别,近年来国外学者也逐步将此技术应用于水果的货架期的检测和预测。例如,Camps[5]利用可见—近红外漫反射光谱技术在低温室和常温两种储存条件下研究了3种不同苹果的货架期,研究中建立的全局存储期检测模型对两种存储条件中货架期的鉴别率分别为75%和83%。Andrew[6,7]对后储存期的苹果干重和SSC含量进行了研究,利用800~1 000nm的近红外光谱,以将采摘的苹果核冷藏6周,模型对收割期前后干重的预测相关系数大于95%,对冷藏期的SSC预测相关系数大于94%;同时还比较了密度法和可见—近红外光谱法(VNIR)对水果收割期和贮藏期品质检测的应用,结果表明VNIR方法检测精度高。Tewari[8]利用遗传算法和相关分析进行柑橘产地和糖度的分析,表明NIRS方法可以很好地进行柑橘产地的鉴别。Zude[9]利用声脉冲共振传感器和小型近红外光谱仪器对果树上的苹果的坚硬度和货架期进行了研究。结果表明,此方法可用于水果最佳收割期的选择和货架期间的品质检测。Clark[10]对15 000个采于3个不同收割期的猕猴桃的潜在贮藏期进行了研究,同时分析了样品的干重和SSC变化,表明NIR方法可很好地用于水果的产后分级。Kim[11]建立了6类不同前处理和贮藏期的猕猴桃的分别鉴别模型,并对比研究了线性和非线性模型,非线性模型的分类效果好。Schmilovitch[12]在室温下,对10个芒果318h(6个时间段)的货架期预测模型的相关系数为0.93。Veraverbeke[13]利用近红外透射光谱较好地实现了对货架期为0/1/2周的苹果进行了鉴别,结果表明方法可用于苹果货架期的鉴别。本文利用了近红外光谱技术进行流通期的柑橘货架期的快速鉴别模型研究。

1 实验部分

柑橘样品于2008年3月30日从水果市场选购, 32个样品均产于浙江黄岩地区,且采摘时间相同;于2008年4月10日和2008年4月20日测量样品光谱,并定义其类别分别1和2。

光谱采集选用了Bruker公司的MPA近红外光谱仪,光斑面积为15mm,光谱扫描范围为12 000~4 000cm-1,分辨力为4cm-1。实验时,实验温度与环境的温度一致。

光谱采集过程中,测点在柑橘赤道上选取,每次均匀测定6个点的光谱,取平均值作为样品一次测量光谱[14]。为了尽量消除果皮厚度与果皮表面反射光的影响,其中第1个点随机确定,每个柑橘样品的光谱重复测量2次,即每个样品的光谱是12次测量的平均值,并利用SNV+detrend方法对光谱进行预处理,图1为同一样品不同货架期的光谱图。

2 建模部分

2.1 样品集组成

校正集由随机选择的22个1类样品光谱和20个2类样品光谱组成,预测集由随机选择的7个1类样品光谱和8个2类样品光谱组成。SNV+detrend预处理后主成分贡献率,如表1所示。

在对水果等的近红外光谱无损检测中,常用的预处理方法有MSC和SNV。两种方法均可以用来校正样品间因散射引起的光谱的误差,一般认为SNV的校正能力比MSC要强[15],SNV校正中每条光谱中各波长的吸光度应符合一定的正态分布,以此为基础对每条光谱进行校正,无需理想光谱,其方法如下

undefined

式中 xi—原始光谱;

μ—光谱的平均值;

δ—光谱的标准差。

为了扣除原始光谱中的线性漂移,变量标准化后进行了detrend处理。

2.2 光谱预处理

本文利用径向基函数神经网络进行了建模。模型的稳健性是人工神经网络在近红外光谱分析应用中关键的问题,应对样品光谱进行特征提取,减少网络的节点。NIR技术常用的特征提取方法是将光谱数据矩阵做主成分分析(PCA) ,降维后的得分作为神经网络的输入。本文先对光谱数据矩阵进行主成分降维,然后将降维后的得分矩阵的主成分作为RBFN 的输入。

2.3 模型与结果

建立了包含一个具有径向神经元的隐含层和具有线性神经元的输出层的神经网络模型。利用matlab中newrb函数建立训练模型,newrb函数可以自动增加网络的隐含层神经元数目,每次循环产生一个神经元,每增加一个神经元都能最大程度地降低误差。其中,样品光谱为输入向量,目标输出向量为样品货架期类别(1或2),训练精度为0. 001,散布常数为10,隐含层增加神经元个数为100, 训练终止条件为满足模型精度或达最大神经元数目,当末达到精度要求时继续增加神经元,满足精度时网络训练完成。

如将800~2 500nm的全波段光谱都作为神经网络的输入不仅增加了网络训练时间,还容易引起模型产生过拟合情况,同时全波段光谱中部分区域的光谱也会模型产生干扰,不利于提高模型的稳健性。本文优选用了950~1 340nm波段的光谱,经过预处理后利用主成分分析进行特征变量提取,将前12个变量作为神经网络的输入,对预测集中15个样品货架期的类别进行预测,对1类7个样品的鉴别中,有4个样品的准确率在90%以上;对2类8个样品货架期类别的预测,准确率均在90%以上,如表2所示。

3 总结

本文研究结果表明,近红外光谱技术为柑橘类水果的货架期的快速鉴别提供了新方法,该技术在水果及食品流通期间的货架期检测中具有广泛的应用前景。利用SNV+detrend的方法对柑橘两种不同货架期的近红外光谱进行预测处理,并利用主成分分析方法进行特征提取,选用12个主成分做为神经网络的输入,其贡献率为99.03%;模型对1类7个样品货期鉴别中,有4个样品的准确率在90%以上;对2类8个样品货架期鉴别准确率均在90%以上。本文仅对柑橘的货架期进行了定性分析,后续将利用此方法对其货架间做更加深入的定量研究,将可进行基于近红外的水果货架期快速分析仪器的开发。

摘要:利用近红外光谱技术进行了柑橘货架期的快速鉴别模型的研究。在两个不同的时间采集从市场上购买的黄岩地区的32个柑橘(同一时间采摘)的近红外光谱,并将不同时间采集光谱时的柑橘的货架期分别定为1类和2类(间隔为10天),对不同货架期的柑橘样品光谱进行主成分特征提取,将提取的特征变量作为神经网络的输入,建立了基于主成分和神经网络的近红外光谱柑橘货架期的快速鉴别模型。所建模型对1类中7个样品货架期的鉴别结果中有4个样品的货架期预测准确率在90%以上;对2类中8个样品货架期的鉴别结果准确率均在90%以上。结果表明,近红外光谱技术可以很好地进行柑橘类水果的货架期的快速鉴别。

主成分分析及算法 篇2

主成分分析及算法

以主成分分析(PCA)特征结构的理论分析为基础,分别从神经网络和向量量化器两个不同的角度给出了最大主成分线的算法实现和比较,并由此讨论了HEBB算法对学习率的依赖和敏感度.

作 者:李玉珍 王宜怀 LI Yu-zhen WANG Yi-huai 作者单位:苏州大学,计算机科学与技术学院,江苏,苏州,215006刊 名:苏州大学学报(自然科学版) ISTIC英文刊名:JOURNAL OF SUZHOU UNIVERSITY NATURAL SCIENCE EDITION年,卷(期):21(1)分类号:O242.2关键词:主成分分析 神经网络 学习率 算法

宜宾油樟营养器官精油主成分分析 篇3

关键词:油樟;1,8-桉叶油素;黄樟油素;气相色谱-质谱联用技术;精油

中图分类号:O657.63文献标志码:A 文章编号:1002-1302(2014)11-0348-03

油樟[Cinnamomumlongepaniculatum(Gamble)N.Chao]系樟科樟属的珍贵树种,由于精油含量高,因此是一种重要的经济树种。该物种于1974年由四川省林业科学院森林植物分类专家赵良能发现并命名,当时认为油樟是特产于四川和陕西西部的新种[1]。但在后期的研究中,李敏敬、陶光复等通过调查发现,在湖北西部、湖南西部、陕西南部也有油樟分布[2-3]。四川省宜宾市位于四川南部,气候温暖湿润、土壤肥沃,非常适合油樟树的生长,境内的宜宾县有“油樟王国”之称,油樟油产量占全国70%以上[1]。现已建成“天然油樟母本园”21.7hm2,选育了优质油樟母树6500多株,油樟种植面积已达2万hm2,年产油量达到3000t。四川宜宾油樟叶精油出油率(3.8%~4.5%)高于其他地区的油樟,如精油的桉叶油素是广东、江西等樟油的1.6倍[1],具有很好的應用前景。开展油樟精油成分分析研究是进一步开发油樟资源的前提,现有文献仅报道了油樟叶精油成分[4],但有关其根、茎精油的成分研究还未见报道。为此,本研究采用气相色谱-质谱联用法分析油樟叶、根、茎的精油主成分,以期对宜宾油樟资源的进一步合理、有效利用提供参考。

1材料与方法

1.1材料

油樟叶、茎、根采自四川省宜宾市翠屏区宗场乡油樟林基地,乙醚(分析纯,成都市科龙化工试剂厂)。

1.2主要仪器设备

磨口玻璃蒸馏器、圆形电子调温电热套、日本岛津GCMS-QP2010气相色谱质谱联用仪。

1.3方法

1.3.1精油制备方法

分别称取10.0g油樟叶、50.0g油樟根、50.0g茎,剪碎后放入3支1000mL的磨口圆底烧瓶中,每个烧瓶中加入750mL蒸馏水后接上磨口连接头,与冷凝管相连。调节电热套,使烧瓶中的水保持微沸,蒸馏120min,获得芳香油-水混合物,然后加入50mL乙醚,转入分液漏斗中,摇匀后静置24h。取有机相,用乙醚定容至100mL,稀释至适当浓度,供分析测试用。

1.3.2气质联用仪(GC-MS)分析条件

气相色谱条件:色谱柱Rtx-5MS(30.0m×0.25mm×0.25μm)弹性石英毛细管柱(美国Restek公司生产);初始温度50℃,保持3min,以5℃/min升温至180℃;载气为纯度大于99.999%的氦气;柱流量1.5mL/min,分流比50∶1;进样口温度200℃;进样量1μL。质谱条件:EI源(电子能量70eV),相对分子质量扫描范围30~550u,倍增管电压1.2kV,溶剂延迟3min,离子源温度200℃,接口温度200℃,溶剂延迟时间为3min,检测阈值为1000,将峰值大于100000的色谱峰进行定性分析。

2结果与分析

2.1油樟叶精油分析

按“1.3”节的方法测得油樟叶总离子流色谱图(图1)。由图1可知,优化的气相色谱条件,可以很好地将油樟叶精油中的各成分分离开来,各峰形对称,峰与峰之间完全分开,基

线稳定无飘移。与文献[4-5]相比,分析时间由原来的40min以上缩短至29min,提高了分析效率。定性可信度高的色谱峰如表1所示。

由表1可知,叶精油中1,8-桉叶油素相对含量最多,为60.81%,稍高于黄远征等报道的58.55%[4]。另2种成分β-水芹烯和α-萜品醇的相对含量分别为13.27%、12.90%。文献[4]报道的含量高于10%的物质是香桧烯(14.18%)、α-萜品醇(15.43%),未检测到β-水芹烯。本次试验中未测到香桧烯,2种物质的结构式如图2所示,二者互为同分异构体,在后期生产实践中,可进一步开展单体的分离纯化与性质研究。

α-蒎烯、2(10)-蒎烯、月桂烯、1,1-二甲基,2-(3-甲基-1,3-丁二烯)-环丙烷、4-萜品醇的含量介于1.10%~3.35%之间,侧柏烯、γ-萜品烯、(1.α,2.β,5.α)-

2-甲基,5-(1-甲基乙基)-二环[3.1.0]2-己醇、(1.α,2.α,5.α)-2-甲基,5-(1-甲基乙基)-二环[3.1.0]2-己醇的含量介于0.34%~0.89%。

油樟叶精油成分是油樟分型的重要依据,李毓敬等依据油樟叶精油的主要化学成分类型,将湖南油樟分为甲基丁香酚型、龙脑型、樟脑型、桉叶油素型、芳樟醇型、倍半萜烯型6个不同的化学类型[2]。陶光复等测得湖北长阳县油樟油的主要成分是布勒醇(44.78%)、β-桉叶醇(15.61%)、香叶醛(10.80%)、橙花醛(7.63%)、愈创醇(5.07%)、β-石竹烯(2.46%)和1,8-桉叶油素(1.72%)[3]。程必强等报道了叶精油的主要化学成分是β-桉叶醇(40.98%)、榄香醇(10.84%)、愈创醇(4.61%)[6]。本试验结果表明,宜宾油樟为桉叶油素型油樟。

nlc202309032136

2.2油樟茎精油成分分析

按“1.3”节方法测得的油樟茎油总离子流色谱图见图3,定性结果见表2。

由表2可知,油樟茎精油以1,8-桉叶油素为主,占鉴定到的3种物质的99.37%,另2种物质为4-萜品醇和α-萜品醇,含量分别为0.24%、0.39%,这与油樟叶精油的成分有很大差异。进一步研究枝条与树叶出油率和产品成分的影响,将有助于综合利用油樟资源。

2.3油樟根精油成分分析

根据“1.3”节的方法对油樟根精油分析,结果如图4、表3所示。

由表3可知,油樟根精油的主要成分是黄樟油素,相对含量高达93.18%,而1,8-桉叶油素和樟脑的相对含量分别为5.31%、1.51%,由此可见根精油成分与叶、茎精油成分有很大差异。

3结论与讨论

本试验结果表明,宜宾油樟叶、茎、根的精油化学成分构成差异较大,其中叶精油的成分比根、茎丰富,主要成分1,8-桉叶油素的相对含量为60.81%,β-水芹烯和α-萜品醇的相对含量分别为13.27%、12.90%。而茎精油主要成分1,8-桉叶油素的相对含量高达99.37%,其他2种成分4-萜品醇和α-萜品醇含量仅分别为0.24%、0.39%。根精油主要成分为黄樟油素,含量为93.18%,而1,8-桉叶油素的相对含量仅为5.31%。油樟叶精油的主要成分分析结果表明,宜宾油樟属于1,8-桉叶油素型。

油樟油是我国重要的外贸商品,精油中的多种单体物质是医药、日化、香精香料的重要原料。1,8-桉叶油素具有抗菌、杀虫、疏风解热、祛湿解毒作用[7],对多种药物具有良好的透皮渗透作用。β-水芹烯是一种具有生物活性的天然杀虫剂,是生物杀虫剂中的一个重要活性成分[8]。黄樟油素可用于合成洋茉莉醛、胡椒基丁醚、左旋多巴、胡椒乙胺、甲基多巴等化工、医药原料[9]。洋茉莉醛不仅可用于香料和调味品工业,而且也可用作电镀工业中的光亮剂;此外,洋茉莉醛还是一些生物碱和特殊化学品合成的重要原料。胡椒乙胺是多巴胺和黄连素合成的重要原料,其中左旋多巴胺是治疗震颤麻痹症的有效药物之一。然而,黄樟油素具有较强的致癌毒性[10],在生产过程中应当采取合理控制工艺,以预防其对工作人员的毒害作用[11]。在植物精油市场上,粗油制品价格低,精加工制品纯度越高价格越高。一直以来,我国油樟油的提炼、精制技术落后,产品单一、品位不高,限制了产品附加值的提升,不利于农户油樟种植积极性的提高,影响了产业的发展。开展油樟加工技术的研究是促进油樟产业快速、健康发展的关键。

参考文献:

[1]罗中杰,李维一,魏琴,等.宜宾油樟的现状及未来[J].四川师范大学学报:自然科学版,2001,24(3):317-319.

[2]李毓敬,李宝灵,曾幻添,等.湖南油樟的化学类型[J].植物资源与环境,1993,2(3):7-11.

[3]陶光复,丁靖垲,孙汉董.湖北油樟叶精油的化学成分[J].武汉植物学研究,2002,20(1):75-77.

[4]黄远征,温鸣章,赵蕙,等.关于油樟叶芳香油化学成分的研究[J].武汉植物学研究,1986,4(1):59-63.

[5]尹礼国,卿海军,曾林久,等.三种方法制备的岩桂叶精油(浸膏)的分析[J].林产化学与工业,2009,29(6):69-72.

[6]程必强,喻学俭,丁靖垲,等.[HJ2mm]中国樟属植物资源及其芳香成分[M].昆明:云南科技出版社,1997:34-35.

[7]王文元,顾丽莉,吴志民.1,8-桉叶油素的研究进展[J].食品与药品,2007,9(02A):56-59.

[8]夏克坚,任宇红,聂丽娟,等.β-水芹烯的合成与应用[J].南昌大学学报:理科版,2001,25(4):380-382.

[9]罗小龙.黄樟油素的生产及应用[J].林产化工通讯,1998(5):24-27.

[10]林大清,池淑君,袁定国,等.樟叶油对雄性小鼠生殖细胞的诱变性[J].癌变·畸變·突变,1994,6(5):27-29.

[11]罗中杰,黄亮.气相色谱法测量空气中的黄樟素[J].化学研究与应用,1999,11(1):99-101.

快速主成分分析 篇4

在经济管理、工程技术等研究领域,多元线性回归是应用最为广泛的统计分析与预测技术之一,它一般采用最小二乘方法(Ordinary Least Squares,简称OLS)估计回归系数,以使残差平方和达到最小;但当数据观察次数n小于自变量个数p时,自变量之间存在多重相关性,此时OLS方法失效。而这种自变量之间多重相关性问题在多元线性回归分析中危害非常严重,但又普遍存在。为消除这种影响,目前学术界的解决方法主要有两种:(1)采用主成分回归(Principal Components Regression,简称PCR)方法,这种方法虽然能够消除自变量之间存在的多重相关性,但由于提取成分时没有考虑到与因变量的联系,因此经常出现主要成分对因变量的解释性不强的情况。(2)针对PCR的缺陷,文献[1]中提出了偏最小二乘回归(Partial Least Squares Regression,简称PLSR)方法。近年来的理论和实践研究都表明,PLSR的成分提取和参数估计依然会受到自变量严重多重相关性的影响[2]。此外,其迭代算法容易产生较大的累计计算误差。

本文从经典主成分回归的基本原理出发,分析了PCR的优点和不足,重点探讨了主成分个数m优化选择问题,并用我国沪指数据与所有的沪市A股交易波动数据进行PCR实证分析。

1主成分回归基本原理[4]

因变量Y与p个自变量X1,X2,…,Xp,做n次观察的多元线性回归模型为:

记Z=(Z1,…,Zr,…,Zp),则

Z=X·A,X=Z·AT,由主成分原理知,Z1,…,Zp即为X的所有主成分。

由高斯-马尔科夫定理可知,式(2)中,回归系数B的最小二乘线性无偏估计为:

主成分回归方程为:

2 PCR方法性能分析

评价线性回归模型的性能可从两方面进行:拟合的有效性和模型的稳定性。下面从式(4)中分析Y与X的回归性能(特别情况下,可从式(3)中取数分析)。

3主成分个数m与模型性能关系分析

4 PCR方法实证分析

设pij表示某j只股票第i周的收盘价,其对数收益为:xij=lnpij-lnp(i-1)j,现从2013年6月1日至2014年8月31日沪市A股65个交易周中,滤去有停牌的股票,共选取640只股票及相应的沪市A股大盘指数周收益数据Y=(y1,…,y65)T,得数据矩阵如表一所示。

图一前30个主成分的累计贡献率

图二主成分个数m与残差平方和、回归系数的均方误差

(4)当m=27时,由Matlab7.0编程,得主成分回归模型:

图三应变量Y与其估计值的拟合

后13周预测拟合图如图四所示。

图四应变量Y的预测与其观测值的拟合

5模型检验

6结束语

从本文的实证分析中可看出,对于自变量个数p较大,而样本数m较小的情况下,PCR是一种非常有效且适用的技术方法,其拟合和预测效果均比较理想。

摘要:针对多元线性回归模型中,自变量之间存在多重相关性问题,本文根据主成分回归原理建立模型,对主成分个数选择与模型的性能之间的关系进行了详细分析,并用沪市A股收益波动性数据进行了实证分析。结果表明:当主成分个数m增加时,模型的残差平方和SES会下降,而回归系数的均方误差MSE会上升,因此m的选择应以SES和MSE的变化趋势交点为宜。

关键词:多元线性回归,最小二乘法,主成分回归

参考文献

[1]Wold S,Albano C,Dunn M,et al.Pattern Regression Finding and Usingr Egularitiesin Multivariate Data[M].London:Analysis Applied Science Publication,1983.

[2]王惠文,王吉力,黄海军.主成分回归的建模策略研究[J].北京航空航天大学学报,2008,34(06):661-664.

[3]童恒庆.理论计量经济学[M].北京:科学出版社,2005.

[4]高慧璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[5]曲双红,李华,李刚.基于主成分分析的几种常用改进方法[J].统计与决策,2011,(05):155-156.

[6]韩汉鹏.偏最小二乘法在回归设计多因变量建模中的应用及其优化[J].数理统计与管理,2007,26(02):303-307.

[7]熊幼林.病态线性回归模型系数的主成分——岭估计[J].数学学习与研究(教研版),2014,(09):121.

海洋经济与环境发展的主成分分析 篇5

海洋经济与环境发展的主成分分析

摘要:应用主成分分析方法,对大连海洋经济和环境发展两者之间的关系进行探讨,选取具有代表性、数据齐全的10项指标,对近4年来大连海洋经济和环境发展的情况进行定量分析,筛选出具有良好代表性的2个主成分,并以这2个主成分的贡献率进行加权平均,构造出综合评价函数.以此对大连市在这两者关系的`协调方面进行综合评价.在此基础上,提出海洋经济和环境协调发展的具体建议.作 者:蔡静    张翠霞    侯磊    CAI Jing    ZHANG CUI-xia    HOU Lei  作者单位:蔡静,CAI Jing(大连水产学院,人文法律系,辽宁,大连,116023)

张翠霞,ZHANG CUI-xia(中国科学院海洋研究所,山东,青岛,266071)

侯磊,HOU Lei(沪东造船厂,上海,200129)

期 刊:海洋环境科学  ISTICPKU  Journal:MARINE ENVIRONMENTAL SCIENCE 年,卷(期):2007, 26(3) 分类号:X22 P74 关键词:主成分分析    海洋经济    环境发展    海洋产业   

快速主成分分析 篇6

关键词:主成分分析 财务绩效 评价指标

1.财务绩效评价指标体系的构建

1.1盈利能力指标

营业利润率(X1):营业利润率是指企业的营业利润与营业收入的比率。计算公式为: 营业利润率=营业利润/全部业务收入×100%。

净资产收益率(X2):用以衡量公司运用自有资本的效率。计算公式为:净资产收益率=净利润/净资产×100%。

总资产利润率(X3):用来说明企业运用其全部资产获取利润的能力。计算公式为:总资产利润率=利润总量/资产平均总额×100%。

1.2营运能力指标

存货周转率(X4):用于反映存货的周转速度。计算公式为:存货周转率=销货成本/平均存货余额。

1.3偿债能力指标

资产负债率(X5):表示公司总资产中有多少是通过负债筹集的。计算公式为:资产负债率=负债总额/资产总额×100%。

流动比率(X6):是流动资产对流动负债的比率。计算公式为:流动比率=流动资产/流动负债×100%。

速动比率(X7):是指速动资产对流动负债的比率。计算公式:速动比率=速动资产/流动负债=(流动资产-存货)/流动负债。

1.4发展能力指标

净资产增长率(X8):反映了企业资本规模的扩张速度。计算公式:净资产增长率=(期末扣除其他资本公积的净资产/期初扣除其他资本公积的净资产-1)×100%。

总资产增长率(X9):企业本年总资产增长额同年初资产总额的比率。计算公式:总资产增长率=本年总资产增长额/年初资产总额×100% 。

净利润增长率(X10):是反映企业成长能力的一个重要指标。计算公式:净利润增长率=(本年净利润增长额/上年净利润)×100%。

2.主成分分析的基本思想

2.1基本思想

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一個综合指标的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。

2.2主要步骤

(1)设原始数据矩阵X=(xij)n×p,其中,i=1,2,……,n;j=1,2, ……p;n表示n个样本;p表示p个指标;xij表示第i个样本的第j个指标值;

(2)将原始数据资料标准化;

(3)计算变量的相关系数矩阵R;

(4)计算R的特征值及相应的特征向量;

向量。首先解特征方程|λi-R|=0,求出特征值λi( i, j=1,2,…,p ),并使其按大小顺序排列,即λ1≥λ2≥…≥0;然后分别求出对应于特征值λi的特征向量ei( i=1,2,…, p);

(5)Zi=a1iX1+a2iX2+…+apiXp即为所求主成分,其中i=1,2,…,p;

(6)求累积贡献率。

(7)构造综合评价函数。选择m个主分量,以每个主分量所对应的特征值占所提取主成分总的特征值之和的比例作为权重,得到综合评价函数。

3.财务绩效指标主成分分析的实证分析

本文选取了中原高速、同力水泥、双汇发展、平煤股份、许继电气、中航光电、太龙药业、郑州煤电、中原环保、ST思达、宇通客车、三全食品、中孚实业、瑞贝卡、天方药业、羚锐制药、新野纺织、利达光电、轴研科技、神火股份、豫能控股、ST安彩、恒星科技、黄河旋风、平高电气、风神股份、豫光金铅、林州重机、焦作万方。财务绩效指标数据来源主要是各个银行2011年年报,原始指标体系是在年报的基础上计算整理得出,能够通过对这29家河南省上市公司在2011年经营情况的研究看出河南省上市公司最新的发展水平。

运用Minitab软件进行数据的分析处理,结果如下:

由相关矩阵的特征分析可知,10个特征值的方差百分比及累计方差百分比表明:第一个特征值是4.0046,第二个特征值是2.0722,第三个特征值是1.3212,这前三个的特征值均大于1,而其余的均小于1。

第一、二、三的特征值的累计方差百分比是0.740。上述都表明原来10个变量反映的信息可由三个主成分反映74.00%,一般认为,累计方差百分比达到70%以上,即认为比较满意。而本文的累计贡献率是74.00%。

运用Minitab最终得出:在河南省29家上市公司中,林州重机、平高电气、焦作万方、黄河旋风、三全食品等几家公司的综合评价处于领先地位。其中,林州重机、黄河旋风、三全食品虽然综合排名靠前,但发展能力方面仍有很大改善空间。另一方面,豫光金铅、中原高速、ST思达、ST安彩、豫能控股的综合财务状况排名比较靠后,需要加以改善。

参考文献:

[1] 张晓峰,李博.主成分分析法在上市公司财务业绩评价中的应用[J].财会月刊.2007.12

[2] 彭亚. 基于主成分分析的上市公司经营管理业绩评价[J]. 山东商业职业技术学院学报.

2010年12月

快速主成分分析 篇7

本文的数据收集自《中国食物成分表》[1], 经过仔细筛选, 确定了如下指标作为解释主食营养的指标:能量 (千卡) X1;蛋白质 (克) X2;脂肪 (克) X3;碳水化物 (克) X4;维生素E (毫克) X5;铁 (毫克) X6;钙 (毫克) X7。用主成分分析法将以上指标重新组合成少数几个相互无关的综合变量。采用的标准化处理方法是对指标进行正态化。即令xi*= (xi-X軍i) /Si, 其中X軍i和Si分别是指标xi的样本均值和样本标准差。

2 主成份分析模型

主成份分析法 (Principal Component Analysis, PCA) 也称主分量分析或矩阵数据分析, 通过变量变换的方法把相关的变量变为若干不相关的综合指标变量[2]。

若某研究对象有两项指标ζ1和ζ2, 从总体ζ (ζ1, ζ2) 中抽取了N个样品, 它们散布在椭圆平面内 (见图1) , 指标ζ1与ζ2有相关性。η1和η2分别是椭圆的长轴和短轴, η1⊥η2, 故η1与η2互不相关。其中η1是点ζ (ζ1, ζ2) 在长轴上的投影坐标, η2是该点在短轴上的投影坐标。从图1可以看出点的N个观测值的波动大部分可以归结为η1轴上投影点的波动, 而η2轴上投影点的波动较小。若η1作为一个综台指标, 则η1可较好地反映出N个观测值的变化情况, η2的作用次要。综合指标η1称为主成份, 找出主成份的工作称为主成份分析。

可见, 主成份分析即选择恰当的投影方向, 将高维空间的点投影到低维空间上, 且使低维空间上的投影尽可能多地保存原空间的信息, 就是要使低维空间上投影的方差尽可能地大。[2]

3 主成份分析法的应用

3.1 原始数据的处理和标准化

首先对所选14种主食的营养成分含量进行标准化, 然后利用SPSS软件对标准化后数据进行分析。得到相关矩阵 (表1) 。

3.2 中国主食营养成分主成份分析的计算结果

利用SPSS软件对标准化后数据进行分析得到公因子方差 (如表2) 、解释的总方差 (如表3) 。

第一主成分解释了总方差的33.311%, 第二主成分解释了总方差的27.931%, 第三主成分解释了总方差的18.000%, 第四主成分解释了总方差的14.689%。四个主成分累计方差贡献率为93.931%。这说明四个主成分能够解释这7个变量约94%的信息。

列出前四个主成分的特征向量并计算综合得分。如表4。

第一主成分的表达式为:F1=-0.023X1-0.388X2+0.895X3-0.448X4+0.853X5-0.626X6-0.244X7。同理可得其他主成分F2, F3。

构造综合营养指标函数。以各主成分的贡献率为权重构造各种主食的营养指标函数, 公式如下:

最后算出主食的综合得分并排名, 结果如表5。

3.3 结果分析

通过SPSS软件进行主成分分析, 得到四个主成分。第一主成分称作脂肪维E因子, 第二主成分称为能量碳水化物因子, 第三主成分称为铁钙因子, 第四主成分称为蛋白质因子。

为维持正常的生理功能, 维生素是人和动物必须从食物中获得的一类微量有机物质。维生素E是一种脂溶性维生素, 不溶于水而溶于脂肪或脂肪溶剂, 它在生物体内的存在与吸收都与脂肪有关。故维生素E和脂肪是一对好搭档, 常态下, 维生素E就溶解在脂肪里, 它们组成第一主成分显然合理。多食用第一主成分高的食物, 可以帮助我们由内而外抗氧化, 从身体内部到皮肤外表得到全面延缓老化的效果。

人类膳食中, 能量的60%-70%来自于碳水化合物, 故碳水化合物和能量具有正相关性, 组成了第二主成分, 反映了食物能量含量。碳水化合物在体内氧化速度较快, 能够及时供给能量以满足机体需要。碳水化合物可以保障人体能量和营养素的需要、改善胃肠道环境和预防龋齿。我国营养专家认为碳水化合物产热量占总热量的60—65%为宜。

第三主成分由钙和铁组成, 反应了食物的矿物元素含量。其中矿物质元素是核心, 如, 钙不仅仅是造体元素, 也是生理代谢不可缺少的元素, 许多疾病都与缺钙有关。铁是人体血红蛋白、肌红蛋白、细胞色素和酶系统的重要组成成分, 是人体生理代谢、营养平衡的必需元素, 一旦缺乏就会引起铁缺乏症。

第四主成分为蛋白质因子, 反应了食物的蛋白质含量。

4 结论

本文得到了中国主食营养因素的四个主成分。分别是:第一主成分称作脂肪维E因子, 第二主成分称为能量碳水化物因子, 第三主成分称为铁钙因子, 第四主成分称为蛋白质因子。

本文中, 脂肪维E因子含量最高的是玉米 (白, 包谷) , 能量碳水化物因子含量最高的是稻米 (大米) , 铁钙因子含量最高的是小米, 蛋白质因子含量最高的是稻米 (香大米) 。而综合排名第一的是玉米面 (白) 。推荐以上四种作为日常主食。荞麦、大麦 (元麦) 、苦荞麦粉排名靠后, 不推荐作为日常主食, 但可以和其他主食搭配食用, 取长补短。

对于加强营养, 我们要考虑三方面, 即蛋白质、矿物质和维生素。[3]首先考虑蛋白质。普通健康成年男性或女性每公斤体重大约需要0.8克蛋白质。目前大众饮食日趋高热量化, 我们要防范蛋白质及热量摄入过多的危害。其次, 考虑补充矿物质和维生素。矿物质和维生素都属于人体生长发育的六大营养素。维生素、矿物质是功能性营养素[4]。以稻米为主食的南方人, 应该多吃些小米、荞麦, 增加钙铁等矿物质的摄取。由于不同谷类的营养侧重不同, 食用多种粮食可以弥补单一种类营养物质的不足。比如我们经常吃的八宝粥、杂粮馒头等, 不仅美味, 而且营养丰富。改变主食结构、丰富主食种类, 对提高健康意义重大。

注:可食部分均计100.

摘要:本文利用主成分分析方法, 以中国传统主食为研究对象, 选择小麦粉、稻米、玉米面、高粱等14种原料, 查找其能量、蛋白质、脂肪、钙等7种营养相关因素的含量, 通过SPSS软件进行降维分析, 得出四种主成分第一主成分称作脂肪维E因子, 第二主成分称为能量碳水化物因子, 第三主成分称为钙铁因子, 第四主成分称为蛋白质因子。它们解释了样本所研究的营养因素总数的93.931%, 较好地概括反映了样本的营养值。主食营养对人们身体健康的影响不容忽视, 本文提出了改善主食结构, 加强主食营养的建议。

关键词:主成分分析法,营养成分,中国主食

参考文献

[1]中国食物成分表[M].2版.北京大学医学出版社.2009, 12.

[2]汪应洛.系统工程[M].4版.机械工业出版社.2011, 6:54-60.

[3]王晓芳, 李林轩.专用小麦粉生产中的品质监控[J].现代面粉工业, 2010, 6:27-30.

教室卫生评价指标的主成分分析 篇8

教室是学生学习的最主要场所,学生在学校的大部分时间都是在教室中度过,因而教室卫生对学生健康影响较大。主成分分析法是良好的构效关系分析方法,为完善标准,了解各指标的实际关联,笔者用主成分分析法对《评价》中的教室主要指标进行了分析。

1 对象与方法

1.1 对象

随机抽取沈阳市和平区6所中小学教室进行卫生监测,其中小学3所,中学3所。每所学校每个年级调查1间教室,共调查31间教室。

1.2 方法

1.2.1 测量

按照《评价》的要求进行教室卫生学指标测量。

1.2.2 主成分分析

利用SPSS 11.5软件[2]对实际调查中影响教室得分的主要指标,如人均面积、课桌椅符合率、采光系数、玻地比、教室照度、CO2体积分数、室温、教室噪声等,进行主成分分析,列出主成分表达式,探讨各成分的意义,并对同一成分中部分指标进行相关分析,分析各因子间关系

1.2.3 相对权重

将各主成分表达式乘以相应的特征根,得到各指标的系数,归一化后,即可得到相对权重,进而确定主要影响因素;将原标准相应权重归一化,与新权重进行比较。

2 结果

经KMO检验及球型检验,该数据符合主成分分析的要求。 特征根及方差贡献率见表1。根据特征根及方差贡献率大小综合考虑,决定提取前4个主成分,各成分因子负荷见表2。

通过观察因子负荷和因子得分(表3)可以发现:第1主成分主要由人均面积、采光系数、教室照度构成,其中教室照度、采光系数2项占主要部分,可以认为该成分主要反映了包括教室的自然照明(采光系数)和人工照明(教室照度)的实际综合光照情况。另外,人均面积为负指标,经相关分析发现人均面积与采光系数和教室照度均呈显著负相关(r=-0.648,P<0.01,r=-0.588,P<0.01),因而推测,人均面积可能为影响教室照明的负性影响因素。

第2主成分主要由教室噪声和玻地比构成,按照《评价》的要求,测量外界噪声干扰要分别在开窗和关窗时进行2次,以关窗为本底值,故而教室噪声与窗口的大小或玻地比可能有相关性。经相关分析教室噪声和玻地比呈正相关(r=0.402,P<0.05)。因此推测第2主成分主要反映外界环境通过窗户对教室的影响,且以噪声为主。

第3主成分主要由CO2体积分数和室温构成,它们同是标准中室内微小气候的指标,因而该成分反映教室室内微小气候。

第4主成分主要由课桌椅符合率构成,反映教室课桌椅情况。

简化的主成分表达式如下:

Z1=-0.352X1+0.343X3+0.332X5

Z2=0.426X4+0.580X8

Z3=0.585X6+0.526X7

Z4=0.899X2

将各主成分表达式乘以相应的特征根,得到各指标系数,归一化后,即可得指标的相对权重(表4)。影响程度最大为光照的总体情况(26%),其次是微小气候(包括CO2体积分数、室温,共占23%),噪声(14%)。

将原标准相应的权重归一化,与新权重进行比较。教室照度、室温、CO2体积分数、教室噪声、人均面积权重与原标准相差不大,采光系数、玻地比权重增大,课桌椅符合率权重减小。

3 讨论

3.1 各指标间的相互关系

通过分析发现,学校教室卫生指标主要可以分为4类,1类即包括教室的自然照明(采光系数)和人工照明(教室照度)实际光照的综合情况;2类主要为外界环境通过窗户对教室的影响,且以噪声为主;3类为室内微小气候由CO2体积分数和室温构成;4类反映教室课桌椅情况,由课桌椅符合率构成。这与《综合评价标准》划分的维度基本相符,建议将自然照明和人工照明划为同一维度。

分析结果发现,人均面积在光照主成分中为负性作用,且与教室照明和采光均呈负相关,在调查中笔者也发现类似情况。对于这一现象笔者认为城市地区教室的大小大致相同,教室人均面积主要取决于教室人数[3,4,5],人均面积大,人数也较少。这样的教室通常照明较差,采光也不好,可能的原因一是由于教室人数少,座位相对分散,在同样照明的情况下,单位课桌面积的平均照度也有所下降;二是该类教室多是非重点教室,灯具陈旧、损坏严重,教室位置不好,采光较差。另外,人数较少,为了节能,灯具使用率也人为地减低。教室人均面积的原标准确定主要依据课桌的长度[6],目的是为了座位的舒适;但通过分析发现,人均面积与照明亦有一定关联,应该在今后修订标准时加以适当考虑这一混杂因素,减少其对评价结果的干扰。

分析还发现噪声与玻地比呈正相关,并且同为一个主成分的影响指标。因而,噪声可能与玻地比存在某种关联,或有共同的作用。由于2者都与直接通向外界的窗户大小关联,故提示玻地比可能反映了外界环境通过窗户对教室的影响。因而,玻地比不仅仅与采光有关,建议今后应该考虑制定一个通过窗户这一重要媒介影响教室的能反映外界声、光、影像干扰的综合指标。

CO2体积分数、室温共同反映了冬季室内微小气候的情况。调查发现 CO2浓度、室温的因子系数符号相同,提示2者作用是同向的,他们共同反映教室空气质量,高CO2则教室空气质量差,同样过高室温也不是良好环境的反映,因此冬季室温不宜过高,原标准仅有室温下限,建议参考《儿童少年卫生学》规定的16~20℃[6]的范围制定其上限。

3.2 各因素对教室卫生状况的影响及权重大小的修订

参考各成分构成和各指标权重,笔者发现光照是当前影响教室卫生的最重要的指标,无论是光照的总体情况(26%)或是采光系数、教室照度都有较大权重。提示今后应改善教室光照。另外,反映自然光的采光系数权重有较大提升,反映各教室在自然光方面有较大差异,今后应加强监测,努力改善;同时也应规范测量的方法,减少其不确定性[7]。

指标权重的决定最好由专家主观经验和统计学依据2方面因素共同决定[8]。既要使权重反映指标的卫生学重要性,又要考虑在实际测量中变异波动的情况。原标准的权重主要依据专家经验,结合此次实际调查分析后,建议应适当提高采光系数、玻地比的权重,减小课桌椅符合率的权重。

当然,此次评价仍存在许多不足之处,欠缺对农村学校的评估,评价指标也仅限于教室卫生的主要指标,有待于今后进一步改进。

参考文献

[1]卫生部学校卫生标准专业委员会.学校卫生监督综合评价.GB/T18205-2000.北京:中国标准出版社,2000:1.

[2]唐功爽.基于SPSS的主成分分析与因子分析的辨析.统计教育,2007(2):12-14.

[3]郑志华.2000年云南省学校卫生监测结果分析.中国校医,2003,l7(1):50.

[4]李香兰,徐能义,赵金龙.包头市区中小学校经常性卫生状况调查分析.包头医学院学报,2003,18(3):186-188.

[5]冯碧君,赵薇,蔡建忆.宁波市区16所中学卫生监督监测结果分析.海峡预防医学杂志,2003,9(2):54.

[6]叶广俊,主编.儿童少年卫生学.4版.北京:人民卫生出版社,2000:156-167.

[7]张宁,沈明珠.教室采光系数测量的不确定度评定.中国校医,2003,17(5):428-429.

玉米籽粒特征提取及主成分分析 篇9

1 玉米种子图像特征提取

首先进行图像获取,通过研究测定,用黑色背景使得图像处理效果更好,因此背景选用黑色,使光照均匀不影响颜色效果,原始图如图1所示。

在进行特征提取前要对图像进行预处理,以便于下一步参数的提取,预处理的过程如图2所示。

预处理完后,针对玉米种子图像特点,由于几何特征能够直观反映种子的外形特征,因此是一大重要参数类别,几何特征包括:轮廓点数、周长、面积、圆形度、当量直径、长轴、短轴、伸长度、矩形度、最大内切圆和最小外切圆。

玉米籽粒的颜色是反映品种和品质的一个重要指标,所有颜色都由红(R)、绿(G)、蓝(B)三基色组合,是易于硬件使用的颜色空间,HSI色彩是适合人的视觉的颜色空间,描述为图像的亮度。亮度I计算公式:I=0.3R+0.59G+0.11B。将读入的彩色图像根据前面的几何特征提取进行单籽粒区域定位,其定位图如图3所示,提取定位后单个籽粒的各个颜色值。分别为RGB和HSI色彩空间的R、G、B、H、S、I均值和标准差共12个。

纹理是一种反映像素灰度的空间分布属性的图像特征, 通常表现为局部不规则但宏观有规律的特征。常用的纹理统计量有均值:m, 标准差:, 平滑度:R=1-1/ (1+μ2) , 三阶矩:μ3, 一致性:。不变矩:

获取籽粒特征部分数据见表1、表2和表3。

2 主分量分析

主成分分析是将提取的众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标的统计方法,是数学上处理降维的方法。基本思想是将提取特征数据P个指标作线性组合,按信息量进行排列的综合指标(F1, F2,…,Fp)。其中F1是“信息最多”的指标,线性组合中使var (F1)最大的组合对应的指标,称为第一主成分;F2为第二信息最多的指标,即cov (F1, F2)=0且var (F2)最大,称为第二主成分;依次类推。可知(F1, F2,…,Fp)互不相关且方差递减。在实际应用中选取前几个最大的主成分(总贡献率达到85%以上),以达到了降维的目的。基本步骤: (1) 指标数据标准化; (2) 指标之间的相关性判定; (3) 确定主成分个数m; (4) 主成分Fi表达式; (5) 主成分Fi命名。

本文共提取原始特征共36个,通过主成分分析可以进行特征优化,主成分得分进行排序,同时计算累计贡献率,如图4所示。

由图4可知:主分量10个的时候,其累计得分就可以达到90%以上,这样取的10个主分量即可以代替前面36个特征数据,很大程度上减少了计算量,提高了用图像识别的速率。

3 支持向量机

统计学习理论就是利用有限的客体特征量将其分到某个类别中去以获得最优分类结果,这样的分类需要一个判定规则,而支持向量机是在统计学习理论的基础上发展的解决小样本、非线性和高维模式问题的方法。本文选择SVM进行分类识别,它与神经网络相比,有良好推广性,具有全局最优解,并解决维数灾难问题。该方法的机理可以简单描述为:寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化。

本文将前述提取的特征量进行主分量分析,基于支持向量机采用3个品种来分析优化后的数据并进行识别验证。

4 结论

本研究表明,对玉米籽粒提取的特征用主分量分析能够获取优化,这样不仅精简数据,减少了计算量,并且之后用支持向量机进行识别能够达到较高的识别率,这对以后采用图像识别品种,进行等级判定等都具有良好参考价值。

摘要:玉米种子的形态特征、颜色特征及纹理特征参数对玉米种子的质量评定和品种的识别有着决定性的作用, 然而对种子的所有特征进行提取, 并用其作为判别标准不仅计算量大而且因为数据存在相关性而影响准确率。本文针对这个问题对玉米种子的特征进行提取后并用主分量分析方法进行特征优化, 利用此结构构建的特征库实现径向基SVM对玉米品种的识别, 验证其准确率高达97%。

关键词:玉米种子,特征提取,主分量分析,支持向量

参考文献

[1]韩仲志, 匡桂娟, 刘元永, 等.基于形态和颜色特征的花生品质检测方法[J].花生学报, 2007, 36 (4) :18~21.

[2]郝建平, 杨锦忠, 杜天庆, 等.基于图像处理的玉米品种种子形态分布及其分类研究[J].中国农业科学, 2008, 41 (4) :994~1002.

[3]闸建文, 陈永艳.基于外部特征的玉米品种计算机识别系统[J].农业机械学报, 2004, 35 (6) :115~118.

[4]熊凯, 李向红, 李言照, 等.基于ANN和PCA的玉米品种特征分析与识别研究[J].粮油食品科技, 2010, 18 (4) :1~5.

快速主成分分析 篇10

关键词:财务业绩,主成分分析,军工企业,沪市

鉴于军工类上市公司在股市中不断展现出来的强劲态势, 投资者需要有一个较为完整的财务业绩评价体系和精确的业绩评价方法, 以此来评价企业的经营成果和预测企业今后的发展走向。而目前, 理论界和实务界在研究企业业绩评价体系构建时通常会忽视以下几方面的问题:

一是企业业绩评价的概念界定, 而概念的澄清是研究企业业绩评价的前提条件。二是企业业绩评价体系构建的行业特色问题。不同行业的企业经营过程有很大的差异, 如果不加区别地比较其现实意义较低。三是财务业绩评价方法的选择问题。精确度高、客观性强的方法对取得有价值的评价结果至关重要。

对军工企业财务业绩评价的最终目的在于全方位地了解企业经营理财的状况和对社会的贡献, 并籍以对企业经济效益的优劣作出系统的、合理的评价, 为决策者提供更加真实可靠的业绩评价依据。

一、研究设计

(一) 财务业绩指标选取

在对大量相关文献中已涉及的企业财务指标进行搜集整理的基础上, 本文初步选取了5个衡量企业偿债能力的财务指标、4个盈利能力财务指标、4个营运能力财务指标、4个发展能力指标。此次调查问卷根据上述初选指标, 对于每个指标设置五个选项, 均以“非常重要、较重要、一般、较不重要、不重要”形式列示, 按照5, 4, 3, 2, 1赋予每个选项得分值。重要性判断赋值规则如表1所示。

利用专家调研法 (Delphi法) 调整后的财务业绩评价指标体系如表2所示。

(二) 样本选取

根据中国证监会颁布的《上市公司行业分类指引》, 剔除2011年度被ST和PT的公司, 本文选取了中国船舶、航天机电、中航重机、航天机电等29家在上海证券交易所上市的军工企业作为样本。样本数据来源于wind数据库或巨潮资讯网中样本公司披露的年报资料, 采用SPSS7.0统计软件进行分析, 其中样本基础数据如表3所示。

(三) 研究方法

主成分分析法是把多指标化为少数几个综合指标的多元统计分析方法, 综合指标通常表示原指标的线性组合。其实质思想是使用尽可能少的变量 (主成分) 反映原始数据中尽可能多的信息, 以简化数据, 突出主要矛盾。主成分分析法的基本步骤:

第一步, 采集p维随机向量x= (x1, x2, ..., xp) T, n个样品xi= (xi1, xi2, ..., xip) T, i=1, 2, ..., n, n>p, 构造样本阵X;

第二步, 对样本阵X中的元进行一致化处理:对正指标yij=xij, 对逆指标yij=-xij, 得矩阵Y;

第三步, 对Y进行标准化变换得到标准化阵Z;

第四步, 对标准化阵Z求样本相关系数阵R;

第五步, 解相关系数阵R的特征方程的p个特征值;

第六, 按确定m值, 使信息的利用率达到85%以上。对每个λj, j=1, 2, ..., m, 解方程组Rb=λjb, 得单位特征向量:bj0=bj/‖bj‖;

第七步, 求出zi= (zi1, zi2, ..., zip) T, i=1, 2, ..., n的m个主成分分量uij=ziTbj0, j=1, 2, ..., m, 得主成分矩阵U。ui为第i个样品的主成分向量, i=1, 2, ..., n, 它的第j个分量uij是向量zi在单位特征向量bj0上的投影, j=1, 2, ..., m。

第八步, 选择适当的主成分价值函数模型, 进一步把m维系统降成一维系统。

二、实证结果分析

因为主成分分析本身具有将数据优化的功能, 所以本文采用一致化后的数据, 利用SPSS17.0对2011年29家军工企业筛选后的9项财务业绩指标进行分析。

(一) 提取主成分

先将筛选后的原始数据由excel转入SPSS数据窗口中, 进行因子分析, 具体分析结果如表4所示。

表4给出了旋转后的因子载荷, 只有前3个因子的特征值大于1, 且前3个因子的累积方差贡献率达到了84.926%, 说明可以解释原始数据的绝大部分信息。因此提取前3个因子作为主因子。

(二) 转后的载荷阵

根据表5所示, 提取三个主成分的累计方差贡献率已经达到84.926%, 即它包含了原始数据84.926%的信息。因此, 这三个主成分就能很好地评价29家电力公司的电网发展经济性, 其线性组合方程如下:

(三) 主成分的经济意义

1.第一主成分Y1中, 除X4和X6外的各变量系数较为均匀, 且从系数看各变量权重相差不大, 因而可以看成是综合评分, 该主成分得分高说明军工企业财务业绩评价越好。

2.第二主成分Y2中, 除X8和X9外的各变量系数权重相差不大, 其中总资产增长率X8和净利润增长率X9两类指标权重较大, 因而可看作反映发展能力的综合评分。

3.第三主成分Y3中, 各变量系数差异较大, 特别是X1、X3、X4、X6的变量系数权重较大, 主要集中在偿债能力和营运能力以及盈利能力三类指标中。为了对29家军工企业财务业绩评价作出综合评价, 可用每一个主成分的贡献率作为权重, 对这3个主成分进行加权平均, 求出综合得分。

则29家军工企业的综合排名如表6所示:

三、结论

本文利用主成分分析法对军工企业的财务综合业绩进行综合评价, 其评价结果居于前五位的依次为洪都航空、航天信息、航天长峰、中国卫星、广船国际, 而居于后五位的几家公司是哈飞股份、航天电子、风帆股份、中国船舶、贵研铂业。由于所采用的财务指标值为进行一致化处理的数据, 由此计算的得分有正有负, 负数表示该上市公司财务水平低于平均水平, 正数则表示该上市公司财务水平高于平均水平。

此外, 第四主成分的分值普遍偏低, 这反映出我国军工企业未来成长能力不足, 这一方面与企业我国军工发展现状有关, 本文所选取的样本企业多居于成熟的发展阶段, 这一时期发展相对平稳, 不会显示很强的发展势头;另一方面构成企业“现金平衡动力之一”的经营活动现金净流量创造不足, 成为制约军工企业成长的重要原因, 收益质量普遍存在问题。除了综合排名第一位的洪都航空, 其成长能力是正值, 其余公司虽然其总体财务业绩良好, 但是其成长能力及营运能力不容乐观。至于衡量企业长期偿债能力的资产负债率, 29家公司指标值均为负值, 低于平均水平, 这也充分说明了, 要想提高企业的财务业绩, 军工企业应分提高其长期偿债能力。

因此, 本文建议上市军工企业应当分阶段、有主次的综合加强企业在偿债、盈利、营运等方面的能力, 追本溯源当务之急是提高经营活动创造收入的能力, 同时必须注重收益质量的提高。在这里, 由于本文所采用的指标值为进行标准化处理后的数据, 由此计算的得分有正有负, 负值表示该军工企业财务业绩水平低于五家企业的平均水平, 正值则表示该军工企业的财务业绩水平高于平均水平。

参考文献

[1] .何永秀, 刘敦楠, 罗涛等.电力综合评价方法[M].北京:华北电力大学, 2011.

[2] .何永秀, 韩金山, 李莹.电力与经济关系的计量分析[M].北京:中国电力出版社, 2008.

[3] .李涛, 郭小晶, 胡浩.火力发电企业财务经营状况评价体系的构建[J].财会研究, 2011.

[4] .张蕊.企业财务业绩评价理论与方法的变革[J].会计研究, 2001, (12) :46-50.

[5] .Baio G, Pammolli F, Baldo V, etal.The economic evaluation of influenza vaccination in the elderly population:A model based on Bayesian Networks[J].VALUE IN HEALTH, 2004, 7 (3) :359.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:66553826@qq.com

上一篇:主要成分分析 下一篇:分类主成分分析