一、引言
整个私募股权市场的投资重心偏向沿海等发达地区, 尤以北京和上海两个城市为重, 内陆地区只有星星点点的投资项目, 但单项投资金额较大。传统行业最受PE投资机构青睐。这与国外PE在帮助高科技和创新企业成长方面发挥主要促进作用, 存在较大差异。究其原因, 一是国内许多高科技企业, 如生物制药等行业的发展还处于起步阶段, 其稳定性和成长性都不能满足PE投资的要求;二是股票市场发展不完善, 创业板市场的缺位使有意投资于高科技行业的投资者望而却步;三是与欧美等发达私募股权资本市场相比, 中国政府的税收和政策优惠都不明显, 且股票市场对高科技公司和私有公司的关注也不够。
二、基准模型研究
(一) 径向基函数神经网络
径向基函数神经网络 (RBFNN) 是一种使用径向基函数作为激活函数的仿真网络。它是一个常用的三层前馈神经网络, 具有输入、隐藏和输出层。
令输入向量x=[x1, x2, ..., xn]和输出层向量y=[y1, y2, ..., y]。w=[ω1, ω2, ..., ωk]代表隐藏输出权向量, k表示隐藏节点总数。径向基函数可以具有不同的形式, 其中最常用的是高斯函数:
其中ci和σi分别表示第i个节点的中心和扩展宽度。一般来说, RBFNN训练有两个步骤:第一步是确定径向基函数的参数, 第二步是通过监督学习方法确定输出权重w。
(二) K近邻算法
K近邻算法是最近邻算法的一个推广。该规则将是一个测试数据点x分类为与它最接近的K个近邻中出现最多的那个类别。K近邻算法从测试样本点x开始生长, 不断地扩大区域, 直到包含进K个训练样本点为止, 并且把测试样本点x归为这最近的K个训练样本点中出现频率最大地类别。其中测试样本与训练样本的相似度一般使用欧式距离测量。
三、基金投资决策模型建立
作为金融业的重要组成部分, 如何挖掘有价值的投资决策具有重要意义。本文首先用k最近邻算法填补缺失值, 然后将学校分为两类, 并将它们分成训练和测试集。由于这两个类别的不平衡, 结论可能会有一定的偏差。
在本文中平衡了训练集并获得了初始样本, 在该过程中, 执行c-SVC和S形核函数, 惩罚因子C和核函数参数g通过交叉验证来优化。得到基于给定数据的实验结果 (超平面H0) 如下。
而后计算每个实例与H0之间的欧几里得距离以确定后验概率。再次使用libsvm工具箱来训练小规模SVC以获得新的超平面H1。
为了反映该模型在金融投资领域的高效可靠的分类性能, 本文采用K-NN和RBFNN来解决同样的问题, 结果如表1所示。在此表中, F1分数用于衡量分类的修正, 它是用来衡量统计二分模型准确度的指标。F1分数可以被看作是加权平均模型的精确度和召回率, 它的最大值是1, 最小值是0。
从表1中可以看出, 与两种经典算法的结果相比, SVC的精度最高, 但运行时间更长。但是在分类性能反面, IE-SVC无论是精度还是运行时间都是最好的。因此通过对大规模、高维度的基金投资数据分析, IE-SVC可以显著降低分类的空间和时间复杂度, 提高准确率。
四、结论
本文将IE-SVC应用于投资基金领域, 与K-NN分类和RBFNN的结果相比, IE-SVC分类在降低空间和时间复杂度以及提高准确性方面具有更高的性能。它可以快速准确地识别大量的投资候选人, 这种方法可以为解决高维度基金投资决策提供有效的方法。
摘要:对于大数据的复杂投资决策, 如何进行风险识别、评估和度量成为投资者迫切需要解决的问题。基于此本文提出了基于信息熵的支持向量分类 (IE-SVC) , 以提高资本投资决策领域的准确性。同时应用两种经典方法, 分别是k-最近邻算法 (K-NN) 和半径基函数神经网络 (RBFNN) 来比较本文算法性能。最终实验结果表明, IE-SVC比其他方法更快, 精度更高。
关键词:基金投资,支持向量分类,半径基函数神经网络,K最近邻算法
参考文献
[1] Deshpande et al.2014.“Item-based top-Nrecommendation algorithms.”Acm Transactions on Information Systems 22 (1) :143-177.
[2] Garcia-Laecina, Pedro.J., J.L.Sancho-Gomez.A.R.Figueiras-Vidal 2009.“K nearest neighbors with mutual information for simultaneous classification and missing data imputation.”Neurocomputing 72 (7-9) :1483-1493.
相关文章:
基于博弈模型的大型工程PPP合作对策研究02-19
急性脑出血患者的病情观察与护理02-19
基于供应链的物流管理过程模型研究02-19
基于某扶贫政策的MOA模型分析研究02-19
基于灰色模型的水泥颗粒分布研究02-19
基于电商冲击模型的市场产品定位策略研究02-19
基于面向对象技术的城市交通仿真模型研究02-19
基于马科维茨模型的股票投资组合实证研究02-19