关键词: 数据
相关系数(精选十篇)
相关系数 篇1
关键词:模糊数据,区间数据,广义模糊数据,相关系数
一、人类认知和思维的模糊性
人类思维主要源自对自然现象和社会活动的认知意识,因而人类知识语言会因本身的主观意识、时间、环境和分析事情的角度不同而具有模糊性[1,2]。如果想要了解某两个变量如X与Y两个现象之间的关系程度,一种最直接方法是先将(X,Y)一组数据的散布图画出来。考察X与Y这两个变量之间呈现何种程度的关系,通常画出数据组散布图,查看X与Y之间的相关性。事实上,任意两个变量之间必定存在某种关系,具体来说包括正相关、负相关或统计无关。因此,测量关系程度的大小则是极为重要的。
在统计学上,使用皮尔森相关系数(Pearson’s CorrelationCoefficient)表达两个变量间线性关系的强度,同时也表达出关系方向。以往相关系数所处理的数据都是明确实数值,但当数据是模糊数据比如区间时,就应适合运用传统方法计算模糊相关系数(fuzzy correlation coefficient)。
社会科学领域中,就搜集到的数据而言,尤其是关于人类的认知及自身活动,绝大部分都体现出模糊数据的特征,最近20年多来,许多研究者开始探索如何将模糊数学用于计算数据的类似性和相关性,如Ragin(2000)[3]和Smithson(1987)[4]就曾探究如何将模糊理论用于社会科学,林原宏(2004)[5]提出模糊相关系数即针对模糊性数据,衡量其类似性(similarity)和相关性的系数。
类似性是计算两个模糊数据(或模糊集合)的类似程度,相关性则是计算一组模糊数据样本,每个模糊样本点的两个模糊数据相关性。尽管文献中存在许多不同公式,如Liu与Kao(2002)[6]研究发现,已有模糊数据相关系数仍存在一些问题,有待进一步完善和发展。
本文研究将针对区间模糊样本数据值求得模糊相关系数,将区间型模糊数据分为离散型和连续型,并依据Liu等所提出相关系数方法先求得模糊相关系数,再对相关系数做适当调整,能使所求出相关系数更加精确。此公式也能用于两个数据为实数或其中一个数据值为实数的情况,可解释更多在实际应用中所发生的相关现象。
二、以往相关系数定义的不足之处
如果想了解X与Y两个现象之间的关系程度,一种最直接方法是,先将(X,Y)的数据散布图画出来。到底X与Y这两变量之间呈现何种程度的关系,通过数据散布图可以查看它们之间的相关性。事实上,任意两个变量之间必定有关系存在,包括正相关、负相关、或统计无关。因此,测量关系程度的大小是关注焦点。
以往线性相关系数通常用ρ表示,代表两个变量X与Y的相关程度,也就是将相关系数定义为
当ρ > 0时,称X与Y之间为直线正相关;当,则称X与Y之间为直线负相关;当ρ = 0时,则称X与Y为之间没有线性相关存在或统计不相关。不过,要求相关系数,必须知道变异数σX2、σY2和它们之间的协方差Cov(X,Y)。在实际应用上,不易得到。因此,用样本相关系数rxy估计ρ,即
其中,(xi,yi)表示第i对观测值,i=1,2,3,…,n;与分别为其样本平均数。
在社会科学研究中尤其是人类活动研究中,区间模糊数据随处可见,在某些情况下,人们无法确定现有信息真正的值是什么。
现在,考察下面的区间模糊数据。区间型模糊数据是一种具有均匀隶属度函数的模糊数据,本文用闭区间符号“[ ]”来表示。当a,b∈R且a < b,则[a,b]表示区间型模糊数据,将a称为[a,b]下界,将b称为[a,b]上界;当a=b,则[a,b]= [a,a] =[b,b] = a = b表示实数a(或b)。同理,实数亦可表示为 [k,k ]。当[a,b]为区间型模糊数据时,设分别表示其中心及半径,也可将区间型模糊数据表示成:。用l = b-a表示此区间长度。
举例来说,某个工人的工资年薪为2.6万—3.5万元这样的区间型模糊数,工时8至10小时也是区间型模糊数,希望知道工资高低和工作时数的相关系数,应该要如何计算呢? 这类区间模糊数据,无法用以往相关系数公式分析。针对上述问题,对于区间型模糊数据,本文提出一类新的模糊数据相关系数公式。
三、一类新的模糊数据相关系数
首先,考虑(xi,yi)为第i对样本值,i=1,2,…,n;xi与yi均表示区间模糊数;及分别表示其样本平均数。当研究的两个变量都是模糊数据时,分别对两个变量取得模糊区间Ixλ与Iyλ,如图1。
将区间型模糊数据(区间内均匀分配),分别对两个变量X,Y取各个样本区间中心点xi、yi作为代表值。当模糊数据为区间型模糊数据,用公式1分别对两变量X,Y取各样本,得模糊数据的重心值xi,yi当作代表值。针对相关系数值rxy,再考虑连续区间模糊数长度不一样,或区间隶属度不同,因此必须考虑区间的相关效应。若将两种相关系数等重相加,所得结果的相关系数可能有一边出现大于1或小于 -1情况。区间长度相关效应也不应该重于中心点相关效应。因此,为对区间数据进行合理修正相关系数,用公式(3)加以调整,得到更具有合理性的模糊数据相关系数。考虑取以e为底的自然对数ln函数进行转换。设连续区间样本xi的长度lxi连续区间样本yi的长度lyi,则修正长度相关系数为
由于0 <ri<1,故δ范围为0 < δ < 0.3069。
定义1模糊相关区间(取区间中心点与长度的方法)
设,表示总体的模糊样本区间中心点,,表示区间长度。是中心点相关系数,δ表示修正长度相关系数。于是,将相关区间定义为
(i)r≥0,ri≥0,(r,min(1,r+δ))
(ii)r≥0,ri< 0,(r-δ,r)
(iii)r<0,ri≥0,(r,r+δ)
(iv)r<0,ri<0,(max(-1,r-δ),r)
四、实证应用分析
本节给出区间模糊数相关系数的实例应用,在下面例3.1中处理(i)两组变量均为实数;(ii)一组变量为连续型等距尺度区间模糊数据,另一组变量为实数,与(iii)两组变量皆为连续型等距尺度模糊数据的情形,例4.1.3、4.2与4.3均是两组变量皆为连续型等距尺度模糊数据,并利用定义3.1公式计算相关系数。
(一)上网时间与数学成就
考察哈尔滨市某高校新生影响数学成绩因素,随机调查10名学生,利用模糊问卷的方式[7],决定各指标的重要性,问题是探讨学生数学分数与上网时间是否有内在的联系(即关系)。
1.学生数学分数(xi)为实数,上网时间(yi)亦为实数
根据皮尔森相关系数计算公式,数学平均成绩和平均上网时间的相关系数为 -0.79,也就是学生的平均成绩越高,上网时间越少。
2.学生数学分数(xi)为实数,上网时间(yi)为区间模糊数
假如想要知道数学平均分数和上网时间模糊区间之间的相关系数,这时搜集到的数据如表2。
在这个例子里,调查“学生每周上网时数的模糊区间”,并纪录“数学平均成绩”,计算相关系数,因“学生每周上网时数的模糊区间”经过模糊统计,故为一组模糊数据,而“数学
平均分数”为一组实数,用定义3.1得到模糊相关系数为0.79,由此可知,当模糊相关系数其中一组为实数时,其相关系数会等于皮尔森相关系数。
3.学生数学分数(xi)为区间模糊数,上网时间(yi)为区间模糊数据
如果研究者搜集到学生一周之间的数学成绩分布,为了方便起见,以每10分为一区间,则表1的数学平均分数变为表3,由此表可计算数学分数和上网时间的模糊相关系数。
利用定义1可知,数学分数与上网时间的区间模糊相关为(-0.79,-0.74),此相关系数呈现高度负相关的关系,也就是数学分数越高,上网时数越少,学生每周上网时数会对数学学业成绩产生负面的影响。
(二)睡眠时间与数学成就
为了认识“影响数学成绩因素”,将10位学生“每天睡眠时间”做模糊问卷调查,并求模糊相关系数,将“每天睡眠时间”指标的问卷结果整理如表4。
呈现低度正相关的关系,故学生睡眠时数越多,数学成绩越好。虽睡眠时间的影响不大,但仍有一些关系。
(三)睡眠时间与上网时间
现在考察“每天学生睡眠时间”与“学生一周上网时间”是否有相关,两组都是区间模糊数据,经收集整理得到下面模糊区间,如表5所示。
表5显示出低度相关的关系,代表学生睡眠时数与上网时间并没有非常直接关系。
这里主要探讨影响数学成绩因子,并计算与数学成绩与其他因子之间的模糊相关系数。通过整理得到表6,从表6得知,睡眠时间、上网时间、与学生数学成绩之间的区间相关系数。对于学生数学成绩影响较大的为上网时间,学生上网时间越多,成绩越差。而睡眠时间则和数学成绩呈现低度正相关的情形,代表睡眠时间长,数学成绩会越好,但影响幅度较小。
五、结论
基于相关系数影像匹配实习报告 篇2
一、实习内容与目的
通过上机编程实现基于相关系数算法的影像匹配,从而更加熟练的掌握书本上关于影像匹配及相关系数算法的理论知识,并熟悉上机编程的操作。
二、实习原理
影像匹配实质上是在两幅或是多幅影像之间识别同名点,其中基于相关系数的算法是实现影像匹配的基本算法之一。
相关系数是标准化的协方差函数,协方差函数除以两信号的方差即得相关系数。计算相关系数的公式如下:
g(x,y)与g’(x’,y’)的相关系数为:
(p,q)其中: C(p,q)CggCgg(p,q)
Cgg(x,y)D2{g(x,y)E[g(x,y)]}dxdy 2{g(xp,yq)E[g(xp,yq)]}dxdy Cgg(p,q)(x,y)D若(p0, q0)>(p, q),(p≠p0,q≠q0),则p0,q0为搜索区影像相对于目标区影像的位移参数。由离散灰度数据对相关系数的估计为
(c,r)(gijij,11mnr,jcg)g)(gi(giij11(gijij,11mng)2mn
r,jc,c)2grgc,r1mnrjgiij11mn,c1,gmngij ij,11mn考虑到计算工作量,相关系数的实用公式为
(c,r)(gijij,11mnmnmn1r,jc)gir,jc)(gi,j)(gimni1j1i1j1[gi1j1mn2i,jmnmnmn1122r,jc)2](gi,j)][gir,jc(gimni1j1mni1j1i1j1
三、实习步骤及相关代码
在第一次点特征点实习的基础上我们组进行了第二次基于相关系数的影像匹配实习。所以程序实现的部分操作直接利用前次实习的中的程序。
(1)读入左右影像
FILE* pSrcFileLeft = NULL;
pSrcFileLeft = fopen(srcFileLeft,“rb”);if(pSrcFileLeft == NULL){
} FILE* pSrcFileRight = NULL;pSrcFileRight = fopen(srcFileRight,“rb”);if(pSrcFileRight == NULL){
} printf(“原始右片影像打开失败n”);return FAILURE;printf(“原始左片影像打开失败n”);return FAILURE;(2)确定目标窗口大小
通过老师课堂上的讲授和我们在编程过程中的不断尝试,我们默认使用的窗口的尺寸为11*11。
(3)确定目标点的位置
由前次的实习中得到左相片中的特征点作为这次实习的目标点。
(4)预测右影像搜索范围
本程序中也在左相片中计算出了特征点,然后将左右两相片中的特征点进行计算相关系数。
(5)逐窗口计算相关系数并保存相应的储存单元
将左相片中的目标点与右相片中的特征点进行相关系数的计算。
(6)比较相关系数,取最大相关系数作为匹配点
对于分别比较上一步骤中计算出的相关系数,选取出最大的一个相关系数作为匹配点。
程序操作如下:
在程序主界面中点击Extend中选取ImageMatch选项,然后进入参数设置界面。
设置读取和保存影像路径和窗口大小等参数后,点击Progress进行运算。
四、实习结果及分析
作为数据源的左右影像如些图所示:
左相片
右相片
经过计算后得到的目标点左右图像分别如下所示: 左相片
右相片
显示匹配点号:
通过老师得到的图片可以看出在左相片中得到的五个目标点中有四个在右相片中找到了同名点,由此可以看出本程序基本满足实习要求,并得到理想的结果。不足的地方就是选取的特征点的数量不够多,这样就无法判断本程序的“误判”的情况如何。
五、实习体会
在学习到相关系数的时候,一看到计算相关系数的公式的时候我就有种被折服的感觉,那个公式实在是太复杂,它使我感觉我怎么也不能记住这个复杂的公式。不过经过这次实习后,我觉得这个公式又不是当初认为的那样无法记忆。我想这次实习我最大的收获就是对于之前在学习过程中遇到不懂知识以及难以记忆的知识都得到了加强,方便了我对他们的理解与记忆。
其次,在编程过程中更加锻炼自己动手编程的能力,使得我编程能力较之前有着一定的提高。每次编程实习都是一个积累经验的过程,然后通过一次次的实习后,我最终的能力就能够得到很好的体现。
附件:
void Moravec(BYTE* pSrcBits, vector
vector
b = false;
for(iter2 = ret.begin();iter2!= ret.end();++iter2)
{
if(iter->x == iter2->x && iter->y == iter2->y)
{
b = TRUE;//存在 break;
}
}
if(b == FALSE)
{
ret.push_back(*iter);
} } return ret;}
void SaveBand(int width, int height, int byteCount, int biBitCount, LPBYTE pBits, CString SavePath){ BITMAPFILEHEADER bmfh;BITMAPINFOHEADER bmih;bmfh.bfType = 0x4d42;
// 0x42 = “B” 0x4d = “M”
bmfh.bfReserved1 = 0;bmfh.bfReserved2 = 0;if(biBitCount == 8){
bmfh.bfOffBits = sizeof(BITMAPFILEHEADER)+ sizeof(BITMAPINFOHEADER)+ 256*4;
bmfh.bfSize = sizeof(BITMAPFILEHEADER)+ sizeof(BITMAPINFOHEADER)+ 256*4 + byteCount;} else if(biBitCount == 24){
bmfh.bfOffBits = sizeof(BITMAPFILEHEADER)+ sizeof(BITMAPINFOHEADER);
bmfh.bfSize = sizeof(BITMAPFILEHEADER)+ sizeof(BITMAPINFOHEADER)+ byteCount;} else {
MessageBox(NULL, “8bit or 24bit accepted”, “错误”, MB_ICONERROR);
return;} bmih.biBitCount = biBitCount;bmih.biWidth = width;bmih.biHeight = height;bmih.biSize = 40;bmih.biPlanes = 1;bmih.biCompression = BI_RGB;bmih.biSizeImage = bmfh.bfSize;bmih.biClrImportant = 0;bmih.biClrUsed = 0;bmih.biXPelsPerMeter = 0;bmih.biYPelsPerMeter = 0;
CFile f;//保存位图
if(f.Open(SavePath, CFile::modeCreate | CFile::modeWrite)){
f.Write(&bmfh, sizeof(bmfh));
f.Write(&bmih, sizeof(bmih));
if(biBitCount == 8)
{
RGBQUAD rgb[256];
int i(0);
for(;i < 256;++i)
{
rgb[i].rgbBlue = i;
rgb[i].rgbGreen = i;
rgb[i].rgbRed = i;
rgb[i].rgbReserved = 0;
}
//修改颜色表255对应的颜色
rgb[255].rgbBlue = 0;
rgb[255].rgbGreen = 0;
rgb[255].rgbRed = 255;
f.Write(rgb, sizeof(RGBQUAD)*256);
}
f.Write(pBits, byteCount);
f.Close();} else {
MessageBox(NULL, “保存图像失败”, “错误”, MB_ICONERROR);
return;} } void DrawCross(BYTE* pBits, vector
if(pBits[i] == 255)
pBits[i] = 254;} for(iter = FeaturePoint.begin();iter!= FeaturePoint.end();++iter){
i = iter->y;
j = iter->x;
pBits[i*_width+j] = 255;
pBits[i*_width+j+1] = 255;
pBits[i*_width+j-1] = 255;
pBits[(i+1)*_width+j] = 255;
pBits[(i-1)*_width+j] = 255;
pBits[i*_width+j+2] = 255;
pBits[i*_width+j-2] = 255;
pBits[(i+2)*_width+j] = 255;
pBits[(i-2)*_width+j] = 255;} } void DrawCross(BYTE* pBits1, BYTE* pBits2, vector
if(pBits1[i] == 255)
pBits1[i] = 254;} for(j = 0;j < byteCount2;++j){
if(pBits2[j] == 255)
pBits2[j] = 254;} for(iter = MatchedPoints.begin();iter!= MatchedPoints.end();++iter){
i = iter->y1;
j = iter->x1;
pBits1[i*_width1+j] = 255;
pBits1[i*_width1+j+1] = 255;
pBits1[i*_width1+j-1] = 255;
pBits1[(i+1)*_width1+j] = 255;
pBits1[(i-1)*_width1+j] = 255;
pBits1[i*_width1+j+2] = 255;
pBits1[i*_width1+j-2] = 255;
pBits1[(i+2)*_width1+j] = 255;
pBits1[(i-2)*_width1+j] = 255;
i = iter->y2;
j = iter->x2;
pBits2[i*_width2+j] = 255;//
pBits2[i*_width2+j+1] = 255;
pBits2[i*_width2+j-1] = 255;
pBits2[(i+1)*_width2+j] = 255;
pBits2[(i-1)*_width2+j] = 255;
pBits2[i*_width2+j+2] = 255;
pBits2[i*_width2+j-2] = 255;
pBits2[(i+2)*_width2+j] = 255;
pBits2[(i-2)*_width2+j] = 255;
} }
void SaveList(vector
return;fprintf(pTxtFile, “#t特征点数: %dnn”, FeaturePoint.size());fprintf(pTxtFile, “坐标Xt坐标Yt兴趣值n”);vector
fprintf(pTxtFile, “%dt%dt%dn”, iter->x, iter->y,(int)iter->IV);fclose(pTxtFile);} void SaveList(vector
return;fprintf(pTxtFile, “#同名点对数: %dnn”,MatchedPoints.size());vector
fprintf(pTxtFile, “%dt%dt%dt%dt%fn”,iter->x1, iter->y1, iter->x2, iter->y2, iter->coefficient);fclose(pTxtFile);} int _tmain(int argc, TCHAR* argv[], TCHAR* envp[]){ if(argc!= 15){
::MessageBox(NULL,“启动参数不正确,请从GUI.exe或命令行参数启动”,“",MB_ICONASTERISK);
return FAILURE;} system(”Mode con: COLS=50 LINES=150“);system(”title Image_Match“);int nRetCode = 0;if(!AfxWinInit(::GetModuleHandle(NULL), NULL, ::GetCommandLine(), 0)){
cerr << _T(”Fatal Error: MFC initialization failed“)<< endl;
nRetCode = 1;
return nRetCode;} CString srcFileLeft, srcFileRight, dstFileLeft, dstFileRight, txtFile;CString threshold_Left,window1_Left,window2_Left;CString threshold_Right,window1_Right,window2_Right;CString CoRelated,window3,flag1;//启动参数
srcFileLeft = argv[1];srcFileRight = argv[2];dstFileLeft = argv[3];dstFileRight = argv[4];txtFile = argv[5];threshold_Left = argv[6];//阈值 window1_Left = argv[7];window2_Left = argv[8];threshold_Right = argv[9];window1_Right = argv[10];window2_Right = argv[11];CoRelated = argv[12];window3 = argv[13];flag1 = argv[14];//判断是否在创建结果文件后显示 int m_threshold_L = atoi(threshold_Left);int m_window1_L = atoi(window1_Left);int m_window2_L = atoi(window2_Left);int m_threshold_R = atoi(threshold_Right);int m_window1_R = atoi(window1_Right);int m_window2_R = atoi(window2_Right);double m_CoRelated =(double)atoi(CoRelated)/ 100;int m_window3 = atoi(window3);int m_flag1 = atoi(flag1);if(GetFileAttributes(srcFileLeft)==-1){ CString err;err.Format(”文件:%s不存在“, srcFileLeft);
::MessageBox(NULL,err, ”Error“, MB_ICONERROR);return FAILURE;} if(GetFileAttributes(srcFileRight)==-1){ CString err;err.Format(”文件:%s不存在“, srcFileRight);
::MessageBox(NULL,err, ”Error“, MB_ICONERROR);return FAILURE;} //打开2幅影像
FILE* pSrcFileLeft = NULL;pSrcFileLeft = fopen(srcFileLeft,”rb“);if(pSrcFileLeft == NULL){ printf(”原始左片影像打开失败n“);
} return FAILURE;FILE* pSrcFileRight = NULL;pSrcFileRight = fopen(srcFileRight,”rb“);if(pSrcFileRight == NULL){ printf(”原始右片影像打开失败n“);return FAILURE;} //读取左片数据
BITMAPFILEHEADER bmfhLeft;BITMAPINFOHEADER bmihLeft;fread(&bmfhLeft, sizeof(BITMAPFILEHEADER), 1, pSrcFileLeft);fread(&bmihLeft, sizeof(BITMAPINFOHEADER), 1, pSrcFileLeft);if(bmihLeft.biBitCount!= 8){ printf(”只支持8位位图: 左片n“);return FAILURE;} DWORD widthLeft = bmihLeft.biWidth;DWORD heightLeft = bmihLeft.biHeight;DWORD _widthLeft =(widthLeft*8 + 31)/32*4;//saved widthLeft in files DWORD pixelCountLeft = _widthLeft*heightLeft;fseek(pSrcFileLeft, 256*sizeof(RGBQUAD), SEEK_CUR);BYTE* pSrcBitsLeft = new BYTE[pixelCountLeft];//new 1 fread(pSrcBitsLeft, sizeof(BYTE), pixelCountLeft, pSrcFileLeft);fclose(pSrcFileLeft);pSrcFileLeft = NULL;//读取右片数据
BITMAPFILEHEADER bmfhRight;BITMAPINFOHEADER bmihRight;fread(&bmfhRight, sizeof(BITMAPFILEHEADER), 1, pSrcFileRight);fread(&bmihRight, sizeof(BITMAPINFOHEADER), 1, pSrcFileRight);if(bmihRight.biBitCount!= 8){ printf(”只支持8位位图: 右片n“);return FAILURE;} DWORD widthRight = bmihRight.biWidth;DWORD heightRight = bmihRight.biHeight;DWORD _widthRight =(widthRight*8 + 31)/32*4;//saved widthRight in files DWORD pixelCountRight = _widthRight*heightRight;fseek(pSrcFileRight, 256*sizeof(RGBQUAD), SEEK_CUR);BYTE* pSrcBitsRight = new BYTE[pixelCountRight];//new 2 fread(pSrcBitsRight, sizeof(BYTE), pixelCountRight, pSrcFileRight);fclose(pSrcFileRight);pSrcFileRight = NULL;//开始计算左片特征点
//计算左片的兴趣点存储于该vector中
vector
//遍历vector, 在右片中搜寻相关系数最大的窗口
vector
int lMaxWidth;int lMaxHeight;int Count3(0), Count4(0);for(iter1 = FeaturePointLeft.begin();iter1!= FeaturePointLeft.end();++iter1){
cout << endl << ”Left point ID: “ << Count2++ << endl;
//计算该点对应的特征点 B = 0.0;D = 0.0;MaxR = 0.0;R = 0.0;if(iter1->x < k || iter1->y < k || iter1->x > heightLeftk){ cout << ”Left point abort: “ << Count3++ << endl;continue;} //逐个搜索
//将左片小窗口内的数据拷贝//可先求出B,D for(i = 0;i < m_window3;++i){ for(j = 0;j < m_window3;++j){
//B = 小窗口所有像素灰度值求和
//D =....................的平方再求和
B += pSrcBitsLeft[(i+iter1->y)*_widthLeft +(j+iter1->x)];
D += pSrcBitsLeft[(i+iter1->y)*_widthLeft +(j+iter1->x)] *
pSrcBitsLeft[(i+iter1->y)*_widthLeft +(j+iter1->x)];} } Count4 = 0;//逐个小窗口计算R for(iter2 = FeaturePointRight.begin();iter2!= FeaturePointRight.end();++iter2){ if(iter2->x < k || iter2->y < k || iter2->x > heightRightk){
cout << ”Right point abort: “ << Count4++ << endl;
continue;} A = 0.0;
C = 0.0;
E = 0.0;
j = iter2->x;//i,j为中心点
i = iter2->y;
j-= k;
//i,j为顶点
i-= k;
int centerX = j + k;
int centerY = i + k;
//这里的centerX,centerY就是右片某个小窗口的中心
//求A,C,E
for(m = 0;m < m_window3;++m)
{
for(n = 0;n < m_window3;++n)
{
//C = 左片小窗口所有像素灰度值求和
//E =........................平方的求和
//A = 对应位置像素灰度直乘积之和
C += pSrcBitsRight[(i+m)*_widthRight +(j+n)];
E pSrcBitsRight[(i+m)*_widthRight+(j+n)]*pSrcBitsRight[(i+m)*_widthRight+(j+n)];
A += pSrcBitsRight[(i+m)*_widthRight+(j+n)] *
pSrcBitsLeft[(m+iter1->y)*_widthLeft +(n+iter1->x)];
}
}
double temp1 = DC*C/m_window3/m_window3;
if(temp1!= 0 && temp2!= 0)
{
R =(A-B*C/m_window3/m_window3)/ sqrt(temp1*temp2);
}
else
R = 0;
if(R > MaxR)
{
MaxR = R;
lMaxWidth = centerX;
lMaxHeight = centerY;
cout << R << endl;
}
}
if(MaxR >= m_CoRelated)
{
MATCHEDPOINTS mp;
mp.coefficient = MaxR;
mp.x1 = iter1->x;
mp.y1 = iter1->y;
mp.x2 = lMaxWidth;
mp.y2 = lMaxHeight;
MatchedPoints.push_back(mp);
} }
//保存结果位图
+= DrawCross(pSrcBitsLeft, pSrcBitsRight, MatchedPoints,_widthLeft, _widthRight, pixelCountLeft, pixelCountRight);
SaveBand(widthLeft, heightLeft, _widthLeft*heightLeft, 8, pSrcBitsLeft, dstFileLeft);SaveBand(widthRight, heightRight, _widthRight*heightRight, 8, pSrcBitsRight, dstFileRight);
//保存特征点列表
SaveList(MatchedPoints, txtFile);
//clean up delete[] pSrcBitsLeft;delete[] pSrcBitsRight;delete[] pTemplate;
pSrcBitsLeft = NULL;pSrcBitsRight = NULL;pTemplate = NULL;
if(m_flag1 == 1){
ShellExecute(NULL, ”open", txtFile, NULL, NULL, SW_SHOWNORMAL);}
相关系数 篇3
[关键词] 员工薪酬 合同期限 利益相关系数
一、文献综述和研究假设
公司与员工之间存在是委托-代理关系。委托-代理理论认为,信息不对称会导致代理人败德行为。然而对薪酬高低是否与忠诚度相关存在不同的认识。法玛研究了经理人员的薪金补偿计划,并提出了“一揽子内部和外部的监督手段”,从而引发了对经理人员薪酬研究的高潮。美国渥克信息公司对几千名就业者进行的一次忠诚度调查显示,有70%的被调查者对当前所服务的公司满意,但只有30%的被调查者对公司忠诚;要想提高员工的忠诚度,仅仅靠提高员工满意度是不够的,而薪酬与员工的忠诚度几乎没有什么关系。20世纪80年代后期,特别是进入90年代以后,大量研究文献涌现出来,并与委托—代理理论、激励理论、信息经济学等经济学的分支结合在一起而得到了迅速发展。伯利和米恩斯在《现代公司与私有财产》一书中直言,管理者权利的增大有损害资本所有者利益的危险。他们担心,由于正在发生的所有权与控制权的分离——这种分离在当时的美国已经特别明显,而且正日益严重——可能会使管理者对公司进行掠夺。詹森和迈克林通过引入公司定价(Corporate Valuation)的分析方法,讨论了公司价值与经理人员股票所有权之间的关系,开创了从代理成本角度来研究公司治理问题的先河。他们的分析有一个暗含的前提,即市场竞争和制度安排的约束力量会使经理人员不致偏离“公司价值或股东价值最大化目标”太远。这些约束力量包括产品市场、经理人员市场、资本市场、公司控制权市场的竞争压力,这实际上就是外部治理结构安排。彭文兵、裴育从比较的角度分析了分散性采购与集中性采购中存在的委托代理关系,进而分析了采购委托代理中的败德行为问题,提出了信息不对称和委托人监督的机会主义是造成上述问题的主要原因,并提出相应的解决思路:公开采购权力委托代理运行的信息、实行高薪养廉激励政策、加大惩罚力度、推行委托人的选择性激励政策和减少委托代理链。黄静、张宝通认为,员工对企业的忠诚问题是影响企业生产效率高低及企业价值实现的重要因素,建立合理的薪酬体系有助于提高企业知识员工的忠诚度。李维安的研究发现,公司员工参与程度与企业业绩和企业价值指标之间均不存在显著的相关关系。刘国峰认为,利益相关系数是不同的利益相关者主体对自己和其他利益相关者的利益增损进行主观评价的程度,这种主观评价对实际的利益增损进行了扩大化或缩小化,并提出利益相关系数与员工学历、薪酬、工龄、一系列制度建设情况等要素存在以下函数关系:
k=h[u(a,r,y,c,s,f,…)]+e
其中k代表自我报告的利益相关系数;u(…)代表一个人实际的利益相关系数;h(.)是关联实际利益相关系数与报告利益相关系数的函数;e为误差项,因为人们一般很难精确地表述他们实际的利益相关系数;a,r,y,c,s,f,…分别表示员工学历、薪酬、工龄、一系列制度建设情况等要素。
相比较而言,目前的研究侧重于理论研究,实证研究相对缺乏。因此,将员工对公司的利益关系(忠诚度)进行量化并进一步研究其影响因素仍值得继续探讨。
我们设计的访谈提纲即选择员工薪酬和劳动合同期限这两个因素进行测量,并试图验证如下两个假设:
假设1:员工薪酬高低对利益相关系数影响无显著差异;
假设2:劳动合同期长的企业员工其利益相关系数比劳动合同期短者趋近于1。
二、数据来源与研究方法
本研究在初步访谈和试调查阶段采用了实地研究法和访谈法,首先以利益相关系数的若干假设为调查目的设计了访谈提纲初稿,随后随机选取研究者联系人数据库中的四个样本进行初步访谈,然后根据初步访谈的结果,修改和完善访谈提纲。试调查共历时5周。为了降低成本及提高回收率,试调查时在研究者联系人数据库中选取了30人作为调查对象,一般利用联系人的休息时间通过MSN、Skype在线即时传输访谈提纲,并解释关于利益相关系数的有关问题,得到有效访谈记录23份。
在正式调查阶段,除在杭州的部分企业采取了进入工作现场、员工集体宿舍、公司外约访等形式进行访谈外,研究者还通过Skype、MSN等工具随机抽样进行在线访谈,历时三个月,共得到207份数据。我们使用SPSS12.0及EXCEL2000对本次调查得到的数据进行处理,采用描述性统计、方差分析和LSD多重比较方法对假设1和假设2进行检验。
三、实证结果分析
1.薪酬水平对利益相关系数影响的实证分析
样本按年薪水平分为五组,各组基本描述性统计量见表1。表2为单因素方差分析,从表中可知,总离差平方和为2624.501,组间离差平方和为50.335,组内离差平方和为2574.166,组间离差平方和中能被线性解释的部分为8.539;方差检验F=0.987,对应的相伴概率为0.415,大于0.05的显著性水平,因此认为各组之间差异不显著,未发现样本薪酬水平与K值有相关关系。表3为LSD法多重比较结果,从表中可知,各组间的相伴概率都大于显著性水平0.05,亦说明各组之间的差异不显著,假设1得到支持。
2.劳动合同期限对利益相关系数影响的实证分析
样本按劳动合同期限分为三组,各组基本描述性统计量见表4,劳动合同期限超过4年的员工其利益相关系数均值为3.2452,低于合同期限为2~4年者(3.8072)但高于2年以下者(3.2271,含未签订劳动合同者)。表5为单因素方差分析,从表中可知,总离差平方和为2624.501,组间离差平方和为12.194,组内离差平方和为2612.307,组间离差平方和中能被线性解释的部分为0.002;方差检验F=0.476,对应的相伴概率为0.622,大于0.05的显著性水平,因此认为各组之间差异不显著,未发现样本劳动合同期限与K值有相关关系。LSD法多重比较结果显示各组间的相伴概率都大于显著性水平0.05(表6),也说明各组之间的差异不显著,假设2未得到支持。
四、结论与局限性
从本次调查的结果来看,多数员工的利益相关系数在2~10之间,员工薪酬水平与利益相关系数无关,这与美国渥克信息公司的调查结果是一致的;员工劳动合同期限长短对利益相关系数的影响没有显著差异。
本研究从利益相关者的视角来研究员工决策行为,讨论了员工薪酬水平、劳动合同期限对利益相关系数的影响,解释了不同制度安排下的企业与员工之间的利益关系,丰富了决策行为分析理论在实践中的应用。
本次调查研究的缺陷之一是调研时间较短,样本都取自于研究者本人的联系人数据库,该数据库中的联系人数量较小,所以整个调查有可能存在偏差。
由于这次调查的访谈内容尚待改进,并且本次调查的数据主要是采用描述统计和比较均值的方法,没有对数据进行深入的统计分析,这些都是本研究工作的局限所在。
在访谈过程中研究者还发现,对同一受访者而言,如果进行跟踪调查,其利益相关系数可能是动态的。如果能够采用实验研究方法结合统计调查研究,将有益于在后续的研究中进一步探讨不同情况下的利益相关系数及其影响因素。
参考文献 :
[1] Fama, Eugence.Agency problems and the theory of the firm[J].Journal of Political Economy,1980,88(2):288-307
[2] 孙经纬.董事会的结构、职能与效率[J].上海:外国经济与管理,1997,(4)
[3] Marc Drizin,A. J. Schneider.美国员工忠诚度调查:薪酬与员工忠诚度无关[EB/OL].http://www.chinahrd.net/zhi_sk/jt_page.asp?articleid=41125,2004-10-25
[4] 陈宏辉.企业利益相关者的利益要求:理论与实证研究[M].北京:经济管理出版社,2004
[5] Berle, Adolf, and Gardiner Means.The Modern Corporation and Private Property[M].New York:McMillan,1932
[6] Jensen, Michael, and William Meckling.Theory of the firm: Managerial behavior, agency costs, and ownership structure[J].Journal of Financial Economics,1976,(3):305-360
[7]彭文兵裴育:政府采购中的寻租经济学分析[J].上海:上海财经大学学报,2003,(2)
[8]黄静,张宝通.论知识员工的忠诚度管理[EB/OL].http://www.chinahr.com/news/news.asp?newid=200501200044&channelid=au06,2005-01-20
[9]李维安:公司治理评价与指数研究[M].北京:高等教育出版社,2005
[10]刘国峰:加强费用考核提高企业员工的忠诚度[J].杭州:杭州科技,2006,(6)
基于相关系数法的直线识别方法 篇4
关键词:相关系数,直线识别法,matlab
本文针对雪糕棒分选机剔选出弯曲雪糕棒这一过程, 提出了基于相关系数检验法的直线识别法。利用激光三角检测技术抓取的雪糕棒图像, 判断其是否弯曲, 可归结为判断图像上一条线是否为直线的问题。本文设计的直线识别法可准确、快速的对图像中的线是否为直线进行判别。经检验为直线时, 输出计算所得的相关系数值, 并显示结果为“straight line”;经检验为曲线时, 输出计算所得的相关系数值, 并显示结果为“curve”。
1 相关系数检验法
对于线性回归中的变量x与y, 其样本的相关系数反映了普通变量x与随机变量y之间的线性相关程度. 故取检验统计量:
r值越大, 表明回归特性越显著, 即x与y的线性相关程度越高。
2 直线识别过程
本文所述的识别方法是在matlab软件上实现的。
根据需要, 对图像进行初步处理, 如二值化、灰度处理、去噪等。由曲线在图像中的位置, 为图像选取合适的坐标框、标尺, 提取曲线坐标, 获得曲线坐标矩阵[tempx, tempy]。曲线坐标的获取, 可基于像素点, 也可根据像素点与坐标轴的比例因子获取。因为像素点数目多, 能准确的表征其曲线特征, 所以提取的数据就非常准确。
对所得数据进行如下处理:
(3) 计算相关系数r。
(4) 判断曲线类型。
根据r的绝对值, 判断曲线类型。r的绝对值越接近1, 则显著性越明显, 表示x与y的线性相关度越高, 即图像上的线越接近直线;反之r的绝对值越接近0, 则表明图像上的线越偏离直线。
为了使雪糕棒分选机对弯曲雪糕棒能精确剔选出去, 此处的ra值应选取一个小于1, 但较大的数值。
3 实例分析
根据上述方法使用matlab软件编写程序。为了保证能精确判别直线或曲线, 程序中ra取值0.90。数据处理部分程序如下所示:
分别将图1中的两张图像导入matlab中, 运行程序, 对图像是否为直线进行识别。
3.1 直线情况
3.2 曲线情况
将图1 (b) 所示的图像导入matlab程序, 运行程序。导入图像中曲线的相关系数r=0.3022, 远小于选取的参考值0.9, 所以显示判断结果如图2 (b) 所示, result为“curve”, 相关系数值r=0.3022。
由结果可知, 该识别法正确识别了图1中两幅图像的曲线、直线类型。
4 结语
相关系数 篇5
题
本卷共分为1大题50小题,作答时间为180分钟,总分100分,60分及格。
一、单项选择题(共50题,每题2分。每题的备选项中,只有一个最符合题意)
1.统计法规定,县级以上人民政府______。A.可以设立统计机构
B.可以根据实际情况设立统计机构 C.应当设立统计机构
D.应当设立独立的统计机构
2.技术性的统计工作,只能由______来承担。A.国家统计机构 B.部门统计机构
C.企业事业组织统计机构 D.民间调查机构
3.某公司2009年初所有者权益总额为1360万元,当年实现净利润450万元,提取盈余公积45万元,向投资者分配现金股利200万元,本年内以资本公积转增资本50万元,投资者追加现金投资30万元。该公司年末所有者权益总额为()万元。A.1565 B.1595 C.1640 D.1795
4.企业已计提坏账准备的应收账款确实无法收回,按管理权限报经批准作为坏账转销时,应编制的会计分录是__。
A.借记“资产减值损失”科目,贷记“坏账准备”科目 B.借记“管理费用”科目,贷记“应收账款”科目 C.借记“坏账准备”科目,贷记“应收账款”科目
D.借记“坏账准备”科目,贷记“资产减值损失”科目
5.《统计法》规定,县级以上人民政府有关部门根据统计任务的需要设立统计机构,或者在有关机构中设置统计人员,并指定统计负责人。统计负责人,是指代表本部门或者本单位履行《统计法》规定职责的______人员。A.行政领导 B.行政管理 C.统计责任 D.专业技术
6.登账后发现,会计人员在分配工资费用时,将车间管理人员的工资计入“管理费用”科目,此时应采用的更正方法是__。A.划线更正法 B.红字更正法 C.补充登记法
D.编制相反分录冲减
7.县统计局在对某企业进行统计执法检查时发现该企业承担经常性政府统计调查任务的人员为统计学类大专本科毕业生,但没有统计从业资格证书,也未取得统计专业技术职务资格,遂认定该企业存在统计违法行为。请回答:对该企业的违法行为,县统计局可以作出的处理是______。
A.责令限期改正 B.警告 C.通报批评 D.统计学原理
8.统计从业资格认定的实施机关是()。A.县级人民政府统计机构 B.地市级统计机构
C.省级人民政府统计机构 D.国家统计局
9.表3-2是已公布的2006年我国国际收支平衡表简表,请根据此表在下列备选答案中选出正确答案。(2006年1美元对人民币的中间价为7.9718)已知我国2006年国内生产总值为210871.0亿元,则根据上表计算的2006年国民生产总值(或国民总收入)为()。A.209933.9 B.214135.8 C.211808.1 D.207606.2
10.一国货币汇率下跌,即货币贬值,则会导致__。A.进口贸易缩减
B.以本币标示的进口商品价格就会下跌
C.本国居民对进口商品的需求增大 D.扩大进口贸易
11.“消费者人均月收入”(x2,单位:元)及“商品需求量”(y,单位:件),建立多元线性回归方程如下:y=4990.519-35.66597x1+6.19273x2,请根据上述结果,从下列备选答案中选出正确答案。假设2011年该地区该电子手表的价格为20元,消费者人均月收入为1500元,则该地区该品牌的电子手表在2011年的需求量将达到13566______件。A.13566 B.12764 C.14398 D.11549
12.已知某资产负债简表的部分内容,如表6-1所示。表6-1 单位:亿元根据上述资料请回答:国外部门的金融负债为()亿元。A.-100 B.100 C.1300 D.1400
13.某工业企业为增值税一般纳税人,2011年10月5日购入材料一批,售价为50000元,该企业适用的增值税税率为17%,所购材料到达后验收发现材料短缺5%,经查属于合理损耗,材料入库前的挑选整理费为700元。则该企业取得的该材料的入账价值应为__元。A.50000 B.59200 C.58500 D.50700
14.在年内新成立的单住年平均人数的计算方法为:从实际开工之月起到年底的月平均人数相加除以______。A.开工月数 B.12个月
C.开工后的整月数 D.单位成立月数
15.下列各账簿中,一般应采用三栏式账簿的是__。A.应收账款明细账 B.原材料明细账 C.库存商品明细账 D.管理费用明细账
16.某企业系增值税一般纳税企业,本期购入原材料20000千克,发票中注明的价格为每千克5元,售价总额为100000元,增值税额为17000元。在购买过程中发生运输费用1000元,保险费用490元。原材料运抵企业,验收入库的原材料为19900千克。企业购进该原材料的单位成本为__元。A.5 B.5.1 C.5.85 D.5.92
17.我国现行的统计基本法是______。A.中华人民共和国统计法
B.中华人民共和国统计法实施细则 C.统计行政法规 D.统计规章 E.规范性文件
18.该企业当年发生的部分经济业务如下:
(1)生产车间为生产甲、乙两种产品共同领用材料一批,其实际成本为20000元。(2)销售产品一批,售价40000元,增值税额6800元,款项尚未收到。(3)以银行存款支付广告费300000元。(4)结转全年实现的净利润500000元。
根据上述资料,计算该企业2006年度的总资产报酬率为__。A.(75+60)/[(800+1000)÷2]×100%=15% B.75/[(800+1000)÷2]×100%=8.33% C.(50+60)/[(800+1000)÷2]×100%=12.22% D.(75+60)/(800+1000)×100%=7.5%
19.国库券利率是指__。A.纯利率
B.纯利率+通货膨胀补偿率 C.资金时间价值 D.通货膨胀补偿率
20.(以下每道综合应用题包括5道小题,每道小题有一项或一项以上的正确答案)某公司上年末资产负债表部分余额如下:
资产总计为6000000元,其中流动资产2000000元,负债总计2000000元,其中流动负债1600000元。
假定本年发生以下经济业务:
(1)企业收到投资者投入的资本金500000元,款项已经存入银行。
(2)企业从外地购入甲材料1000千克,每千克20元;乙材料4000千克,每千克10元,增值税额10200元。企业以银行存款支付上述甲乙两种材料的货款及运杂费5000元,运杂费按材料重量比例进行分摊。
(3)向希望小学捐款30000元,已从银行存款账户支付。
(4)企业本年销售收入1000000元,企业增值税额为170000元,款项已收并存入银行。根据以下要求选择正确答案。
根据上述经济事项(2),外购材料的运杂费分摊率为__。A.0.50元/千克 B.0.083元/千克 C.166.67元/千克 D.1.00元/千克
21.统计台账;二是,建立健全统计资料的______等管理制度。A.审核、交换 B.审查、交换 C.交换和档案
D.审核、交换和档案 E.审核、档案
22.在统计执法中,被处罚单位在接到处罚通知后,如果既不在法定期限内申请复议或向人民法院提起诉讼,又拒不执行的,由查处机关依法______。A.强制执行 B.起诉
C.申请人民法院强制执行 D.与相关人协商解决
23.《北京市统计管理条例》是由北京市人大常委会制定的,属于______。A.统计法律 B.统计行政法规 C.统计规章
D.地方性统计法规
24.国家统计局每年发布的统计公报运用许多重要统计指标和数据反映一年来国民经济和社会发展状况。试根据以下提示的公报内容进行分析和判断,并在备选项中选出正确答案。(1)初步核算,2008年现价GDP为300670亿元,比上年增加43364亿元,实际增长9.0%。其中,第一产业增加值34000亿元,同比增加5373亿元,实际增长5.5%;第二产业增加值146183亿元,同比增加21384亿元,实际增长9.3%;第三产业增加值120487亿元,实际增长9.5%。(2)初步核算,2008年全国能源消费总量为28.5亿吨标准煤,比2005年增加6亿吨标准煤,比上年增长4.0%。(3)2008年末,全国城镇人口占总人口比重为45.7%,比2000年提高了9.5个百分点。如果将GDP缩减指数定义为某年现价GDP与不变价GDP之比率,则2008年GDP缩减指数比上年增长()%。A.7.9 B.7.2 C.5.9 D.不能确定
25.下列各账簿中,一般应采用三栏式账簿的是__。A.应收账款明细账 B.原材料明细账 C.库存商品明细账 D.管理费用明细账
26.企业采用支付手续费方式委托代销商品,委托方确认商品销售收入的时间是__。A.签订代销协议时 B.发出商品时 C.收到代销清单时 D.收到代销款时
27.经济结构等进行计算和分析,在下列备选答案中选出正确答案。表3-5 请根据以下资料对经济增长速度、经济结构等进行计算和分析,在下列备选答案中选出正确答案。表3-5 注:价值量指标按当年价格计算,发展速度按可比价格计算。
28.单位负责人是指依照法律或者法人组织章程规定,代表法人行使职权的负责人,又称______。A.单位主管 B.单位代表 C.法定代表人 D.法定负责人
29.根据《统计法》相关条款的规定,统计人员具有依照统计法律规定独立行使______的职权。
A.统计调查、统计报告、统计检查 B.统计调查、统计报告、统计分析 C.统计调查、统计报告、统计监督 D.统计调查、统计报告、统计研究
30.统计法明确要求,统计调查对象提供统计资料必须______。A.真实、及时 B.准确、及时
C.准确、完整、及时
D.真实、准确、完整、及时
31.某企业于2007年9月10日销售产品一批,销售收入为10000元,规定的现金折扣条件为 3/10,2/20,1/30,n/40,适用的增值税率为17%。企业于2007年9月26日收到该笔款项,应给予客户的现金折扣为__元。A.0 B.58.5 C.117 D.234
32.自行研发并按法定程序申请取得无形资产之前,开发过程中发生的费用符合资本化的,应最终__。
A.计入无形资产成本
B.从管理费用中转入无形资产 C.计入当期损益
D.计入当期长期待摊费用
33.代办电信工程收入30万元。要求:根据上述资料和有关法律规定,分析回答下列小题。该电信局5月应缴纳的营业税额为__万元。A.0.9 B.3 C.3.9 D.5.9
34.委托加工的应税消费品收回后准备直接出售的,由受托方代扣代缴的消费税,委托方应借记的会计科目是__。A.在途物资 B.委托加工物资
C.应交税费——应交消费税 D.营业税金及附加
35.某企业上年末资产负债表部分项目的余额如下:
货币资金460000元,应收账款89000元,存货264000元,固定资产原价1020000元,累计折旧366000元。该企业本年度发生下列经济业务:(1)购入甲材料一批,买价为40000元,增值税额为6800元;购入乙材料一批,买价为20000元,增值税额为3400元;购入甲、乙两种材料共发生运杂费1800元,按材料的买价比例分配;材料的货款和运杂费共计72000元均以银行存款支付,材料已验收入库。(2)对企业行政管理部门使用的固定资产计提折旧1200元。
(3)销售产品一批,售价为60000元,增值税税率为17%,货款尚未收到;该批产品的生产成本为44000元,销售产品应交纳的城市维护建设税及教育费附加为1000元。根据以下要求选择正确的答案。
根据上述业务(1)计算甲材料的实际采购成本为__。A.40600元 B.46800元 C.41200元 D.48000元
该企业当年发生的部分经济业务如下:
(1)生产车间为生产甲、乙两种产品共同领用材料一批,其实际成本为20000元。(2)销售产品一批,售价40000元,增值税额6800元,款项尚未收到。(3)以银行存款支付广告费300000元。(4)结转全年实现的净利润500000元。
上述四笔业务所涉及的下列账户中,不必设置明细分类账户的是__。A.制造费用 B.原材料 C.营业费用 D.本年利润
36.已知某资产负债简表的部分内容,如表6-1所示。表6-1 单位:亿元根据上述资料请回答:金融机构的资产中,金融资产所占比重为()。A.98.1% B.77.9% C.61.9% D.50.5%
37.以下是2005年全国资金流量表实物交易部分,请根据该表数据回答以下有关问题。表3-1 2005年全国支出法GDP比生产法GDP大()亿元。A.-5476 B.14970 C.-14970 D.5476
38.某企业2005年的税后利润为67万元,所得税税率为33%,利息支出为50万元,则该企业2005年的已获利息倍数为__。A.1.34 B.1.9 C.2 D.3
39.某企业上年末的资产总额为8000万元,负债总额为3500万元,所有者权益总额为4500万元(其中未分配利润为500万元);本年度发生主营业务收入3000万元,销售折让20万元,主营业务成本1200万元,主营业务税金及附加100万元,其他业务收入200万元,其他业务支出120万元,营业费用400万元,管理费用260万元,财务费用150万元,营业外收入30万元,营业外支出80万元;本年末的资产总额为9800万元,负债总额为4000万元,所有者权益总额为5800万元。本年末发生的部分经济业务如下:(1)按规定税率33%计算出应交纳的所得税为297万元。
(2)按净利润的10%和5%分别计提法定盈余公积和法定公益金。(3)按规定计算出应分配给普通股股东的现金股利301.5万元。
根据上述资料编制本年末的资产负债表,其中“未分配利润”项目的金额为__。A.211.05万元 B.301.5万元 C.512.55万元 D.711.05万元
40.统计法第七条规定,统计调查对象不得______。A.屡次迟报、拒报统计资料 B.迟报、拒报统计资料
C.屡次漏报、不报统计资料 D.漏报、不报统计资料
41.下列各项中,不应列入企业期间费用的是__。A.向受托方支付的代销商品手续费 B.给予购货方的销售折让
C.为购买材料办理银行承兑汇票支付的银行手续费 D.赊购商品时取得的现金折扣
42.营业收入在100~20000万元间的企业属于______。A.大型企业 B.中型企业 C.小型企业 D.微型企业
43.某饮料生产企业为增值税一般纳税人,年末将本企业生产的一批饮料发放给职工作为福利。该饮料市场售价为12万元(不含增值税),增值税适用税率为17%,实际成本为10万元。假定不考虑其他因素,该企业应确认的应付职工薪酬为()。A.10 B.11.7 C.12 D.14.04
44.某企业的全部实收资本中,国有经济成分的出资人拥有40%的股本,集体经济成分的出资人拥有30%的股本,私人经济成分的出资人拥有30%的股本。请根据上述资料,回答下列问题:该材料中涉及到的常用统计标准是______ A.企业登记注册类型 B.大中小微型企业划分 C.国民经济行业分类 D.企业控股情况划分
45.下列关于金融环境的内容的说法不正确的是__。A.金融工具是货币资金或金融资产借以转让的工具
B.金融市场按期限分为短期资金市场和长期资金市场,即货币市场和资本市场 C.金融市场的组织方式是指金融市场的交易采用的方式 D.资本市场所交易的金融工具具有较强的货币性
46.统计学制定于,修改于______。
A.1983年12月8日,1996年5月15日 B.1987年1月19日,1966年5月15日 C.1989年7月26日,1994年1月26日 D.1963年6月4日,1983年12月8日
47.某设备的账面原价为800万元,预计使用年限为5年,预计净残值为20万元,采用双倍余额递减法计提折旧。该设备在第2年应计提的折旧额为__万元。A.195.2 B.192 C.187.2 D.124.8
48.年末应收账款余额分别为200万元和400万元;年初、年末存货余额分别为200万元和600万元;年末速动比率为1.2,年末现金与流动负债的比率为0.7。假定该企业流动资产由速动资产和存货组成,速动资产由应收账款和现金类资产组成,一年按360天计算。该企业2009年度的应收账款周转天数为__天。A.28 B.45 C.54 D.60 49.当需求曲线整体向右上方移动时,这表明__。A.需求增加 B.需求减少 C.价格提高 D.价格下降
国内外β系数相关特性研究综述 篇6
就方法论而言, β系数必须从过去证券市场的收益率数据中进行估计, 而过去的数据估计出来的只能是过去的β系数。过去的β系数要能用于反映现在或将来的风险, 则必须具有一定的稳定性才行。因此, β系数稳定性的检验就显得相当的重要。根据样本数据构造的时间跨度和样本规模大小, β系数稳定性的研究可分为两类:一类是研究样本数据时间跨度长短对β系数稳定性的影响, 另一类研究样本组合规模大小对β系数稳定性的影响。对于β系数在美国证券市场上的表现, 许多学者做过大量研究, 但没有定论。关于股票β值稳定性的检验, 国外的学者如Levy (1971) 、Blume (1971) 、图莱 (1980) 等大多采用统计学上的相关分析法进行研究。在众多对β系数稳定性的检验中, 最具有代表性的当属Blmue和Levy检验。1971年, Blume在《财务学刊》上发表了《论风险的衡量》一文, 研究了1926年1月到1968年6月间在纽约证券交易所上市的所有股票, 以每7年为一个时间段, 用月收益率数据估计出各个时间段的β系数, 然后以统计学的相关分析法为基础, 对β系数的稳定性作了深入的研究, 得出如下结论:在一个时期里估计出来的β系数是其未来估计值的有偏估计;组合规模越大, 其未来的β系数越能被准确地预测。同年, Levy研究了1960年至1970年间美国纽约证券交易所上市的500种股票, 他缩短了估计的时间段, 采用周收益率数据, 并改变了前后估计时间段等长的传统做法, 以52周为基期, 后续期分别为52周、26周和13周。研究的主要结论认为:在较短的时间段内 (52周) , 单一股票的β系数是相当不稳定的, 但是组合β系数的稳定性有显著的提高。而且, 组合规模越大, 估计时间段越长, β系数的稳定性越高。1974年, Baesel运用转移矩阵法研究了估计时间段长短对β系数估计值稳定性的影响。他把估计时间段分别设定为12、24、48、72和108个月, 对1950年至1967年间美国纽约证券交易所的160只股票进行研究后, 提出:随着估计时间段的延长, 单个股票β系数的稳定性将会增强, 且最佳估计时间段是108个月。1975年, Porter和Ez Zen采用随机组合的方法进行研究后认为, 组合的构造方式会影响β系数的稳定性, β系数的稳定性并不会随着组合规模的扩大而有所提高。1994年, 国内的学者沈艺峰最早把“Chow检验法”用于股票β估计值的稳定性检验。他在《上海证券交易所上市股票的β系数估计及其稳定性检验》一文中, 对1992年6月至1993年12月上海证券市场的10种股票的β值进行估计, 然后将时限一分为二, 采用“Chow检验法”研究这10只股票的β值是否随着时间的推移而显著变化。检验结果表明, 除了“延中实业”外, 所有股票的β值都是稳定的。沈艺峰和洪锡熙 (1999) 又采用相同的方法, 对深圳证券交易所1996年度所有上市公司股票样本数据进行分析, 研究结果表明:无论是单个股票或是股票组合, β系数都不具有稳定性, 以过去期间的数据估计出来的β系数值无法代表未来的β系数值, 说明我国证券市场的系统风险是变动不定和难以预测的。2000年, 靳云汇、李学在《中国股市β系数的实证研究》一文中, 对沪深两市51种1992年以前上市的股票进行了研究, 研究结果表明:股票β系数随着上市时间增加基本上趋于不稳定, 利用β系数的历史数据来预测未来β系数的可靠性较差。
综观β系数稳定性的实证研究, 绝大多数研究认为证券的β系数不具有稳定性, 虽然可以借助于组合的方式来获得较为稳定的β系数, 但对于大多数的个人投资者来讲, 这意味着不能简单地用过去时期数据所估计的β系数作为当前和未来时期的预测值。因此, 除了在估计方法和数据选取等方面寻求β系数的变动原因之外, 许多学者还从公司的基本特征等方面入手探讨导致同一证券的β系数在不同时期出现变动以及不同证券的β系数在同一时期存在差异性的影响因素。
二、β系数的影响因素研究
股票贝塔系数存在不稳定性, 说明有必要进一步对股票β估计值的差异性进行分析。正如James Farrell和Walter J.Renhart (1997) 所指出的:股票贝塔值的不稳定性并不令人惊异, 公司的基本因素 (如产品生命周期、财务政策) 随时间的变化必然会导致股价的变动, 从而股票β值也随之改变。因此, 差异性分析能一定程度地解释股票β值的不稳定性, 有利于更准确地预测股票β值。一般认为, 影响股价变动和股票风险的因素主要有:宏观经济因素, 如利率、通货膨胀、国际收支、汇率等;行业因素, 如行业生命周期、市场竞争性等;公司基本特征 (本文就是从此方面对股票的预期β系数进行探讨的) ;战争及政治因素;心理因素, 如心理预期。以上因素均能导致股价变动, 从而影响股票的系统性风险。从国内外的研究来看, 主要集中在分析公司基本特征和行业因素这两个方面。理论上, 公司规模的大小、资本结构、经营收入的周期性及公司的负债比例等基本特征的变化将改变公司的风险特性, 从而影响公司所发行股票的风险。因此, 学术界对公司的基本特征变量是否会影响其股票的系统性风险系数展开研究。鉴于公司的会计资料能传递与公司基本特征有关的风险信息, 在实证研究中, 通常用会计变量作为反映公司基本特征的量化指标。Ball和Brown (1969) 最早注意到会计信息与β系数存在相关关系, 在他们的研究基础上, Beaver, Kettler和Scholes (1970) 从公司基本特征入手研究股票β值的影响因素。他们把公司基本特征细分为七个会计变量:股利支付率 (Dividend Payout Ratio) ;成长性, 即总资产增长率 (Asset Size Growth) ;财务杠杆 (Leverage) ;流动比率 (Liquidity) ;规模 (Size) ;盈利变动率 (Earning Variability) ;会计贝塔系数 (Accounting Beta) 。研究结果表明:在1947年至1956年和1957年至1965年这两个期间, 纽约证券市场上307家上市公司单个股票和5种股票的组合的系统风险与盈利变动性、股利支付率、会计贝塔系数和财务杠杆这4个会计变量之间一致且显著相关;对于每个变量, 组合的相关程度高于个股的相关程度;系统风险与成长性、规模和流动比率这3个会计变量之间的关系与理论假设不一致或显著无关。学术界认为, Beaver等人首次系统地研究系统风险与会计变量之间的关系。Bildersee (1975) 研究1956年至1966年期间纽约证券市场制造业和零售业的71家公司的系统风险与11个会计变量之间的相互关系, 其最后指出了与系统风险相关的6个会计变量 (负债比率、优先股与普通股的比例、销售与权益资本的比例、流动比率、市盈率的标准差、会计贝塔系数) , 并建立了多元线性回归模型。此外, Harmada (1972) 研究财务结构对股票系统风险的作用, 其研究结果表明公司财务杠杆与股票β值呈正相关关系。曼德尔克 (1984) 则增加了对经营杠杆这一因素的分析, 并表明股票β估计值与经营杠杆存在高度、显著的相关关系。Gahlon和Gentry (1982) 进一步研究表明系统风险是以经营杠杆系数、财务杠杆系数、总收入的方差系数、息税后收益和市场组合收益之间协方差系数为自变量的一个函数。Mandelker和Rhee (1984) 也证实了经营杠杆系数和财务杠杆系数能够解释大部分的系统风险的变动。Huffman (1989) 发现系统风险与财务杠杆系数正相关而与经营杠杆系数负相关。Mensah (1992) 指出公司的经营决策、财务决策和战略决策与系统风险是相关的。Rosenberg和Mc Kibben (1973) 的研究发现不同行业的β值存在持续的差异。于是, Rosenberg和Marathe (1975) 进一步把39个行业哑变量加入股票β值的分析模型中, 来解释股票β值的差异, 形成著名的集个股市场特征、公司基本因素和行业性质于一体的“罗森伯格系统” (Rosenberg’s system) 。Rosenberg和Marathe对该模型的首次检验表明模型对未来β系数的预测能力好于其它的预测模型。由于理论上的吸引力和检验结果的支持, 用罗森伯格系统生成的β系数预测值得到广泛的认可, 著名的BARRA咨询机构 (由Rosenberg创建) 就采用了这一系统。一般来讲, 行业因素对股票β值产生影响的原因有:行业受宏观经济波动的影响程度;行业所处生命周期阶段;行业内竞争程度。但吕长江, 赵岩 (2003) 的研究发现:中国证券市场中Beta系数并不存在显著的行业差异, 但在按照是否被纳入计算成份类指数的标准将股票进行分类, 即分为成份股和非成份股, 这两大类股票的Beta系数存在显著的差异。刘永涛 (2004) 研究也发现:就我国目前的五行业分类方法来看, β系数在行业间的区分并不明显;在证监会的CSRC行业分类标准下, β系数在各行业的区分整体上表现出差别性, 但两两之间β系数的差别不具有统计学意义。另外, 还有一类学者, 他们利用数学推导来研究β值和相关变量之间的关系。Chei-Chang Chiou and Robert K.Su (2004) 运用数学的方法结合资本资产定价模型、Cobb-Douglas函数和净盈余函数推导分析了系统风险和会计变量之间的关系。研究结果表明, 系统风险的决定因素包括收益、销售增长、账面价值、股利、经营杠杆系数、财务杠杆系数、市场回报率和无风险回报率, 并提出了以下结论:对于一个前一年度有着正收益和本年度有着销售增长的公司来说, 如果当前账面价值、股利和收益对股价影响的联合效应 (即股价弹性之和) 为正 (负) , 那么以产品的经营杠杆系数和财务杠杆系数为量度的总杠杆系数对系统风险有正的 (负的) 影响;当账面价值和收益对股价的影响 (即股价弹性) 为正而股利对股价的影响 (即股价弹性) 为正 (负) 时, 股利对系统风险有正的 (负的) 影响;对于一个有着正 (负) 销售增长的公司来讲, 在给定的系统风险水平下, 经营杠杆系数正 (负) 相关于其财务杠杆系数。郑君君 (2000) 运用数学推理的方法研究了β系数和市盈率之间的关系, 并且得到了它们相关的表达式, 结果显示β系数与市盈率呈负相关关系。
相比于国外的研究而言, 国内关于β系数的影响因素研究仍处于起步阶段。吴世农、冉孟顺、肖珉和李雅莉 (1999) 借鉴Beaver等人的研究, 收集1997年至1998年上海证券市场200家上市公司公布的会计信息, 应用实证分析方法, 对影响我国股票系统性风险系数的7个会计变量 (股利支付率、总资产增长率、流动比率、财务杠杆、公司规模、盈利变动性和经营杠杆) 进行了相关性和多元线性回归分析。研究结果表明:中国上市公司的总资产增长率和财务杠杆与股票的系统风险呈正相关关系, 股利支付率与股票的系统风险呈负相关关系;从组合后的回归分析看, 流通规模对股票组合的β值具有显著影响;经营杠杆对个股或组合的β值都没有显著影响, 流动比率与系统风险呈显著正相关关系, 盈利波动性与股票系统风险呈显著负相关关系, 而这些都是与财务理论相左的。农卓恩 (2000) 以1998年初在深交所上市交易的股票周实际收益率数据估计股票的β系数, 选择18个财务指标, 研究β系数与这些财务指标的相关性。结果表明:从总体上看, 股票β系数与财务指标之间的相关性比较弱。
三、β系数的预测性研究
由于经验研究已经证明β系数具有不稳定性, 因此, 如何准确地预测未来的β值就成为至关重要的问题。对未来β系数的预测主要有两条不同的思路:一是基于时间序列关系的预测;二是基于差异性影响因素的预测。1971年, Blume在《论风险衡量》一文中指出, 如果β估计值向均值回归的速度不随时间改变, 就可以在估计β系数时围绕这一趋势修正估计值。他采用简单线性模型β2=a+bβ1, 来估计相邻两期β估计值之间的回归关系, 用此回归关系修正对其将来值的估计。1973年, Vasicke在《关于在证券β系数的贝叶斯估计中运用横截面信息的一项注释》一文中根据β系数的回归趋势, 把贝叶斯决策方法引入β系数的估计中, 提出了贝叶斯调整法。Vasicke认为仅仅依据样本的信息来估计β系数是不够的, 如果能把有关β系数先验分布的资料与样本的信息结合起来, 就能降低估计误差。基于差异性影响因素的预测方法主要有基础β系数法和罗森伯格系统。基础β系数是根据公司基本特征的变化来估计未来的β系数, 模型中的自变量为反映公司特征的财务和会计变量。前面已经提到, 罗森伯格 (Rosenberg) 在1973年和1975年以及随后的研究中, 集历史β系数、个股市场特征、公司基本因素和行业特征于一体, 对β系数的差异性进行研究, 并据此对未来的β系数进行预测, 建立了著名的“罗森伯格系统”。罗森伯格系统试图将历史β系数和基础β系数两种分析思路综合到一个模型中, 以提高β系数预测的准确度。
四、未来研究展望
以上本文重点回顾了β系数的稳定性、差异性和预测性方面的研究文献, 综观这些研究文献, 可以发现存在以下两个方面的研究角度:较早期的研究主要是关注β系数随时间推移的稳定性, 采用各种不同时间区间长度的数据集、不同频率的收益率数据、不同的组合方式来考察β系数的变动特征, 所得出的结论是个股的β系数显著不稳定, 组合的β系数相对稳定, 且随着组合规模的增大, β系数的稳定性也会相应增加。这一时期的研究基本采用静态的估计方法, 即假设β系数估计值在一定的期间内固定不变, 然后采用普通最小二乘法估计单一指数模型或标准CAPM模型。显然, 这一假设在多数情况下与现实不符, 因为公司的基本特征如财务杠杆和经营杠杆的调整、资产的增减等都会改变公司的风险特性, 从而影响到公司所发行股票的系统性风险。正如James Farrell和Walter J.Renhart (1997) 所指出的:股票贝塔值的不稳定性并不令人惊异, 公司的基本因素 (如产品生命周期、财务政策) 随时间的变化必然会导致股价的变动, 从而股票β值也随之改变。许多西方学者从理论和实证的角度对会计变量与β系数的关系都作了深入的探讨, 他们发现β系数确实和一些反映公司风险状况的会计变量有非常密切的联系, 但是不同学者的研究结果并不完全一致。对于究竟哪些因素对β系数有影响作用, 学术界仍存在一些争议。如Bowman (1979、1981) 就不认同β系数与盈利变动性、规模和股利支付率之间会存在理论上的相关性, 他提出公司税率是β系数的一个影响因素。因此, 对于这一方面的进一步研究仍是有必要的。
我国关于股票预期β系数及其影响因素的研究并不多见。从公司基本特征出发, 通过实证研究, 利用相关分析、多元回归分析方法研究各公司前一年度的会计变量对后一年度的β系数的影响, 可以弥补以往研究的不足, 同时也能为投资者和证券监管部门的决策提供理论参考和依据。
摘要:在资本市场理论与实践中, 对β系数相关问题的研究一直是研究热点之一。本文根据对所收集文献的整理后发现, 对于股票系统风险 (β系数) 的实证研究, 国内外学术界主要有三种基本取向:研究不同时间股票的关系, 即对股票β值的相关性和稳定性进行分析和检验;寻求影响股票系统风险的因素, 即研究不同特征股票β值的差异性;研究β系数的预测性。这三个方面的研究是相互关联的, 在β系数的稳定性研究中所涉及到β系数估计模型的选择与修正问题, 这都与β系数的可预测性紧密相关, 而β系数的差异性研究则是从各种潜在影响因素中 (如公司的基本特征、宏观经济条件等) 探寻导致β系数存在差异性的根源。
相关系数 篇7
HHT方法从信号本身的尺度特征出发对信号进行分解,具有良好的自适应性;能够得到信号的时间—频率—能量分布特征。使在时间域内难以观察到的信号特征在频率域内十分清楚地显示来,得到这种分布后我们可以对信号进行分析,提取信号中所包含的特征信息,或者综合得到具有期望的时频分布特征的信号。由于HHT方法的种种特点,HHT已经在许多领域得到应用。在地球物理学领域,如非线性水波分析[1]、地震波分析[2];在生物医学领域,如心电图信号分析[3];在设备诊断领域,用于故障诊断[4]。
HHT是一种新兴信号处理方法,还有一些问题需要解决,比如信号经过EMD分解后会产生一些虚假的IMF分量,尤其在低频部分。本文针对EMD分解过产生的虚假分量[5],提出利用相关系数去除伪分量的方法。
1 HHT理论简介
HHT的实现包含两大部分:经验模式分解(Empirical Mode Decomposition,EMD)和Hilbert谱分析(Hilbert Spectral Analysis,HSA)
1.1 EMD分解[6]
该分解过程基于一个最基本的假设,即采集的数据是由许多基本的内在模态叠加而成,每一种模态对应于一种物理过程,它们或线性或非线性,并且具有相同数目的极值点与过零点,即要求在横坐标轴上下对称分布。
不同时间尺度的各种模态根据其特征尺度进行分离。对任意给定时间段,可能同时存在许多运动模态,它们互相叠加得到原始的复杂信号。分离之后每种模态是相互独立的,在连续的过零点之间不存在其他的极值点。
本征模态函数IMF所要满足的判断条件:
(1)整组数据极的值点和过零点的数目相同或者最多相差一个;
(2)局部极大值包络线和与局部极小值包络线的平均值为0。
在实际信号的处理过程中,完全满足第二个条件是不现实的,所以只要二者的平均值小于一个预先确定的小量即可。根据定义,可以采用如下方法分解函数:
(1)寻找到信号所有的局部极大值并用三次样条函数插值连接获得上包络线;
(2)同样的方法连接局部极小值点作为下包络线。两条包络线应包含了所有的数据,他们的中心线记为m1,它们的余项记为h1,即
经过这次分离,突起的值成为新的局部极大值或局部极小值。此过程有两个目的:消除载波和让波形更加对称。
这样获得的h1可以恢复原来埋没在初始数据中的其他本征模态,也就是说不一定满足本征模态函数的两个条件,随后的步骤将h1看作原始数据,找到包络的中心线m11继续分解:
重复以上过程,经过k次,直到满足以上两个限定条件,结束分解,使得h1k成为第一个IMF项,即
令
C1为从该数据分离出的第一个IMF分量。它应包括了信号的最小时间尺度即最短周期的模态,令原始信号与C1的差值为剩余信号r1
由于r1包含了较长周期的组份,可将其视为原始数据并重复以上的过程获得C2。其新的差值为:
当rn为单调序列或者相对原始信号幅度极小忽略不计时,可认为完成了提取信号本征模态的过程。综合以上的方程,最后得到:
从方程(7)可知,原始信号可表示为n个本征模态函数Cj和一剩余信号rn之和,rn或是常数量或是一组单调数据。所有的IMF分量经过逆向叠加,最后可以还原始数据X(t)。为了保证IMF分量有意义,Huang定义了标准偏差(Standard Deviation,SD)
以判断一个筛选合适完成。
1.2 Hilbert谱
对于满足条件的任意时间信号f(t),Hilbert变换y(t)定义为:
式中:P是Cauchy主值;式(9)是Hilbert正变换;式(10)是Hilbert反变换。f(t)和y(t)可以组成一个共轭复数对,于是得到对应于实信号f(t)一个复解析信号z(t):
式中
幅度函数a(t)和相位函数兹(t)都是时间的实函数,称之为Hilbert变换的瞬时幅度和瞬时相位,它们能很好的描述一个信号的局部特性,瞬时相位兹(t)对时间的导数,可以定义为瞬时频率:
由此可知,瞬时频率是时间的单位函数。幅度、频率都是时间的函数,所以可以画出时间-能量、时间-频率的分布图或者在三维坐标中画出能量-频率-时间的分布图,即Hilbert谱。
对信号进行HHT时,有些情况下在Hilbert谱中,有很多与信号无关的低频分量,这是由于采样率不足以及样条插值而引起的。为了减少这些伪频率分量,一般需要对信号采取过采样[7],在理想情况下,采样率要大于4倍的Nyquvist频率[8]。但是,当信号本身频率已经很高的时候,过采样势必带来很大的计算量,所以本文考虑利用相关系数来进行伪分量去除。
2 利用相关系数去除伪IMF分量
对原信号进行EMD分解后,可以根据信号的各个IMF分量和原信号的相关系数来去除伪分量。设两个时间序列x(n),y(n)的相关系数籽xy定义如下:
具体做法是:计算各个IMF分量和原信号的相关系数,设定阈值伪相关系数序列中最大值的十分之一。
2.1 仿真信号以及其特点
假设信号1是一个基频为100Hz调制频率为20Hz的调频信号和频率为200Hz的余弦信号叠加而成,其表达式如下:
这个信号本身包含了两种模态。
假设信号2为Chirp信号,Chirp信号是一类包含连续变化频率成份的信号,是一种典型的非平稳信号,因为它在各个局部时刻的频率都在变化,并且它还是一个典型的单分量信号,单分量信号本身就是一个严格的IMF。本文采用的Chirp信号的起始频率为10Hz,截止频率为200Hz。
2.2 实验结果
信号1本身包含了两种模态,但是当采样频率为1000Hz时,EMD过程会产生8个IMF分量(不包含剩余分量),如下图1所示。这样就存在6个伪IMF分量。在Hilbert谱中,低频部分由很多理论上不存在的分量,如图2所示。
各个IMF分量和原信号的相关系数如表1所示。
根据前述取阈值为0.08914,所以最后只有IMF1,IMF2被保留下来。
利用IMF1,IMF2对信号进行重构,消除虚伪分量得到的Hilbert谱如图3所示。此时,计算重构信号与原信号的相关系数为0.999。
对于信号2,当采样率为200Hz时EMD过程会产生5个虚假IMF分量,反映到Hilbert谱中,在低频处有许多理论上不存在的分量,如图4所示。
各个IMF分量和原信号的相关系数如表2所示。
此时,阈值为0.1,所以最后只有IMF1被保留下来利用IMF1对信号进行重构,消除虚伪分量得到的Hilbert谱如图5所示。
从上图可以看出,那些虚假的IMF分量带来的低频成分已经被消除了。
此时,计算重构信号与原信号的相关系数为1.000。
3 结论
本文讨论了EMD过程中虚假分量的产生和解决方法,提出利用相关系数去除伪分量的方法,并且采用典型的非平稳信号和平稳信号作为实验信号。实验结果表明本文方法可以有效去除伪分量
参考文献
[1]Schlurmann T,Bleck M,Oumeraci H.Wave transformation at artificial reefs described by the Hilbert-Huang transformation(HHT).Pro-ceedings of the International Conference,2002,1791~1803
[2]胡聿贤,张郁山,梁建文.应用HHT方法从竖向地震动记录识别场地液化的物理过程.地震工程与工程振动,2004,24(3):1~11
[3]Echeverria J C,Crowe J A,Woolfson M S.Application of empirical mode decomposition to heart rate variability analysis.Medical&Bio-logical Engineering&Computing,2001,39(4):471~480
[4]于德介,程军圣,杨宇.Hilbert能量谱及其在齿轮故障诊断中的应用.湖南大学学报(自然科学版),2003,30(4):47~50
[5]Zhong Y M,Qin S R,Tang B P.Study on the theory of Hilbert-Huang transform.Journal of Vibration and Shock,2002,21(4):13~17
[6]Huang N E,Shen Z,Long S R.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis.Proc R SocLond,1998,A454:903~995
[7]张志新,马孝江,苗刚.采样频率对局域波分解的影响.上海交通大学学报,2006,40(11):1976~1979
相关系数 篇8
相关系数是一个无量纲数, 其数值总是在+1与-1之间, 其数值的大小可以表示两个股票之间的线性相关程度。如果相关系数是+1, 那么两资产的收是线性正相关, 如果相关系数是-1, 那么两资产的收益是线性负相关。
如果用传统的方式计算相关系数, 其计算量非常大, 不易实现, 下面用沪、深两市四支股票为例, 用Excel计算相关系数。
四支股票分别是沪市的东风汽车、上海机场, 深市的深万科、深科技, 2000年0-12月月末的收盘价为:
计算相关系数的过程如下:
一、打开Excel录入有关数据
在A1:E13的区间, 录入上述数据, 其结果见上表。
二、计算四支股票12个月的收益与平均收益
在不考虑股利的情况下, 每只股票的月收益rAt= (PAt-PA, t-1) /PA, t-1, 其中PAt表示A股票t期的收盘价, PA, t-1表示A股票t-1期的收盘价。 (收益也可用rAt=ln (PAt/PA, t-1) 计算) 均值可用Average函数, 四支股票的收益及收益均值计算结果如下:
三、计算超额收益矩阵
假设我们有N个风险资产而且对每个资产我们有M期的收益数据。那么超额收益矩阵为如下形式:
其中, rnm表示第n个资产m期的收益, rn表示第n个资产的平均收益。
本例中, 四个资产的超额收益矩阵计算结果如下:
单元格B33:E44的公式格式如上图标注所示。
四、将超额收益矩阵转置
矩阵A转置的结果AT如上图:
矩阵转置的操作方法:选中B47:M50→输入=Trans pos e (B33:E44) →同时按下Shift+Ctrl+Enter三个键。
五、计算方差-协方差矩阵
方差-协方差矩阵S= (AT*A) /期数, 上例的计算结果如下:
方差———协方差矩阵计算方法:选中B52:E55→输入= (Mmult (B47:M50, B33:E44) ) /12→同时按下Shift+Ctrl+Ente r三个键。
六、计算相关系数
相关系数ρAB= (Cov (rA, rB) ) /σAσB, Cov (rA, rB) 为A、B两资产的协方差, σA、, σB分别两资产的标准差。方差开平方可得标准差。本例的计算结果如下:
相关系数 篇9
2000年, Li首次将Copula方法引进CDO定价问题中, 并提出了因子正态Copula模型。这一模型在信用衍生产品领域, 被学界和业界与Black-Scholes期权定价公式相提并论, 并极大地推动了信用衍生产品市场的发展。目前, 正态因子Copula模型是行业定价和风险度量的标准模型, 它具有形式简单、计算快捷的优点, 但不能完全拟合所有标准CDO分券的市场报价, 存在相关系数微笑等与模型假设不符的现象。尽管国内外学者做了大量研究, 目前相关系数微笑问题仍然不能得到根本解决。业界对这一问题的解决办法是采用隐含相关系数定价方法。本文, 笔者旨在研究基于正态因子Copula模型的隐含相关系数定价方法, 以及对非标准分券的定价方法, 并对欧洲CDO标准分券进行实证研究。
一、正态因子Copula模型
若CDO资产池中有n家公司, 是第xi家公司的股票收益率,
式 (1) 中, F为影响所有公司违约状态的市场指数收益率, 被称为共同因子, Zi为只影响公司i的因子。F与Zi服从标准正态分布且相互独立, 参数, xi与xj之间的相关系数为 。
假定公司i的违约时间ti的累积分布函数记为, 则表示ti
将截至时刻t刚好有k个公司违约的概率记为P (k, t) , 在条件F下概率记为。在标准市场模型下, 违约时间分布和视为相同, 式 (2) 变为
*基金项目:河南省基础与前沿技术研究项目“资本市场的分形结构研究” (112300410064) 。
假设公司的违约密度为常数, 并与指数的溢价一致, 可求得违约密度为λ, 则
由二项式分布的性质, 标准市场模型给出了方程
假设某个分券层所覆盖的损失范围为αL至αH, 参数αL被称为附着点, 参数αH被称为离开点, 定义, 。式中, R为回收率。定义m (x) 为大于x的最小整数。在不失一般意义下可以假定分券的最初面值为1。当违约数量k小于m (n L) 时, 分券面值为1。当违约数量k大于m (n H) 时, 分券面值为0, 在其他情况下, 分券面值为。 。
定义Ej (F) 为给定因子F值的条件下, 时刻tj分券面值的期望值
为计算Ej的无条件值, 对Ej (F) 在标准正态分布下积分, 积分的计算采用高斯求积公式来完成。
假设关于一个CDO分券的保费支付时间为t1, t2, …, tm, 并令t0=0, v (t) 为在时刻t的1元钱的现值。假设某个特定分券的溢价 (即为了买入信用保护后支付的基点数) 为每年S, 该溢价用于剩余分券面值上。对于CDO的预期正常付费的贴现值为SA, 其中 , 时刻 之间的损失期望值为Ej-1-Ej。假设损失发生在时间段的中间点 (即在时刻) ;CDO分券的收益期望的贴现为 ;损失发生时的应计付款为SB, 其中 。对于信用保护的买方而言, 分券的价值为C-SA-SB, 根据无套利原理, 信用保护买方 (或卖方) 的期望收益等于期望损失, 即C-SA-SB=0, S=C/ (A+B) 。由此式即可得任意分券的溢价, 也是该分券的市场价格。
二、隐含相关系数及其在CDO定价中的应用
1. 隐含相关系数。
在标准的正态因子Copula模型中, 回收率假设为常数, 相关系数是唯一的不可观测的参数。市场参与者通常用CDO分券的市场价格求出模型隐含的相关系数, 包括基础相关系数和复合相关系数。基础相关系数是对每一个分券[a, b], 使该分券的模型价格与市场价格一致的相关系数;复合相关系数是使每一个分券[0, b]的市场价值与模型价值一致的相关系数。如果市场价格与模型具有一致性, 无论是基础相关系数还是复合相关系数对于所有分券都应该相等, 但是正态因子模型的复合相关系数具有微笑特性, 基础相关系数具有倾斜特性。尽管文献中对模型的改进有大量研究, 但目前仍然没有从根本上解决相关系数微笑问题。针对这一难题, 业界普遍采用的方法是利用标准分券的隐含相关系数对非标准分券定价。
2. 对非标准分券的定价。
i Traxx欧洲指数标准分券有0%~3%, 3%~6%, 6%~9%, 假定想对i Traxx欧洲指数中4%~8%的分券定价, 这是非标准分券。一种方法是对基础相关系数进行插值来求得对应于0%~4%分券和0%~8%分券的基础相关系数, 并计算这些分券相应的预期损失的贴现值。4%~8%分券的预期损失可以被估计为0%~8%分券和0%~4%分券预期损失之差, 由此可以求出隐含复合相关系数, 据此由标准定价模型求得该分券的合理价格。
三、对欧洲CDO标准分券的实证研究
1. 标准分券的隐含相关系数。
笔者针对2007年1月31日、2009年1月31日和2012年1月31日i Traxx欧洲信用指数的标准分券进行实证研究, 各分券报价如表1、表2所示。
表1中, 0%~3%分券的标价是信用买入方必须先支付报价所指明的比率 (以分券面值为基础) 外加每年收费500个基点。
表2中, 0%~3%分券和3%~6%分券的标价是信用买入方必须先支付报价所指明的比率外加每年收费500个基点;6%~9%分券是信用买入方必须先支付报价所指明的比率外加每年收费300个基点;9%~12%分券和12%~22%分券是信用买入方必须先支付报价所指明的比率外加每年收费100个基点。
笔者应用因子Copula方法分别求出各分券的复合相关系数, 如表3所示。再据此分别求出各分券的基础相关系数, 如表4所示。
表3和表4的隐含相关系数的形态分别如图1和图2所示。
从图1可以看出, 复合关系的确不是常数, 具有微笑现象, 且2009年和2012年比2007年的微笑程度高一些。从图2可以看出, 基础相关系数也不是常数, 具有明显的倾斜现象, 并且2009年和2012年比2007年的基础相关系数线显著上移。可能的原因是金融危机之后, 市场对公司共同违约的预期增加了。
2. 非标准分券的定价。
采用隐含相关系数定价方法对i Traxx欧洲指数的非标准分券进行定价研究。2012年1月31日和2009年1月31日的非标准分券价格如表5所示, 其与标准分券的报价比较结果如图3、图4所示。
由图3和图4可以看出, 非标准分券的定价与标准分券的市场价格比较接近, 复合预期, 可以作为交易的理论基础。
相关系数 篇10
但是, 恩格尔系数是根据特殊经验提出的, 且恩格尔系数成立的前提是假设其他变量都是常数。由此可以看出, 恩格尔系数的提出其实是具有地域性色彩和相当严格的限定条件的。在我国, 恩格尔系数也常常被套用来评价人民的生活水准, 但是, 目前也有很多学者已对此提出质疑。学者王少飞提出, 在考虑恩格尔系数的“食物支出”应有明确的统计含义, 需要对食品消费中的必需型食品和非必需型食品进行界定[2]。学者邓明认为, 由于我国正处于经济高速增长时期, 且居民消费结构也在发生变化, 以及地区经济发展的不平衡性, 都将使得恩格尔系数出现失效的情况[3]。鉴于此, 本文认为, 恩格尔系数的评判标准是否合适中国, 是否能真正说明人民的生活水平状况还需要进一步探讨论证。
1 恩格尔系数失效现象
恩格尔系数是指食物支出总额占个人消费支出总额的比重, 其数学表达式为:
恩格尔系数= (食物支出总额÷个人消费支出总额) ×100%
本文主要是通过测算近十年来新疆城乡的恩格尔系数, 通过纵向与横向两个角度, 来证明恩格尔系数的失效现象。
1.1 纵向分析
根据《中国统计年鉴》的相关数据, 本文把2002年至2011年新疆城乡居民平均消费支出, 可支配收入及食物消费支出作了简单整理, 并由此计算出相应每年的恩格尔系数。如表1。
数据来源:《中国统计年鉴》, 2002~2011。
由表1显示的数据可以看出, 若按照国际标准, 2002年到2011年间, 新疆城镇居民的生活水平都一直处于相对富裕的状态;新疆农村居民的生活水平也从小康奔向了相对富裕。值得注意的是, 到2011年, 新疆农村居民的恩格尔系数 (36.1%) 甚至低于了城市居民的恩格尔系数 (38.3%) 。那这些, 是否就能说明新疆全区居民的生活水平都达到了所谓的“相对富裕”呢?是否又能说明目前新疆农村居民的生活状况比城镇居民的生活状况还要好呢?众所周知, 新疆属于西部欠发达地区, 贫困人口比例一直居高不下, 特别是南疆地区的农村, 大多数少数民族家庭超生情况严重, 且本来家庭就不富裕, 抚养孩子成为一个家庭沉重的负担, 甚至在个别偏远的农村地区还有很多人连温饱都是问题。十年间, 城镇居民的可支配收入在不断增加, 但从图1可以看出, 其恩格尔系数却有曲折渐进上升的趋势。就城镇而言, 恩格尔系数与可支配收入之间并没有呈负相关关系, 这一点就与恩格尔定律不符了。其次, 据统计资料表明:2011年, 新疆农村居民人均住房面积26.14平方米, 而同期全国人均住房面积为36.24平方米, 相差10.1平方米, 对于现代有车有房才算富裕的思想来说, 这显然与新疆2011年恩格尔系数36.1% (相对富裕) 得出的结论相悖。
1.2 横向分析
为了将新疆的恩格尔系数作一个横向的比较, 本文例举了几个代表性省市 (其中包括发达省, 中部省, 直辖市) 。根据《中国统计年鉴》2011年的数据, 就全国范围来看, 城镇居民恩格尔系数最低的是内蒙古31.25%, 比经济发达的上海低了4.23个百分点, 比广东省低了5.64个百分点。那是不是就能说明内蒙古城镇居民生活水平在上海和广东这样的发达省市城镇居民生活水平之上了呢?上海作为中国第一大城市, 拥有最大外贸港口和最大工业基地, 并且也是中国的经济金融中心, 2011年人均可支配收入是内蒙古的1.8倍;广东也属于沿海发达地区, 是一个工业化相当发达的省, 其GDP连续21年居全国第一, 2011年的地区生产总值是内蒙古的3.7倍。通过表2的数据, 可看出, 新疆城镇居民的恩格尔系数低于重庆、福建、四川、湖北、海南等地区, 那是不是也意味着新疆城镇居民的生活比这些地区城镇居民的生活更加富裕呢?显然也不是。福建和海南都属于沿海城市, 福建省2011年的人均可支配收入比新疆多出9394元, 虽然地方物价会有一定差异, 但在某种程度来说, 人均可支配收入也能反映人民的生活水平。后者的旅游业相当发达, 很大程度上带动了当地的经济发展, 虽然海南的人均可支配收入不高, 但从现实情况反映来看, 海南人民生活状况还是要稍好于新疆;重庆作为四大直辖市之一, 国家对其经济的扶持力度可见一斑, 2011年重庆市的生产总值达到10011.37亿元, 而整个新疆维吾尔自治区才6610.05亿元, 这里便可明显看出差距有多大。根据以上分析, 本文认为, 恩格尔系数应用于评价人民生活质量方面确实出现了失效现象。
数据来源:《中国统计年鉴》, 2002~2011。
数据来源:《中国统计年鉴》, 2011。
2 关于恩格尔系数失效之原因探讨
在本文前面已经提到, 恩格尔系数是基于其他变量为常数的条件下提出的, 并且受当时地区与社会发展状况的限制;再加上中国是一个发展中的社会主义国家, 社会主义经济体制本身就与欧洲国家不同, 若把恩格尔系数生搬硬套用于评价中国各地区居民的生活水平状况, 确实欠妥。基于以上观点, 本文认为, 恩格尔系数失效的原因主要有以下几点。
2.1 房地产价格的急剧增长
就目前来说, 买房已成为中国家庭居民人生中的一件大事, 中国人的传统思想就是认为有房子才有安全感, 所以不惜一切代价买房, 很多人年纪轻轻就已成为“房奴”。房价的增长速度远远大于人民收入的增长, 对于漫天的房价, 人们只好“节衣缩食”。对于大部分人来说, 每个月工资基本都是固定的, 除去房贷之后, 剩下来的一部分收入还要用于交通、穿着、人际交往等方面, 故对于食物方面的支出就所剩无几了, 显然食物支出下降是由于其他方面支出增多的挤占结果。
2.2 消费观念的变化
现代社会经济快速发展, 在物质需要增长的同时, 人民对精神层面的需求也逐渐增加。人们除了“吃饱穿暖”之外, 还更加讲究“吃好穿好”了。从表3可以看出, 近三年来, 新疆城镇居民在衣着方面的支出比例持续上涨, 并且其比例数量在消费结构中位居第二。由此可以看出, 随着时代的进步, 人们的思想也产生了变化, 追求时尚新潮的观念影响着人们的生活各方面, 所以人们在衣着打扮方面更愿意花钱, 这也是导致恩格尔系数下降的一个原因。
数据来源:《中国统计年鉴》, 2009~2011。
2.3 家庭居民储蓄存款的增加
随着人们绝对收入的增加, 储蓄动机开始增强。比如说, 有的人把多余的钱存入银行, 目的是为了孩子长大后的教育费用;有的人存钱则是为了在以后能够买房买车;也有人存钱是为了给下一代更好的生活条件;也有人存钱的目的是为了给自己养老。当然, 不同的人都有自己不同的储蓄动机, 对未来生活的不确定性也在一定程度上影响了人们的储蓄动机, 并且人们的储蓄意识也随时间增强, 所以人们倾向于把更多的钱存入银行, 这一点从表4可以看出。
数据来源:《中国统计年鉴》, 2006~2011。
2.4 食物的商品化程度不一
在表1中, 可以发现新疆农村恩格尔系数呈现下降趋势, 并且在2011年低于了城镇居民的恩格尔系数, 其中有一个很重要的原因是食物的商品化程度。我们都了解, 城镇居民的食物大多数都需要自己从菜场、小商店或超市购买, 也就是说必须用现金货币支出, 食物对城镇居民来说显然是一种必要的商品, 几乎每一样食物都需要货币;但是农村居民则不同, 农民有地, 除了可以在市场上购买食物之外, 很多农民的生活食物还可以来自自家的农地, 他们有一定程度上的自给自足的现象。基于这两点, 也就不难解释新疆农村居民的恩格尔系数为什么比城镇居民的恩格尔系数还要低。
2.5 地区物价差异及地区消费食物差异
不同地区商品的价格会有一定差异, 这在食物上表现得尤为明显。新疆属于偏远地区, 消费水平肯定不如发达省市, 沿海地区水产品海鲜类消费得比较多, 而海鲜水产品属于高端消费食物, 这样就表现为沿海城市居民的食物消费花费比较多, 像新疆这样的地区, 这类高端食物的消费明显不如内地那么多, 这在一定程度上节省了当地居民在食物上的支出。而且因为沿海本身就比较发达, 所以在整体物价方面会高于新疆, 这也是沿海一些中部省市恩格尔系数高于新疆的一个原因。
3 结语
恩格尔系数用于评价国民生活质量有一定的意义和影响, 但不可否认同时也存在一定的局限性。就如本文所述, 房地产价格、人民的消费观念变化、居民储蓄量的增加、食物的商品化程度、地区的物价差异等都会影响着恩格尔系数的大小。随着时代的进步和经济的发展以及全球化趋势的扩大, 这种意义和影响力在逐渐弱化, 并且在实际的生活中, 发现了很多与恩格尔定律相悖的现象。为国家准确地衡量居民消费能力情况, 制定最低工资标准, 划分居民贫困程度, 提供决策依据和支持[4]。但并不是意味着恩格尔系数对于评价居民生活质量毫无意义。对于此, 本文认为, 在运用恩格尔系数评价分析时, 不要盲目使用国际标准, 要分地区来评判, 也要考虑到不同地区的消费结构的不同, 还有就是需要将地区人均可支配收入及人均GDP结合使用。还有一个值得思考的地方就是, 人民的生活质量是一个很广泛的概念, 以上提到的这些都是属于物质的范围, 但是人民生活水平是否应该也有精神方面呢?所以, 本文认为, 在评价人民生活质量的时候, 也应该把人民的幸福感这类指标与恩格尔系数一起使用, 共同衡量人民生活水平, 这样不仅更全面反映了人民生活状况, 也弥补了恩格尔系数本身的不足, 使得恩格尔系数能更好发挥其作用。
摘要:长期以来, 恩格尔系数都被视为衡量居民生活水平高低的参考指标, 同时, 政府也把其纳入评价国民生活质量的体系之中。但是随着经济的不断发展和社会的不断进步, 恩格尔系数在评判人民生活水平上的效度逐渐弱化。本文以新疆城乡的相关数据为切入点, 通过对城乡恩格尔系数对比及消费结构剖析, 以及与国内部分省市相关数据对比分析, 来证明恩格尔系数失效的观点, 并分析了导致其失效的原因, 最后给出了一点相关建议。
关键词:恩格尔系数失效,新疆城乡,消费结构,失效原因
参考文献
[1]高鸿业.西方经济学[M].北京:中国人民大学出版社, 2011.
[2]王少飞.用恩格尔系数衡量居民生活水平的可行性研究[J].统计研究, 2002 (06) .
[3]邓明.恩格尔系数在我国应用中存在的问题[J].中国统计, 2008 (04) .