不确定知识(精选八篇)
不确定知识 篇1
许多学者都针对知识分享做了大量的研究,一般来说采用演化博弈的方法进行研究,认为知识共享过程作为一个学习的渐进的动态演化系统,用演化博弈理论研究知识共享过程和演化稳定的因素[1]。并针对不同的前提进行分析,主要分成完全理性下背景下的知识分享研究[2,3]和有限理性下背景下的知识分享研究,但是各自都有自己的不足之初。在实际情况中,博弈各方并不能做到完全理性,只能是有限理性情况下进行分析,所以采用完全理性的假设前提并不合理。基于有限理性假设的文献一般关注主动参与知识共享活动和搭便车行为,采用这两类策略的不同主体通过反复博弈从而获得最终的博弈结果。[4,5]
但是在博弈的过程中,必然会受到不确定的外界环境的影响和干扰,这种不确定性会对有限理性下成员的行动产生深远的影响。而文献并没有考虑到不确定性因素对有限博弈带来的影响。所以本文在已有有限理性角度下的知识分享研究的基础上,关注不确定因素对知识分享的影响。
一、模型建立
本文关注合作双方成员知识分享策略的变化过程,以演化博弈的理论为基础在有限理性的假设前提下研究两个组织成员不同策略出现的概率,并重点关注成员在博弈过程中出现随机的犯错误以及外界的不确定因素对成员策略选择结果的影响。
文中假设如下:
(1)成员企业不共享知识时获得的收益为Pi(i=1,2);
(2)如进行知识分享还可获得超额收益,包括直接收益和协同收益。
(3)直接收益是指企业吸收并转化了合作方的知识而带来的收益。它受对方的知识水平(ai)、对方知识的共享度(Bi)和自身知识转化系数(ri)三个因素影响。所以,企业A和B因知识共享所带来的直接收益可分别表示为r1B2a2、r2B1a1。
(4)协同收益与企业彼此相互依赖的程度有关。用Dij表示成员企业j对成员企业i由于联盟而产生的依赖程度,那么知识共享所产生的协同价值可用Djiaj表示。
(5)企业在共享知识时也面临泄露核心知识而丧失核心竞争优势的风险。若li为企业i在动态联盟中采取共享策略时带来的风险水平, 则liai为企业i采取共享策略时所付出的成本。
(6)当双方都选择知识共享策略时,企业A和B的收益分别为P1+r1B2a2+D21a2-l1a1和P2+r2B1a1+D12a1-l2a2。若双方都选择不共享策略时, 双方都只能得到独立运作时的正常收益Pi。若一方选择知识共享,另一方选择不共享,则共享方不但没有可能获得任何超额收益, 反而会面临知识被盗的风险,此时收益为Pi-liai。
(7)成员A选择分享策略的可能性为X,不分享的可能性为1-X,成员B分享策略的可能性为Y,不分享的可能性为1-Y。
最后双方在各种策略下的收益如表(1-1)所示。
由此可得出,成员A采取知识分享策略概率变化的动态方程为:成员A选择知识分享策略概率的变动率=成员A选择知识分享策略概率×成员A选择此策略的额外收益增量。
成员B采取知识分享策略概率变化的动态方程为:成员B选择知识分享策略概率的变动率= 成员B选择知识分享策略概率×成员B选择此策略的额外收益增量。
二、模型求解
只需对(1.1)、(1.2)求偏导且等于零,即可得平衡点,平衡点为(0,0),(0,1),(1,0),(1,1)(x*,y*),其中x*=l2a2/(r2B1a1+D12a1),y*=l1a1/(r1B2a2+D21a2)。并通过求解雅可比矩阵的局部稳定性分析系统在5 个平衡点的稳定性,分析雅克比矩阵的特征值和特征向量即可得到结论。其中tr J是雅克比矩阵的迹,det J是雅克比矩阵的行列式。
由于平衡点(1,0)、(0,1)tr J>0,det J=0,故为不稳定点,平衡点(x*,y*)的tr J>0,det<0,故为鞍点,只有平衡点(1,1),(0,0)的tr J<0,det J>0,所以(1,1),(0,0)为演化稳定策略(ESS)。
从以上动态演化博弈模型可知,在有限理性的前提下,在长期合作中成员知识共享行为最终可能稳定于(共享,共享)或(不共享,不共享),而成员最终选择何种策略必须根据实际参数进行分析,判断r1B2a2+D21a2与l1a1,r2B1a1+D12a1与l2a2之间的关系。若r2B1a1+D12a1>l2a2时,企业A选择知识共享,B选择知识共享获得的收益大于选择不共享获得的收益,所以A、B均共享知识,若A不共享知识,B也选择不共享,避免遭受不必要的损失。若收益小于成本则合作双方均选择不共享知识。
所以只有提高合作双方成员的协同收益、知识存量、知识共享能力,降低知识共享的风险才能促进知识共享活动的实现。
三、成员犯错误及其影响
即使合作双方在博弈过程中,知识分享的收益大于知识泄漏的风险,但双方均只是有限理性,如果在博弈过程中出现错误,选择的策略不是最优策略,最终策略还会共同进行知识分享吗?本文使用伊藤和维纳过程研究“犯错误”的情况。通过对已有模型添加随机扰动项来模拟成员在选择策略时“犯错误”的影响,观察这个随机过程最终的平衡点来判断成员的最终行为,并对其数学期望和方差进行研究。添加了扰动项后的模型为:
通过研究随机变量的某些数字特征可以简洁、有效地描绘成员“犯错误”情况下的统计特性。通过计算均值(期望)和带扰动项后的方差即可知道随机项的影响。
四、结果分析
通过计算发现,E[X(T)]、E[Y(T)]的极限为1,E[X(T)]2、E[Y(T)]2也为1,故DX=E[X(T)]2-(E[X(T)])2=0,DY=E[Y(T)]2-(E[Y(T)])2=0。这个结果与前文求证双方均以(共享,共享)为均衡策略一致,与无犯错情况下的选择一致。
结果表明,即使成员偶然犯错误,只要收益大于知识泄漏的风险成本,长期选择的结果与犯错误没有关系,犯错误的成员会逐步改正错误,最终仍趋向(分享、分享)。即不仅所有的博弈方都会选择知识分享策略,而且具有很强的抗扰动的稳健性能力。在研究成员选择策略的可能性时,犯错误的影响忽略不计。
五、外界不确定环境的影响
既然成员自己犯错误不会对长期博弈的结果产生影响,那么外界不确定环境因素对有限理性成员选择策略的影响程度又有多大呢?
在已有模型的基础上引入漂移项来模拟不确定因素的影响。漂移可以理解为演化博弈发展过程中的一种变异因素,它会改变成员的策略选择。在此我们通过添加漂移项模拟在经济社会中, 外界的动荡环境导致成员偏离某种策略选择的行为。虽然在前文中可以知道,(共享,共享)是最优策略,但我们关注外界不确定因素对最优策略是否存在影响。添加漂移项后的模型为:
成员A选择知识分享策略概率= 成员A选择知识分享策略概率×成员A收益的增量+ 漂移率×(放弃原有策略的概率- 成员A选择知识分享策略概率)
成员B选择知识分享策略概率= 成员B选择知识分享策略概率×成员B收益的增量+ 漂移率×(放弃原有策略的概率- 成员B选择知识分享策略概率)
βi∈(0,1)表示成员i遭受漂移影响而放弃原有策略的概率,且 βi=1,λ 表示外界的变动因素。
六、结果分析
由于无法直接求出均衡解和数字特征,因此下文将采用数值模拟的方法观察成员博弈的过程。
λ 的大小可以反映环境的不确定性的程度,外界不确定通过漂移率 λ 对博弈双方的策略选择造成影响。所以通过有无漂移率的结果对比以及漂移率大小的结果对比来观测外界的影响。
以下首先对漂移率=0 和漂移率=0.1 进行对比分析,观察漂移率对博弈双方策略选择的影响及其影响的程度,参数设定如表2。
从图中1-1 可以看到,当存在漂移时,即使是极微小的漂移(λ=0.1),原有的平衡点也发生变化,合作双方发生动摇,最终的均衡结果不再是(共享,共享)。
然后模型假定合作双方的各种策略收益不变的情况下,在基于上表参数的情况下通过修改漂移率的大小从λ=0.1、λ=0.3、λ=0.5、λ=0.7,观察合作双方最终稳定策略选择的概率。
从图中可以看到,当 λ 较小时,如 λ=0.1,博弈方的策略选择稳定点非常接近(共享,共享),但是随着 λ 越来越大,博弈方选择不分享知识策略的可能性越来越明显。但是即使外界的不确定达到较大时,如 λ=0.7,稳定点出现在0.9 附近。可以看到只要成员能够预估收益较大时,即使有很大风险,成员仍愿意进行分享知识,但演化的过程变慢,动摇的程度也越来越明显。结果如图1
小结
在有限理性的前提下,利用演化博弈理论,在两个博弈成员经过多次博弈最终策略选择为(共享,共享)、(不共享,不共享)。只有当知识分享策略的合作收益大于知识泄漏的风险时,合作双方才会均采取知识分享策略。
把不确定变成确定 篇2
这是我最不喜欢的答案,虽代表了决心,但我得到的却是一个不确定的答案,一个他们不回答我都知道的答案,而我要的是一个确定的答案,当然这个答案也不是自我陶醉式的肯定答案。我继续追问:“你们有把握100%完成任务吗?”他们回答:“没有,所以只能说尽力。”我继续问:“那按目标完成的概率有多高?”这位主管迟疑了许久说:“大约50%。”我接着问:“这个成功的概率太低了,这样不行,有什么方法能让成功的概率提到80%以上?”这位主管与他的团队沟通后回答我:“如果预算目标降低20%,那他们达标的成功率就会提升到80%以上。”我再问:“那什么样的目标,你们有把握100%完成?”他回答我:“如果预算目标降为50%,我们有绝对的把握完成。”
问到这里,我终于得到所有“肯定而正确”的答案,在这个肯定而正确的答案基础上,我让他们重新设定工作方法、制订计划目标。
我曾经被“不确定”迷惑了很长的时间,这包括我自己的不确定:我不知道市场有多大,我不知道自己能否完成任务;也包括别人给我的不确定:我尽力帮你完成这件事,我尽量准时交给你,我尽量达到目标……
解决的方法也很简单,首先我不接受任何不确定的答案,其次,遇到不确定的答案,我就要转换问话方式,一直到得到相对确定的答案为止。
何飞鹏
数码音符——不确定之确定 篇3
然而, 理想和现实之间距离遥远, 这里先迈出很小的一步, 下面展示的是一个非常简单的例子。
第一步:用程序设计语言编写一个随机数发生器。例如, Print Int (Rnd (1) *10) , 反复执行该语句以得到一串随机数。笔者在Visual Basic环境中, 未使用Randomize变换随机序列时, 获得的数字序列是7、5、5、2、3、7、0、7、8、7、0。
第二步:将数字转换为音级。例如, 0到4分别对应Do、Re、Mi、So、La, 5到9也分别对应Do、Re、Mi、So、La, 这样就可以把7、5、5、2、3、7、0、7、8、7、0转换为mi、do、do、mi、so、mi、do、mi、so、mi、do。当然, 假如读者对调式有点了解, 转换规则也可以是其他的样子。
第三步:将以上音级序列写成五线谱。为了使乐曲织体更丰富些, 可以将该序列在高音部重复两次, 然后将音符序列的时值延长一倍作为低音部, 如下图所示。
借助Music XML, 以上步骤中的第二步和第三步也可以做成软件自动转换和导出, 以实现“自动谱曲”。假如这本杂志会发出声音, 并为旋律配上合成器弦乐音色 (Synth Strings) 的话, 那么这段曲子就颇有些氛围音乐的味道了。
自动作曲就这么简单吗?是, 也不是。虽然可以用随机发生器写音乐, 但几乎没办法写出好听的音乐。假设有一台超级计算机时时刻刻都在做着随机生成乐谱的工作, 那么即便能凑巧写出一部《命运》交响乐, 这部交响乐的命运也必然是淹没在比宇宙还要浩瀚的庸俗作品之中。回到本文开始的问题, 自宇宙诞生以来, 所有的音乐作品都已存在吗?这个问题的答案, 取决于人们怎么看待宇宙本身, 它自己究竟是一个充满着庸俗作品的大仓库, 还是一整部发人深思的《命运》交响曲呢?也许两者都不是。
想挑战吗?
1. 想用不确定的随机序列把“音乐”做得更好听些, 要有超越专业的勇气。例如, 一边是调式、调性、音程之类的乐理知识, 另一边是Markov链、Stochastic过程等数学知识, 当然, 还要懂得程序设计, 但这并不妨碍普通用户将已有的研究成果直接拿来使用, 不妨找几个现成的随机旋律生成软件来玩玩音乐创作吧!
2.不确定常常出人意料地隐藏在确定之中, 素数在自然数轴上的间隔、圆周率的每一位后续小数数字、Fibonacci兔子序列……也许某些数字序列转换成音符后, 就能成为有趣的乐曲, 可是, 用什么工具来做这样的尝试呢? (答案在本期找) 对此期主题有任何好主意或建议, 请发送稿件至kaikai_rabbit@sina.com (专栏作者) 或tougao4@chinaitedu.cn (杂志社) 。一中升华、成功。
比赛结束了, 这三天却深深留在了我的记忆中。还记得通宵熬夜后, 早晨靠一个热水澡才能精神奕奕地去参赛;还记得因为忍不住困意独自睡去, 第二天被她们嘲笑;还记得赛场内激烈的争吵, 引来不解的目光;还记得看陈红娟准备第二天陈述, 一字字斟酌, 独自庆幸“还好还好, 陈述的不是我”;还记得陈述PPT改到最后一刻, 直到评委问“可以开始了吗”;还记得评委提出的问题是我们前一天晚上预料到的, 彼此交换的会心眼神;还记得作为第一组答辩完的轻松惬意, 等待结果时的忐忑与期待, 得知获得特等奖时的激动与兴奋……
【陈红娟】接到学校的参赛通知, 是今年5月。当时才歇完产假刚刚回到工作岗位, 第一次听说NOC活动, 担心自己底蕴不足, 很彷徨。而能和卢湘、付瑜这两位老师一起参赛, 对我来说绝对是一个学习的好机会, 错过了很可惜, 所以毅然决定接受此项任务, 并开始了积极的准备。在接下来的日子里, 习惯了每晚把孩子哄睡后, 或打开借阅的书刊, 静静浏览;或打开计算机, 走进一个又一个论坛, 搜集相关资料。那份辛苦, 只有自己知道。正是赛前的积极准备, 才有了比赛时的镇定与从容。
三天的赛程是紧张的, 更是充实的。从教学设计、评价与修订到陈述与答辩, 每一个环节我们都认真参与、饱含激情;从教学设计和课件每一个细节的处理到陈述过程中每一句话的斟酌, 我们都力求完美。每天晚上回到宾馆我们就开始赛场之外的研讨, 你一言我一语, 各自提出独到的见解。正是有了这些独到的想法, 才使我们的设计在众多参赛团队中脱颖而出。在最后陈述与答辩过程中看到评委们的不停点头, 第六感告诉我, 我们成功了。想想这段时间来的辛苦, 突然觉得实在不算什么。最终我们幸运地赢得了此项赛事的最高奖--恩欧希大奖。
直接测量不确定度评定浅析 篇4
1 直接测量的数学模型及传播律分析
由测量仪器输出得到的量值就是被测量的估计值, 该过程叫做直接测量。如同一般的测量, 直接测量被测量的估计值除与直接测得值有关外, 还受测量装置、测量方法、测量条件 (温度、湿度、大气压、电源电压等) 、测量人员等因素 (影响量) 的影响, 而这些影响量是以某一确定的规律影响被测量的估计值的[2]。因此在考虑这些影响量后, 直接测量被测量的估计值在理论上将与这些影响量形成一定的函数关系, 这个函数关系可用函数的一般形式来表示:
式中, y———直接测量的被测量估计值;
x0———直接测得值;
x1, …, xn———影响量。
被测量估计值、直接测得值和影响量都是随机变量, 设这些量y, x0, x1, …, xn的随机变化量分别为δy, δx0, δx1, …, δxn, 则上式写成:
在直接测量中, 影响量的一个特点是, 在满足所要求的准确度下, 各影响量对测量结果的影响是比较小并可忽略的。因此将上式函数展开成泰勒级数后, 可合理地舍去二阶项, 直接取其一阶项作为近似值, 得
由上式可得
在式 (2) 中, 是影响量的影响系数, 如温度对影响长度的膨胀系数等。由式 (2) 可见, 直接测量被测量估计值的随机变化量是直接测得值的随机变化量、各影响量的随机变化量的代数和。
记σy、σxi分别被测量估计值和影响量的标准差, 运用随机变量的方差计算公式, 可得
直接测量的各影响量在测量过程变化区间窄、可引起的误差微小、相互之间的相关性弱, 因此可认为它们之间是独立的, 相关项Dij=ρij≈0, 则上式可简化成
2 直接测量不确定度的评定步骤
直接测量不需建立被测量估计值与各影响量之间的明确函数关系, 可利用上文的分析结果进行直接测量不确定度的评定[3]。
直接测量不确定度的评定步骤如下:
(1) 对测量系统进行分析, 列出因随机效应或系统效应而导致不确定度的所有可能的影响量;
(2) 分析影响量的性质及它们之间的关系, 舍去对测量不确定度贡献很小的影响量, 舍去在直接测得值的重复性中已包含的那些随机变化的影响量;
(3) 应用贝塞尔公式或极差法计算直接测得值的重复性, 对于测量列的测量次数较大时使用贝塞尔公式法, 次数较小时使用极差法;
(4) 分析影响量的分布并用B类评定法进行不确定度的评定。根据各影响量的特点, 确定其分布, 依据资料或实验数据确定影响系数, 计算该影响量的不确定度分量;
(5) 应用式 (4) 进行直接测量被测量估计值的测量不确定度的计算。
3 直接测量的标准不确定度评定实例
应用上面的分析结果, 评定使用一级自动焦度计检测标称值为-5.00m-1的验光镜片的检测结果的不确定度[4]。
(1) 该检测中, 对测量值有影响的因素有:
(1) 检测人员对镜片进行光学中心对中位置差异造成仪器光束落点的变化, 记为x1;
(2) 环境温度和湿度变化造成仪器示值发生变化, 记为x2;
(3) 供电电源不稳定, 记为x3;
(4) 外界杂光对仪器造成的干扰, 记为x4;
(5) 数显式仪器的分辨率限制, 记为x5;
(6) 自动焦度计的设计原理缺陷, 记为x6;
(7) 被测镜片后顶点和焦度计支座平面的距离变化, 记为x7;
(8) 验光镜片表面形状加工误差, 记为x8;
(9) 一级焦度计的不确定度, 记为x9。
(2) 这些影响量中, x1, x2, x3, x4主要以随机效应对测量值产生影响, 它们引起的不确定度可应用A类评定法通过重复性测量列进行评定得到;x5, x6, x7, x8, x9主要以系统效应对测量值产生影响, 它们引起的不确定度可应用B类评定法得到。
(3) 在重复性条件下, 对被测镜片进行10次重复测量, 得到数据列:-5.02、-5.01、-5.03、-5.02、-5.02、-5.03、-5.04、-5.02、-5.03、-5.02, 根据贝塞尔公式计算可得s=0.0069m-1。在实际工作中, 一般测量3次, 取平均值, 则平均值的实验标准差是。
(4) 使用B类法评定其他影响量导致的不确定度分量。
(1) 焦度计量化误差为均匀分布, 其分辨率为0.01m-1时所引起的标准不确定度。
(2) 自动焦度计设计原理缺陷主要是焦度计软件计算示值变化, 为±0.01m-1, 均匀分布, 。
(3) 被测镜片后顶点和焦度计支座平面的距离变化为±0.005m-1, 均匀分布, 。
(4) 验光镜片表面加工误差变化为±0.01m-1, 均匀分布, 。
(5) 一级标准焦度计的扩展不确定度为 (0.02~0.03) m-1 (k=3) , u9=0.03/3=0.01m-1。
(5) 被测量估计值的标准不确定度
4 总结
直接测量被测量的估计值的不确定度评定必须同时考虑直接测得值的重复性和诸影响因素产生的不确定度分量, 而直接测量的被测量与诸影响量之间一般不必建立明确的函数关系, 可利用影响因素有着变化范围窄、引起的误差小等特点, 使用适当的数学方法来处理直接测量被测量估计值与诸影响量之间的关系, 给出直接测量的不确定度评定, 只须直接在评定计算上加上诸影响量导致的各个不确定度项即可得到完整的测量不确定度[5]。
摘要:利用影响量在直接测量中的性质和应用适当的数学工具处理直接测量被测量估计值与诸影响量之间的关系, 给出直接测量的不确定度的传播公式和评定步骤。
关键词:直接测量,不确定度,评定
参考文献
[1]梁晋文, 陈林才, 何贡.误差理论与数据处理[M].北京:中国计量出版社, 2006.
[2]沙定国.误差分析与测量不确定度评定[M].北京:中国计量出版社, 2006.
[3]全国法制计量技术委员会.JJF 1059-2012测量不确定度评定与表示[S].北京:中国计量出版社, 2012.
[4]国家质量技术监督局计量司.测量不确定度评定与表示指南[M].北京:中国计量出版社, 2000.
电梯能效测试不确定度评定 篇5
1.1 测量依据:
DB32/T 2156-2012、DB33/T 771-2009
1.2 测量环境条件:
电网供电电压0~384.5V。机房温度保持在5-40℃之间。环境空气中无腐蚀性和易燃性气体及导电尘埃或在允许范围内无腐蚀性和易燃性气体及导电尘埃应设置检测警示牌, 已设。
1.3 测量标准:
电梯能效测试仪标准装置
1.4 被测对象:
在用及新安装电梯
1.5 测量过程:
(1) 测试点:测试点为试验电梯机房内电源闸箱的下口。 (2) 接线方式:将一台的测量线路连接好, 本测试采用三相三线接线方式, 即分别取测试三相电流和电压, 按照仪表提示完成测试测试流程。 (3) 运行模式:电梯停在1层, 测试开始后, 输入信号使电梯从1层直驶运行至顶层, 正常平层开门后, 再信号使电梯从顶层直驶运行至1层, 正常平层并完全开门后一个循环完成, 结束记录。同上、下端站直驶运行循环共进行三次, 分别记录, 取三次功耗的平均值作为最后结果。
2 数学模型及变量分析
式中:δ———修正为模拟实际工况法的电梯能源效率评价指标;
δ′———空载法测得的平均电梯能源效率评价指标;
μ1———换算系数 (2.17) ;
μ2———平衡系数修正系数 (0.45/k, k为该台电梯实际平衡系数) ;
由公式可知, μ1, μ2皆为常数, δ的不确定分量则主要来自δ′。从校验标准可知δ′=Ec/Wz
式中:Ec———电梯在规定工作周期内, 从电网输入的电能;
Wz———电梯在规定工作周期内, 轿厢完成运送负荷的运送量, 即每次运送的载荷与被移动的垂直距离乘积之和
式中:Qn———第n次轿厢内的有效载荷;
Sn———第n次运送有效载荷的垂直运行距离。
在实际测量中, 采用空载单次运行, 则总的电梯能源效率公式演变为δ=Ec/Σ (Qn×Sn) ×μ1×μ2
由于是空载, 轿厢重量基本不变, 可视为定量。
3 标准不确定度的评定
选取在用电梯, 电梯型号21VF, 额定载重量1600kg, 额定速度1m/s, 传动方式有齿, 平衡系数0.635, 调速方式VVVF, 功率18.5Kw。根据实际, 按照标准规定方法, 测得数值10组, 如表1。
根据公式推导可得, δ的不确定度是由Ec和Wz两个主要参量引入。因此分别对这两个参量进行分析。
3.1 标准不确定度u (Ec) 的评定
输入量Ec的标准不确定度u (Ec) 的来源主要是被测电梯工作变动等因素引起的测量不重复和标准器精度两个方面。
(1) 对于测量不重复, 采用A类评定。
实际测量中, 以3次均值为最终结果, 则有
考虑到标准器的读数分辨率为0.0001Kw.h, 则ua (Ec) =2.9×10-5Kw.h。
(2) 对于标准器精度, 采用B类评定
参考标准器ELE-1的技术参数, 能耗测量精度为±0.5%, 则有ub (Ec) =0.1917Kw.h×0.5%/1.732=5.5×10-4Kw.h。
(3) 合成u (Ec)
u (Ec) =5.5×10-4Kw.h。
3.2 标准不确定度u (Wz) 的评定
输入量WN的不确定度来源于被测电梯工作变动等因素引起的测量不重复和标准器精度两个方面。
(1) 对于测量不重复, 采用A类评定。
实际测量中, 以3次均值为最终结果, 则有
考虑到标准器的读数分辨率为0.0001km*t, 则ua (Wz) =2.9×10-5km*t。
(2) 对于标准器精度, 采用B类评定。
采用B类方法评定。考虑到校准器稳定度、调节细度及读数分辨力所引起的不确定度已包含在重复性条件下所得到的测量列的分散性中, 故在此不另作分析。
标准器测距仪说明书给出精度为±0.1m, 则有
(3) 合成u (WN)
u (WN) =9.6×10-5km*t。
4 合成标准不确定度的评定
(1) 灵敏系数
(2) 合成标准不确定度的计算
输入量Wx与WN彼此独立不相关, 所以合成标准不确定度可按下式得到, u (δ) =0.0061。
5 扩展不确定度的评定
取置信概率P=95%, k=2
扩展不确定度U95=ku (δ) =2×0.0061=0.0121。
参考文献
[1]朱伟.浅析电梯节能管理[J].中小企业管理与科技 (下旬刊) , 2012 (02) .
[2]陈盛康.浅谈电梯检验技术及安全[J].价值工程, 2013 (09) .
不确定数据的决策树分类 篇6
分类是机器学习和数据挖掘中的一个经典问题。给定一个训练数据记录的集合, 每一个记录都有一个类标号, 并用一个特征向量来表示。分类的任务就是建立一个能基于已有的记录的特征向量来预测没有被测试的记录的类标号的模型, 并能用计算机编程实现这个模型[1]。决策树模型是这些最流行的分类模型之一。决策树模型之所以流行, 是因为它又实用又好理解, 而且从决策树中提取规则的步骤也很简单。许多算法, 比如ID3[2]和C4.5[3], 都是为了决策树而设计的。这些算法在很多应用中被广泛的采用并投入使用, 如图像识别, 医疗诊断, 科学测试, 欺诈检测和目标市场定位等等。
在传统的决策树分类中, 记录的一个特征或属性要么是分类的要么是数值的。对于数值型的特征, 经常假设这个特征取值是一个精确的有限的点的值。然而, 在许多应用中, 数据通常是不确定的。因此, 一个特征或属性的值最好不是用一个单独的点的值来表示, 而是用一个范围来表示, 这个范围可以是概率分布。
在各种应用中, 总会存在数据的不确定性, 产生不确定数据的原因很多, 如测量错误, 数据陈旧, 重复测量以及收集数据的过程受限制等等。一个处理数据不确定性的简单方法是用汇总统计数据来抽象概率分布, 如均值, 方差等。这种方法可以称为是基于平均的方法。另一种方法是综合考虑概率分布所具有的全部信息, 依据所有的信息来建立决策树。这种方法可以称为是基于概率分布的方法。
本文探讨在包含不确定数值型数据属性的不确定数据集中, 如何创建决策树分类的问题。首先介绍不确定数据的一些基本概念, 这些概念有助于理解不确定数据集, 然后介绍传统的确定数据集中使用的决策树分类方法, 再探讨不确定数据中的决策树分类方法, 最后, 给出在不确定数据中, 对决策树分类方法的未来研究工作的展望。
2 不确定数据与可能世界
在很多实际应用中普遍存在不确定数据, 而在数据库领域, 最早就有对不确定数据的处理。这种处理方法的思想很简单, 就是把不确定数据变成确定数据, 然后再存入数据库中。但是, 在最近的很多应用中, 不确定数据提供了很多有用的信息, 如传感器网络收集的信息, 基本都是不确定的。因此, 不能采用原有的数据库中的方法, 而应该针对这些不确定数据的特性, 设计专门的不确定数据库并研究不确定数据的相关处理技术。
我们各个应用中使用的最多的就是确定数据库, 即数据库中的每个记录表示一条对应信息, 而且这条信息是一定准确的。而不确定数据有两种类型, 一种称为记录级不确定, 一种称为属性级不确定。在记录级不确定数据库中, 数据库中的每一条记录后面有一个概率, 这个概率表示这条记录在数据库中出现的可能性大小。而属性级不确定数据库中, 组成记录的每一个属性都对应一个概率值, 这个概率表示每个属性在该条记录中出现的可能性大小。因此, 属性级不确定数据库比记录级数据库还要复杂, 存储的信息更多, 需要的计算量更大。适合于属性级不确定数据库的解决方案一定适合于记录级不确定数据库, 而适合于记录级不确定数据库的解决方案却不一定适合于属性级不确定数据库。本文在属性级不确定数据库中探讨决策树分类问题。为了分析不确定数据库, 需要引入可能世界的概念。
假设一个不确定数据集D, 包括d条记录t1, t2, …, td。其中, 任意一个记录ti是一组项的集合, 而记录ti中的每一个项x与一个非零的概率Pti (x) 相关联, 这个概率表示项x在记录ti中出现的可能性大小。因此, 有两种可能情况, 一种情况是项x在记录ti中出现, 另一种情况是项x在记录ti中不出现。把这两种可能的情况分别称为两个可能世界W1和W2。我们不知道哪个可能世界是真正发生的情况, 但是我们从不确定数据集中可以知道每个可能世界真正发生的可能性大小, 即其概率。假设我们用P (Wi) 表示可能世界Wi真正发生的概率, 由概率论的理论可得, P (W1) =Pti (x) 和P (W2) =1-Pti (x) 。可以按照这种方法计算记录ti中其他项的可能世界的概率。例如, 假设项y是记录ti中的另一个项, 它的概率是Pti (y) 。假设项x和项y的概率是独立观察得到的, 那么就有四个可能世界。记录ti同时包括项x和项y的可能世界的概率就是二者概率的乘积, 即Pti (x) ·Pti (y) 。把这种分析方法扩展到数据集的其他记录中, 就得到数据集的所有可能世界[4]。
从可能世界的分析方法可以看到, 用可能世界可以很好的解释不确定数据库中的概率问题, 给出每个可能世界的概率就表示出了该可能世界在真实世界中出现的可能性大小, 通过对这些可能世界对应的概率进行分析和统计, 就可以解决相关的数据挖掘问题。但是, 可能世界的个数是指数增长的, 即直接对不确定数据库对应的所有可能世界进行统计和分析是无法在大型数据库中实现的, 因此, 需要找到一些解决办法来处理这种指数增长问题。也就是说, 在保证分类结果在不确定数据库的所有可能世界中结果是正确的, 又要使解决方法在数据量大的情况也可以用计算机编程实现的。
3 决策树分类方法
在传统的确定数据库分类中, 决策树分类方法能从具有类标号的训练元组进行学习, 得到能用于对未知类标号的元组进行预测类标号的决策树。决策树是一种类似于流程图的树结构, 其中, 树中的每个非叶子节点表示在一个属性上的测试, 树的每个分枝表示一个测试结果的输出, 树的每个叶子节点存放一个类标号, 而决策树的最顶层是根结点。有些决策树算法只产生二叉树, 而有些决策树算法可以产生非二叉树。
如果已经构建好了决策树, 就可以对一个未知类标号的元组进行分类。从决策树的根结点开始测试元组的属性值, 根据属性值的大小来判断树的分枝方向, 不断的重复该过程, 可以得到一条由根结点到某个叶节点的路径, 而最终到达的叶节点中存放的就是该元组的类标号。因此, 决策树很容易转化成分类规则。另外, 构建决策树不需要任何额外的知识, 也不需要进行用户给定的参数设置, 因此适合用于分类。
确定数据库中的决策树算法主要有ID3、C4.5和CART算法, 这些算法都采用贪心策略, 即不回溯, 以自顶向下递归的分治方法来实现。这些决策树算法用训练元组和它们对应的类标号来构建决策树, 基本的策略如下。
用D表示数据的划分, 开始时, D是训练元组和它们对应的类标号的全集。然后使用一定属性选择度量方法, 确定一个属性为分裂属性, 把训练元组中每个元组的该属性值与分裂属性进行比较, 使每个分枝上输出的划分尽可能属于同一个类。从节点生成出分枝的多少决定了决策树是二叉的还是非二叉的。设A是分裂属性, 在训练元组中, A有m个不同的值{a1, a2, …, am}, 用A来划分D有三种可能。A是离散值, 节点N的测试输出直接对应于A的m个值, 即对A中的每个值创建一个分枝, 并用该值标记。A是连续值, 节点N的测试有两种可能输出, 分别对应于A>=分裂点的值和A<分裂点的值。其中, 分裂点通常用连续值A的两个已知的相邻值的重点。A是离散值并且必须产生二叉树, 用A是否属于属性值来进行分裂, 从而结果只有属于或不属于两类, 从而生成二叉树。
对于用分裂属性得到的D的每个子划分, 继续使用同样的过程再选择分裂属性进行划分, 重复上述过程, 就可以得到决策树。
属性选择度量是一种分裂准则, 它是能将给定类标号的元组的划分D最好地分成若干个子划分的启发式方法。常用的属性选择度量有信息增益、增益率和Gini指标等方法。
4 不确定数据的决策树分类
在C4.5中, 通过使用分级记录对具有缺失信息的数据进行决策树分类问题已经得到了解决。在不确定数据中, 当分裂属性的概率分布范围跨越了分裂点时, 可以用这种分级记录的技术按照分裂属性把训练元组分成子划分。对于数值型的元组创建决策树时, 分裂点的选择是通过计算来得到的。因此, 找到最好的分裂点是主要的计算开销。为了提高分裂点的计算效率, 已经提出了许多可以减少候选分裂点的技术[5,6]。
设数据集包括d条记录和k个数值型的属性A1, A2, …, Ak。每一个元组ti与一个特征向量和一个类标号。其中, 每个fi, j是一个在区域[ai, j, bi, j]范围内对元组ti中的属性Aj的不确定值的概率分布函数。分类问题就是建立一个能把每个特征向量 (fx, 1, fx, 2, …, fx, k) 映射到类标号C中的一个概率分布Px的模型M。这样, 对于任意给定的已知类标号的测试元组t0= (f0, 1, f0, 2, …, f0, k, c0) , P0=M (f0, 1, f0, 2, …, f0, k) 能以高的精确度预测出t0的类标号c0。
我们使用二叉树决策树来处理数值属性, 决策树中每个内部结点n与一个属性Ajn和一个分裂点zn相关联, 用二元测试x<=zn来实现属性的二元分裂。决策树中的每个内部结点只有两个孩子结点, 每个叶子结点与一个C上的离散概率分布Pm相联系。为了确定给定一个元组的类标号, 需要从根结点开始, 自顶向下的遍历决策树。当访问一个内部结点n时, 把元组在值zn处分裂成两部分, 对每部分仍然递归的分裂成两部分进行访问, 最后到达叶子结点。在每个叶子结点m上的概率分布Pm成为元组类标号预测的最后的概率分布P0。因此, 最关键的工作是在包含不确定数值的训练元组的基础上, 对于每个内部结点, 找到适合的属性Ajn和一个分裂点zn, 创建出每个叶子结点带有概率分布的决策树。然后, 对于不确定数据, 一个属性的分裂点的可选数不是小于等于m-1, 而是所有概率分布函数的范围的联合。如果每个概率分布函数都用S个样本点来表示, 那么就有至少ms-1个需要考虑的可能分裂点[7]。
已经选好每个结点的属性Ajn和一个分裂点zn后, 把训练元组集分裂成两个子集。如果概率分布函数正好包括分裂点, 就把元组分裂成两个分级元组, 再把这两个元组分别加入到两个子元组中。
5 结束语
在不确定数据中进行数据挖掘已经引起了广泛的关注, 而分类作为一个重要的数据挖掘技术, 也在不确定数据中具有广泛的应用。在未来的工作中, 可以研究其他传统的分类技术如何在不确定中实现分类。
参考文献
[1]R.Agrawal, T.Imielinski, and A.N.Swami, “Database mining:A performance perspective, ”IEEE TKDE, 1993.
[2]J.R.Quinlan, “Induction of decision trees, ”Machine Learning, 1986
[3]J.R.Quinlan, “C4.5:Programs for Machine Learning.Morgan Kaufmann, ”1993.
[4]N.Dalvi and D.Suciu.“Efficient query evaluation on probabilistic databases, ”VLDB Journal, 16 (4) :523-544, 2007.
[5]T.Elomaa and J.Rousu, “General and efficient multisplitting of numerical attributes, ”Machine Learning, 1999.
[6]T.Elomaa and J.Rousu, “Efficient multisplitting revisited:Optimapreserving elimination of partition candidates, ”Data Mining and Knowledge Discovery, 2004.
不确定系统的椭圆区域极点配置 篇7
控制理论的一个基本问题是设计反馈控制律,将闭环系统的极点配置在期望的位置,即极点配置问题。事实上,精确的极点配置是不需要的,只要满足将闭环系统的极点配置在左半复平面的一个指定位置就可以了。近些年,不同区域的极点配置问题理论的研究已经十分活跃[1,2,3,4,5,6],例如:垂直或水平带区域;扇形区域[4];圆形区域[6]和双曲线等区域的极点配置都取得了一些进展。事实上,我们可以将圆盘区域的极点配置问题推广到椭圆区域。然而,对于椭圆区域的鲁棒稳定性研究却鲜见报道。
本文主要研究椭圆区域的LMIs表示形式,并应用LMIs方法,来设计状态反馈控制器,使闭环系统的极点配置在给定的椭圆区域内,推广了基于圆盘区域内的极点配置。最后,通过仿真算例,证明了该定理的可行性。
2 问题描述和引理
考虑以下状态方程描述的一类不确定连续或离散系统:
其中x∈Rn,u∈Rm分别是系统的状态和控制向量;δ是一个算子;对于连续系统,δ是微分算子,即δx(t)=x&(t),对离散系统,δ表示延迟算子,即δx(t)=x(t+1);A,B是具有适当维数的实常数矩阵,∆A,∆B表示系统的扰动,且假定具有以下的形式:
其中D,E1,E2是具有适当维数的实常数矩阵,F是满足FT F≤I的未知矩阵,I是表示适当维数的单位矩阵。
定义1[1]:对复平面中的区域D,如果存在一个对称矩阵L∈Rm×m和矩阵M∈Rm×m,使得:D={s∈C:L+sM+sMT<0}(3)
则称D是一个线性矩阵不等式区域(简记LMI区域)。
定义2[1]对于系统(1)假设系统的系数矩阵在复平面上给定的椭圆区域D即(3)是稳定的,对所有允许的不确定性F,如果存在控制器,使其所对应的闭环系统的所有极点均配置到给定的椭圆区域D内,则称该控制器为给定区域极点配置的鲁棒D稳定控制。
引理1[1]给定由(3)式描述的LMI区域D,则矩阵A∈Rn×n是D-稳定的充分必要条件是存在一个正定矩阵X∈Rn×n,使得(,)0DM A X<(4)
其中:MD(A,X)=L⊗X+M⊗(AX)+MT⊗(AX)T。
引理2设Y为对称矩阵,N1,N2为适维常值阵,E为时变适维阵,满足ET E≤I,标量β>0,则Y+N 1EN2+N2TET N1T<0的充分必要条件为
本文的目的是,针对其不确定性,设计状态反馈控制器:u(t)=Kx(t),使得对所有允许的扰动,闭环系统δ&x(t)=A%x(t)的极点均位于给定的椭圆区域内,其中
本文给出了该控制律存在条件和设计方法。
3 主要结论
定理1:矩阵A的所有特征根均在给定的椭圆区域内的充分必要条件是存在一个对称矩阵X使得下列LMI成立:
证明:假设给定的椭圆区域为:,其中任意一点λ=x+yj,满足
将λ=x+yj,λ=x-yj代入上式整理,再根据Schur补定理可知,其等价于:
故椭圆区域为LMI区域,可表示为(9)式。
若λ=x+yj为A对应的特征值,则根据引理1,可知,只要满足:
则A的特征值在给定的椭圆区域D内,反之亦然,故命题得证。
定理2:对于所给闭环系统,如果存在正定对称矩阵X和W,以及标量ε,使得对所有的不确定性F,下列LMI成立:
则闭环系统在给定的椭圆区域(7)内存在极点配置的鲁棒控制。系统的鲁棒D控制律为:u(t)=Kx(t),K=WX-1。
证明:令AK=A+BK,EK=E1+E2 K,对系统(7)根据定理1有:
根据引理2,可得:
进而,根据Schur补定理有:
故命题得证。对于离散系统也有同样的结论成立。
4 仿真算例
考虑不确定连续系统:
2∆B=DFE,其中f≤1。并且给定的椭圆区域为:,则根据定理2设计鲁棒控制器为:u(t)=Kx(t)可得:K=[0.1669-1.0516]。
下面分三种不确定性界讨论闭环系统的极点:
(1)f=-1时,得到闭环系统的极点为:-1.9370;-2.0000
(2)f=0时,得到闭环系统的极点为:-1.4424+0.3716i;-1.4424-0.3716i
(3)f=1时,得到闭环系统的极点为:-1.8494+0.3891i;-1.8494-0.3891i
其对应的图象为:
如图1可知,该闭环的极点均被配置在了所给定的椭圆区域内,闭环系统具有鲁棒D稳定性,可见定理2可行。
5 结语
本文给出了椭圆区域的LMI表示形式,并应用Schur补定理,给出了椭圆区域极点配置的充分必要条件。讨论了在椭圆区域的鲁棒D稳定问题,这是对圆盘区域的扩展。最后将该理论应用到一数值算例中,证明了该方法的有效性。
摘要:本文应用线性矩阵不等式方法(LMIs)给出了椭圆区域的LMIs表示形式,研究了不确定连续和离散系统的区域极点配置问题,讨论了使闭环系统的所有极点配置在给定的椭圆区域的充分必要条件。所给的定理推广了基于圆盘区域的极点配置问题,最后通过实例仿真验证了该定理的有效性。
关键词:鲁棒D稳定,Schur补定理,线性矩阵不等式,(LMIs),极点配置,椭圆区域
参考文献
[1]俞立,鲁棒控制[M].北京:清华大学出版社,2002.
[2]Garcia G,Bernussou J.Pole assignment for uncertain sys-tems in a specified disk by state feedback IEEE Trans.onAutomatic Control.1995,40(1),184-190.
[3]俞立.具有区域极点和方差约束的不确定连续系统鲁棒控制.自动化学报,2000,26(4):509~514.
[4]滕青芳,范多旺,不确定系统的鲁棒状态反馈区域极点配置[J].计算机技术与自动化,2006,25(1).
[5]Yu Li,Chen Guoding and Yang Maying.Robust Re-gional Pole Assignment of Uncertain Systems via Output Feed-back Controllers[J].Control Theory and Applications,2002.l 9(2):244-246.
临床生化检验测量不确定度分析 篇8
1 资料与方法
1.1 一般资料
选取2013年4-5月我院收治的64例患者进行静脉血各项的生化检验。其中男38例, 女26例, 年龄26~67岁, 平均年龄 (30.27±7.65) 岁。所有患者均接受相应治疗, 并配合调查研究。所有患者身体的基本资料没有较大差异, 无统计学意义 (P>0.05) 。
1.2 方法
1.2.1 分析方法:
选择日立公司的自动生化分析仪和配套试剂, 对本次选取的64例患者进行生化检测, 抽取空腹患者5ml的静脉血液, 采取离心操作并分离血清, 检测各项生化指标。具体程序: (1) 首先进行批内CV检测, 将1d内室内质控品的20次测定结果作为根据, 并每天对室内质控品给予批内CV检测, 共检测20d, 并计算20d的检测结果。 (2) 偏倚CV计算方式为:重复测定定值质控血清3次, 计算平均值, 然后计算百分差值和偏倚CV, 计算公式:CV (bias) =相对差值品均值。
1.2.2 测指标方法:
选择速率法检测丙氨酸氨基转移酶、γ-谷氨酰转移酶和天门冬氨酸氨基转移酶;使用尿酸酶比色法进行尿酸检测, 使用双缩脲终点法进行总蛋白的检测, 使用酶法进行尿素氮和肌酐的检测, 选择胆固醇氧化酶的方法检测胆固醇, 选择氧化酶的方法检测葡萄糖。不确定度的来源主要有:偏倚因素, 批内因素和批件因素。
1.3 统计学分析
对本文所得数据均采用SPSS14.0统计学软件进行检验, 计量资料采用t检验, 计数资料采用χ2检验, P<0.05有统计学意义。
2 结果
对患者进行各项生化检验后, 其各指标不确定度为:总蛋白:2.92%, 肌酐:9.33%, 尿素氮:9.18%, 碱性磷酸酶:8.21%, 葡萄糖:4.08%, 清蛋白:7.22%, 谷氨酰转肽酶:14.18%, 具体数值见表1。
3 讨论
不确定度的测量为数字信息, 合理补充测量结果, 显示这一结果的怀疑程度, 根据应用系统的差异, 不确定度是因为不同因素的集合[2]。测量结果是否可靠的指标来表示测量结果, 在实际的临床工作中, 不能对一个样品多次检测, 所以误差不能对所有的临床检验都适用。检测不确定度为完善发展误差理论, 实践中很难用复杂方法检测不确定度, 需要大量的物力资源、人力资源[3]。本文在分析测量不确定度的过程中, 对各项不精准度给予分量分析, 按照相关标准严格操作, 在检验中依然会受到相关因素的制约, 不同指标的不确定度差异明显, 在检验中说明测量不确定度能够清楚反映生化检验结果的分散程度和准确性, 可在一定程度上降低检验的误差。
测量不确定度的数值可对实验条件下其检验结果的分散性和准确定给予真实反映, 值得广泛推荐。
参考文献
[1]陈辉, 邓小玲, 毕小云, 等.人血清胆固醇常规测量不确定度的研究〔J〕.临床检验杂志.2013, 24 (17) :109-110.
[2]刘小娟, 江咏梅, 王泓, 等.临床生化检验测量不确定度的初步研究〔J〕.重庆医学.2013, 28 (21) :156-157.