关键词:
分层结构模型(精选八篇)
分层结构模型 篇1
随着智能手机、平板电脑等移动终端的普及,以及各种移动接入技术的出现,Wi-Fi、BMSB、DVB-T/H、ATSC-H/M等组播应用需要满足人们随时随地的接入需求[2]。通过移动终端人们可以观看网络视频、进行多人游戏、举行视频会议和完成协同办公。这些应用需要组播技术的支持,而目前较为普遍的应用层组播模型都是基于传统的Internet网络,在节点性能差异巨大的移动互联网中并不适用。
目前应用层组播根据构建组播控制拓扑和数据拓扑的顺序可以分为三类:基于网的组播模型、基于树的组播模型和基于隐含组播转发拓扑的组播模型[1]。较为常用应用层组播模型Nice和Zigzag是基于隐含组播转发拓扑的组播模型,Nice是为大量接收者的组播应用设计的可扩展的应用层组播模型,使用了分层和分簇的思想,通过控制簇的大小来保持负载均衡和降低树的高度[3]。Zigzag也是一种基于分层和分簇的应用层组播模型,将控制拓扑与数据拓扑分离,在簇的头节点的推举过程中考虑了带宽,适用于大规模组播网的应用[4]。
在节点性能差异较大的网络环境中,这两种组播模型均有较大的缺陷。Nice模型没有考虑成员节点能力的差异,簇的头节点选举使用最大最小距离法,可能造成能力弱的节点处于组播树的上层。Zigzag模型在推举头节点时虽然考虑了时延和带宽,但是也没有针对节点的处理能力进行优化。并且这两种组播模型对簇中节点数的范围固定在[k,3k],常数k值在节点性能差异较大的环境中难以确定。
针对传统的基于Internet网络环境设计的组播模型的缺陷,本文通过对Zigzag组播模型的改进,提出了一种基于节点性能的分层分簇组播模型。
1 组播模型定义
1.1 名词定义
由于本文提出的组播模型为Zigzag模型的改进,所以沿用Zigzag的名词定义。
源节点(Source):在组播树中提供数据源的节点称为源节点。
头节点(Head):在一个簇中,被选举为进入上一层的节点称为该簇的头节点,其在组播结构中主要负责组建控制拓扑。
辅助节点(Associate head):在一个簇中,辅助节点为除了头节点外的其他节点的父节点,其在组播结构中主要负责组建数据传输拓扑。
普通节点(Subordinate):在一个簇中,既非头节点也不是辅助节点的节点就是该簇的普通节点。
外头节点(Foreign Head):节点k为第j层中的非头节点,对于第j-1层的除k所在簇的任意非头节点v,k为v的外头节点。
外簇(Foreign Cluster):第j层的头节点k和v,如果k,v在第j+1层位于同一簇,k与v所在簇互为外簇。
上层簇(Super Cluster):如果第j层的簇A的头节点所在的第j+1层的簇X中,那么X称为A的上层簇。
1.2 约束条件
组播模型的构建必须满足下面的约束条件:
(1)第0层包含了组播网络中所有的节点。
(2)一个簇由[k P(uk),3k P(uk)]的节点组成,其中k为正整数,P(uk)为簇的辅助节点uk的性能值。
(3)一个簇Ci中的辅助节点a的性能值为P(ua)≥P(uk),uk∈Ci,uk≠uh且uk≠ua,其中uh为簇Ci的头节点。
(4)一个簇中的头节点h的能力估值P(uh)≥P(ua),其中ua为簇中的辅助节点。
(5)被簇中推举为头节点的节点将进入上一层,成为上一层的成员。
(6)在整个组播树的最高层,只有一个簇,该簇由[2,3k P(us)]个节点组成,其中us为源节点。
(7)在树的最高层,源节点同时为头节点和辅助节点。
1.3 连接规则
组播树的节点连接规则如下:
规则1:当一个节点不在它所在层次的最上层时,它在该层即没有入度,当节点不在其所在层次的次上层时也没有出度。如图1所示,第2层中使用虚线圈出的节点,第0层既没有出度也没有入度,在第1层没有入度有出度。
规则2:在一个簇中,如果节点既非头节点也不是辅助节点,那么该节点只能从簇中辅助节点接收组播数据流,如图1中的白色节点所示,其只能从所在簇中的辅助节点接收数据。
规则3:簇中的辅助节点只能从它的外头节点接收组播数据流,如图1所示,第0层中的黑色节点只能从其头节点所在的上层节点接收组播数据流。
2 组播模型的调整与优化
在组播应用运行的过程中,会不断地有节点加入和退出,伴随着节点的加入和退出,若簇中的节点数超过簇所能容纳节点数的上限则需要对簇进行分裂,若簇中的节点数低于簇容纳的节点数的下限则需要对簇进行合并;并且随着组播结构的变化,组播模型将不能保持最优的状态,需要对模型进行周期性的优化。
2.1 节点加入算法
在节点请求加入组播网络时,首先使用Hotz距离[5]找到与其最近的第0层簇的辅助节点,将其加入到该簇中,如果其性能优于该簇的辅助节点则与辅助节点进行交换。设节点向节点ux发出加入组播树请求,具体算法如图2所示。
其中,函数Addable(ui)在存在一条从ui到第0层某个簇的路径并簇的大小在区间[k P(uk),3k P(uk)-1]时返回true,否则返回false;函数Reachable(uy)在存在一条从uy到第0层某个簇的路径时返回true,否则返回false;d(uy)表示节点uy到组播源之间的距离,d(uy,ui)表示节点uy到节点ui之间的距离。
2.2 节点退出算法
组播树中节点退出的情况较节点加入复杂,由节点所处的层次和承担的角色不同可以分为四种情况,如图3所示。
图3节点退出的四种情况(参见下页)
设簇C中的节点ux退出了组播结构,为了保持组播结构稳定,具体算法如图4所示。
其中,High Qo SSet函数为获取簇C中Qo S评估值高的节点集合,Split函数为簇分裂函数,其目的为将节点数超过簇所能容纳节点数上限的簇分裂为两个簇。
2.3 簇的分裂算法
在组播模型的定义中,每一个簇中不能超过3k P(ua)个节点,其中P(ua)是簇的辅助节点性能值。因此,当一个簇的节点数超过3k P(ua),就要进行分裂,将原来的簇中的节点分出一部分组成新的簇。这样可以减轻原有簇的辅助节点的负载,维持组播模型性能的稳定。
如图5所示,分裂的过程分为三个步骤:1)将超容簇中的普通节点按性能排序,将性能较好的一半移动到新簇。2)将新簇中性能最优的节点作为头节点,性能次优的作为辅助节点,并将新簇的头节点原有子节点连接到新簇的普通节点上。3)将新簇的头节点加入上层的簇中作为普通节点,并将新簇的辅助节点的父节点更改为其上层簇中的适合的普通节点。
根据簇所在的层次不同,分裂操作分为三种情况,分别为簇位于第0层、位于中间层和位于最顶层。三种情况下,簇分裂的过程与图5所示的过程类似,在分裂簇位于最顶层时,将会分裂出新的簇增加组播结构的高度。
2.4 簇的合并算法
在组播树模型的定义中,每一个簇中节点数应该在k P(ua)到3k P(ua),如果某一个层的簇中的节点数小于k P(ua),那么为了有效利用节点性能并降低组播树的高度,则需要将该簇与另外的簇进行合并。
设位于第j层的簇U中的节点少于k P(ua),算法选取簇V与簇U进行合并。对V的选取需要遵循下面三个条件:1)簇V必须和簇U具有相同的上层簇。2)Nv+Nu≤max{3k P(uh),3k P(vh)},其中Nv和Nu分别为簇V和簇U当前拥有的普通节点个数,uh和vh分别为簇U和簇V的头节点。3)max{max{3k P(uh)3k P(vh)}-(Nv+Nu)},V∈Ci,其中Ci为簇U所在层的簇的集合。
如图6所示,簇合并的过程也分为三个步骤:1)从参与合并簇的头节点和辅助节点中选出性能最优和次优的作为新簇的头节点和辅助节点。2)将参与合并簇的原辅助节点的所有子节点以及它自己重新连接到新的辅助节点。3)将被合并簇的头节点下移一层,将其上层的子节点的父节点,置为上层簇中其他性能较高的节点;根据情况,重新设置其父节点。
根据参与合并的簇的头节点在上层簇中的角色不同,簇的合并分为三种情况,分别为头节点为上层的普通节点、为上层的辅助节点和为上层的头节点。这三种情况下,簇的合并均可用类似图6所示的步骤完成。
2.5 周期性优化更新
在组播应用运行一段时间后,随着节点不断的加入离开,簇不断的分裂合并,组播树的结构将变得不稳定,出现性能强的节点在组播树的下层而性能弱的节点在组播树的上层等现象。对于组播树动态变化过程中所出现的问题,本文使用了周期性更新机制来优化组播树的结构,每隔一段时间对整个组播树进行全局调整,将性能强的节点上移,性能弱的节点下移,使得组播树充分利用节点能力,并有效地降低树的高度。
本文借鉴文献[6]中TCP/IP协议中对拥塞控制的有限慢启动(limited slow start)算法的思想来设置优化时间间隔。首先设置初始更新时间间隔tstart,正常步长时间td和最小步长时间tmin,初始时系统每隔tstart时间更新一次组播树结构,随着节点数每增加k,系统更新时间间隔增加td,当系统中节点数达到设定值Nmax时,节点数每增加k,更新时间增加tmin。设当前系统更新时间间隔为ti,那么当节点数增加k后新的更新时间间隔如式(1)所示。
其中,Ncurrent为当前组播系统中的节点数,在节点数减少时,更新时间间隔的计算与增长过程相反。
优化算法如图7所示,对组播树结构的调整采用自底向上的方法,首先从第0层簇开始进行调整,遍历所有第0层簇,选出簇中除辅助节点外性能值最高的节点集,若簇的头节点不在集合中则随机地挑选集合中的一个节点代替头节点进入上一层代替原头节点功能,并将原头节点下移到簇中作为普通节点,递归地进行此过程直至最高层,算法调整完毕。
3 仿真实验
本节使用NS2和GT-ITM对本文提出的基于节点性能的分层分簇组播模型进行仿真。仿真环境由GT-ITM生成Transit-stub结构网络,并对网络环境中的节点性能参数进行随机设置,通过C++编写组播模型的连接规则。从平均时延,平均路径延伸度和平均链路压力三个方面将本文提出的组播模型与Nice模型和Zigzag模型进行了比较。
平均时延是指组播数据包从源到系统端主机处的延迟的平均值。
仿真结果如图8所示,三种模型的平均时延均随网络中节点数的增多而增大,由于本文提出的组播模型考虑了节点性能的因数使得在降低组播树高度的同时降低了端系统的延迟,所以平均时延增长较Nice和Zigzag缓慢。
平均路径延伸度是指在组播网络中组播源到端系统的链路长度与组播源在单播网络中到端系统的链路长度的比值的平均值。
仿真结果如图9所示,本文的模型相较于Nice、Zigzag有更好的平均路径延伸度。因为性能好的节点位于组播结构的上层,降低了组播树的高度,使得平均路径延伸度降低。
平均链路压力是在组播网络中在同一链路上同一数据包需要传输的次数的平均值。
仿真结果如图10所示,本文提出的组播模型的平均链路压力较Nice和Zigzag小。由于本文模型中性能较差的节点在组播结构下层不承担分发任务,所以降低了平均链路压力。
4 结语
本文对节点性能差异较大的网络环境下的组播模型进行了研究,对基于传统的Internet网络的组播模型进行了改进,提出了一种基于节点性能的应用层分层分簇的组播模型,并对模型的调整和优化过程进行了描述。通过仿真实验,证明了本文提出的组播模型的有效性。
参考文献
[1]章淼,徐明伟,吴建平.应用层组播研究综述[J].电子学报,2004,32(12A):22-25.
[2]Franciso F,Belda R,Guerri J C.Evaluation of abackground push download service for personalmulticast devices[C]//2011 IEEE InternationalConference on Consumer Electronics,2011:231-232.
[3]Banerjee S,Bhattacharjee B,Kommareddy C.Scalable application layer multicast[J].ACMSIGCOMM Computer Communication.2002,32(4):205-217.
[4]TranDA,HuaKA,DoTT.Apeer-to-peerarchitecturefor media streaming[J].IEEE Journal on SelectedAreas in Communications,2004,22(1):121-133.
[5]Ng T S E,Zhang H.Predicting Internet networkdistance with coordinates-based approaches[C]//Twenty-First Annual Joint Conference of theIEEE Computer and Communications Societies(INFOCOM 2002):170-179.
分层结构模型 篇2
张璇 王嘉宇
2011-12-13 14:33:23 来源:《统计与决策》(武汉)2010年15期第4~8页
内容提要:文章运用Jackknife和Boostrap的方法,对参数估计的方差进行改进,构造了合适的参数估计的置信区间。通过样本组数和组内个体数的变化,利用数据模拟的方法进行研究,表明参数估计的可靠性很大程度上依赖于组数;对于固定效应参数,组数取30就可以得到可靠的估计值。对于σ和方差协方差成分T,组数分别取50和70才能得到可靠的估计。
关键词:分层线性模型 参数估计的覆盖率 Jackknife Boostrap 数据模拟
作者简介:张璇(1979-),女,湖南湘潭人,中国人民大学统计学院博士研究生,讲师,研究方向:统计模型及其计算、计量经济学(北京100084);王嘉宇,卡尔斯塔德大学国民经济与统计系,乌普萨拉大学信息科学与统计系(瑞典65188)。
1研究背景
很多社会研究都涉及分层数据结构,例如,经济学家探求在多个国家中经济政策是如何影响居民的消费行为,研究采集的观测数据不仅包括以国家为层次的经济指标,还包括以家庭为单位的信息,因此整个观测的数据结构是分层的。此时,同属一个层次的个体之间的相关性会大于来自不同层次的个体之间的相关性,整个观测样本就不再具有独立同分布性质,如果继续使用经典的线性回归模型,就会得到有偏的参数估计和错误的统计推断结果。近年来,随着分层线性模型统计理论的发展,一套完整的应用于分层结构数据的统计推断方法已经建立起来,并且能得到有效的参数估计。
分层线性模型(hierarchical linear models)的称谓最早由Lindley和Smith(1972)[1]提出。这个模型在不同的研究领域有不同的称呼,在社会学研究中,它经常被称为多层线性模型(multilevel linear model);在生物统计研究中常用的名字是混合效应模型(mixed-effects models)和随机效应模型(random-effects models);计量经济学文献称之为随机系数回归模型(random-coefficient regression models)等。
模型的一般形式为:
目前比较常用的分层线性模型的估计方法有极大似然法(ML),约束极大似然法(REML)(Littell,1996)[2]和完全贝叶斯法(Full Bayes)。理论研究表明,大样本情况下ML和REML得到的参数估计都是一致最优估计量,但是在样本较小的情况下,REML在估计方差协方差成分确定性,因此REML比ML得到了更可靠的和T时,考虑了固定效应系数γ的不
和T的估计值。Full Bayes考虑
了所有辅助参数的不确定性,因此理论上得到的参数估计较ML和REML更可靠,但是此估计方法需要运用MCMC算法,很多情况下,并非能得到一个收敛的Markov链,当分层线性模型形式较复杂时(如待定参数向量增多、层数增加等),Full Bayes方法相当复杂。因此很多统计软件采用ML和REML估计分层线性模型,本研究采用REML方法估计。
由于ML和REML方法估计的前提假设都是样本量要足够大,因此样本量较小时,这两种估计都是有偏的,由此得到的参数置信区间和假设检验都是不可信的。因此,分层线性模型样本量问题的研究是一个重大课题,近十几年来,很多的学者都致力于这方面的研究。Bryk和Raudenbush(1992)[3]很早就指出,可以凭借OLS回归的经验法则:增加一个解释变量至少需要增加10个观测样本,联系到分层线性模型的估计,增加一个层2的结果变量(层1模型中待定的随机参数)至少需要增加10个观测样本,这个准则只是OLS回归经验法则的平移,并没有清楚回答模型要得到较好估计所需的最小样本量问题。Kim(1990)[4]在研究分层线性模型斜率参数估计的时候,发现当组数较少而组内的观测值相对很大时,固定效应和随机效应的估计会产生很大的偏差,但是Kim的研究在相同的条件下,只进行了50次模拟计算,因此结果不太可靠。Mok(1995)[5]的研究也得出了类似Kim的结论,并且他进一步指出参数估计的偏差和效率更大程度取决于样本中的组数大小。Busing(1993)[6]指出当组数超过300时,随机效应的估计才是无偏的。Kreft(1996)[7]运用模拟技术探讨了分层线性模型的势,建议30/30准则,即30个组,每组30个观测值可以得到较可靠的估计。Hox(1998)[8]在Keft(1996)之后更详尽阐述表明,50组,每组20个观测值可以使交互效应得到较可靠的假设检验;100组,每组10个观测值可以较可靠进行随机效应的假设检验。另外Bliese(1998)[9]明确指出组内相关系数(ICC)与样本量相互联系。Snijders和Bosker(1999)[10]阐明对于较大的ICC值,增加组数也不会得到一致的标准差的估计。Mass和Hox(2005)[11]针对不同的层1和层2样本量进行了模拟研究,结果表明层2的样本数小于50,会导致有偏的协方差成分估计。
纵观以上研究,其方法主要是运用数据模拟的方法,针对不同层
1、层2样本量的组合,估计分层线性模型,比较固定效应、随机效应和方差协方差成分的估计值。在计算机发展日新月异的今天,进行模拟计算简单易行,应用广泛。但是对于此类问题,以往研究存在许多问题:①大部分研究考虑的是参数估计的准确性,只有很少的一部分重视估计的标准差的准确性。②许多研究在讨论估计参数假设检验或构造置信区间时,想当然的运用了大样本的近似理论,即参数估计近似服从正态分布,但是实际上,在样本量较小时,分层线性模型的参数估计值,尤其是方差协方差成分的估计值并非服从正态分布(Raudenbush(1984))。
2研究方法
本研究仍采用数据模拟的方法,用R语言编译计算程序。另外,研究采用简单的两层模型,每层模型各有一个解释变量:
在数据模拟过程中,研究分别改变组数,组内个体数和组间相关系数ICC,在样本变化的条件下,构造参数估计的置信区间,计算置信区间覆盖真实参数的覆盖率来考查估计值的分布情况。①组内个体数取值为5,30,50,ICC取值为1,2,3,考察组数从5至100改变情况下,估计值的分布如何变化;②组数取值为30,50,100,ICC取值为1,2,3,考察组内个体数从5至100改变情况下,估计值的分布如何变化。
在构造置信区间时,以往研究直接将方差用近似标准差代替,构造正态分布的置信区间,而本研究用另外一种方法计算参数估计的标准差。
R程序lme4程序包中的lmer命令可以提供分层线性模型的计算,它提供固 定效应系数和方差协方差成分的估计值,以及固定效应系数估计的标准差,但是不提供方差协方差成分估计的标准差,lmer命令的编写者Doug Bates(2008)表示,第一,方差协方差成分估计的标准差的计算是非常复杂的,很多情况下,估计值已经在参数空间以外,即便是估计出来,也是无意义的,因此有些软件(如SAS)提供标准差也并不可靠。第二,当参数分布差不多是对称的情况下,提供参数估计的标准差才是有意义的,因为可以由此构造置信区间。
Harvey Goldstein(1999)提到,样本不是很大的情况下,如果随机扰动项不再服从正态分布,分层线性模型的固定效应和随机效应的估计仍然是一致的,但是其估计的标准差不能用来构建置信区间和进行显著性检验。一种替代的方法是运用密集计算中的Jackknife和Bootstrap计算估计的标准差,由Jackknife和Bootstrap理论可知估计的标准差可以利用正态分布构建置信区间和进行显著性检验。
3研究步骤
3.1模拟数据的生成(4)讨论覆盖真实值情况:如果以上的置信区间确实覆盖了真实值,则取值为1;否则取0。
(5)计算覆盖率:重复第一步至第四步1000次,统计覆盖次数,计算覆盖率。
(6)在不同样本量情况下,考察覆盖率随样本量如何变化。固定n(=30,50,100),p(=1,2,3),N从5到100变化;固定N(=5,30,50),p(=1,2,3),n从5到100变化。
3.2.2运用参数Bootstrap方法
和Jackknife方法相比,参数Bootstrap方法步骤(2)中有差异,它将(2)分成以下几步。
构造置信区间和覆盖率的计算和Jackknife的过程一样。
4研究结果
4.1固定效应和方差协方差成分的置信区间覆盖情况
由于不论是Jackknife还是Bootstrap方法,运算量都是非常大的,因此我们先考察在组成样本三个条件N,n,p取不同值的组合下置信区间的覆盖情况。
4.1.1Jackknife方法
表1的结果表明,当N=5时,计算的覆盖率都离95%较远,这时若n的取值较大,如n=100,覆盖率会相对提高,但是方差协方差成分中的覆盖率还是很低,这说明分层线性模型的估计很大程度上依赖于N的个数。如果仅仅考虑参数点估计,当N的取值很小,即使n取值很大,的估计值也不能收敛,因此存在某个整体较大的样本量(较大的n和较小的N),方差协方差成分的估计是相当不可靠的。另外从表1中,还可以看出组内相关系数(ICC)的改变对置信区间的覆盖率没有太大影响。
当N达到30,n达到30时,固定效应和的估计是比较可靠的,其覆盖率基本上达到93%,只有三个值小于93%;但是此时对于仍然偏低,只有个别能达到93%以上。
表1N,n,p不同取值的组合下,Jackknife和Bootstrap方法计算参数95%置信区间覆盖率(%)
注:“J”表示Jackknife法得到的覆盖率;“B”表示Bootstrap法得到的覆盖率。
4.1.2Bootstrap方法
而言,大部分的覆盖率
和Jackknife相比,Bootstrap方法得出的结论很相似,但是对于N较小的时候,可以清楚地看到ICC的值越大,其95%的置信区间的覆盖率越小;另外对于σ的估计和Jackknife不一样,当N=5时,只要提高组内的样本量n,例如当n=100时,其95%的置信区间的覆盖率的均值为94.5%;当n=30,N=5,95%的置信区间的覆盖率的均值也达到93%,这说明σ的估计依赖的是整个样本容量,若组数稍小时,可以通过增加组内的个体数,提高估计的可靠性。
从以上的分析可以看出,Jackknife和Bootstrap方法只是在样本组数较小时有差异,而且其差异主要表现在σ的估计上,这种差异来源于这两种方法计算时再抽样的过程不同,当然这种Parametric Bootstrap的方法在样本组数较小时优于Jackknife的方法,但当样本数增加时区别不大,而Parametric Bootstrap的计算量远远超过Jackknife的计算,因此本研究下面的分析,当n和N连续的变化时,我们考虑Jackknife的计算方法。
4.2N从5到100变化时参数估计置信区间的覆盖率
现在考虑n取30,50,100;ICC取1,2,3的不同组合,N从5到100变化。因为ICC的变化对覆盖率的影响不大,因此以下的覆盖率均为ICC三种取值下的平均覆盖率。另外,为了考察覆盖率的可接受性,我们利用随机模拟的方法建立相应样本量下的覆盖率的置信区间(利用随机数均值覆盖率的置信区间),构成了相应的置信带。
4.2.1固定效应
以为例,其他三个固定效应的变化情况相似。从图1清楚地看到,当N取值很小时(如N=5,10),固定效应的覆盖率是很低的;当N达到35时,三种情况下的覆盖率都进入了置信带。
4.2.2方差协方差
考虑σ和的变化参照
。①σ的估计情况;当N很小时(如N=5,10),标准差σ覆盖率远远低于置信带的下界;随着n的增加,有更多的覆盖率进入置信带,平均当N达到50时,三种情况下的覆盖率完全进入置信带。②计情况:的估的覆盖率在n的三种取值情况下,都比固定效应γ和标准差σ相对应的覆盖率低,因此N从5变化至100时,只有较少的部分进入置信带,对于n的三种取值,N达到70时,覆盖率几乎完全进入置信带。对于较小的N,随着n的增加,参数覆盖率更靠近置信带。因此对于τ的估计,可以通过n的增加得以改善。
4.3n从5到100变化时参数估计置信区间的覆盖率
现在考虑N取5,30,50;ICC取1,2,3的不同组合,N从5到100变化。因为ICC的变化对覆盖率的影响不大,因此以下的覆盖率均为ICC三种取值下的平均覆盖率值。另外,为了考察覆盖率的可接受性,我们利用随机模拟的方法建立相应样本量下的覆盖率的置信区间(利用随机数均值覆盖率的置信区间),构成了相应的置信带。
4.3.1固定效应
以为例,其他三个固定效应的变化情况相似。图4(见下页)清楚地表明,N为5时,不论n如何增加,参数置信区间的覆盖率都远离置信带;当N取30时,只有两点在置信带外;当N取50时,整条覆盖率连线全部进入了置信带。
图1n的不同取值下
图2n的不同取值下σ的95%的置信区间覆盖率
图3n的不同取值下
图4N取5,30,50时,4.3.2方差协方差 的95%的置信区间覆盖率 的95%的置信区间覆盖率 的95%的置信区间覆盖率
考虑σ和,的变化参照。①σ的估计情况。图5显示出,N为5时,不论n如何增加,参数σ置信区间的覆盖率都远离置信带;当N取30时,大部分的覆盖率都进入了置信带;当N取50时,除一点外,整条覆盖率连线全部进入了置信带。②的估计情况。图6表明的估计和固定效应参数与σ有很大差别,当N取50时,还有很多覆盖率在置信带以外,这表明对于方差协方差成分的估计N为50是不够的。结合图3,我们可以看到对于方差协方差成分的估计,N达到70或者更多才可靠。另外,图6还显示了一个有趣的现象,当N取30和50时,较小的n(比如n<20)的覆盖率稳定地进入了置信带,而较大的n(例如:30<n<90)的覆盖率反而在置信带以外,这表明这时较小的n的参数估计比较大的n更可靠。
5研究结论
从以上的深入分析中,我们可以看到分层线性模型估计的可靠性与样本中的组数,组内个体样本数的取值有密切关系,总结如下:
(1)样本中的组数N。分层线性模型估计的可靠性很大程度上依赖于N的取值,随着N的增加,固定效应,方差协方差成分的参数估计的95%的置信区间的真实覆盖率能够进入置信带。当N较小时(如N=5),无论n如何增加,所有参数估计都不可靠,其覆盖率远远低于95%的置信带。对于固定效应参数γ的估计,N取30就可以得到可靠的参数估计。对于参数σ的估计,N取50,才能使其得到可靠的估计,方差协方差成分T的可靠估计需要N的取值达到70以上。
图5N取5,30,50时,σ的95%的置信区间覆盖率
图6N取5,30,50时,(2)组内个体样本数n。在N固定的情况下,随着n的增加,所有参数估计的可靠性都没有明显得到改善,即覆盖率连线没有明显的上升趋势。另外当N取值为30和70之间时,对于较小的n(n<20),比较大的n的参数估计更可靠。
参考文献:
[1]Lindley, D.V., Smith, A.F.M.Bayes Estimates for Linear Model[J].Journal of the Royal Statistical Society, Series B,1972,(34).[2]Littell, R., Milliken, G., Stroup, W., Wolfinger, R.SAS System for Mixed Models[M].Cary, NC: SAS Institute Incorporated, 1996.[3]Bryk, A.S., Raudenbush, S.W.Hierarchical Linear Models[M].Newbury Park, CA: Sage, 1992.[4]Kim, K.S.Multilevel Data Analysis: A Comparison of Analytical Alternatives[M].Los Angeles: University of California, 1990.的95%的置信区间覆盖率
物联网模型的分层应用技术解析 篇3
关键词:物联网,RFID,组网,频率
1引言
PSTN网络时代普及了实时语音通信,IDSN/PDSN网络让窄带数据业务变得容易,IP网则让宽带通信得以普及。但三者实现的都仅仅是P2P(人与人)之间的通信。信息通信的发展无止境,随着移动互联网的普及和传感技术的日益成熟,P2M或M2P之间的通信变为现实,并最终演变为实现了M2M(物与物)之间的通信。无所不在的物物连接和识别处理,使智慧城市和感知中国的IOT(物联网)成了发展的主流趋势。
2物联网组网技术
把所有物品通过RFID射频识别及其它智能感应装置等信息传感设备,经过传输网络传送至设定的信息处理中心,并与互联网连接起来,完成M2M(物与物)、P2M(人与物)之间的自动化信息交互和处理,从而实现智能化识别和管理的网络,就是物联网。物联网本身是以实现控制和管理为目标,由传感器、识别器和互联网络将管理对象(物)连接起来,由信息处理中心完成信息感知、识别、处理和决策执行。因此,物联网组网模型,分为三个层面:感知层、网络传送层和应用层[1]。物联网组网模型如图1所示。
感知层完成感知和识别,主要包括:物件ID标签、识读器和与之相连的识读终端。物件ID一般为RFID内嵌电子标签,也有使用二维识别码(简易型)的,其中RFID为射频识别(Radio Frequency Identification)的简称。识读器或读写器,是射频读写系统,识读RFID信息后经连接终端上传处理中心。
传送层是业务管道,依赖于电信网或互联网,以有线或无线作传输媒介,通过IP/CDMA等接入方式,传送交互信息。保证信息的安全有效传输。
应用层属于物联网的业务平台,包括信息处理中心、各种应用服务器和后台管理系统等。针对物联网的不同业务应用,如物流设备库管、环境监控保护、楼宇智能工程、医疗卫生保障、电子消费应用、智能交通调度等,规划设置相应的业务应用处理平台。应用层现在也逐渐融入了GPS定位系统、云计算平台、地理信息系统等应用平台,提供联合应用。
3物联网RFID技术
RFID(无线射频识别)最早被沃尔玛在超市中率先使用射频标签代替条形码技术[2],现在已成为自动识别技术发展的主流方向。RFID利用射频信号在读写器和ID电子标签之间,通过交变电磁场耦合,从而实现无接触双向信息传递的识别技术。
RFID的工作方式分为有源和无源方式。无源方式采用电感耦合方式工作,天线匝数更多,识读距离较短一般低于1米,通过阅读器天线辐射场,使ID标签电感线圈获得感应电流为无源标签提供射频能量,激活微芯片电路。有源标签一般采用钮扣电池供电,一直处于微发射状态,采取有源或半无源方式能增大识读距离达到几米。
RFID标签的组成包括射频前端、存储器和逻辑控制等电路。标签射频前端内置LC串联谐振电路,当处于阅读器天线场中时,收到同频脉冲信号谐振,在逻辑控制芯片的处理下,按程序解码,或从存储器调用数据通过卡内天线发射。一般存储器为E2PROM(电可擦写可编程只读存储器),主要存储ID码,断电不会丢失数据,通过高于识读工作电压的方式进行擦除和重编程标签的ID。RFID逻辑功能组成如图2所示。
RFID射频信号频点,位于TTU-R划分的ISM(Industrial Scientific Medical)波段中。典型的工作频率有125k Hz、133k Hz、13.56MHz、27.12MHz、433.92MHz、902~928MHz、2.45GHz和5.8GHz等[3],其中2.4GHz段为各国共同的ISM频段。低频段的125k Hz和133k Hz一般用于短距离识别,如动物标签等,低频ID标签一般为无源标签。中高频段的13.56MHz和27.12MHz,一般也采用无源电感耦合方式,所以与低频段具有相似性,一般用在电子类ID识别中,如公交卡、饭卡、电子身份证等。超高频与微波频段的统称射频段,如433.92MHz、902~928MHz、2.45GHz和5.8GHz等。
4物联网管道技术
物联网传送层是物联网应用的业务传输管道。企业内部的小型物联网传送,可以企业内部光纤局域网做传输网;公众物联网则依靠互联网、电信有线网和无线网的公网传输。
无论是互联网还是电信网,核心网都向基于TCP/IP的IP网发展,目前4G移动通信网的核心网也是基于IP寻址,即使LTE中的语音业务也以Vo LTE来实现[4]。物联网的广泛应用,每个联入网络的物件都需要被赋予RFID标签,因此标签ID需要选择海量地址的IPV6地址来识别。因此物联网传输管道必然选择基于IP的数据传输网。
5结束语
物联网本质上是“互联网+”的衍生应用。随着互联网和移动互联网的日益普及,为物联网的应用插上了双翼。无所不在的物物联网,使世界触手可及。为人们物质文化生活提供了极大的便捷,也必将助推我国信息化和工业化的深度融合,为智慧中国的实现推波助澜。
参考文献
[1]邵泽华.物联网结构的探索与研究[J].物联网技术,2015(11):46-53.
[2]代一平,邹传云.基于FSS的无芯RFID标签结构[J].通信技术,2016(1):103-107.
[3]祁超.RFID射频识别技术及其频率划分[J].电信快报,2010,21(3):14-16.
分层结构模型 篇4
信息通信网络发展到今天,已形成固定电话网、移动通信网、有线电视网、Internet网等多个相对独立的网络,这些网络由特定的网络资源组成,承载和疏通特定的业务。这种“一种业务,一种网络”的网络格局已逐渐暴露其固有的弊端:多种复杂的协议、复杂的.网络共存;网络管理和维护成本很高;不利于网络资源尤其是传输资源的共享不便于跨网络多功能综合业务的提供。目前,在2G移动通信网络中逐步引入分层体系结构的软交换设备组网,可提高传输效率与组网的灵活性,减少设备占地面积,降低运营成本,以实现移动网络向3G网络的平滑演进。
2. 交换网络建设总体原则
结合对某运营商交换网络现状分析的结果,本着“从市场出发,以服务、效益为目标”的前提,遵循以下建设原则。
1. 构建合理网络结构,提升网络安全能力:原则不再对TDM端局进行扩容和新建。从满足业务需求、节省投资和利于网络演进的角度出发,考虑引入软交换设备,传统交换局替换为软交换,提升软交换比重;考虑重要网络容灾,提升网络安全水平。
2. 充分根据MSC, VLR等网络的实际负荷,利用历史发展数据和相关资料合理预测市场话务需求,准确分析网络性能需求,解决现网急迫问题。
3. 对于新建端局,采用软交换设备。要求软交换设备采用和R4软交换同一平台及架构的设备,能够通过简单软件升级和增加硬件板卡支持IP化和R4。并能够平滑升级支持3G。
4. 对于新建软交换设备,须支持2G/3G互操作。
5. MSC Server的设置原则:为“大容量、少局所;集中放置、区域管理”,原则上集中设置在省会城市,对于业务量较大的中心城市,也可考虑设置,全网MSC Server的设置要统一规划。 对于非省会城市设置的MSC Server,如果同时负责管理本省内其它本地网的MGW该城市必须处在二干传输中心节点的位置,并且要确保其具备相应的维护技术力量。
6. MGW的设置原则:MGW设置在有业务需求的各个本地网,尽量放置在传输节点上,尽量考虑与BSC同局所,节省A接口传输资源。初期,MGW单系统承载的最忙时话务量建议不超过8000ERL,中后期,可以适当考虑上调。MGW要求能同时支持TDM端口和IP端口,并支持IP入+TDM出、TDM入+TDM出、TDM入+IP出,采用IP承载时能够支持IP入+IP出。
7. 网络结构应尽量简单、清晰,便于实施。网络结构应具有较大的灵活性,便于以后网络的发展。
3. 交换网络建设方案设计
针对现网交换核心存在系统负荷高的问题,根据网络性能需求分析,考虑到网络演进,通过引进软交换设备,设计规划软交换网络架构。采用传统交换机与软交换设备混合组网的方式,解决系统容量问题。实现交换网络MSC增容,一般有两种手段,最直接的方式,就是现有MSC扩容;另外一种方式就是新建MSC。现有局扩容方式,优势是工程周期短,投产快,网络分区不必做较大规模调整,有利于保持网络稳定,电源配套等项目增加投入不大;劣势是解决增容相对有限,议标方式扩容单位成本相对较高,并且需要核定处理机的处理能力是否满足,如果再需要升级处 理机,则扩容的成本将会进一步提高。
新建局方式,则可以满足各种规模的扩容,并目可以采用招标方式,有效单位造价;其不利的方面主要是,工程周期相对较长,网络分区要做较大规模调整,电源配套等项目增加投入较大。但新建局方式还有一项很重要的优势就是,可以采用更新的技术,更新的产品,从而保证投资的长效性。
结合对两种建设方式的分析、交换处理能力需求预测及容量需求预测,提出交换端局建设方案。本期工程不考虑对传统交换局进行建设。从网络向3G演进的方向考虑,对于有新增容量需求的传统交换局均采用新建软交换方式建设,新建软交换局管辖区域需要结合BSC划分方案确定,应尽量避免新建局与原有交换局间出现频繁切换从而影响网络质量,考虑到今后3G业务发展需求软交换局优先考虑管辖市区。提出以下建设方案: 城市A业务区:新建软交换MGW 1与MGW2,进行管辖区域调整,管辖部分市区BSC;
城市B业务区:新建软交换MGW2,管辖部分市区BSC;
城市C-F业务区:新建软交换MGW,管辖部分市区或郊区BSC。
软交换组网布局如图1所示。
4. 结论
本章是论文的核心部分,根据某运营商核心网现状分析的结果,本着“从市场出发,以服务、效益为目标”的前提,提出了建设总体原则:即引进R4结构的软交换设备;网络结构要简单、灵活,便于向3G平滑过渡。通过对网络资源利用情况数据的分析,重点解决各业务区系统容量不足与资源利用率高问题。通过话务量预测,确定系统性能需求。经过方案论证,设计了采用软交换设备的分层体系结构的移动核心话路网与信令网网络组网方案。
参考文献:
[1]赵慧玲、叶华,以软交换为核心的下一代网络技术「M].人民邮电出版社,.
[2]陆立、张鹏生、张华、傅娟,NGN协议原理与应用[M] 电子工业出版社,.
分层结构模型 篇5
随着计算机和通讯技术的发展和进步,人类社会进入了信息社会。互联网在人们的日常信息交流中占据着越来越重要的地位,但是,人们在享受互联网带来的方便快捷服务的同时,反动、色情、暴力等不良内容在互联网上的传播已经成为日益突出亟待解决的问题。因此,针对这类包含不良内容的非法文本过滤的研究也越来越多,越来越成熟,可以把这类问题看做一个两类文本自动分类问题。目前文本分类的方法主要有:K近邻法(KNN)、朴素贝叶斯(Naive Bayes)、支持向量机(SVM)等等[1]。这些方法通常采用的是单步分类策略,即首先从待分类文本中抽取具有分辨能力的特征,然后根据某一种分类算法对文本进行分类[2]。
本文的研究范围为有关国家安全敏感信息文本过滤,研究数据是一类和国家安全敏感信息相关的真实的中文文本集,其任务就是找出其中宣扬对国家安全有害内容的文本。如果将其看作一个两类文本分类问题,那么可以形式化地定义为:假设预定义的文本类型集为C={C1,C2},其中C1表示和宣扬对国家安全有害内容的文本类型,C2表示揭露这些对国家安全有害内容的文本和一些与国家安全敏感信息不相关的文本类型。
这类文本集有如下显著特点:首先,文本集中属于类型C1的文本数目远远小于属于类型C2的文本数目。其次,属于类型C1的文本为一些宣扬对国家安全有害内容的文本,而在属于类型C2的文本中存在许多揭露这些对国家安全有害内容的文本。假定这些文本的类型为C2的一个子类C
本文针对这类语料的过滤问题提出了一种基于关键词提取二元词串为特征的高性能的分层过滤方法,其基本思想是:首先,在非法文本集中使用文档频率和卡方统计相结合的方法抽取非法关键词集合,并根据制定的策略,筛选出非法文本和一些包含非法关键词的合法文本;其次,在筛选出的文本中,选取包含非法关键词的二元词串作为特征集合,以卡方统计方法对特征进行评估,选取预定数目作为结果的特征子集,使用支持向量机分类器过滤非法文本。
1基于二元模型的分层过滤方法
1.1基于关键词的第一层过滤
在第一层过滤的时候,关键点主要有两个:非法关键词集合的抽取和基于非法关键词的过滤策略的确定。
本文要抽取的非法关键词是希望能够代表文本类型为C1的那些关键词,因此,可以使用文本分类中常用的特征选择方法来抽取关键词。主要有:文档频率(DF)、信息增益(IG)、互信息(MI)、卡方统计方法(CHI)、期望交叉熵、文本证据权等。但是在众多的特征选择方法中,Yang指出IG(信息增益)和CHI 的效果最好[3],而IG计算量相对其它几种方法较大,因此本文在非法关键词抽取时,主要采用效果较好卡方统计方法,公式(1)就是常用的卡方统计公式:
其中N为文档总数,A为包含特征t且属于c类别的文档数,B为包含包含特征t但不属于c类别的文档数,C为包含不包含特征t但属于c类别的文档数,D为不包含特征t且不属于c类别的文档数。因此,在实际使用时可以用下式计算:
由公式(2)可以看出,卡方统计在用于关键词抽取有个很明显的缺陷[4]:提高了很少在C1类中出现但普遍存在于C2类中的词语在C1类中的权重。在整个训练集语料库中一些出现频率较高的词语,而这些词语在C1类中出现得很少(即A 值很低),显然这些词是不能作为C1类的关键词,但是BC>>AD 导致用公式(2)计算出来的χ2 统计值相对来说比较大,而权重高的特征项将被保留[5],作为该C1类的关键词。因此本文对这个缺陷做了简单的改进,使用文档频率(即DF)剔除了A值很低的特征,然后在做开方统计。这样提取的关键词有更好的代表性和普遍性。所以,本文是采用文档频率(DF)和开方统计(CHI)结合的方法提取关键词集合用于实时过滤。
使用非法关键词,根据一定的策略,可以筛选出几乎所有文本类型为C1、C
1.2基于二元词串的第二层过滤
二元词串是一种具有较强类型分辨能力的特征,但同时也是数据分布很稀疏的一种特征。为了降低稀疏程度,本文采用了基于非法关键词的二元词串提取。首先,在经过第一层过滤后剩下的文本集合中,提取出包含非法关键词的候选二元词串,使用的非法关键词是在步骤一中提取的权重靠前的关键词。例如“人民/n 揭露/v 事情/n”,其中“揭露”为非法关键词,那么“人民揭露”和“揭露事件”都讲作为的二元词串,以这些二元词串构造特征集合。
在上述构造好的特征集合中,使用卡方统计公式,即公式(2),对这些候选特征进行评估,选取预定数目的最佳特征作为结果的特征子集,这个特征子集将用于下一步的文本向量化。
根据最终确定的特征子集,以向量空间模型表示出经过第一层过滤筛选出的文本,以支持向量机分类器进行文本分类,区分出文本类型,从而过滤掉文本类型为C1的文本。
1.3过滤实验步骤
根据上面提出的基于二元模型的分层过滤方法,本文在验证该方法的过程中,依照图1所示的步骤进行了相关的实验。
1.4基于二元模型的分层过滤方法的特点
本文提出的基于二元模型的分层过滤方法主要有以下特点:首先,经过第一层的过滤,可以筛选掉文本类型为C2的大部分的文本,因此降低了不相关文本对下一层使用分类器分类的干扰。然后,在筛选出的文本中,使用非法关键词的抽取二元词串作为特征,可以降低稀疏程度,同时保留了具有较强类型分辨的能力。最后,本文中的第一层基于关键词的过滤,可以作为一个实时过滤系统运行在网关或类似的设备上,可以提高整个系统的监控能力。
2实验研究
2.1实验数据
本文用于实验的数据由12600篇文本构成,其中属于C1类型,即宣言对国家有害信息的文本有1800篇;属于C2类型的文本10800篇,其中类型为C
2.2非法关键词的抽取策略
为了比较关键词抽取的性能,提出了覆盖率:
其中满足条件是指,在规定大小的非法关键词集合中,该文本包含的非法关键词的个数大于等于过滤阈值。
根据表1所示,使用文档频率(DF)与卡方统计(CHI)相结合的策略,在提高类型C1的覆盖率的同时降低了类型C2的覆盖率,而且其表现的性能也相当不错,适合用于非法关键词的抽取。
2.3非法关键词集合大小及其过滤阈值的实验
为了选取大小合适的关键词集合和过滤阈值,同样使用覆盖率来比较,本文做了如下实验:
根据表2所示,比较上述列举的五种策略,为了保证类型C1的覆盖率,同时降低类型C2的覆盖率,本文选取了关键词集合取50,过滤阈值取1,这时表现的效果还是比较理想的。
2.4文本过滤实验及其结果分析
为了验证本文提出的方法,对同一份语料,即12600篇文本。由于测试集中属于类型C1和属于类型C2的文档比例为1:6,如果将所有文本都标记为C2类型,C2的分类精度也能达到85.7%,因此类型C2的分类性能对所选择的分类方法不敏感。在下面的实验中只给出类型C1的分类性能。将属于类型C1和属于类型C2的文本集随机地平均分为五份,以其中的四份构成训练集,剩下的一份份构成测试集。进行五折交叉验证,最后以平均值作为最终的性能指标。进行了下面5种不同过滤方法的实验:
方法1 以单个词语为特征,使用卡方统计进行特征抽取的单步分类。
方法2 以二元词串为特征,使用卡方统计进行特征抽取的单步分类。
方法3 第一层为关键词过滤,第二层为以单个词语为特征,使用卡方统计进行特征抽取的两步分类。
方法4 第一层为关键词过滤,第二层为以二元词串为特征,但没有使用关键词来抽取候选二元词串,使用卡方统计进行特征抽取的两步分类。
方法5 第一层为关键词过滤,第二层为以二元词串为特征,并且使用关键词来抽取候选二元词串,然后在使用卡方统计进行特征抽取的两步分类。
实验从下面三个方面进行评价:
(1) 准确率:
(2) 召回率:
(3) F1测试值:
实验结果由表3所示。
比较方法1和方法2,虽然方法2的准确率和召回率都比较高,但是方法2使用了12000个特征,得出结论:二元词串是一种具有较强类型分辨能力的特征,但同时也是数据分布很稀疏的一种特征。
比较方法1和方法3(方法2和方法4),可以看出,经过第一层的过滤,筛选点部分的合法文本,降低了不相关文本对分类器的影响,因此准确率和召唤率都有提高。
比较方法4和方法5,方法5虽然只使用了3000个特征,但是在准确率和召唤率上都比方法4要高,得出结论:基于关键词提取的二元词串,可以降低二元词串作为特征时的带来的数据稀疏问题。
最后,方法5的准确率,召回率和F1的值都比较高,说明本文提出的方法具有比较高的性能。
3结语
有关非法文本过滤是分文分类的重要应用,也是当前急需解决的现实任务。本文给出了一种高性能的过滤方法,在12600篇文本构成的语料上运行实验表明,提出的过滤方法达到了较高的性能,准确率,召唤率和F1的值分别为:95.65%,84.87%和89.93%。本文在实验过程也提出一种性能不错的关键词抽取方法,同时本文提出的两步过滤策略,其中第一层的过滤可以作为一个实时过滤系统运行在网关或类似的设备上,以提高整个系统的监控能力。
摘要:提出一种基于二元模型的分层过滤策略的中文文本过滤方法。首先,在非法文本集中使用文档频率和卡方统计相结合的方法抽取非法关键词集合,并根据制定的策略,筛选出非法文本和一些包含非法关键词的合法文本;其次,在筛选出的文本中,选取包含非法关键词的二元词串作为特征集合,以卡方统计方法对特征进行评估,选取预定数目作为结果的特征子集,使用支持向量机分类器过滤非法文本。实验表明提出的过滤方法的准确率、召唤率和F1的值分别为:95.65%,84.87%和89.93%。
关键词:文本过滤,卡方统计,关键词抽取,二元词串
参考文献
[1]Sebastiani F.Machine learning in automated text categorization[J].ACM Computing Surveys,2002,34(1):1-47.
[2]樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131.
[3]Yang Y,Pedersen J Q.A comparative study on feature selection in textcategorization[C]//Proceeding of the 14 International Conference onMachine Learning(ICML),1997:412-420.
[4]肖婷,唐雁.改进的χ2统计文本特征选择方法[J].计算机工程与应用,2009,45(14):136-140.
分层结构模型 篇6
实验是科学研究的基本方法之一,而实验教学是培养学生创新能力和实践能力的重要环节。好的实验教学更加能够提高学生的科学素质、培养学生的动手能力和创新能力[1]。同时,实验教学要因地制宜,根据具体实际,探索开展创新实验教学的方法与途径。
由于江苏科技大学张家港校区为异地办学,软件、硬件条件匮乏、设备少、师资匮乏,再加上传统的实验教学,以老师讲为主,学生缺乏动手和创新的机会,忽视了对学生多方面能力的培养与锻炼,为此提出一种分层创新实验教学模型,如图1所示。
2 实验教学定位及规划
遵循江苏科技大学“笃学明德经世致用”的办学理念和治学传统,学校注重学生的实践能力与创新能力,大力鼓励学生多进入实验室,加强专业实习、课程设计、社会实践等实践教学环节,形成了“实践与理论相结合、发展与创新”的实验教学理念。
在此理念的指导下,学校把理论与实验相结合,与往相比加强了实验教学的环节,增多了实验内容,课时安排有了一定的拓展性、开放性[2]。实验形式多元化,尊重学生的认知能力,开设了演示型、验证型、设计性、综合性、开放型、创新性等实验内容。综合提高学生的动手能力、创新思维、科研素质。逐渐形成了“实践、创新、发展”的实验教学特色。
3 分层创新实验教学的实践
3.1 必修实验模块
必修实验分为基础实验和专业实验两个模块。如:物理实验、电工基础实验、计算机程序设计实验等。实践与理论相结合,让学生在实践中认知理论,采用分批分组实验,分批讲解、分组操作的形式,有利于设备的综合利用。如180人的实验,要求每个学生能够操作,只有一台设备,分为20批/h,3组/批。学生利用所学在实践中,掌握基本的实验方法、实验技能、培养自身分析和解决问题的能力。
必修实验一般利用晚上、周末时间给学生开实验,这样为学生提供了更大的空间,让学生有充足的时间完成自己的实验,尊重学生的认知能力。
3.2 开放实验模块
开放实验分为一般实验、课程设计和毕业设计三个模块。如:金工实习制作小铁锤、生产实习、机电液综合课程设计、专业选修实验、毕业设计部分的实验等。专业选修实验,主要在已有设备上开发新项目进行开放实验教学,根据专业课程内容开发自制设备进行开放实验教学。对学生自己设计、毕业设计、课程设计中的实验进行开放。一般由老师指导,学生自己设计方案实现。给学生提供了便利的资源,提高了学生学习和动手的积极性,同时提高了学生主动力和判断力,以及单独实验的能力,更重要的是培养了学生创新的能力,让学生自己对于自己所学有一定的鉴定力。经过实践,得到了广大学生的青睐,老师的认可与好评,形成了开放实验模块。
3.3 创新实验
创新实验包括本科生创新实验和大学生竞赛实验两个模块。通过科研训练自主创新,一般以团队为单位,学生运用所学知识,或者设备器材进行自主学习,然后开发团队或者个人的创新项目。如:机器人、四轴飞行器等。
通过创新实验,给了广大学生宽阔的舞台,让自己的想法自己的创新可以在实验室里实现,同时锻炼了他们团队意识与合作能力。培养了学生创新思维与单独思考的能力以及学会了科学的研究方法,形成了创新实验模块。
4 分层创新实验教学效果与成果
首先,新的实验教学方法,提高了教学质量,带动了学生们的积极性,体现了学校的人才培养标准和特色,体现了学校倡导并遵循的价值追求和教育宗旨。提高了学生动手能力,创新思维,以及实验技能。毕业生无论走向自己的工作岗位还是继续深造,都受到了用人单位的好评。
另外,利用开放实验完成毕业设计论文的有110篇,占15%。课程设计有300篇,占54%。新的实验教学为同学们毕业设计与课程设计提供了平台。
值得一提的是,在校生也参加了国内外的各类大学生竞赛,如四轴飞行器、飞思卡尔、江苏省大学生工程训练综合能力竞赛也均取得好成绩。其中,校区学子组成的“鹰之歌”代表队,继夺得第五届全国大学生“飞思卡尔”杯智能华东赛区一等奖后,在全国总决赛中又获得二等奖;“四轴飞行器”在2010年第三届江苏省大学生机械设计创新比赛中获得二等奖;环保型“无碳小车”在2011年首届江苏省工程训练大赛中取得三等奖。
5 分层创新实验教学师资力量
实验教学的水平对于学生的创新能力以及教学质量有重要的意义。结合张家港校区异地办学,师资匮乏的情况,我们采用专兼结合的实验教师队伍。专业的实验教师,主要管理、实验室运行、设备维护。同时,打造“双肩挑”教师队伍,理论教师兼实验教师、设备管理教师兼实验教师、校内工厂师傅兼实验教师。专兼结合,节省了资源,同时也提高了实验人员的整体素质;其次,对于一线教理论的教师更加有机会把自己的成果运用在实验中得以检验。这些都提高了教学质量。专兼结合的教师队伍,为培养和提高学生的创新能力打下了坚实的基础。
6 结论
本文结合相关例子说明了分层创新教学实验的正确性和可行性,把实验分为必修实验、开放实验。创新实验,提高了教学质量,有利的运用了教学资源。此创新实验教学对于有效开展应用型院校的教学改革,以及培养高素质、有竞争力的应用型人才具有一定的指导意义。
参考文献
[1]王志芳,周锦艳.创新性实验教学实践[J].实验技术与管理,2010,27(3):206-209.
[2]马丽霞,屈晓阳,顾勇飞.创新性实验教学体系的构造[J].中国大学教育,2010(10):67-69.
[3]白爱东,汤作华.高校实施开放性实验教学所面临的问题及解决措施[J].科技信息(学术研究),2008(36).
分层结构模型 篇7
随着企业信息化程度的不断加深, 信息资源共享在企事业单位之间变得越来越重要。但由于各单位在不同时期所进行的信息化建设的程度存在很大差别, 导致了信息系统运行在不同的平台上, 产生了一个个“信息孤岛”, 使得在信息系统之间进行数据交换面临很多困难, 现有的数据交换方案在一定程度上解决了资源共享问题, 但是, 至今没有很好地解决数据交换过程中的松耦合、可扩展和通用性问题。本文设计了一种由数据层、适配层和传输层组成的数据交换模型。
1 基于XML的数据交换模型
XML语言, 即可扩展标记语言[1]。具有自描述性、可扩展性、跨平台性、灵活性和开放性等适合数据交换的特点[2]。在数据交换中引入XML技术, 采用分离数据交换标准与具体的软件实现的方法[3], 提高数据交换兼容性, 降低了数据交换系统的重复开发率, 基于XML的基本数据交换模型[4]如图1表示。
2 基于分层机制的VTS数据交换模型
VTS系统, 一般也叫船舶交通管理信息系统, 从狭义上讲, VTS是指由岸基雷达、VHF通信系统和数据处理器等设备组成的系统, 即VTS是一种设备系统[5]。系统分为内外两个站点, 对外的站点面向船代等其他外部用户, 内部站点面向海事局内部工作人员, 协同完成船舶的申报、审批等工作。
JMS:对于消息中间件技术[6], SUNONE提出了JMS技术作为java平台的消息服务接口规范, 定义了一整套在Java企业系统中传递消息的规则, 提供了一个通用的消息模型, 包括点对点 (Point to Point) 和发布/订阅 (Publish/Subscribe) 两种模式[7], 完成可靠的消息传输、事务和消息过滤等机制。
在对数据交换现有解决方案进行分析和对JMS和XML技术进行研究的基础上, 设计了由基于分层机制的JMS/XML的异构数据源数据交换模型。模型包括三层:数据层、适配层和传输层, 模型如图2所示。
数据层:数据层由待交换的异构数据源组成, 其数据类型涵盖关系数据库管理系统, 这些数据源在数据格式、存储模式上存在着差异。
适配层:该层由数据存取/解析模块和消息服务模块组成。其中, 数据存取/解析模块主要完成数据封装和代理的功能, 抽象出对数据源访问的具体实现。消息服务模块主要完成消息的封装和传递功能, 主要包括:建立与JMS服务器的连接;将XML文档封装成XML消息 (本文中称封装了XML文档内容的消息为XML消息) , 并发送到JMS服务器相应的主题或队列中;从JMS服务器的主题或队列上接收XML消息并解析成XML文档。
传输层:传输层由JMS服务器来实现对封装消息的传输功能, 是各个应用系统交换数据的媒介, 它保存了系统间为数据交换所需的消息, 确保消息通信的异步性、持久性和可靠性。详细设计结构如图3所示。
3 模型的验证
源数据源PostgreSQL请求目标数据源Mysql, 以下是测试结果。
3.1 从目的数据源Mysql生成XML文档
3.2 转换到本地数据源PostgreSQL
4 结束语
整个模型的设计过程中采用了组件化思想和基于消息主题的数据传输方式, 较好地实现了数据交换的松耦合性和可扩展性。以XML作为异构数据源交换载体, 使该模型具有较好的通用性。经验证, 该模型可以有效的完成应用系统异构数据源间的数据交换, 为海事局各应用系统之间进行数据交换提供了一种良好的解决方案。
参考文献
[1]展翔.基于XML的异构数据库交换技术的研究[D].武汉:武汉理工大学, 2007.
[2]陈丽娟.张金望.基于XML的数据库信息交互.[2009-7-5].http://www.ccw.com.cn/.
[3]万军.基于XML的数据交换模型的设计与实现[D].苏州:苏州大学, 2005.
[4]张正明.异构数据库集成的研究与实现[D].北京:北京机械工业学院, 2005.
[5]唐强荣.VTS系统结构模型.广州:广州航海高等专科学校.2001.
[6]中间件技术概述 (.2009-2-15) [2009-6-20].http://www.kuqin.com/middleware/0006.html.
分层结构模型 篇8
Windows Driver Model(WDM)的根源可追溯到几年前一种叫做Windows for Workgroups 3.10的操作系统。那时候驱动开发人员努力地支持无数不同的SCSI控制器。重新构造必要的映象加载器(image loader)和小端口驱动程序需要的执行环境比把这些小端口驱动程序重写成某些VXD形式的驱动程序并调试完毕所花费的努力要少得多。共享驱动程序模式的潜在意义是重大的。驱动程序开发人员感兴趣的是支持双平台,共享驱动模式能降低开发和调试的一半开消。对微软来说,共享模式意味着更容易地从win9x迁移到Windows2000或这个平台的未来版本。对最终用户来说,大量不同种类的稳定驱动程序可以在这个家族中的所有成员之间通用。
1. 驱动程序分类
微软发布的许多操作系统中,我们以Windows 2000系统为例,介绍驱动程序的分类。多种驱动程序都可以在Windows 2000下使用,图1显示了其中几种。
2. WDM规范和分层驱动模型
2.1 层次结构
Windows驱动模型使用了层次结构。图中左边是设备对象堆栈,设备对象是一种数据结构,该数据结构可以帮助软件去管理相应的硬件。分别是物理设备对象PDO(physical device object),处于堆栈的底层;功能设备对象FDO(functional device object),处于中间层;过滤器设备对象Fi DO(filter device object),处于FDO上面的叫上层过滤器,处于FDO下面的叫下层过滤器。右边是对应的驱动程序。系统通过使用I/O请求包IRP(I/O request packet)去驱动设备。IRP会被驱动程序逐层传递。驱动程序可以处理IRP,也可以不对IRP做任何处理直接传递到下一层。
2.2 驱动程序所包含的基本函数
下表列出了驱动程序所包含的基本函数:
2.2.1 Driver Entry函数
Driver Entry()相当于C程序的main()等函数,它是驱动程序运行的入口,不由用户调用而由操作系统调用。
I/O管理器按下面方式调用该函数:
extern"C"是必须的,表示“用C链接”。如果你的文件的扩展名是.c的话,这句可以省略。
在DDK中,IN,OUT和INOUT被定义成空的字符串。当一个参数被定义成IN参数时,表明这个参数是输入参数,其它没有任何含义。当一个参数被定义成OUT类型的参数时,表明这个参数是输出参数,其它没有任何含义。当一个参数被定义成INOUT类型的参数时,表明这个参数是既是输入参数又是输出参数,其它没有任何含义。
一个Driver Entry函数关键实现如下:
2.2.2 create_device函数
在功能驱动程序FDO中,create_device函数的功能是增加一个设备对象,把它放到设备堆栈中
关键实现的代码如下:
2.2.3 unload_device函数
在WDM驱动程序中,unload_device函数的主要功能是卸载和释放在Driver Entry函数中初始化的一些系统资源和内存。如果Driver Entry函数返回失败,系统将不会再调用unload_device函数,因此必须保证内存一次性释放,否则会造成内存泄露等其他后果。
代码如下所示:
3. 总结
通过对Windows2000操作系统的概述,Windows2000驱动分类,重点介绍了WDM驱动的工作过程及其驱动编程所涉及到的主要的函数进行的简单介绍,对驱动开发的过程及其框架有了基本的理解。要想继续深入进行实战,读DDK文档。
参考文献
[1]Walter Oney,Programming The Microsoft Windows Driver Model.[M].微软出版社.
[2]翟洪涛.WIN2000驱动程序设计.[EB/OL]http://usbing.com/books/win2000chinese/source/index.htm.
[3]WDM设备驱动程序开发平台.[EB/OL]http://xuexi.hao500.net/windows/a270002.htm.
[4]Wyouken,04icwin.Windows WDM驱动开发.[EB/OL]http://www.iciwin.net.2005.11.
[5]周明全,耿国华,张毅坤,姚全珠.windows2000驱动程序开发大全[M].机械工业出版社,2001.08版.1368页.
[6]DDK开发环境中的DDK文档.
[7]驱动程序开发——Hello Word!http://blueplato.bokee.com.
相关文章:
贝叶斯结构模型01-13
结构解析模型01-13
结构保留模型01-13
功能翻译理论在科技翻译中的映射01-13
多神教观念在现代俄语中的映射及其研究价值01-13
案例10 关于中国普通高等学校债务问题01-13
资本结构调整模型01-13
超结构模型01-13
结构与方程模型01-13
信息装备结构模型01-13