回归优化(精选八篇)
回归优化 篇1
协同过滤推荐是当前最成功的推荐技术之一[1],根据过滤操作对象的不同,协同过滤算法可以分为基于用户(User-based)[2]和基于项目(Item-based)[3]的算法。User-based协同过滤算法随着数据的不断增多,要从大量用户中寻找最近邻居用户的问题成为推荐系统发展的瓶颈,而Item-based协同过滤算法通过将计算用户之间的相似性转换为计算项之间的相似性的方法,有效地解决了这一问题。在Item-Based协同过滤算法中,项目之间相似性的度量是否准确,直接关系到整个推荐系统的推荐质量。而实际上,由于系统用户评分数据的极端稀疏性,传统的相似性度量方法存在着一定的弊端,系统的推荐精度往往会很低。为了提高系统推荐精度,一些研究者们对项目相似性计算方法进行了改进。根据项目属性相似度和用户评价相似度,计算项目之间的综合相似度,但项目属性相似度的计算公式只简单考虑两个项目间相同的属性数,未考虑项目属性的重要性差异。因此将项目属性相似度和项目评分相似度的线性组合作为最终邻居相似度,在计算项目属性向量的相似度时,使用加权计算来解决项目属性的重要性差异问题。以上算法的核心就是用基于项目属性的相似性来改进传统Item-Based协同过滤中目标项目的最近邻居项目集的查找,项目属性相似度的计算是这类改进方法的关键。但是,目前基于属性相似性的Item-Based协同过滤算法将项目属性之间的复杂关系进行了简单的线性化处理,忽略了项目属性的非线性关系,在一定程度上影响了算法的效能。
Vapnik等人根据统计学习理论提出的支持向量机(SupportVector Machine,SVM)[7]方法具有诸多的优良特性,近年来引起了广泛的关注,SVM方法最早是针对模式识别问题提出的,Vapnik通过引入不敏感损失函数,得到了用于回归估计的SVM方法,称为支持向量机回归 (Support Vector Regression,SVR) [8],SVR方法被引入非线性回归领域,显示了其巨大威力[9,10]。本文利用支持向量机回归算法的回归能力,解决项目属性的非线性关联问题。实验结果表明,本文所提的算法大幅提高了推荐算法的精确度。
1支持向量机回归
一般的回归问题可表述为:给定l个训练样本,学习机从中学习出输入、输出变量之间的关系(依赖关系、映射关系、函数关系) f(x)。考虑一个训练样本数据集{(x1,y1),…,(xl,yl)}。对于i=1,…,l其中xi∈Rn每个代表了样本的输入空间,存在一个目标值yi∈R与其相对应。回归问题的思想就是从中学习出一个函数,能够精确地估计未来值。一般的SVR函数形式为:
其中,w∈Rn,b∈R,Φ代表了从Rn 到高维空间的一个非线性变换。我们的目标是找出w和b的值,使回归风险函数最小化。回归风险函数为:
其中,Γ(·)是损失函数,常数C > 0,表示对估计偏差的惩罚度。最常用的损失函数是Vapnik提出的ε-敏感度函数。解决回归问题时,SVM是在n维特征空间中,使用ε-敏感度损失函数来求解一个线性回归问题。同时,它要通过最小化‖w‖2来减小模型容量,以保证更好地拟合一般性。于是我们得到了Vapnik所描述的最优化问题:
其中,ξi,ξ*i是代表输出结果上下界的松弛变量。
经过推导,可得到其对偶优化问题为:
在解出以上的二次优化问题后,一般公式可以改写为:
在公式(5)中,点积可以用核函数k(xi,x)来代替。核函数能够在不知道变换具体函数的情况下,使用低维空间的数据输入来计算高维特征空间中的点积。通常使用的核函数包括线性函数、多项式函数以及RBF等。
2基于支持向量机回归的相似度优化方法
2.1 项目的特征属性
一般来说,推荐系统至少存在3个基本数据表,一个用来记录注册用户信息,一个用来记录项目信息,还有一个记录用户的评分信息(记为用户评分表)。通过对记录项目信息表的整理可以得到项目特征属性矩阵A。假定接受评分的项目数是n,每个项目挑选k个具有代表性的属性描述,在此将其抽象为 { Attr1,Attr2,…,Attrk}。见表1,项目属性矩阵A(其中1表示某个项目具有某项属性,0表示某个项目不具有某项属性) ,项目特征属性的抽取可以从项目的简介网页中提取,或者从推荐系统中用来记录项目信息的表中整理得到。
2.2 构建项目属性相似度模型
设任意两个项目Itemx、Itemy在k维项目特征属性空间上的属性值分别看做向量Itemx={Attrx,1,Attrx,2,…,Attrx,k}和Itemy={Attry,1,Attry,2,…,Attry,k},并且该向量元素的取值为二维数据(0或1),则项目Itemx和项目Itemy之间的属性相似性simAttr(Itemx,Itemy)的计算公式为[6]:
其中simAttr(Itemx,Itemy)为两个物品的相似度,sim(Attrj(Itemx),Attrj(Itemy))则是Itemx,Itemy关于属性Attrj的相似度。wj是根据经验对每个属性Attrj赋予一个权值,且。相似度是对每种特征进行线形加权,但是对于非线性相似度则会出现较大的误差。例如用户可能会觉得只要是导演A与演员B合作的影片,无论风格以及年代的差距有多大,都是非常相似的。针对这个问题,本文使用支持向量机的方法来解决。两个物品在项目属性上的相似度修改为:
在构建回归模型时,线性回归模型难以拟合复杂的项目属性相似度,并不能得到好的回归效果。如上所述,支持向量机回归(SVR)能够通过核函数,将只包含上述自变量的低维空间,转化为一个包含了它们非线性组合的高维自变量空间。于是本文引入SVR方法来构建此非线性回归模型。基于公式(5),可构建模型如下:
为了提高算法执行效率,本文使用序贯最小优化(SequentialMinimal Optimization,SMO)方法[10],一种快速支持向量机训练算法来求解此模型。
2.3 优化后的推荐算法
SVR相似度优化方法仅仅是针对基于属性相似性的ItemBased协同过滤算法提出的一种新的计算项目属性之间相似性的方法,因此只需要将基于属性相似性的Item-Based协同过滤算法中的项目属性相似性度量方法转换为SVR相似度优化方法,就可以得到一种新的基于属性相似性的Item-Based协同过滤推荐算法,称之为基于SVR的协同过滤推荐算法,简称SVRBased CF。
算法1基于SVR的协同过滤推荐算法
输入:用户—项目评分矩阵R,项目属性矩阵A,最近邻居个数k,推荐集元素个数r,项目相似性平衡参数α。
输出:推荐集rec。
(1)基于用户—项目评分矩阵R,采用相关相似性计算项目i和项目j之间的评分相似性simRate(i,j)。
(2)基于项目属性矩阵A,按式(4)计算任意两个项目间的属性相似性simAttr(i,j),并建立项目属性相似性矩阵simAttr(i,j)。
(3)将simRate(i,j)与simAttr(i,j)进行线性组合,计算最终的项目相似性矩阵sim (sim为n×n方阵,其元素的值以主对角线为轴对称分布,即sim(i,j)=sim(j,i),如下所示:
(4)搜索项目相似性矩阵sim将相似度最高的若干项目作为目标项目l的邻居集合Nl={i1,i2,…,ir},并且l埸Nl
(5)根据相似邻居预测用户u对未评分项目l的评分,公式如下:
其中,Nl是项目l的邻居集合,R軍l与R軍p指项目l和p的平均评分。
(6)对用户u未评价过的项目预测评分从大到小进行排序,取前r个值对应的项组成推荐集rec={i1,i2,…,ir}进行推荐。
3实验及分析
3.1 数据集
数据集取自Movie Lens数据集[11],该数据集由明尼苏达大学Group Lens研究小组通过Movie Lens网站(http://movielens.umn.edu)收集,包含了943位用户对1 682部电影的100 000条评分数据,每位用户至少对20部电影进行了评分,所有电影分属于19种电影类别。为了分析实验数据稀疏性对算法性能的影响,本文从Movie Lens数据集上随机抽取100、200、300位用户的评分数据组成3个数据集,分别记为TDS100、TDS200、TDS300。
3.2 评价标准
评价推荐系统推荐质量的度量标准采用统计度量方法中的平均绝对偏差MAE(Mean Absolute Error)进行度量。MAE通过计算预测的用户评分与实际的用户评分之间的偏差来度量预测的准确性,MAE越小,推荐质量越高。
3.3 实验结果及分析
实验以传统Item-based协同过滤(Item-based CF)、基于属性相似性的Item-based协同过滤(Item feature-based CF)[3]以及基于属性线性加权的Item-based协同过滤 (Item feature weighted based CF)[4]为对照,检验本文提出的算法的有效性,计算各种推荐算法的MAE。实验中最近邻居个数k取30, 推荐集元素个数取10,项目相似性平衡参数α取0.6,实验结果见表2。
由表2可知,Item feature-based CF方法优于Item-based CF方法,说明在计算项目相似性的过程中考虑项目属性相似性,可以有效改善传统协同过滤算法中面临的“稀疏性”问题,提高推荐算法的推荐质量。Item feature weighted -based CF方法优于Itemfeature-based CF方法的性能,说明通过加权计算可以解决项目属性重要性不同的问题,能有效改善推荐方法的性能,而本文提出的方法的MAE值较Item feature weighted -based CF方法的MAE值有大幅度的降低,说明加入支持向量机后明显优于线性组合的特征加权,通过支持向量机回归方法改善项目属性相似性的计算,能使得项目的相似性计算更加准确,进一步提高方法的性能。
4结束语
回归优化 篇2
正交旋转回归试验优化纤维素酶发酵培养基
利用旋转回归法研究里氏木霉WX-112发酵生产纤维素酶的`两个重要因素:微晶纤维素粉(Avicel)和麸皮对滤纸酶活的影响,并拟合出回归方程.经回归分析表明,培养基中Avicel、麸皮的含量及其配比对滤纸酶活有显著影响.通过岭脊分析寻优得出:Avicel最佳浓度为1.34 g/dL、麸皮最佳浓度为3.35 g/dL,在此优化条件下滤纸酶活可达6.51 U/mL.用30 L发酵罐进行放大试验,滤纸酶活可达10.84 U/mL,CMCase达到449.57 U/mL.
作 者:郝学财 缪静 余晓斌 周洪 汤蕾 HAO Xue-cai MIAO Jing YU Xiao-bin ZHOU Hong TANG Lei 作者单位:郝学财,余晓斌,周洪,汤蕾,HAO Xue-cai,YU Xiao-bin,ZHOU Hong,TANG Lei(江南大学,生物工程学院,江苏,无锡,214036;工业生物技术教育部重点实验室,江苏,无锡,214036)缪静,MIAO Jing(鲁东大学,生命科学学院,山东,烟台,264025)
刊 名:食品与生物技术学报 ISTIC PKU英文刊名:JOURNAL OF FOOD SCIENCE AND BIOTECHNOLOGY 年,卷(期): 25(4) 分类号:Q815 关键词:纤维素酶 里氏木霉 岭脊分析 培养基优化回归生活世界 优化数学教学 篇3
教学情境的生活化,主要是通过师生合作与互动,共同捕捉生活中的数学现象,挖掘数学知识的生活背景,并把两者统一于一定的富有生活气息的情境之中,引导学生在熟悉的生活氛围中发现问题、探索问题、解决问题,在问题的逐步解决中把握数学知识与实际生活的内在联系,在运用数学方法使实际问题一一破解中感受成功的快乐和学习的乐趣。新教材的许多章节,都力求从学生熟悉的数学实例出发,选择学生身边感兴趣的事物创设情境,提出有关数学问题,从而激发学生的学习兴趣,通过实践(“试一试”)、思考(“想一想”)、探索(“猜一猜”)、交流(“议一议”)、总结(“练一练”)等学习过程来展开。这样能逐渐培养学生学习数学的兴趣,激发学生的学习潜能,提高学生的数学实践能力。
如在教学“角”的概念时,我们可借助学生都熟悉的钟表、墙角、张开的圆规等生活题材,启发学生在熟悉的生活情景中自主地提出数学问题:角有几个顶点?什么叫做角的边?角有几种……让学生体验生活中存在的数学,加深理解教材所学的内容,从而培养从实际生活中提出数学问题并加以解决的能力。
又如在学“两点确定一条直线”时可以先让一个学生(甲)站起来,然后请学生自己确定,凡是能与甲同学共线的就站起来。一开始,可能没有人站起来,不一会四面八方有人站起来,最后全班学生都站起来。学生总结:过一点的直线是不唯一的,所以每个同学都可以与甲同学共线(经过一点有无数条直线)。接着让两个学生先站起来,然后请学生自己确定,凡是能与这两个同学共线的就站起来。学生很快作出反应,站起来了一排。可以总结:两点确定一条直线,所以有且只有一排学生与这两个同学共线(经过两点有且只有一条直线)。最后让三个学生先站起来,然后请学生自己确定,凡是能与这三个同学共线的就站起来。当三个学生共线时,站起来了一斜排学生;当三个学生不英线时,最终没有一个人站起来。最后总结:经过三点可能有一条直线,也可能没有直线。这样,在轻松活跃互动的氛围中,学生理解了“两点确定一条直线”。
二、教学内容生活化,激发学生学习数学的热情
在新课程理念下,教师不再是教科书知识的解释者和忠实的执行者,而是课程资源的开发者。在教学中,教师一方面要理解教科书的编写意图、渗透的数学思想方法和理念,有效地运用好己有资源进行教学;另一方面,还要联系学生的生活实际和课程标准,对教学内容进行整合、重组、补充、加工,创造性地利用教材,充分运用学生身边的资源进行教学。教师要把数学引向生活,使教学内容充满生活气息,更加具有现实意义;使数学学习基于学生生活经验和己有数学基础,从而带来对数学学习的更大热情。
如“有理数的加法”教学时,模拟生意人,如何根据应收款、借款等计算净资产。学生激起极大兴趣,在轻松愉悦的探讨中掌握了“有理数加法法则”。又如教学“利用轴对称设计图案”时,从学生已有的经验和背景出发,精心安排不同学生依据不同生活背景进行同图案设计活动:有的学生自然会想到中国民间的剪纸艺术——先将一张纸对折,在折痕的一侧剪下一块,打开即可得到一个轴称图形的纸片;有的学生想到的是做墨迹——取一张质地较软、吸水性能较好的纸,在纸的一侧滴上一滴墨水,将纸打开、辅平,所得的图案就是轴对称图形;有的学生想到的是扎眼……不同的学生从不同的生活背景和经验出发,都能得到轴对称图形的图案,彼此交流,达到对轴对称图形本质的理解和认识的目的。
三、教学应用生活化,提高学生学习数学的能力
在数学生活化的学习过程中,教师引导学生作广泛沟通,使学生“领悟”数学源于生活又用于生活、数学有很强的应用价值这个重要道理。在数学教学中,把数学知识与生活、学习、活动有机地结合起来,通过收集资料、动手操作、合作讨论等活动,学生真正感受数学在生活中无处不在,获得探索数学的体验,提高利用数学解决实际问题的能力,让生活数学化。
如:学过“相似三角形”后,组织一次实践活动,要求学生用1米长的木尺测量操场边旗杆的高。以小组为单位协作进行。通过思考,有一组的学生在旗杆的绳索上做文章。绳索上系条带子,通过滑轮带子从最低升到最高,量出绳长,即旗杆的高度;还有一组学生把木尺笔直地竖在旗杆旁。在阳光下测出旗杆和尺的影长,应用相似三角形的知识估算出旗杆的高。随着一介个问题的解决,学生的数学生活经验日趋丰富,利用数学知识解决问题的能力不断提高,学习数学的主动性、创造性和协作性不断增强,从而实现从“要我学”向“我要学”的转变。
回归优化 篇4
1 实验部分
1.1 主要试剂与仪器
7-DAMC(98.94%,自制);对甲基苯硫氯(98.21%,自制);1,2-环氧丙烷(AR),上海凌峰化学试剂有限公司;乙醚(AR,99.5%),杭州化学试剂有限公司;二氯甲烷(AR,99.5%),杭州双林化工试剂厂分子筛4A型,国药集团化学试剂有限公司;Merecury Plus-400型核磁共振仪,Jasco FT/IR-460plus型红外光谱仪。
1.2 实验过程
在0 ℃时,将1.00 g 7-DAMC(99.94%)和7.13 g经粉碎的4A分子筛加入到45 mL二氯甲烷和10.8 mL环氧丙烷混合液中,搅拌,滴加1.09 g对甲基苯硫氯(98.21%)和15 mL二氯甲烷的混合液,滴完后升温至28 ℃,搅拌3 h,过滤后将滤液减压脱溶后,加乙醚重结晶,过滤得1.08 g淡黄色粉末状固体7-DTMC,HPLC纯度99.34%,收率89.71%。mp.149~151 ℃(文献值150~153 ℃)。
1H-NMR(CDCl3)δ:2.37(Ph-CH3中的H);3.75(3-位侧链-CH2-中H);3.85(N-CH3中H);4.27,4.45(4-位环上-CH2-中H);5.36(环上6-位-CH-中H);6.96(酯基-CH-中H);7.37(酯基苯环上H)。
1 648(—C=C—键的伸缩振动);1 495(—N=N—键的伸缩振动);
1 455,1 385(—CH3键的弯曲振动);1 089(—C—N键的伸缩振动)。
1.3 分析方法
高效液相色谱仪。流动相为20%甲醇溶液+80%的0.2 mol/L磷酸盐水溶液,检测波长254 nm,流速1.0 mL/min,柱温25 ℃。
2 回归正交实验设计
本实验部分以7-DAMC和TSC为原料、4Å分子筛为脱水剂、环氧丙烷为催化剂和二氯甲烷为溶剂合成中间体7-DTMC。在已有实验数据基础上[8],通过对物料配比和精制溶剂种类筛选等得到合成7-DTMC的稳定工艺条件。
2.1 因素水平编码表
通过对合成7-DTMC条件实验的初步探索,下面对以下4个主要指标进行了考察:x1为反应温度(℃);x2为物料配比(TSC与7-DAMC的摩尔比);x3为反应时间(h);x4为催化剂环氧丙烷(mL)。由于因素数m=4,如果取零水平试验次数m0=2,二水平试验次数mc=8(即做四元二次(1/2实施)回归正交),根据星号臂长γ的计算公式得γ=1.414。因素水平编码可以通过水平编码计算公式Zj=(xj-xj0)/Δj计算得到。其中xj0=(xj1+xj2)/2=(xjr+x-jr)/2(xj2和xj1分别表示因素xj的上下水平,xj0为零水平,xjγ和x-jγ为因素xj的上下星号臂水平(即因素xj的上下限)。
m为因素数;m0为零水平试验次数;mc为二水平试验次数。
对以上四个因素分别编码后,得到表1。
注:7-DAMC投料量为1.41 mmol。
2.2 正交组合设计
由于因素数m=4,可以选用正交表L8(27)进行变换,二水平试验次数mc=8,星号试验的次数为2m=8。试验方案见表2。
根据四元二次回归正交组合设计的要求,根据公式
y为产物的粗产量;y为产物的纯度;y为纯的产物的产量。
(1)回归方程的建立
通过对四元二次回归正交组合设计计算得到
根据下列的回归系数计算公式及表3中数据计算各回归系数。
得:a=52.47;b1=-0.89,b2=3.83,b3=-0.83,b4=0.67;
b12=-2.07,b13=-0.97,b14=0.41,b23=0.41,b34=-2.07;
b11=1.77,b22=-0.62,b33=0.04,b44=-0.62。
得到回归方程:
y=52.47-0.89z1+3.83z2-0.83z3+0.67z4-2.07z1z2
-0.97z2z3+0.41z1z4+0.41z2z3-2.07z3zv4+1.77z′1
-0.62z′2+0.04z′3-0.62z′4
(2)回归方程及偏回归系数的显著性检验
根据下列计算公式计算得到方差
其他SS2等计算结果类似,方差分析结果见表4。
注:F0.05(1,4)=7.71, F0.01(1,4)=21.20, F0.01(13,4)=24.05。
方差分析结果表明,所建立得回归方程以及各偏回归系数部分不显著。将其归入残差平方和中。重新计算得新的方差分析结果表5。
注:F0.05(1,9)=5.12, F0.01(1,9)=10.56, F0.01(8,9)=5.47。
所以规范变量与试验指标y之间的回归关系式修改为:
y=52.47-0.89z1+3.83z2-0.83z3+0.67z4-2.07z1z2-0.97z1z3-2.07z3z4 +1.77z′1
(3)失拟性检验
检验结果表明,失拟不显著,回归模型与实际情况拟合得很好。
(4)回归方程的回代
由二次项中心化公式
代入回归方程,则有:
y=51.28-0.89z1+3.83z2-0.83z3+0.67z4-2.07z1z2-0.97z1z3-2.07z3z4+1.77z
根据编码公式:
得回归方程为:
y=0.035x
3 调优试验
3.1 最优试验方案的确定
根据极值必要条件:
3.2 稳定试验阶段
根据正交试验的结果,在优化实验条件x1=28.27,x2=3.38,x3=3.04,x4=4.94进行稳定试验,7-DTMC收率89.71%,HPLC纯度99.34%。发现采用回归正交优化的工艺条件进行稳定试验,产品收率有了提高。
4 结 论
(1)从正交回归的计算和分析中可看出,合成7-DTMC受各因素影响大小顺序为:反应温度>反应时间>催化剂用量>原料物料配比。另外,四大因素的两两相互交互作用也对产品收率有很大的影响。
回归优化 篇5
1 陶瓷过滤机运行原理
磷矿浆脱水中试采用核工业烟台同兴实业有限公司生产的小型陶瓷过滤机,陶瓷过滤机运转一周,完成4个工作过程[2,3]。第一个过程:在吸浆(料)区,完成吸料过程;第二个过程:在干燥区,完成二次脱水干燥工作;第三个过程:在卸料区,完成卸料过程;第四个过程:在清洗区,完成对微孔陶瓷过滤板的反冲洗工作。
陶瓷过滤机与盘式真空过滤机的工作原理相类似,即在压强差的作用下,悬浮液通过过滤介质时,颗粒被截留在介质表面形成滤饼,而液体则通过过滤介质流出,达到了固液分离的目的。其不同之处在于过滤介质—陶瓷过滤板具有产生毛细效应的微孔,使微孔中的毛细作用力大于真空所施加的力,使微孔始终保持充满液体状态,无论在什么情况下,陶瓷过滤板不允许空气透过,由于没有空气透过,固液分离时能耗低、真空度高。
2 回归分析
2.1 中试试验数据收集
参数测试是按日常生产操作条件,试验人员按预先设计好的表格随机抽样测试,测试不同参数(过滤机搅拌器频率、主轴频率、矿浆含固量等)条件下对应的过滤后的矿浆滤饼水分值。然后根据测试情况分类整理出25组数据。见表1。
2.2 数据分析及处理
运用相关软件进行多元线性回归(过程中选取95%置信水平),得出如下回归方程:
式(1)的相关系数为0.857,其方差分析见表2,由方差分析可知,对于给定的α=0.05(95%置信度),回归方程F统计量(13.820)≥F临界值(2.866),表明回归方程具有统计学意义,线性回归方程显著。
从式(1)可以直观的得出,因变量Y与自变量X1、X4呈负相关,与自变量X2、X3呈正相关。
对回归方程各自变量进行方差分析见表3,发现X1自变量F统计量(0.612)≤F临界值(4.351),表明X1自变量于因变量相关关系不显著;X2自变量F统计量(8.705)≥F临界值(4.351),表明X2自变量于因变量相关关系显著;X3自变量F统计量(5.384)≥F临界值(4.351),表明X3自变量于因变量相关关系显著;X4自变量F统计量(0.137)≤F临界值(4.351),表明X4自变量于因变量相关关系不显著。
从以上回归分析可知,回归方程式(1)中因变量Y与自变量X2、X3显著,且为正相关,即主轴频率X2与矿浆含固量X3是影响滤饼含水量的要因,为得到更低含水量的滤饼,可重点通过调低主轴频率X2与矿浆含固量X3来实现。
中试试验中为有效降低滤饼含水量,将搅拌器频率X1为50Hz(以保证矿浆混合均匀),主轴频率X2调低至下限13Hz,矿浆含固量X3调低至下限50%,矿浆细度(100目)X4为76%,此时,根据回归分析得出回归方程式(1),滤饼含水量理论值Y=4.436-0.024×50+0.122×13+0.267×50-0.05×76=14.37%,中试试验中该参数条件下滤饼含水量为14.63%,基本相符。
试生产过程中,通过重点调整主轴频率X2与矿浆含固量X3两个参数,在过滤机正常运行的条件下,滤饼水分基本低于15%(均值14.75%),取得较为良好的应用效果。
3 结语
运用中试历史数据,建立了滤饼含水量与将搅拌器频率、主轴频率、矿浆含固量、矿浆细度自变量相关函数关系式,运用方差分析识别出相关关系显著的主轴频率与矿浆含固量,通过重点调整主轴频率等参数,在过滤机正常运行的条件下,滤饼水分基本低于15%(均值14.75%),取得较为良好的应用效果。
摘要:借助线性回归技术,运用历史数据建立了磷矿浆滤饼含水量与搅拌器频率、主轴频率、矿浆含固量、矿浆细度自变量相关的线性回归模型,借以预测不同运行参数下的结果值,并可甄别出影响磷矿浆滤饼含水量的主要因素。将结果运用于磷矿浆脱水试验,滤饼水分基本低于15%(均值14.75%),达到了预期的效果。
关键词:线性回归,磷矿浆,过滤
参考文献
[1]宋莹,邓甦.多元线性回归分析在固定资产投资中的应用[J].沈阳师范大学学报(自然科学版).2008(2):160-162.
[2]谢蓬根,刘广龙.金川镍矿选矿厂精矿过滤实践与发展[J].有色金属.2001(1):25-30.
回归优化 篇6
近年来,许多学者对挤压成形进行了大量的深入研究。王忠堂等[1]用主应力法研究了管材挤压力的理论计算方法;陈昆等[2]运用有限元理论,提出了钢管热挤压力的古布金公式的修正方法;倪正顺等[3]从热力耦合角度出发,运用有限元软件进行分析计算,以模具寿命为目标进行模具结构的优化设计;石峰等[4]以挤压制品损伤值为目标,用数值模拟技术建立了冷挤压模具结构参数的优化模型,运用神经网络、遗传算法等优化技术进行了优化计算。
对于企业日常的挤压生产工艺设计来说,生产设备、工模具、坯料等因素往往是确定的,它们的结构和性能参数一般作为常量处理;设计变量多数是工艺参数,如挤压速度、挤压温度、挤压比、润滑条件等。挤压工艺设计不仅要考虑设备、工模具的安全可靠,也要注重产品质量和能源消耗等指标。工艺设计的目的就是在设备、工模具安全可靠的提前下,实现优质、高效、低耗的综合效益最优。单一目标的优化设计片面追求某一方面的指标最优,忽略其他指标的要求,得到的优化方案往往是不经济的,甚至是不可行的。鉴于上述分析,本文结合正交试验理论、有限元技术和优化技术,提出以工艺参数为设计参数,以挤压力和损伤值为指标的多目标优化函数,用改进的遗传算法进行优化计算,并用铅黄铜(HPb59-1)棒材热挤压工艺参数多目标优化设计案例验证了本文优化算法的可行性。
1 热挤压工艺优化设计技术框架
以大型数值计算软件MATLAB为支撑,集成参数化造型软件Pro/E、材料成形过程模拟软件DEFORM构建金属塑性成形工艺优化设计技术平台,如图1所示。以挤压工艺参数为因素,以挤压力、损伤值为指标进行正交试验。数值模拟试验代替物理模拟试验可获取更多的指标与因素之间的信息,用大型数据处理软件MATLAB对试验样本进行回归分析,可得到挤压力、损伤值与挤压工艺参数的回归模型。用遗传算法进行多目标优化运算,得到最优解。
2 热挤压成形过程数值模拟试验
2.1 热挤压成形三维实体模型
因不研究挤压设备与工模具的工作状态,故简化热挤压成形三维实体模型。根据圆棒挤压的对称性,对工件的1/4部分成形过程进行数值模拟。忽略挤压杆,把挤压垫看作主动工具(图2)。挤压垫直径为200mm,厚5mm;挤压筒外径为220mm,内径为200mm;挤压模采用45°锥模,外径为220mm,长150mm,定径带长15mm,模孔直径由挤压制品热直径确定。为减小运算量,缩短模拟时间,坯料长度取75mm。考虑热膨胀等因素的影响,坯料直径应该略小于挤压筒内径,取198mm。本设计方案坯料尺寸固定不变,通过挤压比计算制品直径。
2.2 热挤压成形过程数值模拟方案
铅黄铜Hb59-1热挤压初始温度在580~630℃之间,范围较窄[5]。因此,坯料初始温度的变化对挤压状态影响不大。本文选择坯料与工模具之间的摩擦因子x1、挤压杆速度(挤压垫速度)x2、挤压比x3三个参数为试验因素,每个因素取5个水平。根据文献[5]给出的各因素水平范围,确定模拟试验方案,如表1所示,括号内的数据是挤压比。
2.3 热挤压成形过程DEFORM模拟
工件设为刚塑体,初始温度设为630℃,采用四节点四面体单元划分网格,网格最小边长2mm,最大边长3mm。工模具视为刚性体,预热温度设为400℃。环境温度为20℃,铅黄铜辐射率为0.6,对流换热系数为50W/(m2·K),接触热传热系数为6kW/(m2·K)。模拟控制采用的增量步为主动工具(挤压垫)的位移,步长为1mm,模拟终止条件为位移达到75mm。对表1中30种试验方案依次进行热力耦合模拟试验,在DEFORM后处理中运用数据导出功能将每步的挤压力、损伤值输出备用。
3 热挤压数值模拟试验数据处理与分析
运用MATLAB软件对DEFORM模拟结果中的数据进行处理,提取出每种试验方案下的最大挤压力y1和最大损伤值y2,结果如表2所示。
采用多元非线性回归法,分别建立挤压力、损伤值与摩擦因子、挤压速度、挤压比之间的拟合数学模型。多元二次非线性回归拟合数学关系方程[6,6,7]为
i=1,2,…,n-1
式中,a为代定多项式系数;n为设计变量数;xj、xi为自变量;y为因变量。
铅黄铜棒热挤压模拟试验数据回归分析的自变量有摩擦因子x1、挤压速度x2和挤压比x3,样本数据如表1所示。因变量y1和y2的样本数据如表2所示。运用MATLAB软件数值计算,分别得到挤压力、损伤值与摩擦因子、挤压速度和挤压比的多元非线性回归方程如下:
其中,式(2)是挤压力回归方程,式(3)是损伤值回归方程。
4 热挤压工艺优化设计
4.1 热挤压工艺优化模型
热挤压力是一个重要参数,它不仅决定了成形过程的能量消耗,同时也是判断设备是否过载、工模具强度是否满足要求的直接依据。一般要求挤压成形过程中最大挤压力Fmax不能超过设备额定载荷。因此,定义最大挤压力为优化设计的一个子目标函数:f1(X)=Fmax,X=(x1,x2,x3),数学模型就是式(2),即f1(X)=y1。由于各种因素的影响,热挤压成形时,制品可能出现断裂。DEFORM软件用损伤值表示单元(质点)断裂的可能性,用所有单元的最大损伤值Dmax作为衡量制品变形损伤的指标,当Dmax小于材料的临界破坏值时,Dmax越小则成形性能越好,断裂可能性越低。将制品内部最大损伤值定义为挤压优化设计的第二个子目标函数:f2(X)=Dmax,数学模型就是式(3),即f2(X)=y2。
本文采用线性加权和法设计评价函数,该方法的关键在于合理选择加权系数wi,以反映各个子目标函数对整个评价函数的重要程度。本文认为热挤压成形的挤压力、损伤值同等重要,使用以下方法计算加权系数:
wi=1/f*i(X)=1/(min fi(X)) i=1,2,…,l
式中,wi为第i个子目标函数的加权系数;f*i(X)为第i个子目标函数的单目标最优值;l为子目标个数。
这种方法可避免多目标优化过程中出现“大数吃小数”的现象发生。根据计算得到子目标的单目标最优值分别为f*1(X)=0.4708,f*2(X)=0.2291。因此,铅黄铜棒热挤压成形工艺优化问题的数学模型表示如下:
min F(X)=f1(X)/0.4708+f2(X)/0.2291
s.t. 0.1≤x1≤0.6,20≤x2≤50,10≤x3≤40
4.2 热挤压工艺优化算法
上述优化问题是二次连续非线性函数优化问题,主要算法有拟牛顿法和约束变尺度法等[8]。这些算法搜索能力强,迭代次数少,但需要计算梯度、构造矩阵,算法复杂;对于多峰值函数优化问题往往陷入局部最优。本文采用全局搜索能力较强的遗传算法实现二次规划问题的求解。对基本GA算法进行改进,以满足工程设计实际需要。
连续变量的GA编码有二进制法和实数法等。鉴于二进制编码的Hamming距离大、编码串长、计算量和存储量大等缺点[9],选用实数编码法。编码算法如下:
[x1x2x3 … xn] %一个编码串;
mi=ai+rand(1)*(bi-ai),i=1,2,3,…,n;
%mi是中间变量;
xi=round(mi*10∧ki)/10∧ki,i=1,2,3,…,n
式中,n为基因位数即设计变形量个数;xi为第i个设计变量;[ai,bi]为xi取值空间;ki为xi的精度要求。
采用轮盘赌法选择、外部单点交叉、动态变异等GA操作,并实行保优策略。为克服早熟问题,引入种群突变机制[10]。
4.3 热挤压工艺优化算法仿真
热挤压工艺参数中摩擦因子精度取0.1,挤压比精度取0.01,挤压速度取1mm/s。种群规模取100,遗传代数取50,初始交叉概率取0.3,初始变异概率取0.08。运用MATLAB编程进行GA运算,铅黄铜棒热挤压工艺多目标优化和单目标优化的结果如表3所示。可以看出,热挤压工艺优化问题中单目标优化的最优点不能重叠,即不能同时达到最优解,甚至有时还会产生完全对立的情况。这就需要在各个目标的最优解之间进行协调,相互作出“让步”,以便取得整体最优方案(图3)。
5 结束语
本文运用数值模拟试验代替传统的物理模拟试验研究了热挤压工艺优化模型,在此基础上进行GA优化运算,给出了多目标和单目标下的各自最优解。本文工艺优化设计的研究方案和算法能有效提高工艺优化设计效率,缩短产品开发周期,这不仅适用于HPb59-1棒材热挤压成形工艺优化,也适用于其他金属和其他塑性成形工艺优化。
参考文献
[1]王忠堂,郑洁,张士宏,等.管材挤压力能参数物理模型[J].塑性工程学报,2003,10(4):49-50.
[2]陈昆,张博,陈定方,等.钢管热挤压中的挤压力研究[J].装备制造技术,2008(3):1-3.
[3]倪正顺,帅词俊,钟掘,等.基于热力耦合的热挤压模具结构参数优化设计[J].中国机械工程,2004,15(7):757-760.
[5]石峰,娄臻亮,张永清.基于遗传算法和神经网络的冷挤压工艺参数模糊优化设计[J].机械工程学报,2002,38(8):45-49.
[6]马怀宪.金属塑性加工学:挤压、拉拔与管材冷轧[M].北京:冶金工业出版社,1991.
[6]马怀宪,史乃安.LY12铝合金棒润滑热挤压的数学模型[J].稀有金属材料与工程,1990(3):42-46.
[7]赵茂俞,薛克敏,李萍.多元非线性回归的铝合金覆盖件成形模拟优化设计[J].农业机械学报,2009,39(9):166-169.
[8]陈学文,王进,陈军,等.热锻成形过程数值模拟与多目标设计优化技术研究[J].塑性工程学报,2005,12(4):80-84.
[9]陈伦军,罗延科,陈海红,等.机械优化设计遗传算法[M].北京:机械工业出版社,2005.
回归优化 篇7
大豆含有丰富的蛋白质、碳水化合物、脂肪、维生素和多种微量元素等。豆粕是大豆经过提取豆油后得到的一种副产品,其蛋白质含量为40%~48%[1,2,3]。豆粕蛋白经酸水解后得到的氨基酸,可作为食品添加剂、叶面喷肥及饲料添加剂等[4,5,6,7]。
蛋白质水解工艺主要有酶水解、盐酸水解和硫酸水解。酶水解的主要优点是条件温和,缺点是酶制剂成本高、水解条件较复杂、杂菌易繁殖和水解时间长等[8,9];盐酸水解的主要优点是水解迅速,缺点是污染环境、腐蚀设备及脱酸运行费用高等[10,11];硫酸水解的主要优点是水解迅速、硫酸无挥发性且成本较低,缺点与盐酸水解类似[12,13]。
关于豆粕提取氨基酸的研究,前人大都采用酶法水解,运用硫酸法水解的迄今仅有高压水解釜水解[12]和回馏装置水解[14]两篇报道,前者利用正交实验设计并对实验结果进行直观分析,后者仅进行单因素实验研究,二者均属较简单的研究探讨。本研究采用干燥箱进行硫酸水解,首次采用二次回归正交旋转组合设计对豆粕中氨基酸的提取工艺进行优化,得到最佳提取工艺的数学模型。
1 材料与方法
1.1 材料、试剂和仪器
① 豆粕:福建元成豆业有限公司。
② 浓硫酸、氢氧化钠、37%甲醛溶液等,所用试剂均为国产分析纯。
③ 多功能粉碎机(SB-02),上海市浦恒信息科技有限公司;电热恒温鼓风干燥箱(DH6-924385-Ⅲ),上海新苗医疗器械制造有限公司;电子天平(SARTORIUS BS124),北京赛多利斯仪器系统有限公司;磁力搅拌器(HR1797/BC),PHILIPS公司;pH计(MODEL 520A),ORION RESEARCH公司。
1.2 实验方法
豆粕经粉碎后过40目筛,置于60℃烘箱中干燥12 h,储存于干燥器中。选取液固比、硫酸浓度、提取时间和提取温度四个因素进行考察,以氨氮得率作为考察指标,先进行单因素实验,再采用二次回归正交旋转组合设计法对硫酸水解豆粕制备复合氨基酸的工艺条件进行优化。每个样品称取1.00 g豆粕于比色管中,根据实验设计方案加入一定体积一定浓度的硫酸浓液,然后搅拌均匀,再置于一定温度的干燥箱水解一定时间,每次实验配置3个平行.水解完毕,自然冷却至室温,用4 mol·L-1 NaOH溶液将pH调至4.0,减压抽滤,并洗涤废渣,将洗涤液并入滤液中,转入250 mL的容量瓶中,得到深褐色的复合氨基酸溶液。
1.3 分析方法
以豆粕中氨氮得率为考察指标,豆粕中氨基态氮的测定采用甲醛滴定法[15]。计算公式如下:
undefined
式中,X:试样中氨氮的含量(mg·mL-1);V:加入甲醛后耗用氢氧化钠标准溶液的体积(mL);V0:空白试验加入甲醛后耗用氢氧化钠标准溶液体积(mL);V1:试剂稀释液取用量(mL);V2:豆粕中氨基酸水解液的总体积(mL);CN:氢氧化钠标准滴定溶液的浓度(mol·L-1);0.014:与1.00 mL氢氧化钠标准滴定溶液相当的氮的质量(g);Y:氨氮得率(mg·g-1);m:水解称取的豆粕的质量(g)。
2 结果与讨论
2.1 液固比对提取效果的影响
选取硫酸浓度3.0 mol·L-1、水解温度120℃和水解时间12 h,研究不同的液固比(V硫酸∶m豆粕质量, mL∶g)对提取效果的影响。结果如图1所示,在液固比为10∶1时,硫酸用量少,溶液体积较小,反应物浓度较高,使得反应进行得不充分,氨基酸产生量较少;液固比在10∶1~25∶1时,随着硫酸体积比例的增加,氨基酸产生量也随着增加;在液固比25∶1时,氨基酸积累量达到最大值,超过此液固比时,氨基酸积累量迅速减少,推测可能的原因主要是硫酸用量过大,导致水解产生副反应增多,氨氮积累量下降[13]。因此本研究选择液固比25∶1进行正交实验。
2.2 硫酸浓度对提取效果的影响
选取液固比25∶1、水解温度120℃和水解时间12 h,研究不同硫酸浓度对提取效果的影响。结果如图2所示,硫酸浓度在2~3 mol·L-1时,氨氮得率急速上升,3~6 mol·L-1时,氨氮得率缓慢且稳定上升,上升幅度较小,当浓度超过6.0 mol·L-1以后,氨氮得率反而有下降趋势。这主要是因为硫酸浓度在2 mol·L-1时,浓度较低,水解不完全,氨氮得率较小;当硫酸浓度达到3~5 mol·L-1时,说明硫酸浓度已经足够水解豆粕中的氨基酸,在此范围内,氨氮得率增加不明显;当硫酸浓度超过6.0 mol·L-1时,氨基酸在高温条件下发生脱羧反应,损失了氨基酸,导致氨基酸积累量减少,使得氨氮得率有所下降;且硫酸使用量过多时,会导致中和时沉淀量增多[16],因此硫酸浓度为3.0~7.0 mol·L-1较为合适。
2.3 提取时间对提取效果的影响
选取液固比25∶1、硫酸浓度5.0 mol·L-1和水解温度120℃,研究不同提取时间对提取效果的影响。结果如图3所示,提取时间在6~12 h时,氨氮得率随着提取时间的延长而迅速增大,12 h后增加速度减慢,约在20 h时氨氮得率达到最大值。提取时间超过20 h后,氨氮得率逐渐减小。此结果说明水解时间达到20 h以后,氨氮浓度积累至最大值,再继续水解,氨基酸更容易发生脱羧反应产生胺类及发生脱氨基反应产生氨[17],从而使水解液中氨氮含量减少。但时间过短,水解不完全,氨氮含量也不高[16]。实验表明,水解时间选择16~24 h较为合适。
2.4 提取温度对提取效果的影响
选取液固比25∶1、硫酸浓度5.0 mol·L-1和水解时间20 h,研究不同提取温度对提取效果的影响。结果如图4所示,水解温度在90~120℃时,氨氮得率随着温度的增加而增加,说明随着温度的升高,水解反应越激烈,水解越彻底;但当温度超过120℃以后,氨氮得率反而随着温度的增加而下降,推测可能的原因是游离氨基酸的氨基与豆粕中少量糖份中的醛基发生美拉德反应及氨基酸的脱酸反应,致使水解液中总氨氮含量减少。且温度越高,美拉德反应和脱酸反应越激烈,其反应产物会影响水解液的风味[18],因此水解温度选择110~140℃较为合适。
2.5 豆粕氨基酸最佳提取条件的确定
2.5.1 二次回归正交选择组合设计
根据单因素实验结果,选定液固比为25∶1,选取硫酸浓度、提取时间和提取温度三个因素的适宜范围分别为3.0~7.0 mol·L-1、16~24 h和110~140℃,进行二次回归正交旋转组合设计实验[19,20,21,22,23]。设三个因素分别为z1,z2,z3,其中第j个因素zj的上下界分别为z2j和z1j(j=1, 2, 3)。再令:
undefined
对因素作线性变换:
undefined
则变量xj的变化范围为[-1.682, 1.682],如表1所示。
实验次数为N=23,其中零水平实验重复次数为m0=9,星号臂r=1.682,对平方项xundefined进行中心化处理,即对xundefined进行如下线性变换:
undefined
作出三因素二次回归正交旋转组合设计[24]结构矩阵并计算,见表2。
用Excel软件处理表2数据,得到回归方程:
undefined
2.5.2 回归方程及回归系数的检验
由表3可知,x1x2和x′1在α=0.05水平上显著,x′3项在α=0.01水平上高度显著。回归方程在α=0.01水平上高度显著。通过对回归系数的显著性检验可知,影响氨氮得率的主次顺序为x1>x2>x3,即硫酸浓度>提取时间>提取温度。把回归方程中不显著项归入误差项,则回归方程变为:
undefined
失拟性检验:在中心点处有9次重复实验,实验结果分别为y01、y02……y09,用由此产生的误差平方和S误对失拟评分和Slf及他们的自由度f误和flf进行检验,如下所示:
undefined
说明失拟误差基本由实验误差引起。对中心点实验进行误差分析得出最大误差为4.69%,平均误差为2.16%,为可接受范围。
注:*差异显著,p<0.05,**差异极显著,p<0.01
2.5.3 最佳提取工艺条件的确定
由中心化处理公式(6)可得:
undefined
将公式(10)和(11)代入方程(8)可得到变换后的方程:
undefined
根据编码公式(5)对因素进行还原得到回归方程:
undefined
对方程(13)求解得到最佳条件z1=3.1、z2=16.0和z3=125.0,即最优工艺条件为硫酸浓度3.1 mol·L-1、提取时间16 h和提取温度125℃,代入方程求得氨氮得率为59.7 mg·g-1。以此最优工艺条件进行验证实验,求得氨氮得率为59.9 mg·g-1,与理论值相对误差为0.3%,说明拟合结果较好。
3 讨 论
本研究应用二次回归正交旋转组合设计法对提取效果进行优化[25,26],不仅考虑了各个因素的独立作用,还考虑了各个因素间的交互作用,因此有更高的实验精密度[24]。本研究对方差分析结果用F检验法进行检验,剔除不显著项后得到含有编码变量的方程(8)中有x1x2、x12和x32三个显著项,而还原后的含有实际变量的方程(13)中有z1、z2、z3、z1z2、z12和z32六个显著项,由此可知,对实验结果进行分析时,不能只看单个因素对实验结果的影响,应该同时考虑各个因素之间的交互作用,这样可以减少预测值与实际值的误差。
回归优化 篇8
在管道油气输运中,随着高压大管径管道的用量增多,与此相关的管道安全评定成为一个研究热点,特别是对缺陷管道疲劳寿命的预测分析,由于可利用的数据和信息非常有限,以致缺少管道材料特别是缺少实际管道疲劳裂纹扩展规律和小试样与实际管道疲劳裂纹扩展相关性试验研究的数据[1]。相关文献认为油气输送管的疲劳断裂是由管线中的各种交变应力引起的。这些交变应力有些来自于管内输送压力的波动和气体介质的分层结构,也有些来自于管线外部的变动载荷,这些因素均会产生交变应力,使钢管内部和表面的缺陷发生扩展,最终造成管道的疲劳断裂。由于疲劳断裂往往是突然发生的,没有预先征兆,因而具有较大的危险性,尤其对于天然气高压长输管线,其危害性更是显而易见[2]。
为了建立油气输送缺陷管道疲劳寿命的预测模型,以便及时判断疲劳断裂时限,或适当地调节传输工艺参数,以延长油气输送缺陷管道的使用寿命。为此,本文建立了基于二阶粒子群优化的支持向量机的油气输送缺陷管道疲劳寿命预测模型。支持向量机( support vector machines,SVM) 是一种基于结构风险最小化原理的机器学习技术,能较好地解决小样本、非线性、高维数和局部极小点等问题,具有非常优异的预测推广能力。支持向量机中的惩罚因子C和核函数参数 σ 等直接影响着模型的预测精度。拟采用二阶粒子群算法优化C,σ 等参数,并且利用采集到的20组油气输送带缺陷管道样本数据建模和测试模型。测试结果和性能评价指标表明基于二阶粒子群优化的支持向量机回归油气输送带缺陷管道预测模型,具有很高的精确度和非常好的泛化能力。
1 支持向量机的回归算法
设含有l个数据的集合为{ ( xi,yi) i = 1,2,…,l} ,其中xi( ∈Rd) 是第i个训练样本的输入列向量,xi=[xi1,x12i,…,xid]T,yi∈R为对应的输出值。
设在高维特征空间中建立的线性回归函数为
其中 Φ( x) 为非线性映射函数,w表示权重,b表示偏差。
引入松弛因子,原问题转化为[3 - 5]:
式中 ε 表示不敏感损失系数; C为惩罚因子,C越大表示对训练误差大于 ε 的样本惩罚越大,ε 规定了回归函数的误差要求,ε 越小表示回归函数的误差越小。
上述模型对应的对偶形式:
其中: K( xi,xj) = ф( xi) ф( xJ) 为核函数,本文选取应用广泛、精度较高的RBF核函数,其表达式为:
通过( 3) 得最优解 α =[α1,α2,…,αl],α*= [α1*,α2*,…,αl*],并据此求出权重w*和偏差b*,最后得出支持向量机的回归函数:
2 二阶粒子群算法
粒子群优化算法( PSO算法) 是一种基于群体智能的并行优化算法,具有依赖经验参数少、运算速度快、搜索能力强等优点。在标准PSO算法中,微粒的飞行速度仅仅是微粒当前位置的函数,没有体现位置信息; 而二阶粒子群算法中微粒飞行速度的变化充分考虑了微粒位置的变化,利用微粒位置变化来更新微粒速度,增加了粒子群的多样性,避免了搜索的趋同性,能够有效地跳出局部极小值[5]。具体步骤如下:
( 1) 随机初始化种群中各微粒的位置和速度;
( 2) 评价每个微粒的适应度,将当前各微粒的位置和适应值存储在各微粒的pbest中,将所有pbest中适应值最优个体的位置和适应值存储于gbest中;
( 3) 根据下面的方程对微粒的速度和位置进行进化:
( 4) 对每个微粒,将其适应值与其经历过的最好位置作比较,如果较好,则将其作为当前的最好位置;
( 5) 比较当前所有pbest和gbest的值,更新gbest;
( 6) 若满足停止条件( 通常为预设的运算精度或迭代次数) ,搜索停止,输出结果,否则返回( 3) 继续搜索。
要注意的是,为保证算法的性能,c1+ c2的值最好在2 附近。
3 模型建立和测试
3. 1 带缺陷压力油气管道试验样本数据
某天然气管道公司对持续运行10 年左右的带缺陷压力油气管道进行检测。通过实际测定,得到表1 的数据。其中x1为管外径,x2壁厚,x3为深度,x4为长度,x5为温度,x6为压力,y为疲劳寿命。
3. 2 模型参数优化
二阶粒子群算法中相关参数设置为: c1= c2= 1,种群规模为20、算法的停止条件是最大迭代次数200。C( 惩罚因子) 取值范围是[0. 1,100],设不敏感损失系数初值 ε = 10- 3,σ2的取值范围是( 0. 1,1 000],粒子的维数为2,其它参数值取默认值。取前28 组数据建立模型,后5 组数据进行测试。适应度函数为:
式中yi为第i个样本的实际值,为第i个样本的预测值,n为样本数目。由于数据集中各变量的差异较大,不属于同一个数量级,因此在建立回归模型之前,先对数据进行归一化。通过试算( MATLAB程序[6 - 7]) 得出最优参数C = 84. 933 044 316 767 0,σ2= 81. 215 108 992 997 1
训练集和测试集样本的预测仿真效果见图1 和图2。
从图1 和图2 可以看出,训练集和测试集的均方误差分别0. 000 104 91和0. 000 099 407,决定系数分别达到0. 999 85 和0. 998 82,表明所建立的SVR回归模型具有非常好的泛化能力。
测试集样本的预测值见表2。
4 性能对比
为了对比SVR回归模型的性能,这里将之与BP神经网络对比。与图1 和图2 对应的训练集和测试集相同,建立的BP神经网络[8]对测试集的预测结果如图3 所示。
图3 与图1 和图2 对比,不难发现,SVR回归模型的性能要明显优于BP神经网络。
5 结束语
用粒子群智能算法优化支持向量机的回归参数,可以避免按经验选取输入参数的盲目性,有效地提高了预测速度和精度。实例仿真结果表明用基于二阶粒子群优化的支持向量机回归对带缺陷压力油气管道疲劳寿命预测具有很高的精确度,远优于BP神经网络的预测结果。
摘要:针对带缺陷管道疲劳寿命的预测分析,提出了利用二阶粒子群优化的支持向量机的管道疲劳寿命预测方法。利用粒子群智能算法优化支持向量机的回归参数,可以避免按经验选取输入参数的盲目性,能有效地提高预测速度和精度。实例仿真结果表明用该方法对管道疲劳寿命预测具有很高的精确度,远优于BP神经网络的预测结果。
相关文章:
防腐倡廉02-05
使用权出让02-05
数字电视信号自动切换控制的研究02-05
探究分析铁路信号施工质量控制02-05
海信信号控制系统02-05
阿甘正传观后感心得体会02-05
当代中国慈善观的建立与发展论文02-05
购房补充合同格式02-05
一问责八清理民主生活会专题报告02-05
质量员述职02-05