经验小波(精选五篇)
经验小波 篇1
时间序列是每隔特定时间出现的按照时间顺序排列的一组数据,广泛存在于工业工程控制、故障诊断、天气预报和经济预测等领域。早期的时间序列预测分析方法绝大部分是通过构建线性模型来“捕获”训练集的规律,然后利用该规律进行预测。比如常见的ARMA模型[1],取得了较好的效果。但在实际问题中,人们更常见的是非线性、非平稳时间序列。
目前,BP神经网络、小波神经网络和经验模态分解三种方法被广泛应用于非线性、非平稳性时间序列预测。BP神经网络具有网络结构简单、非线性映射能力和自学习性较强等优势,但是BP神经网络预测模型易出现局部极小值问题,且精度不尽理想[2]。WNN是继BP神经网络之后,在非线性、非平稳时间序列预测中得到广泛应用的一种模型。其结合了人工神经网络和小波变换各自的特点,把小波变换应用到人工神经网络中,具备BP神经网络的自学习能力和小波变换局部化等优点[3,4,5],能够有效解决局部极小值问题。但是在实际生活生产中,发现其存在小波分解无法实现的自适应多分辨率分析的问题[6,7]。针对该问题,部分学者通过引入遗传算法、粒子群算法等对WNN的参数进行优化。这些解决方案本质上是对WNN本身进行优化,以期达到克服自身缺陷、提高精度的目的。但是,优化后的WNN模型预测精度不尽理想,其预测精度还具有提高的空间。EMD在信号处理和分析中的有效性得到了验证[8,9],具有直接、简单和自适应的良好特性,很好地弥补了小波神经网络自适应多分辨率的缺陷。理论上,EMD算法可以解决所有类型信号的分解问题,其在处理非线性、非平稳信号上,具有较强优势[10,11,12],然而也存在模态混叠的不足[13]。单个预测方法往往都有各自的不足,为了充分利用多个方法的优势,提高预测精准度,产生了组合多个方法进行预测的思想。Jain等人验证了组合方法可以提高时间序列的预测精准度[14]。郝凤龙等人证实了EMD与小波变换组合模型的有效性和科学性[15]。
鉴于此,本文基于EMD和小波变换各自的特性,采用组合模型的思想,提出了基于经验模态分解的小波神经网络预测模型,以期在非线性、非平稳时间序列预测中得到更加理想的拟合精度和预测精度。
1 基本理论概述
1.1 BP神经网络
BP神经网络是一种采用最小二乘法求解误差函数最小值的多层前馈式网络,其隐含层的激励函数是S型正切函数。BP网络的学习过程包括输入信号的正向传播过程和误差的反向传播过程。两个学习过程反复进行,不断在相对误差函数梯度下降的方向计算各个网络节点的权值和偏差,得到变化结果,逐步实现目标。常见的BP神经网络结构为输入层、隐含层(大于等于1个)和输出层。
1.2 小波神经网络
小波神经网络WNN是一种以BP神经网络和小波理论为基础,把小波基函数作为隐含层激励函数的多层前馈神经网络。WNN具有信号向前传播的同时误差向后传播的特点。在信号传递中,信号首先从输入层进入网络,然后经过隐含层神经元逐层处理,最后到达输出层。输出层“判断”输出结果是否是期望输出,若是,则输出结果,否则进入反向传播过程。反向传播过程根据网络预测误差更新网络连接权值、尺度因子和位移因子,使预测输出不断接近期望输出。构建WNN的主要任务之一是依据具体时间序列特性,筛选合适的小波基函数作为联系小波变换和神经网络的激励函数。
假设样本集数据为N个,输入层神经元个数为I,第n个样本的输入值为Tn={tni},i=1,2,…,I;Wij是隐含层第j个小波单元和输入层第i个神经元的连接权值;隐含层第j个小波的输出为h{{第j个小波单元的输入-bj}/aj},其中aj是第j个小波的尺度因子,bj是第j个小波的位移因子;Wj是隐含层第j个小波单元和输出层的连接权值;输出层有1个神经元,输出函数是Yn={yn},输出期望是En={esn},n=1,2,…,N。则可构建输出函数公式为:
小波神经网络拓扑结构如图1所示。
图1中的Xi是小波神经网络的输入序列,i=1,2,…,I;fj是选择的小波基函数,Y是小波神经网络的输出序列。j为隐含层节点数,j=1,2,…,m。
小波神经网络算法流程包括以下三部分:
(1)小波神经网络构建:选取合适的小波神经网络结构;
(2)小波神经网络训练:初始化参数并使用训练数据训练WNN;
(3)小波神经网络预测:用训练好的小波神经网络预测测试样本,得到预测结果并进行分析。
1.3 经验模态分解
经验模态分解EMD是Huang等人[3]提出的一种新型数据分析方法,可以将非平稳、非线性时间序列中的不同特征波动和趋势分离开,形成若干固有模态分量IMF和1个余项,其本质是平稳化处理数据。EMD分解出的IMF要满足以下两个特点:①IMF中的所有极值点数量和所有零点数量相差为0个或者1个;②在IMF中的任何一个点处,所有极大值点形成的上包络线和所有极小值点形成的下包络线的平均值始终为0。
EMD算法步骤是:①筛选出时间序列p(t)中的极大值和极小值;②通过三次样条插值法拟合出极大值和极小值的包络线;③计算包络线均值g(t)与初始时间序列p(t)的差值,设为y(t);④把y(t)看作初始时间序列,重复k次步①-步③计算,直至Hk小于给定的阈值,得到第一个imf1(t),imf1(t)=yk(t),Hk满足式(2),r1(t)=p(t)-imf1(t);⑤将r1(t)看作初始时间序列,重复①-④,得到imf2(t),r2(t)=r1(t)-imf2(t);⑥将r2(t)看作初始时间序列。重复以上步骤直至所得到的余项函数值小于给定的阈值或者是单调函数时,结束计算。最后一次得到的余项函数r(t)称为余项。
由上文可知,时间序列p(t)的公式为:
2 EMD-WNN预测模型
2.1 模型构建
针对非线性、非平稳的时间序列,首先对其进行归一化处理。其次,利用EMD分析方法对其进行分解,最终得到一组IMF和一个余项。然后,利用WNN分析方法对IMF和余项分别进行网络的训练和预测。最后,将IMF和余项预测结果累加即得到原始时间序列的最终预测值。
2.2 算法步骤
EMD-WNN预测算法步骤如下:
Step1数据预处理:对原始数据进行归一化处理。
Step2对归一化后的时间序列进行EMD分析,具体如下:(1)筛选原始序列的局部极值;(2)拟合上、下包络线;(3)计算上、下包络线的均值;(4)计算原始时间序列与步(3)均值的差值序列;(5)判断步(4)序列是否为IMF,若是,则将步(4)序列视为第一个IMF,若否,则将步(4)序列视为原始时间序列,重复步(1)-步(5);(6)计算原始时间序列与第一个IMF之间的差值,视为余项和原始时间序列。继续重复步(1)-步(6),直至余项满足停止条件。
Step3 WNN预测分析:(1)网络初始化:随机初始化小波函数尺度因子和位移因子、网络连接权值以及学习速率;(2)样本分类:将原始数据集划分为训练样本集和测试样本集,训练样本用于训练网络,测试样本用于预测;(3)预测输出:将训练样本集输入网络,计算实际输出以及网络误差;(4)判断误差是否达到精度要求或者算法是否达到其他停止条件,若是,训练完成,若否,继续步(5);(5)权值修正:根据网络误差修正连接权值、尺度因子以及位移因子;(6)返回步(3),重复计算。
Step4将得到的一组IMF与余项利用WNN预测的预测值累加,记为原始时间序列的预测值。新模型实施的流程如图2所示。
3 仿真实验
3.1 数据选取
本文数据采用的是Matlab随机生成的数据,数据分为三组,每组数据的样本容量为50,样本容量合计为150。各组数据的自变量和因变量取值情况如下:第一组数据的自变量取值分别为0~0.6之间和0~0.7之间的随机数,对应的因变量取值为1;第二组数据的自变量取值分别为0.4~1之间和0~0.6之间的随机数,对应的因变量取值为2;第三组数据的自变量取值分别为0.3~1之间和0~0.4之间的随机数,对应的因变量取值为3。为保证效果,在生成数据之后,将前100组数据乱序之后作为样本数据进行训练。归一化后的时间序列如图3所示。
数据的计算处理均使用Matlab软件,运行环境是2.13GHz、2.00 GB内存,测试环境为Matlab R2012b。将随机数据的前100项设置为训练样本集,后50项为测试样本集。为验证本文模型的有效性,采用BP神经网络、WNN及本文模型三种方案对相同数据集进行预测,然后比较分析三种方案的结果。
3.1.1 网络参数的确定
对于BP神经网络,采用试凑法确定最佳隐含层节点数和层数。输入层的节点数为2,隐含层节点数为4,输出层的节点数为1。隐含层的传递函数是正切S型函数,输出层的传递函数是线性函数,训练函数是学习率自适应并附加动量因子的最速下降法。训练显示间隔次数为50,学习速率为0.1,动量系数为0.9,训练次数为10 000,性能目标(MSE)是0.01。对于WNN,学习概率分别为0.01和0.001,网络迭代学习次数为1000。本文隐含层的小波基函数采用国际上常用的Morlet母小波函数。Morlet小波函数在时频局部和对称性方面具有优势,使得模型具有很好的线性逼近能力,母小波函数公式为:
其中t为输入变量,f(t)为输出变量。
继而,小波函数偏导数输出为:
3.1.2 预测结果图
在明确网络参数的基础上,根据原始数据结构:存在两个输入变量和一个输出变量。分别对三个变量的时间序列进行EMD分析,结果如图4-图6所示。从三幅图中可以看出,三个时间序列经过EMD分析,均得到5个IMF和1个余项,并且可以明显地看出IMF是从高频到低频依次被提取。然后,将三组变量中的分量依次对应,组成6个样本集,包括5个IMF样本集和1个余项样本集。利用WNN分别训练和测试上述样本集,将最终得到的测试样本集的预测值累加,即得到测试样本集最终预测值。图7即为测试样本集中期望输出值与实际输出值(预测值)的图示。
3.2 预测结果对比分析
为了有效评价模型的有效性,本文采用预测模型中被广泛应用的平均绝对误差(MAE)、平均相对误差(MARE)来进行三种模型的对比评价。
计算测试样本集中最终实际值与期望值的MAE和MARE,结果如表1所示。从表1可以看出,EMD-WNN获得的实际值与期望值之间的MAE和MARE分别为0.3355和0.5452,BP神经网络的MAE和MARE分别为0.5066和0.7317,WNN的MAE和MARE分别为0.4741和0.6773。EMD-WNN训练样本的MAE和MARE分别为0.2741和0.4588。三种模型的运行时间分别为0.45、7.13和42.58。由以上数据可得:(1)BP神经网络预测速度较快,但是预测结果落后于WNN,说明了WNN预测精度高于BP神经网络;(2)EMD-WNN比WNN的时间成本高,但是误差好于WNN,说明了有必对非平稳、非线性时间序列进行EMD分析;(3)EMD-WNN训练样本的MAE和MARE与测试样本的MAE和MARE相差很小,说明新的算法具有较好的泛化能力。总之,EMD-WNN的MAE和MARE均小于BP神经网络和WNN的MAE和MARE。显然,EMD-WNN的拟合效果和预测精度均优于BP神经网络和WNN。这是由于WNN结合了小波变换良好的时频局部化性质与BP神经网络的学习能力,因此具有了更加灵活有效的函数逼近能力。另外,EMD对非平稳的时间序列进行了平稳化,有助于提高预测精度。而EMD与WNN的结合,能充分发挥两者的优势,提高预测精度。
4 结语
肖江霞 邹小波 邹小波 篇2
我在一间正规的桑拿上班,认识了一个我最爱的大老板的儿子,他有别墅有小车。但我认识他之前有一个相爱的男友,他人品很好,但只是个打工仔,经济条件一般。我不知该爱谁,你能帮我出出主意吗?
(深圳市永福镇肖江霞)
翔姐:有时候爱会蒙蔽人的眼睛,你以为那个人是你的最爱,可那个人往往可能是最不适合你的。记住,任何形式的爱情走进婚姻,最终都要落实到生活中来,所以,抛弃那些不切实际的梦吧。有的人喜欢物质胜于一切,且看那些风光嫁入豪门的女明星们,有多少是得意洋洋如鱼得水美满幸福的?到处看人脸色,处处小心行事,还不如跟那个人品好,又宠你爱你愿意载你去远方看夕阳的穷小子来得浪漫。
如何看体检报告
翔姐,您好!现在去医院看病,医生经常要病人做各种各样的检查,检查报告上的各种指标,我又看不懂,你能不能简单说说怎样看检查报告或体检报告?
(江门市邹小波)
翔姐:我就以一份常规的体检报告为例:
血常规报告在血常规检查中,只要白细胞总数、红细胞总数、血红蛋白和血小板这四项主要指标正常,其他次要指标高点儿或低点儿问题并不大。
尿常规检测尿常规一般以尿蛋白质、尿葡萄糖、尿酮体、尿红细胞、尿白细胞、尿比重等作为主要判断的依据。尿常规的检测结果有时会受到饮食、药物、年龄等因素的影响,偶尔发现个别指标轻度升高,不一定有临床意义。但如果连续多次超出参考值,建议到肾内科进一步检查。
血脂四项一次血脂检查,包括总胆固醇、甘油三酯、高密度脂蛋白、低密度脂蛋白四项,每项都不能忽视。总胆固醇偏高是一种血脂异常现象,与心血管病,尤其是冠心病的发病、发展有着密切关系;高密度脂蛋白偏低时易患冠心病、动脉粥样硬化等;而低密度脂蛋白升高会导致动脉硬化;甘油三酯偏高也是血脂异常,要引起注意。
转氨酶升高通过抽血化验检测肝功能的转氨酶主要有谷丙转氨酶(ALT)和谷草转氨酶(AST)两种。如果这两个数值明显升高,一般情况下表示肝脏有损伤。
T波改变心电图T波改变的原因很多,睡眠不好、压力大等非心脏因素也会引起T波改变。多数T波轻微改变是无意义的。但如果T波显著增高,则可能是心肌梗塞早期或高钾血症。如果T波低平或倒置,多见于心肌劳损、心肌缺血、低钾血症。
窦性心律窦性心律不齐是指心律随呼吸出现周期变动,吸气时心率增快、呼气时心率减慢,屏气或活动后心律不齐现象消失。窦性心律不齐一般无重要临床意义,不必过虑。
跌倒了要重新爬起来
真倒霉,最近我们的小店亏本开不下去了,丈夫心里很难受,他希望通过买彩票中大奖来挽回损失,这办法可行吗?
(东莞市城区叶月娇)
经验小波 篇3
关键词:经验模式分解,小波分解,GPS,变形分析
1 经验模式分解
黄鄂等在1998年提出的经验模式分解方法(Empirical Mode Decomposition,EMD)[1]是一种适合对非平稳信号进行分析的有效工具。Huang介绍的EMD的具体步骤,石春香[3,4]、于德介[5]、谭善文[6]、戴吾蛟[7]等人进行了详实的叙述和总结,而且EMD已经成功应用到海洋[2]、地震[3]、机械振动信号分析[4]等领域的数据分析中。对于给定的信号,EMD的本质就是对一个信号进行平稳化处理,即将信号中不同尺度的信号逐级分解,产生一系列具有不同特征尺度的平稳的窄带信号[7]。
EMD的核心是产生固有模态函数(Intrinsic Mode Function,IMF)的筛选分解过程,由EMD得到的IMF需满足以下两个条件[1,7]:①在整个信号长度上,一个IMF的极值点和过零点数目必须相等或至多只相差一点;②在任意时刻,由极大值点定义的上包络线和由极小值定义得下包络线的平均值为零。满足上述条件的IMF就是一个单分量信号。
本文鉴于小波分解在变形分析领域内的成功应用,以及希尔伯特-黄变换方法的独特优势,从模拟数据和真实的GPS试验数据两方面对比分析EMD用于变形分析应用的可行性。
2 模拟信号算例分析
分别采用小波变换(WT)和EMD两种方法分析在模拟信号特征检测中的异同,包括突变性检测、趋势检测和频率检测。小波变换选择不同的小波基,如Daubechies家族中的db3小波和haar小波。文中图示作统一说明,横坐标为模拟数据的长度,纵坐标为对应的振幅(mm)。
为了对WT和EMD两种方法进行定量对比,选用均方误差(Root Mean Square,RMS)作为衡量指标,其计算公式见公式(1)。其中,N为信号的总长度,wxt为采用WT或EMD处理后的信号,xt为不含噪声的原始参考信号。
2.1 突变性检测
信号的奇异性可分为两种,一种是信号在某一时刻,其幅值发生变化,引起信号的不连续,信号的突变处是第一种类型的间断点;另一种是信号外观上很光滑,其幅值没有突变,但是在信号的一阶微分上有突变发生,且一阶微分是不连续的,称之为第二种类型的间断点。本节仅对第一种类型的间断点进行检测分析。
图1中从上到下依次为突变信号原始波形和EMD得到的6个尺度的IMF(imf1~imf5、res),因为EMD不经过频域转换,它依据数据本身的时间尺度特征进行分解,得到的IMF就不太容易检测出间断点的位置,只能从imf1中可以看出频率的变化,但不知道频率变化的具体时刻,而imf2~imf5分量包含一定的虚假频率信息,第六个尺度的IMF就是一个明显的虚假信号,因为原始波形中并没有趋势项成分。
图2中从上到下依次为应用db5小波进行6层分解得到的细节信号d6~d1和第六层的概貌信号a1,可以看出,在细节信号d6~d1部分能清晰地显示出间断点的准确位置,特别在第一、二层的细节信号中(d1、d2)对信号的不连续性显示得相当明显。而从概貌信号a1可以看出对信号的近似重构效果比EMD的imf1分析结果好。
2.2 趋势检测
通常,一些含噪信号的发展趋势是难以分辨的,通过小波变换对含噪信号进行消噪处理分解,可以去除干扰信号,最终显现出有用信号,但选择不同的小波基提取趋势项的结果就不同。而对原始信号进行EMD,第一个IMF对应频率最高的成分,随着IMF阶数的增加,其对应频率成分逐渐降低,EMD分解的收敛准则使得分解余量为单调函数,也就是信号的趋势项。本节通过对含噪的斜坡信号的对比分析,表明应用EMD方法无需任何先验假定条件,可以有效提取信号的趋势项。
图3是加噪前后斜坡信号;图4中依次为斜坡参考信号、db3小波和haar小波去噪后的近似信号以及三种信号的对比图;图5是EMD得到的8个尺度的IMF,其中imf1、imf2认为是高频噪声,imf3~imf7反映了在频率不断减小情况下不同频段的加噪斜坡信号,从中可以看出夹杂一定的虚假信号,imf8是EMD得到最低频率固有模态函数,即趋势项成分,从中可以清晰的看出信号的趋势。从图4及表1定量计算可知,db3小波的处理效果优于haar小波的分析效果,而EMD的综合处理效果优于其它两种小波分析效果。如在噪声水平为1的条件下,EMD获取信号的RMS最小(0.058),更接近于原始参考信号。
2.3 频率检测
图6从上到下依次是合成信号波形和三种频率(大约分别是0.5、0.05和0.005Hz)相同振幅的正弦波形;图7从上到下依次是合成信号波形和EMD得到的6个尺度的IMF分量,从中可以明显看出三种不同频率的正弦波分别对应于IMF中的imf1、imf2、imf3,而imf4~imf6的幅值范围很小,可以认为是虚假信号;图8从上到下依次为采用db3小波进行5层分解后的近似信号和细节信号,从中可以看出0.5Hz的正弦信号位于细节信号d1层,每一个信号中包含有10个正弦振荡;而在细节信号d4层中包含0.05Hz的正弦波;而频率为0.005Hz的正弦波在近似信号a4层中可以较清晰的分辨,另外近似信号a3和a4之间出现了不连续;表2是定量计算不同小波基的WT分量和EMD分解信号与三个不同频率正弦信号的均方差。
从表2中的RMS值可以看出,EMD的频率检测效果与小波分解的结果相似,但EMD方法无需考虑小波基选择的问题,从图7、图8可以看出EMD分解出的频率成分光滑性更好。
3 GPS振动试验
3.1 模拟振动平台
为了检验GPS用于结构振动监测的精度并获取结构振动的理论频率和振幅,在试验研究中特制了一个振动模拟平台(如图9所示),为了能够使振动台进行各种频率与振幅的振动,计算机中装有一个ADLINK 控制板,通过计算机中的控制软件,用户可以控制振动台作各种不同频率和振幅的运动(见表3),GPS接收机安装在振动模拟平台上以测定平台运动,为保证平台和GPS同步,将GPS时间输入到控制平台的计算机,修改计算机时间,使时间同步精度好于0.1ms,可以满足时间同步要求[8]。
实验中首先利用小波变换对静态观测数据的残差进行去噪,提取具有系统性的多路径误差改正模型。然后根据多路径误差重复性的特点,对后续动态观测的数据进行改正,之后再对预处理后的振动平台记录数据进行分析。
3.2 试验对比分析
试验分别采用小波分解和经验模式分解两种方法以验证EMD对隐藏在复杂频率下的GPS低频趋势项分离处理的优越性,试验数据均经过多路径改正和滤波处理后。先分析没有趋势项影响的信号处理,后加入一个趋势项来说明EMD对于信号处理的独特优势。
如图10所示是同一振幅范围(正负20mm)两个不同频率的GPS信号及叠加信号;图11依次是叠加信号和EMD得到三个IMF信号,imf1对应0.1Hz的GPS信号,imf2 对应0.5Hz的GPS信号,剩余分量res的平均值为4.724,res分量中数据后期波形上升可以认为是端部效应引起的;图12依次是db3小波五层分解得到近似成分a5(对应0.1Hz的GPS信号)和细节成分d5(对应0.5Hz的GPS信号)。表4是WT及EMD的分量与不同频率信号的均方差的定量对比,从中可知,当信号中无低频信号(或趋势项)干扰时,EMD的处理效果优于小波分离效果,但并不明显。
如图13所示,当信号中加入一个趋势项(0.025Hz的低频成分),明显看出叠加信号由于趋势项的影响振幅变化趋势缓慢。图14是EMD得到imf1对应0.5Hz的GPS信号,imf2 对应0.1Hz的GPS信号,imf3对应0.025Hz的GPS成分,剩余分量res的均值为7.916。图15是db3小波5层分解得到的近似成分a5和细节成分d5,对比图12可以看出a5由于趋势项影响出现了基线偏离。从表4、5中可知,小波分解不能有效分离出趋势项,且RMS值向低频区域增大。而EMD对宽频段内频率相差较大的信号分离效果明显,特别对趋势项的分离是有效的。
4 结论
对比模拟算例和GPS试验分析结果表明, EMD既保留了小波变换多分辨分析的优点,又克服了小波变换中选择小波基的困难。基于EMD的希尔伯特-黄变换是一种崭新的非平稳信号的处理技术,在测量领域的应用还处于探索和研究阶段。本文基于两种不同的实验分析表明小波分解和经验模式分解在变形分析中各具优势,但小波分解方法的一些固有问题(如小波基选择),借助于经验模式分解的 方法可以得到减弱或消除,具体表现如下:
(1) EMD方法和小波变换都适用于对非平稳信号的分析,小波变换对信号的突变性检测具有优势,EMD方法适用于缓慢变形趋势的提取以及GPS信号中低频信号的分离。
(2) EMD是一种自适应的时域处理方法,不必进行频域转换。EMD不受傅里叶变换和测不准原理的限制,且不受小波基选择的影响。
此外,基于EMD的希尔伯特-黄变换为建立一套不受傅立叶变换理论的束缚,揭示非平稳信号的本质特征提供了一种有效的分析方法。该方法从直观上容易理解,算例分析也表明是一种有效的时频分析方法。
参考文献
[1]HUANG N.E.,SHEN Z.,and LONG S.R..The Emprical ModeDecomposition and Hilbert Spectrum for Nonlinear and Non-stationaryTime series Analysis[J].Proceedings of the Royal Society of LondonSERIESA,1998,454:903~995.
[2]HUANG N.E.,SHEN Z.,and LONG S.R..A new view ofnonlinear water waves:The Hilbert spectrum[J].Annu.Rev.FluidMech.,1999,31:417~457.
[3]石春香,罗奇峰,郭忠印.Huang变换在地震波信号纠偏中的应用[J].同济大学学报(自然科学版),2005,33(7):895~899.
[4]石春香,罗奇峰.时程信号的Hilbert-Huang变换与小波分析[J].地震学报,2003,25(4):398~406.
[5]于德介,程军圣,杨宇.Hilbert-Huang变换在齿轮故障诊断中的应用[J].机械工程学报,2005,41(6):102~107.
[6]谭善文,秦树人,汤宝平.Hilbert-Huang变换的滤波特性及其应用[J].重庆大学学报,2004,27(2):9~12.
[7]戴吾蛟,丁晓利,朱建军等.基于经验模式分解的滤波去噪法及其在GPS多路径效应中的应用[J].测绘学报,2006,35(4):321~327.
分裂者张小波 篇4
张小波,生于1963年,凤凰联动文化传媒有限公司总裁,作家,知名文化商人。20世紀80年代,他是第三代诗歌运动的代表人物之一,上海“城市诗派”的旗手。后因策划《中国可以说不》系列而崛起于中国出版界,成为成功书商。他策划的《求医不如求己》《中国不高兴》《山楂树之恋》等畅销书引领了出版界的风潮。
“民营书商的存在,改变了中国出版的生态。现在不能想象,没有体制外这拨民营书商的进入,中国的出版能到目前这种态势。”
2010年10月,张小波担任总裁的凤凰联动图书有限公司出手大动作:一举推出去年诺贝尔文学奖得主赫塔·米勒的《赫塔·米勒作品集》中文版,一套10册。消息一出,震动业界。
从国内的出版业巨头来数,还真没有几家能有这种大手笔。德籍罗马尼亚裔女作家赫塔·米勒2009年获诺奖之时,国内还没多少人知道她是何许人,一年之后,她的中文版都上市了,而且是以全套作品集的规模,这种气魄和速度在中国出版业是空前的。不要说民营的出版商做不到,即使国营的老牌出版社,做到这一点也基本是神话。
之所以说出版全套《赫塔·米勒作品集》是大手笔,不仅在于其咄咄逼人的速度,而且在于它的投入。光是作品的版权费,就达14.5万欧元,再加上译者的稿费等等费用,若想收回全部成本,大约得卖到10万套。张小波对《中国新闻周刊》坦承:“像赫塔·米勒这样的作家,在中国完成10万套确实比较困难。”
“我对中国当代作家极度失望”
凤凰联动为什么要做这件事?
凤凰联动可以说是个异数。严格说来,它既不是国营,也不属民营,而是一个“国民合营”的结晶。
去年4月,国营出版集团巨头、凤凰出版传媒集团旗下的江苏人民出版社与张小波的民营出版公司“共和联动”共同注资1亿元,组建了凤凰联动,其中,国营一方占股权51%,民营一方占股权49%。控股方派驻财务总监并按照出资比例获得利润回报,而日常经营管理则由原共和联动方面主要负责。
张小波说:“当时有很多报道,说我们是被招安了,被收编了……我是觉得,我们走了这么多年,变成了一个新的出版主体,用所谓‘招安这个词,词用得是非常爽利,但是否能准确描述这样一个现实?不一定。”
凤凰联动成立一年多以来,张小波一直在探寻如何发挥合资双方的“长板”。他总结出:凤凰联动的长板,第一是创意力,这是自由竞争激发出来的;第二是灵活性;第三,是某种理想主义。“这么多年它长久地支撑在里面。很多时候,它会超越商业法则。”
“比如,每年我们会选出这一年中最好的诗来出版诗集,而诗集在当前永远是会赔钱的。出版赫塔·米勒,也是超越商业法则的。”张小波说,“对于当下中国社会的复杂性,我们中国的作家在语言表达上是滞后的。他们要么就回到古代,而对当下,他们找不到语言做有力和准确的表达。从这个角度说,我对中国当代作家极度失望。引进米勒,我们就是要看看,人家对于当下的文学表达是如何做到的。”
在此之前,张小波还策划过出版印度裔英国作家拉什迪的作品。虽然也买下了全部版权,但出于种种原因只出了《羞耻》一本。即使这样,张小波仍说“这是最令他骄傲的一本书”。
在商言商,书商不遵循商业法则,何以生存?况且张小波的名字是和一连串的畅销书连在一起的:《中国不高兴》《袁伟民与体坛风云》《中国足球内幕》,乃至《山楂树之恋》《求医不如求己的智慧》系列……
其中仅仅《中国不高兴》一书,就卖了60万册,当然是大赚了一笔。但张小波向记者辩白说,出《中国不高兴》,真不是首先出于商业价值考虑。“我们认为它会有影响力。书中谈到三鹿奶粉事件的时候,将它比喻成中国内部的‘奥斯维辛事件,说在中国,价值观的虚无性和价值重建的紧迫性同时凸显在每个中国人面前。而这一点,应该和中国公众的主流价值是一致的。作为出版人,我骨子里对书中观点会有某些认同。至于卖得好,有影响力的书,当然会卖得好。”
张小波说,他也出著名自由主义知识分子马立诚的书。“在网上那么多人骂他汉奸,我觉得,应该给他的思维一个全貌展现,让人能了解。这未尝不是中国社会的一个进步。出版应该是社会一个共生的平台。我能做到即使是我不认同的观点,但我深知它有价值而把它出版,这一点是我最高兴的事情。我本人的政治倾向与我的出版之间,我希望能实现一个有控制性的互动。虽然这是很不容易的。”
张小波说,他至今还看不懂财务报表。“反正有财务总监,就由他来管就好了。”张小波的全付精力在于策划选题,还有就是为要出版的新书写广告语。捕捉社会情绪的热点是张小波的拿手长项。他做的许多书一上市即能炒热,不管是掀起民族主义情绪,还是民间养生的狂热。
张小波刚刚推出的一本新书是《穷人通胀富人通缩》,正好打到了人们关心的社会痛点,而这本书是从去年就开始策划了,当时想的书名叫做《通货就要膨胀》,没想到形势发展得这么快,现在的通胀已经不是“就要”的问题了。
张小波另外一个要做的动作是,推出一批“80后”“90后”的“小青年写的书”。“关于中国工业社会的来临、中国的产业制造、中国向何处去……会不会变成跟西方一样的国家?有几条道路?我已经不愿意找‘50后‘60后的人写东西。他们基本上认知是过时的。”
这或许就是张小波的成功之道。他能捕捉到社会潮流的最前端,看似在做“超越商业法则”的事情,却赚到了大钱。
没有放弃写作
张小波做书商已经将近20年。
1991年,江苏镇江文联的干部张小波决定下海,此前他在国家机关已经待了7年,再往前,他是华东师范大学教育系的本科生,那时的他,整天读的是萨特或卡夫卡,“写诗成为生活的一部分”。
上学和当机关干部的日子,让张小波饱读名著。“当然那时读萨特和走入社会10年后再读萨特,无论是理解和体味都是不一样的。但是那段时间,为我提供了大量的养分。”张小波回忆说。
决定下海,是想改变命运。对于这些文学青年来说,做书商是一条最现成的路。张小波记得当时这一拨上海的和四川的诗人,比如宋渠、宋炜、李亚伟、马松……大家都在尝试做书,而张小波做的第一套书,是温瑞安的。“应该是赚到钱了,因为我们是先借了钱的,到最后把借的钱还掉发现还有剩的,这就说明是赚了钱了。”张小波说,他不记得赚了多少,那时就对账目心里没数。
早年做书商的日子,张小波有些不堪回首。最困难的,还不光是资金问题,是感觉备受歧视,一种“无所归依”的感觉。“年年都说要整顿‘二渠道,常常觉得手头的这本书就是最后一本书了。”
所以,当2009年,张小波以自己的实力与凤凰出版集团实现组建凤凰联动时,他有一种欣慰感:“以前说你是民营的,二渠道,现在,他愿意和你对话了,承认你了。当然,审视自己这近20年从事出版的历程,会有很多的极不满足和极大的遗憾。你做的值得人去谈论的好书有多少?你做的是不是用过即扔的东西?但是虽遗憾,我不后悔,至少民营书商的存在,改变了中国出版的生态。现在不能想象,没有体制外这拨民营书商的进入,中国的出版能到目前这种态势。他们的‘转企等各种改变,也是源自于我们。”
张小波现在的生活是一种高速运转的节奏。他每天不停地与人开会,吃饭,打电话,在出差的路上,还要带上数部书稿,为它们写广告词。与20年前在镇江文联当干部相比,这完全是一种不可同日而语的日子。但张小波说,他内心的改变没这么大,他还一直没有放弃写作的梦想。
张小波的一部剧本《刽子手花园》被电影导演张元看中,已经准备投拍了。“这是我从商十几年来写的第一个剧本。你内心的虚荣心和光荣感是会被激发的……这个非常纠结,我内心有无数的写作计划。我每年都在想,能不能找到一个人把这个公司接管了?我是想回到一个自由的写作状态。但随着年纪的推移,总觉得不太可能了。无论你的体力、你的创造力、你对文字的把握,都不太可能了。这让我觉得非常地恐惧。”
经验小波 篇5
关键词:短期负荷预测,互补的集成经验模态分解,小波核极限学习机,组合预测模型
0 引言
负荷预测是电力企业管理运营成功的关键,电力的运行规划及调度都必须以相对准确的需求负荷预测为依据。精确的负荷预测模型是电力系统自动化运行的基础与保证,因此,负荷预测已经逐渐成为电力行业研究的重要领域之一[1]。如今,许多先进的数学方法已被用来进行电力负荷预测,常用的有神经网络、支持向量机和卡尔曼滤波预测等[2,3,4]。尽管国内外研究人员努力改进预测算法提高预测的准确度,然而受气候、地理位置、能源市场等复杂因素影响,负荷时间序列有着典型的随机性、不可控性及非平稳性,仅采用单一的预测方法并不能达到令人满意的精度。组合预测方法[5,6]集合了多种数据处理与预测算法的优势,较单一预测算法在精度上有了很大的提高。此类预测算法首先把非线性信号序列按其频率尺度的不同分解为有限个分量,对各个分量分别加以预测,改善其本证模态分量间相互影响问题,将各子序列所得的预测值求和即可得出最后的预测结果。信号的分解算法使用最广泛的有小波分解[7]和经验模态分解[8]等。经验模态分解(EMD)不仅具有小波分解多分辨的优点,且不需要预先设置分解尺度,分解速度快,把负荷时间序列自适应地分解成不同的层次,使负荷的波动信息得到精确反映。但仅采用传统EMD算法对电力负荷序列预测时容易存在分解所得子序列之间的模态混叠现象。通过利用一种的集合经验模态分解(CEEMD)[9,10]可使负荷时间序列更好地分离,使分量更为稳定且频率大小相对固定,有效改善模态混叠问题。极限学习机(ELM)[11]是近年来出现的一种新型单隐层前馈神经网络,该模型不仅在训练时间上明显优于神经网络、支持向量机等预测模型,且能够获得与之媲美的泛化性能,但ELM与其他常用的神经网络同样存在局部最优或过学习等问题[12]。综合分析以上算法的优缺点,针对电力负荷的变化特性,本文采用一种新型的基于CEEMD和小波核函数的改进极限学习机(WKELM)的电力负荷组合预测模型。先通过CEEMD降低电力负荷数据的非平稳性,然后运用WKELM分别对各模态分量和余项进行预测分析,将IMF和余项预测值集合叠加求得最终的负荷预测结果。对某市真实电力负荷数据进行实验分析,结果表明本文提出的新型组合预测模型相比其他预测算法具有更高的精度和效率,实用性和有效性令人满意。
1 CEEMD
EMD是希尔伯特-黄变换的重要组成部分,是希尔伯特-黄变换实现其理论和实际应用价值的关键,其本质是一种自适应的非线性迭代分解算法。信号中存在尺度不同的波动或趋势时,按其自身性质将其逐级分解,如果分解所得分量满足:①极值和过零点的个数差为0或1;②在任何一点处,由极值点决定的上下包络线的平均值为0,满足要求的分量可以称之为一个本征模态函数IMF(Intrinsic Mode Functions),各IMF分别具有不同的尺度特征,详细分解过程参见文献[13]。
模态混叠现象是影响EMD分解效果的一个严重问题[14],意味着一个IMF中包含了多种频率的信号或多个IMF包含在一个类似的频带的信号中。EEMD的开发主要就是为了减弱或避免模态混叠这一缺陷[15],EEMD是一个多重试验过程,有着与EMD相似的信号处理程序,不同之处在于,EEMD的输入由原始时间序列和一个有限的高斯白噪声混合而成。通过所有分解信号的集合平均使无关联的高斯白噪声将相互抵消,从而使有意义的时间序列得以保留。其分解步骤如下:
(1)将原始电力负荷序列混入高斯白噪声,其中μσm(t)是独立的高斯白噪声,μ为加入噪声的幅值,即加入白噪声与原信号序列幅值的标准差之比,M为经验模态分解的次数。
(2)通过EMD对混有高斯白噪声的时间序列xm(t)进行处理,得到IMF和余项。
式(3)为实现对原始信号的重构,将式(2)分解所得的总的IMF分量与余项进行平均运算,以去除加入到信号中的噪声对分解结果的干扰。
其中
EEMD通过引入噪声扰动的方式,并对添加噪声的原始信号序列进行集合平均,在一定程度上避免了不同尺度分解信号混淆的问题。虽然EEMD降低了模态混叠的可能性,但由式(3)可以看出,添加白噪声所造成的干扰σM依旧存在,若重复分解的次数不足,使白噪声混入原信号序列则会引起重构误差。CEEMD的提出有效减弱了加入白噪声对分解结果造成的干扰与影响[16]。CEEMD与EEMD算法的不同之处在于在步骤(1)添加白噪声的过程中同时添加一对符号相反的噪声辅助信号,其余步骤与EEMD相同。
不论CEEMD还是EEMD算法的分解效果均依赖于白噪声与原信号序列的比值μ和集成次数M,由文献[17]结合本文预测模型的特性可知,当M=100,μ的取值在[0.1,0.4]之间时效果最佳,经参数测试本文中选取M=100,μ=0.25。
2 基于小波函数的核极限学习机
2.1 极限学习机理论(ELM)
ELM是在2006年由黄广斌教授等学者提出的一种新型单隐层前馈神经网络[11],但与传统SLFNS不同的是,ELM通过求解线性方程组来代替参数的训练,大大提高了训练速度和泛化性能,其计算步骤如下:
假设给定有限样本(xi,yi)(i=1,2,…,N)估计如下未知函数:
其中,ε为零均值随机误差。一个学习算法就是要利用训练样本从所有的逼近函数中找一个最好的模型f(x)使实际预测风险泛函最小。极限学习机通过如下函数来估计式(4)中的未知函数:
其中,L为SLFNS的隐含层神经元的数目;aj=(a1j,a2j,…,anj)T为连接输入层与第j个隐含层结点的权向量,bj为第j个隐含层阈值,βj表示连接第j个隐含层结点的输出权值,G(x)是激励函数,一般采用sigmod,径向基(RBF)函数等作为激励函数。其误差最小化的过程可表示为:
H为隐含层输出矩阵,可写作:
各样本隐层输出h(xi)可以被视作样本xi的非线性映射。在实际应用中,因隐含层节点数目一般小于训练样本数,输出层权重可以由式(8)求得:
则极限学习机的输出函数为:
其中,C为惩罚参数,一般取值为600。ELM首先随机产生权值向量aj和隐层神经元阈值bj,用随机产生的值计算隐层输出权重矩阵H,最后求取输出权重β,解得的β是唯一的。不仅能使误差最小化,还能泛化性能达到最优,其网络参数设定一次后不用再进行迭代调整,大大缩短了训练时间,其结构如图1所示。
2.2 基于核函数的极限学习机
由于传统ELM的输入权值与隐含层偏差是随机生成的,其参数生成的随机性造成了运算过程的不稳定。支持向量机作为一种针对小样本数据的学习算法,在一定程度上改善了一般的预测算法存在的局部最优或过学习、欠学习等问题,但其学习速度相对于ELM还是有一定差距。文献[16]通过基于核函数的极限学习机将两种算法的优势结合起来,提高了预测模型的学习速度及稳定性,提出核极限学习机(KELM)这一概念。KELM其结构与ELM相似,如图1所示。
若隐层输出h(xi)未知时,可选用SVM一般采用的如高斯核,线性核等核函数来替换HHT,ΩELM代表极限学习机核函数。ELM的隐含层输出矩阵H可由如式(7)表示。
结合式(11)与式(9)可知,KELM的输出结果为:
由式(9)能够看出,只需将惩罚参数C的值确定,此时核极限学习机即可得到稳定不变的映射,从而取代了传统ELM中的随机映射,避免了传统极限学习机中因随机选取映射引起的不稳定,从而使预测方法的泛化性能得到极大的改善。
2.3 基于小波核函数的极限学习机
作为KELM的核函数必须同时满足Mercer条件和平移不变性定理[18],小波函数完全符合条件。且小波函数还可根据具体的工作环境选用适应性强的小波基函数,同时还具有Sigmoid函数,径向基函数(RBF)等核函数不具备的对数据序列的突然变化逐步精细的描述特性,取得更好的拟合效果。小波核函数的KELM结构参数的确定过程中定面临最重要的问题就是选用适合的小波基函数,一般常采用Haar、Meyer和Morlet小波等函数作为基函数[19]。基于Morlet小波在数据处理与回归预测方面的优越性,因此预测模型采用Morlet小波基函数作为KELM的核函数,其表达式如式(13),提出基于小波核函数的核极限学习机WKELM。
由Morlet小波构造的满足Mercer条件和平移不变性得到核函数表达式如式(14)所示,本文选取平移不变小波基函数构造小波核函数为:
3 基于CEEMD-WKELM的短期电力负荷预测建模
基于电力负荷信号序列的非线性,非平稳性及其局部特性明显等特征,本文将互补的集成经验模态分解算法(CEEMD)与小波核极限学习机(WKELM)结合建立一种组合预测结构应用于电力负荷的短期预测中。首先,用CEEMD对电力负荷序列平稳化处理,可将信号中存在的尺度不同的变化趋势按其自身性质自适应逐级分解。并能克服传统EMD模态混叠的问题,避免不同频率尺度信息之间的相互干扰,分解所得的IMF能够明显地反映不同时刻电力负荷的局部特性。在此基础上,通过q个WELM模型对CEEMD分解所得的q个IMF分别输入WELM作为其训练和测试样本,本文采用前七个时间点的负荷数据预测下一个时间点的负荷(即采用前7个数据预测第8个数据)。最后,每个子序列预测的结果的总和即为总的电力负荷预测值。总体预测过程如下(如图2所示):
(1)将原始数据分为训练与测试两个部分。通过CEEMD方法降低负荷时间序列的非平稳性,得到q个IMF分量(IMF1~IMFq)和余项R。
(2)分别对分解所得的负荷分量和余项通过基于小波核函数的极限学习机进行训练,建立预测模型。
(3)用训练好的CEEMD-WELM模型对测试数据进行分解重构预测,将每个IMF和余项的预测值求和作为最终的负荷预测值。
(4)误差分析。
4 算例仿真与结果分析
4.1 电力负荷原始数据样本
实验选用澳大利亚昆士兰地区2014年7月1日到8月20日每日偶数整点时刻的电网负荷共612个数据作为训练样本数据,取8月21日到8月30日十天的偶数个整点共120个数据作为测试样本,负荷样本数据如图3所示。
先对电力负荷信号序列分别进行传统的经验模态分解(EMD)与互补的集合经验模态分解(CEEMD),其分解效果图4、图5所示。
由图4和图5对比可以明显看出,EMD与CEEMD均可将非平稳的电力负荷时间序列分解为不同尺度特征的本征模态分量,降低序列的非平稳性。然而由负荷数据的分解结果可以看出,对比CEEMD(见图5),传统EMD(见图4)的分解效果相对较差,传统EMD将信号共分解为7部分(包含余项),且在IMF2与IMF3中存在较为严重的模态混叠问题,有低频信号混入了高频信号中,在信号的边缘出现了失真的现象。而本文采用改进的集合经验模态分解将负荷序列分解为8部分(包含余项),较传统EMD而言分解更为精细,每个分量的信号相对平稳,有效减弱了模态混叠问题,更有利于预测的准确性。
4.2 评价标准
为了定性定量地对预测模型性能优劣进行客观评价,选用常用的拟合效果评价指标均方根误差(RMSE)、平均绝对百分比误差(MAPE)和最大绝对误差(ME)分别对几种负荷预测算法进行分析,使预测模型的性能得到更加全面客观的评价,式中,yi-r表示真实的测量数据,yi-f为预测数据,N为测试样本数量。
其中,RMSE主要反映误差的离散程度,表示为:
由MAPE可观察预测值总的误差水平,表示为:
最大绝对误差表达式为:
4.3 实验仿真结果分析
为进一步验证本文所提出的预测模型的性能,同时采用单一的小波核函数的极限学习机预测(WKELM),经CEEMD分解后通过支持向量机预测求和叠加(CEEMD-SVM),CEEMD分解后由传统极限学习机预测求和叠加(CEEMD-ELM)以及本文提出的经CEEMD分解后由基于小波核极限学习机预测求和叠加(CEEMD-WKELM)四种模型分别对处理后的数据进行预测分析。首先给出前三种预测模型的输出结果如图6所示,图7为本文提出的CEEMD-WKELM算法的预测结果,图8为四种模型的效果误差对比曲线。
对非线性数据处理模型而言,初始值的选取对其性能有很大的影响。为方便数据处理,加快模型收敛速度,首先,对所选用的训练及预测数据实行归一化处理,将数据归一化为[0,1]之间的数。归一化公式如下:
其中:实验数据经归一化处理后记作表示模型的输入或输出数据,xmin、xmax分别代表实验数据中的最小值与最大值。
由图6和图7能够看出,四种预测方法均可有效跟踪电力负荷序列的变化情况,通过设置合适的参数基本都可达到预测的效果。
表1为四种预测模型训练时间及预测值与真实值的误差对比。
经过进一步分析对比可以得出,CEEMD-WKELM预测模型较单一WKELM方法在训练时间上相差不大。但就预测精度表现而言,CEEMD-WKELM组合预测的预测值与真实值的偏差明显小于单一采用WKELM预测,说明在预测前对负荷信号进行不同尺度分解以提取其局部特征降低其非平稳性对预测精度的提高是非常有效的。同时结合四种预测模型的误差对比图可明显观察到,虽然CEEMD-ELM的学习时间较短,但是在预测精度上却落后于CEEMD-WKELM。由此可明显看出,小波核极限学习机可对非线性数据进行多尺度学习的优势,进一步提高了预测的准确程度。由表1能够看出CEEMD-SVM模型消耗的时间是四种预测模型中最多的,预测的效果一定程度上取决于所选的核函数。虽然模型的预测误差与本文所提算法相差不大,但综合耗时与精度两种指标而言,CEEMD-WKELM还是具有很大优势。综上所言,采用CEEMD-WKELM预测模型不仅有效提升了短期电力负荷预测的精准程度,且在训练时长上也明显优于一般的预测算法,具有很高的工程应用潜能,是一种实用且有效的新型短期负荷预测模型。
5 结语
相关文章:
王小波有趣语录01-22
关于母亲给你送伞的范文01-22
给你启示的作文01-22
雨天给你一把伞范文01-22
天父给你的信范文01-22
王小波的调查报告01-22
高王小学校车管理制度01-22
网际快车技术总监王小猪教你做PPT01-22
王小贵组织人事自查报告01-22
王小燕初中英语教学经验总结01-22