版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、CN4321258/TP ISSN10072130X 计算机工程与科学COMPU TER EN GIN EERIN G&SCIENCE2010年第32卷第5期Vol132,No15,2010基于扩展卡尔曼粒子滤波算法的神经网络训练Neural Netwo rk Training Based o nt he Extended Kalman Particle Filter王法胜,郭权WANG F a2sheng,GU O Q u an(大连东软信息学院计算机科学与技术系,辽宁大连116023(Deptartment of Computer Science and T echnology,D
2、alian N eusoft Institute of I nform ation,Dalian116023,China摘要:神经网络的训练是一种非线性系统的辨识问题,基本粒子滤波算法已被成功用于训练神经网络,但基本粒子滤波算法在建议分布的选择上并没有考虑当前时刻观测值的影响,本文针对该问题提出使用扩展卡尔曼滤波器来生成建议分布。由于扩展卡尔曼滤波器在传递近似建议分布的均值和协方差的过程中充分利用了观测值信息,从而可以更好地描述神经网络权值的后验概率分布。实验结果证明,使用扩展卡尔曼滤波器作为建议分布的粒子滤波算法性能明显优于基本粒子滤波算法。Abstract:Training neural
3、networks can be viewed as an identification problem for a nonlinear dynamic system.The ge2 neric particle filter has been applied with success to neural network training,but the proposal distribution chosen by the ge2 neric particle filter does not incorporate the latest observations which can deter
4、iorate the performance of the algorithm.In this paper,we propose to use the extended Kalman filter to generate proposal distribution in the particle filtering f rame2 work.The extended Kalman filter can make efficient use of the latest observations,and the generated proposal distribution can approxi
5、mate the posterior distribution of neural network weights much better,which consequently improve the perform2 ance of the particle filter.The experimental results show that the proposed particle filter outperforms the generic particle fil2 ter.关键词:多层感知器;神经网络训练;扩展卡尔曼粒子滤波K ey w ords:multilayer percept
6、ron;neural network training;extended Kalman particle filter中图分类号:TP183文献标识码:A1引言多层感知器(Multilayer Perceptrons是应用较为广泛的一种人工神经网络结构。在多数实际应用中,一般采用BP算法来训练神经网络。尽管BP算法对于小型网络以及规模相对简单的问题能够取得较好的效果,但对于复杂问题收敛性能非常差。为了克服BP算法的缺陷,研究者提出了很多改进方法,比如引入变步长、加入动量项等等。Singhal S和Wu L1提出将多层感知器的训练看作非线性动态系统的辨识问题,使用状态空间法建立模型,并应用扩展卡
7、尔曼滤波算法(Extended Kalman Filter,简称EKF来进行训练。实验结果表明,与传统的BP算法相比,EKF训练算法的收敛性能明显优于BP算法。这一研究成果受到许多研究者的重视。EKF算法基于局部线性化方法,针对输出方程,将其展开成一阶泰勒展式,然后使用卡尔曼滤波方程估计神经网络权值。然而,EKF算法对输出方程进行局部线性化的过程中常常会丢失一些重要的信息,对于非线性输出模型而言,使用E KF进行线性化以后得到的分布不能很好地逼近真实843收稿日期:2009209203;修订日期:2009212206基金项目:国家863计划资助项目(2006AA01A124作者简介:王法胜(1
8、983-,男,山东临沂人,硕士,讲师,研究方向为智能信息处理;郭权,博士,教授,研究方向为人工智能和网络安全。通讯地址:116023辽宁省大连市软件园路8号大连东软信息学院计算机系A32220;Tel:133*;E2mail:wangfashengneusoft. Address:Deptart ment of Computer Science,Dalian Neusoft Institute of Information,8Ruanjianyuan Rd,Dalian,Liaoning116023,P.R. China的非线性系统分布。为解决EKF 算法存在的问题,Freitas 等人2提出
9、使用SIR 算法(Sequential Importance Sam 2pling 2Resampling ,简称SIR 对神经网络进行序贯训练(Se 2quential Training 。SIR 算法,即粒子滤波算法,是近年来新兴的一种解决非线性滤波问题的方法,其基本思想是用一个带有权重(也称重要性比率的样本粒子集合来逼近感兴趣的概率分布。Freitas 等人率先提出使用该算法对神经网络进行训练,并在实验中证明其性能要优于EKF 训练算法,这主要是由于粒子滤波算法能够更好地逼近真实的神经网络权值的概率分布。但是,SIR 算法却存在严重的退化问题,即经过若干次迭代以后,仅有极少数粒子的权重能
10、够对逼近概率分布产生重要影响,大多数粒子权重小到可以忽略不计的程度。退化现象严重影响粒子滤波算法的性能3。有效减少退化现象影响的方法之一是选择一个好的建议分布来产生样本粒子4。一种比较好的选择方法是,将后验概率密度近似为高斯分布,这样只要得到了均值和协方差,就可以构造该高斯分布,以该高斯分布为建议分布,从中抽取样本粒子。本文以该思想为基础,使用EKF 算法来构造近似高斯后验概率密度函数,以此产生扩展卡尔曼粒子滤波算法,并应用该算法训练多层感知器网络,在实验中与SIR 算法对比,验证了算法的训练性能。2粒子滤波算法2.1神经网络的状态空间模型首先,使用状态空间表示法为神经网络建模,以描述神经网络
11、随时间变化的过程。使用一个状态迁移方程描述神经网络权值的变化,一个测量方程描述某一具体物理过程的输入和输出之间的非线性关系,方程如下:w k+1=w k +d k (1y k =g (w k ,x k +v k(2其中,y k R o 表示输出测量,x k R d 表示输入测量,w kR m 表示神经网络的权值。非线性测量函数g (使用一个多层感知器来近似。假设系统测量噪声v k 为0均值高斯噪声,协方差为R 。假设第k +1时刻的网络权值依赖于k 时刻的网络权值以及系统随机过程噪声d k 。过程噪声可用来描述系统参数变化的不确定性、系统建模误差或者未知的输入量,如目标机动等。假设过程噪声为0
12、均值高斯噪声,协方差为Q 。2.2粒子滤波算法粒子滤波算法的基本思想是使用一个带权粒子集合来逼近在推理过程中需要进行的积分运算,这些粒子取自于神经网络权值的后验概率密度函数p (w 0:k |y 1:k 。后验概率密度可近似为:p (w 0:k |y 1:k =Ni =1q ik(w 0:k (w 0:k -w i 0:k (3其中,w i0:k 表示用来近似后验概率密度函数的粒子;(为delta 函数;N s 表示使用的粒子数目,粒子w i0:k 从后验概率密度函数中抽取;q k (w 0:k 为粒子的重要性比率。在实际应用中,直接从后验概率密度中抽取样本粒子是很难做到的。因此,有学者提出从
13、一个已知的概率分布密度,即建议分布密度(w 0:k |y 1:k 中抽取样本粒子,使用这些粒子来近似后验概率密度4。引入建议分布以后,粒子的重要性比率q k (w 0:k 可以通过下式递归计算得到:q k =q k-1p (y k |w k p (w k |w k-1(w k |w 0:k-1,y 1:k (4上式为我们提供了一种递归更新粒子重要性比率的机制。再采样技术可以有效减少退化现象的影响,它的基本思想是去除重要性比率低的粒子,复制重要性比率高的粒子,再采样之后得到的粒子集合中,每一个粒子的重要性比率均为1/N s 。关于再采样方法的内容,请参考文献4。文献2,4给出了详细的SIR 粒子
14、滤波算法。SIR 粒子滤波算法中建议分布函数选择的是先验概率密度转移函数p (w k |w k-1,但先验概率密度转移函数只考虑了上一时刻神经网络权值w k-1对当前时刻神经网络权值的影响,忽视了当前时刻观测值y k 对估计网络权值的作用。为解决这个问题,本文使用高斯近似方法,将网络权值的后验概率密度函数近似为高斯函数,然后使用EKF 来估计高斯函数的参数,这样在估计过程中,EKF 融合了当前时刻观测值的影响,从而可以提高估计精度。3扩展卡尔曼粒子滤波神经网络训练算法扩展卡尔曼粒子滤波算法(Extended Kalman Particle Filter ,简称EKPF 是由Doucet 3等人
15、提出的。本文将在神经网络训练背景下详细介绍EKPF 算法。将后验概率密度函数近似为高斯密度函数,使用均值和方差即可描述该高斯函数。p (w 0:k |y 1:k p N (w 0:k |y 1:k =N ( w k ,P k (5因此,我们只需要递归地计算权值的均值和相应的协方差即可,将近似高斯分布向前传递。在粒子滤波算法的框架内,对每一个粒子,使用EKF 产生并传递近似高斯的建议分布,即:q (w i t |w i0:k-1,y 1:k =N ( wi k ,P i k ,i =1,N s (6在时刻k -1,根据最新的观测值信息,使用EKF 方程计算每一个粒子的均值和协方差的估计,然后从构
16、成的近似建议分布中抽取第i 个粒子,该过程递归进行下去。假设在k -1时刻,已经得到样本粒子集合w i0:k-1,q i k-1N s i =1来近似表示k -1时刻的后验概率密度函数,在k 时刻,首先根据方程(1计算该时刻的预测状态和预测协方差:w i k|k-1=w i k-1(7P i k|k-1=F i k P i ,T k-1F i ,Tk+G i k Q k G i ,T k (8计算卡尔曼增益:K k =P i k|k-1H i ,T k U i k R k U i ,T k +H i k P k|k-1i H i ,T k -1(9k 时刻观测值y k 到来,根据该时刻的观测值
17、和计算的卡尔曼增益,更新前面计算的均值和协方差的预测值:w i k = w i k|k-1+K k (y k -g ( w i k|k-1,x k (10P i k =P i k|k-1-K k H i k P i k|k-1(11这样就得到了k 时刻的均值和协方差估计,进而可以得到近似的高斯建议分布N ( w i k ,P i k ,从中抽取粒子w i k 94N( w i k,P i k。EKPF算法步骤总结如下:步骤1初始化网络权值(k=0时刻:FOR i=1,N s,从网络第一层先验分布p1(w0和第二层先验分布p2(w0中抽取粒子w i0;计算重要性比率:q i0=p(y0|w i0
18、;归一化重要性比率:q i0=q i0N s j=1q j0步骤2FOR k=1,2,(1采样阶段:FOR i=1,N s计算雅克比矩阵F i k&G i k和H i k&U i k;使用E KF方程更新粒子得到均值和协方差估计量 w i k和P i k;抽取粒子w i kN( w i k,P i k;根据方程(4计算重要性比率;归一化重要性比率:q i k+1=q i k+1N s j=1q j k+1(2再采样阶段:去除重要性比率较小的粒子,同时复制重要性比率较大的粒子,得到N s个随机粒子w i k+1,为每个粒子分配大小相同的重要性比率,q i k+1=1/N s。4实
19、验本节将通过实验验证EKPF算法的性能。在实验中,输入输出数据由下列非线性非平稳状态空间模型产生:x k+1=0.5x k+25x k(1+x k2+8cos(1.2k+process_noise(12y k=x2k20+60.05(k-1+3+measurement_noise(13实验中,使用一个多层感知器来逼近这些数据,该多层感知器网络为三层前馈网络,隐层神经元数为10个,输出层为1个线性神经元。多层感知器的训练中使用SIR粒子滤波算法和EKPF算法。粒子滤波算法的粒子数目N s为50个。表1所示为两种算法的一步预测平均误差及运行时间对比,实验进行100次,独立运行,每一次运行120个时
20、刻。从表中可以看出,EKPF训练算法的一步预测误差约为4. 58,低于SIR训练算法的6.76;在运行时间方面,SIR为115s,EKPF为118s,相差不大,EKPF算法训练运行时间稍高于SIR算法。表1平均一步预测误差对比算法RMS error Time(sSIR 6.76115EKPF 4.58118图1所示为某一次运行中,E KPF算法和SIR算法训练感知器对输出的预测误差曲线。从图1中可以看出,EKPF算法明显优于SIR算法。图1两种算法的一步预测值与真实值对比曲线5结束语本文提出一种新型的神经网络训练算法,即EKPF算法。在粒子滤波算法框架内,使用EKF算法传播近似高斯建议分布,有效利用观测值提供的信息,从而可以更好地描述神经网络权值的分布函数。本算法不仅可用于多层前馈网络,也可用于递归神经网络、径向基函数神经网络等.参考文献:1Singhal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 备战2026年高考英语考试易错题(新高考)消灭易错08 名词(解析版)(3大题组)
- 教育资源优化策略-洞察与解读
- 2025年支付宝运营专员岗位招聘面试参考题库及参考答案
- 2025年面向企业的销售代表岗位招聘面试参考题库及参考答案
- 2025年信息技术督导招聘面试参考题库及答案
- 2025年承包商经理岗位招聘面试参考试题及参考答案
- 2025年海运物流专员岗位招聘面试参考试题及参考答案
- 2025年的士运营经理岗位招聘面试参考试题及参考答案
- 2025年现场经理人员岗位招聘面试参考题库及参考答案
- 2025年商业策划专员岗位招聘面试参考试题及参考答案
- 中复神鹰碳纤维招聘试题及答案
- 《思想道德与法治》2021版第四章
- 便民服务中心考勤制度
- 证券投资计划、方法与技巧
- 课后答案(固体枯燥)
- GB/T 9239.1-2006机械振动恒态(刚性)转子平衡品质要求第1部分:规范与平衡允差的检验
- GB/T 36198-2018土壤质量土壤气体采样指南
- GB/T 11361-2008同步带传动梯形齿带轮
- 公益事业捐赠预评估表
- 江苏开放大学组织行为学期末复习题
- 科学社会学的研究对象
评论
0/150
提交评论