光纤陀螺启动后的模型树线性回归模型_第1页
光纤陀螺启动后的模型树线性回归模型_第2页
光纤陀螺启动后的模型树线性回归模型_第3页
光纤陀螺启动后的模型树线性回归模型_第4页
光纤陀螺启动后的模型树线性回归模型_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

光纤陀螺启动后的模型树线性回归模型

1误差补偿研究作为整个网络系统的核心组成部分,螺钉作为整个网络系统中的一个非常重要的单元。影响陀螺仪工作精度的一个重要指标是陀螺漂移。漂移量是影响陀螺仪精度的主要漂移误差,也是影响陀螺仪性能可靠性的主要因素。一方面要求惯性仪表的漂移在允许的范围内,另一方面要求根据建立的漂移数据模型进行补偿以减少漂移对系统精度的影响。所以,利用实际陀螺数据,采用合理的方法对陀螺漂移数据进行建模,预测漂移性能的变化趋势,对误差进行补偿,及时预报陀螺仪故障,对于提高整个导航系统的精度有着十分重要的意义。陀螺漂移时间序列的最大特点是具有很强的非线性,需要一种具有较强非线性映射能力的预测模型。但是到目前为止在陀螺建模研究领域还没有一种较为成熟的模型建立。当然实际中已经存在一些预测数值类别属性的学习方法应用在其中。这些方法包括标准的回归,神经网络,支持向量机,基于实例的学习方法,回归树和基于预先离散化的预测等等。但是这些方法都有各自的不足之处:标准的回归虽然简单,运行速度快,但不是一种很有潜力发掘函数关系的方法,因为该方法暗含整个数据是线性关系的假设。支持向量机在运算速度上欠缺,当数据量大的时候无法满足导航系统的实时性。神经网络和基于实例的学习方法虽然更加有效但是缺乏透明性:模型不能显示它所代表函数关系的结构。而大多的使用机器学习的最终用户对于从模型里获知数据隐含结构的兴趣超过了模型对新数据的较好准确度的预测。模型树方法是决策树的一类变种,同样采用“分而治之”的思想,在传统的决策树的叶子节点中引入了线性回归模型。这种方法相对比较清晰,同时可以符合陀螺的变化过程“慢变化,快变化”,慢变化指的是陀螺随时间变化的漂移;快变化是指在慢变化的同时随机误差的影响。进而得到整个非线性模型。这种表示方法相对比较明晰,用分段的思想得到整体非线性的模型,因为决策结构很清晰并且回归方程通常情况下不会包含很多变量。2改进算法的思想构建模型树的基本思想是很直接的。在第一阶段我们使用决策树生成算法构建一棵树,不同的是决策树中在每个中间节点劈分的准则是最大化信息增益,而M5P(文献中基于Quinlan工作的基础上,详细给出了M5算法的实现,由于Quinlan的原文中缺乏详细的介绍,该文作者做了很多更细致的工作,引入了一些修改,并将其成果取名为M5P)使用的是最小化每个分支中子集类别属性的差异。在第二阶段,引入了从树的每个叶子节点向根部的剪枝策略。该方法是由Breiman和Quinlan分别于1984年和1986年独立提出的。目前剪枝的方法已经成为决策树生成中的标准。两人剪枝唯一的不同之处在于后者在剪枝到一个内部节点时采用了回归平面而非一个常量代替该节点。并且决定回归模型的属性就是参与了劈分决策到目前节点的属性。2.1基于psdr准则的树停止生长构造树的过程就是不断递归的劈分数据集的过程,劈分的标准就是将达到某个节点的样本的类属性的标准差作为该节点误差的量度,并且通过测试该节点数据各个属性计算误差的期望减小值,使期望误差减小值最大的属性被选择做劈分属性。同时我们注意到由于在某些过程中,其函数在某点的一阶导数反应了函数在该点处的斜率,而同在一条直线上或者近似在一条直线上的点其一阶导数应该是相同或者接近的,因此我们根据被选择劈分属性的值及其对应类别属性取值,计算出各点处的一阶导数,劈分的点则是选择劈分后两段中各段中点的一阶导数尽量接近。而考虑各段中点的一阶导数尽量接近时,我们再考虑与标准差减小值(StandardDeviationReduction)SDR类似的设计中来。基于上面的分析,劈分准则的设计过程公式可描述如下:记一个待劈分的数据集为{x1,x2,…,xn,y},其中xi(1≤i≤n)为可选劈分属性,y为类别标记属性,记当前考虑劈分的属性为xs(1≤i≤n),则假设xs和y之间的函数关系为y=F(xs),应用数值算法求出在每个不同的xs取值处的关于F的一阶导数,我们将求出的导数记作p,则对当前选择劈分属性,定义最佳劈分点标准如下:SDR=sd(p)−∑i|pi||p|×sd(pi)(1)上面式(1)是进行改进的劈分原则,其中,p为当前数据集对与劈分属性导数的标准差,i取1,2分别表示依据劈分点得到的两个子集,p为待劈分数据集样本数目,pi为依照该劈分点划分后的两个子集各自包含的样本数目,sd(pi)为依照这种划分后两个子集中的一阶导数的标准差。由此可见PSDR准则与SDR相比考虑了待劈分属性对类别属性的影响,而SDR则单单考虑了类别属性的取值。图1中给出了两段直线的导函数曲线和抛物线的导函数曲线,以及将该导数做为增益计算标准得到的曲线,可见该标准得到的劈分最优点正是在x轴的原点处。即从中间将抛物线劈开分别用两条直线拟和,这是比较直观的。树的生长过程和Breiman等人的CART类似,不同在于CART劈分选取了能得到最大期望差异减小或最大期望绝对偏差减小的属性(可以通过在命令行中设置选择不同标准)。文献中提到不管选择两种中的哪种标准对生成的树来说是不敏感的:生成的树都是类似的。树的生成不能无限制的进行下去,因此需要确定树停止生长的条件。M5P算法采用的树停止生长的条件有两个。一是劈分过程只有很少数量样本达到某节点,通常根据数据设置;二是到达节点样本的类别属性取的不同值很少时停止,通常通过达到节点的样本类别属性的标准差与总体样本类别属性标准差的比例来限制树的生长。2.2模型树算法的使用我们知道树的结构并不是越大越好,劈分的细可能会造成过拟和。而剪枝则可以提高模型在未知数据上的预测能力。剪枝的过程通过使用对测试数据期望误差的估计来进行。首先,对到达该节点的训练样本的预测值和实际值之间的绝对误差做了平均。这个平均将会低估未知样本的期望误差,为了补偿,将其乘于一个补偿因子(n+v)/(n-v),n是到达节点的样本数目,v是在该节点处参与表示模型的属性的数目。模型树算法为未进行剪枝的树的每一个中间节点计算了线性模型。该模型使用标准的回归构建,回归使用的属性是在此节点以下被使用过做劈分属性。得到的线性模型需要通过去掉某些项来最小化通过上面的补偿因子公式来计算的估计误差,去掉模型中某些项是通过贪婪法计算出来的。最终只要期望估计误差减小,一个新线性模型将在该节点处产生,该节点的子树也被剪掉。2.3模型预测值的计算最后一步使用平滑过程来补偿剪枝后树的相邻叶子节点处不可见的严重的不连续性,尤其是对于从小样本训练数据构建的模型。这个平滑过程由Quinlan提出,在叶子节点处计算预测的值,然后将该值向根节点反传,在沿途各个节点中通过与各个节点的线性模型预测值结合得到平滑后的预测值。计算公式是:p′=(np+kq)/(n+k)(2)p′是传向父节点的预测值,p是子节点传到改层的预测值,q是本层模型的预测值,n是到达本层节点的训练样本数目,k是一个常数(通常取值为15)。平滑从本质上增加了预测的准确性。2.4基于sdr的冲击性判据通过上一节中对模型树算法的描述我们可知在这个过程中含有四个要素:1)要指定劈分数据的标准。2)根据标准选择劈分属性及劈分点劈分数据。3)确定劈分停止条件。4)选择合适大小的用于预测的最终生分树。由此看出模型树的建立首要的工作在于劈分准则的选择,关于劈分准则的研究有很多文献。但是这些准则大多对于离散的分类问题,对于连续数值的预测中所采用的劈分方法,在Breiman等人的CART中选取了能得到最大期望差异减小或最大期望绝对偏差减小的属性,文献中提到选择两种标准中的哪一个对生成的树来说是不敏感的:生成的树都是类似的。M5P中使用的SDR劈分标准见式(1)。整个算法过程包含递归地劈分节点和从叶子节点向上进行剪枝两个主要部分。每个节点结构包含说明该节点是中间节点还是叶子节点的标志,指向左右孩子的指针,到达该节点的样本,用来劈分该节点的属性,以及该节点处的线性模型。计算标准误差值在算法一开始以及进行劈分的开始被调用来分别计算样本类别属性的方差。在劈分过程中,要统计节点元素的个数。在剪枝过程里,通过获得子树中使用属性来构建线性回归方程,这里是有那个线性回归模型,主要因为线性模型在一定条件下计算速度快,同时能够保障较好的拟合度。然后通过贪婪的舍弃线性模型中的一些项来减少估计误差。其中在剪枝过程中用到的误差函数的返回公式表示为:(n+v)n−v×[∑examples|devationfrompredictedclassvalue|]/n(3)其中n为该节点处的样本数目,v为节点处线性模型所使用的属性数目。3在螺母建模中的应用3.1敏感角速率该数据为光纤陀螺在不同温度下的各个输入角速度的转速数据。下面以各个陀螺数据进行详细说明:陀螺采样数据是不同的8个温度点,温度单位为摄氏度。各个数据文件的输入角速度分别为0,±1,±5,±10,±30,±50,±100,±150,±200,±250,±300,单位为°/s。其中规定了转速表示,采样速度,以及正副方向。输入角速度未考虑地速影响,所以在处理时每一个转速中需要减掉天向地速分量,即如果上述输入转速为30°/s,则光纤陀螺实际敏感角速率为(30-9.625/3600)°/s。如果是-30°/s,则为(-30-9.625/3600)°/s。根据经验数据,光纤陀螺标度因数K取值范围为:15000<|K|<16000光纤陀螺零位ω0(一次项)取值范围为:|ω0|<100°/h。注意:数据为1s采样,由于设备进行通断电操作,进行数据处理时应抛掉起始的1组和结束前的1组。3.2建立数学模型实验模型树参数设置叶子至少拥有实例数为300个(每个叶子实例数如果大于300就将进行劈分估计,小于300个将作为叶子结点停止劈分),平滑控制常量为15。主要步骤:1)利用LR建立模型得到大相关量,比如对于001陀螺,得到的LR模型为Y=144.3062+1.6603*T+15573.4168*W,其中W为大相关量;2)利用温度(T),角速率(W)和LR模型的误差(Y-YpredictbyLR)建立M5P模型;原因是W为模型的主要作用因素,W对于模型的贡献大于T对于模型的贡献,如果不将大相关量处理掉,W将掩盖T的作用;也就是说,使用数据建立的M5P模型全部都是以W为分割点,不能建立温度的模型。在实际操作中总结的经验是:T对于脱离建模有一定的影响,但不是主要因素,这也从一个方面说明验证了我们的试验思路。3)将LR模型与M5P模型混合使用,得到最终的分段模型。将模型树模型和线性回归模型进行对比,评价函数如下:RMSE=∑(yi−yˆi)2n−−−−−−−−√其中,yi为实际值,yˆi为预测值线性回归和模型树的RMSE分别为:LR的RMSE=878.241LR的模型为:Y=144.306223+(1.660311)*T+(15573.416777)*W因为M5P模型的建立是根据温度补偿的的方法,所以我们可以依据温度和角速度的范围将陀螺数据划分为以下几个区间,与之对应的是每个区间的模型,即M5P叶子节点的线性回归模型:1民国时期对种子至实体达力T≤-3.225741,W≤-40.002674,该叶子有到达实例有336个,RMSE为:338.035。方程:Y=278.772044+(2.079837)*T+(15566.705296)*W2主要到达实例T≤-3.225741,W>-40.002674,该叶子有到达实例有1148个,RMSE为:224.228。方程:Y=453.353373+(16.396511)*T+(15567.210681)*W3主要到达实例-3.225741<T≤34.749098,W≤-75.002674,该叶子有到达实例有420个,RMSE为:151.391。方程:Y=825.305027+(-41.233161)*T+(15573.356601)*W4%w7.976-3.225741<T≤34.749098,-75.002674<W≤7.497326,该叶子有到达实例有963个,RMSE为:65.796。方程:Y=111.991965+(1.708110)*T+(15571.777396)*W5种类到达实例29.514905<T≤34.749098,7.497326<W≤74.997326,该叶子有到达实例有167个,RMSE为:76.529。方程:Y=266.177608+(2.224540)*T+(15573.411461)*W6最大到达国外-3.225741<T≤29.514905,7.497326<W≤74.997326,该叶子有到达实例有169个,RMSE为:31.9444。方程:Y=111.866465+(2.218927)*T+(15573.411461)*W7主要到达实例-3.225741<T≤34.749098,W>74.997326,该叶子有到达实例有560个,RMSE为:205.483。方程:Y=-375.418446+(41.368799)*T+(15573.401591)*W8#t+5.843#w温度T>34.749098,该叶子有到达实例有941个,RMSE为:354.529。方程:Y=2291.339744+(-34.075628)*T+(15582.759883)*W温度在34.925548℃的时候绝对误差最大,其角速度值为-300.002674°/s,实际输出值为-4672903.700000,预测值为-4673768.397235绝对误差为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论