版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于聚类-SVR的航迹预测模型构建分析案例目录TOC\o"1-3"\h\u20201基于聚类-SVR的航迹预测模型构建分析案例 1264411.1航迹数据预处理 1112151.2“先聚类,后回归”的预测模型构建 4257891.3算法评估 71.1航迹数据预处理AIS系统是一种大型海上船舶助航系统,是一种新型的集现代互联网信息技术、现代移动通讯网络技术、计算机通信技术、电子信息以及显示等多种信息技术于一体的海上数字化船舶助航系统,对海上通信和事故定位有很大帮助。AIS原始数据如表2.2所示。表2.2AIS原始数据"!AIVDO,1,1,0,A,B2@0F6P003?8mP=18D0000E3QP06,0*3C\n","!AIVDO,1,1,0,B,B2@0F6P003?8mP=18D0000E3QP06,0*3F\n","!AIVDM,1,1,,B,15N4cJ`005Jrek0H@9n`DW5608EP0*13\n","!AIVDM,1,1,,B,23aJGi0P00PEKiJMaTj3Wwvr2>`<,0*69\n","!AIVDM,1,1,,B,13aBNA5P1PAPOdMOoqBlgvp2>`<,0*29\n","!AIVDM,1,1,,B,133dWgg0000Cp82ME`j1QQPp0>`<,0*5F\n","!AIVDM,1,1,,B,13aGDE5P1aPA`BLMHLU9wOvr2>`<,0*03\n",由于AIS设备自身以及外界条件的限制,得到的航迹数据往往不能够直接使用,需要进行针对性的预处理,整个预处理过程如图2.5所示。图2.5AIS航迹数据预处理流程图(1)AIS数据解析AIS原始数据由甚高频通过网络以数字编码的方式进行广播,是一种离散而不容易被人们理解的数据,对舰船轨迹进行挖掘和分析研究的基础与前提是将这些原始数据进行分析并转换成一种结构化的数据。所有首先要对其各个组成部分进行解码处理,才能解析所需要的水上移动通信业务标识码(MaritimeMobileServiceIdentify,MMSI)、时刻(time)、航速(sog)、经度(lng)、纬度(lat)和航向(cog)等各类信息,如表2.3所示。表2.3AIS航迹数据数据类别相关信息静态数据船名、呼号、MMSI、IMO、船舶类型、船长、船宽动态数据航速、经度、纬度、航向航次数据船舶状态、吃水、目的地航行信息航行警告、气象报告(2)AIS数据清洗经解析后的AIS数据由于其来源多样和操作人员有意或无意的错误,存在着数据格式不统一、数据质量差异大等问题,具体如下:重复:即连续两条数据完全一致,此类问题比较常见,处理方法比较简单,删除两条重复数据中的后一条即可。缺失:如某一行数据中某个属性数据为空等,对于缺失某些动态信息的数据,常用处理方法是利用三次样条插值进行填充。错误或异常:某些数据明显与客观事实不符,如航向超出0~3599、航速超出0~1022、相邻两条记录经度和纬度变化较大等(AIS航迹数据中航向、航速数值均为实际的10倍),此类数据都应该去除,否则会对实验结果产生不可忽视的影响。(3)数据归约每一条AIS数据中记录着大量信息,在本文对舰船航迹的研究中,我们只需提取MMSI、时刻、航速、经度、纬度和航向等六种属性信息,这样可以有效提高后续计算效率,如表2.4所示。表2.4提取关键属性MMSItimesoglnglatcog2111480001332229808219120.996621.75413322111480001332229941221121.004321.76543232111480001332230188218121.012921.77323462111480001332230337219121.020521.78413522111480001332230465220121.028321.79693382111480001332230602222121.036221.80673432111480001332230738223121.044021.81883402111480001332230863227121.052721.8302312(4)AIS数据规范化为了使表示不同属性的各数据之间具有一定的可比性,需要我们对这些数据进行一次无量纲化的处理。常用的规范化包括z分数规范化、正则化、小数定标规范化以及最小最大规范化。不同方法适用于不同类型的数据,根据AIS航迹数据的应用特点,选择最小-最大航迹规范化,其表达式为:(2.20)其中,和分别是为该属性的最小值和最大值。最小-最大规范化是将的实际值反应到区间中的,如表2.5所示。这样既能放大某些特征之间的差别,又能够保留原始数据中潜在的权重关系,因此被广泛应用。表2.5数据规范化MMSItimesoglnglatcog21114800013322298080.85250.38780.58360.092321114800013322299410.86070.38860.58450.089821114800013322301880.84840.38950.58510.096221114800013322303370.85250.39030.58600.097921114800013322304650.85660.39110.58700.094021114800013322306020.86480.39200.58780.095421114800013322307380.86890.39280.58870.094521114800013322308630.88520.39370.58960.0867在实验分析部分,为更好的进行结果可视化或误差比较,往往需要对进行反归一化操作,其表达式为:(2.21)1.2“先聚类,后回归”的预测模型构建舰船目标的航迹会受到多方面因素影响,其中目标本身的意图和地理海域环境影响最为突出,而目标意图和海域环境的影响往往在历史航迹上体现明显,即具有相同目的意图的舰船,往往在航线规划上大体相同,除此之外,舰船目标航迹数据为时间序列数据,舰船未来航迹很大程度上与过去时间内的航迹有关,为了增加舰船航迹预测的准确性,需要综合以上两种模型,建立基于聚类-SVR的航迹预测模型,航迹预测模型的建立可分为航迹聚类、航迹预测和综合预测模型[27]三个步骤。(1)航迹聚类通过2.1.2节我们得到了基于K-Means聚类算法的航迹聚类模型,并将历史航迹数据分成k个类,记作;通过2.2.2节我们得到基于SVR的单一航迹预测模型。给定包含有限个航迹点的被预测航迹T,可以将其表示为由一组离散轨迹点组成的序列:(2.22)其中,为航迹点。每一个航迹点可以用一个三维特征向量进行表示:(2.23)其中,、和分别表示航迹点的系统时间、经度和纬度,航迹预测就是根据当前n个时刻组成的序列,预测n+1时刻最可能出现的位置点。由于基于K-Means航迹聚类模型是对历史所有航迹进行聚类分析,将被预测航迹T进行分类时是根据相似性度量来确定的,很难出现完全相似的,所以对于被预测航迹T的分类是概率性分类,为了减小概率性对聚类结果的影响,首先,分别计算被预测航迹T与航迹聚类模型所得出的所有航迹类的相似性度量,设定阈值参数,表示当航迹T与的相似性度量大于时,认为T不属于类,类轨迹对T影响很小,可以忽略,反之则影响较大,最后得出对目标航迹T影响较大的航迹类的集合。(2.24)为航迹类中的第i个位置点,遍历中每个航迹类,根据欧氏距离寻找每个航迹类与被预测航迹的末端位置点的最近位置点,此时和之间欧式距离为:(2.25)其中表示有n个位置点组成的航迹类中第i个位置点。令到中每个航迹类的最近位置的下一时刻位置方向的向量为,我们可以得到m条这样的向量,为每条向量赋予权值,被预测航迹T与的相似性度量越小,T被分为类的概率越大,相应权值越大,向量赋予权值为:(2.26)将m条向量进行矢量合成,最终得到聚类预测结果向量,以上过程如图2.5所示。图2.5航迹预测模型过程其中n=4、m=2。(2)航迹预测将被预测航迹带入基于SVR的单一航迹预测模型中,得到回归预测的位置信息,具体算法过程在2.2.2节中已经给出,令到的向量为。(3)综合预测模型采用基于向量夹角余弦固定权值组合预测的思想[28][29],将聚类分析结果与回归预测结果进行组合,设为被预测航迹在第n个位置点处的组合预测值。(2.27)其中,为聚类分析算法的加权系数,为聚类分析算法的加权系数,和都是在区间[0,1]中的固定值。使用上述相同的方法,分别计算出被预测航迹T的前个航迹点的聚类分析向量和回归预测分析向量,为使预测准确,每一个航迹点的预测向量与真实值的向量夹角最小,也就是最大化向量夹角的余弦值,综上所述建立和的方程:(2.28)通过公式(2.3.9)计算得出聚类分析和回归预测分析的加权系数和,根据公式(2.3.8)求得聚类-SVR航迹预测模型的最终预测结果。1.3算法评估本文使用某日南海区域的AIS数据作为算法评估的数据集,经过数据预处理、特征提取和归一化处理,并剔除停泊的船舶数据后从中随机选择200批航迹,共11693个航迹点作为总的测试数据集,按照交叉验证法的思想,将数据集按照7:3的比例随机划分生成训练集和测试集,将训练集带入基于K-Means的航迹聚类模型中进行训练,k值取20。航迹预测的精度和准确率与预测结果和真实结果的误差有着紧密的联系,因此,本文选择了三种常用的评价指标来度量模型航迹预测的准确性。(1)均方误差(MSE):(2.29)(2)平均误差和(SSE):(2.30)(3)平均绝对误差(MAE):(2.31)式中为被预测舰船实际位置,为航迹预测模型预测舰船位置,评价标准为:各误差指标越小,航迹预测模型预测效果越好,评价指标越大,效果越差。对测试集进行处理,只取每条航迹的前一半数据作为测试数据,将得得到的预测结果与截取掉的航迹数据进行对比,采用均方误差作为评价指标来度量航迹预测模型的预测准确性。为使所得实验结果更具有说服力,避免偶然性的发生,均取50次运行结果的平均值,同时与不同的回归预测模型进行对比,预测结果如。表2.6航迹预测结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年危旧房改造自主更新原拆原建模式操作手册
- 游戏产业发展报告:机遇、挑战与创新路径
- 中国新能源产业人才需求与发展趋势分析
- 城市规划与可持续发展实践案例研究
- 创业者:商业计划书制作与融资策略
- 数据分析师技能提升手册
- 微课在教育教学中的应用价值及其开发模式研究
- 中医的食补法在慢性疾病调理中的重要性
- 国际经济形势下的企业对外投资决策分析
- 机器学习在人工智能领域的应用案例
- 2026河北衡水恒通热力有限责任公司公开招聘工作人员28名考试参考题库及答案解析
- 小区道路及室外管网配套工程施工设计方案
- 网吧的安全保卫制度
- 2026届高三高效学习方法与备考策略
- 2026广东中山市民政局招聘雇员2人考试参考试题及答案解析
- 2026年六安职业技术学院单招职业适应性考试题库含答案详解(综合题)
- ISO 14067-2018 温室气体产品的碳足迹量化要求和指南培训课件
- 华南地区地理知识
- 危险化学品安全法解读
- 广东省佛山市南海区2025-2026学年上学期期末八年级数学试卷(含答案)
- 石油天然气科普
评论
0/150
提交评论