(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf_第1页
(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf_第2页
(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf_第3页
(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf_第4页
(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf_第5页
已阅读5页,还剩82页未读 继续免费阅读

(交通信息工程及控制专业论文)港口水域航迹带宽度和操纵参数的回归分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 随着,主产力的快速发展及航运业运输成本的低廉,国际航运业务取得了长足 进步。与此同时,船舶多样化、大型化的发展趋势,使得港口及附近水域交通流 量增加明显,船舶会遇机率大幅提高,船舶在港口及附近水域的航行安全受到很 大影响。本文将对大型船舶航迹带宽度、转弯半径、制动距离、旋回圈半径进行 回归分析,得出这些量的多重回归方程。根据回归方程可知是哪些因素对航迹带 宽度、转弯半径、制动距离、旋回圈半径产生影响,以及各因素对这些量影响程 度的大小。为港口附近水域建设提供参考,同时为大型船舶在港口附近水域的安 全航行提供一定的帮助。 文章依托中交水运规划设计院有限公司与大连海事大学签订的“开敝式码 头设计与施工技术规程一大型船舶回旋水域、制动距离、和航道尺度船舶实船 测量研究”这一项目。曾昆基于实态的船舶航迹带宽度和操纵参数的研究对 航迹带宽度、转弯半径、制动距离、旋回圈半径进行统计分析,对海港总平面 设计规范提出了一些修改建议的基础上。本文将扩大数据的收集范围,对数据 作进一步的细化,选出适合本研究的样本。利用数理统计知识,采用适当的方法 对所得样本进行回归分析,得出回归方程。 经多重回归分析,得到港口附近水域大型船舶航迹带宽度和操纵参数与各相 关因素的回归方程,经各类检验,各方程在总体显著性、参数显著性、多重共线 性问题及各假定的结果是比较理想的。将所得多重回归方程进行多重回归预测, 结果比海港总平面设计规范要大,这与样本选择的都是船长3 0 0 m 以上的大 型船是有关系的。通过方程可反映出各类大型船舶在港口附近水域航迹带宽度和 操纵参数与各因素的相关程度,并可对各类大型船舶在港口附近水域航迹带宽度 和操纵参数作出预测。总体上来说,所得回归方程对大型船舶在港口及附近的航 行和港口建设有一定的指导意义,为港口附近资源的充分利用提供参考。 关键词:ais 数据;多重回归;航迹带宽度;操纵参数 英文摘要 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fs o c i a lp r o d u c t i v i t ya n dt h el o wc o s t so ft h e s h i p p i n gi n d u s t r y ,i n t e r n a t i o n a ls h i p p i n gb u s i n e s sh a sm a d ec o n s i d e r a b l ep r o g r e s s a t t h es a m et i m e ,t h et r e n do ft h es h i pd i v e r s i f i e da n dl a r g e - s c a l ed e v e l o p m e n th a s i n c r e a s e dt h ep r o b a b i l i t yo fs h i p s e n c o u n t e r i n ge a c ho t h e rn e a rt h ep o r t t h es a f e t yo f n a v i g a t i o ni nt h i sr e g i o nw i l lb eg r e a t l ya f f e c t e d t h i sp a p e rw i l lm a k em u l t i p l e r e g r e s s i o na n a l y s i so fl a r g ev e s s e l s t r a c kw i d t ha n dc o n t r o lp a r a m e t e r s a c c o r d i n gt o t h er e g r e s s i o ne q u a t i o n s ,w ec a nd i s c o v e rw h i c hf a c t o ra f f e c t st h et r a c kw i d t ha n d c o n t r o lp a r a m e t e r sa n dh o wm u c hi m p a c to nt h en e a r b yp o r tw a t e r sb yt h a tf a c t o r b y t h a tw ec a l lg i v eh e l pt ot h eb u i l d i n go ft h ep o r ta n dt h en a v i g a t i o nn e a r b yt h ep o r t t h ep a p e rb a s e so nt h ep r o j e c t ”o p e nt e r m i n a ld e s i g na n dc o n s t r u c t i o no f t e c h n i c a lr e g u l a t i o n s t h ew a t e r so fl a r g ev e s s e l sr o u n d a b o u t ,b r a k i n gd i s t a n c e ,a n d t h e f a i r w a ys c a l es h i p m e a s u r e m e n t s t u d y ” w h i c hs i g n e db e t w e e nc h i n a c o m m u n i c a t i o np l a n n i n ga n dd e s i g ni n s t i t u t ef o rw a t e r w a yt r a n s p o r t a t i o na n d d a l i a nm a r i t i m eu n i v e r s i t y i n ”t h es t u d yo ft r a c kw i d t h & m a n o e u v r i n gi n d e x b a s e do nt h eo b s e r v a t i o ni nr e a l i t yc o n d i t i o n ”,z e n g k u nh a sg i v e ns o m es u g g e s t i o n s t ot h e ”d e s i g nc o d eo fg e n e r a ll a y o u tf o rs e ap o r t ”o nt r a c kw i d t h ,t u m i n gr a d i u s , b r a k i n gd i s t a n c ea n dc i r c l er a d i u s h e r e1 w i l le x p a n dt h es c o p eo fd a t ac o l l e c t i o n , c l a s s i f yt h ed a t ea n dc h o o s et h ea p p r o p r i a t es a m p l e b yt h em u l t i p l er e g r e s s i o na n a l y s i s ,w ew i l lg e tt h er e g r e s s i o ne q u a t i o n s t h r o u g h t e s t s ,t h es i g n i f i c a n c eo ft h ee q u a t i o n sa n dc o e f f i c i e n t s ,m u l t i c o l l i n e a r i t yp r o b l e m s a n da l la s s u m p t i o n sa r ei d e a l t h ep r e d i c t e dv a l u e so ft h er e g r e s s i o ne q u a t i o n sa r e s l i g h t l yl a r g e rt h e nt h e mi nt h e ”d e s i g nc o d eo fg e n e r a ll a y o u tf o rs e ap o r t ”t h a ti s b e c a u s et h el e n g t ho ft h es h i p si nt h es a m p l e sa r ea b o v e3 0 0m e t e r e s t h r o u g ht h e r e g r e s s i o nw e c a r ll e a r nt h er e l a t i o n s h i pb e t w e e nd e p e n d e n tv a r i a b l e sa n di n d e p e n d e n t v a r i a b l e s w ec a na l s op r e d i c tt h et r a c kw i d t ha n dc o n t r o lp a r a m e t e r so fl a r g ev e s s e l s n e a rt h ep o r tw a t e r o v e r a l l ,t h er e g r e s s i o ne q u a t i o n sw i l ld og o o dt os h i p s n a v i g a t i o n , t h ep o r t sc o n s t r u c t i o na n dt h ef u l lu t i l i z a t i o no fr e s o u r c e sn e a rt h ep o r t k e yw o r d s :a i sd a t a ;m u l t i p l er e g r e s s i o n ;t r a c kw i d t h ;c o n t r o lp a r a m e t e r s 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成博硕士学位论文 :鲞旦丞邀魅逛萤童廑塑拯继叁麴的回归佥逝= = 。除 论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已 在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已 经公开发表或未公开发表的成果。本声明的法律责任由本人承担。 学位论文作者签名:弘生灸 学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学 位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本 学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士 学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论 文全文数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式 出版发行和提供信息服务。保密的论文在解密后遵守此规定。 本学位论文属于:保密口在年解密后适用本授权书。 不保密口( 请在以上方框内打“ ) 敝储样引久铆摊刁哗 日期:p 年歹月夕日 港口水域航迹带宽度和操纵参数的同归分析 第1 章绪论 1 1 本文的研究背景 2 0 世纪四五十年代,第三次科学技术革命到来,推动社会生产力飞速发展。 生产力的飞速发展,推动了国际经济贸易的发展,船舶运输业由于成本低廉、运 量大,受到人们青睐。船舶数量不断增加:油轮、散货船、集装箱船等专用船舶 已形成规模,水翼船、半潜船等新型船舶日益发展,船舶种类趋于多样化;为降 低运输成本,船舶向大型化发展,尤其以油船、散货船、集装箱船的大型化最为 明显。这些船长度从4 0 、5 0 年代的1 0 0 多米到现在的3 0 0 多米甚至4 0 0 米,吨级 有当时的万吨级到现在的几十万吨级,吃水也多达十几米甚至二十几米【l j 。 上述情况导致了船舶交通流量的大大增加,使得港口和狭水道等水域变得拥 挤,增大了有限水域内船舶的会遇次数,从而增加了船舶交通的危险度,在一定 程度上影响到船舶海上行驶安全【2 1 。 同时各地港口为适应船舶大型化和高速装卸的要求,争做枢纽港或主干航线 挂靠港,在未来全球运输网络和地区经济发展中扮演重要较色,纷纷进行新港口 建设和泊位改造。特别是诸如河北曹妃甸、上海洋口港、连云港、青岛港、天津 港等建设和改造项目的完成,使得各大港口货物吞吐能力获得极大提高的同时, 港1 3 的通航安全压力也倍增【3 卅。 为更加合理地使用港口及其附近水域有限的资源,改善船舶航行条件和港区 交通状况,发挥港口优势和扩大港区吞吐能力,需要在港口规划、建设中充分考 虑船舶大型化对通航环境带来的影响,以便从宏观和微观方面了解和把握船舶航 行对水域的需要与实际利用情况。因此,确定大型船舶在港口附近水域航迹带宽 度与操纵参数和船长、船宽、船舶载重吨、风流等因素的关系就显得非常必要【5 1 。 1 2 本文的研究目的及意义 正如研究背景所说现在各大港口正朝着泊位大型化、专业化和港口物流化的 方向发展,港口及其附近水域船舶交通流量增加,使得该区域船舶操纵环境变得 复杂,对驾驶员的船艺水平有了更高的要求【6 1 。而从a i s 基站获得的船舶在港口 第l 章绪论 及其附近的航行数据,能够实时的反映出船舶的运动情形。有了这些数据就能求 出船舶的航迹带宽度、制动距离、转向半径及旋回圈大小。 曾昆基于实态的船舶航迹带宽度和操纵参数的研究对大型船舶航迹带宽 度、制动距离、转弯半径、旋回圈大小进行统计分析,对我国目前执行的海港 总平面设计规范中一些结论提出了适当的改正意见。在这本文扩大数据筛选范 围,选取研究所需样本,利用数理统计的原理对样本进行回归分析,得到各量的 回归方程,这样利用现有数据可对大型船舶港口附近水域航迹带宽度、制动距离、 转弯半径、旋回半径作出预测;同时根据回归方程也可知航迹带宽度、制动距离、 转弯半径、旋回半径与所选各自变量的相关程度。这样对现有港口资源的利用及 以后港口及附近水域建设适合船舶大型化和大型化船舶航行都有一定的参考意 义。 1 3 本研究的必要性 国内外对航道水域占用情况的研究,有实船观测、实船试验结合模拟研究、 船模试验、变态船模试验、理论计算和查阅设计规范资料等方法【7 - 1 1 1 【5 7 】。如下: ( 1 ) 实船观测方法对不进出实测水域的船型无法观测;风流等外界自然条件只 限于实测时的一种状况,难以对船舶受横风、横流和极限风流影响的状况进行实 测;一次观测的成本和准备时间较长,要进行大量的实船观测是困难的。 ( 2 ) 船长和最大风流压偏角及船舶间距和岸边富裕宽度的经验值决定的方法, 要达到一定的精度,必须对船模试验中可能产生的误差进行分析,并找出修正误 差的方法。并配合适当的数学模型及船舶模拟,结果精度才更可信。 ( 3 ) 理论计算的缺点是各种因素很难考虑全面,且一些因素很难量化。 ( 4 ) 以模拟器为平台中一些量( 风、流、拖轮增减) 的设定与实际情况可能有 着较大的出入【2 1 。 针对以上对航道占用的研究,曾坤在基于实态的船舶航迹带宽度和操纵参 数的研究研究中提出了以下方法: ( 1 ) 以解码所得a i s 数据作为基础,利用最小二乘法,进行航迹绘制; ( 2 ) 再利用相关原理求取航迹带宽度及操纵参数; 2 港口水域航迹带宽度和操纵参数的回归分析 海港总平面设计规范对航迹带宽度、转弯半径、制动距离、旋回圈半径给 出了经验公式和一些经验值,船舶大型化使其已不能完全满足需要。在曾昆基 于实态的船舶航迹带宽度和操纵参数的研究中主要对厦门港附近大型船舶航迹 带宽度、转弯半径、制动距离、旋回圈半径进行了统计分析,对海港总平面设 计规范提出了适当改正意见。本文扩大数据采集范围,使研究结果更好的反映 大型船舶在港口附近水域的航行状态。研究也不应仅仅局限在对大型船舶航迹带 宽度和操纵参数的统计分析上,要进一步确定大型船舶航迹带宽度、转弯半径、 制动距离、旋回圈半径与船长、船宽、载重吨、吃水、风流等因素的关系。对这 些量进行回归分析得出回归方程,利用回归方程对这些量进行预测并为大型船舶 在港口附近水域的航行及港口建设适应船舶大型化趋势提供参考。 1 4 本论文的主要工作内容及基本方法 本文的工作内容主要包括以下几方面: ( 1 ) a i s 数据的扩大收集、解析及对a i s 有效数据的筛选及数据坐标转换; ( 2 ) 根据获得的数据解得航迹带宽和船舶操纵参数; ( 3 ) 论文写作所需样本的选择; ( 4 ) 用数理统计知识对所选取的样本进行回归分析: ( 5 ) 对所得多重回归方程进行总结分析,看其可用性及对大型船舶航行和港口 附近水域建设的影响。 本文对取得的样本进行回归分析,得到大型船舶在港口附近水域航迹带宽度 和操纵参数的回归方程,通过方程可知各自变量对航迹带宽度和操纵参数的影响。 1 5 本章小结 本章主要介绍了论文写作的背景、目的、意义及其写作的必要性。重点介绍 了作者写作论文的主要原理方法及作者所要做的工作,论文主要利用数理统计知 识对所得样本进行回归分析,得到航迹带宽度和操纵参数与船长、船宽、风流等 因素的具体关系,为大型船舶在港口附近水域航行及港口建设适应船舶大型化提 供一定参考。 第2 章研究数据的收集 2 1als 简介 第2 章研究数据的收集 2 1 1a is 的概念及主要功能 ( - ) a i s 的概念 船舶自动识别系统( a u t o m a t i ci d e n t i f i c a t i o ns y s t e m ,简称a i s 系统) 是一种 新型助航系统。典型的a i s 系统有基站管理服务器、访问信息服务器、中心网络 管理服务器加监控软件构成陋1 3 1 。i m o 把其定义为一种改善避碰的船载自备工 具,无需雷达而使v t s 获得交通信息的工具,一种船舶报告系统工具【1 4 1 。 ( - z ) a i s 主要功能 在i m o 正式公布a i s 的性能标准并强制船舶安装之前,a i s 系统已经在欧美 等发达国家得到了一定的应用。总结起来,a i s 的主要功能如下几点 1 5 - 1 7 】: ( 1 ) 自动地向主管部门、岸台、其他船舶提供自动识别信息,而不需要人员的 参与。 ( 2 ) 自动的接受和处理来自其他来源,包括主管部门、岸台、其他船舶的自动 识别信息。 ( 3 ) 自动识别信息包含静态信息、动态信息、与航行安全相关的信息。 ( 4 ) 对高优先和与安全相关的调用尽快作出回应: ( 5 ) 以支持主管部门和其他船舶进行精确跟踪所需的更新速率提供船位和操纵 信息,使接受者精确地跟踪和监视船舶动态。 ( 6 ) 与岸基设施交换数据,以便主管部门指配工作模式、控制数据传输时间和 间隙。 ( 7 ) 以许多模式工作,数据的传输响应有来自于船舶或主管部门的问询,有轮 询和受控两种模式。 ( 8 ) 提供国际海事标准界面,并由人工输入和输出数据的接口。 a i s 系统的上述功能,在船舶避碰、v t s 自动识别、船舶遇险搜救、海岸监 控等方面都有重要意义。 4 港口水域航迹带宽度和操纵参数的回归分析 2 1 2a l s 的信息内容及更新速率 ( - ) a i s 信息内容 a i s 主要利用广播式转发卫星定位数据原理、时分多址通信原理、自组织通 信原理等原理。数据在传送过程中,是以消息的方式进行传送的,消息共有2 2 种类型【1 8 】。a i s 的信息种类有:静态信息、动态信息、与航次相关数据、与安全 相关的短电文。如表2 2 【1 9 】所示: 表2 ia i s 信息种类及内容 t a b 2 1a i sm e s s a g et y p e sa n dc o n t e n t 类别包含内容 静态信息 动态信息 与航次相关信息 船名与呼号、i m o 号码、螂i 码、船长和船宽、船舶类型、g p s 天线在船上的位置( 离船首船尾及左右弦的位置) 、船舶的龙 骨以上高度、电子定位设备类型 船位、对地航向c o g 、对地航速s o g 、u t c 时间、船艏向h d g 、 航行状态( 需要时由人工输入,包括主机动力航行、锚泊、失控、 操纵能力受限、系泊、吃水受限、搁浅、从事捕捞、操帆航行 等) 、横倾角、回旋速率回旋速率( 如有) 船舶吃水、货物类型、目的港和预计到达时间e t a 、航 线计划( 转向点) 等 与安全相关的短电文和安全相关的数据、辅助航行数据、计划航线、船上人数等 ( - = ) a i s 数据更新速率 国际海事组织通用船载自动识别系统性能标准和我国国家标准船载自 动识别系统( a i s ) 技术要求( g b t2 0 0 6 8 2 0 0 6 ) 的规定,不同信息的更新速率 分别为【2 0 2 1 】: ( 1 ) 静态消息:每六分钟,或者当数据被修正。 ( 2 ) 动态消息:根据速度和航向改变状况,如表2 3 所示。 5 第2 章研究数据的收集 ( 3 ) 航次相关信息:每六分钟或者当数据被修正。 ( 4 ) 安全相关短电文:根据请求。 表2 2 动态信息更新速率 t a b 2 2t h eu p d a t i n gr a t eo fd y n a m i ci n f o r m a t i o n 船舶航行状态 更新时间 抛锚船 航速0 1 4 k n 航速0 1 4 k n 且改变航向 航速1 4 一- - 2 3 k n 航速1 4 2 3 k n 且改变航向 船速 2 3 k n 船速; 2 3 k n 且改变航向 2 2a i s 信息采集及有效数据的筛选 2 2 1a is 信息的采集 根据i m o 的要求,a i s 的短电文信息是以字符码的形式存在,用标准a s ci i 形式进行传输。如果信息量过大,可采用两个或更多连续时隙传输,最多为5 个 时隙;数字或状态信息,更新速率快,可采用二进制形式进行传输【2 4 】。 a i s 信息主要通过船舶上安装的各种设备,如:g p s d g p s g n s s 、陀螺罗经、 雷达a r p a 、计程仪、e c d i s 、v d r ,数据信息有传感器记录输入。a i s 信息采 集框图如图2 2 1 2 5 j 所示: 6 蛐 佻 铅 风 熟 弧 孤 港口水域航迹带宽度和操纵参数的回归分析 2 2 2a is 数据解析 a i s 信 息 处 理 器 弋困 一匾 一困一困 图2 1a i s 信息采集框图 f i g 2 1t h ec h a r to fa i si n f o r m a t i o nc o l l e c t i o n 整个解析的过程是这样的,启动系统,进行初始化,将串口各状态初始化为预 测的值,信息通过串口由电脑接受,对接受的信息进行校验,看是否已经接受完 一帧,如果接受完整的话,调用数据处理程序,进行解析;如果信息不足够一帧, 将继续接收数据直到接收到完整的一帧f 2 6 】。 从a i s 串口接收到的信息为6 字节的a s c i i 码,根据数字编码表对其进行编 码得n - 进制字符串。通过这个过程a i s 数据的解析就完成了,最后就是a i s 信 息在e c d i s 上以图形化、数字化等形式的显剥2 7 1 。 2 2 3 坐标转换 a i s 数据解析完成后,这些数据对我们直接利用不十分方便。因为a i s 所提 供的位置数据是基于w g s 8 4 基准的大地地理坐标系,对于习惯于笛卡尔直角坐 标系的我们是十分的不便。为了能够更好的利用这些数据,方便以后的研究工作, 第2 章研究数据的收集 本文将基于w g s 8 4 基准的大地地理坐标系的位置的值转化为以测定点附近为坐 标原点的x 轴与当地东线、y 轴与当地n 线重合的笛卡尔直角坐标系口9 。o 】。 将某点的地理坐标( 九,q ) 转换为直角坐标( x ,y ) 要经过下面这两步【3 1 1 : ( 1 ) 地理坐标( 九,( p ) 是以度为单位的,要将其换算成以米为单位的; ( 2 ) 用船位的直角坐标值减去测定地点选定的坐标基准点值即可得出船位在 测定地点坐标系的直角坐标。 某点地理坐标( 九,q ) 转化为直角坐标( x ,y ) 公式为口2 。3 】: 九霄a c o s x2180-r未x1-e2s i n 2 ( p ( 2 1 ) 削l n 【伽( ;+ ( 2 a ,、1 ) ( 1 堋- e s i i n n ( 缈a ) ,们】 ( 2 2 ) 在w g s 8 4 坐标中a = 63 7 81 3 7 o m ,e 为w g s 8 4 坐标系地球椭圆体偏心率, 取值0 0 8 1 8 1 9 1 9 1 。 2 3 本文所用数据 2 3 1 所用a ls 数据及常出现问题与解决办法 本文用a i s 数据【2 8 1 ( 1 ) 动态数据:船舶位置( 经度、纬度) 、对地航行速度s o g 、航迹向c o g 、 船艏向h d g 、回旋速率。 ( 2 ) 静态数据:船长、船宽、吃水、d w t ( 载重吨) 、g p s 天线在船上的位 置和船舶类型。 ( 3 ) 与航次相关信息:船舶吃水。 本文所用到的a i s 数据常出现的问题 ( 1 ) 数据输入错误:由于静态数据是在安装a i s 设备时输入的数据,在实际 应用中发现有些数据输入有误。 8 港口水域航迹带宽度和操纵参数的回归分析 ( 2 ) 陀螺罗经信号没有接入a i s ,使得艏向没有显示或显示固定值。根据国际 海事组织通用船载自动识别系统性能标准和我国国家标准船载自动识别系 统( a i s ) 技术要求( g b t2 0 0 6 8 2 0 0 6 ) 的规定,如果信息不可用,则显示“5 1 1 ”。 ( 3 ) 旋回速率显示不准确,主要原因也是罗经信息未接入,这时信息显示为 , 4 - 1 2 7 ”。 对数据常出现问题的解决办法【2 】 为了使回归分析中样本的选择更加可信,对于数据出现的问题,主要采取以下 方式来解决: ( 1 ) 动态数据:由于动态数据输出后具有不可变动性,实际上也不能对其进行 改动。船舶在运动中各种动态数据时刻在变化,此刻过后数据输出,如果对其改 动,那么船舶的航迹就会变动。变动数据对于本研究的可信性造成动摇,也不符 合科学研究的精神。为了处理动态数据中存在的误差,本文采用加大样本容量的 方法,使样本数据能更好的反映船舶的运动状态。 ( 2 ) 静态数据:由于输入或其他方面的原因,解析后的静态数据可能出现丢失 或变动。解决静态数据问题的方法是登录m a r i t i m e d a t a c o m ( 海事数据网) ,根 据v e s s e le v e n t s 中的数据进行对比和补充。 在海事数据网中,只要知道船舶的船名、m m s i 、n a m e 、c a l l 、i m o 编号、 等信息中的一项就可以知道该船舶的其他信息,这样对于解析后不全面的静态信 息就可以通过这种方式将其补充完整。 当然除了上述对所用a i s 数据的修正,保证信息可靠性外。a i s 相关设备的 正确安装与使用也能够保证其传输信息的可靠性,从而对利用a i s 信息所进行的 航迹带宽度、制动距离、旋回半径、转弯半径的研究准确性有着极大的提高2 2 2 ”。 2 3 2 航迹带宽度与操纵参数的获取 本文所用到的a i s 数据主要来自天津港、大连港、青岛港、上海港、宁波港、 厦门港。将这些数据按照上面所讲的方式解析后,将其转化为数据库格式。这里 所选数据都是船长3 0 0 m 以上的船,为保证同一条船舶在一段时间里的数据不被 遗漏,要以船舶的m m s i 作为牵引。本文将加强各港口附近水域大型船舶航行数 9 第2 章研究数据的收集 据的收集,使所得样本数据能够更好反映大型船舶在港口附近的航行状态。另外, 扩大数据搜寻范围的月份,使某个港口的数据不仅仅局限在一两个月,使所得数 据更加广泛。 将获得的数据按照曾昆基于实态观测的船舶航迹带宽度和操纵参数的研究 中的方法,计算船舶航迹带宽度、转弯半径、制动距离、旋回圈半径。下面将对 具体算法做个简单介绍f 2 】, ( 1 ) 航迹带宽度分为两部分,一是航迹偏移量,二是船舶本身占用的航道空间。 航迹偏移量按如下方法求取,首先求出船舶航行时的航迹线,然后求出船舶在航 迹线两侧的最大偏距相加即可得出船舶航迹偏移量。海港总平面设计规范船 舶本身占用的空间有式2 1 可得, a = l s i n y4 - b ( 2 1 ) 为船长,b 为船宽,y 为风流压差。 那么航迹偏移量与船舶本身占用的航道空间之和就为航迹带宽。 ( 2 ) 转弯半径计算法是用最d - - 乘法进行曲线拟合,求出圆的最或是位置,计 算出圆心坐标和圆半径。 ( 3 ) 本文的制动距离是实际制动距离,即,船舶在某初始速度减速开始至完全 停止的距离。其计算方法如式2 。2 , ( f = o 、1 、2 。厅) k ,乩) 为开始减速时位置坐标,x , ,) 为速度降为0 时位置坐标,“,乃) 为 此过程中某时刻位置坐标。 ( 4 ) 回旋半径计算法是根据a i s 信息用两个点代表船首尾位置,这样一组点就 记录了船舶旋回时的轨迹。以这组点中横坐标最大值与最小值做一矩形,以矩形 中点为圆心,以该点到最远处船位点距离为半径做圆。那么此圆的半径就是船舶 作旋回时的旋回半径。 1 0 港口水域航迹带宽度和操纵参数的回归分析 2 4 本章小结 本章主要对a i s 系统做了简单介绍,并讲解了基于a i s 的数据采集。同时指 出本文用到的数据及通常存在的问题,并提出了解决这些问题的办法,通过这些 处理措施使获得的研究数据更加可信,使样本的选择更具代表性。最后指出用所 得数据获得航迹带宽度及操纵参数,获得进行回归分析所需数据。 第3 章多重回归分析介绍 第3 章多重回归分析介绍 日常生活经验告诉人们,因变量的变化在多数情况下受到多个自变量的影响, 只受单个自变量影响的情况只占少数。多重回归所要解决的则是因变量与多个自 变量之间的线性关系问题【3 4 1 。 3 1 多重线性回归与最小平方法 3 1 1 多重线性回归介绍口5 q 7 1 已经知道因变量y 与自变量x l 、x 2 、x p 之间具有线性依赖关系的话, 对于给定的一组自变量x l i 、x 2 i 、x p i 就可写出多重线性回归模型( f = 1 , 2 ,刀 下面也如此) 。 y l = i b0 + l | bixl i + p2x2 i + + p p xp i + s i ( 3 、) 肺、- 、届称为模型参数; 占t 是一误差项随机变量; 回归分析的目的,就是要确定模型参数的具体值,进而能够确定回归模型的 具体形式。 为了使得到的回归方程更加可信,对回归模型做出以下假定: ( 1 ) 因变量与解释变量之间的关系主要是线性形式。 ( 2 ) g ,的方差相等。 ( 3 ) 占,具有独立性。 ( 4 ) 占,服从正态分布。 按照上述假定,对式( 3 1 ) 两侧同时取数学期望可得多重线性回归方程 e ( k ) = p o + b i x + p 2 x2 , + + b p x p , ( 3 2 ) 多重线性回归方程中模型参数是不知的,可通过一个己知样本对参数进行估 计,估计回归方程的一般形式为: a y f = b o + b l x l f + b 2 x 2 f + + b px p ( 3 3 ) 1 2 港口水域航迹带宽度和操纵参数的回归分析 y j 是e ( m ) 的估计值; b l 、6 z 、幻是对应的o 、- 、局的估计值。 最重要的工作还是要用所选择的样本数据计算6 t 、6 z 、6 p 的具体值,确 定式( 3 3 ) 的具体形式,对总体的回归方程作出估计。 3 1 2 最小平方法的介绍 在简单线性回归中,自变量与因变量之间是否存在线性关系,通过散点图就 可以有个直观的了解。而在多元回归分析中,就没有这么直观的了解,这是因为 图形维数增多,画出这么一张图很不容易,也很难从这张图看出其线性关系 3 5 】。 为了使估计的回归方程对所有的样本点有一个好的拟合度,观测值与对应的 估计值参距离平方和要最小,即:羔( ,弘一参 z 取最小值( n 为样本容量) 3 8 】。为 了更好的讨论这个问题,在这里以两个自变量的情况为例对多重线性回归的最小 平方法进行讨论。先做下面几种假设: ( 1 ) 因变量y 与自变量x l 、x 2 具有线性关系; ( 2 ) 存在样本点( y i ,x l i ,x 2 i ) ,估计值y f = b o + b l x + b 2 x 2 f 。 由上述可知, 上:芝fy ,一多。、】2 :墨b 。一( 6 。+ 6 。x 。,+ 6 :x :,) 】二取最小,亩得下式口, 6 b - _ 2 喜,一6 0 - 6 l h _ 6 2 砀) = 。 。卅缸_ 6 0 嘲,- 6 2 砀) = 。 6 :q 蔷砀r 一6 b 嘲t 一) = o 经整理可得: ( 3 4 ) 第3 章多重回归分析介绍 疗 砀y , f - l 以打托 2 = 6 0 x 2 ,+ 6 。x 。,x :,+ b 2 x 2 , f = ii = 1i = 1 ( 3 5 ) 通过式( 3 5 ) 可得出模型系数,从而确定回归方程。以此类推的话,可以得 到含有m 个自变量的多元线性回归方程的最小平方法估计量d 5 1 , x 朋,y ,= 6 0 x 肌,+ 6 。x 。,x 朋,+ - + 6 肌x 肌,2 f - lf - lf = ii = 1 同理将样本数据代入上式,就会得到模型系数,从而确定了估计回归方程。 3 2 多重判定系数与偏相关系数 3 2 1 多重判定系数的引入【4 0 4 2 】 ( 3 6 ) ( 1 ) 多重判定系数 为判定回归方程拟合的紧密程度,人们提出了判定系数的概念,记作r 2 。下 面介绍三个概念: 由上姐m 的最小平方原理可以知道喜l 一五) 2 取最小值川腻 把这个最小化的量称为残差平方和,记作s s e ( e r r o rs u mo fs q u a r e s ) ,即 s s e = 虮一y i 2 0 i = l 1 4 砭 疗硝 拍 一脚 l u+ 圪 = y 打 甜 xx 押 6+ 2 x 一烈 l 口+ 厅m o 6 = y x 盯h xx 疗日 m 6+ 甜 x 肝硝 2 6+x 疗商 6+ 挖 = y 疗 坍 xx 珂蹦 m 6+ 2 x 疗闰 6+x 疗瑚 加 l i y x 疗硝 港口水域航迹带宽度和操纵参数的回归分析 因变量第f 次的观测值与因变量均值歹之间的距离称为第i 个总离差, 而所有总离差的平方和称为总离差平方和,记作s s t ( t o t a ls u mo fs q u a r e s ) ,即 s s t s s t :窆b 一一y 卜r :y iy ,一 一v 一, 第i 次观测因变量的估计值少- q 因变量均值y 之间的距离称为第i 个回 归离差,而所有回归离差的平方和称为回归平方和,记作s s r ( r e g r e s s i o ns u mo f s q s ) u ps s r :窆仁币 对总离差平方和进行变形如下: s s t = 窆,一歹) 2 = 芝f ,y ,一多,+ y a ,一e 1 2 得 = 喜( y ,一多,) 2 + 2 喜( y ,一多,) ( 多,一歹) + 喜( y ,一歹) 2 3 1 2 卧平方法数学性质确,喜卜五) ( 五一歹) - o ,代入上式,可 s s t = s s e + s s r ( 3 7 ) 很明显0 s 奴镕r ,我们将多重回归中s s r 所占s s t 的比重称为多重判 定系数,记作r 2 ,即: 膏= r ( o 鲋 - f ,拒绝原假设,否则,接受原假设。于是 显著水平口下自由度为n - p 一1 的t 分布的双侧分位数,其给出了原假设的拒绝域, 本文取显著性水平为0 0 5 。 3 3 2f 检验的介绍【4 6 4 7 】 对多重回归,f 检验原假设为:届= 岛= = 尾= o ,备择假设为:至少有 一个回归参数不为0 。 在式( 3 1 0 ) 中s s t 的自由度为n 1 ,s s e 的自由度为n p l ,s s r 的自由度 为p 。均方误差m s e 定义为, m s e :墅 ( 3 1 5 ) i 1 p 。1 均方回归m s r 定义为, m s r = :s s r p ( 3 1 6 ) m s e 是一的无偏有效估计量,m s r 只有在原假设成立的情况下才成为一的 有效估计量。若原假设不成立的话,m s r 会趋于无穷大,0 2 被高估。所以朋舔e 接近于l 就成为接受原假设的有力证据。m 琴么距服从分子自由度为p ,分母自由 度为n p - 1 的f 分布,因此我们可以用这个f 统计量对回归方程的显著性进行检 验。 f :m s r ( 3 1 7 ) = 一 ,i ,j m s e 。 1 8 港口水域航迹带宽度和操纵参数的同归分析 f 检验的拒绝法则为:若f - 凡,拒绝原假设,否则,接受原假设。凡是显 著水平口下,分子自由度为p ,分母自由度为n p 1 的f 分布的上侧位数,其给出 了假设检验的拒绝域,本文取显著性水平为0 0 5 。 3 3 3 多重共线性问题及其诊断 用多个自变量进行多重回归预测因变量取值,人们既希望有高的拟合度,又 希望保持回归方程的显著性,那么就包含着各个自变量之间是相互独立的这一假 设。如果自变量之间不是相互独立的,而是存在着线性关系,那么就会导致单个 回归参数显著性的降低。 上面所讲述的自变量之间的线性相关性称为多重共线性。多重共线性所带来 的不便是,当f 检验表明多元回归方程整体具有显著性时,t 检验可能会得出单 个回归参数不显著的结论。当然,自变量间不会是完全独立的,只要其样本相关 系数不大于某一值,就不会带来估计回归方程显著性的降低【3 9 1 。 在s p s s 中有这几个量特征值、条件索引、方差比、容许度、膨胀因子来诊 断多重共线性问题。他们的含义分别如下f 3 5 】: ( 1 ) 特征值:测定自变量数据间明显存在维度多少的尺度,其接近零时,表明 白变量间存在高度的交互相关,样本数据稍微的变化就会带来回归系数很大的变 化,表明存在多重共线性。 ( 2 ) 条件索引:指最大本征值与最小本征值比值的平方根。当其大于1 5 时。说 明可能存在多重共线性:大于3 0 时,说明存在严重的多重共线性。 ( 3 ) 方差比例:指与各本征值相联系的主要成分所解释的估计方差之间的比率。 当某一具有较高病态指数的主成分对多变量之间的方差具有较大贡献时,说明存 在多重共线性问题。 ( 4 ) 容许度:其值为l 一厨2 。r i 2 是第j 个自变量与其余自变量进行回归时的判 定系数。当某一自变量容需度较小时,意味着该自变量对模型拟合的贡献也较小, 其很可能是个多余变量。 ( 5 ) 膨胀因子:是容许度的倒数。值越大多重共线性就越严重。 1 9 第3 章多重回归分析介绍 3 4 残差分析 3 4 1 线性诊断及方差齐性检验 在实际应用中,一些观测值的变化对因变量产生不同影响,导致随机误差项 的方差相异,使方程显著性检验失效,估计与预测的精度降低。方差齐性检验的 方法主要有图示法、s p e a r m a n 秩相关系数检验法、p a r k 检验法、g l e j s e r 检验法、 g o l d f e l d q u a n d t 检验法等。在这用以标准化残差( z r e s i d ) 为横轴,标准化预 测值( z p r e d ) 为纵轴的散点图对方差齐性行判定。当散点大多数坐落在横坐标 1 + 1 范围内,回归模型满足方差齐性假定。 此图同时也适用于回归模型的线性诊断,当散点大多数坐落在横坐标1 + 1 范围内,回归模型满足线性嘲侧。 3 4 2 残差独立性检验 残差独立性假定如不成立,线性回归将会出现严重的偏差。d u r b i n - w a t s o n 检 验是一种常用的检验方法。 d u r b i n w a t s o n 检验的原假设为:不存在自相关,备择假设为:存在自相关; d u r b i n 与w a t s o n 编制了一个临界值表,表中给出了对应显著水平和样本容量下 临界值的上下限。根据此表并结合我们的样本,当检验值落在上限d 。与4 - d 。之间 时接受原假设;其落在下限d l 与上限d 。间、4 也与4 d l 间,即,灰色区间内,就 无法确定其独立性;落在其余区间内则应该拒绝原假设1 3 引。 3 4 3 模型正态性假定及异常值检测 残差分析还有以下两个重要目的【3 9 】: ( 1 ) 模型中误差项随机变量i 的正态性假设; ( 2 ) 样本数据中是否含有异常值。 其中( 1 ) 中i 的正态性假设是整个分析的基础,若其不成立,以后所有的分析 将会是无用功。( 2 ) 中所讲的异常值就是样本数据中过大或是过小的数据,他们的 存在对于回归分析的精确度有着极大的影响。 上面提到异常值,就要说一下样本中的值是极端值得的样本点,也就是高杠 杆率点。杠杆率指的是某一观测值与所有观测值的平均值之间的距离,其值越大 说明该点对模型拟合可能造成的影响越大。杠杆率它的缺陷是只能识别出高杠杆 率点,不能够分别出对模型拟合有影响的点【4 8 。5 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论