(精密仪器及机械专业论文)赤潮多源监测数据处理与综合预测预报方法研究.pdf_第1页
(精密仪器及机械专业论文)赤潮多源监测数据处理与综合预测预报方法研究.pdf_第2页
(精密仪器及机械专业论文)赤潮多源监测数据处理与综合预测预报方法研究.pdf_第3页
(精密仪器及机械专业论文)赤潮多源监测数据处理与综合预测预报方法研究.pdf_第4页
(精密仪器及机械专业论文)赤潮多源监测数据处理与综合预测预报方法研究.pdf_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卜海交通大学甫j 学何论文 曼曼! ! 曼曼! 曼曼曼! 曼皇曼曼曼曼! 曼! 曼曼曼! ! ! ! 曼曼皇! 曼曼! 鼍o : i i i i i 曼曼! 曼皇曼! 量! 曼曼曼曼曼! 曼! 曼曼曼曼曼曼! 皇曼! ! 曼 摘要 赤潮我国沿海最主要的生态灾害之一,随着经济的发展,环境污染日益加剧, 赤潮爆发的频率逐年升高,赤潮的发生对沿海的生态环境和水产养殖造成了严重 的影响。赤潮灾害的监测和预报作为一个围际性的难题已引起人们的高度关注和 重视。为了对赤潮进行研究和预报,许多沿海国家都组建了自己的赤潮髓测系统, 由于赤潮过程的复杂性,人们目前还没有完全把握赤潮的发生、发展和消亡的相 同机理,因此在众多现行的赤潮监测体系中,为了有效的处理大量的赤潮豁测数 学习和模糊技术被广泛使用。同时,为了更加全面的监控赤潮过程,多 方位的立体监测系统的开发也势在必行,因而处理多源赤潮监测信息的 不确定性并对其进行融合也将是一个难题。 本文的研究得到国家高技术发展计划( 8 6 3 计划) 赤潮重点监控区监控预警 系统重大专项课题( 2 0 0 5 a a 6 3 5 2 0 0 ) 的资助,本文针对该赤潮监控系统获取得 大量监测数据,结合机器学习、模糊数学、数据融合方法等理论,对赤潮监测数 据的处理与分析方法进行了研究,主要研究内容和创新之处如下: 首先,介绍了本项研究所依托课题的实旌情况与五个监测子系统的实现技 术,给出了多源监测数据的获取手段和传输方式。对于数据的预处理主要包括两 项工作:一个是综合利用现有的相关标准对浮标传感器进行在线评价,并对符合 线性分析标准的监测参数进行不确定度评估:另一个是针对监测数据中出现的缺 失数据的情况,提出了一种适用于赤潮监测数据的时间序列的插补方法,取得了 比一般插补方法更好的插补效果。 经过对浮标传感器在线评价,发现一些在线监测参数满足与离线数据的线性 回归分析标准,而另一些则刁 t ( f = 刀一2 ;0 9 5 ) ,则校准数据和在线数据间存在显著相关性。 测试2 :异常值测试与剔除 回归函数输出与传感器测量值之间具有最大绝对残差的数据对可能为异常 值( 图3 2 ( d 、e ) 的情况) ,但还需要利用f 检验来评估剔除异常值后标准差s , 是否显著下降。异常值的个数不能多于测量值个数的1 0 。 可能的异常值定义为:p o = m a x l y , 一爿= m a x l y ,一( 乃一( 薯+ 舀) ) i 定义统计量t s :互蔓互垡,其中彳l 表示包含有异常值的集合,么2 表 s ;a 2 示取出异常值的集合。与显著水平为1 的f 检验对比。如果t s 五几,2 。跏,则 剔除可能异常值后标准差显著下降,该p o 为异常值,反之则不是。 测试3 :线性关系测试 如果线监测数据和标定数据之间无线性关系,则可能存在两种情况,一种情 况是二者确实没有关系( 如图3 2 ( b ) ) ,另一种情况是二者存在非线性关系( 如 图3 2 ( f ) ) 。如果在选定的标定范围内二次函数比一次函数的拟合效果好很多, 则认为选定的标定范围不合适或者样本本身不适合使用线性回归分析。为了验证 是否存在这种情况,需要进行如下验证过程。首先,根据标定传感器测量数据的 极大和极小值给出标定传感器的标定范围,在标定范围内用f 检验评估二次函数 和线性函数对在线监测数据和标定数据对的拟合效果,进而验证在线监测数据和 标定数据之间的线性水平。 假定非线性回归函数为y = f l l x + f 1 2 x 2 + 口 2 s 第节脸测数扔“门刊! 处王i f i 定义统计量t s - 譬,其q ad s 2 劬- 2 ) 沓( 棚) ,: o y 2 s y ,。表示线性回归函数的标准残差,:表示表示非线性回归函数的标准残 差。 将该统计量与显著水平为1 的f 检验对比。如果t s 曩,1 他,则在线监 测数据和标定数据之间为非线性水平,反之则为线性水平。 测试4 :方差齐性测试 对仪器测量数据进行非加权的线性拟合还有一个非常重要的前提条件,就是 测量数据的方差与样本的分布密度无关( 如图3 3 ( a ) 的情况) ,即满足方差齐 性。如果不满足方差齐性,则利用线性回归得出的分析结果会带有很大的误差, 从而无法正确的描述出数据样本的误差分布情况( 如图3 3 ( b 、c ) 的情况) 。 残 签 满足方蕴,齐性 廖,霹,:,: :西7 r二亡捧拖暄 不满足矗茇舞性 昝线性趋势) 。f 誓v 9 b , r 作缒喇 t c t 珑t 列酚j 瑶霹暑二, 产。 r 】:作箍捌 方麓弃性测试 :。 :r 。 7 k 一r + , 、2 5 0 7 5 ; 图3 0 关于测量数据方差齐性的情况 f i g 3 - 3t y p i c a ls c e n a r i o sf o rh o m o g e n e i t yo f v a r i a n c e s 因此,在满足相关性和线性水平的情况下还需要进行数据样本在线性回归函 数上分布的方差齐性测试。以保证线性回归函数的一致性。 取在线监测数据0 - 2 5 和7 5 1 0 0 值域范围内的数据样本( 如图3 3 ( d ) 2 所示) ,其标准差表征了其关于线性回归函数的分散性,则可以定义t s = r a y , 7 5 , s ;2 5 卜海交通大学阿一t 学1 寺论文 其中s 2 啦和s 2 , 7 5 分别为0 2 5 0 ,。咀坝- 7 h b - - 围内和7 5 - 1 0 0 0 加咀坝- ¥- h b - - 围内的数据样本 关于线性回归函数的标准差。 作显著水平为1 的f 检验( 曩佧棚- l ,厂2 _ 。2 - i 0 9 9 ) ) ,如果t s ( ,l ,2 o 朋, 则在线监测数据和标定数据之间不满足方差齐性,反之则满足方差齐性。 该检验对于图3 3 ( b ) 所示的情况,方差具有线性变化趋势是有效的,而 对于图3 3 ( c ) 所示的情况,方差具有非线性变化趋势则是无效的。如果经测 试不满足方差齐性条件,则需要限制工作范围或者使用加权回归。 算例: 认为在线人工读取的浮标数据和同时读取的船载数据是相互关联的,取6 月 1 日至7 月3 1 日问的一号站位同时读取的浮标数据和船载实测数据的2 4 个样本 对,考察四个水质参数:温度、p h 值、盐度、溶解氧,由于浮标和船载盟测巾 对叶绿素使用的脂测方法不一致( 详细情况见第六章) ,所以没有考查叶绿素数 据,对各个参数的测试结果如下表: 表3 - 1 参数测试结果对比 t a b 3 - 1t e s t i n gr e s u l tf o rp a r a m e t e r s : 温度 p h 值 盐度溶解氧 关联性测试显著相关不相关显著相关不相关 异常值个数无 1 无 2 线性水平测试线性非线性线性非线性 方差齐性测试方差齐性非方羞齐性方差齐性非方差齐性 从中可以看出只有温度和盐度数据满足线性回归分析的条件,因此只有这两 个参数可以利用线性回归的方法来评价其不确定性。同时,也说明由于海水波动 和其他未知因素的影响,p h 值和溶解氧传感器的数据非常不稳定,其彳i 确定性 无法用线性回归的方法度量,应该从另外的角度考虑其不确定性。 3 3 系统误差显著性检验 在线传感器中一般还包含有系统误差。为了检验是否存在系统误差,i s o 1 5 8 3 9 水质在线监测数据不确定性分析规范中,利用= 1 且口= 0 的理想回归函 数9 5 的信度区问来检验生成的线性回归模型与理想情况之间差异的显著程度, 2 7 筇章船测数据的于砸处i 甲 如果传感器数据工作范围内的信度区间能够包括理想情况的回归函数则不存在 显著系统误差。 信度区间的宽度取决于数据样本的数目和方差以及在测量值域内的分布情 况。如果信度区间的宽度较小则回归函数的预测值和输出变量相关性较强。信度 区间可表示为: 其中 c 1 9 5 = ( a + x o d ) + - t c o 9 5 ,:”一2 ) s y s y = ,o 9 5 扣脚) 为显著水平为5 自由度为n - 2 的t 分布。 3 4 基于线性回归方法的不确定- i 生的表示方法 经过系统误差显著性检验后,对样本数据会有两种情况:无显著系统误差和 有显著系统误差。参考i s o1 5 8 3 9 水质在线监测数据不确定性分析规范,在无显 著系统误差的情况下,考虑小确定性的传感器输出值信度区间( 总不确定性) 可 表示为: 其中 c i 删,删,9 5 2y o - - - t ( o 眠厂:”一2 ) s s = “9 5 一2 ) 为显著水平为5 自由度为n - 2 的t 一分布。 对于有显著系统误差的情况信度区间( 精确程度) 可表示为: c - = 雩彤,眦专 其中,( 。9 5 ,一2 ) 为显著水平为5 自由度为n - 2 的t 一分布。 在应用船载数据对浮标数据进行标定的同时还通过不确定性分析来判断浮 上海瓮通大7 7 1 可十学仲论文 标传感器的工作状态,我们规定温度和盐度的极限信度区间分别为0 8 和 o 5 p p m 。如果最近2 0 个样本的9 5 信度区间超出这个范围则认为是浮标传感 器出现故障,需要进行现场校正。其中一号站位的温度传感器在近3 个月的监测 过程巾表现良好,而盐度传感器在获得8 月1 8 号的样本后信度区间超出了规定 范围,对其进行了现场校正。 综合不确定度分析的情况,利用现有的标准中给出的方法我们只能对浮标上 的温度和盐度参数进行标定,而其他的浮标监测参数则无法直接描述其不确定 度,因此温度和盐度参数我们可以将已知误差范围的采样值作为该点的采样真 值,构成精确值得时间序列,而其他的浮标临测参数则需要采用别的方法来表达 数据的不确定性。 3 5 监测时间序列缺失数据的插补方法 在海洋环境监测中,由于采样不充分,测量系统错误,或者是其他的一些原 因,往往会导致监测数据的出错或缺失。对于这种情况,在进行赤潮数据处理和 分析时,通常的做法是将带有缺失或差错的列参数的观测数据集体删除,这样 虽然保证了所用数据的可靠性但是在某些情况下却会带来大量的有用信息的丢 失1 2 3 1 1 2 4 1 。针对这个问题,需要结合赤潮监测数据的特点以及不同的缺失程度, 设计专用于赤潮监测数据的插补方法。 3 5 1 几种常规的时间序列插补方法 1 ) 最近邻插补 单变量时间序列的最近邻插补是最简单的一种插补方法,它是使用缺失数据 前后端点的数据来对缺失数据进行估计,如下式 y = m ft t l + ( 乞一t 1 ) 2 y = 儿ff t l + ( 乞一,1 ) z 。 其中y 是点t 处的插补值,t 。、咒和t :、y :是缺失数据段前端和后端的位置 和其上的值。 2 ) 线性插补 线性插值是在缺失数据段上拟合一个线性函数,其表达式如下: 第一章监洲数据的预处卵 y ( ,) 2 只+ 筲川卅 其中y ( ,) 是点,处的捅补值, f j 、只和,+ 、乃+ 。是缺失数据段前端和后端的 位置和其上的值。 3 ) 三次样条插补 三次样条插值是在缺失数据段上拟合一个三次样条函数,并保证其前二阶偏 导连续,其表达式如下: y o ) = 口,厂+ 勿,2 + q t + 4 其巾j ,( ,) 是点t 处的插补值,q 、6 j 、q 、z 是定义在缺失数据段上的三次 多项式的参数,使得y ( ,) 满足二阶连续。 3 5 2 基于统计分析的时间序列插补方法 文献【2 5 】中,s c h n e i d e r 将基于回归分析的插补方法与期望最大化方法 ( e x p e c t e dm a x i m u m ,e m ) 相结合,提出了r e g e m 插补方法,其主要思路是 利用e m 算法估计插补时间序列相卒间的均值和协方差,然后计算其回归参数, 进而得到基于条件期望的插补,不断迭代,获得最终的插补结果。 文献【2 6 】中给出的多元插补方法是统计数据分析中比较常用的一种统计插补 方法,由于采用多模型优化的模式,这种插补方法被认为是精度较高的一种插补 方法,然而由于其主要是适用于多元变量序列的插补,而月要求多元变量间的相 关性和模型化,所以并不适合赤潮监测中单变量时间序列的插补。 此外h a k k i n e n 2 7 1 和g a r d n e r 2 8 1 分别在自己的文章中提出利用s o m 神经网络 和b p 神经网络的方法对数据进行插补。然而神经网络对于少样本、大波动数据 学习效果比较差,所以也不适合赤潮监测时间序列的插补。 3 5 3 基于奇异谱分析的插补方法 3 5 3 1 奇异谱分析方法简介 奇异谱分析( s i n g u l a rs p e c t r u ma n a l y s i s ,s s a ) 是一种广义的功率谱分析方 法【2 9 1 ,由于它不需要时间序列有正弦性的假设,所以可更加灵活的对非线性和不 稳定的时间序列进行去噪和特征提取的操作,同时可实现时问序列的动态重构。 上海交通人学博1 j 学何论文 因而在涉及时间序列处理的许多领域s s a 都得到了应用 3 0 - 3 2 】。 对于长度为n 的时问序列b ,y 2 y n 】,给定嵌套空间维数m ,m m n ( 3 1 ) 做内积旃础) = 南筹眦,邝歹州 ( 3 2 ) 得到如下t o e p l i t z 结构的延迟自相关矩阵: s = c ( 0 )c ( 1 ) c ( m - 1 ) c ( 1 )c ( 0 ) c o ) c ( 1 ) c ( m 一1 ) c ( 1 )c ( o ) ( 3 3 ) 对矩阵s 进行奇异值分解,s = e 2 e r ,得到相应的特征值以,1 后m 。 将特征值排序得到a 乃厶0 ,对应特征相量( 或者称为经验正交函数) e ,其中l k m 。 进而得到主分量向量,其中,第k 个主分量的第f 个值表示为: m 岔= 咒+ ,劈,o i m ( 3 4 ) j = l s s a 可以利用各个主分量对时间序列进行重构,则第k 个主分量重构的序列 的第i 个元素r 可表示为: x = ! m 号= 1 tp i e : 加r m i n - m “ 寻杰彰 j j = l 1 i m 一1 ( 3 5 ) 而1 j 善m ,k k 加r n m + 矧 0 ,v 是一个 取最大的运算。 5 3 2 单变量模糊时间序列预测 q s o n g 和b s c h i s s o m t 5 1 1 提出最初的模糊时间序列概念,并将其应用于时 间序列预测时,只是给出了单变量的模糊时间序列预测方法,将其应用于叶绿素 时间序列的预测,算法如下: 第一步:计算历史叶绿素数据任意两个相连数据的变动。找到任意两个相连 数据的最大增加量眈和最大减小量d 只,定义论域u = 【眈一q ,眈+ d 2 】,其中b 和及为合适的正实数。 第二步:将论域u 分为适当长度的区间u iu :,u ,。 第三步:在论域u 上,定义关于模糊时间序列,( ,) 的模糊化变动的模糊集 合。这里,我们将叶绿素的变化分为7 个语言值描述的模糊集,4 = ( 骤然升高) , 4 = ( 快速升高) a 3 = ( 升高) a 4 = ( 无变化) a s = ( 下降) , 4 6 = ( 快速下降) , 4 7 = ( 骤然下降) ,其表达式如下: 1 0 500000 以= 一+ + 一+ 一+ 一+ 一+ 一 “l“2“3“4“5 z f 6“7 0 5l0 50000 a = + + + + + + “i甜2甜3心甜5“6“7 0 0 5 10 5 000 a = 一+ + 一+ + + 一+ 蚝u 4鸭u 7 f _ 海交通大学 甫士学何论文 4 :旦一卫ol 十oj0( 5 一一1 )4 = 一卜卜+ - 十斗_ i 1 毪恐坞坞蚝 00 00 510 50 4 = 一+ 一+ 一+ + 一+ + 一 甜2屹坞甜7 0 0 000 5l 0 5 以= + 一+ 一+ 一+ 一+ 一+ 一 “i“2 蚝蚴甜5蚝 撕 00 0000 51 a = 一+ 一+ 一十一十一十+ 一 甜i“2z 岛“4“5 掰6“7 第四步:根据以上定义的模糊集合,将历史数据模糊化,如果叶绿素在时间 f 的变动数为p ,p 甜,并且当最大隶属度值出现在“,时有模糊集4 与之对应。 则变动数p 可转换为模糊集4 。 第五步:选择合适的窗口的宽度w ,通过标准向量c ( t ) 和操作矩阵0 ”( f ) 计 算在我们想要预测的在时间,的输出。 在时间,的标准向量c ( t ) 和操作矩阵0 ”( ,) ,表达式如下: c ( t ) = f ( t 一1 ) = 【c lc 2 巳】 d ”o ) = f ( t - 2 ) ( ,- 3 ) f ( t w 1 q l d 2 。 q 川) l 前一天的叶绿素变动和前w 天的叶绿素变动之间的模糊关系矩阵r ( t ) 为: 尺( ,) = 0 ”( ,) 固c ( f ) = 蜀,蜀: 恐恐: r 。凡: 墨。 恐。 r w m 则预测现在时刻将要发生的模糊变动f ( t ) 为: f ( ,) = 【m a x ( r i ir 2 l r 1 ) m a x ( r 1 2r 2 2 尺。2 ) m a x ( r i 。r 2 。r 。) 】 第六步:将上一步得到的模糊化预测变动进行去模糊化处理。 一般的去模糊化方法包括以下两种: ( 1 ) 最大隶属度法 设m ,w 2 ,嵋为论域u 上输出元素的隶属度。令= m a ) 【 嵋,w 2 , , 4 9 胛 m dm哆。咿 堙 2 2 m 哆j 咿 币h 覃叶绿素的f 奠糊时f i t j 仔列刊删0 方f 上研 我们选择此,即输出元素的最大隶属度,其所在区间的中点为输出值。当输 出的隶属度有两个以上最大隶属度时,则取各最大隶属度所在区间中点的平均值 为输出值。 ( 2 ) 隶属度加权平均法 设w l ,w 2 ,为论域u 上输出元素的隶属度。我们考虑以标准化的隶属度 加权数,对各组中点作加权平均为其输出值。亦即输出值 0 = s i 木m i + & 幸鸩+ + 邑木鸩,其中墨= w , w ) ,为标准化后的隶属度, m ,为指数分区的组的中点,f = l ,2 ,刀。 这里我们选择隶属度加权平均法。 第九步:计算预测的主因子时间序列的数值。 5 3 3 二元模糊关系法 单因子模糊时间序列采用时间序列的模糊化来表达数据的不确定性,这是具 有开创性的工作,但是这种方法只考虑了单因予自身的变化,因此在预测的准确 性方面不是很理想。c h e n 掣5 2 1 首次提出了基于模糊关系的二元模糊时间序列预 测方法,并将其应用于气温时间序列的预测中,获得了比单变量模糊时间序列预 测更加理想的预测效果。结合5 2 节分析得出的溶解氧可作为叶绿素辅助预测因 子的结论,本节主要讨论这种二元方法的应用。 定义5 5 :令 x ( t ) r ,t = l ,2 ,刀) 为一个时间序列,u 为其论域。对于x ( t ) 的 两个模糊时间序列,( f ) 和g ( t ) ( ,= 1 ,2 ,1 ) ,其中, f ( f ) = ( “l ( ,) ,“2 ( ,) ,“。( ,) ) ,g ( t ) = ( - 6 i ( f ) ,鸬2 ( f ) ,心。( ,) ) ,k t j ,( ,) 和鸬,( f ) 都 是关于x ( f ) ( 扛1 ,2 ,押) 的模糊集合。如果我们要用g ( ,) 来辅助预测f ( ) ,则称 f ( t ) 为主因子模糊时间序列,称g ( t ) 为辅助因子模糊时间序列。 模糊化的主因子模糊时间序列f ( t ) 的在t 和f 一1 间的模糊变动表述如下: 设论域u 分为m 个区间,( “,鸬,心) 。若有k 个语言变量, 如: 4 ,4 ,4 等,描述为如下形式: 4 :趔+ 幽+ + a a , ( u m ) u lu 2甜m 上褥瓮通大彳研士0 7 1 市沦文 a :丝! 蛐+ 丝2 丝+ 业! u lr 2 u m ; 4 :丝业+ 丝盟+ + 丝绁 lm 2“胛 4 的最大隶属度值为u ,1 f 七。女i i 果主因子模糊时间序列f ( ,) 在,和f 一1 间的模糊变动是x ,并f i x 甜,则主因子模糊时f h qj 扔j 0f ( f ) 在,和t - 1 间的历史 数据模糊变动是4 ,其中1 f k 。即: 厂( f ) = 【m ,( ) 心。( 甜:) 鸬,( 材。) 】 模糊化的辅助因予模糊时间序列g ( t ) 的在时间,的模糊数表述如下: 设论域u 分为聊个区间,( “,鸬9o ,) 。设有k 个语言变量,届,盈,反, 描述为如下形式: 丑:t i m ( u 1 ) + 丝垒! ! 丝! + + l b l ( u m ) u 2u & :丝2 1 丝! ! + 丝21 竺! ! + + - b 2 ( 1 - m ) u 2u ” ; 最:, t r k ( u 1 ) + 丝塑+ + 丝盟 i u 2u m 在预测时间,的数据前还要确定窗口的宽度w ,从而得到在时间t 的标准向 量c ( f ) 和操作矩阵0 ”( ,) ,表达式如下: c ( f ) = f ( t - 1 ) = 【c lc z g 】( 5 2 ) d ”( f ) = f ( t 一2 ) f ( t 一3 ) f ( t w ) q d 2 。 q 州) l q 2 q : q 州) 2 ( 5 3 ) f ( t 1 ) 是主因子模糊时间序列f ( f ) 7 在t - 1 和f 一2 问的模糊化变动,m 是论 域中元素的个数。c ,和q 为精确值,0 c j l ,0 q l ,1 f w l ,l j m 。 可见,标准向量c ( f ) 和操作矩阵0 ”( f ) 都是由主因子时间序列推演出来的。 定义5 6 :令g ( ,) 为论域中辅助因子模糊时间序列,辅助因子向量s ( t ) 如下式所 示: 气l m 仉踟:咿 第斤章叶绿素的授糊时m j 序列于砸测方_ ;上研究 s ( ,) = g ( t - 1 ) = 【s i 最最】 ( 5 4 ) 其中s ( t ) 是在时间t 一1 的辅助因子向量,g ( t 1 ) 是辅助因子模糊时间序列 g ( f ) 在时间t - i 的模糊化数据,m 是论域中元素的个数,s 【0 ,1 】,1 f r n 。 单因了时变模糊时间序列模型的模糊关系是标准矩阵和操作矩阵之间的关 系。在双因子时变模糊时间序列模型中,我们必须要考虑标准矩阵、操作矩阵和 辅助因了向量之间的模糊关系。新的模糊关系矩阵定义如下: 定义5 7 :设f ( t ) 是主因子模糊时间序列,g ( t ) 是辅助因子模糊时间序列,c ( t ) 是 关于f ( t ) 标准向量,o ”( ,) 是关于f ( ,) 的操作矩阵,s ( ,) 是关于g ( t ) 的辅助因子 向量。c ( t ) ,0 ”( f ) 和s ( t ) 之间的模糊关系矩阵等于: r ( ,) = 0 ”( ,) s ( ,) c ( f ) 也可以写为如下形式: r ( ,) = d l 。s g 0 2 l s c l q 川) l s c l 蜀。蜀: 心。 坞: & 。- 1 ) l& 。1 ) 2& 。- 1 ) 脚 q 。s m q 0 2 。瓯巴 q 州) 。x c ( 5 5 ) m 是论域中元素的个数,毛= q l c j ,1 i w 一1 ,l ,m ,“ 是 乘法算子。 根据模糊关系矩阵r ( t ) ,我们可以得到主因子模糊时间序列f ( t ) 在t 和f 一1 间的模糊化预测变动f ( t ) ,描述如下: u ( t ) = m a x ( n l ,墨! ,墨,1 1 1 ) m a x ( 墨! ,如,墨州) ! ) m a x ( 墨。,墨。,尽,”。) 】 其中,u ( t ) 是模糊时间序列f ( t ) 在t 和f l 间的模糊化变动。 基于以上提出概念的双因子模糊时间序列预测方法,可以总结如下: 第一步:将历史数据按照时间段进行分组,对每个组的数据分别用如下预测 步骤进行处理。 第二步:计算主因子模糊时间序列任意两个相连数据的变动。找到任意两个 5 2 g q吗1趴趾;蝇; 2 2 d 吼 k一 i 海交通大宁f 呵卜7 1 市论文 相连数据的最大增加量功和最大减小量d r ,定义论域u = 【d ,一日,d ,+ d 】,其 中日和历为合适的正实数。 第三步:将论域u 分为适当长度的区间u iu :,u m 。 第四步:在论域u 上,定义关于主因子模糊时间序列,( f ) 的模糊化变动的 模糊集合。这里,我们将叶绿素的变化分为7 个模糊集,a t = ( 骤然升高) ,以= ( 快速升高) 呜= ( 升高) a 4 = ( 无变化) 4 = ( 下降) 以= ( 快速下降) 呜= ( 骤然下降) ,其表达式同( 5 1 ) 式。 第五步:在论域u 上,定义关于辅助因子模糊时间序列g ( t ) 的模糊集。这 里取辅助因子为溶解氧。 第六步:模糊化主因子模糊时间序列f ( t ) 的模糊化变动和辅助因子模糊时间 序列g ( f ) 的数据。 第七步:选择合适的窗口的宽度w ,定义关于f ( t ) 标准向量c ( t ) ,关于,( f ) 的操作矩阵0 ”( f ) 和关于g ( t ) 的辅助因子向量s ( t ) 。然后,根据( 5 5 ) 式计算标准 向量c ( t ) 、操作矩阵0 ”( f ) 和辅助因子向量s ( t ) 之间的模糊关系矩阵r ( t ) 。进而, 根据模糊关系矩阵r ( f ) 可以得到要预测的模糊化变动u ( ,) 。 第八步:将模糊化主因子模糊时间序列f ( t ) 预测的模糊化变动去模糊化。利 用5 3 2 节中的隶属度加权平均法,得到精确值。 第九步:计算预测的主因子时间序列的数值。 5 3 4 二元高阶模糊推理法 二元模糊关系法利用与预测值最近邻的窗口宽度范围内的模糊时间序列差 动样本产生模糊关系,没有考虑时间序列的整体变动情况。为了更加有效的利用 所有己知数据的信息,l w l i 吲引入模糊推理的理念,提出一种二元高阶模糊 推理法,可以总结如下: 第一步:定义主因子论域u = 【。一d l ,d 。+ d 2 】,其中d m 。和d m 积分别为 历史数据的最小和最大值,口和d 为两个合适的正实数。同理,定义辅助因子 论域y = 【。一互,+ t 】,其中瓯m 和分别为历史数据的最小和最大值, e 和最为两个合适的正实数。 第万章叶绿素的枝彻时问序歹0 于砸洲方法研究 第二步:将主因子论域u 分为n 个适当长度的n f 日- u i , 甜:,, ,将辅助因子 论域y 分为m 个适当长度的区问v l , v 2 ,。这里取门= 7 ,m = 5 。 第三步:在论域u 上,定义关于主因子的语言变量模糊集合4 。这里,我 们将叶绿素的状态分为7 个等级,4 = ( 极低) ,4 = ( 较低) 4 = ( 偏低) a 4 = ( r f l 等) 4 = ( 偏高) 4 = ( 较高) 4 = ( 极高) ,其表达式为: 10 5 00000 以= 一十+ 一+ 一+ 一+ 一+ 一 “i甜2坞“5蚝“7 0 5 10 5 0 000 且= + 一十+ + 一+ 一+ 一 u lu 2u 3 u 4u 5 u 6 u 7 。 0o 51o 5000 42 一+ 一+ 一+ 一+ 一+ 一+ 一 甜l“2“3蚴蚝z f 6“7 4 :旦一卫+ _ 1 + o 卫( 5 6 )a = 一卜卜+ _ + _ + 一斗( ,6 ) 心坞蚝蚝 0000 5 1 0 5o 4 = 一+ 一+ 一+ 一+ 一+ 一+ 一 甜2吻弛蚝蚝甜7 o0oo0 510 5 4 2 一+ 一十一+ 一+ 一+ 一+ 一 “2鸭蝴蚝蚝“7 00 0000 51 丘= 一十一+ 一+ + 一+ - i - - “2坞心地吻 将溶解氧的状态分为5 个等级,最= ( 低) ,垦= ( 较低) s 3 = ( 中等) b 4 = ( 较高) 及= ( 高) ,其表达式为: b :一1 + 一0 5 + 旦+ 旦+ 旦 l ;哆吩屹吩 垦:堕+ 土+ 堕+ 旦+ 旦 mv 2v 3v 4v 5 恳:旦+ 堕+ ! + 堕+ 旦 巧哆v 3v 4v 5 历:一0 卜0 卜0 5 + - l + ( 5 7 ) 巧匕v 3v 4 f 忍:旦+ 旦+ 旦+ 堕+ 土 哆v 2v 3吩v 5 卜海交通大学f 呵卜彳f 万论文 第四步:将主因子时间序列和辅助因子时间序列利用如上定义的语言变量模 糊集合进行模糊化,构成相应的模糊时间序列。 第五步:根据模糊化的主因子和辅助因子和已知的时问序列构建双因子高阶 模糊推理关系。 如果主因子第i 天的模糊化的历史数据为x ,则可以构建第f k 天,第 f 一2 天,第f l 天与第i 天数据之间的双因子高阶模糊逻辑关系 “( ( 置。,k ) ,( 置:,y :) ,( z ,r 。) ) 斗z 其巾2 k ,7 ,z 护,置:,五。表示 主因子在第i - k 天,第i - 2 天,第i - 1 天的模糊化的值,玩,z :,r 。表示辅 助因子在第f k 天,第f 一2 天,第f 一1 天的模糊化的值。 第六步:对新的数据,在生成的双因子高阶模糊推理关系表中查找匹配的逻 辑关系,将预测结果去模糊化即可得到预测的叶绿素值。会有如下几利一情况: 情况1 :如果第i 天之前的双因子k 阶模糊化历史数据为 ( k ,坛) ,( 置( 七_ ,) ,k 卜。) ) ,( ! ,) ,( 五。,k ) ,其中k 2 ;瓦,五( ) ,五:,五。为 第三步中获得的主因子模糊化值,圪,k 纠,为第三步中获得的辅助因子 模糊化值。在模糊逻辑关系库中存在如下k 阶模糊逻辑关系( 只有一个模糊关系 匹配) : ( ,坛) ,( 置( 卜i j ,k 纠) ) ,( :,砭) ,( 五一,写) j 墨 则第i 天的预测值t ,为: m i + 0 5 m 2 ,如果,:1 1 - i - 0 5 。 。 。= 半游 ,如果2 j , - - 1( 5 8 ) 堕业,如果_ ,:刀 1 - i - 0 5 。 。 其中,m ,- 1 ,m ,和m 川分别为区间“一材,和“川的中点。 情况2 :若存在多个匹配的模糊推理关系,即存在: ( 瓦,砭) ,( 置( ) ,k ) ) ,( k z ,砭) ,( 置- ,k ) 斗一。 ( 瓦,坛) ,( x 。n ,k 川) ) ,( x :,r z ) ,( 五t ,k ) j z : ( ,坛) ,( 五( t 一) ,k t _ ) ) ,( z ,砭) ,( 五,写) 。 气气 第- i 章叶绿裹的税捌时何j r 列而训1 力_ 三研究 且一。、一:l 模糊关系库中出现的次数分别为乃,、 :。 则第i 天的预测值,j 为: 7 0 i l j l + 乃2x l j 2 + + n j x t p ,2 _ ,i + 2 + + 其中,t j l0 :0 为( 5 8 ) 式的计算结果。 情况3 :若不存在匹配的模糊关系,即有: ( 纸,圪) ,( 置一1 ) ,匕) ) ,( x :,r ! ) ,( z 。,k ) j 群 则第i 天的预测值,。为: 1 x t j k + 2 x t j f 女一1 ) + + k x t l 1 + 2 + + k 其中,屯h ,为( 5 8 ) 式的计算结果。 5 3 5 二元模糊时间序列预测方法的改进 在上一节中提到的方法中,二元模糊关系法【5 2 1 是利用窗口宽度范围内的时间 序列样本产生模糊关系,然后将该模糊关系应用于下一步时间序列数值的预测, 这种方法没有考虑时间序列整体变动情况,而且对波动较大的叶绿素时间序列的 预测效果并不理想,二元高阶模糊推理法吲利用预测点之前的模糊时间序列情况 构建模糊推理库,然而由于时间序列的长度有限,在第六步中,“情况3 ”经常 出现,而针对这种情况所给出的处理方法是对窗口宽度范围内的模糊时间序列的 去模糊数值采用递增加权求均值的方法,这种方法频繁使用也会严重影响预测效 果。 考虑两种方法的特点与缺陷,本文提出了一种新的综合预测方法,其步骤如 下: 第一步:利用第三章中的s s a 方、法分别对叶绿素和溶解氧时间序列进行分 解,考虑到时间序列的波动较大的特点,只取前两阶主分量进行重构,形成叶绿 素和溶解氧变动的趋势信息时间序列。 第二步:对叶绿素和溶解氧的趋势信息时间序列使用5 3 3 中的二元模糊关 系法进行预测,窗口函数取w = 7 ,获得第i + 1 天的叶绿素趋势模糊化变动预测 值+ l 。 上海交通大学阿j 学 寺沦文 曼曼曼! 曼! 曼曼! 皇曼曼! i 一= 一 :i i| _ 鼍! ! 曼! ! 曼鼍! 曼蔓皇曼皇曼! 曼寰 第三步:对原始叶绿素时间序列,采用5 3 4 中的二元高阶模糊推理法进行 预测,阶数k = 3 ,对存在匹配模糊关系的情况( 情况1 和情况2 ) ,按照式( 5 7 ) 和( 5 8 ) 计算第i + 1 天的叶绿素预测值+ 。,对不存在匹配模糊关系的情况( 情况 3 ) ,则进入第四步。 第四步:利用第二步中获得的趋势模糊化变动预测值,与第i 天的叶绿素相 叠加,获得第i + 1 天的叶绿素预测结果。 5 4 算例分析 我们以一号站位和二号站位8 :0 0 组、1 2 :0 0 组、1 6 :0 0 组的浮标豁测叶 绿素和溶解氧数据为研究对象,二元模糊关系法取窗口宽度w = 7 ,二元高阶模 糊推理法取阶数k = 3 ,考察7 月2 1 日到8 月2 8 日的叶绿素数据的预测情况, 得到的单步预测结果的均方误差如表5 4 所示。从中可以看出,二元模糊关系法 和二元高阶模糊推理法比单变量模糊时间序列法的预测精度高,而本文提出的综 合预测方法则比其他预测方法的预测精度都要高。 另外,相同时间段样本,本文给出的方法由于考虑了采样数据的不确定性, 并采用了辅助预测因子,因此单步的预测精度要远高于第四章中的单因子预测方 法。 表孓4 不同预测方法的误差对比 t a b 5 - 4t h ee r r o ro fd i f f e r e n tp r e d i c t i o nm e t h o d s 二元模糊 二元高阶 本文提出的综 单变量法 关系法模糊推理法合预测方法 一号站位( 8 :0 0 ) 2 1 7 3 31 5 0 5 01 0 4 7 90 9 2 8 8 一号站位( 1 2 :0 0 ) 1 0 6 4 3o 7 1 8 70 8 0 8 20 6 8 3 2 一号站位( 1 6 :0 0 ) 2 5 3 8 32 0 2 3 91 2 4 2 7 1 1 0 5 5 二号站位( 8 :0 0 ) 0 7 3 7 30 3 6 8 60 3 9 3 60 3 3 7 1 二号站位( 1 2 :0 0 ) 1 0 1 0 3o 8 1 5 20 9 0 3 40 7 8 4 3 二号站位( 1 6 :0 0 ) 2 3 8 0 21 1 3 8 5i 2 3 0 51 0 7 8 2 5 7 第+ ,i 亭叶绿素的径彻时问序列预测方法研究 5 5 本章小结 考虑到叶绿素时间序列的非线性和数据不确定性等特点,本章采用模糊时间 序列的方法来处理与预测叶绿素监测数据,在总结与分析模糊时间序列原理与概 念的基础上,重点讨论了二元模糊关系法和二元高阶模糊推理法具体内容,并在 此基础上提出了种改进的综合模糊时间序列预测方法,试验证明该方法能够提 高叶绿素时间序列单步预测的预测精度。模糊集合理论拥有语言变量无缝连接优 势,利用模糊时间序列处理叶绿素时间序列能够实现该海域历史数据库信息的充 分利用,并且还能够充分结合专家的经验知识,发挥人机交互的优势。 能够比较准确的把握单点观测的叶绿素数据的变动,对赤潮的预测具有重要 的意义,其作用不仅在于能够实现对赤潮情况的提前估计,而且可以作为调整浮 标状态和提高观测密度的依据,另外预测值经过数据同化后,还可为赤潮状态的 预警提供参考值( 相关内容见第六章) 。 5 8 海交通大学m | 学侈论文 第六章基于数据融合理论的赤潮发生快速判别方法 6 1 引言 赤潮的发生与否常常根据赤潮生物的密度指标,同时结合前后几天的叶绿 素、营养盐、p h 、d o 、天气状况,浮游生物主要优势利生态类型,群落结构特 点等情况综合判断。由于赤潮生物的种群密度目前还没有很好的快速在线检验方 法,只能在现场取样后,通过试验室观测进而得出统计结果,因此常规的赤潮判 断方法存在严重的时间滞后性,往往要在赤潮爆发后一段时间才能判断赤潮发生 与否。然而,本监测系统不止要做到对赤湖发生的常规判断,还必须具备对赤潮 进行实时判断与快速预警的能力。 叶绿素是赤潮骼测过程中的重要监测参数,也是表征水体中浮游植物生物量 的重要表征因子。叶绿素的变动受许多因素的影响,但相比于其他的水质参数, 叶绿素与水中赤潮生物的生长或消亡有着最直接的关系 4 5 , 4 6 l ,因此在常规水质监 钡1 j 4 7 , 4 8 1 和水质的遥感监测【田1 中都被作为判断赤潮爆发与否的重要指标。 叶绿素参数的检测方法是多样化的,有些方法还能够实现叶绿素的非接触测 量。在本赤潮监测系统中一共有三种监测叶绿素的于段,因此叶绿素监测信息是 多源信息,三种监测手段分别为浮标监测、快速船载监测、卫星遥感反演监测。 其中浮标监测属于在线测量,快速船载监测和卫星遥感反演则属于离线测量,三 者获得的数据往往会存在一定程度的差异,并且都存在看较大的不确定性。因此, 综合利用叶绿素的多源监测信息,并结合现有的数据融合技术做到赤潮发生的实 时判断与快速预警是本章讨论的主要问题。 6 2 数据融合的相关理论 数据融合技术是从多信息的视角来研究与处理信息,尤其对智能信息处理技 术的研究提供了新的观点。它涉及数学、计算机科学、信息技术、人工智能、通 讯技术、管理科学等多种学科,是一门新兴的交叉学科。 数据融合(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论