




已阅读5页,还剩75页未读, 继续免费阅读
(农业水土工程专业论文)支持向量机在大坝安全监测资料分析中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 论文题目 学科专业 研究生 指导教师 支持向量机在大坝安全监测资料分析中的应用 农业水土工程 张真真 签名:引媛爱 李智录副教授 。扣一 签名:寸锦 摘要 随着水资源的开发与利用,大坝的安全问题日益突出,正确地预报大坝安全监测量, 对指导大坝安全运行和辅助决策具有重要的作用。大坝安全监控模型是分析、评价大坝性 态的主要工具,在大坝安全监测中发挥着重大的作用,大坝安全监测资料分析及安全监测 模型的建立是安全监测工作的最终价值体现。 本文在分析传统的大坝监控统计模型上,利用一种数据挖掘中的新方法一支持向量 机,建立了基于支持向量机的大坝安全监测统计模型,实际应用表明,将支持向量机应用 于大坝安全监测资料分析是成功的。本文主要研究成果: ( 1 ) 在大坝安全监测的建模分析中,建模因子主要考虑水压、温度、时效等因素, 并以此建立其与效应量间的复杂关系,最4 , - 乘回归统计方法是常用模型方法,但这种线 性统计模型一般很难反映这种复杂关系,而支持向量机,通过引入核函数,将输入空间中 的非线性问题映射到高维特征空间中在高维空间中构造线性函数判别,是一种很好的非线 性模型,因此,本文建立了基于支持向量机的大坝安全监测统计模型。 ( 2 ) 支持向量机是求解一个凸二次规划,计算复杂,计算速度慢,最d , - 乘支持向 量机采用等式约束替代不等式约束,加快了求解速度。因此,本文建立了最小二乘支持向 量机大坝安全监测统计模型,加快了求解速度,减少了计算资源,比传统的支持向量机模 型更具推广力。 ( 3 ) 针对大坝安全监测中,因子间的多重相关性,以及模型的非线性特点,本文将 偏最1 1 , - 乘回归与最小二乘支持向量机耦合,建立大坝安全监测模型。利用偏最小二乘回 归对影响大坝渗流和变形的诸多因素进行分析,提取对因变量影响强的成分,从而克服了 变量间的多重相关性问题,降低了最d , - 乘支持向量机的输入维数。实例分析表明,偏最 i 1 , - 乘支持向量机的学习训练效率比最小二乘支持向量机有较大的优势,更适合于大规模 的数据建模。 关键词:大坝安全;渗流和变形;支持向量机;最d - 乘支持向量机;偏最小二乘; a b s t r a c t t i t l e :a p p l i c a t i o no fs u p p o r tv e c t o rm a c h i n et os a f e t y m o n i t o r in e gd a 队a n a l y s i so fd a m m a j o r :a g r i c u l t u r a lw a t e r a n ds o i le n g i n e e r i n g n a m e :z h e n z h e nz h a n g s u p e w i s o r :a s s o c i a t ep r o f z h i l ul i a b s t r a c t s i g n a t ur e 砌砌 s i g n a t u r e :厶口厶,厶“ w i t ht h ew a t e rr e s o u r c e se x p l o i t a t i o na n du t i l i z a t i o n ,t h ed a ms a f e t yp r o b l e m sh a v e b e c o m ei n c r e a s i n g l yr e m a r k a b l e i ti si m p o r t a n tt of o r e c a s tt h em o n i t o r i n gd a t ao fd a m p r e c i s e l yf o rs u p e r v i s i n ga n dd e c i s i o n - m a k i n go ft h ed a mo p e r a t i o n t h ed a ms a f e t ym o n i t o r i n g m o d e li st h em a i nt o o lo fa n a l y s i s ,e v a l u a t i o no ft h es t a t eo ft h ed a m ,a n di nt h ed a ms a f e t y m o n i t o r i n gp l a y s 吼i m p o r t a n tr o l e ,t h e d a mp r o t o t y p eo b s e r v e dd a t aa n a l y s i sa n dt h e e s t a b l i s h m e n to fm o d e ls a f e t ym o n i t o r i n gi st h es a f e t ym o n i t o rw o r kf i n a lv a l u em a n i f e s t s b a s e do nt h ea n a l y s i so ft h ed a mm o n i t o r i n gt r a d i t i o n a ls t a t i s t i cm o d e l ,o nt h eb a s i so fa n e wd a t am i n i n gm e t h o d s u p p o r tv e c t o rm a c h i n e ,t h i sp a p e rb u i l tt h es u p p o r tv e c t o rm a c h i n e d a mm o n i t o r i n gs t a t i s t i cm o d e l t h ea n a l y s i ss h o w e dt h a tt h em o d e la p p l ys u c c e s s f u l l yi nd a m p r o t o t y p eo b s e r v e dd a t aa n a l y s i s t h em a j o r r e s e a r c hr e s u l t s : ( 1 ) i nt h ed a ms a f e t ym o n i t o r i n gm o d e l i n ga n a l y s i s ,t h em o d e l i n gf a c t o r sm a i n l yc o n s i d e r w a t e rp r e s s u r e ,t e m p e r a t u r e ,a g i n ga n do t h e rf a c t o r s ,a n dt ob u i l dt h ec o m p l e xr e l a t i o n s h i p b e t w e e nt h e s ef a c t o r sa n de f f e c tq u a n t i t y , l e a s ts q u a r e sr e g r e s s i o ns t a t i s t i cm e t h o di sa c o m m o n l yu s e dm o d e lm e t h o d b u tt h i sl i n e a rs t a t i s t i cm o d e l i s d i 衔c u l tt or e f l e c tt h i sc o m p l e x r e l a t i o n s h i p b u ts u p p o r tv e c t o rm a c h i n e ,t h r o u g ht h ei n t r o d u c t i o no ft h ek e m e lf u n c t i o n , m a p s t h en o n l i n e a rp r o b l e mo ft h ei n p u ts p a c et ot h eh i g h - d i m e n s i o n a lf e a t u r es p a c ea n di nt h e h i g h d i m e n s i o n a ls p a c es t r u c t u r e sl i n e a rf u n c t i o n s o i ti sag o o dk i n do fn o n l i n e a rm o d e l i n v i e wo ft h e s e ,t h i sp a p e rb u i l tt h es u p p o r tv e c t o rm a c h i n ed a ms a f e t ym o n i t o r i n gs t a t i s t i c m o d e l ( 2 ) s u p p o r tv e c t o rm a c h i n es o l v e sa c o n v e xo p t i m i z a t i o np r o b l e m ,c o m p u t a t i o n a lc o m p l e x i t y , t h es p e e ds l o w l y , a n dl e a s ts q u a r e ss u p p o r tv e c t o rm a c h i n eu s e se q u a l i t yc o n s t r a i n t st o a l t e r n a t i v ei n e q u a l i t yc o n s t r a i n t s s ot h es p e e do fs o l u t i o na c c e l e r a t e sg r e a t l y s o ,t h i sp a p e r b u i l tt h ed a ms a f e t ym o n i t o r i n gr e g r e s s i o ns t a t i s t i c a lm o d e lb a s e do nl e a s ts q u a r e ss u p p o r t v e c t o rm a c h i n e i ta c c e l e r a t e dt h es o l u t i o ns p e e d ,a n dr e d u c e dt h ec o m p u t a t i o n a lr e s o u r c e ,a n d h a dp r o m o t e ds t r e n g t hc o m p a r e dt ot h et r a d i t i o n a ls u p p o r tv e c t o rm a c h i n em o d e l ( 3 ) i nv i e wo fm u l t i p l ec o r r e l a t i o na m o n gf a c t o r sa n dn o n l i n e a rc h a r a c t e r i s t i c so fm o d e li nd a m s a f e t ym o n i t o r i n g i nt h ep a p e r ,t h ed a ms a f e t ym o n i t o r i n gm o d e lb a s e do n t h ec o m b i n a t i o no f p a r t i a ll e a s ts q u a r e sr e g r e s s i o n ( p l s ) a n dl e a s ts q u a r e ss u p p o r tv e c t o rm a c h i n e ( l s s v m ) 西安理工大学硕士学住论文 w a sb u i l t t h ef a c t o r sa f f e c t i n gd a ms e e p a g ew a sa n a l y z e db ym e a n so fp l st oe x t r a c tt h em o s t i m p o r t a n tc o m p o n e n t s ,t h e r e b yn o to n l yt h ep r o b l e mo fm u l t i p l ec o r r e l a t i o nc a nb es o l v e db u t a l s ot h ea m o u n to f i n p u t i n gd i m e n s i o n so ft h el s s v m c a l lb er e d u c e d t h ee x a m p l es h o w e d t h a tp l s l s s v mw a sm o r es u i t a b l et ot h em o d e lo fl a r g e - s c a l ed a t ad u et og r e a t e rt r a i n i n g e f f i c i e n c yt h a nl s s v m k e yw o r d s :d a ms a f e t y ;s e e p a g ea n dd e f o r m a t i o n ;s u p p o r tv e c t o rm a c h i n e ;l e a s ts q u a r e s s u p p o r tv e c t o rm a c h i n e ;p a r t i a ll e a s ts q u a r e 独创性声明 秉承祖国优良道德传统和学校的严谨学风郑重申明:本人所呈交的学位论文是我 个人在导师指导下进行的研究工作及取得的成果。尽我所知,除特别加以标注和致谢 的地方外,论文中不包含其他人的研究成果。与我一同工作的同志对本文所研究的工 作和成果的任何贡献均已在论文中作了明确的说明并已致谢。 本论文及其相关资料若有不实之处,由本人承担一切相关责任 论文作者签名: 孚红基堑护睁6 月) ,日 学位论文使用授权声明 本人燃基 在导师的指导下创作完成毕业论文。本人已通过论文的答辩, 并已经在西安理工大学申请博士硕士学位。本人作为学位论文著作权拥有者,同意 授权西安理工大学拥有学位论文的部分使用权,即:1 ) 已获学位的研究生按学校规定 提交印刷版和电子版学位论文,学校可以采用影印、缩印或其他复制手段保存研究生 上交的学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索;2 ) 为 教学和科研目的,学校可以将公开的学位论文或解密后的学位论文作为资料在图书馆、 资料室等场所或在校园网上供校内师生阅读、浏览。 本人学位论文全部或部分内容的公布( 包括刊登) 授权西安理工大学研究生部办 理。 ( 保密的学位论文在解密后,适用本授权说明) 论文作者签名:l 整錾童二 导师签名:j 阻 口矿年 月工日 1 绪论 1 绪论 1 1 大坝安全监测概述及意义 我国幅员辽阔,河流众多,具有十分丰富的水力资源,理论蕴藏量达6 7 6 g w ,可开 发3 7 8 g w ,居世界首位。为了充分利用水资源,兴水利除水害,我国迄今已修建了水库 大坝8 4 万座堤坝。其中1 5 m 以上的大坝约为1 9 万座,总蓄水量约5 1 0 g m 3 ,总装机容 量超过1x1 0 8 k w ,灌溉面积约5 5 x1 0 m 2 。从坝型上看,土坝占7 8 ,堆石坝占5 , 混凝土坝重力坝占1 2 ,拱坝占4 。在高于1 0 0 m 的大坝中,混凝土坝2 3 0 座,土石坝 1 8 0 座1 1 4 1 众所周知,大坝所拦蓄的水在正常利用时会带来显著的经济效益和社会效益,包括防 洪、发电、供水、航运、灌溉、旅游、养殖等;同时在提高城市化水平、促进区域社会经 济发展和生态环境建设方面也发挥了重要作用。但一旦溃坝,突然失控的水流将给下游人 民的生命财产带来巨大的灾害。近年来由于多种原因,如水文、地质、施工质量以及老化、 人力和物力等原因,部分大坝存在安全问题和监测资料分析不及时的问题,影响着这些工 程的效益发挥甚至威胁下游居民的生命财产安全。随着西部大开发和西电东送的开展,如 三峡、溪洛渡、小浪底等高坝大库也越来越多,对大坝的安全提出了更高的要求。尽管大 坝在设计时采用了一定的安全系数,但是设计中很难对坝的工作条件及承载能力作出完全 准确的估计,施工质量也不可能完美无缺,大坝在运行管理中还可能发生管理运行不当化, 因此国内外均有一些大坝曾出现失事的记录。2 0 世纪2 0 年代以来,国际上相继发生了圣 佛朗西斯重力坝( 美国,1 9 2 8 年) 、马尔巴塞拱坝( 法国,1 9 5 9 年) 、瓦依昂特拱坝( 意大利, 1 9 6 3 年) 、提堂土坝( 美国,1 9 7 6 年) 等溃坝事件,我国也先后发生了板桥、石漫滩两座土 坝( 1 9 7 5 年) 洪水漫项以及1 9 9 3 年青海省沟后水库失事,给相关国家带来了惨重的灾害和 巨大的经济损失1 5 - 7 1 。大坝安全监测已受到人们的广泛重视,我国已先后颁布水电站大 坝安全检查实施细则、混凝大坝安全监测技术规范、水库大坝安全管理条例、土石 坝安全监测技术规范等,同时,国际大坝会议也多次讨论过大坝安全问题。 大坝安全监测可以及时获取第一手的资料来了解坝的工作性态,为评价大坝状况提供 依据,从而可以制定适当的水库控制运行计划及坝的维护修理措施来保证大坝安全,在发 生险情时还可以发布警报减小事故损失1 8 1 。同时,通过对观测资料进行整体分析,建立 各种数学监控模型,利用反馈分析,馈控大坝原型结构和完善设计理论。因此,通过对大 坝安全资料的分析一方面可以及时监控和评价大坝和基础的工作状态,另一方面对在建或 拟建大坝的设计、施工和运行提供反馈信息,从而达到优化设计、施工和运行的目的。因 此大坝安全监测及其资料分析是保证大坝安全运行的重要措施,是坝工建设和运行管理中 非常必要、不可或缺的一项工作,有着重大的现实意义1 5 1 0 西安理工大学硕士学位论文 所谓大坝安全监测9 1 们是通过仪器观测和巡视检查对大坝坝体、坝基、坝肩、近坝 区岸坡及大坝周围环境所作的测量及观察,其首要目的是掌握坝的实际性状,为判断大坝 安全、对大坝的坝体和地基材料的参数进行反演分析以及综合评判和决策提供必要信息, 评价大坝的安全性。这一过程包括三个基本环节:数据量测、数据采集和数据分析,一个 完整的大坝安全监测系统也应该由这三部分组成。数据量测的结果分为两大类:环境( 原 因) 量和效应量。环境量主要包括气温、水温、降水量等,效应量监测项目主要有三类: ( 1 ) 常规监测主要有变形监测、渗流渗压监测、应力应变和坝体温度监测;其中,变 形监测和渗流观测被视为最重要的观测项目。 ( 2 ) 专项监测是指水力学监测、震动爆破监测和为常规监测提供必要的控制数据、基 准数据、环境参数及其一些辅助性监测项目。例如:坝区变形控制网、地应力监测等, ( 3 ) 另一类监测是指对大坝坝体、廊道、坝肩、泄水设施、发电设施、通航建筑物、 高陡边坡等通过目视检查和一些辅助手段进行的日常或定期检查。 数据采集( 包括传输) 是指定时或定期把量测得到的数据或资料通过自动装置或人工 手段或半自动半人工的方式采集起来作短时存放,再集中传送到近坝区或远方的监测中 心。 数据分析( 包括数据管理、分析解释、安全评价和辅助决策) ,其主要功能是对传输 来的各类监测数据和资料进行有序管理,建立数据库、图库、分析模型库和相关知识库等, 并应用一系列数据分析软件,对建筑物及相关岩体的性状变化和安全状态做出评价。在出 现可能危及建筑物安全的异常状况时,及时做出预报进行分级分类报警,并提出应对措施 的建议,为主管部门决策提供依据1 2 1 1 2 大坝安全监测模型 1 2 1 大坝安全监测模型概述 大坝安全监测的原始成果往往只展示了事物的直观表象,要深刻地揭示规律和做出判 断,还要通过对监测数据和监测资料的定性、定量正分析及反分析,对坝的状态做出及时 的分析、解释、评估和预测,才能为有效地监控大坝的安全提供可靠依据。早在1 9 5 5 年 意大利的f a n e l l i 和葡萄牙的r o c h a 等,应用统计回归方法定量分析了大坝的变形观测资 料。在此基础上f a n e l l i 等又于1 9 7 7 年提出混凝土坝变形的确定性模型和混合模型。即将 理论计算值和实测数据有机得结合起来,这类模型对监测大坝安全比较适用t i l l 。 大坝安全监测数学模型是对大坝效应量监测值建立起来的具有一定形式和构造的数 学式。这种数学方程式能够反映大坝效应量监测值的定量变化规律,确定大坝效应量与环 境变量间的确定性关系或统计关系。大坝监测的数学模型包括统计模型、确定性模型和混 合型模型。 2 1 绪论 ( 1 ) 大坝监测统计模型用数理统计方法来处理数据,建立起大坝监测统计模型来揭 示测值的变化规律。大坝监测统计模型是通过数理统计分析所建立的定量描述大坝监测值 变化规律的数学方程,是大坝实际工作性态的抽象和简化。 ( 2 ) 大坝监测确定性模型确定性模型是一种建立在物理力学基础上的模型,它结合 大坝和基础的实际工作状态,应用有限元方法或工程力学方法计算外荷载作用下大坝和基 础的位移场,然后以实测值进行校验,求得反映大坝和基础的平均力学参数的调整系数, 从而建立确定性模型。 ( 3 ) 大坝监测混合模型影响大坝效应监测量的因素很多,有些环境因素与效应量间 的关系是明确的,通过相应的物理理论和方法就可以建立这些环境自变量与效应量间的函 数关系式;另一些环境因素与效应量间的关系尚不明确,采用相应的物理理论和方法难以 建立这些环境自变量与效应量间的确定性关系式。针对上述情况,我们在建立大坝效应监 测量数学模型时,对各环境影响分量的形式的确定可采用不同的方法,从而使所得的数学 模型既保证有明确的物理概念,又计算简单,模型的质量较好t 1 2 l 。 除了上述三种典型模型外,在建立数学模型时,国内外许多学者还运用了时间序列分 析、回归与时序结合的分析方法、数学滤波方法、非线性动力系统方法等传统方法。 1 2 2 大坝安全监测统计模型研究现状 统计模型最早由意大利的托尼尼( t o n i n i ) 提出,由于大坝观测效应量( 如位移、渗压、 应力等) 是各种环境因素作用的综合效应,其量值取决于坝体几何尺寸、材料的物理力学 性能、工程地质条件和外界荷载等情况,为了解各环境量的作用,需通过数学、力学等方 法建立它们与效应量之间的关系。然而,由于坝体本身结构性态和环境因素的复杂性,使 得函数关系变得极为复杂难以用函数关系式来表示,人们只得用确定性函数法、物理推断 法及统计相关法来求其与环境量的表达形式,然后再根据最小二乘法求解各环境量项的系 数,用这种方法所建立的模型称为统计模型。统计模型是通过数理统计分析所建立的定量 描述大坝监测值变化规律的数学方程,是大坝实际工作性态的抽象和简化。 统计模型是大坝安全监测资料分析中最常用的模型,是建立混合模型的基础。大坝安 全监测领域常用统计模型采用的分析方法有:多元线性回归( m u l t i p l el i n e a rr e g r e s s i o n ) 、逐 步回归( s t e p w i s er e g r e s s i o n ) 以及近年来兴起的偏最小二乘回归( p a r t i a ll e a s t - s q u a r e s r e g r e s s i o n ) 。这些回归方法各有其特点和适用性; 7 0 年代,在陈久宇的开创下,国内开始应用统计回归分析原型观测资料,并对分析 成果加以物理成因的解释,使其逐渐用于监测大坝的安全运行和评价大坝的工况1 6 1 0 多元回归( 如逐步回归) 分析方法在国内外得到了广泛应用,它采用最小二乘法进行 回归参数的无偏估计,因此也称为最小二乘回归法t 1 3 - 1 4 1 。8 0 年代中期,吴中如等从徐变 理论出发推导了坝体顶部时效位移的表达式,用周期函数模拟温度、水压等周期荷载,并 西安理工大学硕士学位论文 用最小二乘法进行参数估计;提出了裂缝开合度统计模型的原理和方法,并在实际工程中 得到了成功应用。 偏最小二乘回归5 1 是一种新型的多元统计数据分析方法,它克服了传统多元回归分 析方法无法解决的因子之间的严重相关性,这种相关性有时会对分析效果产生较大的影 响,甚至使分析失效。偏最小二乘回归集多元线性分析,典型相关分析和主成分分析的基 本功能于一体,将建模预测类型的数据分析方法与非模型式的数据认识性分析有机地结合 起来,能很好地解决自变量集合内部存在的严重多重相关性问题 1 6 j 。 由于水利工程的特点:坝型不一,地质条件各异,运行工况也千差万别。因此,结合 大坝实际特点有比较地选择分析模型,对监测资料分析的准确性、系统性具有重要影响。 1 2 3 大坝安全监测模型的发展 近年来,国内外大坝观测资料分析逐渐向纵深方向发展,吴中如7 1 等通过引入空 间三维坐标,提出了混凝土坝空间位移场的时空分布模型,将单测点模型拓宽至空间三维; 黄铭、李珍照等提出了重力坝位移二维分布模型,且把单测点统计模型扩展为空间多测点 统计模型:何金平、李珍照等提出混凝土坝位移空间多测点分布模型,并把单测点确定性 模型扩展为空间多测点确定性模型。另外,模糊数学 1 8 1 灰色系统理论t 1 9 - 2 0 1 神经网络、 k a l m a n 滤波等各种新理论、新方法也被引入到大坝安全监测领域。并取得了一定的成果。 对大坝安全监测中的因变量建模时主要考虑水压、温度、时效等影响因素,进行回归 分析时一般是线性模型,而因变量与自变量的关系比较复杂,拟定的表达式有时难以精确 反映因变量的变化规律,最终也会影响模型的拟合及预报效果。而神经网络以其独特的结 构和处理方法,对环境变化具有较强的自适应学习能力,理论上可以实现任意函数的逼近, 它克服了模型必须是线性组合的局限们。 近二十多年来,非线性建模技术飞速发展。除神经网络外,如卡尔曼滤波技术,小波 理论,支持向量机等,这些方法都克服了观测数据的线性局限性,使大坝安全监测建模技 术又迈上了一个新台阶。 1 3 数据挖掘中的新方法支持向量机 1 3 1 支持向量机的提出 支持向量机眨m 3 1 是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问 题的新工具,它最初于2 0 世纪9 0 年代由v a p i n k 提出,近年来在其理论研究和算法实现 方面都取得了突破性进展。它是一种基于统计学习理论的小样本学习方法,它依据结构风 险最小化归纳原则,以特征空间中样本到最优划分超平面的最大间隔作为划分依据,建立 4 1 绪论 线性学习机。通过在高维空间中构造较低维的函数集,从而获得好的推广能力;由于在线 性学习机中样本点仅以点积形式出现,依据定理引入核函数很容易得到非线性学习机,从 而解决了非线性问题。提供了较好的方法。 支持向量机是以统计学理论为基础的,因而具有严格的理论和数学基础,支持向量机 具有以下特点: 1 ) 支持向量机是基于结构风险最小化( s r m ,s t r u c t u r a lr i s km i n i m i z a t i o n ) 原则,保证 学习机器具有良好的泛化能力; 2 ) 解决了算法复杂度与输入向量密切相关的问题; 3 ) 通过引用核函数,将输入空间中的非线性问题映射到高维特征空间中在高维空间 中构造线性函数判别,是一种很好的非线性模型; 4 ) 支持向量机是以统计学理论为基础的,与传统统计学习理论不同。它主要是针对 小样本情况,且最优解是基于有限的样本信息,而不是样本数趋于无穷大时的最 优解; 5 ) 算法可最终转化为凸优化问题,因而可保证算法的全局最优性; 6 ) 支持向量机有严格的理论和数学基础。 1 3 2 支持向量机的国内外研究现状 自从v a p n i k 及其合作者提出支持向量机算法以来,受到了众多学者的关注,这其中 既包括算法本身的改进和完善,又包括算法在不同领域实际应用的研究。目前,对支持向 量机的研究大体可以分为以下三个方面:支持向量机的基础理论研究、支持向量机的训练 算法研究和实际应用研究。 ( 1 ) 支持向量机的基础理论研究 由于核函数对支持向量机的性能有重要影响 2 4 1 所以对核函数的研究占据了支持向 量机基础理论研究的核心位置,这主要包括核函数的机理研究及模型选择。1 9 9 8 年,s m o l a 在其博士论文中详细研究了各种核函数的机理和应用t 2 5 1 0 张铃2 6 1 等人则分别给出了具 有某种特性的核函数的构造方法。对于模型选择,c a u w e n b e r g h s1 2 7 1 ,l e e 2 8 1 等人对针对 通常使用的交叉验证法和留一法计算量大的缺点进行了改进。j o a c h i m s 给出了泛化误差的 一个上界t 2 9 1 。c h a p e l l e 等先后提出所谓的硬间隔和软间隔边界1 3 0 - 3 1 1 0 随着对支持向量机的深入研究,一些学者提出了支持向量机的变形算法,这些变形算 法主要是通过增加函数项,变量或系数等方法使公式变形,从而产生各种有某一方面优势 或一定适用范围的算法。s c h o l k o p 针对c s v m ( v a p n i k 提出的可调参数c 的s v m 统称) 中参数c 缺乏直观解释的不足,提出了v s v m ,用v 代替c 加入到约束条件中,用以控 制支持向量的数目和误差1 3 2 1 。s u y k e n s 提出最d , - - 乘支持向量机的概念( l e a s ts q u a r e s s v m ) ,把标准支持向量机求解的二次规划问题变为一个线性规划问题1 3 3 1 。c h e w 提出加 西安理工大学硕士学位论文 权支持向量机( w e i g h t e ds v m ) 用以克服标准支持向量机不能区别样本重要性的缺点 【3 4 1 ,l i n & w a n g 提出模糊支持向量机( f u z z ys v m ) ,在算法中给每个样本都赋予一个模糊 隶属度值 3 5 1 该方法提高了s v m 抗噪能力,但其本质上是w s v m 。针对高维空间中的 属性预测问题,s c h o l k o p f 提出了所谓的o n e c l a s ss v m 的方法3 ,在o n e c l a s ss v m 中, 样本被映射到一个高维空间中,然后寻找样本点和高维空间原点的最大间隔。l e e 等人为 了设计能高效处理海量数据的算法,提出了r s v m ( r e d u c e ds v m ) 3 7 1 , 这种算法在求 解中能够限制支持向量数目。 ( 2 ) 支持向量机的训练算法的研究 支持向量机的训练需要求解一个二次规划的优化问题。对于小规模的训练样本来说, 用梯度下降法、共扼梯度法等来求解二次规划是直接而简单的方法。然而对于大规模的训 练样本来说,这些方法存在着很大困难。 1 9 9 2 年b o s e r 等人提出了c h u n k i n g 算法妇引。其基本依据是支持向量机最终的决策函 数只与支持向量有关,而与非支持向量无关。o s u n a 等人于1 9 9 7 年提出了固定工作样本 集的分解算法t 3 9 。j o a c h i m s 在o s u n a 的分解算法的基础上提出了一种解决大型s v m 学 习的算法 4 0 1 p 称为s v m “g h 。由于采用了核函数缓存以及启发式搜索策略,极大提高了 分解算法的速度。1 9 9 8 年p l a t t 提出了具有里程碑意义的支持向量机训练算法,即序贯最 小优化算法1 4 1 。它将工作样本集的规模减到两个样本。 ( 3 ) 支持向量机的应用研究 支持向量机是近年来倍受瞩目的一种处理高度非线性分类、回归等问题的新方法。近 几年来己在文字识别、人脸识别、医疗诊断、故障诊断、基因分类、遥感图像分析、函数 逼近、数据挖掘1 4 2 1 , 网络安全h 3 水1 、勘察测井、气象、化学计量h 5 1 等领域得到了一些 十分有意义的应用。一些学者还研究了支持向量机在混沌时间序列预测方面的应用 4 6 - 4 8 1 。 各方面的应用结果表明支持向量机比传统的分类和预测方法具有更佳的性能 4 9 1 。 b o s e r 和g u y o n 等人利用美国标准手写数字库进行的对比实验,使用多项式核函数 对手写阿拉伯数字进行了识别。实验结果表明,采用s v m 方法比采用其他神经网络算法 效果更好。d a n n yr o o b a e r t 等人将s v m v l 方法应用到三维对象识别技术上,取得很好 的效果,实验结果显示,若不考虑对识别对象的先验的知识,其识别准确率远优于其他方 法。 o s u n a 最早将s v m 应用到人脸检测5 们,j o a c h i m s 应用s v m 对文本分类进行了研究 1 5 1 1 ,谭小彬等人将支持向量机应用到异常检测方面 5 2 1 0 另外支持向量机在语音识别巧”、 三维物体识别巧4 1 等模式识别领域取得了丰硕成果。 2 0 0 2 年陈永义、冯汉中等人对支持向量机方法的原理在气象预报领域中的应用进行 了些尝试探讨,结果表明,方法能用于具有显著非线性特征的气象预测预报 5 5 1 0 近年来,支持向量机方法也不断的被应用到水利水电领域中,研究成果如下: 6 1 绪论 三峡大学和武汉大学的张立君和刘先珊提出了基于一种支持向量机的渗流监测方法。 在土石坝的坝体和坝基的适当部位设置一定数量的测压管,并进行观测,了解坝体的浸润 线和各点渗透压力的大小,对测压管水头进行预报。选气温、库水位、下游水位、降雨因 子和时效因子作为预报因子,建立了渗流监测模型。为水头预报和安全监测奠定了基础。 河海大学的高永刚等人将支持向量机应用的变形监测数据处理中,建立了了大坝沉降 与时间等因子的关系模型,通过对某大坝连续观测数据的计算分析,论证了支持向量机在 变形监测中应用的可行性和有效性。 大连理工大学的康飞等人用支持向量机对已知的样本集进行学习得到相应的大坝浸 润线预测模型。 支持向量机在水文中的应用也在不断发展中。l i o n g 亦已将s v m 应用于水文预报中 1 5 6 1 。天津大学的王亮等人将支持向量机应用到城市用水量短期预测中,均取得了不错的 效果5 刀。 西安理工大学的赵新宇博士将支持向量机应用到大型灌区退水量预测中,建立月退水 量预测模型。 1 4 本文主要研究内容 本文采用云南云龙水库和西安黑河金盆水库大坝实测资料为例,用三种支持向量机方 法分别对大坝渗流和应变预测进行了研究。本文的主要工作如下: ( 1 ) 利用云南云龙水库和西安黑河金盆水利枢纽工程导流洞的多年观测数据资料建立 大坝渗流和应变的支持向量机模型,用模型进行回归和预测,通过一定的统计评价指标对 预测结果进行分析,并将其与相同样本数量下建立的神经网络模型结果进行对比分析。 ( 2 ) 针对支持向量机计算复杂,计算速度慢的特点,提出最d x - - 乘支持向量机采用等 式约束替代不等式约束,从而加快了求解速度,利用同样的观测数据,建立大坝渗流和应 变的最小二乘支持向量机模型。 ( 3 ) 受气象、水文、地形、地质、坝体的材料、坝工结构特性、观测精度等因素的影 响,影响大坝安全监测变量( 即因变量) 的各类因子( 自变量) 之间,往往存在着一定程度的 线性或近似线性相关性,也称为多重共线性。尝试将偏最小二乘方法与最d - 乘支持向量 机耦合,利用偏最小二乘回归方法对影响大坝变形、渗流的诸多因素进行分析,提取对因 变量影响强的成分,克服变量间的多重相关性,降低最d - 乘支持向量机的输入维数。同 时,利用最d - - - 乘支持向量机可以较好的解决非线性问题。采用同样的观测数据,建立大 坝渗流和应变的p l s - l s s v m 模型。 本文主要包括三个层次的内容,是一个有机的整体,结构组织图如下: 7 西安理工大学硕士学位论文 8 下ij理论方法lili+till实践应用iiilillji+结论j上 2 统计学习理论 2 统计学习理论 2 1 机器学习问题 机器学习的基本思想就是通过让机器对大量信息的认知,进行内部学习、分析归类、 记忆存储和随时更新等处理过程,达到做出预期输出的目的。 机器学习包括三部分:产生器,训练器,学习机器。基本模型见图: 酒输出y 图2 - 1 机器学习模型 f i g 2 1l e a r n i n gm a c h i n em o d e l 机器学习的目的是根据给定的训练样本求出对某系统输入输出之间依赖关系的估计, 使它能够对未来输出做出尽可能准确地预测。这种对未来的现象做出正确判断或预测的能 力称作推广( g e n e r a l i z a t i o n ) 能力或泛化能力。假设给定样本集( x j , ) ,f - 1 ,2 七,r ” ( r 为实数域) ;咒r 。且自变量x 与因变量y 的依赖关系是未知的,即遵循某一未知的 联合概率f ( x ,y ) ,机器学习就是在一组函数f ( x ,州中求一个最优的函数对依赖关系进行 估计,使期望风险: r ( w ) = l l ( y ,f ( x ,w ) ) d f ( x ,y ) ( 2 1 1 ) 最小。其中,称 f ( x ,川) 为预测函数集,w 为函数的广义参数, f ( x ,w ) ) 可以表示任何 函数集; 2 2 经验风险最小化原则 在实际应用中一般根据概率论中大数定理的思想,即采用算术平均来代替数学期望, 定义经验风险 = 昙喜地,胞川) ) 利用求经验风险的最小值来代替求期望风险的最小值, ( e m p i r i c a lr i s km i n i m i z a t i o n ,e r m ) 。 ( 2 2 1 ) 这就是经验风险最小化原则 9 西安理工大学硕士学位论文 当训练样本数目趋于无穷大时,经验风险的最优值能够收敛到真实风险的最优值。 经验风险和真实风险之间的关系可以用下图来表示: 风险值 样本数 图2 - 2 经验风险与真实风险关系示意图 f i g 2 2f i g u r eo ft h er e l a t i o n s h i pb e t w e e nt h ee x p e r i e n c er i s ka n dt h er e a lr i s k 当训练样本数有限时,直接最小化经验风险实际上并不能保证能达到一个最小的实际 风险。某些情况下,训练误差过小反而会导致泛化能力的下降,这就是所谓的过学习。学 习能力过强的学习机器,它的泛化能力必然不够强。 经验风险准则不成功的一个例子就是神经网络的过学习现象,神经网络在训练样本 时,是使经验风险r ( w ) ( 即训练误差) 更小,但是训练误差小并不能保证预测效果好。 2 3 统计学习理论核心思想 基于数据的机器学习是现代智能技术中的重要方面,研究从观测数据( 样本) 出发 寻找规律,利用这些规律对未来数据或无法观测的数据进行预测包括模式识别、神经 网络等在内,现有机器学习方法共同的重要理论基础之一是统计学传统统计学研究的 是样本数目趋于无穷大时的渐近理论,现有学习方法也多是基于此假设但在实际问题 中,样本数往往是有限的。 与传统统计学相比,统计学习理论是建立在一套较坚实的理论基础之上的,为解决 有限样本学习问题提供了一个统一的框架它能将很多现有方法纳入其中,帮助解决许 多原来难以解决的问题( 比如神经网络结构选择问题、局部极小点问题等) ; 2 3 1v c 维 统计学习理论是关于小样本进行归纳学习的理论,其中一个重要的概念是v c 维。 v c 维反映了函数集的学习能力,v c 维越大则学习机器越复杂( 容量越大) 。v c 维定 义为:假如存在一个有h 个样本的样本集能够被一个函数集中的函数按照所有可能的 2 种形式分为两类,则函数集能够把样本数为h 的样本集打散。指示函数集的v c 维就 是用这个函数集中的函数所能够打散最大样本集的样本数目。也就是说,如果存在h 个 1 0 2 统计学习理论 样本的样本集能够被函数集打散,而不存在有办+ 1 个样本集能够被函数集打散,则函数集 合的v c 维就是厅。如果对于任意的样本数,总能找到一个样本集能够被这个函数集打散, 则函数集的v c 维就是无穷大。 直观来看假设有3 个样本,即h = 3 ,被函数集按如下2 3 种方式打散,而不存在4 个样 本被此函数集打散,则此函数集的v c 维为3 豳圈园 囡圈团 2 3 2 结构风险最小化原则 图2 - 3v c 维直观示意图 f i g 2 3f i g u r eo fv cv i c t o r i a v a p n i k 等人经过研究认为:经验风险和实际风险之间的概率满足如下关系: r(w)(w)+jh(1n(2nh圃+1)-in(r4) ( 2 3 1 ) h 是函数集的v c 维,力是样本数。由上式可知,学习机器的实际风险有两部分组成:一 部分是经验风险( w ) ,另一部分就是置信范围。结构风险最小化的基本思想就是:把 函数集构造为一个函数子集序列,使各个子集按照v c 维的大小排列,在每个子集中寻找 最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。结构示意 图如下: 风险 奄围 建弼f 图2 4 结构风险最小化示意图 f i g 2 - 4f i g u r eo fs t r u c t u r a lr i s km i n i m i z a t i o n 西安理工大学硕士学位论文 实现结构风险最小化归纳原理可以有两种思路,一种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论