




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
毕业设计题目黄河头道拐河段凌情预报物元分析模型设计与实现黄河头道拐河段凌情预报物元分析模型的设计与实现摘要黄河凌汛是河道的冰凌对水流的阻力作用造成的一种涨水现象。黄河流域跨越23个经度,地形地貌相差悬殊,径流量变幅较大。黄河流域由于其特殊的地理位置和地形特点,决定此处凌汛的多发性。而黄河宁夏、内蒙河段由于河道束窄、弯曲、浅滩,容易卡冰结坝,致使该河段水位上涨,形成严重凌汛。近年来,我国非常重视黄河冰凌的研究,国家先后投入巨资开展对冰凌形成机理、破除冰凌方法、预测冰凌出现时间等的研究。本论文首先分析了凌汛的几个成因,又介绍了黄河宁夏河段、内蒙古河段的地理位置、凌洪灾害。运用蔡文教授创立的物元分析理论,提取出影响黄河头道拐河段封河的三类因素,六个因子。构建物元模型、关联函数,模拟预测该河段的封河日期。关键词冰清凌汛封河可拓物元分析TOUDAOGUAIYELLOWRIVERLINGFORECASTMATTERELEMENTANALYSISMODELDESIGNANDIMPLEMENTATIONAUTHORLINHAIHUAINSTRUCTORYUANJINGABSTRACTICEFLOODISARISINGPHENOMENONCAUSEDBYRESISTANCETOTHEFLOWOFTHERIVERICEINTHEYELLOWRIVERTHEYELLOWRIVERRIVERACROSS23DIFFERENTLONGITUDE,TOPOGRAPHY,RUNOFFVARIESGREATLYTHEYELLOWRIVERDUETOITSSPECIALGEOGRAPHICALPOSITIONANDTOPOGRAPHICALFEATURES,DECIDEDTORUNMULTIPLEHOWEVER,THEYELLOWRIVERINNINGXIA,INNERMONGOLIARIVERASTHERIVERNARROW,CURVED,SHALLOW,EASYICEDAM,CAUSINGTHEWATERLEVELOFTHERIVERROSE,ASERIOUSICERUNINRECENTYEARS,THEYELLOWRIVERATTACHESGREATIMPORTANCETOTHESTUDYOFICEINOURCOUNTRY,THESTATEHASINVESTEDHEAVILYTOCARRYOUTTHEFORMATIONMECHANISMOFICE,ICEBREAKINGMETHODSTOPREDICTTHEOCCURRENCEOFICEANDOTHERRESEARCHTHISPAPERFIRSTANALYZESSEVERALCAUSESOFICERUN,ONTHEGEOGRAPHICALLOCATIONOFTHEYELLOWRIVERNINGXIA,INNERMONGOLIASECTION,THEICEFLOODDISASTERAPPLICATIONOFMATTERELEMENTANALYSISTHEORYCREATEDBYPROFESSORCAIWEN,EXTRACTEDFROMTHEINFLUENCEOFTHETHREEFACTORSOFTHEYELLOWRIVERTOUDAOGUAIRIVERFLOOD,AFACTOROFSIXCONSTRUCTTHEMATTERELEMENTMODEL,CORRELATIONFUNCTION,SIMULATIONANDPREDICTIONONTHEFREEZEUPDATEKEYWORDSICEICEJAMFLOODFREEZEUPMATTERELEMENTANALYSISEXTENSION目录1绪论111黄河流域凌汛112凌汛成因113黄河凌汛特征22黄河宁蒙段凌汛421宁夏河段522内蒙古河段523宁蒙段凌情总结63物元分析731物元分析介绍732物元理论833可拓集与关联函数114MATLAB2341MATLAB简介2342MATLAB2443数据和函数的可视化2644EXCEL、文件在MATLAB中的读写315冰情数据挖掘3251冰情数据说明3252数据处理3253利用数据挖掘对封河日期进行预测4154小结48结论49致谢50参考文献521绪论黄河流域东西跨越23个经度,南北相隔10个纬度,地形地貌相差悬殊,径流量变幅也较大。冬春季受西伯利亚冷空气影响,气候干燥寒冷,雨雪稀少。流域内冬季气温的分布是西部低于东部,北部低于南部,高山低于平原。元月平均气温都在0以下。11黄河流域凌汛凌汛,俗称冰排,是冬季河道中冰凌对水流的阻力作用所引起的江河水位明显上涨的水文现象。冰凌有时可以聚集成冰塞或冰坝,使水位大幅度抬高,造成漫滩或决堤。中国北方的河流,如黄河、黑龙江、松花江,在冬季的封河期和春季的开河期都有可能发生凌汛。黄河有“桃、伏、秋、凌”四汛,凌汛防御难度最大。由于黄河凌洪来势迅猛,凌峰流量沿程增大,水位急剧雍高,天寒地冻,防守困难,容易决口成灾。在历史上凌汛决门曾被认为是人力不可抗拒的,故有“凌汛决口,河官无罪”,“伏汛好抢,凌汛难防”之说1。12凌汛成因影响黄河下游冰凌演变的因素很多,其主要影响因素有热力因素、动力因素、河道形态及人类活动等。这些因素的相互作用,形成了黄河下游冰凌的演变过程和特点。121河道形态从黄河干流河道形态看,黄河下游是由西南流向东北,气温是上段暖下段冷,河道宽度是上宽下窄,比降是上陡下缓,这些特点对流冰和封开河形势十分不利,也是产生黄河下游凌情和凌灾的重要原因之一。据统计,凌汛期有95以上的险情或灾害发生在弯道、束窄断面或浅滩分叉道等局部河段,说明河道边界特征与凌情及凌灾关系十分密切2。122热力因素热力因素包括太阳辐射、气温、水温等,其中气温是各热力因素的集中表现。气温的高低决定河道的冰量和冰质,是影响结冰、封冻、开河的主要因素。首先气温具有地带性,表现在黄河下游河道上下河段因纬度差带来的气温差别。由于气温的差异使得黄河下游河口附近河道的流凌、封冻日期要早于上游河段,河道封冻是逆流而上,开河时上游河段解冻开河日期要早于下游河段,开河是顺河而下。123动力因素动力因素包括流量、水位、流速、风力含风向和波浪等,流速大小影响结冰和冰凌输移、下潜、卡塞等,水位升降与封、开河形势有关,水位平稳能形成“平封”和“文开河”,水位变幅过大能形成“立封”和“武开河”。水位和流速与流量具有函数关系,流量大,则流速大、水位高,因此,可用流量的大小作为冰情演变动力因素。124水库干流水库在防凌中发挥了积极的作用。三门峡水库在1973年以前水库防凌期主要是在预报开河前几天控制下泄流量,防止产生“武开河”。1973年以后采用全面调节运用,推迟了封河、抬高冰盖、增加冰下过流能力。加上出库水温升高2左右使水库以下150KM长河段少流凌或不流凌(如表11)。表1119501960年度、19601973年度、19731999年度和19992005年度不同时段的水文冰情要13黄河凌汛特征黄河干流凌汛主要发生在上游宁蒙河段、中游北干流河段、下游河段以及上中游干流水库库尾河段。黄河宁蒙河段和下游河段部分河道流向从低纬度流向高纬度,封河过程自下而上,当上游的冰水向下游传播时,因河道束窄、弯曲、浅滩,容易卡冰结坝,致使卡冰河段上游水位大幅增高,形成严重凌汛,直接给黄河大堤造成威胁3。黄河凌汛洪水在发生频次和规模上远较其他地区为高,往往造成较大灾害。黄河凌汛的主要特点有一是突发性强,形成冰坝的位置难以预测,有可能造成多处出险。二是水位上涨快,一旦开河时形成阻水冰坝,河道水位可能骤涨34米。三是破坏力大,河中的冰块在动力作用下,有摧枯拉朽之力,能切断碗口粗的树木和电线杆,冲击大堤时比推土机力量还要。四是抢险困难,冰封之地取土困难,冰坝破除难,手段少。近年来,我国非常重视黄河冰凌的研究,国家先后投入巨资开展对冰凌形成机理、破除冰凌方法、预测冰凌出现时间等的研究,取得了一些可喜的成果4。2黄河宁蒙段凌汛黄河从兰州到内蒙古河段,大致是由西南流向东北,从内蒙古的磴口到托克托黄河又变成从西流向动。黄河宁蒙河段地处黄河最北端大陆性气候特征显著降雨偏少、蒸发强烈。水流来自上游泥沙集中来源于河段中的十大孔兑。尤其内蒙河段干流长度830公里大部分属于冲积性河道。内蒙古河段河槽萎缩后排洪能力下降防洪威胁增大稍有不慎就会发生堤防决口。图21宁蒙河段图22黄河宁蒙河段河道平面图21宁夏河段211宁夏河段位置黄河自中卫县南长滩入境至石嘴山麻黄沟出境,全长397KM,流向自南向北,纬度增加2度。黑山峡至枣园135KM为峡谷河段,河面宽200300M,比降0810。因坡陡流急,只有冷冬年份才能封河;称为不常封冻河段。枣园以下260多公里,河面宽5001000M,比降0102,因坡缓、流速小、气温低,为常封冻河段。212宁夏河段凌洪灾害宁夏河段一般年份凌洪灾害不大,但刘家峡水库1967年12月初曾因导流洞闸门失灵而使泄流突然增大,水鼓冰开,使局部河段产生冰塞壅水造成凌洪灾害。成灾原因有以下几点1青铜峡水库蓄水位较高,阻碍流冰下泄该库1967年12月下旬至1968年1月中旬,蓄水位达1151M,比天然情况下水位抬高13M。因此,冰塞体不能下移,故在石空至枣园河段造成冰塞雍水灾害成冰塞。2上游来冰量多,从中宁站的气温观测成果看出19671968年的113月累积气温达7374,是40年来最冷的一年,封冻上首达石空附近,石空以上有400公里的未封河段,因此,有源源不断的流冰自上而下在石空河段形。3封河后,上游来水猛涨1967年12月6日,黄河上游刘家峡水库导流洞闸门失灵,下泄流量比封河时流量增大300750M3S,致使石空以上水鼓冰开,大量冰花冰块下潜在枣园上下,形成严重的冰塞4。22内蒙古河段221内蒙古河段位置黄河内蒙古河段,地处黄河最北端,从宁夏的石嘴山市和内蒙古伊克昭盟的拉僧庙入境,至伊克昭盟准格尔旗马栅的榆树湾出境,干流全长840KM,总落差仅1625M。泫河段河宽坡缓,逶迤曲折,虽地处上游,但在昭君坟至头道拐的河道比降仅为009011。已接近黄河河口的比降。黄河在内蒙古河段,区间的支流较少而且均为雨洪产流的时令河,冰期几乎无水补给,故内蒙古河段冰期来水绝大部分来自兰州以上。222内蒙古河段凌洪灾害黄河内蒙古河段,冬季严寒而漫长,元月月平均气温1012,极端最低气温达34,自上游兰州至包头纬度差437,致使上下河段温差也较大。由河道特性和水文气象条件决定了流凌、封冻日期溯源而上。在流凌封冻期,因湿周明显增加,阻力增大及部分过水断面被冰凌堵塞,因而水位上涨,部分水量转化为槽蓄水量储存在河道内。冰坝阻冰雍水,导致下游河段水位猛涨,冬季天寒地冻,防守困难,极易造成大堤决门5。成灾原因一是封冻期流量大,槽蓄水量多。流凌期流量比较大,尤其三湖河口以上都在850M3/S以上,因而封河水位也较常年偏高,封河流量、河槽蓄水量都较常年偏多。二是降温强度大,流凌封冻早。1966年11月中旬寒潮入侵,降温强度大,包头日平均气温达8,月末再次降温,气温达18,致使内蒙古各河段流凌、封冻日期均早于常年。三是解冻期气温回升晚,但上升幅度大。3月上旬旬平均气温仍较常年偏低37,青铜峡水库在开河期减少了下泄流量,使水流动力作用减弱,开河日期普遍推迟。通过上述分析可以看出,因为上游水库离下游凌洪严重河段距离过远,上游水库的调节运用,并不能从根本上解除内蒙占河段的凌洪威胁。因此,在现阶段,多种防凌措施还需综合运用,才能减轻或免除凌洪灾害的发生6。23宁蒙段凌情总结宁夏内蒙古河段在新中国成立前每年出现冰凌灾害,由于历史记载不完整,据粗估,晚清至民国较大范围的凌洪淹没损失平均二年就有一次。宁蒙河段的凌灾主要是由于开河时频繁卡冰结坝,造成壅水漫滩或决口成灾。新中国成立后,修筑大堤,兴建了大型调节水库,使冰凌灾害有所减缓。3物元分析物元分析是研究解决不相容问题的规律和方法的新兴学科,是思维科学、系统科学、数学三者的交叉边缘学科。它的中心是研究“出点子、想办法”的规律、理论和方法。它的数学工具是建立基于可拓集合基础上的可拓数学7。31物元分析介绍物元分析本身不是数学的一个分支,在它的数学描述系统中还需要保留一定的开放环节。在这些环节中,人脑思维与客观实际要在这里发挥作用。它是在经典数学、模糊数学基础上发展起来而又有别于它们的新学科。经典数学的逻辑基础是形式逻辑,模糊数学的逻辑基础是模糊逻辑,而物元分析的逻辑基础则是形式逻辑与辩证逻辑的结合。物元分析则是描述人脑思维出点子、想办法解决不相容问题的工具,它带有很浓的人工智能色彩。物元分析是一门着重应用的学科,它既可以用在“硬”科学方面,又可以用在“软”科学方面8。311物元分析的诞生自然界中很多事物都是质和量的统一,要想解决其中的冲突问题,就需要将事物的定量特点和定性特点有机地结合起来研究。可拓学是研究事物的可拓性和可拓规律与方法的科学,运用定性和定量的方法处理问题。1983年,我国的数学工作者蔡文先生发表了“可拓集合和不相容问题”一文,标志着可拓学的诞生。可拓学的基本理论是物元理论。物元分析引起国内外许多专家、教授、学者的兴趣和关注。1985年10月3日人民日报海外版以物元分析及其创立者为题介绍了这项研究。美国经济学家、诺贝尔奖获得者西蒙(HERBERTALEXANDERSIMON)教授给蔡文来信说“我发现您对问题的论述是很有意思的,而且您的例子也是很有用的”。物元分析诞生至今,它发展迅速、应用广泛,召开了多届全国物元分析学术讨论会,成立了“广东物元分析研究中心”,创办了智囊与物元分析杂志。研究成果也传播到美国、日本等地。已有多次国际会议邀请蔡文去介绍他的工作。由于蔡文这一研究工作的成就,国家科委评定他为有突出贡献的中青年专家。蔡文所著物元分析一书,已由广东高教出版社出版9。312物元分析的发展物元分析是研究求解不相容问题时出点子、想办法的规律与方法的理论。在现实世界中存在着两类总是相容问题与不相容问题。当所给的条件能达到要实现的目标时,称为相容问题;当所给出的条件不能达到要实现的目标时,则称为不相容问题。物元分析正是研究求解这类不相集合是物元分析的两个最重要的组成部分。物元分析的突出特点是它创立了“物元”这一新概念,并建立了物元变换理论。因为求解不相容问题,如果只从抽象的量和形的侧面考虑,是无法解决问题的,而必须同时考虑质和量,对质和量进行变换,才可以使问题获得解决。所以有必要引进能够表征质和量有机结合的新概念。把物理分析理论运用于系统的研究,得到了研究系统的物元分析方法。在系统研究中,也存在着大量的不相容问题,为了解决这些问题,建立了系统物元、相容系统和不相容系统等概念,并提出了化不相容系统为相容系统的有关方法,通过系统物元变换,可以处理不相容系统中的问题。把物元分析理论运用于决策理论的研究,建立了“可拓决策”方法。可拓决策方法,不是单纯考虑数量关系的迭代,而是采用最大限度满足主系统、主条件,其它系统则采取系统物元变换、结构变换等方法,化不相容问题为相容问题,使问题得到合理解决10。物元分析既然是专门研究如何处理难题的人脑思维的一种模型,因此,它将参与人工智能及与人工智能相关的学科。几年来,物元分析已取得了许多较好的应用成果。32物元理论在客观世界中,事物是质和量的统一体,事物的量变与质变是紧密联系互相制约的。经典数学从客体中抽象出它的量与形,研究数量关系与空间形式。由于它撇开了事物质的方面,因此,对于涉及质的变换的矛盾问题,就暴露出其局限性。为此,可拓论引进了物元的概念,以描述既考虑量变又考虑质变的思维过程。它把客观世界看成一个物元世界,把处理客观世界中的矛盾问题变成处理物元之间的矛盾问题11。321物元的概念假定给定事物的名称NAMEN,其关于特征(CHARACTER)C的量值(VALUE)V,则有序三元组RN,C,V(31)R是一个事物的基本元素,称为物元。N、C、V称为物元的三要素,N代表事物,C是事物的特征,V是事物N关于特征C所取的量值。物元概念中,()反映了事物的质和量的关系。物元是一个相当重要的概念,它把事物、特征、量值放在一起考虑,使人们处理问题时既要考虑量,也要考虑质。物元的三个要素的变化和事物内部结构的变化使得物元产生变化,因而物元是描述事物可变性的基本工具12。322物元的可拓性物元的可拓性是物元特有的性质,是处理矛盾问题的依据,包括物元的发散性、可扩性、相关性、蕴含性和共轭性,对应的方法称为发散树法、分合链法、相关网法、蕴含系法和共轭对法。1物元的发散性一事物具有多种特征,一特征、一特征元又为多个事物所具有,这类性质称为物元的发散性。从一物元出发,根据不同的规则,可以发散出相应的物元集。性质一个事物具有很多特征,简称一物多征。记为0000N,CVR|N,C,EC它表示事物具有一个特征C,也可以具有多个特征1,2,N。符号”表示可拓,EC表示特征的全体。性质具有同一特征的事物有无数个,简称一征多物。记为00N,CVR|N,C,E其中,EN表示事物的全体。性质具有同一特征元的事物有很多个,简称一特征元多物。记为00,CV|,CV2物元的共轭性对事物内部结构的研究,有助于利用事物的各个部分及其关系和相互转化去解决矛盾问题。系统论从系统的组成部分和内外关系去研究事物,这是对事物结构的一种描述。通过对大量现实事物的分析,除了系统性以外,事物的结构还可以从物质性、动态性和对立性等角度去研究。对事物N,用IMN表示事物N的虚部,用REN表示事物的实部,记IMRE把IM和RE作为事物,可以用虚部物元与实部物元来描述虚部和实部,如3212,NICV为事物的虚部物元。在一定条件下,某些虚部分物元与实部分物元可以相互转化,这一性质称为事物的虚实共轭性。与事物的物质性相仿,从系统性、动态性和对立性考虑,相应地可以把事物的结构分别分为软部和硬部、潜部和显部、关于某特征的负部和正部,并用物元表示相应的共轭部,对应的可转换性分别称为软硬共轭性、潜显共轭性和负正共轭性。3物元的相关性一个事物与其它事物关于某特征的量值之间,同一事物或同族事物关于某些特征的量值之间,如果存在一定的依赖关系,称之为相关。由于相关性的存在,一个事物的量值的变化会导致与之相关的事物的变化,一个事物或一族事物关于某一特征的量值的变化会导致关于别的特征的量值的变化,这种变化互相传导于一个物元相关网中。因此,可以利用相关关系去处理求知问题和求行问题。物元的相关性是事物因果关系的形式表示,相关物元构成的物元相关网和物元传导变换描述了事物变化所产生的传导作用。4物元的蕴含性蕴含分析原理是根据物、事和关系的蕴含性,以基元为形式化工具而对物、事或关系进行的形式化分析。对蕴含的概念作如下的定义若A,必有B,则称A蕴含B,记作,符号表示存在。A与B之间的关系称为蕴含关系。蕴含关系可以产生于事物、特征、量值、特征元和物元间。若干元素以及它们之间的蕴含关系构成一个蕴含系统B。12NB,5物元的可扩性物元的可扩性描述物元与其它物元结合和分解的可能性。事、物和关系可以组合、分解及扩缩的可能性,分别称为可组合性、可分解性和可扩缩性,统称为可扩性。33可拓集与关联函数康托尔集描述的是事物的确定性概念,用0,1两个数来表征对象属于某一集合或不属于该集合;模糊集描述的是事物的模糊性,用0,1中的数来描述事物具有某种性质的程度;可拓集描述的是事物的可变性,用中的数来描述事物具有某种性质的程,度,用质变域描述事物”是”与”非”的相互转化。这类转化用康托尔集或模糊集都是无法描述的,可拓集正是以这类实际问题为背景发展起来的一个概念13。331可拓集的概念下面介绍可拓集(EXTENSIBLESET)的定义。定义31设U为论域,K是U到实域R的一个映射,为给定的变换,UKT,称UKUETU,Y|T,YKU,YR为论域U上的一个可拓集合,YKU为的关联函数,为的可EUTKE拓函数,其中表示对论域U的变换,为对关联准则K的变换,为对元素U的变换K(这里规定当时,)。UTYKU0当时,称EUKUE,|T,YT0为的正质变域;TUKUU,Y|U,YK0,为的负质变域;EUKUT,|T,YT0为的正量变域;UKUEU,Y|U,YK0,为的负量变域;T0UKU,|T,为的拓界。E当时UKUTE,TE,称,Y|U,KUEY0为的正域;U,Y|U,KU为的负域;E0,|,0为的零界。E(1)当时,UKTE,UKT,,UU,Y|YU,YKT此可拓集为关于元素U变换的可拓集。(2)当时,UTE,UUT,,KKE,Y|YK,YTU此可拓集合为关于关联函数KU变换的可拓集。(3)当且时,UTEUTUK1K,T,U,UUE,Y|,YU,YKU此可拓集合为关于论域变换的可拓集。特别地,当且时,UKTEUTKUTYUEU,Y|,Y由上述定义可见,可拓集描述了事物“是”与“非”的相互转化,它既可用来描述量变的过程(量变域),又可用来描述质变的过程(质变域)。零界或拓界是质变的边界,超过它们,事物就产生质变。上述可拓集,当时,可把论域U划分为三部分TE,VU|,K0,0|,它们分别称为论域U的正域、负域和零界,如图31所示。VV0V图31TE时对论域的划分由此可见,可拓集的核心概念是质变域。质变域有正质变域和负质变域之分。正质变域表示非域或论域外一部分元素,它们不具有某种性质,但由于可拓变换(包括元素本身的变换、关联函数的变换和论域的变换),变为具有该性质。显然,不同的变换具有不同的质变换。质变域中的元素,经过变换产生了质变。质变域的提出,使人们把矛盾问题转化为不矛盾问题具有合理的理论基础。为方便起见,常把可拓函数记作。YKU,T特别规定(1)当KU,T0时,称T为质变变换。(2)当KU,0时,称T为量变变换。(3)当KU,T时,称T为增效变换。(4)当KU,时,称T为减效变换。与质变域相对应的是量变域,它表示在某变换下,其性质不产生质的变化的元素。事物的变化在量变域内进行的,属于量变的范围。如上所述,可拓集有两条疆界,一条是零界,一条是论域的边界。论域的变换表现为它的边界的改变,关联准则的变换表现为正域和负域的分界零界的改变,元素的变换是它的位置的改变,通俗地说,可拓变换可表现为两疆及元素的变换9。332关联函数在解决实际问题时,问题的矛盾程度是事物关于某个量值符合要求的程度来表述的,利用可拓集合在实轴上研究事物与量值之间的关系,而可拓集合是用关联函数来刻划的,因此只有建立实轴上的关联函数,才能使解决矛盾的过程量化成为可能。在可拓学理论中,解决实际问题需要定义关联函数,是事物变化的显式描述,处理流程如图32给定论域U和特征C的量域V(C)对事物作RN,C,C(N)CN数量化为X0,得到RN,C,X0)建立实轴的关联函数KX计算KX0表CN符合要求的程度KRKX0表N符合要求的程度规定关于量值得要求X和X0图32利用可拓论解决问题的流程由于事物的变化大多从量变到质变。因此,必须建立描述这一过程的定量化工具,这就是可拓集的关联函数。为了尽量减少人为的主观干预,研究了不同类型的定量化计算公式,去计算事物具有某种性质的程度。下面介绍常用的几种。(1)最优点在区间中点的初等关联函数很多实际问题对某些指标的要求都有两个区间量值符合要求的区间和可接受的区间。定义32设,且,记和的公共端点为(若无公0XA,BC,D0X0XZ共端点,则为空),对任意,令ZZX(33)且0000,1,XX,且,DXKXPX,称为点X关于和X在的中点取得最大值的初等关联函数,其中,K00(34)AB,2表示点X与区间的位置关系,称为点X与区间的距离。00X(35)且0000,XX,X,D,XAB,X,描述点X与和X组成的区间套的位置关系,称为点X与区间套,X的位置。00在有公共端点的情况,如,对的取值作如下规定ZACZK当,即,即时,取;Z0且,BXXC,DZK当,即,即时,取;XXZX1当时,即时,取;它表且Z0Z0A,B,Z0示即等于0,也等于1。ZK此关联函数的值域是,可用此公式计算点和区间套的关联程度。用上述公,式表述可拓集中的关联函数,就把“具有性质P”的事物从定性描述拓展到“具有性质P的程度”的定量描述。初等关联函数基本公式的建立,使问题关联度的计算不必依靠主观判断或统计,而是根据对事物关于某特征的量值要求的范围和质变的区间来确定。0XA,BXC,D这使关联函数摆脱了主观判断造成的偏差。在操作上,只要确定了四个点,就可以建立关联函数。因此,由这个公式扩展的关联函数计算公式对不同实际问题具有重要的价值。特别地,当,且无公共端点时,由于此时0X00X,X,XX,DX,AB故式(31)变为(36)0X,KDX这是最优点在的中点达到的初等关联函数。0AB2要恰当地建立初等关联函数,就必须首先恰当地确定4个端点的数据,即A,B,C,D,确定四个值的方法一般方法有根据专业规范和客观规律;根据实验记录、历史资料统计手段获得;利用数据挖掘技术确定;当无法根据、确定四个值时,可利用“28”统计规律法确定这四个参数,这种方法在新兴学科和前沿领域应用较多14。(2)侧距及相应的初等关联函数最优点不在区间中点的初等关联函数侧距的定义定义33(左侧距)给定区间,称0XA,B0ABX,2(37)000,X,XXB为想与区间关于的左侧距。0X定义34(右侧距)给定区间,称00ABX,X,2(38)000AX,X,X,XBB,由上可见,距是侧距的特例,即时0AX200ABX,X,2距设在实数域中的点X与点Y的距离。定义35设X是实数域,上的任一点,为实数域的任一有限区间,称,|/2|/XXBA为点X到区间的距。说明距和经典的距离不同,当X不属于时,距和距离概念一致;当X属于时,经典数学的距离为零,而距的值为负数,表示X在的位置关系下面介绍几个常用的关联函数。简单关联函数设X,MX,函数/XAMXKB,称为简单关联函数。其图形如图33所示初等关联函数设X0,X,且0X而无公共端点,令000,/,1XDXXK图33简单关联函数图像称KX为X关于区间X0,X的初等关联函数。其中,,|/2|/ABXABA称作点X到区间的距,001,XBDX朝右三角符X叉字符V朝下三角符符号线型符号线型细实线(默认)虚点线点划线虚划线符号色彩字符色彩B蓝色M紫红色C青色R红色G绿色W白色K黑色Y黄色PLOT(X,Y)采用默认的色彩次序用细实线绘制多条曲线【说明】当X、Y均为(MN)数组时,将绘制出N条曲线,每条曲线的几何位置由X,Y对应的列确定。当X、Y两个输入宗量中有一个是一维数组,且该数组的长度与另一个输入宗量的“行数”(或“列数”)相等时,将绘制出“列数”(或“行数”)条曲线。PLOT(X、Y,S)只能用S指定的点形线型色彩绘制多条曲线。PLOT(X、Y)指令采用细实线绘制曲线,并按照蓝、绿、红、青、紫红、黑的次序着色,以提高“观察性”。(3)多三元组绘制多条曲线PLOT1,S,2,S,XNY,S【说明】该指令的输入宗量有多个“三元组”(XN,YN,SN)组成。每个三元组是独立的,它的工作方式与PLOT(X,Y,S)完全相同。(4)单输入宗量绘制曲线PLOTY【说明】当Y是一维数组时,以该数组的下标为横坐标,Y为纵坐标绘制一条曲线。当Y是二维数组时,以该数组的“行下标”为横坐标,Y为纵坐标绘制“列数”条曲线。例如41试绘制下列函数图形YTKCOST0T2,K041T0PI/52PI41YCOSTKPLT,Y得到的结果如图43所示图43YTKCOST的图形432坐标轴控制和图形标识MATLAB对图形风格的控制比较完备友善。,它采用了一系列考虑周全的默认设置,另外,它又给出了一系列便于使用的指令,可以让用户根据需要改变那些默认设置24。(1)坐标轴的控制MATLAB用指令AXIS对坐标轴进行调整和控制。AXIS指令的功能非常丰富,如表44列出了常用的指令格式和功能。表44常用的坐标轴控制指令指令功能AXISAUTO使用默认设置AXISEQUAL横轴、纵轴的单位刻度设置成相等AXISNORMAL默认矩形坐标系AXISOFF关闭所有轴标注、标记和背景AXISON打开所有轴标注、标记和背景AXISSQUARE产生正方形坐标系AXISIJ矩阵式坐标,原点在左上方AXISXY普通直角坐标,原点在左下方AXISX1,X2,Y1,Y2人工设定坐标范围,X1和X2分别为横轴的初始值和终值,Y1和Y2分别为纵轴的初始值和终值【说明】在AXIS(X1,X2,Y1,Y2)指令中,必须有X1X2和Y1Y2成立;其中的元素允许取INF或INF,意味着上限或下限是自动产生的,即坐标范围“半自动”确定。(2)坐标刻度标识MATLAB用SET指令来设置坐标轴的刻度标识。SET指令的调用格式为SETGCA,XTIK,SYTICK,S其中,XS和YS分别为横轴和纵轴刻度标识的标识向量(必须从小到大依次排列)。SET指令的另一种调用格式为SETGCA,XTIKLBE,S1YTICKLABE,S2其中,S1和S2分别为横轴和纵轴刻度标识的标识字符串(字符串之间用|分隔)。(3)图形标识MATLAB允许对图形进行文字标识。常用的图形标志指令如下TITLE(S)图形标题。XLABEL(S)横坐标名。YLABEL(S)纵坐标名。TEXT(X,Y,S)在坐标(X,Y)出标注说明文字。GTEXT(S)用鼠标在特定出标注说明文字。其中,S为字符串。提醒作为字符串标记的单引号对必须在英文状态下输入。(4)图里注解当在同一个坐标系中绘制多条函数曲线时,需要区分各条曲线,为此MATLAB提供了图例的注解说明指令,其格式为LEGNDS1,2,PS该指令在图形窗中开启一个注解视窗,依据绘图的先后顺序,依次输出字符串对各条曲线进行注解说明。S1是第一条曲线的注解说明,S2是第二条曲线的注解说明,;PS是参数字符串,确定注解视窗在图形中的位置,其含义如表45表45参数字符串的含义参数字符串含义0尽量不与数据冲突,自动放置在最佳位置1放置在图形的右上方2放置在图形的左上方3放置在图形的左下方4放置在图形的左下方1放置在图形视窗外的右边(5)图像保存MATLAB用SAVEAS将图像保存为指定格式和指定的位置。SAVEAS的调用格式为SAVEH,FILNAMEXT【说明】H是图像的HANDLE。图像格式EXT选项如表46表46图像格式EXTVALUESFORMATAIADOBEILLUSTRATOR88BMPWINDOWSBITMAPEMFENHANCEDMETAFILEEPSEPSLEVEL1FIGMATLABFIGUREINVALIDFORSIMULINKMODELSJPGJPEGIMAGEINVALIDFORSIMULINKMODELSMMATLABMFILEINVALIDFORSIMULINKMODELSPBMPORTABLEBITMAPPCXPAINTBRUSH24BITPGMPORTABLEGRAYMAPPNGPORTABLENETWORKGRAPHICSPPMPORTABLEPIXMAPTIFTIFFIMAGE,COMPRESSED44EXCEL、文件在MATLAB中的读写441MATLAB读、写EXCELOFFICE的表格文件也就是XLS文件本质上就是一个二维矩阵,二维矩阵是用来保存数据的最佳方式,所以在日常工作中,我们从其它地方获取的数据通常都被保存为XLS格式,但处理数据时,我们却需要把XLS文件的数据导入到MATLAB里进行处理。MATLAB自身提供了大量的函数,包括读取OFFICE文件。其中XLSREAD和XLSWRITE就是专门用来读取XLS文件里的数据的。XLSREAD对于纯数据的XLS文件支持很完美,也就是说当XLS文件里的每个格子都是“数”时,XLSREAD会直接返回一个实数矩阵。但是通常我们拿到XLS文件并不是这样,它的表头多半是描述性文字,它的数据也有可能是文字,有些位置的数据还有可能是缺失的。XLSREAD对这样的文件读取无能为力,或者说需要大量的时间去协调数据的位置信息24。(1)XLSREAD读取MICROSOFTEXCEL电子表格文件语法NXLSREADFILENAMENXLSREADFILENAME,SHEETNXLSREADFILENAME,RANGENXLSREADFILENAME,SHEET,RANGE【说明】SHEET代表从哪个表中读入数据,RANGE代表读入数据区间例如A2D4(2)XLSWRITE写MICROSOFTEXCEL电子表格文件语法XLSWRITEFILENAME,MXLSWRITEFILENAME,M,SHEETXLSWRITEFILENAME,M,RANGEXLSWRITEFILENAME,M,SHEET,RANGE【说明】默认的是写入第一个SHEET,也可以指定写入第几个SHEET中,以及指定的RANGE。5冰情数据挖掘51冰情数据说明头道拐封河日期模型设计使用的数据是19862009年度的,以19861111987331,19871111988331,。,20091112010331形式存为EXCEL表格,依次命名为DATA1986,DATA1987,。,DATA2009,保存在“头道拐水文数据”文件夹中。EXCEL中以日期为行,以各因子为列。各因子的顺序分别是最高气温,最低气温,日均气温,日均水位,日均流量,上游三湖河口站日平均流量。如图51图51DATA1991XLS部分数据52数据处理521各参数图像输出根据参数性质不同,将原始数据的6个参数分为三类温度、水位和流量。温度类包括头道拐最高气温、头道拐最低气温和头道拐日平均气温三个参数;水位类包括头道拐日平均水位;流量类包括头道拐日平均流量、上游三湖河口站日平均流量两个参数。借助MATLAB编写程序,按照19861987年度、19871988年度20092010年度画出三类参数变换曲线图。函数如下图5254图52流量函数图53气温函数图54水位函数以下是19862009年度的三类参数变化曲线。保存在“各参数曲线图”文件夹下。此处只展示19861987、20012002年度的三类参数曲线。其他曲线不再一一列出。图55头道拐19861987年气温变化曲线图56头道拐198619872年水位变化曲线图57头道拐19861987年流量变化曲线图58头道拐20012002年气温变化曲线图59头道拐20012002年水位变化曲线图510头道拐20012002年流量变化曲线由图可以看出,温度类的三条曲线具有较好的相关性,可以作为一个影响因子;流量类也具有很好的相关性,因此也应该作为一个影响因子考虑;水位亦作为一个影响因子。522确定各参数经典域、节域数据时自1986年11月1日到2010年3月31月份的数据。在EXCEL中,容易算出各参数的最大值和最小值,如表51所示表51各参数的最值参数最小值最大值头道拐最高气温1924头道拐最低气温396头道拐日平均气温25713头道拐日平均水位954498929头道拐日平均流量3233270上游三湖河口站日平均流量5752060自1986年开始检测,到2010年共有数据3630条,按照“28”原则确定数据的经典域和节域。经典域是事件参数通常的值域范围,在这个范围内,事件只保持量的变化;节域是时间从量变到质变的变化范围,一旦超出这个范围,事件将变质。“28”原则认为,中间大约80的数据处于正常区间,即处在经典域内,两边各增加5,形成90的区间作为节域范围。据此,可以确定各个参数的经典域和节域。如表52表52各参数的经典域节域参数经典域节域头道拐最高气温(7,11)(9,13)头道拐最低气温(22,3)(24,1)头道拐日平均气温(142,32)(166,51)头道拐日平均水位(98663,98848)(98637,98865)头道拐日平均流量(226,795)(180,990)上游三湖河口站日平均流量(293,787)(210,900)523确定影响封河日期的因素我们主要研究1986年份2009年份的各参数变化的规律。由于各参数数据之间差别太大,因此在绘图时做了技术处理。考虑到是预测封河日期,河面开始结冰日期几乎全在12月份,故主要考虑每年的11、12月份的冰清数据。温度、流量、水位等均有一些相关性很强的因素,因此对数据进行细化,分解成是个分量11月份平均气温、11月份下旬平均气温、11月份日均气温转负累计、日均气温5累计天数、11月份日均流量、11月份下旬日均流量、三湖河口11月份下旬平均流量、11月份平均水位、11月份下旬平均水位、封河天数十个分量。存在“19862009年各参数与封河日期XLS”中。如图511所示图51119862009年各参数与封河日期从这十个分量中找出影响封河的主要因子。具体分析如下A十一月份日均流量、十一月份下旬日均流量、三湖河口11月平均流量与封河天数编写M函数如图512图512流量变化函数绘出图像如图513图513流量变化曲线可以看到,11月份日均流量和11月份下旬日均流量相关性很强,因此只保留一个即可,不妨选择保留11月份下旬平均流量。B11月下旬日均气温、11月份平均气温和封河天数编写M函数如图514图514气温变化函数绘出图像如图515图515气温变化曲线可以看到,11月份日均气温和11月份下旬日均气温相关性很强,因此只保留一个即可,不妨选择保留11月份下旬日均气温。C11月份下旬平均水位与11月份平均水位编写M函数如图516图516水位变化函数绘出图像如图517图517水位变化曲线二者相关性很多大,只留一个11月份下旬平均水位D11月份气温转负累计和日均气温5累计天数编写M函数如图518图518转负天数函数绘出图像如图519图519转负天数曲线由于11月份气温转负累计和日均气温5累计天数是从不同的角度来分析的所以均作为影响封河的因子。这样,去掉3个因子及封河天数,只保留6个因子11月份下旬平均气温(X1)、11月份日均气温转负累计(X2)、11月份日均下旬流量(X3)、11月份三湖河口下旬平均流量(X4)、11月份下旬平均水位(X5)、日均气温5累计天数(X6)。53利用数据挖掘对封河日期进行预测由于各参数的量纲、数值不一,甚至差别很大,因此需要对各参数进行无量纲化处理。其次,作为各个参数,直接使用参数本身数据也会造成较大的误差。因此,我们以逐年的各参数变化率作为影响因素的计算数值,求得预测年份的参数变化率,再乘以基数就得到预测日期26。根据上文分析,选取6个影响因素11月份下旬平均气温(X1)、11月份日均气温转负累计(X2)、11月份日均下旬流量(X3)、11月份三湖河口下旬平均流量(X4)、11月份下旬平均水位(X5)、日均气温5累计天数(X6),建立预测模型。531数据与处理将有关温度的参数采用绝对温度,将封河日期离当年度的11月1日之间的天数作为预测对象。那么所有封河日期天数的集合就构成所有的分类,每一个天数作为一个分类。根据统计资料,19862009年的封河日期天数在2172之间,因此可以分为52个类。这样,本课题就转化为分类问题,可以利用数据挖掘技术进行知识分类。以1987年开始计算各参数比上一年度的变化率,即增长率。编写函数如图520,图520增长率函数结果如表53所示。表53比上一年的增长率YEARX1X2X3X4X5X6封河日期19870025706984028360159500004012500691990000520179902628073620005101111003231991000410603502694025540001502333081251992000180005403657022850000100541020691993003681344606959051850005405897054351994004280895125032092280008415625119051995000851461503277036460001902195017391996000270687503626017630006101875026321996000590146800490338100003011540428619970006603395085990227300075079310819980010303216000130174700006051920513919990004112860571901358000803605714200100096069709916001720007701176021822002000510154002090162300001016670279120030004600611002902125000090028602200500016042820281400717000060088202045200600064060660288400076000150096803143200700066136750055401461000090142900652200800058004830254801255000360312502326200900048221360215203048000390238101509532建立预测物元模型以各参数变化率新的参数,建立物元模型(51)1256XVNRV533构造关联函数下面以19862003年的数据作为样本,以20052009年的数据作为预测年份,计算各待预测年份的关联度。首先构造关联函数如下KIJXI,XJ|XIXJ|(52)534计算预测年份与历史年份之间关联度利用公式(52),计算20052009年各参数与19872003年的关联度如表5458所示。表542005年份与历史年份对应参数的关联度YEARX1X2X3X4X5X61987002410270200022023120000202132199000068060810018608079000450199319910002510317055080183700021032151992133E05002891000560020014666E05000949199300384177280977304468000605015199400412046692221809945000781650719950010118897060910292900025013131996000
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论