(系统分析与集成专业论文)沿江环境的统计建模与评价研究.pdf_第1页
(系统分析与集成专业论文)沿江环境的统计建模与评价研究.pdf_第2页
(系统分析与集成专业论文)沿江环境的统计建模与评价研究.pdf_第3页
(系统分析与集成专业论文)沿江环境的统计建模与评价研究.pdf_第4页
(系统分析与集成专业论文)沿江环境的统计建模与评价研究.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京信息工程大学硕士学位论文 摘要 江苏沿江地区包括南京、镇江、常州、扬州、泰州、南通、苏州、无锡8 个市。沿江环境是沿江地区经济建设的主要载体以及能量的来源。沿江环境的 质量直接能够关系到江苏的整个的发展。党的十七大要求构建和谐社会,那么 就要坚持科学发展观。本文以可持续发展为指导思想,结合国内外最新的研究 成果设计了符合江苏沿江地区实际情况的综合评价指标体系。 沿江环境评价指标众多,合理选择指标是进行沿江环境评价的关键。本文 综合运用了相关性分析,聚类分析,多元线性回归分析以及灰关联等方法对沿 江环境的指标进行了分类筛选,运用两种方法建立评价模型。在实证研究中, 本文选取了沿江环境的水环境,大气环境,固体废弃物排放情况,声音环境等 指标,横向选取了八省市地区,时间上从2 0 0 2 年到2 0 0 8 年数据进行分析。 指标权重的确定有很多方法,本文在利用多元统计的方法进行评价的过程 中,为了验证评价的结果,采用了灰关联的方法进行指标的确定。在时间和空 间上进行了比较分析,点、线、面相结合,数据与图表相结合,指出了两种方 法各自适用的环境和要求。本文通过分析南京地区气象因素与环境的相关关系, 指出影响大气环境的主要的气象因素,在分析的基础上,针对沿江区域、不同 城市的环境特点、现状和变化趋势,提出了改善沿江环境的对策建议。 关键字:沿江环境,聚类分析,回归分析,灰关联,对策建议 南京信息工程大学硕士学位论文 a b s t r a c t 皿ec i t i e sa l o n gt h ey a n g t z er i v e ri n c l u d en a n j i n g ,z h e n j i a n g ,c h a n g z h o u , y 跹g z h 0 ut a i z h o u , n a n t o n g ,s u z h o u , a n dw u 菇i i ke n v i r o n m e n to ft h i sr e g i o ni s t h em a i nv e h i c l ef o re c o n o m i cd e v e l o p m e n ta n de n e r g ys o u r c e s n l eq u a l i t yo ft h e e n v i r o n m e n ta l o n gt h ef i v e rc a nb ed i r e c t l yh a st h ei n f l u e n c eo ft h ee c o n o m i c d e v e l o p m e n to ft h ee n t i r ej i a n g s up r o v i n c e o nt h er e p o r to f17 t 1 1n a t i o n a lc o n g r e s s o fc o m m u n i s tp a r t yo fc h i n a , t h ei d e ao fe s t a b l i s h i n gah a r m o n i o b ss o c i e t yi s i n c l u d e d s ow em u s ti n s i s to nt h es c i e n t i f i cd e v e l o p m e n t i nt h i sp a p e r , a st h e g u i d i n gi d e o l o g y o fs u s t a i n a b l e d e v e l o p m e n t ,c o m b i n i n gt h e l a t e s tr e s e a r c h a c h i e v e m e n t sa th o m ea n da b r o a dd e s i g n e dc o m p r e h e n s i v ee v a l n a t i o ni n d e xs y s t e m t om e e tt h es i t u a t i o no fj i a n g s up r o v i n c ea l o n gt h ey a n g t z er i v e rr e g i o n n e r ea r em a n yi n d i c a t o r st od ot h ea s s e s s m e n to ft h ee n v i r o n m e n ta l o n gt h e r i v e r c h o o s i n gt h er e a s o n a b l ei n d i c a t o r si st h ek e yt ot h ea s s e s s m e n to ft h e e n v i r o n m e n ta l o n gt h ey a n g t z er i v e r n l i sp a p e ru s e dt h ec o r r e l a t i o na n a l y s i s , c l u s t e ra n a l y s i s ,m u l t i p l el i n e a rr e g r e s s i o na n a l y s i sa n d 蓼a y - a s s o c i a t e dt os e l e c tt h e i n d i c a t o r s a n dt h e nu s i n gt w om e t h o d st oe s t a b l i s ht h ee v a l u a t i o nm o d e l 1 1 1 e m p i r i c a ls t u d i e s ,t h i sa r t i c l es e l e c t e dw a t e re n v i r o n m e n t , a t m o s p h e r i ce n v i r o n m e n t , s o l i dw a s t ee m i s s i o n s ,s o u n de n v i r o n m e n ti n d i c a t o r s ,a n ds e l e c t e de i g h tc i t i e s ,a n d t h et i m ef r o m2 0 0 2t o2 0 0 8t h ed a t af o ra n a l y s i s n l ee s s a yu s e sg r a y a s s o c i a t e dt h e o r ya n dm u l t i v a r i a t es t a f f s t i c a lm e t h o d st o e s t a b l i s ht h es t a t i s t i c a lm o d e l 1 1 1 ee n v i r o n m e n tw a se v a l u a t e ds e p a r a t e l yi nt i m ea n d s p a c eo nac o m p a r a t i v ea n a l y s i so fp o i n t , l i n e ,c o m b i n e dw i t ht h ed a t aa n dc h a r tt o e x p r e s s t h e nt h ee s s a yp o i n t so u tt h et w od i f f e r e n tm e t h o d su s i n gu n d e rt h es p e c i f i c s i t u a t i o ma n dt h ee s s a ya n a l y z e st h er e l a t i o n s h i pb e t w e e nt h ea t m o s p h e r ea n dt h e e n v r i o m e n t a tl a s to nt h eb a s i so ft h ea n a l y s i so ft h er e g i o na l o n gt h ef i v e ra n dt h e d i f f e r e n tc h a r a c t e r i s t i c so fd i f f e r e n tc i t i e s 也es t a t u sa n dt r e n d st h ee s s a yg i v e ss o m e s u g g e s t i o n st oi m p r o v e t h ee n v i r o n m e n t k e yw o r d s :e n v i r o n m e n ta l o n gt h ey a n g t z er i v e r ,c l u s t e ra n a l y s i s ,r e g r e s s i o n a n a l y s i s ,g r a y a s s o c i a t e d ,s u g g e s t i o n s 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。本论文除了文中特别加以标注和致谢的内容外,不包含其他人或其他 机构已经发表或撰写过的研究成果,也不包含为获得南京信息工程大学或其他 教育机构的学位或证书而使用过的材料。其他同志对本研究所做的贡献均已在 论文中作了声明并表示谢意。 学位论文作者签名:j 鸳:主羔 签字日期: 羔! ! :! :! i 关于论文使用授权的说明 南京信息工程大学、国家图书馆、中国学术期刊( 光盘版) 杂志社、中国 科学技术信息研究所的中国学位论文全文数据库有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文,并 通过网络向社会提供信息服务。本人电子文档的内容和纸质论文的内容相一致。 除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权南京信息工程大学研究 生部办理。 可公开口保密( 年月) ( 保密的学位论文在解密后应遵守此协议) 学位论文作者 指导教师签名 签字日期:! f1 2 :鱼= ! ; 签字日期:二压出l 二- 座一 南京信息工程大学硕士学位论文 1 1 研究背景 第一章绪论 江苏位于我国沿海与沿江生产力布局主轴线的结合部,西连长江中上游诸省,东接上 海,并以长江为依托,辐射范围大,区域市场发展迅速,地理位置优势显著u 】。 江苏沿江区域包括南京、镇江、常州、扬州、泰州、南通、苏州、无锡8 个市。沿江 地区大中小城市密集,对外开放起步早,产业配套能力强,科技教育相对发达,劳动力充 足且素质较高,科技资源丰富,人才广聚,具有得天独厚的发展优势。但是传统的经济发 展一般是采用粗放型的经济发展,虽然取得了一定的成绩,但是对于生态环境以及环境质 量都造成了很大的负面影响。同时由于环境政策贯彻落实得还不够到位,资源环境的利用 效率不高,对可持续发展有一定的挑战 2 1 。 社会的发展是一个有序而平衡的过程,人们在追求经济发展的过程中,普遍要求可持 续性发展、要求利用科学的发展观进行发展【3 】。十七大报告上,党首次把“生态文明”这 一理念写进党的行动纲领。经济发展过程中要注重和保护生态环境的协调发展。随着经济 的快速发展,区域环境压力也会不断增加。目前江苏沿江现有及规划中的国家级和省级开发 区共有3 6 个,主要涉及化工、电力、冶金、造纸、电子、汽车等行业,其为江苏的经济做 出贡献的同时也进一步增加长江的潜在环境风险,污染事故突发的风险等将严重威胁到流 域乃至更广范围的人民生活安全、经济发展和社会稳定【4 】。处理好经济与环境的协调发展, 毫不犹豫地坚持可持续发展,坚持以人为本,促发展,即坚持科学发展观,是沿江经济发 展并能够带动整个江苏腾飞真正成功的关键。 1 2 研究意义和目的 保护沿江环境有助于促进资源的永续利用,构建资源节约型社会和环境友好型社会; 有助于污染防治、改善生态环境:有助于创造新的经济增长点、增加就业机会:有助于落 实科学发展观,全面建设小康社会;它是我国增强国际竞争力的重要途径和客观要求【5 j 。 本文的研究意义可以从两个方面来说明,在理论研究方面,通过沿江环境评价的综合 研究,对于多元统计方法以及灰关联方法在评价研究中应用的条件以及两种方法各自的优 缺点进行说明;在现实方面对于江苏沿江整体以及各个城市的环境保护进行分析总结,给 出意见建议,指导江苏沿江科学的发展。 研究的目的是根据沿江环境的重要性的研究,运用科学的方法构建符合江苏实际的和 符合可持续发展目标的综合评价指标体系和综合评价模型,随时掌握沿江环境的现状、特 点、变化过程与趋势,科学指导经济发展,统筹考虑流域上下游左右岸、不同地区或同一 南京信息工程大学硕士学位论文 地区内不同产业的发展布局,对全省沿江经济发展总体布局进行优化调整,使总体规划方 案充分体现科学发展观和循环经济发展战略,从而实现沿江各市污染物总量的结构性减排: 把环境容量和资源禀赋对经济增长的硬性制约作用进行有效的传递,推动沿江地区合理发 展经济,有效实现资源的合理配置;通过对开发规划方案的评价提出替代方案或减轻环境 影响的措施建议,将污染控制方案和生态保护方案纳入到沿江产业经济发展过程中,指导 企业走循环经济和清洁生产之路,从而有效减轻对生态环境的影响,规避环境风险。确实 实现沿江区域的科学发展。 1 3 研究现状 国内外对于环境评价的研究比较多,基本上侧重于具体一类环境特点的研究,例如对 于某一地区的水环境,大气环境等等,而没有将整个系统内的环境综合考虑进去,针对区 域环境的指标体系的研究和评价研究的资料比价少。 张晓伟等在灰关联分析与多元线性回归模型联合应用研究在这篇文章中作者依据 5 0 年( 1 9 5 4 - 2 0 0 3 ) 和田绿洲的气象资料,应用灰关联分析,发现影响绿洲蒸发能力的主要因 子是相对湿度与平均气温,在此基础上建立了回归模型。王晓鹏,曹广超等在基于多元 统计的水环境质量综合指数研究这篇文章中利用主成分分析法进行了水环境的评价。周 丰,郭怀成等在基于多元统计分析和r b f n n s 的水质评价方法这篇文章中利用方差分 析对各断面多年水质监测样本进行时间与空间尺度上的显著差异性分析,识别出具有显著 差异的样本,然后通过层次聚类分析把上述样本进行聚类分组,最后应用径向基神经网络 对各组样本进行水质评价。 目前对于环境质量综合评价的方法很多,环境评价实际上是具有确定性评价标准和评 价指标与评价因子权重的不确定性相结合的多元统计的过程,目前专家进行的是针对一类 的环境问题而进行的。江苏沿江地区不管从地理位置、经济发展、产业结构和生态环境等 各个方面都有一定的特殊性和代表性,对于这样的一个特定的大江流域的环境评价的研究 方案未见报道。 1 4 本文研究内容 本文在国内外环境评价研究和发展的基础上,对江苏沿江环境进行了分析研究。进行 综合评价前,本文研究了国内已有的关于环境评价的指标体系建模方法,对于他人运用的 方法原则进行了总结,同时结合江苏沿江的具体实际,按照科学发展观、可持续发展等观 点建立符合江苏沿江实际的评价指标体系。 环境评价是个综合的系统工程,评价的层次具有多层次,多复杂性的特点。对于这些 特点,本文通过聚类分析的方法对于沿江的各个城市进行聚类分析,找出城市间污染源和 环境特点相类似的城市。对于沿江环境的多个指标体系,本文通过回归分析的方法和层次 2 南京信息工程大学硕士学位论文 分析法进行综合评价。出发点有两个,针对于多层次的特点,选取层次分析法具有实用性: 同时在权重的确定过程中,选择灰关联的方法;对于指标的选择过程中多复杂性的特点, 通过回归分析,选取了相关性较小的指标体系。对于两种方法进行的评价最后进行分析总 结,从理论上和实际上给予指导。 本文收集和整理了2 0 0 2 年至2 0 0 8 年江苏沿江环境指标体系中的指标数据,首先进行 了归一化处理,通过多元统计和灰关联的方法进行了分析,指出了两种分析方法各自使用 的条件,同时对于两种分析方法所产生的结果进行比对。通过分析南京地区环境质量和气 象因素的关系,得出一定的结论,为对策建议提供理论支持。 1 5 本文组织结构 本论文的主要组织结构如下: 第一章主要介绍了论文的研究背景,研究意义与目的,国内相关研究的现状,并对论 文研究的主要内容和全文组织结构进行了说明。 第二章总体介绍聚类分析,回归分析,灰关联分析一些基本理论和概念。 第三章进行实证分析研究。首先介绍了综合评价的基本概念以及进行建模的一般方法。 其次针对沿江环境研究现状,对选取的指标体系进行了说明并利用聚类分析对指标体系进 行分类。通过多元线性回归的方法和灰关联的分析的方法分别建立评价的模型。 第四章进行了空气质量与气象条件关系的分析,利用南京作为主要的研究对象,研究 了风向,风速,降雨,逆温层对于空气质量的影响,为第五章的对策建议提供理论依据。 第五章对前面的计算结果进行了分析说明,指出了两种方法各自利用的具体情况,同 时利用评价结果有针对性的提出了对策建议,力图为决策部门提供参考。 第六章对本文进行了总结和展望,提出了下一步的研究方向。 3 南京信息工程大学硕士学位论文 第二章评价指标的确定方法 环境系统在系统科学上来讲是一个复杂的大系统,对于环境进行综合评价是一个综合 性的工作。环境系统指标数据量大,涉及到大气环境,声音环境,水环境,固体废弃物的 排放情况,而每个分系统又有很多的子指标。由于变量的个数众多,且带有动态性,数据 之间存在着一定的相关性,对于指标的提取比较复杂。针对这个问题,本文采用多元统计 和灰关联的方法分别进行统计研究。 多元统计分析是利用对于多维复杂数据进行科学分析的优势,深入的挖掘环境系统的 特征和内涵,从大量的数据中找出规律,把握本质特征,提取出重要的信息,能够使复杂 的指标简单化。利用多元统计可以将指标按照相似度进行分类。本文利用多元统计里面的 聚类分析,对沿江市县按照环境状况类似的进行分类,可以为政府决策提供参考。 灰色系统理论提出了灰色关联分析方法,由于环境统计数据的有限性,现有数据的灰 度大,有些没有典型的分布规律,灰关联的方法弥补了作为数理统计的缺点,对于样本数 据的多少和分布规律没有多元统计那么要求严格,可以用来进行补充分析。 2 1 聚类分析 多元统计分析是数理统计学3 0 多年来迅速发展起来的一个分支。随着计算机的普及, 各种统计软件不断推出,多元统计分析方法已广泛应用到各个领域。本文首先进行聚类分 析,然后进行多元线性回归分析,下面首先来介绍聚类分析的基本概念。 2 1 1 聚类分析的基本思想 聚类分析是多元统计中经常使用的一种方法,在实际的应用中在对观测数据分类上起 到很好的作用。聚类分析是将一系列变量,按照在性质上的相似度进行分类。聚类分析可 以分为以下几种 6 1 : l 、系统聚类法:最初将每个对象定义为一类,把最相似的两类进行合并,合并后再重 新计算新类和其他类的距离,最终将所有对象归并为一类。 2 、动态聚类法:首先对k 个对象进行分类,依据分类损失函数最小的原则对分类结果 进行调整,直到出现最优结果为止。 3 、最优分割法:这种方法一般用于有序样品的分类,首先将所有的观测对象看作一类, 根据某种规则,将其分为两类、三类等,直到分到所定义的k 类为止。 4 、图论聚类法:该方法是利用图论理论中的最小支撑树的理论进行分类处理的过程。 5 、聚类预报法:在多元统计中,可以进行预报的方法有很多种。聚类预报可以针对一 些异常的数据进行预报。 4 南京信息工程大学硕士学位论文 2 1 2 相似性测度 聚类分析是将性质相近的个体聚为一群,对于性质相近如何进行测度就成为重要的问 题。 根据变量取值的不同,变量可以分为两大类:定量变量和定性变量。定量变量就是所 说的连续变量,它们由测量或计数、统计所得到的量,这类变量具有数值特征。定性变量 并非真有数量上的变化,而只有性质上的差异。这类变量中还可以分为两种,有序变化和 名义变量。有序变化是没有明确的数量关系,只有次序关系,如质量的等级。名义变量是 没有次序的关系的不同状态,例如性别等。不同类型的变量在定义距离或者相似性测度的 时候有很大的差异。在实际中遇到的比较多的是定量数据的聚类分析问题 7 1 。 相似性度量的选择中,常常包含许多主观上的因素,但是最重要的是考虑指标性质或 者观测的尺度。不同类型的变量,相似性的测度也不尽相同,常用的度量方法有以下几种: 为了说明的方便,设x ,y 是两个要测度相似性的聚类变量,它们均有m 个值。 1 、定量变量的相似性测度 对样品进行聚类时,相似性通常用距离来衡量,常用的距离的定义有以下几种: k - - 一m ( 1 ) 绝对值距离:d i s t a n c e ( x ,y ) = l 坼一y k i ( 2 ) 欧氏距离:d i s t a n c e ( x ,y ) = ( 3 ) 平方欧氏距离:d i s t a n c e ( x ,y ) = z ( x k - y t ) 2 k = l ( 4 ) 切比雪夫距离:d i s t a n c e ( x ,少) = 恐骄i 雄一y k l ( 5 ) 明考斯基效力距离:d i s t a n c e ( x ,y ) = 在上面五种距离中,欧氏距离和平方欧氏距离实际应用中最广泛的。而名考斯基效力 距离是五种距离中最综合的,其他的距离只是p ,f 取特殊值的情况。 对于指标聚类是,相似性通常根据相关系数和某种关联性来度量。 ( 1 ) 夹角余弦r =露露 5 y x 砌心 南京信息工程大学硕士学位论文 ( 2 ) 皮尔逊相关系数勺= k = m ( - x - - ) ( y i - y - ) 膏= 1 露j 臣焉 有时将1 一乙,定义为距离,两变量间相关系数越大,距离越小,说明两变量性质越接 近。实际上,皮尔逊相关系数就是标准化之后的夹角余弦值,由于剔除了量纲的影响,能 更准确地测量变量之间的关系,因此皮尔逊系数在实际中应用更为广泛。 2 、定性变量的相似性测度 关联测度常用于测度名义变量的相似性,一般都是基于列联表来计算。设x ,y 均是取 值为o ,1 的变量,a 表示x ,y 均取o 时的配对个数,b 表示x 取0 ,y 取1 时的配对个数, x 共a + c 个值取0 ,y 共有a + b 个值取0 ,每个变量共有a + b + c + d 个值。常用的关联测度方 法是,不匹配系数,即x ,y 取值不相同的个数与取值总数之比:r = ( b + e ) ( a + b + c + d ) 。 2 1 3 系统聚类法 系统聚类法有两种,聚类法和分解法川。聚类法就是首先将每个个体各自看成一群, 将最相似的两群合并,重新计算群间距离,再将最相似的两群合并,每步减少一群,直至 所有个体聚为一群为止。分解法正好相反,它首先将所有个体看成一群,将最不相似的个 体分为两群,每步增加一群,直至所有个体自成为一群为止。 系统聚类法的基本步骤如下: 1 、首先计算n 个样品两两之间的距离,得到样品间的距离矩阵d 忡 2 、初始n 个样品各自为一类,类的个数k = n ,第i 类q = 置) ( f _ 1 埘) ,类之间的 距离( 即d ( 1 ) = d ( o ) 。其次对样品x r i 、( f = 2 甩) 执行步骤3 和4 。 3 、对步骤2 得到的距离矩阵”,将类之间的距离最小的两类合并为新的一类,类 的总数为k = n i 1 。 4 、重新计算新类和其他类之间的距离,得到新的距离矩阵。如果合并后类的总个 数k 依然大于l ,重复步骤3 ,4 ,当类的总个数为1 时进行步骤5 。 5 、画出谱系数聚类图。 6 、最后确定分类的个数和成员。 2 1 4 快速样本聚类 当需要分类的类数确定时,快速聚类能迅速地将各样本值分到各个类中去。利用快速 聚类进行分析的时候,可以利用统计软件本身的默认值,或者可以自行设定条件。例如可 以定义所需要的样本要分为几类,最终停止的条件等。 6 南京信息工程大学硕士学位论文 在进行快速样本聚类的时候,首先要确定变量的个数以及要分类的类数。同时聚类分 析的变量一定要是数值型的变量。同时要指定一个归并量用来测度观测值归并到具体的哪 一类。其计算步骤如下: 1 、确定归并的类的数目。在实际的研究过程中一般是由分析人员通过几次不同的分类 对数据进行分类,然后通过分析选取出最优的聚类数。 2 、其次决定聚类中心。一般的方法是由分析者指定或者通过数据分析结果由数据自身 的结构确定。 3 、分别计算每一个数据距离中心值的距离。依据距离最近的原则进行分类,同时要计 算出新类的中心点。 4 、由步骤3 得出的新的中心点后,接着计算数据到新的中心点距离,重新进行数据归 类,计算出新的中心点。 5 、重复步骤4 一直到收敛标准或者规定的迭代次数。 2 2 回归分析 回归分析是统计学的一个重要的分支,它基于观测数据建立变量直接的某种依赖关系, 分析数据的内在规律,并可以用于预报,控制等方面。线性回归分析是描述一个因变量与 一个或多个自变量之间的线性依存关系。根据自变量的不同可以分为一元线性回归,多元 线性回归,非线性回归等。 2 2 1 建立实际问题回归模型步骤 在实际问题回归分析模型的建立和分析中有几个具体的阶段,具体的建模过程如图2 1 所示: 7 南京信息工程大学硕士学位论文 2 2 2 一元线性回归模型 图2 1 回归分析模型 1 、一元回归模型基本概念 一元线性回归模型是描述两个变量之间统计关系的最简单的模型,直线回归分析的任 务就是根据若干个观测值找出描述两个变量之间关系的直线回归方程 y = 风+ 届x ,+ 毛,= 1 , 2 刀,其中( x ,z ) 表示( x ,y ) 的第i 个观察值,风屈是模 型中的参数1 9 。 2 、回归方程的显著性检验 当得到一个实际问题的经验回归方程乡= z o + 届x 后,不可以直接进行分析,仍需要 用统计方法进行检验【1 0 1 。在对回归方程进行检验时,通常需要正态性假设,即假定占,服从 8 南京信息工程大学硕士学位论文 标准正态分布具体的检验方法有: ( 1 ) t 检验。t 检验是统计学中常用的检验方法,t 检验一般用于检验回归系数的显著 性,即检验因变量y 对自变量x 的影响程度是否显著。 t 检验原假设是:风:届= 0 ,对立假设是马:局0 。若原假设日。成立,则因变 量y 与自变量x 之间并没有真正的线性关系,即自变量x 对因变量y 没有影响。 t 检验使用的是检验统计量为t 的统计量,对与给定显著性水平口,双侧检验的临界 值是f 口2 。当h 厂n 6 ,则表示表达式 x 。l z o ) x 6 l x o ( 优于) 若y z 6 i x o ( 劣于) 若y = y 曲,则有表达式 x 。i x o ) = 托l x o ) ( 等价于) 2 3 3 指标权重的确定 利用灰关联理论计算指标权重,其实质就是考察比较序列和参考序列的发展趋势,灰 关联度越大,表明两者的影响越大,反之则越t , 3 2 2 1 。在江苏省沿江环境评价系统中,首先 将一个指标与其他指标之间的灰关联度分别计算出来,然后得到这个指标总的灰关联度。 得到总的灰关联度后进行比较,如果灰关联度大说明这个指标在整体的系统指标中所占的 权重就大,所含的信息量就大,反之说明这个指标对其他指标影响因素小,也就权重越小 【2 s 】。 沿江环境评价的指标体系共有四层,如表2 1 所示,首先从d 层指标层开始计算指标 的权重,然后分别向上计算c 层和b 层指标的权重咖。 具体步骤如下: 1 、针对时间序列值0 ( 1 ) 国( 2 ) 国0 ) ) ,把缈( 1 ) 作为基点,对数据进行标准 化处理,x 协) 为处理后的数据,其中,1 七刀。同时为了保证指标极值的一致性,还要 考虑指标的类型: 效益型黼x g ) = 需 成本型指标:x ) = 石c o 两o ) 适中型躲m ) 2 网1 刁万2 去丢z g ) 2 、从d 中分别观察第,个指标和其他指标k 的范数灰关联度占业( 1 拧, 1 k 玎) ,其中,= 1 ,表示指标和本身的关联度最大。 记占= 1 毛2 s 2 1 1 s 1 “2 ;。 南京信息工程大学硕士学位论文 3 、求某指标的群范数灰关联度。 占+ = b 严占业1 1 ,力,1 七玎j = 舀+ q 】1 七行 是关联系数理想列, 占一= 扛p 占肚1 1 ,刀,1 尼”j = 备一 ) 1 1 七刀 是关联系数负理想列。 第- 个指标序列范数灰关联系数列g 门s ,2占加) 的2 个范数定义是: d 4 j - = 町= 貅尚黼数糕艉:q 2 卉。 4 、计算指标j 的权重 占; 叶2 产 占, j - i 得到权重序列形= “1 4 , 2 w n ) 。 5 、进行综合加权。 将处理后得到的指标数据与权重综合加权得到评价值。 第f 个评价对象对于d 层指标的评价结果为 r 。= z ,形。 6 、分别用下一层指标的评价结果作为本层的指标值,重复2 - 5 过程,分别计算出本层 的指标权重。 最后,把b 层指标数据和b 层指标权重进行综合加权,得到最终的综合评价值。 1 4 南京信息工程大学硕士学位论文 3 1 综合评价概述 第三章实证研究 综合评价的前提是要建立一套科学合理的评价指标体系。只有科学合理的评价指标体 系,才有可能得出科学公正的综合评价结论。指标体系是由一系列相互联系、相互制约的 指标组成的科学的、完整的总体瞄l 。通过分层建立指标体系,既可以显示出整个体系的条 理性,又可以从几个大的方面反映沿江环境的全貌,使整个指标体系既系统又完整,不会 因为指标多而显得凌乱睇o j 。 评价一般是指按预定的目的,确定研究对象的属性,并将这种属性变为客观定量的计 值或主观效用的行为,是人类社会中一项经常性的、极重要的认识活动,是决策中的一项 基础性工作【2 7 1 。各种评价结果也可以进行对象结构的研究,并为优化结构提供参考。评价 的基本要素有:评价的主体、评价的客体和评价的环境。评价的过程就是这三者的集合。 评价主体在评价环境中对评价客体进行综合评价瞄1 【2 s l 。基本步骤如图3 1 所示: l 确定被评价对象 l 建立评价指标体系 i 选择评价方法 i 收集指标数据 i 处理数据与评价 i 输出评价结果 图3 1 评价的基本步骤图 3 2 综合评价指标建立的一般方法 综合评价就是通过一定的数学模型将多个评价指标值“合成”为一个整体性的综合评 价值。一般对于综合评价的过程有定性和定量分析两种方法。定性分析的方法常用的是德 尔菲法。就是通过专家打分进行赋权。定性分析的方法对于定量分析的方法来说主观性较 强,一般专家所认为重要性不同会影响到整个的评价结果。相对于定性分析来说,定量分 析就是通过数学的方法计算出来权重,客观性较强,目前常用的定量分析的方法有以下几 1 5 南京信息工程大学硕士学位论文 类: 1 、选取典型指标。这种分析方法是对于指标比较多的情况,将各个指标先进行聚类分 析,将指标分成几类,然后再选择具有代表性的指标【3 0 】。 2 、主成分分析。主成分分析法是多元统计中最常用的方法,很多的评估都采用主成分 分析的方法。主成分分析能够保证所选取的指标最大程度代表整个体系的同时还能满足选 取的指标尽量的少。主成分分析的基本过程首先是计算出相关系数阵或协方差阵的特征向 量和特征值,然后观察最小特征值所对应的特征向量,删除其中最大分量对应的指标,在 剩下的指标中再进行主成分分析,通过相同的处理方法,经过有限次的主成分分析后,观 察最小的特征值不是无穷小时停止,用保留的指标作为指标体系p 1 1 。 3 、极大不相关。对于指标的选择过程中,通过对于各个指标的相关性分析,将相关性 大的指标去掉,对于相关性小或者没有相关性的指标进行保留,这样保证了整体分析的指 标的不相关性。 4 、聚类分析。聚类分析根据分析对象的不同可以分为r 型聚类和q 型聚类。对变量( 指 标) 进行分类处理是r 型聚类,对样本进行分类处理是q 型聚类。在进行聚类分析时,关 键是选取具有代表性的指标。一般是在聚合的过程中分别选取出一个具有代表性的指标变 量,然后再计算这个指标和它同一类的其他指标的决定系数r 2 的均值,选取决定系数均值 最大的变量,将这个变量作为该类的典型指标。如果某类只有一个指标,那么该指标即为 评价指标p 引。 5 、灰关联分析法。灰关联分析是通过分析指标间的相关性大小来确定关联度的大小。 灰关联度越大比较序列与参考序列关系越密切。 6 、指标鉴别力分析法。指标鉴别力分析法实际上是充分利用指标数据的差异信息,选 择在综合评价过程中信息量丰富、作用大的指标。 3 3 指标选择的原则及数据来源 3 3 1 指标选择的原则 沿江环境综合评价是一个综合的过程,其中涉及到了很多的因素,有大气环境,水环 境,固体废弃物的排放情况,声音环境等等,那么在指标的选择过程中我们要以统筹全局 的做法,做到指标体系简约而不简单。本文总结了构建沿江环境评价的指标选择时应该遵 循的原则: 整体性原则。沿江环境的评价是个复杂的系统,在进行评价的时候既要防止指标体系 过于复杂但是同时要避免指标太少而遗漏重要方面,要充分考虑各个方面,要追求指标体 系的最优化。 可行性原则。在指标的建立过程中,所选择体系应能够全面覆盖沿江环境的评价的各 个部分。同时,在指标的设置过程中,要简单明了,容易了解,要考虑数据去的难易程度 1 6 南京信息工程大学硕士学位论文 和可靠性,尽可能的去选择有代表性的指标。 可靠性原则。统计指标应与国际惯例接轨,符合国际规范以及国内现行统计制度的要 求,保证数据的可靠性。 可比性原则。选取的指标值可能是分布在不同的地方和不同时间的指标,指标的选择 应该具有时间和空间可比性。否则对评价结果的科学性就会造成一定的影响。 引导性原则。沿江环境的评价的最终目的是为了沿江建设的过程中减少环境污染,那 么指标的选取应该从江苏沿江的实际出发,有区别有针对性的进行指标的设置和评价【3 3 】。 3 3 2 数据来源 本文选取江苏沿江八市即南京、无锡、苏州、常州、南通、镇江、扬州、泰州的环境, 时间上从2 0 0 2 年到2 0 0 8 年选取了七年的数据进行研究,所选数据来源于江苏统计年鉴 以及各个市的环保局的环境公报。 3 4 多元统计分析 3 4 1 指标聚类分析 我们进行沿江的八市环境评价时,对于沿江十五县市也进行评价。在进行聚类之前, 先进行归一化运算,将各个变量变成o n l 之间的数据。其次选择聚类方式,选择快速聚类。 因为想了解各个城市的环境分类情况,臣陬j - 变量进行聚类,所以选择r 聚类。具体的聚类 结果如图3 2 所示。 1 7 南京信息工程大学硕士学位论文 p e n d r o g r a mu 昌i n ga v e r a g el i n k a g e ( b e t w e e ng r o u p s i r e s c a l e ddi s t a n c ecl u s t e rc o m bi n e c 且se051 0l s2 02 5 l a b el n u m + 一一- + 一一一一+ 一一一+ 一一一+ 一一一+ 启东 如皋 太仓 常熟 通州 兴化 仪征 海门 扬中 泰兴 江阴 江都 丹阳 张家港 南通 无锡 泰州 扬州 镇江 常州 南京 苏州 图3 2 沿江城市环境聚类图 从沿江环境的聚类情况我们可以看出来启东,如皋,太仓之间距离最小聚为一类,通 州,靖江,仪征,海门之间距离也最小,这样先聚类到一起,这样就由7 类减少n 2 类。接 着用这样聚类在一起的新类与常熟,扬中,泰兴聚类在一起最终聚为一类。这样的分析结 果是根据数据之间的关系聚类在一起。南京和苏卅l 情况相似,说明这两个城市发展过程中 对于环境产生的影响或者说环境质量都相差不大。我们通过实际的分析来说,南京和苏州 都是比较发达的地区。南京第二产业比较发达,苏州引进了许多企业,但是苏州不是能源 产地,需要从外部引入能源。南京的水质量主要是受到化工企业的影响,苏州有多家重点 企业,特别是苏州工业园区等,地表水污染属于综合型有机污染,主要污染物为化学需氧 量、高锰酸盐指数,非离子氨和总磷等。再次苏州的机动车保有量比较高,同时南京是省 会,交通车辆比较多,大气环境很大部分受到这方面的影响。这就使得两个城市的环境情 况比较相近。 1 8 加n 8 6孔坫心拍控3“坞7 9 2加h哇l 5 南京信息工程大学硕士学位论文 3 4 2 指标回归分析 在进行横向比较时,我们使用s p s s 软件通过回归分析后,提取了因子及相关系数,建 立了多元线性回归方程: y = 2 9 9 9 + o 6 9 6 x 1 + 1 6 7 4 x 2 2 5 2 9 x 3 + o 5 8 9 x 4 5 8 3 x 5 + 2 7 8 x 6 并进行综合评 价。通过表3 1 我们可以看出f 值为7 0 4 0 4 ,p 值为0 ,拒绝接受原假设,显著性十分明显。 对于回归系数的检验,我们从表3 2 可以看出全部通过t 检验,说明每个自变量都对y 产 生显著性的影响。因此用多元回归分析问题有实际意义。 表3 1 方差分析结果 a n o v a 6 m o d e is u mo fs q u a r e sd fm e a ns q u a r e f s i g 1 r e g r e s s i o n9 7 4 9 e 919 7 4 9 e 97 0 4 0 40 0 0 8 r e s i d u a i 2 7 7 0 e 92 01 3 8 5 e 8 t o t a l 1 2 5 2 e 1 02 1 a p m d i c t o r s :( c o n s t a n t ) 。v a r 0 0 2 b d e p e n d e n tv a r i a b l e :v a r 0 0 6 表注:a n o v a , , 方差分析 m o d e l 模型 s u mo fs q u a r e s :平方 d f :自由度 m e a ns q u a r e 均方 s i g 显著性 r e g r e s s i o n :回归 r e s i d u a l :残值 t o t a l ;总数 p r e d i c t o r s :( c o n s t a n t ) :预测因素,常数 d e p e n d e n tv a r i a b l e 因变量 1 9 南京信息工程大学硕士学位论文 表3 2 回归系数分析表 c o e 俪c i e n t s a m o d e iu n s t a n d a r d i z e ds t a n d a r d i z e dt s i g c o e f f i c i e n t s c o e f f i c i e n t s s t d e r r o r b e t a 1 ( c o n s t a n t ) 2 9 1 1 9 1 2 9 4 52 5 1 7 6 6 6 60 0 2 4 0 6 v a r 0 0 1 o 6 9 60 5 2 0 1 5 1 42 8 3 7 1 1 71 3 3 7 3 7 2 70 0 加8 7 4 2 v a r 0 0 2 1 6 7 41 1 2 0 0 8 4 35 5 2 0 3 2 2 1 4 9 4 0 9 9 30 0 3 7 5 4 9 3 v a m 0 3 2 5 2 92 0 5 5 1 9 1 4_ 4 ,9 1 5 8 8 4- 1 。2 3 0 6 3 30 0 4 3 4 4 11 v a r 0 0 4 0 5 8 90 3 4 9 3 3 9 42 1 3 5 5 91 6 8 5 8 5 9 3o 0 3 4 0 8 3 5 v a r 0 0 5 5 8 3 0 3 2 1 6 9 2 5 49 10 6 9 2 21 8 1 2 2 9 70 0 3 2 0 9 9 2 v a 傩 2 7 8 11 7 6 5 3 4 5 46 0 2 5 9 0 91 5 7 5 3 6 3 7o 0 3 6 0 0 7 a d e p e n d e n t v a r i a b l e : b v a r 0 0 7 表注:c o e f f i c i e n t s :系数 m o d e l 模型 u n s t a n d a r d i z e dc o e 怖c i e n t s :非标准系数 s t a n d a r d i z e dc o e 俪c i e n t s :标准系数 d e p e n d e n tv a r i a b l e :因变量 图3 3 是多元统计分析的结果,对于沿江环境的横向和纵向的分析结果。 图3 3 多元统计沿江整体环境纵向比较结果 从图3 3 所示的沿江2 0 0 2 至2 0 0 8 年沿江地区环境质量综合评价结果看,2 0 0 2 年到2 0 0 6 年整体呈现出比较好的发展趋势,但是2 0 0 7 年以后环境质量有所下降。这与后面的灰关联 分析结果有所出入,在后面分析原因。 2 0 南京信息工程大学硕士学位论文 图3 4 多元统计沿江整体环境横向比较结果 在进行横向比较的时候我们从图3 4 发现江苏沿江环境污染情况发展不平衡,可以看 到无锡的环境污染最严重就是无锡,其次是南京,环境最好的是泰州。 3 5 灰关联分析 表3 3 是由灰关联方法计算出的权

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论