2.3数据的无量纲化处理及示例_第1页
2.3数据的无量纲化处理及示例_第2页
2.3数据的无量纲化处理及示例_第3页
2.3数据的无量纲化处理及示例_第4页
2.3数据的无量纲化处理及示例_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据的无量纲处理方法及示例数据的无量纲处理方法及示例 在对实际问题建模过程中 特别是在建立指标评价体系时 常常会面临不同类型的数 据处理及融合 而各个指标之间由于计量单位和数量级的不尽相同 从而使得各指标间不 具有可比性 在数据分析之前 通常需要先将数据标准化 利用标准化后的数据进行分析 数据标准化处理主要包括同趋化处理和无量纲化处理两个方面 数据的同趋化处理主要解 决不同性质的数据问题 对不同性质指标直接累加不能正确反应不同作用力的综合结果 须先考虑改变逆指标数据性质 使所有指标对评价体系的作用力同趋化 数据无量纲化主 要解决数据的不可比性 在此处主要介绍几种数据的无量纲化的处理方式 1 极值化方法 可以选择如下的三种方式 A maxmin ii i xx x R 即每一个变量除以该变量取值的全距 标准化后的每个变量的取值范围限于 1 1 B minmin maxmin ii i xx x R 即每一个变量与变量最小值之差除以该变量取值的全距 标准化后各变量的取值范围 限于 0 1 C 即每一个变量值除以该变量取值的最大值 标准化后使变量的最大取 max i i x x 值为 1 采用极值化方法对变量数据无量纲化是通过变量取值的最大值和最小值将原始数据转 换为界于某一特定范围的数据 从而消除量纲和数量级的影响 由于极值化方法对变量无 量纲化过程中仅仅对该变量的最大值和最小值这两个极端值有关 而与其他取值无关 这 使得该方法在改变各变量权重时过分依赖两个极端取值 2 标准化方法 利用来计算 即每一个变量值与其平均值之差除以该变量的标准差 无量 i i xx x s 纲化后各变量的平均值为 0 标准差为 1 从而消除量纲和数量级的影响 虽然该方法在 无量纲化过程中利用了所有的数据信息 但是该方法在无量纲化后不仅使得转换后的各变 量均值相同 且标准差也相同 即无量纲化的同时还消除了各变量在变异程度上的差异 3 均值化方法 计算公式为 该方法在消除量纲和数量级影响的同时 保留了各变量取值 i i i x x x 差异程度上的信息 4 标准差化方法 计算公式为 该方法是标准化方法的基础上的一种变形 两者的差别仅在 i i x x s 无量纲化后各变量的均值上 标准化方法处理后各变量的均值为 0 而标准差化方法处理 后各变量均值为原始变量均值与标准差的比值 综上所述 针对不同类型的数据 可以选择相应的无量纲化方法 如下的示例就是一 个典型的评价体系中无量纲化的范例 示例示例 近年来我国淡水湖水质富营养化的污染日益严重 如何对湖泊水质的富营养化 进行综合评价与治理是摆在我们面前的任务 下面两个表格分别为我国 5 个湖泊的实测数 据和湖泊水质评价标准 表 2 2 全国五个主要湖泊评价参数的实测数据 总磷 mg L 耗氧量 mg L 透明度 m 总氨 mg L 杭州西湖13010 300 352 76 武汉东湖10510 700 402 0 青海湖201 44 50 22 巢湖306 260 251 67 滇池2010 130 500 23 表 2 3 湖泊水质评价标准 评价参数极贫营养贫营养中营养富营养极富营养 总磷660 耗氧量27 1 透明度 37122 40 55 0 17 总氨4 6 要求 1 试用以上数据 分析总磷 耗氧量 透明度 总氨这 4 个指标对湖泊水质评价 富营养化的作用 2 对这 5 个湖泊的水质综合评价 确定水质等级 在进行综合评价之前 首先要对评价的指标进行分析 通常评价指标分成效益型 成 本型和固定型指标 效益型指标是指那些数值越大影响力越大的统计指标 也称正向型指 标 成本型指标是指数值越小越好的指标 也称逆向型指标 而固定型指标是指数值越 接近于某个常数越好的指标 也称适度型指标 如果每个评价指标的属性不一样 则在综 合评价时就容易发生偏差 必须先对各评价指标统一属性 建模步骤 建立无量纲化实测数据矩阵和评价标准矩阵 其中实测数据矩阵和等级标准矩 阵如下 13010 30 352 76 10510 70 42 0 201 44 50 22 306 260 251 67 2010 130 50 23 X 1423110660 0 090 361 87 1027 1 37122 40 550 17 0 020 060 311 24 6 Y 然后建立无量纲化实测数据矩阵和无量纲化等级标准矩阵 其中AB 3 max 3 min ijij j ij ijij j xxj a xxj 3 max 3 min ktkt k kt ktkt k yyk b yyk 得到 1 00000 96260 71431 0000 0 80771 00000 62500 7246 0 15380 13080 05560 0797 0 23080 58501 00000 6051 0 15380 94670 50000 0833 A 0 00150 00610 03480 16671 0000 0 00330 01330 06640 26201 0000 0 00460 01420 07080 3091 1 0000 0 00430 01300 06740 26091 0000 B 计算各评价指标的权重 计算矩阵 B 的各行向量的均值和标准差 5 2 5 1 1 1 1 2 3 4 54 iji j iiji j b b si m m 然后计算变异系数 iii wsm 最后对变异系数归一化得到各指标的权重为 0 27670 24440 23470 2442w 建立各湖泊水质的综合评价模型 通常可以利用向量之间的距离来衡量两个向量之间的接近程度 在 Matlab 中 有以 下的函数命令来计算向量之间的距离 dist 计算中的每个行向量和中每个列向量之间的欧式距离 w pwp mandist 绝对值距离 w p 计算中各行向量到中各列向量之间的欧氏距离 AB 4 2 1 ij ikik k d ab 若 则第 个湖泊属于第级 15 min ikij j dd ik 1 84721 83121 73741 37690 2881 1 59591 57981 48591 12710 5034 0 21850 20450 13670 33831 7917 1 32011 30381 20820 83920 9591 1 07931 06500 98670 73281 3450 d 这说明杭州西湖 武汉东湖都属于极富营养水质 青海湖属于中营养水质 而巢湖和滇池 属于富营养水质 同时也可以计算中各行向量到中各列向量之间的绝对值距离AB 4 1 ijikik i Dab 若 则第 个湖泊属于第级 15 min ikij j DD ik 3 66313 63033 43742 67830 3231 3 14363 11082 91782 15870 8427 0 40620 37340 21100 57873 5800 2 40712 37432 18141 42231 5791 1 67011 63741 44441 06602 3161 D 其评价结果与利用欧氏距离得到的评价结果完全一样 所以 从上面的计算可以看出 尽管欧氏距离和绝对值距离的意义完全不一样 但对 湖泊水质的评价等级是一样的 这表明了方法的稳定性 程序 X 130 10 3 0 35 2 76 105 10 7 0 4 2 20 1 4 4 5 0 22 30 6 26 0 25 1 67 20 10 13 0 5 0 23 Y 1 4 23 100 660 0 09 0 36 1 8 7 1 27 1 37 12 2 4 0 55 0 17 0 02 0 06 0 31 1 2 4 6 B1 Y 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论