《计算机地质学》实验指导书_第1页
《计算机地质学》实验指导书_第2页
《计算机地质学》实验指导书_第3页
《计算机地质学》实验指导书_第4页
《计算机地质学》实验指导书_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机地质学 实 验 指 导 书 西安科技大学地环系 二零零六年八月 目 录 实验一实验一 预处理与统计预处理与统计.1 实验二实验二 一元线性回归分析一元线性回归分析.7 实验三实验三 多元线性回归分析多元线性回归分析.11 试验四试验四 趋势面分析趋势面分析.15 试验五试验五 聚类分析聚类分析.20 试验六试验六 两类判别分析两类判别分析.24 试验七试验七 贝叶斯多类判别分析贝叶斯多类判别分析.28 试验八试验八 有序地质量最优分割法有序地质量最优分割法.32 1 实验一实验一 预处理与统计预处理与统计 一、目的:一、目的: 通过完成数据统计和预处理程序的设计和实现及完成算例,掌握统计

2、一组数据的极值、均值、 方差、变异系数及进行数据预处理的方法。 二、方法概要二、方法概要 1、进行统计和预处理的原因、目的和应注意的问题、进行统计和预处理的原因、目的和应注意的问题 (1)原因 原始数据可能有强非对称性,存在孤立值,大多数的统计方法应用原始数据时存在大而且不是 偶然的残差等问题,通过改变表达方式,有时可以增强信息的显示,而这种改变不仅需要改变数值 的单位,而且可能改变数据的基本测量尺度; (2)目的 使变量尽可能为正态分布(如回归分析要求因变量为正态分布,要求自变量和因变量之间 具有足够的相关关系) ; 统一变量的数据尺度; 使变量之间的非线性关系转换为线性关系; 用新的数目少

3、的相互独立的变量代替相互联系的原始变量; 方便用简单自然的方式进行解释; 帮助理解数据的特征。 (3)注意问题 数据范围:只有数据变化范围相对较大,变换才显著; 变换是很重要的工作,变换不当则适得其反;所以在认真研究分析的基础上进行,有时要 通过多次试验才能找到合适的变换方法; 有些行业中,有些强制性变换或习惯使用的变换,工作中应遵循; 变换后数据的可解释性也很重要,有时为了不影响解释,宁可不对其转换。 三、程序设计框图三、程序设计框图 预处理和统计模块的流程图如图 1-1 所示。 后续的不同多元统计方法对原始数据的分布有不同的要求,但对原始数据都需要进行预处理和 统计,所以建议统一输入文件的

4、格式,预处理和统计模块处理后输出文件的格式也按该定义的格式 定义。 文件的格式建议为: 2 样品个数,变量个数 第 1 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值, 第 2 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值, 第 3 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值, 不是所有的原始数据都进行系统的统计和预处理,程序应该提供强大和灵活的人机交互界面, 方便用户根据实际情况和需要,选择不同的数据变换方法。 打开标准格式的原始数据文件 ),(,jixmn,原始数据矩阵变量个数读入样品个数 3-法则 n i jxx n jx 1 , 1

5、 )(计算平均值 s(j)(),( 1 1 )( 2 1 2 和计算样品方差:jxjix n js n i )(),(),(jxjixjiv计算残差 v(i,j)3s 删除样品i和变量j in i=1,j=1 jm y i=i+1 j=j+1 n n y y j=1 ),(,jixmn,原始数据矩阵变量个数形成新的样品个数 数据统计模块数据统一量纲模块 求平均值 求变异系数和正态分布检验 求样品方差 是否正态 选择正态变换的方法 角变换平方根变换对数变换 求平均值 求样品方差 标准化变换均匀化变换极差变换 ),(,jixmn ,原始数据矩阵变量个数形成新的样品个数 输出变换后的标准格式数据文件

6、 开始 开始 图 1-1 数据预处理和统计模块流程图 3 四、算例四、算例 (1)请对以下 15 个样品数据进行数据统计和数据预处理 变量 样品 123456789 11.7661153.48137952.625.7015.279.955.829.601158 21.7287603.23419252.522.2038.922.401.041.401578 31.7154183.68239061.105.2023.352.782.861.361372 41.4593923.98246130.3633.5928.213.090.891.581383 51.7383053.50571071.904.

7、0014.592.331.041.551285 61.7133233.29393453.581.8037.843.231.091.801564 71.7517413.48281566.164.0018.594.461.381.611320 81.8536373.46121464.265.9014.275.562.273.981230 91.6496273.77359255.807.8023.894.193.112.231350 101.7209033.39263951.702.6037.193.362.441.001549 111.7379083.47131159.203.7030.482.7

8、51.180.941479 121.6318493.82491856.1210.5017.38.372.074.901233 131.7204073.29241656.064.6036.001.171.230.311555 141.8287893.49714272.886.0514.493.091.041.281290 151.7099483.67559567.905.4015.844.392.962.191282 4 y z 散点图 实验二实验二 一元线性回归分析一元线性回归分析 一、目的:一、目的: 通过对一元线性回归分析程序设计及完成算例,掌握一元线性回归分析的基本原理和方法。 二、方法

9、概要二、方法概要 1、原始数据预处理、原始数据预处理 对对原始数据()( =0,1,)数据进行预处理(见实验一) 。 n ii yx ,i n 2、数学模型建立、数学模型建立 (1)作散点图 一元线性回归只能处理两个变量之间的关系,它又被称为 直线拟合,假设为自变量,为因变量,对预处理后对数xyn 据()( =0,1,;其中)如果把各个点数据 ii yx ,innn 画在坐标纸上(作散点图) ,各点近似分布呈一条直线,则可用 一元现行回归。 (2)选择数学模型 (2-1)bxay (3)参数 a, b 的估计 为根据回归方程的得到的因变量的计算值;a,b 为回归方程中的系数;x 为自变量。由于

10、 y y 测定结果中不可避免会有实验误差,因此用最小二乘法的原理估计回归直线中的系数 a,b。 假设实验得到了 n 对数据(i ,y)(i=0,1,n)并得到了回归方程 ,则对于bxay x 的一系列变量 x1 ,x2 ,xn,根据回归得到方程可得到因变量的一系列计算值 nn bxay bxay bxay 22 11 每一个实测值 yi(i=0,1,n)与它相对应的一个计算值(i=0,1,n)之间都有偏差, 1 y 也可称残差,计算公式: (2-2))( iiiii bxayyyv 所有测试数据的残差平方和为 n i ii n i i n i ie bxayyyvq 1 2 1 2 1 2 )

11、( (2-3) 5 如果回归方程是合理的 a,b 为最佳。则所得到的残差平方和应达到最小值。bxay 得 (2-4) xbya xnx yxnyx l l b n i i n i ii xx xy 1 22 1 )( 列出回归方程 (2-5)bxay 3、回归方程显著性检验、回归方程显著性检验 (1)将自变量 n 组试验数据依次代入回归方程(式 38) ,求出因变量 n 个回归值 () (2-6) ii bxayni, 2 , 1 (2)计算,和: 总 s 回 s 剩 s (2-7) n i i ynys 1 22 总 (2-8) n i i ynys 1 22 回 (2-9) 回总剩 sss

12、 (3)计算 f 统计量 (2-10) 2 1 ns s f 剩 回 (4)计算相关系数 r (2-11) yyxx xy ll l r (5)查表检验 给定显著水平 ,查表得。若或,则证)2(),2,(nrnpf )2 ,(pff )2( nrr 明回归方程显著;否则,回归方程无实用价值。 4、对因变量进行区间估计、对因变量进行区间估计 (1)估计剩余标准值 (2-12)2( ns剩 (2)求出因变量估计值 当自变量取定值时,由回归方程可求得 因变量数学期望的估计值。x y (3)写出预测区间 6 95%置信区间:() 2,2yy 99.7%置信区间:() 3,3yy 三、程序设计框图三、程

13、序设计框图 建议对原始数据以以下格式输入: 样品个数,2 第 1 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值 第 2 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值 第 3 个样品号,该样品第 1 个变量的观测值,第 2 个变量的观测值 首先要对数据进行预处理,处理完成后,形成以上格式新的文件(详见图 11) 。以下步骤如 流程图(图 21) 。 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 读入n对数据(xi,yi)(i1,2,n) )见式计算32(, yyxyxx lllyx )见式计算32(,ba ), 1 , 0(

14、nibxay ii ,求出 2 1 2 1 2 2 1 2 ns s f sss ynys ynys n i i n i i 剩 回 回总剩 回 总 计算 yyxx xy ll l r 计算 ),系统自动查询入(或者建立数据库,输输入 , , rfrf ff且rr )2/( ns剩计算剩余标准差 y rfsrf,,输出 bxayx 值,求出读入待预测样品 2 2 22 12 yl yl 3 3 23 13 yl yl ),%7 .99),95 31322122 llll的置信区间(和的置信区间(输出 结束 n 开始 图 2-1 一元线性回归分析模块流程图 四、算例四、算例 (一)从某煤矿采集

15、11 个煤样,分别测定煤的发热量()和煤灰分()含量,获得 g dt q g a 如下表数据: 样品号 1234567891011 (千卡) g dt q8.307.87.77.26.86.25.65.55.004.704.3 g a 0.030.050.080.100.150.200.270.300.340.400.45 7 试建立煤的发热量()对煤灰分()的回归方程,并检验该回归方程的显著性。 g dt q g a (二)煤矿脉中 13 个相邻样本点处某种伴生金属的含量数据如下表: 样品号 1234567 距离 x 23457810 含量 y 106.42108.20109.58109.5

16、0110.00109.93110.49 样品号 8910111213 距离 x 111415161819 含量 y 110.59110.60110.90110.76111.00111.20 试建立 y 对 x 的回归方程,并进行显著性检验。 8 实验三实验三 多元线性回归分析多元线性回归分析 一、目的:一、目的: 通过对多元线性回归分析程序设计及完成算例,掌握多元线性回归分析的基本原理和方法。 二、方法概要二、方法概要 设有自变量,因变量 y,共做 n 次实验。若 y 与间有线行关系,回归 p xxx, 21 p xxx, 21 方程则为: (3-1) ppx bxbxbby 22110 显而

17、易见,只要确定了各回归系数,方程也就确定了。 p10 b,b,b 1、建立原始数据矩阵,并进行必要的预处理、建立原始数据矩阵,并进行必要的预处理 (1)确定因变量与自变量,形成行列的矩阵:n1p (3-2) npnn p p yxxx yxxx yxxx 21 222221 111211 (2)进行预处理(详见图 11) 2、数学模型建立、数学模型建立 设经过预处理的原始数据,表示如下 (3-3) pnn p p xxx xxx xxx x 21 22221 11211 n y y y y 2 1 由最小二乘法知道,使得全部观察值与回归值的偏差平方和 q 达到最小,即 p10 b,b,by y

18、 使 (3-4)最小 n i ipniii n i ii xbxbxbbyyyq 1 2 22110 1 2 )()( 根据微积分学中的极值原理,b0,b1,bn,应是下列方程组: (3-5)), 2 , 1, 2 , 1( 0)(2 0)(2 1 1 0 pjni xyyq b yyq b ij n i ii j n i ii ; 35 式是求解回归系数的正规方程组,可以写成以下形式 9 (3-6)yxbxx (3-7)yxxxb 1 求解正规方程组,得到各回归系数。 p10 b,b,b 列出回归方程 (3-8) ppx bxbxbby 22110 3、回归方程显著性检验、回归方程显著性检验

19、 (1)将自变量 n 组试验数据依次代入回归方程(式 38) ,求出因变量 n 个回归值 () (3-9) ippiii xbxbxbby 22110 ni, 2 , 1 (2)计算,和: 总 s 回 s 剩 s (3-10) n i i ynys 1 22 总 (3-11) n i i ynys 1 22 回 (3-12) 回总剩 sss (3)计算 f 统计量 (3-13) 1 pns ps f 剩 回 (4)计算相关系数 r (3-14) 总 回 s s r (5)查表检验 给定显著水平 ,查表得。若或,)2(),1,(nrpnpf ) 1,(pnpff )2( nrr 则证明回归方程显

20、著;否则,回归方程无实用价值。 4、对因变量进行区间估计、对因变量进行区间估计 (1)估计剩余标准值 (3-15)) 1(pns剩 (2)求出因变量估计值 当自变量取定值时,由回归方程可求得因变量数学期望的估计值。 p xxx, 21 y (3)写出预测区间 95%置信区间:() 2,2yy 99.7%置信区间:() 3,3yy 10 三、程序设计框图三、程序设计框图 建议以实验一的原始数据格式输入,首先要对数据进行预处理,处理完成后,形成实验一的原 始数据格式的新文件(详见图 11) 。以下步骤如流程图(图 31) 。 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数

21、据文件 读入n对数据(xij,yi)(i1,2,n;j1,2,p),形成原始矩阵(见式33) )见式计算73(,)( , 11 yxxxxxx 1 2 1 2 2 1 2 pns ps f sss ynys ynys n i i n i i 剩 回 回总剩 回 总 计算 总 回 计算 s s r ),系统自动查询入(或者建立数据库,输输入 , , rfrf ff且rr ) 1/(pns剩计算剩余标准差 y rfsrf,,输出 ppp xbxbxbbyxxx 2211021 ,值,求出读入待预测样品 2 2 22 12 yl yl 3 3 23 13 yl yl ),%7 .99),95 313

22、22122 llll的置信区间(和的置信区间(输出 结束 n p10 1 b,b,b,求得根据yxxxb 请参考 线性代 数矩阵 运算。 )(求nixbxbxbby ippiii , 2 , 1 22110 开始 图 3-1 多元线性回归分析模块流程图 11 四、算例四、算例 (一) 、某矿区从 18 个矿样中测得 cu,pd,pt 的含量如下所示,试求 pt 对 cu 和 pd 的回归方程, 并检验其有无实用价值。 编号编号 1 x cu(%) 2 x pd(g/t) 3 x pt(g/t) 编号编号 1 x cu(%) 2 x pd(g/t) 3 x pt(g/t) 10.360.1690

23、.176100.060.0230.045 20.050.0350.020110.530.3290.292 30.240.2480.262120.060.0650.080 40.050.0150.035130.210.2830.235 50.220.2160.234140.030.0300.030 60.130.0860.092150.330.210.237 70.101.3001.669160.010.0300.050 80.070.0090.006170.210.2520.24 90.160.1600.150180.080.0530.103 (二) 、由于碳、氢、氧是煤燃烧过程中产生热量的主

24、要元素,对某矿(褐煤、常烟煤、肥煤、 焦煤和无烟煤)中取 12 块煤样,经分析化验后,其发热量(焦耳/克)与 cr(%)、hr(%) 、 r dt q or(%)元素的数据如下。问:今后能否不再对该矿煤进行发热量测定,而由元素分析结果对其进 行预测? 编编 号号 1 x c cr r(%(% ) ) 2 x h hr r(% % ) 3 x o or r(% % ) y (j/gj/g r dt q ) 编编 号号 1 x c cr r(%(% ) ) 2 x h hr r(% % ) 3 x o or r(% % ) y (j/gj/g r dt q ) 1625.0156.57856.06

25、.08.4 2706.0207.08883.03.08.5 3756.5257.29905.05.08.8 4755.0107.510902.52.58.0 5785.5157.711923.03.08.5 6805.24.08.012953.53.58.7 12 试验四试验四 趋势面分析趋势面分析 一、目的:一、目的: 通过趋势面分析程序设计及完成算例,掌握趋势面分析方法原理及工作步骤。 二、方法概要二、方法概要 1、建立原始数据矩阵,并进行必要的预处理、建立原始数据矩阵,并进行必要的预处理 (1)选取应变量 选取什么样的变量进行趋势分析,取决于研究对象和研究目的。 (2)确定控制点 在确定

26、控制点时,一般要考虑以下几个方面:控制点的代表性、真实性和可靠性。控制点 要具有面性、均匀、随机分布的特点。 (3)整理原始数据统计表 收集因变量观测值及相应坐标,填入趋势分析原始数据统计表,其格式可参考表 4.1 。 表 4.1 趋势分析原始数据统计表格式 编 号控制点坐标 顺序号原编号横坐标()u纵坐标()v 变量 z 其中“控制点坐标 可以是地理坐标,也可以是虚拟坐标系的相对坐标。 (4)建立原始数据矩阵 假设有 n 个控制点的地理坐标及地质变量观测值,则原始数据矩阵为: nnn zvu zvu zvu 222 111 (5)统一量纲 为了不改变地质变量的值,仅对控制点的坐标值进行以下变

27、换(先中心化,在均匀化): ), 2 , 1( ) 1( ) 1( ni v v c v vv cv u u c u uu cu ii i ii i 其中,;为常系数,其目的在于使,与具有相同的数量级。 n i i u n u 1 1 n i i v n v 1 1 c i u i v i z 例如,在对间隔型(标高、水位等)进行趋势分析时,因为一般有三位整数,故将取作 100 即 i zc 13 可;对比例型数据(煤厚、灰分、显微组分含量等)进行趋势分析时,可视的数量级,为值在 i zc 中间取值。1001 若自选坐标系,控制点的坐标为相对坐标,可通过适当选取坐标系的单位,达到与地质变量统

28、一量纲的目的,因而不必再施加上述变换。 2、趋势方程的参数估计、趋势方程的参数估计 纪正规方程组为: (4-1) i n i ii ii i l nn i n i n ii n i n iiiii n iiiiii n iii zv zv zu z b b b b vvvuv vvvuv vuvuuu vvu x 2 1 0 1 12 2 1 解方程组可求出系数,从而得到趋势面方程: 0 b 1 b 2 b l b (4-2) n iliii vbvbubb 210 其中,)2)(1(5 . 0nnl 3、趋势与剩余、异常与、趋势与剩余、异常与“噪声噪声”的分离的分离 (1)由趋势方程计算各控

29、制点的趋势值,再由观测值、趋势值求得各点的剩余值: (4-3)), 2 , 1( nizr iii (2)计算正剩余的平均值 (4-4) m j j z m r 1 1 或正剩余的二倍标准差 (4-5) m j j rr m s 1 2 )( 1 1 22 (3)计算异常点和异常值 选或作为异常限,记为e。若正异常剩余与异常限之差,则第 点为 r s20 err ji i 正异常点,为正异常值;若负剩余与异常限之和,则第 点为负异常点,为负 i r0err ji i i r 异常值。 4、趋势方程的显著性检验、趋势方程的显著性检验 (1)计算趋势平方和、剩余平方和、拟合度及检验统计量 趋 s

30、剩 scf (4-6) n i i zs 1 2 )( 趋 (4-7) n i ii s 1 2 )z( 剩 14 (4-8) 剩趋总 ss s (4-9)%100 总趋 ssc (4-10) 1 p pns s f 剩 趋 (2)给定置信水平,查临界值表的。若,则认为f) 1,( pnpf) 1,(pnpff 趋势方程在置信水平下是显著的。 5、绘制趋势图和偏差图,并进行地质解释、绘制趋势图和偏差图,并进行地质解释 三、程序设计框图三、程序设计框图 要求:针对算例编写,不要求通用性,这样可以少占用一些时间。 建议以实验一的原始数据格式输入,首先要对数据进行预处理,处理完成后,形成实验一的原

31、始数据格式的新文件(详见图 11) 。以下步骤如流程图(图 41) 。 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 读入n对数据(ui,vi,yi)(i1,2,n) 1 100 2 1 2 2 1 2 pns ps f ssc sss zns znzs n i i n i i 剩 趋 总趋 趋总剩 趋 总 )( 计算 ),系统自动查询入(或者建立数据库,输输入 ff ff y fsssfc, 剩趋总 输出 结束 分析)(详细步骤见多元回归求得 式)解正规方程组( l bbb, 15 10 n iliii vbvbubb 210 得方程 ), 2 , 1( n

32、izr iii 计算剩余值: m j j z m r 1 1 计算正剩余的平均值: m j j rr m s 1 2 )( 1 1 22 差:计算正剩余的二倍标准 sr2e或用户选择 rjf y 果输出以上计算的所有结 结束 分析)(详细步骤见多元回归求得 式)解正规方程组( p ccc, 66 10 p j jjx cy 1 得方程 式),(计算分界值9876 0 y ), 2 , 1( 1 v p j jjj njxcy 求出 ), 2 , 1(,n ), 2 , 1(,n 21b 21a bbipbibi aaipaiai nixxx nixxx )对数据(读入 )对数据(读入 计算组内

33、平均值和组内方差(61式) 计算各变量的i值(62式) 用户设定输入挑选变量的界限值,挑选大于界限值的变量 计算p个变量的组内方差和协方差(65式 ba yy 类否则,归入 类;,归入 判别规则: b a 0 yy 类否则,归入 类;,归入 判别规则: a b 0 yy ), 2 , 1(,n 21vvvipvivi nixxx)对代判样品数据(读入 ynnxcy ba p j jj 个样品的计算根据方程 1 根据判别规则判别样品的归类,并统计归类正确的数ma和mb %100 a ba b nn mm r计算正确率: n 开始 图 6-1 二类判别模块流程图 四、算例四、算例 今获得有关内陆泥

34、炭和滨海泥炭得锶(sr)和钡(ba)的化验数据如下: 已知类样品号锶(sr)钡(ba) sr / ba 10.00120.000112 20.00300.00056 30.00030.00021.5 40.00520.00182.88 滨海 泥炭 50.00020.00021 10.00090.00220.41 20.00070.00130.54 30.00250.01100.23 内陆 泥炭 40.0280.00600.47 10.0010.00052.00 20.0050.000657.69 未知 个体 30.00070.00023.50 试用两类判别分析判断(未知个体)煤层的成因类型。

35、25 试验七试验七 贝叶斯多类判别分析贝叶斯多类判别分析 一、目的:一、目的: 通过对多类线性判别分析程序设计和完成算例,掌握贝叶斯多类判别模型原理和工作方法步骤。 二、方法概要二、方法概要 1、原始数据获取、原始数据获取 设有 g 类母体,从每个母体中取得个样品,每个样品测得个变量,则原始数据为: g np (; ) gkj xg ,1,2, g g n,1,2, k p,1,2, j (总样品个数) 1 g g g nn 2、准备工作、准备工作 (1)计算诸变量的类平均值和总平均值 (71) 1 1 g n gj gkj k g xx n 1 1 g gjj g xx g (其中;)g ,

36、1,2, g g n,1,2, k p,1,2, j 或 (72) 12 1 g n g j gkj gk xx n 1 1 g gjj g xx g (2)计算组内离差矩阵()和总离差矩阵(t)w (73)();( ) ijpxpijpxp wtt (74) 11 ()() g n g gigj ijgkigkj gk xxxx () (75) 11 ()() g n g ij ijgkigkj gk txxxx p,1,2, ji, (3)求 w,t 矩阵的逆矩阵(w-1,t-1) 及行列式值 3、判别分类、判别分类 (1)计算判别系数和及先验概率 jg c og c g q (76) p

37、 i gjij p i gjijjg xgnxgnc 11 )()( (;)g ,1,2, gp,1,2, j 26 () (77) 1 1 2 p gj ogjg i cc x g ,1,2, g , () (78) g g n q n g ,1,2, g (2)检验 p 个变量的判别效果 用威尔克斯准则来检验,即检验 p 个变量对于区分 g 个母 w u t g aaah 210: 体的能力。 计算 (79) ) 1( 1 1 1 gp u u f a a 其中: 22 22 (1)4 (1)5 1 p g a pg (1) 1 2 p g ka 1 2 pg kn 在给定下,查 f 分布

38、表得,如果,则判别函数有),1( gpf),1( gpff 效,否则,判别函数无效。 (3)计算未知个体的判别值:)x,x,(x x p21 () (710) p j jjgoggg xccpxy 1 ln)(g ,1,2, g (4)对未知个体类别分类 若 (),则将 x 样品划归第个母体。 *( )max() gg yxyxg ,1,2, gg g a 4、计算后验概率、计算后验概率 (711) () () 1 / g g yx g yx k e p ag x e 式中: * ()()() ggg yxyxyx 当时 22 (1)50pg 当时 22 (1)50pg 27 5、正确判别率估

39、计、正确判别率估计 设对已知类型 n 个样品判别归类后,有 m 个样品归类正确,则正确判别率 (712)%100 n m r 三、程序设计框图三、程序设计框图 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 式)值(计算97f ),系统自动查询入(或者建立数据库,输输入 ff ffy 果输出以上计算的所有结 结束 ), 2 , 1;, 2 , 1;, 2 , 1(,n 21 pjnkggxxx ggkpgkgk )对数据(读入 计算诸变量的类平均和总平均值(71,2式) 计算组内离差矩阵(w)和总离差矩阵(t)(73,4,5式) )(n107xyg个已知类型样品

40、的式计算根据 根据最大值确定其类别,并统计归类正确的样品数m %100 n m r计算正确率: n 开始 式),以及先验概率和计算判别系数87 , 67)(, 2 , 1;, 2 , 1(pjggqcc gogjg ), 2 , 1(207)(),( 21 ggxyxxxx gp 式)(的判别值计算未知样品 类,则归入的最大值求出上述g)(), 2 , 1)(xyggxy gg 式)计算后验概率(117 图 6-1 贝叶斯多类判别模块流程图 28 四、算例四、算例 (一) 、某煤矿矿井开采 a、b、c 三个煤层,由于断层破坏,掘进巷道遇到一层没不知属于哪 一层,从而影响掘进工作正常进行。试用判

41、别分析解决该煤层对比问题。为此,取若干煤样,经过 化验获得如下数据: 煤层样品 sal2o5c2o 17.8323.352.74 27.5823.203.15 38.5123.894.19 a 48.3124.004.32 14.7338.922.40 25.1237.843.23 35.7837.193.36 b 46.1737.403.30 16.5614.592.33 27.7815.844.39 37.2814.959.32 已知类型 c 47.3213.943.33 未知个体 x14.5639.021.36 试建立多类线性判别函数,并对未知个体进行判别,求出 x 属于各母体的后验概率

42、。 29 试验八试验八 有序地质量最优分割法有序地质量最优分割法 一、目的:一、目的: 通过对有序地质量最优分割法简单程序设计及完成算例,掌握该法的数字原理与方法。 二、方法概要二、方法概要 1、取得原始数据、取得原始数据 设有 n 各有序样品,每个样品测得 p 各变量,则有原始数据矩阵 (81) 11121 21221 12 . . . p p nnnp xxx xxx x xxx 2、数据正规化、数据正规化 (82) min maxmin xjij ij ijij xx z xx 1,2,., 1,2,., in jp 3、计算段直径矩阵、计算段直径矩阵 d (83) 2 11 ( , )(1, ) jp d i jzzj 1ijn 其中: 1 1 ( , ) 1 j zi jz ji 得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论