




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学地质 实 验 指 导 书 二零零六年八月 说 明 一 该指导书所属课程 数学地质 二 适用专业 地质工程 三 实验总学时数 20 学时 可根据需要增开适当的课外机时 四 各实验项目时数 实验一 预处理与统计 2 学时 必做实验 实验二 线性回归分析 4 学时 选做实验 实验三 多元线性回归分析 4 学时 必做实验 实验四 趋势面分析 4 学时 必做实验 实验五 聚类分析 4 学时 必做实验 实验六 两类判别分析 4 学时 必做实验 实验七 贝叶斯多类判别分析 4 学时 选做实验 实验八 有序地质量最优分割法 2 学时 必做实验 五 前修课程知识 1 计算机编程语言 2 线性代数 3 概率统计 目 录 实验一实验一 预处理与统计预处理与统计 1 实验二实验二 一元线性回归分析一元线性回归分析 7 实验三实验三 多元线性回归分析多元线性回归分析 11 试验四试验四 趋势面分析趋势面分析 15 试验五试验五 聚类分析聚类分析 20 试验六试验六 两类判别分析两类判别分析 24 试验七试验七 贝叶斯多类判别分析贝叶斯多类判别分析 28 试验八试验八 有序地质量最优分割法有序地质量最优分割法 32 1 实验一实验一 预处理与统计预处理与统计 一 目的 一 目的 通过完成数据统计和预处理程序的设计和实现及完成算例 掌握统计一组数据的极值 均值 方差 变异系数及进行数据预处理的方法 二 方法概要二 方法概要 1 进行统计和预处理的原因 目的和应注意的问题 进行统计和预处理的原因 目的和应注意的问题 1 原因 原始数据可能有强非对称性 存在孤立值 大多数的统计方法应用原始数据时存在大而且不是 偶然的残差等问题 通过改变表达方式 有时可以增强信息的显示 而这种改变不仅需要改变数值 的单位 而且可能改变数据的基本测量尺度 2 目的 使变量尽可能为正态分布 如回归分析要求因变量为正态分布 要求自变量和因变量之间 具有足够的相关关系 统一变量的数据尺度 使变量之间的非线性关系转换为线性关系 用新的数目少的相互独立的变量代替相互联系的原始变量 方便用简单自然的方式进行解释 帮助理解数据的特征 3 注意问题 数据范围 只有数据变化范围相对较大 变换才显著 变换是很重要的工作 变换不当则适得其反 所以在认真研究分析的基础上进行 有时要 通过多次试验才能找到合适的变换方法 有些行业中 有些强制性变换或习惯使用的变换 工作中应遵循 变换后数据的可解释性也很重要 有时为了不影响解释 宁可不对其转换 2 鉴别并剔除异常值 鉴别并剔除异常值 1 3 法则 拉依达准则 由于随机误差服从正态分布规律 因此 1 1 7 99 3 3 P xP 由式 1 1 知 误差出现的概率只有 0 3 也就是说 在 1000 次测量中 误差大于 3 的情况只可能出现 3 次 因此 在有限次测量中 若某次测量值的误差大于 3 时 则认为该 3 2 测量值含有过失误差 应予以舍去 这就是法则 3 一般的测量时误差是得不到的 只能得到残差 而总体标准差也是得不到的 xxv 故只能用它的估计值 通常取为样本标准差 即 S 因此 3 法则只能按下述规则实际 应用 对于测量数据 若某个测量值 对应的残差满足 n xxx 21 i xni 1 1 2 Sxxv ii 3 则将舍去 i x 根据 3 法则对实验数据进行处理 也有犯 弃真 的错误 就是将一些误差较大但并不含有 过失误差的正常测量值当作含有过失误差的测量值舍去了 3 法则 弃真 概率很小 且随着测 量次数的增加而减少 最后稳定与 0 3 一般要求 n 10 当 n 10 时 即使测量数据中含有粗大 误差 用 3 法则也不能判别出来 2 Dixon 准则 第一步 将样本从小到大顺序排列 得次序统计量 2 1 n xxx 称为极端值 max 1 min n xxxx 第二步 对不同的 n 求极端值 选择计算不同的统计量 1 3 2 1 n Dixon x xx xx n nn 第三步 对比 若计算出的统计量 临界值 则认为相应的极端值为异常值 3 统计 统计 1 平均值 设有一批样本数据 x1 x2 xn 其平均值为x 1 1 n i i x n x 1 1 2 样本方差 设有一批样本数据 x1 x2 xn 其离差平方和的平均值为样本方差 记 S2 1 2 2 1 2 1 1 xx n S n i i 方差反映了数据的离散程度 其值越大数据越分散 其值越小数据就较多的集中在平均值附近 但它是有量纲的 受到量纲 量级的制约 3 变异系数及正态分布检验 样本数据的标准差于平均值之比为变异系数 记 Cr 3 1 3 100 x S Cr 变异系数它是无量纲的 克服了量纲的影响 给出数据相对变化性度量 能较好的反映出数据 变化程度的大小 当变异系数大于 0 5 一般是非正态总体 正态总体的变异系数小于 0 33 当变异系数介于 0 33 0 5 之间时 总体多数服从对数正态分布 4 统一量纲 统一量纲 由于测量数据单位不同 或数量级不同 多种变量观测值的变化范围往往很大 如果用原始数 据计算 可能突出某些数量级特别大的变量作用 压低了数量级小的变量的作用 使计算失去意义 为使变量有相等的权 必须对原始数据进行变换 使其达到量纲统一 1 标准化变换 1 4 n i jij jijjij ij xx n xx Sj xx x 1 2 1 1 式中为原始观察值 为第 j 个变量的算术平均值 Sj为第 j 个变量的标准差 ij x j x i 1 2 n 为样品号 j 1 2 m 为变量号 变换后 变量平均值为 0 方差为 1 各变量处于同一量纲 每个变量在变化前后的相关程度 不变 按照几何意义 标准变换相当于将坐标原点移至中心 平均数 位置 这种变换适合于量纲 不同和数量大小不均一的连续型原始数据 如化学分析数据 2 极差变换 1 5 minmax min jj jij ij xx xx x 式中为原始数据 为第 j 个变量的最小值 为第 j 个变量的最大值 ij x minj x maxj x i 1 2 n 为样品号 j 1 2 m 为变量号 变换后 数据处于同一量纲 其最大值为 1 最小值为 0 所有数据在 0 1 之间变化 变化前 后的相关程度不变 按照几何意义 相当于把坐标原点移至变量最小值的位置上 极差变换适合于 量纲和大小不一样的连续型原始数据的变换 3 均匀化变换 1 6 j ij ij x x x 式中为原始数据 为第 j 个变量的算术平均值 变换后数据量纲一致 数据都是在 1 附近 ij x j x 波动的相对数 数学期望为 1 变量与平均数之差的期望为 0 此变换适合于比例型数据 如长度 4 体积 质量等 5 正态变换 正态变换 正态变换是指把呈非正态分布的数据变换成正态或近似正态分布的数据变换 1 角变换 角变换的作用是使左偏和右偏的不对称分布变成近似正态分布 方法是把原始数据变为 0 90 之间的角度 公式 1 7 n i i n i i x x x x 10 arccos 10 arcsin 式中为变换后的数据 为原始数据 n 1 2 为正整数 取变量原始观察值的最大值 i x i x 的整数位数 变换前后和其它变量的相关性略有差异 2 平方根变换 使右偏不对称分布变为正态分布 公式 1 8 Cxx ii C 为常数 平方根变换适用于服从泊松分布的离散型变量 如露头个数 距主断裂带的距离等 3 对数变换 公式 1 9 log Cxx ii C 为常数 对数变换适用于服从对数正态分布的数据 如化探数据及有色 稀有 重金属的品位数据等 三 程序设计框图三 程序设计框图 预处理和统计模块的流程图如图 1 1 所示 后续的不同多元统计方法对原始数据的分布有不同的要求 但对原始数据都需要进行预处理和 统计 所以建议统一输入文件的格式 预处理和统计模块处理后输出文件的格式也按该定义的格式 定义 文件的格式建议为 样品个数 变量个数 第 1 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 第 2 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 第 3 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 不是所有的原始数据都进行系统的统计和预处理 程序应该提供强大和灵活的人机交互界面 5 方便用户根据实际情况和需要 选择不同的数据变换方法 打开标准格式的原始数据文件 jixmn 原始数据矩阵变量个数读入样品个数 3 法则 n i jxx n jx 1 1 计算平均值 S j 1 1 2 1 2 和计算样品方差 jxjix n jS n i jxjixjiv 计算残差 V I j 3S 删除样品I和变量J i n i 1 j 1 j m Y i i 1 j j 1 N N Y Y J 1 jixmn 原始数据矩阵变量个数形成新的样品个数 数据统计模块数据统一量纲模块 求平均值 求变异系数和正态分布检验 求样品方差 是否正态 选择正态变换的方法 角变换平方根变换对数变换 求平均值 求样品方差 标准化变换均匀化变换极差变换 jixmn 原始数据矩阵变量个数形成新的样品个数 输出变换后的标准格式数据文件 开始 开始 图 1 1 数据预处理和统计模块流程图 四 算例四 算例 1 请对以下 15 个样品数据进行数据统计和数据预处理 变量 样品 123456789 11 7661153 48137952 625 7015 279 955 829 601158 21 7287603 23419252 522 2038 922 401 041 401578 31 7154183 68239061 105 2023 352 782 861 361372 41 4593923 98246130 3633 5928 213 090 891 581383 51 7383053 50571071 904 0014 592 331 041 551285 61 7133233 29393453 581 8037 843 231 091 801564 71 7517413 48281566 164 0018 594 461 381 611320 81 8536373 46121464 265 9014 275 562 273 981230 91 6496273 77359255 807 8023 894 193 112 231350 101 7209033 39263951 702 6037 193 362 441 001549 111 7379083 47131159 203 7030 482 751 180 941479 121 6318493 82491856 1210 5017 38 372 074 901233 131 7204073 29241656 064 6036 001 171 230 311555 141 8287893 49714272 886 0514 493 091 041 281290 151 7099483 67559567 905 4015 844 392 962 191282 6 2 请对以下 15 个样品数据进行数据统计和数据预处理 变量 样品 123456789 11 7661153 48137952 625 715 279 955 829 61158 21 728763 23419252 522 238 922 41 041 41578 31 7154183 6823961 15 223 352 782 861 361372 41 4593923 98246130 3633 5928 213 090 891 581383 51 7383053 5057171 9414 592 331 041 551285 61 7133233 29393453 581 837 843 231 091 81564 71 7517413 48281566 16418 594 461 381 611320 81 8536373 46121464 265 914 275 562 273 981230 91 6496273 77359255 87 823 894 193 112 231350 101 7209033 39263951 72 637 193 362 4411549 111 7379083 47131159 23 730 482 751 180 941479 121 6318493 82491856 1210 517 38 372 074 91233 131 7204073 29241656 064 6361 171 230 311555 141 8287893 49714272 886 0514 493 091 041 281290 151 7099483 67559567 95 415 844 392 962 191282 7 y z 散点图 实验二实验二 一元线性回归分析一元线性回归分析 一 目的 一 目的 通过对一元线性回归分析程序设计及完成算例 掌握一元线性回归分析的基本原理和方法 二 方法概要二 方法概要 1 原始数据预处理 原始数据预处理 对对原始数据 0 1 数据进行预处理 见实验一 n ii yx i n 2 数学模型建立 数学模型建立 1 作散点图 一元线性回归只能处理两个变量之间的关系 它又被称为 直线拟合 假设为自变量 为因变量 对预处理后对数xyn 据 0 1 其中 如果把各个点数据 ii yx innn 画在坐标纸上 作散点图 各点近似分布呈一条直线 则可用 一元线性回归 2 选择数学模型 2 1 bxay 3 参数 a b 的估计 为根据回归方程的得到的因变量的计算值 a b 为回归方程中的系数 x 为自变量 由于 y y 测定结果中不可避免会有实验误差 因此用最小二乘法的原理估计回归直线中的系数 a b 假设实验得到了 n 对数据 i y i 0 1 n 并得到了回归方程 则对于bxay x 的一系列变量 x1 x2 xn 根据回归得到方程可得到因变量的一系列计算值 nn bxay bxay bxay 22 11 每一个实测值 yi i 0 1 n 与它相对应的一个计算值 i 0 1 n 之间都有偏差 1 y 也可称残差 计算公式 2 2 iiiii bxayyyv 所有测试数据的残差平方和为 n i ii n i i n i ie bxayyyvQ 1 2 1 2 1 2 2 3 8 如果回归方程是合理的 a b 为最佳 则所得到的残差平方和应达到最小值 bxay 得 2 4 xbya xnx yxnyx L L b n i i n i ii xx xy 1 22 1 列出回归方程 2 5 bxay 3 回归方程显著性检验 回归方程显著性检验 1 将自变量 n 组试验数据依次代入回归方程 式 3 8 求出因变量 n 个回归值 2 6 ii bxay ni 2 1 2 计算 和 总 S 回 S 剩 S 2 7 n i i ynyS 1 22 总 2 8 n i i ynyS 1 22 回 2 9 回总剩 SSS 3 计算 F 统计量 2 10 2 1 nS S F 剩 回 4 计算相关系数 r 2 11 yyxx xy LL L r 5 查表检验 给定显著水平 查表得 若或 则证明回 2 2 nrnpF 2 pFF 2 nrr 归方程显著 否则 回归方程无实用价值 4 对因变量进行区间估计 对因变量进行区间估计 1 估计剩余标准值 2 12 2 nS剩 2 求出因变量估计值 当自变量取定值时 由回归方程可求得 因变量数学期望的估计值 x y 3 写出预测区间 9 95 置信区间 2 2 yy 99 7 置信区间 3 3 yy 三 程序设计框图三 程序设计框图 建议对原始数据以以下格式输入 样品个数 2 第 1 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 第 2 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 第 3 个样品号 该样品第 1 个变量的观测值 第 2 个变量的观测值 首先要对数据进行预处理 处理完成后 形成以上格式新的文件 详见图 1 1 以下步骤如 流程图 图 2 1 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 读入n对数据 xi yi I 1 2 n 见式计算32 yyxyxx lllyx 见式计算32 ba 1 0 nibxay ii 求出 2 1 2 1 2 2 1 2 nS S F SSS ynyS ynyS n i i n i i 剩 回 回总剩 回 总 计算 yyxx xy LL L r 计算 系统自动查询入 或者建立数据库 输输入 rFrF F F 且r r 2 nS剩计算剩余标准差 Y rFSrF 输出 bxayx 值 求出读入待预测样品 2 2 22 12 yL yL 3 3 23 13 yL yL 7 99 95 31322122 LLLL的置信区间 和 的置信区间 输出 结束 N 开始 图 2 1 一元线性回归分析模块流程图 四 算例四 算例 一 从某煤矿采集 11 个煤样 分别测定煤的发热量 和煤灰分 含量 获得 g DT Q g A 如下表数据 样品号 1234567891011 千卡 g DT Q8 307 87 77 26 86 25 65 55 004 704 3 g A 0 030 050 080 100 150 200 270 300 340 400 45 10 试建立煤的发热量 对煤灰分 的回归方程 并检验该回归方程的显著性 g DT Q g A 二 煤矿脉中 13 个相邻样本点处某种伴生金属的含量数据如下表 样品号 1234567 距离 x 23457810 含量 y 106 42108 20109 58109 50110 00109 93110 49 样品号 8910111213 距离 x 111415161819 含量 y 110 59110 60110 90110 76111 00111 20 试建立 y 对 x 的回归方程 并进行显著性检验 三 收集到广西晚二迭世含煤建造 30 个工程点煤系厚度 H 和煤层厚度 M 的资料 如 表三 提示 用抛物线方程 作二元一次线性回归 2 cxbxay 样点编号样点编号 12345678910 煤厚 煤厚 M M 1 801 050 560 02 300 922 502 933 262 28 煤系厚 煤系厚 H H 121 257 363 138 0154 6138 8134 6126 9196 1328 7 样点编号样点编号 11121314151617181920 煤厚 煤厚 M M 0 401 103 490 460 02 802 540 924 332 84 煤系厚 煤系厚 H H 528 5480 0420 0418 520 099 1378 5596 3155 8357 7 样点编号样点编号 21222324252627282930 煤厚 煤厚 M M 3 352 061 633 701 181 84 312 222 704 00 煤系厚 煤系厚 H H 240 9154 8116 7183 7127 0165 4192 4179 1230 0226 0 试建立煤层厚度 M 对含煤建造厚度 H 的回归方程 并作显著性检验 11 实验三实验三 多元线性回归分析多元线性回归分析 一 目的 一 目的 通过对多元线性回归分析程序设计及完成算例 掌握多元线性回归分析的基本原理和方法 二 方法概要二 方法概要 设有自变量 因变量 y 共做 n 次实验 若 y 与间有线行关系 回归 p xxx 21 p xxx 21 方程则为 3 1 ppx bxbxbby 22110 显而易见 只要确定了各回归系数 方程也就确定了 p10 b b b 1 建立原始数据矩阵 并进行必要的预处理 建立原始数据矩阵 并进行必要的预处理 1 确定因变量与自变量 形成行列的矩阵 n1 p 3 2 npnn p p yxxx yxxx yxxx 21 222221 111211 2 进行预处理 详见图 1 1 2 数学模型建立 数学模型建立 设经过预处理的原始数据 表示如下 3 3 pnn p p xxx xxx xxx X 21 22221 11211 n y y y Y 2 1 由最小二乘法知道 使得全部观察值与回归值的偏差平方和 Q 达到最小 即 p10 b b b y y 使 3 4 最小 n i ipniii n i ii xbxbxbbyyyQ 1 2 22110 1 2 根据微积分学中的极值原理 b0 b1 bn 应是下列方程组 3 5 2 1 2 1 0 2 0 2 1 1 0 pjni XyyQ b yyQ b ij n i ii j n i ii 3 5 式是求解回归系数的正规方程组 可以写成以下形式 12 3 6 YXBXX 3 7 YXXXB 1 求解正规方程组 得到各回归系数 p10 b b b 列出回归方程 3 8 ppx bxbxbby 22110 3 回归方程显著性检验 回归方程显著性检验 1 将自变量 n 组试验数据依次代入回归方程 式 3 8 求出因变量 n 个回归值 3 9 ippiii xbxbxbby 22110 ni 2 1 2 计算 和 总 S 回 S 剩 S 3 10 n i i ynyS 1 22 总 3 11 n i i ynyS 1 22 回 3 12 回总剩 SSS 3 计算 F 统计量 3 13 1 pnS pS F 剩 回 4 计算相关系数 r 3 14 总 回 S S r 5 查表检验 给定显著水平 查表得 若或 2 1 nrpnpF 1 pnpFF 2 nrr 则证明回归方程显著 否则 回归方程无实用价值 4 对因变量进行区间估计 对因变量进行区间估计 1 估计剩余标准值 3 15 1 pnS剩 2 求出因变量估计值 当自变量取定值时 由回归方程可求得因变量数学期望的估计值 p xxx 21 y 3 写出预测区间 95 置信区间 2 2 yy 99 7 置信区间 3 3 yy 13 三 程序设计框图三 程序设计框图 建议以实验一的原始数据格式输入 首先要对数据进行预处理 处理完成后 形成实验一的原 始数据格式的新文件 详见图 1 1 以下步骤如流程图 图 3 1 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 读入n对数据 xij yi i 1 2 n j 1 2 p 形成原始矩阵 见式3 3 见式计算73 11 YXXXXXX 1 2 1 2 2 1 2 pnS pS F SSS ynyS ynyS n i i n i i 剩 回 回总剩 回 总 计算 总 回 计算 S S r 系统自动查询入 或者建立数据库 输输入 rFrF F F 且r r 1 pnS剩计算剩余标准差 Y rFSrF 输出 ppp xbxbxbbyxxx 2211021 值 求出读入待预测样品 2 2 22 12 yL yL 3 3 23 13 yL yL 7 99 95 31322122 LLLL的置信区间 和 的置信区间 输出 结束 N p10 1 b b b 求得根据YXXXB 请参考 线性代 数矩阵 运算 求nixbxbxbby ippiii 2 1 22110 开始 图 3 1 多元线性回归分析模块流程图 14 四 算例四 算例 一 某矿区从 18 个矿样中测得 Cu Pd Pt 的含量如下所示 试求 Pt 对 Cu 和 Pd 的回归方程 并检验其有无实用价值 编号编号 1 x Cu 2 x Pd g t 3 x Pt g t 编号编号 1 x Cu 2 x Pd g t 3 x Pt g t 10 360 1690 176100 060 0230 045 20 050 0350 020110 530 3290 292 30 240 2480 262120 060 0650 080 40 050 0150 035130 210 2830 235 50 220 2160 234140 030 0300 030 60 130 0860 092150 330 210 237 70 101 3001 669160 010 0300 050 80 070 0090 006170 210 2520 24 90 160 1600 150180 080 0530 103 二 由于碳 氢 氧是煤燃烧过程中产生热量的主要元素 对某矿 褐煤 常烟煤 肥煤 焦煤和无烟煤 中取 12 块煤样 经分析化验后 其发热量 焦耳 克 与 Cr Hr r DT Q Or 元素的数据如下 问 今后能否不再对该矿煤进行发热量测定 而由元素分析结果对其进 行预测 编编 号号 1 x C Cr r 2 x H Hr r 3 x O Or r y J gJ g r DT Q 编编 号号 1 x C Cr r 2 x H Hr r 3 x O Or r y J gJ g r DT Q 1625 0156 57856 06 08 4 2706 0207 08883 03 08 5 3756 5257 29905 05 08 8 4755 0107 510902 52 58 0 5785 5157 711923 03 08 5 6805 24 08 012953 53 58 7 15 试验四试验四 趋势面分析趋势面分析 一 目的 一 目的 通过趋势面分析程序设计及完成算例 掌握趋势面分析方法原理及工作步骤 二 方法概要二 方法概要 1 建立原始数据矩阵 并进行必要的预处理 建立原始数据矩阵 并进行必要的预处理 1 选取应变量 选取什么样的变量进行趋势分析 取决于研究对象和研究目的 2 确定控制点 在确定控制点时 一般要考虑以下几个方面 控制点的代表性 真实性和可靠性 控制点 要具有面性 均匀 随机分布的特点 3 整理原始数据统计表 收集因变量观测值及相应坐标 填入趋势分析原始数据统计表 其格式可参考表 4 1 表 4 1 趋势分析原始数据统计表格式 编 号控制点坐标 顺序号原编号横坐标 u纵坐标 v 变量 z 其中 控制点坐标 可以是地理坐标 也可以是虚拟坐标系的相对坐标 4 建立原始数据矩阵 假设有 n 个控制点的地理坐标及地质变量观测值 则原始数据矩阵为 nnn zvu zvu zvu 222 111 5 统一量纲 为了不改变地质变量的值 仅对控制点的坐标值进行以下变换 先中心化 在均匀化 2 1 1 1 ni v v c v vv cv u u c u uu cu ii i ii i 其中 为常系数 其目的在于使 与具有相同的数量级 n i i u n u 1 1 n i i v n v 1 1 c i u i v i z 例如 在对间隔型 标高 水位等 进行趋势分析时 因为一般有三位整数 故将取作 100 即 i zc 16 可 对比例型数据 煤厚 灰分 显微组分含量等 进行趋势分析时 可视的数量级 为值在 i zc 中间取值 100 1 若自选坐标系 控制点的坐标为相对坐标 可通过适当选取坐标系的单位 达到与地质变量统 一量纲的目的 因而不必再施加上述变换 2 趋势方程的参数估计 趋势方程的参数估计 纪正规方程组为 4 1 i n i ii ii i l nn i n i n ii n i n iiiii n iiiiii n iii zv zv zu z b b b b vvvuv vvvuv vuvuuu vvu X 2 1 0 1 12 2 1 解方程组可求出系数 从而得到趋势面方程 0 b 1 b 2 b l b 4 2 n iliii vbvbubb 210 其中 2 1 5 0 nnl 3 趋势与剩余 异常与 趋势与剩余 异常与 噪声噪声 的分离的分离 1 由趋势方程计算各控制点的趋势值 再由观测值 趋势值求得各点的剩余值 4 3 2 1 nizR iii 2 计算正剩余的平均值 4 4 M j j z m R 1 1 或正剩余的二倍标准差 4 5 m j j RR m S 1 2 1 1 22 3 计算异常点和异常值 选或作为异常限 记为E 若正异常剩余与异常限之差 则第 点为 R S20 ERr ji i 正异常点 为正异常值 若负剩余与异常限之和 则第 点为负异常点 为负 i r0 ERr ji i i r 异常值 4 趋势方程的显著性检验 趋势方程的显著性检验 1 计算趋势平方和 剩余平方和 拟合度及检验统计量 趋 S 剩 SCF 4 6 n i i zS 1 2 趋 4 7 n i ii S 1 2 z 剩 17 4 8 剩趋总 SS S 4 9 100 总趋 SSC 4 10 1 p pnS S F 剩 趋 2 给定置信水平 查临界值表的 若 则认为 F 1 pnpF 1 pnpFF 趋势方程在置信水平下是显著的 5 绘制趋势图和偏差图 并进行地质解释 绘制趋势图和偏差图 并进行地质解释 三 程序设计框图三 程序设计框图 要求 针对算例编写 不要求通用性 这样可以少占用一些时间 建议以实验一的原始数据格式输入 首先要对数据进行预处理 处理完成后 形成实验一的原 始数据格式的新文件 详见图 1 1 以下步骤如流程图 图 4 1 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 读入n对数据 ui vi yi i 1 2 n 1 100 2 1 2 2 1 2 pnS pS F SSC SSS znS znzS n i i n i i 剩 趋 总趋 趋总剩 趋 总 计算 系统自动查询入 或者建立数据库 输输入 FF F F Y FSSSFC 剩趋总 输出 结束 分析 详细步骤见多元回归求得 式 解正规方程组 l bbb 15 10 n iliii vbvbubb 210 得方程 2 1 nizR iii 计算剩余值 M j j z m R 1 1 计算正剩余的平均值 m j j RR m S 1 2 1 1 22 差 计算正剩余的二倍标准 SR2E或 用户选择 RjF Y 果输出以上计算的所有结 结束 分析 详细步骤见多元回归求得 式 解正规方程组 P CCC 66 10 p j jjx Cy 1 得方程 式 计算分界值9876 0 y 2 1 1 v p j jjj njxCy 求出 2 1 n 2 1 n 21B 21A BBipBiBi AAipAiAi nixxx nixxx 对数据 读入 对数据 读入 计算组内平均值和组内方差 6 1式 计算各变量的I值 6 2式 用户设定输入挑选变量的界限值 挑选大于界限值的变量 计算P个变量的组内方差和协方差 6 5式 BA yy 类否则 归入 类 归入 判别规则 B A 0 yy 类否则 归入 类 归入 判别规则 A B 0 yy 2 1 n 21vvvipvivi nixxx 对代判样品数据 读入 ynnxCy BA p j jj 个样品的计算根据方程 1 根据判别规则判别样品的归类 并统计归类正确的数mA和mB 100 A BA B nn mm r计算正确率 N 开始 图 6 1 二类判别模块流程图 四 算例四 算例 今获得有关内陆泥炭和滨海泥炭得锶 Sr 和钡 Ba 的化验数据如下 已知类样品号锶 Sr 钡 Ba Sr Ba 10 00120 000112 20 00300 00056 30 00030 00021 5 40 00520 00182 88 滨海 泥炭 50 00020 00021 10 00090 00220 41 20 00070 00130 54 30 00250 01100 23 内陆 泥炭 40 0280 00600 47 10 0010 00052 00 20 0050 000657 69 未知 个体 30 00070 00023 50 试用两类判别分析判断 未知个体 煤层的成因类型 28 试验七试验七 贝叶斯多类判别分析贝叶斯多类判别分析 一 目的 一 目的 通过对多类线性判别分析程序设计和完成算例 掌握贝叶斯多类判别模型原理和工作方法步骤 二 方法概要二 方法概要 1 原始数据获取 原始数据获取 设有 G 类母体 从每个母体中取得个样品 每个样品测得个变量 则原始数据为 g np gkj xG 1 2 g g n 1 2 k p 1 2 j 总样品个数 1 G g g Nn 2 准备工作 准备工作 1 计算诸变量的类平均值和总平均值 7 1 1 1 g n gj gkj k g xx n 1 1 G gjj g xX G 其中 G 1 2 g g n 1 2 k p 1 2 j 或 7 2 12 1 g n G j gkj gk xx N 1 1 G gjj g xX G 2 计算组内离差矩阵 和总离差矩阵 T W 7 3 ijpxpijpxp WTt 7 4 11 g n G gigj ijgkigkj gk xxxx 7 5 11 g n G ij ijgkigkj gk txxxx p 1 2 ji 3 求 W T 矩阵的逆矩阵 W 1 T 1 及行列式值 3 判别分类 判别分类 1 计算判别系数和及先验概率 jg C og C g q 7 6 p i gjij p i gjijjg xGNxGNC 11 G 1 2 g p 1 2 j 29 7 7 1 1 2 p gj ogjg i CC x G 1 2 g 7 8 g g n q N G 1 2 g 2 检验 P 个变量的判别效果 用威尔克斯准则来检验 即检验 p 个变量对于区分 G 个母 W U T g aaaH 210 体的能力 计算 7 9 1 1 1 1 Gp U U F a a 其中 22 22 1 4 1 5 1 p G a pG 1 1 2 P G ka 1 2 PG kN 在给定下 查 F 分布表得 如果 则判别函数有 1 GpF 1 GpFF 效 否则 判别函数无效 3 计算未知个体的判别值 x x x X p21 7 10 p j jjgoggg xCCpXy 1 ln G 1 2 g 4 对未知个体类别分类 若 则将 X 样品划归第个母体 max gg yXyX G 1 2 g g g A 4 计算后验概率 计算后验概率 7 11 1 g g yX G yX k e P Ag X e 式中 ggg yXyXyX 当时 22 1 50pG 当时 22 1 50pG 30 5 正确判别率估计 正确判别率估计 设对已知类型 n 个样品判别归类后 有 m 个样品归类正确 则正确判别率 7 12 100 n m r 三 程序设计框图三 程序设计框图 打开标准格式的原始数据文件 数据预处理和统计模块 输出变换后的标准格式数据文件 式 值 计算97F 系统自动查询入 或者建立数据库 输输入 FF F F Y 果输出以上计算的所有结 结束 2 1 2 1 2 1 n 21 pjnkGgxxx ggkpgkgk 对数据 读入 计算诸变量的类平均和总平均值 7 1 2式 计算组内离差矩阵 W 和总离差矩阵 T 7 3 4 5式 n107Xyg个已知类型样品的式计算 根据 根据最大值确定其类别 并统计归类正确的样品数m 100 n m r计算正确率 N 开始 式 以及先验概率和计算判别系数87 67 2 1 2 1 pjGgqCC gogjg 2 1 207 21 GgXyxxxX gp 式 的判别值计算未知样品 类 则归入的最大值求出上述g 2 1 XyGgXy gg 式 计算后验概率 117 图 6 1 贝叶斯多类判别模块流程图 31 四 算例四 算例 一 某煤矿矿井开采 A B C 三个煤层 由于断层破坏 掘进巷道遇到一层没不知属于哪 一层 从而影响掘进工作正常进行 试用判别分析解决该煤层对比问题 为此 取若干煤样 经过 化验获得如下数据 煤层样品 SAl2O5C2O 17 8323 352 74 27 5823 203 15 38 5123 894 19 A 48 3124 004 32 14 73
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023-2024学年四年级英语上册期中专项复习-用单词正确形式填空练习(含答案)
- 胎盘前置护理周立蓉50课件
- 跨境电子商务双语教程 课件 第1章 跨境电商绪论
- 水稻全程机械化课件
- 水电站行业知识培训内容课件
- 用药护理47课件
- 2025版进出口石材贸易合同
- 二零二五年度互联网物流企业借款合同模板
- 二零二五年度教育科技股权投资保密及资源共享协议
- 2025版国内货物公路运输货物保险合同集锦
- 2025年内河船员考试(船舶辅机与电气2203·一类三管轮)历年参考题库含答案详解(5套)
- 农村土地确权课件
- 2024年黔西南州畅达交通建设运输有限责任公司招聘考试真题
- (高清版)T∕CES 243-2023 《构网型储能系统并网技术规范》
- 公共场所卫生管理员安全教育培训手册
- 2025年全国高校辅导员素质能力大赛基础知识测试题及答案(共3套)
- 大气监测培训课件
- 财政分局对账管理制度
- 2025年河南省中考历史试卷真题(含答案)
- 标准预防与手卫生
- 工程量计算培训课件
评论
0/150
提交评论