




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Comment 微微微微1 结果未写出来 Comment 微微微微2 数据 第第 1 1 页页 共共 3131 页页 心脏病的判别 摘 要 本文研究的是一个判别分析类问题 解决的是如何根据就诊者的各项生理指标 数据 判别就诊者是否患有心脏病以及患病的程度 并确定哪些指标是影响人们 患心脏病的关键因素 从而减少化验的指标 以便人们可以及时发现疾病 首先我们对题目中给出的数据进行了处理 通过查找资料以及合理的判断 将 9 进行了合理的赋值 对于问题一 首先通过对患病情况的分析将患病程度划分为 0 1 2 3 4 五 个总体 从而建立了多总体 fisher 判别模型 利用 spss 软件对 13 个判别指标进行 分析 去除错误数据判别指标 L M 最后得出 fisher 判别函数 并利用求得的 Fisher 判别函数 对已给出的病患情况进行回代分析 最终回代结果显示 是否患 病 的正确率为 97 2 判断 患病程度 的正确率为 85 6 对于问题二 首先在问题一确定的判别函数和判别思想的基础上 通过分析 去除错误数据过多的判别指标 L M 得到了新的 fisher 判别函数 然后我们运用 excel 软件 将 44 名就诊人员的 11 项有效判别指标的数据代入判别函数求解 通 过判断 得出各自的患病情况 对于问题三 运用主成份分析法进行判别指标的遴选 首先在问题一分析患心 脏病程度与心脏病判别指标间联系的基础上 在保留心脏病判别指标的前提下 剔除心脏病检测指标中某些被认为可以被用于表示对应心脏病判别情况的部分 接着 运用主成份分析法 分析各判别指标对最终结果评判的影响 分析各成分 指标间的贡献率 最终因此 我们得出 H C K J I M 为主要因素 对于问题四 首先我们在问题三遴选判别指标的基础上 运用 spss 软件对相关 指标分析 建立多总体 fisher 判别模型 得到相关系数 最终确定 fisher 判别函 数 接着利用与求解问题二相同的方法 将 44 名就诊人员 13 项指标的数据代入 得出的判别函数中进行求解 将得出的结果与问题二中得到的结果比较 我们发 现 筛选后所建立的判别方法及判别准则在判断 是否患病 时 正确率较高 而在判别 患病程度 时 就有一定的偏差 这与模型以及算法本身的准确度有 一定的关系 也与我们处理数据时的正确性有一定关系 本文综合运用了 fisher 判别法 主成份分析法等分析方法 构建相对应的 fisher 判别模型 结合 spss excel 等软件 对心脏病判别的问题进行了多角度的 分析 并给出了利用筛减优化指标判别心脏病患病情况的方法 在文章的最后对 所建模型的优缺点进行了分析 并对模型的适用范围进行了推广 在实际应用中 有较大的参考价值 关键字 多总体 fisher 判别 主成份分析法 心脏病的判别 第第 2 2 页页 共共 3131 页页 一 问题重述 心脏是维持全身血液循环的最重要器官 由于现代人不正确的饮食和运动习惯 等因素 心脏病患者人数逐年上升 心脏病已经成为威胁人类生命的十大疾病之 一 除了老年人 中青年也成为心脏病猝死的高危人群 年轻人的心脏病突发往 往没有明显先兆 突然发作时很危险 心脏病的病因很多 有时很难判断一个人 是否患有心脏病 附录二是到某医院做心脏病检测的一些确诊者的生理指标数据 指标 A B M 的含义见附录二 指标 N 表示是否确诊为心脏病以及患病的程 度 请尝试建立合适的数学模型讨论下列问题 问题一 根据附录一中的数据 提出判别心脏病以及患病程度的方法 并检验 你提出方法的正确性 问题二 按照问题一提出的方法 判断附录三中的 44 名就诊人员的患病情况 问题三 能否根据附录二的数据特征 确定哪些指标是影响人们患心脏病的关 键或主因素 以便减少化验的指标 问题四 根据问题三的结果 重复问题二的工作 并与问题二的结果对比作进 一步分析 二 问题分析 2 1 问题一的分析 问题一要求在已知就诊者各项生理指标及患病情况的前提下 提出判别心脏病 以及患病程度的方法 并检验提出方法的正确性 考虑到此题通过研究个体的观 测指标来推断该个体的所属类型 我们采用判别分析法中的 fisher 判别法进行求解 本问题为多元分析中的判别分析 现在利用 Fisher 判别法来处理该问题 Fisher 判别法的基本思想 从k个总体中抽取具有 p 个指标的样品观测数据 借助方差分析的构造一个线性判别函数 xcxcxcxy pp 11 其中系数 12 c c c c p 确定的原则是使得总体之间区别最大 而使每个总体内部的离差最 小 有了线性判别函数U后 对于一个新的样品 将它的 p 个指标值代入以上线 性判别函数式中求出 y x 值 然后根据一定的判别规则 就可以判别新的样品属 于哪个总体 首先 我们对指标中的数据进行分析 剔除其中有误的数据指标 L M 然后 可以通过 spss 软件处理原始数据 衡量剩余的 11 项指标的相应的标准差 方差 均值等 然后 利用所给数据求解出相应的 fisher 判别函数 建立判别准则 从而 得到确定心脏病以及患病程度的方法 最后 通过回代法 将确诊者的各项指标 代入判别函数 通过判别准则得出分类情况 再与原来的分类情况进行对比 即 可计算出正确率 从而验证所得出方法的正确性 2 2 问题二的分析 问题二要求在第一问的求解基础上 利用求解问题一的方法和思想分析 44 名 待诊断者的信息 对相应的指标数据进行合理的取舍和转换 得到对应的 fisher 判别函数 然后通过 excel 软件 将附录二中 44 名待诊断者的数据代入判别函数 中 即可分析得到最终的判别结果 2 3 问题三的分析 问题三要求根据给出的数据 筛选出能影响人们患心脏病的关键或主要因素 以便能够减少化验指标 首先我们利用 spss 软件对剔除错误数据指标后的剩余 11 个指标进行分析 然后利用主成份分析的方法 确定最终可以用来判别患病情况 的主成份 接着利用 spss 软件分析得到 11 个指标间的主成份正交解 剔除系数绝 第第 3 3 页页 共共 3131 页页 对值最小的项 最终确定可以用来判别患病情况的主要指标 2 4 问题四的分析 问题四要求依据问题三的结果 重复问题二中对于 44 名待诊患者患病情况的 判断 并与问题二中的判别结果作比较 根据问题三中分析得到的可以用来判别 患病情况的主成份指标 运用 spss 软件分析 通过 fisher 判别方法 求得最终的 fisher 判别式 通过指标回代的方法 利用与问题二中类似的方法 可以分析得到 减少分析指标后的患病情况分析结果 最后将问题四中的结果和问题二中的结果作比较 分析出用两种不同的方法对 患病情况预测的准确率 三 模型的假设与符号说明 3 1 模型假设 假设 1 假定就诊人员的身体状况只有患心脏病和健康 非心脏病患者 两类 不 考虑就诊人员的其他疾病因素以及身体素质的差异对疾病的影响 假设 2 假设除了表中列出的指标外 其他指标对是否患心脏病影响很小 假设 3 假设题目中所给的数据是在相同的条件下测得的 假设 4 假设样 品的估计平均 值 协方差分别 等于总体的平 均值 协方差 3 2 符号说明 A X 年龄 B X 性别 C X 胸痛类型 D X 静息血压 E X 血清中胆固醇含量 mg dl F X 空腹时血糖 120 mg dl G X 静息时心电图结果 H X 最大心跳速率 I X 运动是否诱发心绞痛 J X 运动心电图 ST 下降程度 K X ST 段斜坡 L X 大血管属性 M X 地中海贫血 N X 心脏疾病的诊断结果 G总体 n样品 c判别系数 FF 分布统计检定值 第第 4 4 页页 共共 3131 页页 四 数据的预处理 4 1 附录二数据的预处理 根据确诊者的表格信息 具体见附录二 其中患心脏病人数为 93 个 正常的为 157 个 由于数据中有 9 这一异常数据 为了便于模型的建立与分析 我们利用个 案剔除法和均值替换法将数据作如下处理 各指标属性见符号说明 一 剔除法 1 直接剔除法 对于指标 L M 由于在这两项判别指标中 数据 9 在所数据 中分别占有 98 8 和 89 2 的比率 由于比重过大 我们分析这两项指标可能对于最终 患病情况的判别没有较大的影响 故而 在建立模型和模型的求解过程中 可以不予 考虑这两项指标对心脏病结果的判别 2 个案剔除法 对于指标 H I 由于在这两项判别指标中 数据 9 仅仅在所有 数据中出现一次 由于所占比重太小 因此我们将这两项指标中的 9 转换为 0 便于 数据的正确处理 二 均值替换法 均值替换法就是将该项目剔除异常数据后取剩余数据的平均值的整数来替换异常或 缺失数据的方法 即 先剔除后替换的思想 E为血清中胆固醇含量 先将该指标下的 9剔除 然后求解剩余数值的效范围的平均值作为该指标下 9的替换值 将用于后面模 型建立与分析的有效数据 其中 在附录二中指标 K 表示 ST 段斜坡 1 上升 2 平 3 下降 我们将正常 人的 K 指标下的 9 置为 2 患病情况下的 9 将依据患病程度作不同的赋值置换处理 患病程度为 1 和 3 等级的患者 其 K 指标中的 9 将分别置换成与之一一对应的 1 和 3 其它患病等级的患者 其 K 指标中的 9 将统一置换成 1 4 2 附录三中数据的预处理 在附录二数据的预处理的前提下 为了能够正确利用问题一中的分析结果对附录三 中的待诊的44名患者进行心脏病的判别 因此在附录二数据预处理的前提下 将K指标 中的异常数据用 均值替换法 作相应的改变处理 先将这44名患者的第K指标中的数 据 9剔除 然后求解数值的效范围的平均值作为该指标下 9的替换值 其它判别指标在 附录一数据预处理的基础上不作任何改变 其中 具体的数据处理结果见附录 插入数据处理图表 五 模型的建立与求解 5 1 问题一模型的建立与求解 5 1 1 问题一模型的建立 本问题为多元分析中的判别分析 我们建立多个总体的 fisher 判别分析模型 1 假设共有k个总体 12 k G GG 抽取样品数分别为 12 k n nn 则令 12k nnnn 第 i 个总体的第 a 个样品的观测向量为 1 i ap i a i a xxx 则 建 立的判别函数为 xcxcxcxy pp 11 其中 11 pp xxxccc 2 根据求随机变量线性组合的均值和方差的性质可知 xy 在总体 i G 上的样本均值 和样本方差分别为 cscxcy i ii 2 i 其中 i x 和 i s 分别是总体 i G 内 x 的样 本均值向量和样本协方差矩阵 记x为总的均值向量 则 xcy Fisher 准则下的目标就是要选取系数向量 c 使得 如下值最大 即 第第 5 5 页页 共共 3131 页页 2 1 2 1 max k i i i k ii i n yy q 其中 i q 是人为的正的加权系数 它可以取为先验概率 3 如果取 1 ii nq 并将 cscxcyxcy i i ii 2 代入上式可化为 Ecc Acc 其中 A 为总体之间样本协方差矩阵 E 为组内离差阵 即 k i ii i xxxxnA 1 k i i i sqE 1 4 为求 的最大值 根据极值存在的必要条件 令 0 C 利用对向量求导的公式 2 2 22 Acc Ecc Ec Ecc Ecc Ac C Ecc Acc Ecc Ec Ecc Ac 22 Ecc Ec Ecc Ac22 因此 EcAc Ecc Ec Ecc Ac C 0 22 0 这说明 及 c 恰好是 A E 矩阵的广义特征根及其对应的特征向量 由于一般都要 求加权协差阵 E 是正定的 因此由代数知识可知 上式非零特征根个数 m 不超过 min k 1 p 又因为 A 为非负定的 所以非零特征根必为正根 记为 0 21 m 于是可构造 m 个判别函数 1 m l l y xcxl 5 对于每一个判别函数必须给出一个用以衡量判别能力的指标 i p 定义为 1 1 m l im i i pl m0 个判别函数 01 m yy 的判别能力定义为 0 0 0 1 1 1 1 m l m i i m l lm psp 6 当取 m0 1 时 即只取一个判别函数 此时有两种可供选用的方法 i 不加权法 若 1 min j kj i yxyyxy 则判 i Gx 第第 6 6 页页 共共 3131 页页 ii 加权法 将 2 1 k yyy 按大小次序排列 记为 2 1 k yyy 相应判别函数的标准 差重排为 i 令 1 k 1 i 1 1 1 1 ii iiii ii yy d 则 1 ii d 可作为 ji G 与 1 ji G 之间分界点 如果 x 使得 1 1 iiii dxyd 则判 ji Gx 7 当取 1 0 m 时 也有类似两种供选用的方法 i 不加权法 记 kixcy i l i l 1 m 1 l 0 对待判样品 1 p xxx 计算 xcxy l l 0 1 2 2 k 1 i m l i lli yxyD 若 min 2 1 2 i ki r DD 则判 r Gx ii 加权法 考虑到每个判别函数的判别能力不同 记 0 1 2 2 m l l i lli yxyD 其中 l 是由 EcAc 求出的特征根 若 min 2 1 2 i ki r DD 则判 r Gx 我们按照上面的模型将样本分为 5 个总体 分别为 0 1 2 3 4 从而建立了五个总体 的 fisher 判别模型 然后通过 spss 软件进行求解 5 1 2 模型解答过程 5 1 2 1 确定判别函数 Fisher 判别函数的输出如表 2 所示 表 2 各分类判别函数系数 分类函数系数分类函数系数 N 指标 01234 A1 3931 3621 3641 4411 397 B4 0294 2954 7785 0813 988 C6 2767 3297 2426 5876 937 D 415 406 433 435 437 E 058 062 071 067 074 F 10 570 8 299 8 347 9 002 10 139 G1 8041 1061 6723 1192 722 H 578 586 566 563 567 I 4 949 2 096 1 317 2 936 493 J 749 114 4501 0061 898 第第 7 7 页页 共共 3131 页页 K20 78715 30615 16321 30616 831 常量 139 155 133 837 137 915 150 140 145 453 Fisher 的线性判别式函数 根据分类函数系数表格可得出各类型的 Fisher 判别函数为 155 139 787 20 749 0 029 4 393 1 0 KJBA xxxxxY 837 133 306 15 114 0 295 4 362 1 1 KJBA xxxxxY 915 137 163 15 450 0 778 4 364 1 2 KJBA xxxxxY 14 150 306 21 006 1 081 5 441 1 3 KJBA xxxxxY 453 145 831 16 898 1 988 3 397 1 4 KJBA xxxxxY 将某待诊者的 11 项生理指标分别带入到上述各类型对应的 Fisher 判别函数 得到 五个对应的 Fisher 函数值 最后 通过回代法 将确诊者的各项指标代入判别函数 通过判别准则得出分类情况 再与原来的分类情况进行对比 即可计算出正确率 从 而验证所得出方法的正确性 5 1 3 运用模型一进行检验 根据得出的判别函数以及判断准则 将原确诊者的各项指标分别带入各类型对应的 Fisher 判别函数 进行判别 并将其与原确诊信息对比如下 其中序号表示人数排号 N 表示判断所得的数据 验证表示确诊数据 缩略表格如下表 3 具体见附录三 表三 结果分析 经过比对 我们可以看出 有 26 个人在 是否患病 中被判断错误 有 41 个人 在 患病程度 中被判断错误 由此 我们得出 判断 是否患病 的准确率为 6 89 100 250 26250 判断 患病程度 的准确率为 6 83 100 250 41250 5 1 4 模型一的检验分析 序 号 N 验证序号 N 验证序号 N 验证 100910018100 210920018212 300930018300 434942418434 500950018503 86331764424612 87331774424701 88041783324821 89211790024923 90021800025023 第第 8 8 页页 共共 3131 页页 通过 spss 软件得出的分类结果如下表 表 4 分类结果分类结果b c b c 预测组成员 N 01234 合计 01378534157 121954434 20752923 331111723 计数 400121013 087 35 13 21 92 5100 0 15 955 914 711 811 8100 0 2 030 421 78 739 1100 0 313 04 34 347 830 4100 0 初始 4 0 07 715 476 9100 0 01376635157 121774434 2011021023 35226823 计数 40024713 087 33 83 81 93 2100 0 15 950 020 611 811 8100 0 2 047 8 08 743 5100 0 321 78 78 726 134 8100 0 交叉验证 a 4 0 015 430 853 8100 0 a 仅对分析中的案例进行交叉验证 在交叉验证中 每个案例都是按照从该案例以外的所有其他案例派生 的函数来分类的 b 已对初始分组案例中的 72 8 个进行了正确分类 c 已对交叉验证分组案例中的 66 8 个进行了正确分类 检验结果分析 由上表可得 该模型判别的正确率为 72 8 与原结果较为吻合 而从上面所判别 的患病情况中 利用我们选取的 fisher 判别方法求解是否患病准确率为 89 6 患病 程度的准确率为 83 6 与实际结果的吻合度比较高 结果较为理想 符合实际的要 求 5 2 问题二的解答 5 2 1 判别函数的确定 Fisher 判别函数的输出如表 5 所示 表 5 分类函数系数分类函数系数 N 指标 01234 第第 9 9 页页 共共 3131 页页 A1 3931 3621 3641 4411 397 B4 0294 2954 7785 0813 988 C6 2767 3297 2426 5876 937 D 415 406 433 435 437 E 058 062 071 067 074 F 10 570 8 299 8 347 9 002 10 139 G1 8041 1061 6723 1192 722 H 578 586 566 563 567 I 4 949 2 096 1 317 2 936 493 J 749 114 4501 0061 898 K20 78715 30615 16321 30616 831 常量 139 155 133 837 137 915 150 140 145 453 Fisher 的线性判别式函数 根据分类函数系数表格可得出 Fisher 判别函数 如下 155 139 787 20 749 0 029 4 393 1 0 KJBA xxxxxY 837 133 306 15 114 0 295 4 362 1 1 KJBA xxxxxY 915 137 163 15 450 0 778 4 364 1 2 KJBA xxxxxY 14 150 306 21 006 1 081 5 441 1 3 KJBA xxxxxY 453 145 831 16 898 1 988 3 397 1 4 KJBA xxxxxY 然后将待诊者的各项生理指标分别代入到上述各类型对应的 Fisher 判别函数 得到 五个对应的 Fisher 函数值 根据 Fisher 后验概率最大这一判别规则 即所得函数值最 大 可以判断某待诊者所属的类型 5 2 2 待诊情况判别 我们将 44 位待诊断者数据带入到上述判别函数并进行判别 得出结果如下 序号代 表患者号 N 表示患病情况 表 6 序号 N 序号 N 序号 N 序号 N 序号 N 12101190280370 22110202294380 33120210304390 43131220310401 51141230323410 64150244333420 70161250341431 80170260350440 90182270360 判定结果分析 从上表中可知 44 名待诊断者中 正常的有 24 名 患心脏病程度为 1 级的有 8 名 患心脏病程度为 2 级的有 4 名 患心脏病程度为 3 级的有 4 名 患心脏病程度为 4 级 的有 4 名 用 fisher 判定方法对 44 名待诊者病情的诊断 虽然不能 100 的判断出 第第 1010 页页 共共 3131 页页 待诊者所属的患病类型 不可避免的会出现误判的情况 但在一定的程度上 利用该 方法能够对待诊者做出简单 快速 较为准确的判断 有一定的实际意义 5 3 问题三模型的建立与求解 5 3 1 问题三模型的建立 删改 Step1 为消除不同变量的量纲的影响 首先需要对变量进行标准化中处理 本部分涉 及到的指标共11个 样本对象250个 第 个样本的第 个指标值为 将ji ij F 各标准化值按如下方式进行标准化为 ij F i iij ij s FF F 其中 和分别为 指标的均值和标准差 标准化的目的在于消除不同变量的 i F i si 量纲的影响 而且标准化转化不会改变变量的相关系数 Step2 计算标准化数据的相关系数阵 求出相关系数矩阵的特征值和特征向量 记第i 个指标与第i 个指标的相关系数为 其计算方法为 ii r 11 2 1 111 11 1 ii FF r k kiik ii 则相关系数矩阵为 其中 11 11 ii rR iiiiii rrr 1 Step3 计算特征值与特征向量 计算相关系数矩阵R 的特征值 Step4 确定个主成分 进行统计分析 p 根据以上步骤 本文利用 SPSS 统计软件 首先求得各指标的相关性系数表 见附件 5 从表中可以发现 某些指标具有很强的相关性 如果直接用这些指标对酿酒葡萄质量进行 分级 不仅会使得运算量过大 同时还会造成信息的重叠 影响分级的客观性 主成分分 析可以把多个指标转化成少数几个不相关的综合指标 以红葡萄为例 相应主成分的特征 值和累计贡献率如下表 解释的总方差解释的总方差 初始特征值提取平方和载入旋转平方和载入 成份 合计方差的 累积 合计方差的 累积 合计方差的 累积 12 77025 17825 1782 77025 17825 1781 0719 7379 737 21 34112 19437 3721 34112 19437 3721 0309 36119 098 第第 1111 页页 共共 3131 页页 由以上分析利用 SPSS 统计软件计算得到主成分分析正交解 旋转成份矩阵旋转成份矩阵a a 成份 指标 1234567891011 A 065 040 959 115 020 089 001 003 006 218 077 B 055 090 000 048 025 027 987 081 040 030 039 C 153 948 041 015 064 023 101 081 005 144 187 D 082 015 108 981 029 032 049 063 022 079 064 E 054 057 019 028 990 076 025 034 002 052 053 F 023 022 081 032 076 990 027 047 019 013 052 G 038 003 006 021 002 019 039 035 997 004 022 H 117 150 235 089 060 014 035 001 005 937 135 I 380 260 107 093 079 079 057 027 033 176 848 J 933 153 067 091 060 023 062 022 045 112 265 K 020 070 003 061 034 047 080 990 036 001 017 提取方法 主成份 旋转法 具有 Kaiser 标准化的正交旋转法 a 旋转在 6 次迭代后收敛 结果分析 由上表可知 F G B A D E 的 F 值较小 首先剔除 此时分类正确率为 82 4 与问题二中的结果分析相差不大 当剔除 H 指标的时候 分类正确率明显降低 说明 H 对判别造成较明显的影响 综上 我们最终选定 H C K J I M 为影响人们患 心脏病的主要因素 8 问题四的解答 8 1 问题四求解 根据问题三的分析 选定 H C K J I M 为影响人们患心脏病的主要因素 通 过 spss 软件 得出新的 Fisher 判别函数的输出表 如表 9 所示 表 9 31 11010 09447 4661 11010 09447 4661 0119 18828 286 41 0609 63957 1051 0609 63957 1051 0099 17137 457 5 9318 46565 570 9318 46565 5701 0069 14546 602 6 9178 33773 907 9178 33773 9071 0059 13755 739 7 8227 47181 378 8227 47181 3781 0059 13564 873 8 6926 29187 669 6926 29187 6691 0029 11373 986 9 5965 41893 087 5965 41893 0871 0019 10483 090 10 4614 19397 280 4614 19397 280 9999 08292 172 11 2992 720100 000 2992 720100 000 8617 828100 000 提取方法 主成份分析 第第 1212 页页 共共 3131 页页 分类函数系数分类函数系数 N 指标 01234 A 683 660 687 753 719 B3 7164 0154 4454 6343 551 C2 7884 0904 1863 3813 960 D 372 365 394 396 399 E 050 054 062 058 066 F 8 047 5 634 5 689 6 341 7 357 J 2 728 1 339 806 534 818 K19 02314 04314 05319 88615 842 常量 70 677 65 991 74 730 85 683 81 880 Fisher 的线性判别式函数 根据分类函数系数表格可得出各类型的 Fisher 判别函数为 677 70 023 19 728 2 716 3 683 0 0 KJBA xxxxxY 991 65 043 14 339 1 015 4 660 0 1 KJBA xxxxxY 730 74 053 14 806 0 445 4 687 0 2 KJBA xxxxxY 683 85 886 19 534 0 634 4 753 0 3 KJBA xxxxxY 880 81 842 15 818 0 551 3 719 0 4 KJBA xxxxxY 然后再将待诊者的各项生理指标分别带入到上述各类型对应的 Fisher 判别函数 根 据 Fisher 后验概率最大这一判别规则 判断某待诊者所属的类型 如下表 表 10 序号 N 序号 N 序号 N 序号 N 序号 N 13101190283370 22110203293380 34120214304390 40131220310401 52140230320410 64150244334420 70160250341431 80170260350440 第第 1313 页页 共共 3131 页页 判别结果分析 从上表中可知 44 名待诊断者中 未患病者有 26 名 患心脏病程度为 1 级的有 5 名 患心脏病程度为 2 级的有 2 名 患心脏病程度为 3 级的有 5 名 患心脏病程度为 4 级的有 6 名 8 2 结果分析 将问题二与问题四所判断出的结果对比做成如下表格 表 11 序号N2N4序号N2N4序号N2N4序号N2N4序号N2N4 1231011190028033700 2221100202329433800 3341200210430443900 4301311220031004011 5121410230032304100 6441500244433344200 7001610250034114311 8001700260035004400 900182327003600 从表格的对比分析可以看出 两次结果差别不大 全部 44 组数据中 只有 13 对判 断不一致 这从另外一个方面说明 我们的判断方法不是特别准确 仍存在一定的误 差 但是 我们在判断 是否患病 时具有较高的准确率 只是在判别 患病程度 时准确率较低 这说明可能是在对数据进行分析时 没有很好的将有问题的数据 9 进 行合理的置换 斟酌 9 模型的评价 改进及推广 8 1 模型评价 虽然 该模型并不能 100 的判断出待诊者所属的患病类型 但是 利用该模型能够 对待诊者做出简单 快速 较为准确的判断 能够解决医学上现在所面临的问题 同 时 也成为医学上一种新的诊断方式 与传统的诊断方式相比 准确率得到了大幅提 高 治疗效果也会更为显著 8 2 模型改进 在此模型下 我们是假设把几乎所有判别变量都选入判别函数 并通过计算标准化 判别函数系数 没有辨认出不重要的判别变量 所以最后的判别正确率不太高 因此 我们必须对模型进行改进 可以考虑多踢除一些影响不大的相关指标 8 3 模型推广 此类判别问题可以推广到天气预报中 比如有一段较长时间关于某地区每天气象的 记录资料 晴阴雨 气温 气压 湿度等 建立一种用连续五天的气象资料来预报第 六天的天气的方法 参考文献 1 于林 数学建模主次因素的判别 三峡大学理学院 2 杨清源 心脏病医学全接触 复旦大学出版社 2007 05 90183270360 第第 1414 页页 共共 3131 页页 3 附录 附录一 已确诊的信息 ABCDEFGHIJKLMN 4 0 12 14 0 28 9 00 17 2 00 9 9 9 0 4 9 03 16 0 18 0 00 15 6 012 9 9 1 3 7 12 13 0 28 3 019800 9 9 9 0 4 8 04 13 8 21 4 00 10 8 1 1 5 2 9 9 3 5 4 13 15 0 900 12 2 00 9 9 9 0 3 9 13 12 0 33 9 00 17 0 00 9 9 9 0 4 5 02 13 0 23 7 00 17 0 00 9 9 9 0 5 4 12 11 0 20 8 00 14 2 00 9 9 9 0 3 7 14 14 0 20 7 00 13 0 1 1 5 2 9 9 1 4 8 02 12 0 28 4 00 12 0 00 9 9 9 0 3 7 03 13 0 21 1 00 14 2 00 9 9 9 0 5 8 12 13 6 16 4 0199122 9 9 3 3 9 12 12 0 20 4 00 14 5 00 9 9 9 0 4 9 14 14 0 23 4 00 14 0 112 9 9 3 4 2 03 11 5 21 1 01 13 7 00 9 9 9 0 5 4 02 12 0 27 3 00 15 0 0 1 5 2 9 9 0 3 8 14 11 0 19 6 00 16 6 00 9 9 9 1 4 3 02 12 0 20 1 00 16 5 00 9 9 9 0 6 0 14 10 0 24 8 00 12 5 012 9 9 1 3 6 12 12 0 26 7 00 16 0 032 9 9 1 4 3 01 10 0 22 3 00 14 2 00 9 9 9 0 41212180014012 0 第第 1515 页页 共共 3131 页页 404299 4 9 02 12 4 20 1 00 16 4 00 9 9 9 0 4 4 12 15 0 28 8 00 15 0 132 9 9 3 4 0 13 13 0 21 5 00 13 8 00 9 9 9 0 3 6 13 13 0 20 9 00 17 8 00 9 9 9 0 5 3 14 12 4 26 0 01 11 2 132 9 9 0 5 2 12 12 0 28 4 00 11 8 00 9 9 9 0 5 3 02 11 3 46 8 9 0 12 7 00 9 9 9 0 5 1 12 12 5 18 8 00 14 5 00 9 9 9 0 5 3 13 14 5 51 8 00 13 0 00 9 9 9 3 5 6 13 13 0 900 11 4 00 9 9 9 0 5 4 14 12 5 22 4 00 12 2 022 9 9 1 4 1 14 13 0 17 2 01 13 0 022 9 9 3 4 3 02 15 0 18 6 00 15 4 00 9 9 9 0 3 2 12 12 5 25 4 00 15 5 00 9 9 9 0 6 5 14 14 0 30 6 10871 1 5 2 9 9 1 4 1 02 11 0 25 0 01 14 2 00 9 9 9 0 4 8 02 12 0 911 14 8 00 9 9 9 0 4 8 04 15 0 22 7 00 13 0 1129 9 0 5 4 02 15 0 23 0 00 13 0 00 9 9 9 0 5 4 03 13 0 29 4 01 10 0 102 9 9 4 3 5 12 15 0 26 4 00 16 8 00 9 9 9 0 5 2 13 14 0 25 9 01 17 0 00 9 9 9 0 4 3 14 12 0 17 5 00 12 0 112 9 73 5 9 13 13 0 31 8 00 12 0 112 9 30 第第 1616 页页 共共 3131 页页 3 7 14 12 0 22 3 00 16 8 00 9 9 30 5 0 12 14 0 21 6 00 17 0 00 9 9 30 3 6 13 11 2 34 0 00 18 4 012 9 30 4 1 14 11 0 28 9 00 17 0 00 9 9 61 5 0 14 13 0 23 3 00 12 1 122 9 72 4 7 04 12 0 20 5 0098122 9 64 4 5 12 14 0 22 4 10 12 2 00 9 9 9 0 4 1 02 13 0 24 5 00 15 0 00 9 9 9 0 5 2 04 13 0 18 0 00 14 0 1 1 5 2 9 9 0 5 1 02 16 0 19 4 00 17 0 00 9 9 9 0 3 1 14 12 0 27 0 00 15 3 1 1 5 2 9 9 1 5 8 13 13 0 21 3 01 14 0 00 9 9 61 5 4 14 15 0 36 5 01 13 4 011 9 9 0 5 2 14 11 2 34 2 0196112 9 9 3 4 9 12 10 0 25 3 00 17 4 00 9 9 9 0 4 3 03 15 0 900 17 5 00 9 9 30 4 5 14 14 0 22 4 00 14 4 00 9 9 9 0 4 6 14 12 0 27 7 00 12 5 112 9 9 1 5 0 02 11 0 20 2 00 14 5 00 9 9 9 0 3 7 02 12 0 26 0 00 13 0 00 9 9 9 0 4 5 04 13 2 29 7 00 14 4 00 9 9 9 0 3 2 12 11 0 22 5 00 18 4 00 9 9 9 0 5 2 14 16 0 24 6 0182142 9 9 3 4 4 14 15 0 41 2 00 17 0 00 9 9 9 0 51214260114112 1 第第 1717 页页 共共 3131 页页 705599 4 4 12 13 0 21 5 00 13 5 00 9 9 9 0 5 2 14 12 0 18 2 00 15 0 00 9 9 9 2 4 4 04 12 0 21 8 01 11 5 00 9 9 9 0 5 5 14 14 0 26 8 00 12 8 1 1 5 2 9 9 2 4 6 13 15 0 16 3 9 0 11 6 00 9 9 9 0 3 2 14 11 8 52 9 00 13 0 00 9 9 9 2 3 5 04 14 0 16 7 00 15 0 00 9 9 9 0 5 2 12 14 0 10 0 00 13 8 10 9 9 9 0 4 9 14 13 0 20 6 00 17 0 00 9 9 9 1 5 5 13 11 0 27 7 00 16 0 00 9 9 9 0 5 4 12 12 0 23 8 00 15 4 00 9 9 9 0 6 3 14 15 0 22 3 00 11 5 00 9 9 9 1 5 2 12 16 0 19 6 00 16 5 00 9 9 9 0 5 6 14 15 0 21 3 10 12 5 112 9 9 2 6 6 14 14 0 90094112 9 9 3 6 5 14 17 0 26 3 10 11 2 122 9 9 3 5 3 02 14 0 21 6 00 14 2 122 9 9 0 4 3 11 12 0 29 1 01 15 5 00 9 9 9 2 5 5 14 14 0 22 9 00 11 0 1 0 5 2 9 9 0 4 9 02 11 0 900 16 0 00 9 9 9 0 3 9 14 13 0 30 7 00 14 0 00 9 9 9 0 5 2 02 12 0 21 0 00 14 8 00 9 9 9 0 4 8 14 16 0 32 9 00921 1 5 2 9 9 2 3 9 03 11 0 18 2 01 18 0 00 9 9 9 0 第第 1818 页页 共共 3131 页页 5 8 14 13 0 26 3 00 14 0 122 9 9 2 4 3 12 14 2 20 7 00 13 8 00 9 9 9 0 3 9 13 16 0 14 7 10 16 0 00 9 9 9 0 5 6 14 12 0 8500 14 0 00 9 9 9 0 4 1 12 12 5 26 9 00 14 4 00 9 9 9 0 6 5 14 13 0 27 5 01 11 5 112 9 9 4 5 1 14 13 0 17 9 00 10 0 00 9 9 70 4 0 04 15 0 39 2 00 13 0 022 9 62 4 0 14 12 0 46 6 9 0 15 2 112 9 61 4 6 14 11 8 18 6 00 12 4 00 9 9 71 5 7 12 14 0 26 0 10 14 0 00 9 9 60 4 8 04 12 0 25 4 01 11 0 00 9 9 9 0 3 4 12 15 0 21 4 01 16 8 00 9 9 9 0 5 0 14 14 0 12 9 00 13 5 00 9 9 9 0 3 9 12 19 0 24 1 00 10 6 00 9 9 9 0 5 9 02 13 0 18 8 00 12 4 012 9 9 0 5 7 14 15 0 25 5 0092132 9 9 2 4 7 14 14 0 27 6 10 12 5 10 9 9 9 0 3 8 12 14 0 29 7 00 15 0 00 9 9 9 0 4 9 03 13 0 20 7 01 13 5 00 9 9 9 0 3 3 04 10 0 24 6 00 15 0 112 9 9 1 3 8 14 12 0 28 2 00 17 0 00 9 9 9 1 5 9 04 13 0 33 8 11 13 0 1 1 5 2 9 9 1 3 5 01 12 0 16 0 01 18 5 00 9 9 9 0 3111415001800 1 第第 1919 页页 共共 3131 页页 4060999 4 7 03 13 5 24 8 10 17 0 00 9 9 9 3 5 2 03 12 5 27 2 00 13 9 00 9 9 9 0 4 6 14 11 0 24 0 01 14 0 00 9 9 30 5 8 02 18 0 39 3 00 11 0 112 9 74 5 8 12 13 0 23 0 00 15 0 00 9 9 9 0 5 4 12 12 0 24 6 00 11 0 00 9 9 9 0 3 4 02 13 0 16 1 00 19 0 00 9 9 9 0 4 8 04 10 8 16 3 00 17 5 021 9 9 0 5 4 02 12 0 23 0 10 14 0 00 9 9 9 0 4 2 13 12 0 22 8 00 15 2 1 1 5 2 9 9 0 3 8 13 14 5 29 2 00 13 0 00 9 9 9 0 4 6 14 11 0 20 2 00 15 0 10 9 9 9 1 5 6 14 17 0 38 8 01 12 2 122 9 9 3 5 6 14 15 0 23 0 01 12 4 1 1 5 2 9 9 3 6 1 04 13 0 29 4 01 12 0 112 9 9 0 4 9 13 11 5 26 5 00 17 5 00 9 9 9 1 4 3 02 12 0 21 5 01 17 5 00 9 9 9 0 3 9 12 12 0 901 14 6 021 9 9 0 5 4 14 14 0 900 11 8 10 9 9 9 2 4 3 14 15 0 24 7 00 13 0 122 9 9 1 5 2 14 16 0 33 1 00941 2 5 9 9 9 4 5 0 14 14 0 34 1 01 12 5 1 2 5 2 9 9 4 4 7 14 16 0 29 1 01 15
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年宠物针灸安全操作面试题及答案
- 草坪园艺技术使用中常见问题解决大全
- 2025年护卫犬训练理论模拟题库
- 2025年安全员考试备考冲刺题解
- 2025年智能制造工程师面试技巧与答案
- 2025年安全员安全生产法规试题
- 2025年事务局培训管理岗位面试题库答案
- 2025年农村经济管理实务技能考核试卷及答案解析
- 2025年金融业务拓展经理综合能力测验试卷及答案解析
- 2025年地震观测员技能鉴定初级模拟题
- 全册(教案)人教精通版英语六年级上册
- 炼焦厂推焦车司机岗位技术操作规程
- DL-T5455-2012火力发电厂热工电源及气源系统设计技术规程
- 穴位贴敷治疗过敏性鼻炎技术
- 公司自行车管理制度
- 《剧院魅影:25周年纪念演出》完整中英文对照剧本
- 蒋诗萌小品《谁杀死了周日》台词完整版
- 6G网络中的垂直通信和切片技术
- 社区健康服务与管理教案
- 《社区康复》课件-第一章 总论
- 机械设备维护保养手册
评论
0/150
提交评论