




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文就是针对正常人与病人体内Zn、Cu、Fe、Ca、Mg、K、Na七种元素含量的不同,通过建立七种元素含量的数学模型,来寻找一种或多种方法来判断任意一个病例是否为病人。在问题一的求解中,我们先后采 用了MATLAB中classify函数、FISHER判别准则、欧氏距离和协差阵距离判别法四种方法,通过把样本代入模型进行检验,发现均能达到较高的 正确率。然后我们从这四种方法中选出正确率最高的一个模型即协差阵距离判别模型,来作为最终检验的依据。以此模型来对表B.2中从61到90号病例进 行判断,求得结果。然后我们利用了t检验法对七种 元素进行判断,通过判断每种元素在病人和正常人身上含量是否差别显著来作为依据。若差别不显著,我们则认为在对最后结果的影响中可以对该元素不予以考虑。 如此我们找到了影响人们患肾炎的关键或主要因素,大大地简化了模型,减少了化验的指标。再利用新模型对B.2中的病例重新进行分析。通过两个模型对同一组未知数据 的判断,我们最终对两次的结果进行了最后的分析。发现了两种模型各有优缺点。一种需要测量的元素种类较多,但结果相对准确;另一种操作简便,但误差相对较 大。因此我们最终得出结论,认为应结合实际情况,在不同情况下使用不同的模型。并且我们发现,该模型对于病人的判断准确率很高,因此又提出一种简便的判别 方法,即若病人的Ca含量偏高,则应对其用其他方法重新进行化验,以提高判别的准确性。模型假设1、假设病例没有其他疾病导致某种元素含量不正常。2、假设所有人体格基本相差不大,因体格不同而引起的影响可忽略。3、检测是在同等条件下进行的,即同样的外界环境和生理条件。1.MATLAB 中 CLASSIFY 函数来求在MATLAB、SPSS等软件中有现成的函数来判断这类问题,因此解决此问题非常简单,就把它放在第一位上了。在MATLAB中该函数的名字叫做classify。用法是:CLASS = CLASSIFY(SAMPLE,TRAINING,GROUP)2.FISHER判别FISHER判别准则是一个被 广泛应用的准则,是一种常用的监督分类方法。它的准则是“组间最大分离”的原则,即要求组间(类间)距离最大而组内(类内)的离散性最小,也就是要求组间 均值差异最大而组内离差平方和最小。FISHER判别是利用一判别函数来进行最小距离分类的。当选用一次函数作为判别函数时为线性判别,本题中只用到了 Fisher线性判别。设病人为A类,正常人为B类。设Zn、Cu、Fe、Ca、Mg、K、Na分别为1、2、3、4、5、6、7,则它们对应的系数分别为、 、 、 、 、 、 。则每个病例均可求出一个R值:作为判断该病例的准则。首先求A类平均值和B类平均值,它们分别为:(其中i=1,2,3,4,5,6,7).A类中心和B类中心分别为:依照FISHER准则,要使A,B两类病例的R的均值之差越大越好,即使为最大。类内离差越小越好,即使为最小。把两个要求结合起来,就是要使:为最大。因此, 满足下列条件:(i=1,2,3,4,5,6,7)于是我们推算出T与 、 、 、 、 、 、的关系式,再利用MATLAB求算出同时满足T对7个系数的偏导都等于0时的7个系数的实数解。具体步骤如下:在MAPLE中输入 的表达式后,利用命令:eq1:=diff(T,a1)=0:eq2:=diff(T,a2)=0:eq3:=diff(T,a3)=0:eq4:=diff(T,a4)=0:eq5:=diff(T,a5)=0:eq6:=diff(T,a6)=0:eq7:=diff(T,a7)=0:solve(eq1,eq2,eq3,eq4,eq5,eq6,eq7,a1,a2,a3,a4,a5,a6,a7);即求出a1=0.000530906136342214a2=-0.118465004411677a3= 0.0159696486584355a4= 0.0033349535094511a5=- 0.00556834867026913a6= 0.00123530639041636a7=-0.00137863475060256再继续算出A类和B类所有的训练样本计算两类的平均判别函数值:=0.202244545974639=4.82866058587808即得:=2.5154525659263595此时,R0值就是区分A、B两类病例的标准,称为判别函数。当RR0的为正常人,RR0的为病人。3.欧氏距离法欧氏距离:即两项间的差是每个变量值差的平方和再平方根,其目的是计算其间的整体距离即不相似性。设有两个总体B、A,其中,B为正常人总体,A为病人总体,从第一个总体中抽取30个样品,从第二个总体中抽取30个样品,每个样品测量7个指标,对每一个指标进行求平均值,其结果如下表。指标ZnCuFeCaMgKNa代号B186.621.9236762.011672511.133295.136790.37367.21A143.1033312.33433323.066667698.16667113.39333201.13333526.83333今任取一个样品,实测指标值为 ,首先计算X到B、A总体的距离,分别记为和 ,按距离最近准则判别归类,则可写成:距离定义采用欧氏距离,则可计算出然后比较 和大小,按距离最近准则判别归类。4.协差阵距离判别法协 方差这一概念并没有确切的意义。它是反映两个随机变量的相关性的一种度量。不过受数值量级的影响,因此单位化后可通过相关系数来反映两个随机变量线性相关 的程度。比如对二维随机向量(X,Y)来说,期望E(X),E(Y)只反映了X,Y各自额平均值,方差D(X),D(Y)只反映了它们各自与自己均值的偏 离程度,它们对X,Y之间的相互关系不提供任何信息。当X,Y相互独立时,有 E(X-E(X)(Y-E(Y)0 由此可知,如不等于0,则它们肯定不独立。于是定义:设(X,Y)是二维随机变量,若E(|(X-E(X)(Y-E(Y)|)小于无穷大,则称 E(X-E(X)(Y-(Y)为X与Y的协方差,记为Cov(X,Y).也可对比单个随机变量的方差来理解。模型建立:(1)由所给数据,令A类代表病人,B类代表正常人,两类各有30个样本,即 = =30,待测样本为30个,样本A和B的均值矩阵分别为:(2)计算样本协差阵对于A类 对于B类 令S=(3)求线性判别函数W(X)线性判别方程为: 其中= 由。通过MATLAB求得:将检测值X代入此线性判别方程,若W(X)0,则此人无病(B);若W(X)0,则为有病之人(A);若W(X)=0,待进一步检验。可以采用数据挖掘中分类挖掘方法,31-60一确诊为肾炎病人,后30个为健康人,那这二者可以作为 训练集,挖掘出一种分类模式,先用训练集验证一下该模式是否准确,若准确则即可用该模式来判断 剩下的就诊者属于哪一类。本文是一个这是一个判别类型的问题,在医学上是一个诊断问题,即从样本个体的若干个量化特征来判断肾炎与否。我们针 对这些信息根据logistic回归分析的相关功能,建立logistic回归分析判别模型。对于样本属性为肾炎与否,这是一个二值响应的问题,我们采用 二类样本判别分析方法,即响应变量只有两个值,肾炎时就是1,健康的时候就是0。用logistic模型回归分析处理二类样本判别时,选取阈值0.5,使 预报值在阈值0.5上下波动,当预报值大于0.5时则说明样本属性为健康,当预报值小于0.5时则说明样本属性为肾炎。同时利用连接函数logit将二值 响应和影响到样本属性的多因素有机的结合起来,使模型函数化,运用最大似然估计得到函数中的参数,得到一个模型表达式,然后利用这个模型进行判别。在消除 logistic回归模型分析中各变量存在的多重共线性上面,我们采用主成分分析法,同样在最后利用得到的新模型进行判别。 问题一中通过建立的模型对样本进行检验得出总预测准确率为90%,对问题二中待判别的样本个体进行模型检测时有17个肾炎患者,13个正常人;问题三中对 样本进行检验得出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江省建筑业企业农民工劳动合同范本
- 2025年婴幼儿发展引导员(高级)职业技能鉴定考试题库(含答案)
- 2025年度通化市继续教育公需科目试题及答案
- 2025年保密知识在线学习测考试试题+答案
- 2025年时政热点题库及答案
- 预制混凝土基础施工技术方案
- 2025年注册会计师 会计科目冲刺试卷及考点预测
- 2025年考研英语(一)翻译实战演练:高分策略与真题解析
- 九年级英语词汇教学课件设计
- 2025年注册电气工程师考试押题试卷 电气设备绝缘与接地专项训练
- MOOC 颈肩腰腿痛中医防治-暨南大学 中国大学慕课答案
- 2024年米粉项目实施方案
- 日本商务谈判风格剖析课件
- 餐饮服务公司消防培训制度范本
- 《智能交通概论》 课件 陈岚 任务3、4 辅助出行的出行者信息系统、智能化的公共交通系统
- 顶管顶力计算
- 综合实践活动课程的设计与实施
- 机械制图习题集(第五版)习题解答
- 《影视鉴赏》教学课件 《影视鉴赏》第三章
- 市政工程监理平行检验表(套)
- 四议两公开工作法课件
评论
0/150
提交评论