典型案例(杨).doc_第1页
典型案例(杨).doc_第2页
典型案例(杨).doc_第3页
典型案例(杨).doc_第4页
典型案例(杨).doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10.3肾炎诊断问题分析问题提出人们到医院就诊时,通常要检测一些指标来协助医生诊断。我们判断人员是否患肾炎是通过分析人体内各种元素含量来确定的。对于就诊人员说而言不希望自己的病情被误判,所以我们应该确定精确的检测方法。题目所给数据是60位已经诊断的病例号的体内元素含量,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。另外还有61-90号为待检验的就诊患者。需要解决的问题有:问题一:根据表B.1中的数据,提出一种或多种简便的判别方法,判别就诊人员是属于患者或健康人,并检验你提出方法的正确性。问题二:按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题三:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主因素,以便减少化验的指标。问题四:根据3的结果,重复2的工作。问题五:对2和4的结果作进一步的分析。表B.1 确诊病例的化验结果病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.8025.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.530.065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373.0347141628.2327.162510862.4465151506.6321.06271401796391615910.711.761219098.53901711716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.7062993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.3060858.958.91392878.614.69.7042170.81334642990.03.278.1762252.37708523017828.832.499211270.21693121319.136.2222024940.01683217013.929.8128522647.93303316213.219.8152116636.21333420313.090.8154416298.903943516713.114.1227821246.31343616412.918.6299319736.394.53716715.027.0205626064.62373815814.437.0102510144.672.53913322.831.016334011808994015613532267471090228810411698.00308106899.153.02894224717.38.65255424177.9373431668.1062.81233252134649442096.4386.9215728874.0219451826.4961.738704321433674623515.623.4180616668.81884717319.117.0249729565.82874815119.764.220314031828744919165.435.053613921376885022324.486.0360335397.74795122120.115531723681507395221725.028.223433731104945316422.235.52212281153549541738.9936.016242161032575520218.617.7378522531.067.35618217.324.8307324650.71095721124.017.0383642873.53515824621.593.2211235471.71955916416.138.0213515264.32406017921.035.0156022647.9330表B.2 就诊人员的化验结果病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.5542177184427631520.8012.513321761286466485.51.703.9950362.3238762.6651440.7015.154779.771.0218.56685.71.094.279017045.8257.9671440.309.1141755249.5141.5681704.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373.0347.57421319.136.2222024962.0465.87519220.123.8160615640.01687617110.530.567214547.0330.57716213.219.8152116636.21337820313.090.8154416298.9394.57916420.128.9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.88216715.027.0205626044.872.08315814.437.01025101180899.58413322.831.31633401228289851698.030.8106899.153.08178624717.38.65255424177.5373.5871853.9031.31211190134649.8882096.4386.9215728874.0219.8891826.4961.73870432143367.59023515.623.4180616668.9188问题分析此题研究的是如何判断就诊人员是否患有肾炎。在医院就诊时,一般情况下医生是通过就诊人员的尿液的化验结果来判断该就诊人员是否患有肾炎。本题中就是通过分析病人的尿液中各元素的含量来判断的,我们要对这些数据进行分析处理,寻求好的判别方法,判断前来就诊的人员是否患有肾炎。针对问题一,题目中已经给出30个肾炎患者与30个健康者体内7种元素的含量,现在所要做的是,如何根据这些数据提出一种合理的诊断方案。通过分析,我们确定两种比较好的方法来判别病例号是否患有肾炎。方法一:采用改进后的加权马氏距离判别法,即在马氏距离判别法的基础上,对每种不同的指标确定合适的权重从而提高准确度的方法,对实际问题进行判别。方法二:将数据划分为两类,分别用两个集合表示。一类为肾炎患者,一类为健康人体,使用模糊论中的模糊模式识别的方法建立模型,达到判别效果。针对问题二,表B.2中给出了30名就诊人员体内各种元素的含量,我们分别应用问题一中建立的加权马氏判别模型和模糊模式识别模型进行判断,然后将两种判断结果进行比较。得出6190号就诊者的诊断结果。针对问题三,根据表B.1的数据,我们要得到哪些元素是该化验结果的关键指标,即哪些元素在诊断结果中起关键作用。我们重新建立了一个Fisher线性判别模型,求出Fisher系数,按照Fisher模型的理念,依次剔除Fisher系数小的元素,用Fisher判别法对题中给出的160号就诊者进行检验,得出正确率。根据正确率的改变,确定出起关键作用的元素。针对问题四,在问题三中我们已经剔除了对肾炎诊断结果起次要作用的元素,选出在诊断中起关键作用的元素。然后我们再运用问题一的加权马氏改进法和模糊模式识别,对6190号的就诊人员进行判别是否患有肾炎。针对问题五,通过把问题二和问题四中分别运用加权马氏改进法和模糊识别法进行判断的结果进行比较、分析,剔除了次要元素后,61-90号就诊者患肾炎的人员是否发生变化。问题假设(1)假设题目所给的数据合理正确(2)假设肾炎患者体内各种元素的含量受其他疾病的影响较小;(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;(4)假设用于判断肾炎患者的七种元素,不受人体内其他元素或化合物的影响。符号说明A1表示肾炎患者的模糊集合A2表示健康人体的模糊集合A1(xi)表示样本变量xi与A1的隶属度A2(xi)表示样本变量xi与A2的隶属度xii=(1,27)分别代表7种不同元素含量(xi, A1)表示xi与A1的格贴近度(xi, A2)表示xi与A2的格贴近度表示与的内积表示与的外积 样本样本X到A1的距离 样本X到A2的距离u130个肾炎病人样本各元素的均值向量u230个健康人样本各元素的均值向量y0 Fisher模型中求得的临界值 肾炎患者这类样品的“重心”健康这类样品的“重心” 肾炎患者样本各个元素的均值向量 健康样本各个元素的均值向量模型建立与求解问题一的求解针对问题一,要求我们采用一种或多种方法对前来就诊的人员做初步的判断,我们运用加权马氏判别法(模型一)和模糊识别模型(模型二)寻求了两种判别方法。判别方法一模型一的分析对于本题,我们把病人体内含有的7种元素作为化验结果的样本检测的指标,把总体分为肾炎病人类和健康人类。60个人的化验结果是。我们定义为样本到的距离,为样本到样本的距离,通过比较与的大小来判别样品应该归属于类还是类。样品到类和类的马氏距离分别为: (10.3.1) (10.3.2)其中,,分别为总体和的均值和协方差。在实际问题中,这些指标往往在判断样本属于时,所起的作用不尽相同,其重要性存在差异。因此,马氏距离夸大了一些微小指标的作用。如果不对指标的重要性进行区别,在判定时,可能造成较大的误判,为了减小这种影响,在马氏距离的基础上,我们需要对重要指标加以区分,因此,我们增加了一个权重,构造了加权马氏距离判别法。加权马氏距离判别法的原理:马氏距离判别法是用待判别样本 到各总体的距离远近作为测量尺度来判别其归属的一种直观判别方法。为了提高这种方法对实际问题进行判别时的准确程度,在马氏距离判别法的基础上,对不同的指标加入不同的权重,合理的分配各种指标对问题的影响,这就是加权马氏距离判别法。模型一的建立对原始指标数据的标准化 我们采集7维随机向量是题中给出的60个人的化验结果,607,所以我们构造样本阵,对样本进行如下标准化变换: (10.3.3)其中,从而可以计算出.求标准化阵的相关系数矩阵加权马氏距离判别法对马氏距离判别法的改进主要取决于权重的选取,权重选取是否得当影响加权马氏距离判别法的准确度。在该实际问题中我们确定权重,其中。我们可以解这个样本相关矩阵的特征方程,得到7个特征根。确定加权的马氏距离根据我们所求得的权重,可以确定加权后的马氏距离为: (10.3.4) (10.3.5)式中分别是和的均值和协方差。确定判别函数在马氏距离判别法中,我们一般通过比较与的大小来判别样品应该归属于类还是类。为了便于对结果进行直观的观察和统计,我们将判别函数定义为与的差值。那么我们确定的判别函数为:= (10.3.6)说明样本到类的距离大于到类的距离所以应该属于类即肾炎患者;说明样本到类的距离小于到类的距离所以应该属于类即健康人。运用模型一进行检验根据上述建立的加权马氏距离判别法,我们运用matlab软件(代码见附录二)对题目中给出的病例号为160的就诊人员进行检验,检验结果整理如下表1:表1:运用加权马氏距离判别法对160号进行检验的结果病例号实际检验结果130肾炎患者18,19号误判为健康3160健康38,41号误判为肾炎模型一的检验分析由表(1)中的检验结果可以看到在给出的60个病例号中,我们将18,19,38和41号判断错误,也就是说我们所建模型一对于该实际问题的检验准确度为:既然我们所建立的模型有这么高的准确度,为什么这四个病例号会误判呢?我们对检验结果进行分析。运用excel分别求出130号和3160号七种元素的平均值,并与18,19,38和41号就诊人员体内元素含量进行比较,见图(10-10)和图(10-11)。图(10-10):130号体内各元素含量与均值比较 图(10-11):3160号体内各元素含量与均值比较由图我们发现, 19号体内元素的含量为20.7接近健康人的体内含量,但远高于肾炎病人体内的含量;41号体内元素的含量为8.00肾炎患者体内含量很接近,但远低于健康人体内的含量;18号体内元素含量太低,而41号体元素含量太高;这四个人体内元素和元素的含量都很异常,按照均值推断,正常情况应该是患者体内这两种元素的含量远远低于健康人体内的含量,但事实刚好相反。由此我们可以推断这七种元素对肾炎患者的诊断有主次区别,对于这四位误判的检验分析可以得出,元素和元素可能起次要作用。判别方法二模型二的分析先用excel对表B.1所给数据进行处理,处理结果见下表2:表2:1到60号的数据分析130平均置信区间3160平均置信区间Zn143.1033123.0587,163.1479Zn186.6175.51,197.68Cu12.3343310.0448,14.22Cu21.9236713.0534,30.7938Fe23.0666717.9325,28.201Fe62.0116733.7115,90.3078Ca698.1667597.27,799.0594Ca2511.1332036.30,2985.95Mg113.393395.90,130.885Mg295.1367288.8,361.4K201.1333104.128,298.137K90.3771.2074,109.5325Na526.8333414.5935,639.0731Na367.21276.08,458.411假设(患者体内各元素含量的均值的集合),(健康者体内各元素含量的均值的集合)为该方法中的两个标准模式。最大隶属原则:原则1:设为给定的论域上的个模糊模式,为一个待识别对象,若,则认为优先归属于模糊模式。原则2:设为给定论域上的一个模糊模式,为U中的个待识别对象,若,则认为优先归属于模糊模式。择近原则:设论域上有个模糊集构成一个标准模型库为待识别的模型。若存在,使得 (10.3.7)则称与最贴近,或者说把归并到类。我们根据模糊识别法中的择近原则来判断待识别的模糊集与标准模型库哪个最贴近,即求的值。如果,则应归并到模式,即该就诊人员为肾炎患者。,则应归于模式,即该就诊人员为健康人员。其中表示两个模糊集之间的贴近程度。贴近度:由模糊集的性质可以知道,单独使用内积或外积还不能完全刻划两个模糊集之间的贴近程度,模糊集的内积与外积都只能部分地表现两个模糊集的靠近程度。由模糊集的内积与外积的性质可知,内积越大,模糊集越靠近;外积越小,模糊集也越靠近。因此,可用二者相结合的“贴近度”来刻划两个模糊集的贴近程度较为适合。 设是论域上的模糊子集,则称 (10.3.8)为与的贴近度。可见,当越大时,越大,越小,与越贴近。其中:表示两个模糊集的内积;表示两个模糊集的外积。模型二的建立通过上述分析我们设待检查人员的各项指标的集合为,即集合为待识别的模糊集,(患者体内各元素含量的均值的集合),(健康者体内各元素含量的均值的集合)为该方法中的两个标准模式。那么只需要分别求出,然后比较的大小,如果,那么待识别的模糊集贴近于,可以判断为该待测人员为肾炎患者;如果,那么待识别的模糊集贴近于,可以判断为该待测人员是健康的。根据最大隶属度原则,设为某就诊人员的一组指标的化验结果。确定模糊模式识别模型为: (10.3.9)运用模型二进行检验:将题目中给出的60个病例号带入到模糊模式识别模型中,用matlab7.0.1软件对其进行检验,将检验结果整理,得到如下表3:(其中用1表示,用0表示)。 表3:模糊模式识别法对160号的检验结果病例号实际检验结果130号肾炎患者17,18,19,23号误判为健康3160号健康没有误判模型二的检验分析题中给出的病例号中,130号为肾炎患者,3160号为健康的。由整理得到的表格知:我们运用所建立的模型,对给出的60个病例号误判了4个,即将17号,18号,19号,以及23号肾炎患者误判为健康人。所以该模型的准确度为.那么为什么我们所建立的模型会误判这四个病例号呢?我们分别求出130号和3160号体内各元素的平均含量,将这四个误判的就诊者体内元素含量与平均值进行比较。这四个病例号体内的七种元素含量与平均值的比较图见图(10-12):图(10-12):误判者体内各元素含量与均值比较由图(10-12)可以看出对于那些与肾炎患者体内相应元素差距很大,但是跟健康人体内含量相近的元素,很可能是导致误判的原因。比如:19号体内元素的含量为20.7接近健康人的体内含量,但远高于肾炎病人体内的含量;这四个患者体内元素的含量都与正常值偏离较远,但接近肾炎患者体内该元素的平均含量;并且17,18,19号体内元素的含量都远高于健康人的体内含量。由此我们推断这些元素在对肾炎患者的判别时,存在主次,且,对结果的影响较大。问题二的求解用两种模型进行判别问题二要求我们运用问题一中提出的判别方法,对表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题一中我们提出了两种判别方法,所以我们分别用这两种方法对这30个病历号进行检验。我们先用模型一中的加权马氏距离判别法进行判别,运用matlab软件(代码详见附录四)将这30个病例号得化验结果数据带入,得到结果整理如下表4:表4:加权马氏距离判别法的检验结果患病61,62,64,65,66,67,68,69,72,73,76,79,83,8514个再用模型二中的模糊模式识别法进行判别,运用matlab软件(代码详见附录五)将这30个病例号得化验结果数据带入,得到结果整理如下表(5):表5:模糊模式识别判别法的检验结果患病61,62,64,65,66,67,68,69,72,73,7611个两种模型判别结果的比较由表4和表5我们可以看到,这两种判别方法的判别结果基本相同,方法一和方法二的判别结果都显示,病例号为61,62,64,65,66,67,68,69,72,73,76的11个就诊者都患有肾炎,只是在对79,83和85号得判断上有所不同,所以这三个就诊者还要通过进一步的检查来确诊他们是否患有肾炎。问题三的求解针对问题三,要根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,我们建立了模型三。模型三的分析在问题中,我们将肾炎患者和健康人分为两类,每一类有30个样本,每个样本的指标是7个,设待测指标为:,我们要判别应该属于哪一类。考虑用Fisher判别法求解该问题,在此引入Fisher判别法的基本思想。Fisher判别法的基本思想:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使两类分类效果为最佳。由此,借助方差分析的思想可以构建一个Fisher判别函数:,那么我们只需确定这个判别函数的系数就可以得出判别式,对于任意一个样本,把相应的7个指标带入我们的判别式,求出值,与判别式的临界值进行比较,就可以判别他属于哪一个类型。模型三的建立确定系数时,应基于以下两个原理:原理一:肾炎病人和健康人这两类之间的区别最大原理二:肾炎病人和肾炎病人,健康人和健康人内部之间的区别最小根据这两个原理我们来推导fisher判别式,我们已经确定了fisher判别式的形式是,我们把1-30号编码的肾炎病人的样品观测值,带入到判别式中,可以得到: (10.3.10)再把31-60号编码的健康人的样本观测值,带入到判别式中,相应的得到: (10.3.11)对于1-30号编码的肾炎病人的样本观测值,将左边的式子累加,在除以样品的个数,得到肾炎患者这类样品的“重心”: (10.3.12)同理,可以得到健康人这类样品的“重心”: (10.3.13)其中,我们在确定了判别式的值之后,还要与相应的判别式的临界值进行比较,所以我们将肾炎患者和健康人两个总体的几何中心作为判别式的临界值: (10.3.14)基于fisher判别法的基本思想,为了使判别函数能够很好地区别来自不同总体的样品,自然希望:(1)来自不同总体的两个平均值,相差越大越好;(2)要求它们的离差平方和越小越好,同样也要求越小越好。那么我们得到一个总的约束: (10.3.15)并且希望越大越好,记为两组之间的离差,为两组内的离差,那么。我们希望越大越好,这样一来可以对进行多次求导,当导数值等于0时,可以达到最大值,经化简整理得: (10.3.16)此时的最大值对应然后分别用含的表达式将和表示出来。最终得到方程组:其中:即 (10.3.17)写成矩阵形式为: 从而得到费希尔系数矩阵:,其中,.确定Fisher判别函数将得到的系数矩阵带入Fisher判别函数中,得到Fisher判别函数为: (10.3.18)模型三的求解根据上述运用Fisher判别法建立的模型,我们在MATLAB中编程,求解出Fisher系数为:.把新样本的值带入判别函数,设是零界判定点。那么当时,若,则,若,则;当时,若,则,若,则.对题目中所给数据进行处理,计算可以得到各个元素对结果总影响的大小,见下表6:表6:每种元素对总结果的影响大小ZnCuFeCaMgKNa-0.01140.0592-0.0143-0.1002-0.0406-0.00200.0281根据上表6,我们对各项指标对结果影响进行排序为.按照这个顺序依次对进行剔除。以剔除元素为例:剔除元素后,用剩余6种元素对160号就诊人员进行检验。然后再剔除,重复此过程。我们将剔除相应元素的后的检验结果整理如下表7。表7:逐步剔除各个元素后检验结果的变化临界值准确率160号的检验结果剔除前剔除元素-0.081193.3%130无误判 3160误判4个K-0.80893.3%130无误判 3160误判4个K,Zn-0.70693.3%130无误判 3160误判4个K,Zn,Fe-0.064593.3%130误判1人 3160误判3个K,Zn,Fe,Na-0.83890.0%130误判1人 3160误判5个K,Zn,Fe,Na,Mg-0.72083.3%130误判1人 3160误判6个K,Zn,Fe,Na,Mg,Cu-0.59483.3%130无误判 3160误判7个从表7中我们可以看出当剔除三种元素后,准确率仍然可以达到93.33%,但剔除这四种元素后,准确度下降到90.0%.所以我们认为:,是影响人们患肾炎的主要因素。模型三的结果分析在对模型一和模型二的检验结果进行分析的时候,我们分别对误判的四个人体内七种元素的含量进行了比较分析,并且初步判断对结果的影响比对结果的影响要大。而由模型三的求解可以知道各元素对结果影响顺序为:,恰好与模型一和模型二中的检验分析吻合,即三个模型相互验证了自身都具有较高的准确性。问题四的求解运用两种模型进行判别问题四要求我们将问题三中剔除的元素不做为检验指标,只把,做为检验指标,再用问题一中提出的方法进行检验。我们先用加权马氏距离判别法进行判别,运用matlab软件将这30个病例号得化验结果数据带入,得到结果整理如下表8:表8:马氏加权判别模型的判别结果患病61,62,64,65,66,67,68,69,72,73,76,79,83,8514个健康63,70,71,74,75,77,78,80,81,82,84,86,87,88, 89,9016个再用模糊模式识别法法进行判别,运用matlab软件将这30个病例号得化验结果数据带入,得到结果整理如下表9:表(9):模糊模式识别模型的判别结果患病61,62,64,65,66,67,68,69,72,73,7611个健康63,70,71,74,75,77,78,79,80,81,82,83,84,85,86,87,88,89,9019个两种模型判别结果的比较由表8和表9我们可以看到,这两种判别方法的判别结果基本相同,方法一和方法二的判别结果都显示,病例号为61,62,64,65,66,67,68,69,72,73,76的11个就诊者都患有肾炎,只是在对79,83和85号得判断上有所不同,所以我们剔除的四种元素具有一定的准确性,但是这三个就诊者还要通过进一步的检查来确诊他们是否患有肾炎。问题五的求解我们将相同方法对问题二和问题四的求解结果进行对比,对比结果如下表10:表10:问题二和问题四的结果对比加权马氏判别问题261,62,64,65,66,67,68,69,72,73,76,79,83,85加权马氏判别问题461,62,64,65,66,67,68,69,72,73,76,79,83,85模糊模式识别模型261,62,64,65,66,67,68,69,72,73,76模糊模式识别模型461,62,64,65,66,67,68,69,72,73,76 横向对比:运用加权马氏距离判别法对问题二和问题四求解得到的结果一样,运用模糊模式识别法建立的模型对问题二和问题四求解得到的结果也一样。这在一定程度上说明我们在问题三中剔除的四种元素的确是对判断结果影响较小的因素,模型具有较高的准确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论