肾炎的诊断.doc_第1页
肾炎的诊断.doc_第2页
肾炎的诊断.doc_第3页
肾炎的诊断.doc_第4页
肾炎的诊断.doc_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

肾炎的诊断19组 唐少君 袁光辉 代悦一、摘要本文通过对表B.1中已经确诊病例的化验结果进行分析,建立logistic回归模型,列出logistic回归函数:利用MATLAB软件进行求解,得到回归函数中七个回归系数的值,同时利用P检验和F检验验证其合理性。针对问题1,本文提出一种判别方法。选取0.5作为一个分割点,利用MATLAB拟合logistic回归确定回归系数,得到了logistic回归函数 将就诊人员体内各化学元素的含量代入(2)式中,利用MATLAB求出相应的拟合概率的大小,与0.5进行比较:若小于0.5,则表示是患者;若大于或等于0.5,则表示健康。通过数据结果可得,130病例号中满足的共有30个,3160病例号中满足的共有27个,故其判断的正确率为,即其准确性高达95%。针对问题2,利用问题1中的判别方法,得到表中30名就诊人员的健康状况,其中15名为肾炎患者,15名是健康的,具体如下表所示(其中1表示患了胃炎,0表示健康):就诊人员616263646566676869707172737475健康状况110111011011101就诊人员767778798081828384858687888990健康状况100100010100000针对问题3,本文根据问题1和问题2的计算过程中图形的分布可知元素之间呈一定的关系,故采用分布剔除的方法进行计算,经过计算最终确定在检验指标中Zn Cu Fe Ca Mg为主要因素。针对问题4:经过剔除后,利用问题一中的判别方法,得到表中30名就诊人员的健康状况,其中15名为肾炎患者,15名是健康的,具体如下表所示(其中1表示患了胃炎,0表示健康)就诊人员616263646566676869707172737475健康状况110111011001101就诊人员767778798081828384858687888990健康状况110100010100000针对问题5:可以看出,虽然问题2和问题4最终得到的都是15人患肾炎,15人是健康的,即患病率相等,但是这些患肾炎的与健康的人的分布发生了改变:问题2中的71号是肾炎患者,77号是健康的,问题4中与之相反。而这个差异则是由于他们体内Na k 含量的异常引起的。本文该对模型进行了评价,并给出相关建议。关键词:肾炎的诊断 logistic回归 P检验 F检验 corrcoef()二、问题的重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果(其中表B.1、B.2见附录)。我们的问题是:1. 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。三、问题的分析问题1的分析:本问题中,就诊人员的身体健康状况实际上是一个二值响应变量,不妨将患胃炎编码为1,健康编码为0,一个人患了肾炎(=1),健康(=0),而这个响应变量是与人身体内的各种元素的含量息息相关的,要解决这种对响应取二值之一的概率建模,我们使用excel软件6SQ工具箱中的“正态P-P分析图”,(见图1),图形基本符合使用logistic模型,故使用logistic回归方法拟合与此同时进行“F检验”和“p检验”;而后通过拟合logistic回归来响应概率建模并估计(1)式中的参数。图一要用简单的方法判别是患者还是健康人,可以通过引入一个中间的分割点,判断拟合出来的数据与分割点数值的大小关系,进行判定,通过其中满足关系的数据与总数据进行比率,来检验方法正确性的高低。问题2的分析:问题2实际上是问题1中方法的一个应用,通过输入数据进行拟合,按照问题1中的方法判断表B.2中的就诊人员是肾炎病人还是健康人。问题3的分析:要确定哪些指标是影响人们患肾炎的关键,即要找出那些必不可少的因素。将对患胃炎影响很小的所有因素找出并进行剔除即可得到想要的结论,故剔除法是主要的求解思路,通过使用MATLAB软件中的corrcoef()函数计算各元素之间的相关性,然后进行数据处理,确定主要因素,最终得到问题1中模型的一个简化。问题4的分析:问题4的实质是对问题3解出的简化模型的一个检验,判断是否可靠,将数据代入即可。问题5的分析:对(2)(4)的结果进行分析,可以从两个方面考虑:一方面是就诊人员患病与否的分析,通过对B.2中数据的判别,比较两个问题中就诊人员患病情况结果;另一方面是患病概率的分析,通过两个问题结果的患病概率图进行比较。此外,还可以对分析的后的结果给出相关的建议。 四、模型假设(1) 假设题目中所给数据都准确可靠;(2) 假设题目中所给的元素不相互影响;(3) 假设在检查过程中没有错误记在数据;(4) 假设肾炎的发生只与体内这7种元素有关,与其他因素没有关联。五、定义与符号说明:就诊人员体内第中元素的含量(),其中第种元素分别代表;:logistic回归函数中的回归参数();:; :logistic回归函数中当时是患者的概率,六、模型的建立与求解模型I的建立:对于问题1本文建立logistic回归模型。问题要求根据表B.1中提供的就诊人员体内各元素的含量来判断就诊人员是否患有肾炎。据此不妨猜测就诊人员是否患有肾炎与各种元素的含量有关,把被测的7种元素的含量作为7个不同的自变量,就诊人员是否患有肾炎作为因变量,用表示病例号是否得病,记为时的概率,显然,若用条件概率模型:来处理数据,由于线性函数是无界的,因此不能用以对概率建模。为了将概率限定在范围内,可以建立logistic回归函数:显然是关于参数的非线性函数。通过对模型的分析有体内含元素的指标分别为的某病例号是患病者的概率是:体内含元素的指标分别为的某病例号是健康的概率是故:式子两边同时取对数,有:所以将原非线性函数转化为线性回归函数,原问题就转化为求解一线性回归模型。模型的求解:问题1 的求解根据模型的分析,本问题归结为根据表中提供的数据求解线性回归模型:设病例号患肾炎的概率。因为60个数据有30个为0,30个为1,所以,取分界值0.5,令由于我们并不知道就诊者患病的概率的具体值,也不可能通过的数据把这个具体的概率值算出来,于是,为了方便做回归运算,我们取区间的中值,即就诊者患病的回归概率为0.25,不患病的回归概率为0.75。从而表中数据可作如下变化变为:(样表如下)表1ZnCuFeCaMgKNa0.2516615.824.57001121795130.7517921.035.0156022647.9330详表见附录;于是,在Matlab软件包中编程,对进行通常的线性回归:回归结果为:表2 -0.85940.0007-0.03660.00360.00070.00210.0001-0.0007运行程序见附录一.与此同时进行F_检验值15.68540.0000(这个值比较好),与显著性概率相关的p值0.4476,说明变量之间存在线性相关关系。回归方程为: 使用求得的函数回代检验:使用MATLAB软件中的stem()函数作图,图形如下: 其程序代码见附录二 经过图形细化分析可以知道本来健康的病例号38、39、60被误判为病人,即模型整体正确率为95%. 问题2的求解使用问题1中的函数求解,并使用stem()函数作图,如下图:其程序代码见附录三:通过图形可以看出(其中1代表患者,0代表健康者)表3病例号616263646566676869707172737475健康状况110111011011101病例号767778798081828384858687888990健康状况100100010100000即在6190号就诊人员中共有15名为肾炎患者,15名是健康的。问题3的求解:在问题1求解过程中可看出元素之间有一定的关系,在问题1的基础上使用MATLAB中求两个变量之间的相关性函数corrcoef().可以的到就诊人员体内各种元素相关性结果为:表4元素ZnCuFeCaMgKNaZn0.11590.13570.40690.3527-0.3571-0.3224Cu0.11590.55610.70950.79820.01530.2065Fe0.13570.13570.42880.5571-0.03700.1116Ca0.40690.40690.42880.8452-0.1673-0.0645Mg0.35270.79820.55710.8452-0.11870.0933K-0.35710.0153-0.0370-0.1673-0.11870.7150Na-0.32240.20650.1116-0.06450.09330.7150其程序代码见附录四根据相关性及问题1解决过程中的系数关系决定去掉元素K,进行计算。解得回归函数各系数为 :表5 -0.85710.0007-0.03660.00360.00070.0021-0.0006其程序代码见附录五;回归方程为:将前60各病例号的各参数量回代检验得到图形,如下:其程序代码见附录六通过计算:可知病例号12、38、39、60被误判,虽然此时的准确率下降至93.4%,但这样的准确率仍然能够达到要求,可见剔除K是合理的,接着继续根据剩余元素的相关性,及以上求解所得系数剔除Na,计算回归函数的各系数为:表6: -1.26690.0017-0.03920.00360.00070.0017其程序代码见附录七:回归方程为:将前60个病例号的体内各元素量回代检验得到图形为:通过计算:可知病例号32、33、38、60被误判,这时的准确率为93.4%,可见剔除K后再剔除Na是合理的,接着再根据剩余元素的相关性,及以上求解所得系数剔除Ca进行尝试,计算回归函数各系数为:表7: -1.53980.0047-0.02920.00230.0057其程序代码见附录八:回归方程为:使用回代检验:将前60个病例号的体内各元素量回代检验得到图形为:其程序代码见附录九:通过数据分析知剔除K、Na后再剔除Ca的准确性直接降至85%,同时患有肾炎者被判定为无病的概率上升了5倍,从而说明这样的处理是不合理的。经过实验数据可以得到在剔除K、Na后准确率大于90%,然而在这之后再剔除其余元素准确率都低于90%。也就是说在检验中Zn、Cu、Fe、Ca、Mg为主要元素,K、Na为次要因素,可以剔除。问题4的求解:针对本问题是在剔除K、Na两元素后的患病人数:经检验方程为;使用以上函数中的函数求解,并使用stem()函数作图,如下图:对图形进行分析可知:如下将结果(其中1代表患者,0代表健康者)表8;就诊人员616263646566676869707172737475健康状况110111011001101就诊人员767778798081828384858687888990健康状况110100010100000问题五的求解:对比表1和表8我们可以看到:在表1中71号病例不患病而在表8中患病;77号在表1中患病而在表8中不会患病。虽然两次检验得到的患病率相等,但患者人群发生了改变。因为logistic回归函数的回归系数的含义,表示对应的自变量每变化一个单位的改变量,由于在问题2中的结果是考虑到的影响,而问题4中的结果则是剔除两因素后所得,即没用兼顾到病例号体内量的大幅度变化。而通过对6190号病例体内元素含量进行分析有71号体内含量异常之高,而77号体内的含量则较低,正是由于这个原因对于71号病例计算的值由问题2中的大于0.5变为问题4中的小于0.5,对于77号病例计算的值由问题2中的小于0.5变为问题4中的大于0.5。七、模型的评价优点:1 该模型能够清晰地判断出就诊人员是否患有肾炎,同时能够刻画出七种元素对肾炎的影响。2 该模型简单易懂,实用价值强,不仅适用本题,也为其他的统计应用提供了一个模本,值得推广。缺点:本模型没有进行回归诊断,而对Logistic回归来说,不存在这样简单而令人满意的评价参数,所以会对结果产生一定的影响。八、建议由问题5可以看出,Na和K虽然不是关键因素,但是Na和K含量的异常仍然会影响最后的检测结果,故建议医生在进行胃炎的诊断时,可以询问就诊人员平时的食盐量和是否食用了有关K和Na元素的药物,若食盐量过大或服用了相关的药物,则需要检测Na和K两种元素的含量,用来准备判断病情;若没有上述情况发生。则只需检测剩余的五种元素,用来降低检测 成本。 九、参考文献Sampi Chaterjee等 例解回归分析第三版 中国统计出版社 2004年12月张国权 应用概率统计 科学出版社 2003年2月薛定宇等 高等应用数学问题的MATLAB求解 清华大学出版社 2009年10月王济川等 Logistic回归模型 高等教育出版社 2001年十、附录表B.1 确诊病例的化验结果病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.8025.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.530.065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373.0347141628.2327.162510862.4465151506.6321.06271401796391615910.711.761219098.53901711716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.7062993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.3060858.958.91392878.614.69.7042170.81334642990.03.278.1762252.37708523017828.832.499211270.21693121319.136.2222024940.01683217013.929.8128522647.93303316213.219.8152116636.21333420313.090.8154416298.903943516713.114.1227821246.31343616412.918.6299319736.394.53716715.027.0205626064.62373815814.437.0102510144.672.53913322.831.016334011808994015613532267471090228810411698.00308106899.153.02894224717.38.65255424177.9373431668.1062.81233252134649442096.4386.9215728874.0219451826.4961.738704321433674623515.623.4180616668.81884717319.117.0249729565.82874815119.764.220314031828744919165.435.053613921376885022324.486.0360335397.74795122120.115531723681507395221725.028.223433731104945316422.235.52212281153549541738.9936.016242161032575520218.617.7378522531.067.35618217.324.8307324650.71095721124.017.0383642873.53515824621.593.2211235471.71955916416.138.0213515264.32406017921.035.0156022647.9330表B.2 就诊人员的化验结果病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.5542177184427631520.8012.513321761286466485.51.703.9950362.3238762.6651440.7015.154779.771.0218.56685.71.094.279017045.8257.9671440.309.1141755249.5141.5681704.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373.0347.57421319.136.2222024962.0465.87519220.123.8160615640.01687617110.530.567214547.0330.57716213.219.8152116636.21337820313.090.8154416298.9394.57916420.128.9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.88216715.027.0205626044.872.08315814.437.01025101180899.58413322.831.31633401228289851698.030.8106899.153.08178624717.38.65255424177.5373.5871853.9031.31211190134649.8882096.4386.9215728874.0219.8891826.4961.73870432143367.59023515.623.4180616668.9188附录一ZnCuFeCaMgKNa0.2516615.824.57001121795130.2518515.731.57011251844270.251939.8025.95411631286420.2515914.239.789699.22397260.2522616.223.860615270.32180.251719.299.2930718745.52570.2520113.326.655110149.41410.2514714.530.06591021546800.251728.857.8655175.798.43180.2515611.532.56391071035520.2513215.917.757892.4131413720.2518211.311.37671112646720.251869.2637.195823373.03470.251628.2327.162510862.44650.251506.6321.06271401796390.2515910.711.761219098.53900.2511716.17.0498895.51365720.2518110.14.0414371841015420.2514620.723.8123212815010920.2542.310.39.7062993.74398880.2528.212.453.137044.14548520.2515413.853.36211051607230.2517912.217.9113915045.22180.2513.53.3616.813532.651.61820.251755.8424.980712355.61260.2511315.847.362653.61686270.2550.511.66.3060858.958.91390.2578.614.69.7042170.81334640.2590.03.278.1762252.37708520.2517828.832.499211270.21690.7521319.136.2222024940.01680.7517013.929.8128522647.93300.7516213.219.8152116636.21330.7520313.090.8154416298.903940.7516713.114.1227821246.31340.7516412.918.6299319736.394.50.7516715.027.0205626064.62370.7515814.437.0102510144.672.50.7513322.831.016334011808990.75156135322674710902288100.751698.00308106899.153.02890.7524717.38.65255424177.93730.751668.1062.812332521346490.752096.4386.9215728874.02190.751826.4961.738704321433670.7523515.623.4180616668.81880.7517319.117.0249729565.82870.7515119.764.220314031828740.7519165.435.053613921376880.7522324.486.0360335397.74790.7522120.115531723681507390.7521725.028.223433731104940.7516422.235.522122811535490.751738.9936.016242161032570.7520218.617.7378522531.067.30.7518217.324.8307324650.71090.7521124.017.0383642873.53510.7524621.593.2211235471.71950.7516416.138.0213515264.32400.7517921.035.0156022647.9330附录二A= -0.8594 0.0007 -0.0366 0.0036 0.0007 0.0021 0.0001 -0.0007;B= 1 166 15.8 24.5 700 112 179 513 ;1 185 15.7 31.5 701 125 184 427 ;1 193 9.8 25.9 541 163 128 642 ;1 159 14.2 39.7 896 99.2 239 726 ;1 226 16.2 23.8 606 152 70.3 218 ;1 171 9.29 9.29 307 187 45.5 257 ;1 201 13.3 26.6 551 101 49.4 141 ;1 147 14.5 30 659 102 154 680 ;1 172 8.85 7.86 551 75.7 98.4 318 ;1 156 11.5 32.5 639 107 103 552 ;1 132 15.9 17.7 578 92.4 1314 1372 ;1 182 11.3 11.3 767 111 264 672 ;1 186 9.26 37.1 958 233 73 347 ;1 162 8.23 27.1 625 108 62.4 465 ;1 150 6.63 21 627 140 179 639 ;1 159 10.7 11.7 612 190 98.5 390 ;1 117 16.1 7.04 988 95.5 136 572 ;1 181 10.1 4.04 1437 184 101 542 ;1 146 20.7 23.8 1232 128 150 1092 ;1 42.3 10.3 9.7 629 93.7 439 888 ;1 28.2 12.4 53.1 370 44.1 454 852 ;1 154 13.8 53.3 621 105 160 723 ;1 179 12.2 17.9 1139 150 45.2 218 ;1 13.5 3.36 16.8 135 32.6 51.6 182 ;1 175 5.84 24.9 807 123 55.6 126 ;1 113 15.8 47.3 626 53.6 168 627 ;1 50.5 11.6 6.3 608 58.9 58.9 139 ;1 78.6 14.6 9.7 421 70.8 133 464 ;1 90 3.27 8.17 622 52.3 770 852 ;1 178 28.8 32.4 992 112 70.2 169 ;1 213 19.1 36.2 2220 249 40 168 ;1 170 13.9 29.8 1285 226 47.9 330 ;1 162 13.2 19.8 1521 166 36.2 133 ;1 203 13 90.8 1544 162 98.9 394 ;1 167 13.1 14.1 2278 212 46.3 134 ;1 164 12.9 18.6 2993 197 36.3 94.5 ;1 167 15 27 2056 260 64.6 237 ;1 158 14.4 37 1025 101 44.6 72.5 ;1 133 22.8 31 1633 401 180 899 ;1 156 135 322 6747 1090 228 810 ;1 169 8 308 1068 99.1 53 289 ;1 247 17.3 8.65 2554 241 77.9 373 ;1 166 8.1 62.8 1233 252 134 649 ;1 209 6.43 86.9 2157 288 74 219 ;1 182 6.49 61.7 3870 432 143 367 ;1 235 15.6 23.4 1806 166 68.8 188 ;1 173 19.1 17 2497 295 65.8 287 ;1 151 19.7 64.2 2031 403 182 874 ;1 191 65.4 35 5361 392 137 688 ;1 223 24.4 86 3603 353 97.7 479 ;1 221 20.1 155 3172 368 150 739 ;1 217 25 28.2 2343 373 110 494 ;1 164 22.2 35.5 2212 281 153 549 ;1 173 8.99 36 1624 216 103 257 ;1 202 18.6 17.7 3785 225 31 67.3 ;1 182 17.3 24.8 3073 246 50.7 109 ;1 211 24 17 3836 428 73.5 351 ;1 246 21.5 93.2 2112 354 71.7 195 ;1 164 16.1 38 2135 152 64.3 240 ;1 179 21 35 1560 226 47.9 330 ;C=B*A;f=exp(C)./(1+exp(C);stem(f);hold on,plot(0,60,0.5,0.5);附录三A= -0.8594 0.0007 -0.0366 0.0036 0.0007 0.0021 0.0001 -0.0007;B= 1 58.2 5.42 29.7 323 138 179 5131 106 1.87 40.5 542 177 184 4271 152 0.8 12.5 1332 176 128 6461 85.5 1.7 3.99 503 62.3 238 762.61 144 0.7 15.1 547 79.7 71 218.51 85.7 1.09 4.2 790 170 45.8 257.91 144 0.3 9.11 417 552 49.5 141.51 170 4.16 9.32 943 260 155 680.81 176 0.57 27.3 318 133 99.4 318.81 192 7.06 32.9 1969 343 103 5531 188 8.28 22.6 1208 231 1314 13721 153 5.87 34.8 328 163 264 672.51 143 2.84 15.7 265 123 73 347.51 213 19.1 36.2 2220 249 62 465.81 192 20.1 23.8 1606 156 40 1681 171 10.5 30.5 672 145 47 330.51 162 13.2 19.8 1521 166 36.2 1331 203 13 90.8 1544 162 98.9 394.51 164 20.1 28.9 1062 161 47.3 134.51 167 13.1 14.1 2278 212 36.5 96.51 164 12.9 18.6 2993 197 65.5 237.81 167 15 27 2056 260 44.8 721 158 14.4 37 1025 101 180 899.51 133 22.8 31.3 1633 401 228 2891 169 8 30.8 1068 99.1 53 8171 247 17.3 8.65 2554 241 77.5 373.51 185 3.9 31.3 1211 190 134 649.81 209 6.43 86.9 2157 288 74 219.81 182 6.49 61.7 3870 432 143

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论