关于肾炎诊断的数据分析方法.doc_第1页
关于肾炎诊断的数据分析方法.doc_第2页
关于肾炎诊断的数据分析方法.doc_第3页
关于肾炎诊断的数据分析方法.doc_第4页
关于肾炎诊断的数据分析方法.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于肾炎诊断的数据分析方法摘要肾炎是一种比较常见的疾病,早期症状常不明显,容易被忽略,发展到晚期可引起肾功能衰竭,严重威胁病人的健康和生命,是引起肾功能衰竭最常见的原因,必须早发现早治疗。本文就肾炎病人和健康人的化验结果进行处理,是否患有肾炎与就诊者体内微量元素的含量有关,科学的判定方法可以及时对就诊者的身体情况给予正确的判定.本文根据附件所给数据,就此分析就诊者体内Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素含量,说明影响肾炎的主要元素。并由此建立模型确定元素的影响程度。最后评价模型,分析如何更实际的判断是否患有肾炎。对于问题1,我们采用Logistic回归方程,求出7中元素在对人体中是否患有肾炎时健康概率。分析模型计算出其健康概率,再与概率值0.5 比较,即可以判断就诊者是否患有肾炎.若p0.5,则表明就诊者患有肾炎,否则,就表明就诊者健康. 对于问题2,我们采用马氏距离判别法是将表B.1中的结果分为肾炎病人A组和健康人B组,化验结果是一个维的样品,这里定义为样品c到A组、B组的距离,这样通过比较两值的大小就可以判断样品c是属于A组还是B组;样品c到A组和B组的马氏距离分别为:其中,分别为总体A和B的均值和协方差。则判别函数为:当时,样品c靠近A,c属于A;当时,样品c靠近B,c属于B。通过此法和MATLAB软件等相关数学工具对患者和健康者的Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素含量进行计算,然后与1中两种方法进行比较,然后得出比较合理的判断方法。对于问题3 EXCEL制图软件结合所给数据编出作图程序绘出7中微量元素对是否患有肾炎的分布散点图,观察图像并与(1)和(2)的计算结果比较,并较精确地得出影响肾炎的关键或主要元素,并得出最简洁的检测方案。对于问题4,重复上述工作,并进一步得出更为精确的指标及检验方法。对于问题5 ,通过对上述问题的优缺点统计分析,我们通过收集必要的信息对上述模型进行修正,从而更好地研究出对一个人是否患肾炎时微量元素含量的定标检测法。关键词:EXCE制图软件Logistic回归方程 马氏距离判别法 MATLAB软件 统计分析一、 问题重述1.1问题背景人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确定为健康人的结果。表B.2是就诊人员的化验结果。表B.1 确诊病例的化验结果病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.8025.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.530.065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373.0347141628.2327.162510862.4465151506.6321.06271401796391615910.711.761219098.53901711716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.7062993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.3060858.958.91392878.614.69.7042170.81334642990.03.278.1762252.37708523017828.832.499211270.21693121319.136.2222024940.01683217013.929.8128522647.93303316213.219.8152116636.21333420313.090.8154416298.903943516713.114.1227821246.31343616412.918.6299319736.394.53716715.027.0205626064.62373815814.437.0102510144.672.53913322.831.016334011808994015613532267471090228810411698.00308106899.153.02894224717.38.65255424177.9373431668.1062.81233252134649442096.4386.9215728874.0219451826.4961.738704321433674623515.623.4180616668.81884717319.117.0249729565.82874815119.764.220314031828744919165.435.053613921376885022324.486.0360335397.74795122120.115531723681507395221725.028.223433731104945316422.235.52212281153549541738.9936.016242161032575520218.617.7378522531.067.35618217.324.8307324650.71095721124.017.0383642873.53515824621.593.2211235471.71955916416.138.0213515264.32406017921.035.0156022647.9330表B.2 就诊人员的化验结果病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.5542177184427631520.8012.513321761286466485.51.703.9950362.3238762.6651440.7015.154779.771.0218.56685.71.094.279017045.8257.9671440.309.1141755249.5141.5681704.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373.0347.57421319.136.2222024962.0465.87519220.123.8160615640.01687617110.530.567214547.0330.57716213.219.8152116636.21337820313.090.8154416298.9394.57916420.128.9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.88216715.027.0205626044.872.08315814.437.01025101180899.58413322.831.31633401228289851698.030.8106899.153.08178624717.38.65255424177.5373.5871853.9031.31211190134649.8882096.4386.9215728874.0219.8891826.4961.73870432143367.59023515.623.4180616668.91881.2 目标任务1. 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。 二、问题分析 对题中数据进行初步分析,不难发现,无论肾炎患者还是健康人,就不同的人体内相同的元素而言,其含量都是随机的在某个值的周围上下变动,并使得肾炎患者和健康人之间的元素差别没有明显的差异现象,有些元素患者与健康扔胡含量要一样的,就像23号患者和60号健康人体内的Zn元素相同,都是179,可见,单就一种元素分析是不行的;另一方面,就相同人体内不同的元素而言,由于各种元素同处于人体这个有机整体,它们相互依存,相互制约,即客观上存在一定的联系,却又有明显的不确定性,就像他们胡含量要王权不同的。所以只要能寻找隐藏在随机性后面的统一性,确定它们的关系,我们相信问题是一定可以得到解决的。 由上述分析可知,本文的首要任务是对表B.1中的数据进行处理,由于数据量大,可知属于统计分析问题。处理的关键是对表B.1(肾炎病人(实验组);健康人(对照组)中的数据进行总体比较,从中寻找出一种或多种简便的判别方法并用此法对表B.2中的就诊人员进行确诊。在减少化验指标时,其关键又要确定哪些指标是影响人们患肾炎的关键或主要因素,进而必须确定两组(实验组和对照组)中各元素的显著性区别。最后对结果进行分析,相信一定会得出正确的元素含量高低的。 三、模型假设(1)假设表B.1给出的数据完全正确,没有误诊并且在化验过程中没有任何错误。(2)假设通过人体内的7种元素的含量可以判定是否患有肾炎;(3)假设表B.2的化验结果完全正确,在化验过程中没有出现错误和较大的误差;(4)假设病人的化验数据对于我们解决分析这一个问题数据是足够的,不存在因为数 据不足而引起的分析有较大偏差的问题;(5)假设对于确诊是不是肾炎这一问题,题目中所给出的七种元素已经足够了,这七种以外的其他元素不会对肾炎的判别有影响;(6)假设只有肾炎和非肾炎的区别,其他疾病不会对判别结果产生影响;(7)假设各种元素对于判别是否是肾炎的影响是相互独立的;(8)假设人处于健康状态时,体内各种元素的百分比含量是相对稳定的。 四、符号定义与说明D( c , A) 被检验组到正常组的距离D(c , B ) 被检测组到患者组的距离 被检测者中第j中元素的含量 表示求和表示健康者中某种元素的平均值 表示患者中某种元素的平均值表示第种元素表示对应元素回归系数P 参照概率 五、模型建立与求解5.1 对问题(1)的求解5.1.1 线性回归方程求解法:对于问题(1),首先,我们居于表B.1数据,采用某医院化验的 30 名健康人和30 名肾炎患者(见附录1),将选取的样本40 人(健康人1-20 号,患者31-50 号),将样本40 人7 种元素的含量直接使用Matlab进行线性拟合,求出相应的回归系数如下表所示。回归系数回归系数估计值回归系数置信区间0.6617 -0.0885 1.41190.0006 -0.0030 0.00430.01690.0065 0.0273-0.0017 -0.0038 0.0003-0.0003-0.0005 -0.0002-0.0007 -0.0022 0.0008-0.0002 -0.0009 0.00060.0004 -0.0002 0.0011 图5.1.11 由以上数据得回归方程为:图5.1.111 剔除上述第29、30、35三组数据后得新的回归系数及回归方程为:回归系数回归系数估计值回归系数置信区间0.5978 -0.0500 1.24550.0018 -0.0016 0.0051 0.0141-0.0035 0.0317 -0.0051 -0.0102 0.0001 -0.0003 -0.0006 -0.0001 -0.0011 -0.0031 0.0009 -0.0005 -0.0012 0.0002 0.00080.0002 0.0014 图5.1.12 修改后得回归方程为:图5.1.121将表B.1中病历号为2130和5160的数据代入上述回归方程得:病历号21222324252627282930P0.847680.994350.645830.627230.563750.953590.654690.996190.816710.83834是否患病否否否否否否否否否否病历号51525354555657585960P0.3 5160.424080.414970.281650.2 1120.08780.1 4820.0 3440.278360.56105是否患病是是是是是是是是是否5.1.122由上表得回归方程正确率: 由此可以看出,在剔除坏数据后模型的线性拟合度有了较大的改进,使用改进的模型有已知的数据进行检验,有以上结果可知改进后的模型精确度已达95%,说明本模型在判断就诊者是否患有肾炎上仪具有较高的分辨率。5.2对于问题(2)的求解 5.2.1按照1提出的方法,判断表B.2中的30名就诊人员的化验结果得:病例号61626364656667686970P0.6938920.4901170.663330.999560.662990.4968590.1565190.7961640.7294470.278856是否患病否是否否否是是否否是病例号71727374757677787980P0.7429880.8914870.8275740.446330.547230.76080.407740.287870.600870.13685是否患病否否否是否否是是否是病例号81828384858687888990P0.006520.087910.171950.999960.4462650.68820.2244870.7296610.48947是否患病是是否是否是否是否是 由以上表格可知使用回归模型求出的30名就诊人员中有14位患有肾炎,16位健康人。 5.2.2马氏距离判别法 利用马氏距离判别法对表B.1的数据进行计算,然后我们对表B.1计算胡结果代入马氏距离判别法胡式子,然后再对表B.2的数据进行计算,计算的过程和结果如下: 马氏距离判别法是要将表B.1中的化验结果分为肾炎病人A组和健康人B组,化验结果是一个维的样品,这里定义为样品c到A组,B组的距离,这样通过比较两值的大小就可以判断样品c是属于A组还是B组;样品c到A组和B组的马氏距离分别为:其中,分别为总体A和B的均值和协方差。则判别函数为:当时,样品c靠近A,c属于A;当时,样品c靠近B,c属于B。编程求得:将表B2的数据代入上式方程得:病例号61626364656667686970y0.6938920.4901170.663330.999560.662990.4968590.1565190.7961640.7294470.278856是否患病否是否否否是是否否是病例号71727374757677787980y0.7429880.8914870.8275740.446330.547230.76080.407740.287870.600870.13685是否患病否否否是否否是是否是病例号81828384858687888990y0.006520.087910.171950.999960.4462650.68820.2244870.7296610.48947是否患病是是否是否是否是否是图5.2.1由以上表格得B2中有16人健康,有14人属于患者。综合以上两种方法对比可知使用回归模型和马氏距离判别法计算出的30名就诊人员中健康人和患者的人数完全一样,从马氏距离判别法的结果可知我们建立的回归模型具有相当的精确度,在误差范围内能精确的反应就诊人员健康与否的真实情况。5.3 对问题(3)的求解5.3.1 通过图像直接分析法 EXCEL进行数据处理分析和EXCEL制图分析: 各种微量元素广泛存在于人体中。其中,元素的含量多少直接影响到一个人是否患有肾炎,对人体的健康起着重要的意义。有研究表明可以直接通过对人体内元素曲线图观察得到,下面我们就随机抽取30个健康人和30个患者,分别作出Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素的曲线图,图像如图17:(说明:表B.1中患者和健康者的编号是160,但由于在EXCEL中无法分开编号,在此就设患者从130,人夜也是130,但只是在此小题中) 图1 图2 图3 图4 图5 图7 通过以上图像得知影响一个人是否患有肾炎的主要元素是Zn、Ca、Mg和Fe四种微量元素,故可以将对七种元素的检验指标简化为Zn、Ca、Mg和Fe四种元素的检验指标。5.4对问题(4)的解答根据问题(3)的结果重复(2)的工作得:病例号61626364656667686970p0.945310.777350.665150.9680090.955830.859060.3379810.6201720.866030.21279是否患病否否否否否否是否否是病例号71727374757677787980p0.554860.818680.950670.267820.573580.773150.612180.374480.682990.40891是否患病否否否是否否否是否是病例号81828384858687888990p0.276260.34870.75570.250630.758940.2649150.588830.081990.367530.48634是否患病是是否是否是否是是是图5.41 由表得使用主要元素对就诊的30名人员进行判别,其中有19人是健康的,11人患有肾炎。其结果与问题(2)中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论