肾炎判断.doc_第1页
肾炎判断.doc_第2页
肾炎判断.doc_第3页
肾炎判断.doc_第4页
肾炎判断.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

肾炎诊断题目要用黑体! 【摘要】:肾炎是一种比较常见的疾病,早期症状常不明显,容易被忽略,发展到晚期可引起肾功能衰竭,严重威胁病人的健康和生命,是引起肾功能衰竭最常见的原因,必须早发现早治疗。本文就肾炎病人和健康人的化验结果进行处理,并采用判别法,马氏距离判别法和支持向量机()模型三种能够准确确诊就诊人员的判别方法,对30名就诊人员进行了确诊并对这三种方法的正确性进行了检验和比较。为了减少化验指标,通过函数对化验结果进行显著性检验,从中找出影响人们患肾炎的关键因素,并用上述三种方法中较为理想的支持向量机()模型对30名就诊人员进行了确诊。最后我们对减少化验指标前后对30名就诊人员进行确诊的结果作了进一步的分析,并对三种方法进行了比较得出了很有实用价值的结论。在此基础上,我们对医生在临床上就肾炎病人确诊方法的科学性进行了进一步证实,并依据人体内各种元素的供需和影响人们患肾炎的关键因素对肾炎病人的饮食给出了合理的建议。摘要格式问题【关键词】:肾炎诊断 ;判别函数 ;正确性检验;显著性检验。1.问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1(见附表)是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。问题一:根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。然后按照提出的方法,判断表B.2(附表)中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题二:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。并根据得到的结果,重复判断表B.2(见附表)中的30名就诊人员是肾炎病人还是健康人。问题三:对2和4的结果作进一步的分析。2.基本假设1.通过人体内的7种元素的含量可以判定是否患有肾炎;我们组忽略了2.不考虑就诊人员的其它疾病因素以及身体素质的差异对各种元素含量的影响;我们组忽略了3.人处于健康状态时,体内各种元素的百分比含量是相对稳定的。4,各种元素的含量对肾炎的影响是独立的,不考虑功能的交互作用的影响;我们组的logistic模型如果加入交叉变量,拟合效果是否会更好呢?从医学角度来讲,各元素交互作用十分重要。可对此进行模型改进5.医院所提供的确诊病例的化验结果和就诊人员的化验结果都是准确的;6.诊断标准符合第二届全国肾脏病学术会议制定的诊断标准。3.符号约定:各种化学元素的编号,:肾炎病人的病例号,;那这里的s又表示什么呢?:肾炎病人的化验结果矩阵,表示病例号为的肾炎病人体内编号为的元素的化验结果;:健康人的病例号,;:健康人的化验结果矩阵,表示病例号为的健康人体内编号为的元素的化验结果;:确诊病人的病例号,;:确诊病人的化验结果矩阵,表示病例号为的确诊病人体内编号为的元素的化验结果;:判别函数;:判别函数的系数矩阵;其实4.问题分析对题中数据进行初步分析,不难发现,无论肾炎患者还是健康人,就不同的人体内相同的元素而言,其含量都是随机的在某个值上下小范围内波动,并使得肾炎患者和健康人之间产生了覆盖现象,比喻10号患者和40号健康人体内的Zn元素相同,都是156,可见,单就一种元素分析是不行的;另一方面,就相同人体内不同的元素而言,由于各种元素同处于人体这个有机整体,它们相互依存,相互制约,即客观上存在一定的联系,却又有明显的不确定性,若能寻找隐藏在随机性后面的统计规律性,确定这种相关关系,问题就可获解。由上述分析可知,本文的首要任务是对表B.1中的数据进行处理,由于数据量大,可知属于统计分析问题。处理的关键是对表B.1(肾炎病人,视为实验组;健康人,视为对照组)中的数据进行总体比较,从中寻找出一种或多种简便的判别方法并用此法对表B.2中的就诊人员进行确诊。在减少化验指标时,其关键又要确定哪些指标是影响人们患肾炎的关键或主要因素,进而必须确定两组(实验组和对照组)中各元素的显著性大小。最后对结果进行分析,必须能得出能指导实际的正确结论。5.模型建立及求解(12问)5.1. 模型-的建立及求解方法 一:判别法5.1.1. 模型一的建立我们先将表B1中的数据分为A和B(A代表健康,B代表患病)。对于p个判别指标,设判别函数y为:则A组对应判别值为:B组对应判别值为:A,B两组判别值的代表为:判别的标准就是的值,为使A组,B组之间有明显的区分,即:越大越好;又属于A组,属于B组,为了使得它们的代表值能具有很好的代表性,必须使它们与其代表之间的差距即离差平方和:越小越好。、综上所述,得fisher最优判别准则为函数:越大越好。从而解得最优判别函数的系数矩阵函数的极大值点,由微分学可知,为方程组的解。最终求得判别函数:其中的临界值为(1).时,若, 则判别对象属于A肾炎病人,若,则判别对象属于B健康人。(2). 时,若, 则判别对象属于B肾炎病人,若,则判别对象属于A健康人。在Matlab中编程运行,求得判别函数:5.1.2.模型一的正确性检验:现在来对上述方法的正确性作必要的检验,即检验上面求出的最优判别函数是否有效。步骤如下:(1) 计算统计量:(2) 这里显著性水平,从F分布表中查出:(3) 检验结果:,说明所作出的判别函数是有效的,从而可以用来作判别。5.1.3.模型一的求解:将表B1.中的确诊病人进行回代结果见附表A.1其中病例号为32,38,39,60的4个健康人被误判为肾炎病人,正确率为93.3%,再用此法对表B.2中的就诊病人进行判别,结果见附表A.2,患病人数为15人,其病例号为61、62、64、65、66、68、69、71、72、73、75、76、79、83、85。5.2模型二的建立:方法 二:马氏距离判别法 5.21.马氏距离判别法模型的建立:马氏距离判别法仍然是要将表B.1中的化验结果分为肾炎病人A组和健康人B组,化验结果是一个维的样品,这里定义为样品c到A组,B组的距离,这样通过比较两值的大小就可以判断样品c是属于A组还是B组;样品c到A组和B组的马氏距离分别为:其中,分别为总体A和B的均值和协方差。则判别函数为:当时,样品c靠近A,c属于A;当时,样品c靠近B,c属于B。编程求得:5.22.马氏距离判别法的求解及正确性检验:将表B.1的确诊病人的化验结果代入马氏距离判别函数中得到结果同附表A.1,说明马氏距离判别法和fisher判别法正确性相当,而将B.2就诊病人的化验结果代入马氏距离判别函数中得到结果同附表A.2,即患病人数为15人。方法 三:支持向量机()模型在这里,我们首先把问题限定在线性可分的情况下讨论,然后再进行优化。模型思想如图1所示:图中实心点和空心点分别表示健康人和肾炎病人两类样本,H为把两类没有错误地分开的分类平面,它是由支持向量支撑起来的,H,H分别为过两类样本中离分类平面最近的点且平行于分类的平面,它们是由支持向量组成的平面,H和H之间的距离叫做两类样本的分类间距。如果我们能够找到这样的一个最优的分类平面:使得分类平面不但能将两类无错误地分开,而且要使得两类的分类间隔最大。设线性可分样本集为是类别标号(在本题中,即为7维空间实向量,健康人类别编号+1,肾炎病人类别编号为-1)。维空间中线性判别函数方程的一般形式设为:则分类平面H的方程为:分类平面H即为参考平面,由于分类标号的设定,H,H两个分类边界面与分类面H是平行的,可以认为是由H面上下平移一个单位得到的,则H,H的方程为:若H平面上下不断平移,它会经过两类所有的样本,在这所有平移的平面中,其平移距离满足:考虑到与在正负号上的一致性,上式可以去掉的绝对值,得:其中,在分类边界面H,H上的样本,也即是支持向量,能使上式取等号,此式就是使得分类面对所有样本正确分类的约束条件。分类间距D为分类边界面H,H之间的距离:要使间隔D最大等价于或最小。问题归结为在上述(1)的约束条件下,求函数:的最小值。可见是一个二元二次线性规划问题,可以定义如下拉格朗日函数:其中,为拉格朗日系数,我们的问题是对和求拉格朗日函数的极小值。上述拉格朗日函数分别对和求偏微分并令它们等于0,问题最中转化为如下简单的对偶问题:在约束条件:之下对求解下列函数的最大值:设所求的最优解为,则即为最优分类平面H的法向量。这是一个不等式约束下二次函数极值问题,存在唯一解。并且其解比满足(1)约束取等号的支持向量,它们通常只是全体样本中的很少一部分。而是分类的域值,可以由任意一个支持向量用(1)式(此时(1)式取等号)求得,也可以通过分别在健康人和肾炎病人中任意取一对支持向量取平均值求得。至此,求得了最优分类函数:其中, 为符号函数,时取-1;时取0;时取+1。在Matlab中编程运行,并将确诊病人待入最优分类函数结果见附表A.3: 从表中可知,A组误判0人,B组误判0人,其正确率为100%,这个结果是很理想的。现在运用最优分类函数对表B2.中的就诊病人进行确诊结果见附表A.4.结果共有15人患有肾炎,其判别结果与上述两种方法相符。6.化验指标的减少(34问)6.1显著性检验:将各组测得的结果求出,经统计学t检验,求得p值,所得数据列于附表A.5。由附表A.6。知,Zn,Fe,Ca,Mg这几种元素肾炎病人与健康人差异非常显著(其),而其他元素差异则没有它们显著(其),因此我们有理由认为,Zn,Fe,Ca,Mg这几种元素是影响人们患肾炎的关键或主要因素,其它几种元素则为次要因素。6.2减少化验后的模型求解:在减少指标后,上述三种模型的求解结果见附表A.6,附表A.7,这里马氏距离判别法和fisher判别法的结果仍然是相当的。其中fisher判别法的判别函数为:马氏距离判别法的判别函数为:7.对上述结果的进一步分析首先,对三种判别方法及其结果进行比较评价,将上述三种方法的判别结果利于表A.7对比可知,在小样本容量(指样本容量的样本集合)下,马氏距离判别法和fisher判别法的结果仍然是相当的,其正确率也是相当的,相比较而言,支持向量机则能作到更准确的判别。三种方法中fisher判别法,特别是支持向量机,再涉及到高维数据时,都是借助向量这一概念来使问题简化,马氏距离判别法,运用距离这一几何长度来衡量则更易于理解接受。另外,在实际处理中,医生在诊断就诊病人是否患肾炎时,首先是尿常规检查,而化验各种元素含量只是为了协助医生的诊断,从这个意义上讲,上述三种方法在正确性上是能满足要求的。再分析一下元素,由于Zn,Fe,Ca,Mg这几种元素是影响人们患肾炎的关键或主要因素,因此,肾炎病人必须多进食含这几种元素的食物才能满足机体的正常需求,比如多吃西瓜,牛奶,鸡蛋等等另外,肾炎的根本原因是肾脏病变,其滤过能力改变,不能有效的滤过尿液中的蛋白质等含化学元素的有机物,最终导致体内的化学元素流失,并使得尿液的化学成分,ph值,比重等发生改变,可见实际中诊断肾炎病人首选尿常规检查是科学的。8模型的推广在社会、经济、自然科学领域的研究中,人们经常需要对某一研究对象的一些属性进行观察和研究从而将其进行适当的归类。例如,一个医生要对病人病情进行分析,以便判断到底应该使用何种手段治疗,例如非典型肺炎与典型肺炎治疗的方法就不相同。经济管理人员要对产品进行分类,判别它的销售情形属于“畅销”还是滞销。植物学家要对一类植物进行分析,昆虫学家对一种蠓虫的分类判别研究,地质学家要对某一地层出现的岩芯进行分类分析,在上述事例中经常用到的统计手段就是判别分析法。判别分析有多种方法和准则,其中常用的判别分析法是主要有:距离判别法、Fisher判别法、Bayes判别法、逐步判别法。除此之外,还有一种重要的的方法就是支持向量机。支持向量机(SVM)是近几年发展的以统计学习理论为基础的新型学习机,它是根据Vapnic提出的统计学习理论发展而来的,该学习机以结构风险为最小化原则取代传统学习机所采用的经验风险最小化原则,使SVM有更强的泛化能力。9模型的优缺点优点:1本文建立的统计识别模型能有效的解决实际生活中相类似的样本分类的问题,具有较强的实用性和通用性,而且误差也比较小;2本文采用的三种判别分析法成功地为诊断肾炎提供了一个科学、合理的方案,而且准确率达93.33,具有较高的可信度;3. 求解的过程中采用matlab数学软件编程求解,计算过程方便快捷,且结果准确。缺点:1.在所建立的模型中,对于题目中所提供的少部分就诊人员的化验结果我们并不能作出完全准确的判断;而且采用改进后的判别函数对就诊人员进行诊断时所得的结果中有几个与原先的判定结果不相同;2.在肾炎病的诊断过程中如果能综合考虑其他因素对人体内元素含量的影响,将使本文所建的模型更加贴近于生活实践,更加具有实用价值;同时也能对就诊人员是否患病提供可靠的依据;3. 本文所建的费希尔判定模型需要在总体之间差异较大的基础上进行,如果在总体之间差异不是非常明显时就会影响到最后的判定结果;此外,题中所提供的参考数据有限,这在一定程度上也降低了诊断结果的准确性。十参考文献及附录参考文献:【1】宋来忠,王忠明,数学建模与实验,科学出版社,2005.8. 【2】蔡锁章,数学建模原理与方法,海洋出版社,2000.6. 【3】徐全智,杨晋浩,数学建模(第二版),电子科技大学出版社,2008.6.附录1:表B.1 确诊病例的化验结果(a1表)病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.8025.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.530.065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373.0347141628.2327.162510862.4465151506.6321.06271401796391615910.711.761219098.53901711716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.7062993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.3060858.958.91392878.614.69.7042170.81334642990.03.278.1762252.37708523017828.832.499211270.21693121319.136.2222024940.01683217013.929.8128522647.93303316213.219.8152116636.21333420313.090.8154416298.903943516713.114.1227821246.31343616412.918.6299319736.394.53716715.027.0205626064.62373815814.437.0102510144.672.53913322.831.016334011808994015613532267471090228810411698.00308106899.153.02894224717.38.65255424177.9373431668.1062.81233252134649442096.4386.9215728874.0219451826.4961.738704321433674623515.623.4180616668.81884717319.117.0249729565.82874815119.764.220314031828744919165.435.053613921376885022324.486.0360335397.74795122120.115531723681507395221725.028.223433731104945316422.235.52212281153549541738.9936.016242161032575520218.617.7378522531.067.35618217.324.8307324650.71095721124.017.0383642873.53515824621.593.2211235471.71955916416.138.0213515264.32406017921.035.0156022647.9330表B.2 就诊人员的化验结果(a2表)病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.5542177184427631520.8012.513321761286466485.51.703.9950362.3238762.6651440.7015.154779.771.0218.56685.71.094.279017045.8257.9671440.309.1141755249.5141.5681704.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373.0347.57421319.136.2222024962.0465.87519220.123.8160615640.01687617110.530.567214547.0330.57716213.219.8152116636.21337820313.090.8154416298.9394.57916420.128.9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.88216715.027.0205626044.872.08315814.437.01025101180899.58413322.831.31633401228289851698.030.8106899.153.08178624717.38.65255424177.5373.5871853.9031.31211190134649.8882096.4386.9215728874.0219.8891826.4961.73870432143367.59023515.623.4180616668.9188附表A.1确诊病人判别结果(判别法,马氏距离判别法)编号(有病组)判别值(y)判别类型正确性编号(正常组)判别值(y)判别类型正确性1-0.0811有病组正确31-0.1389正常组正确2-0.0012有病组正确32-0.0787有病组不正确3-0.0134有病组正确33-0.0923正常组正确4-0.0157有病组正确34-0.1048正常组正确5-0.0085有病组正确35-0.1475正常组正确6-0.0229有病组正确36-0.1935正常组正确7-0.0236有病组正确37-0.1347正常组正确8-0.0231有病组正确38-0.0537有病组不正确90.0091有病组正确39-0.0683有病组不正确10-0.0147有病组正确40-0.2426正常组正确11-0.0098有病组正确41-0.1567正常组正确120.0537有病组正确42-0.1451正常组正确13-0.0086有病组正确43-0.0927正常组正确14-0.0786有病组正确44-0.2006正常组正确15-0.0239有病组正确45-0.3172正常组正确16-0.0237有病组正确46-0.105正常组正确17-0.0307有病组正确47-0.149正常组正确18-0.0013有病组正确48-0.1183正常组正确19-0.0725有病组正确49-0.1701正常组正确200.0177有病组正确50-0.2263正常组正确210.0214有病组正确51-0.2247正常组正确220.0385有病组正确52-0.1289正常组正确230.0028有病组正确53-0.108正常组正确24-0.064有病组正确54-0.1225正常组正确258.56E-04有病组正确55-0.2328正常组正确26-0.0679有病组正确56-0.1956正常组正确270.0183有病组正确57-0.2407正常组正确28-0.0072有病组正确58-0.1649正常组正确29-0.0038有病组正确59-0.1177正常组正确300.0018有病组正确60-0.0737有病组不正确附表A.2就诊病人判别结果(判别法,马氏距离判别法)编号61626364656667686970判别值-0.0131-0.0592-0.0912-0.000442-0.0498-0.071-0.1394-0.0703-0.047-0.1576判别类型有病组有病组正常有病组有病组有病组正常有病组有病组正常编号71727374757677787980判别值-0.045-0.0162-0.0255-0.1205-0.073-0.0364-0.0923-0.1048-0.0421-0.1497判别类型有病组有病组有病组正常有病组有病组正常正常有病组正常编号81828384858687888990判别值-0.1849-0.1448-0.0035-0.1075-0.0301-0.145-0.0841-0.2005-0.3171-0.105判别类型正常正常有病组正常有病组正常正常正常正常正常表A.3确诊病人判别结果患病者123456789101112131415-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1161718192021222324252627282930-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1健康者313233343536373839404142434445111111111111111464748495051525354555657585960111111111111111表A.4就诊病人判别结果就诊人员123456789101112131415-1-11-1-1-11-1-111-1-111161718192021222324252627282930-1111111-11-11-1111附表A.5 检验结果元素有病正常PZn143.15.37188.629.680.000334Cu12.335.0521.9223.750.038Fe23.0713.7562.0175.780.0095Ca698.17270.202511.131271.601.29691E-08Mg113.3946.84295.14177.575.33158E-06K201.13259.7890.3751.320.029Na526.83300.58367.21244.240.279附表A.6就诊病人判别结果(判别法,马氏距离判别法)编号61626364656667686970判别值-0.0258-0.0482-0.0907-0.0431-0.0632-0.048-0.0286-0.0754-0.0622-0.1205判别类型有病组有病组有病组有病组有病组有病组有病组有病组有病组正常编号71727374757677787980判别值-0.0947-0.0545-0.0492-0.143-0.1165-0.0743-0.1027-0.1246-0.0865-0.1308判别类型有病组有病组有病组正常正常有病组有病组正常有病组正常编号81828384858687888990判别值-0.1597-0.1206-0.0877-0.0851-0.0922-0.1643-0.0974-0.1426-0.1905-0.1371判别类型正常正常有病组有病组有病组正常有病组正常正常正常附表A.7三种方法结果比较. 检验指标 判别法 7种微量元素做检验指标Zn、Fe、Ca、Mg四种微量元素做检验指标马氏判别法1519费希尔判别法1519支持向量机1517附录2:文件M1w0=xlsread(a1);w1=xlsread(a2);wz0=143.1033333;12.33433333; 23.06666667; 698.1666667; 113.3933333; 201.1333333 ;526.8333333;wp0= wz0; wz0 ;wz0; wz0; wz0; wz0; wz0; wz0; wz0 ; wz0; wz0; wz0; wz0;wz0; wz0; wz0 ;wz0 ;wz0 ; wz0 ;wz0; wz0; wz0; wz0; wz0; wz0; wz0; wz0; wz0 ;wz0;wz0;wz1=186.6; 21.92366667; 62.01166667; 2511.133333; 295.1366667; 90.37; 367.21;wp1= wz1; wz1 ;wz1; wz1; wz1; wz1; wz1; wz1; wz1 ; wz1; wz1; wz1; wz1;wz1; wz1; wz1 ;wz1 ;wz1 ; wz1 ;wz1; wz1; wz1; wz1; wz1; wz1; wz1; wz1; wz1 ;wz1;wz1;a=w0-wp0;b=w1-wp1;s1=a*a;s2=b*b;s=s1+s2;q=inv(s)*(wz0-wz1);ya=sum(q.*wz0);yb=sum(q.*wz1);y=(ya+yb)/2 %判别值A=q;for n=1:30y0=sum(A.*w0(n,:);%比较值if y0=y u0=1%判断正确endif y0y u=0%判断错误endendfor n=1:30y1=sum(A.*w1(n,:);% 比较值if y1yu=0%判断正确endend%以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论