化验结果的处理模型论文._第1页
化验结果的处理模型论文._第2页
化验结果的处理模型论文._第3页
化验结果的处理模型论文._第4页
化验结果的处理模型论文._第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、化验结果的处理模型谭光考韶关学院2006级数学系信息与计算科学(1)班,广东韶关,512005摘 要本文运用两种方法对问题进行分析求解。方法一是通过对表B.1的数据处理与分析,首先通过前30个已确诊的健康人的数据运用求平均值的方法得出各元素的标准值分别为183.6、21.92、62.01、2511.13、295.14、90.37、367.21。再通过此值,分别与各元素值作差求出各偏离量因子,然后对其取平均值,从而求出综合平均偏离因子。其次,根据对已确诊为健康和患病者的综合平均偏离因子的观察分析计算得出它们之间的综合平均偏离因子界限值,然后把表B.2的30位就诊人员与此值作差得到,用进行判断,大

2、于0为患病,反之则为健康。接着通过建立综合平均偏离因子与各元素含量值的七元回归模型,得出它们之间的关系,通过分析其置信区间,从而得出影响人们患肾炎的主要因素为、。最后,通过这4个主要因素求出综合平均偏离因子,再次运用上述方法,对表B.2的就诊人员进行判断,从而得出结论。而方法二则是用判别分析的方法,利用判别函数和SPSS软件对问题进行求解,从而对就诊人员进行判断。此外,还对两次的结果进行分析比较,两种方法所得出两次的结果都是基本一致。关键词: 标准值;综合平均偏离因子;七元回归模型;判别分析1 问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断,诊断就诊人员是否患肾炎时通常要化验人

3、体内各种元素含量。我们的问题是:1. 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。2 模型的假设2.1 人体中各元素都有一个标准值,并且健康人在这个标准值内只有很小的波动,我们可以取某一部分健康人的某种元素的平均值作为该元素的标准值;2.2 元素值偏离标准值

4、的状况可以反映人的健康状况,偏离程度大则患病,反之则为健康;2.3 该方法适合所有人群的判别,即与年龄、性别无关;2.4 所有人员在检测时都没有受到其它因素的影响;2.5 该检测人群中没有其它的疾病,即只有健康和患肾炎两种。3 符号的约定:数据表中对应的病历号的就诊人员。其取值为1,,90,其中1,30为已确诊的患病病人,31,60为已确诊的健康人,61,90为待检验的就诊人员;:元素的种类。其取值为1,7,分别代表、元素;:第种元素的标准值;:第病历号第种元素的含量值;:第病历号第种元素的偏离量因子;:第病历号的综合平均偏离因子;:综合平均偏离因子的界限值;:第病历号的健康状况因子,>

5、0表示患病,反之则为健康;4 问题的分析本题目是关于对化验的结果处理问题,为此我们要做如下处理:对于问题1,我们先利用EXCEL软件对数据表B.1的数据进行处理分析。而我们要判断人员是否患病就需要一个指标来衡量。再考虑到人体内的各微量元素都有一个标准值,利用该标准值,我们就可以得出各元素的偏离程度,从而最后得出一个总偏离量的指标。利用该指标,我们就可以判断其是否患病。此外,还可以考虑用判别分析法来求解。对于问题2,利用问题1的方法,可求出其综合平均偏离因子,从而判定他们是患病还是健康。对于问题3,我们利用问题1的综合平均偏离因子,运用多元回归的方法,得出综合平均偏离因子与各元素之间的关系,然后

6、根据各元素权重的大小,得出其影响患病的主要因素。于是我们就可以利用这些主要的指标进行判定,从而减少化验的指标。对于问题4,我们同样根据问题2的做法,利用问题3求出的主要指标进行判断人们是否患病。对于问题5,我们就是要对问题2和问题4中两种方法求得的结果的差异进行分析。 5 模型的建立和求解5.1患病与健康的判断模型的建立与求解a.各元素的标准值的求解对于数据表B.1,我们利用EXCEL软件对其进行处理分析,为了得出人体中各元素的标准值,我们把已确诊为健康的数据放在一起,分别对第项元素求平均值: (1)其中公式(1)的表示第个人第种元素的值, 等于1,7分别表示、元素.于是我们得到各元素的标准值

7、如下表1:表1 各元素的标准值1234567186.621.9262.012511.13295.1490.37367.21b. 各偏离量因子的计算利用上面计算到的标准值,我们将数据表1中的第人的第项元素值分别减去对应的标准值: (2)从而根据公式(2)得到各项元素的偏离量因子(见附录1)。c. 综合平均偏离因子的计算为了更好的进行判断人员是否患病,我们又引入综合平均偏离因子。我们对各偏离量因子取平均值得到综合平均偏离因子: (3)由公式(3)我们得到综合平均偏离因子如下表2:表2 综合平均偏离因子表1327.5613192.2612309.88132203.6183351.39133210.7

8、614338.61034168.7785328.4323594.5476362.67436139.0527353.17537100.5048356.49538296.6329329.86439242.92810331.23440860.62911638.11041288.95312351.8624233.42713240.20543238.90214323.2354482.720415354.71545222.76116302.10546160.76117300.2184726.34718205.21448175.93919331.12449485.51820450.23450191.6152

9、1486.85251185.75822364.0675267.04223251.9285388.09524441.41954161.72425315.35155252.75226365.12456136.52327370.22857224.55528373.78158327.84329493.69959276.52930282.19060196.858d. 患病与健康的判断模型与检验分析为了判断健康与患病,我们就需要一个指标来判段,也就是综合平均偏离因子的界限值。为此,我们分别对所有确诊为患者和健康的综合平均偏离因取平均值,再对这两个值取平均值作为我们的综合平均偏离因子界限值: (4)于是我们

10、得到患病与健康的一个综合平均偏离因子界限,。所以我们得到判断人员的健康状况的模型: (5)根据公式(4)我们可以计算出对应的,当时,表示该人员为患病者。当时,表示该人员为健康者。为了检验公式的合理性,我们再用公式(5)对前60位人员进行判断。通过检验,我们可以发现除了、出现了异常外,其它都基本正确。并且通过分析,在这几个数据中都是由于某种元素值过高或过低,导致其偏离量过大,而此种元素可能就是非关键或主要元素。此外由于我们所选取的标准值是通过确诊的健康人群中取平均值得到的,因此会存在误差。所以通过总的综合评价,该方法还是基本准确的,具有合理性和实用性。为了要判断就诊人员是健康还是患病,我们就需要

11、了解各元素之间存在着怎样的关系,并且通过这种关系来进行判断。于是,通过查找资料,我们想到可用判别分析法1进行求解。判别分析就是根据观察或测量到的若干变量值,判断研究对象如何分类的一种统计分析方法。它就是要从各变量中筛选出能够提供较多信息的变量并建立判别函数,使得利用推导出的判别函数对观测量判断其属性类别是的错误率最小。判别函数的一般形式是: (6)其中为判别值;为变量值,为变量系数,也称判别系数。所以,我们这里设健康状况与各元素之间的判别函数为: (7)其中分别表示、元素的值, 分别为其对应判别系数。于是,为了求出这些关系,我们利用SPSS软件进行求解,容易得到分别为0.061、-1.205、

12、0.372、1.165、0.524、0.052、-0.350。从而我们得到判别函数: (8)由SPSS求得的结果分析中可以看出,对这60名已确诊的病历,利用该方法判断的准确率为93.33%,所以,该方法确实是比较准确的。5.2 就诊人员的判断根据我们建立的患病与健康判断模型,我们可以知道,要判断人员是否患病,我们就要计算其综合平均偏离因子,于是我们根据判断患病与健康模型,对表B.2的30名就诊人员所测得的各元素分别计算其偏离量因子。然后通过取其平均值得到综合平均偏离因子,然后根据综合平均偏离因子的界限指标对各人员的健康状况进行判断,结果如下表3:表3 就诊人员的综合平均偏离因子及健康状况表(1

13、)就诊人员综合平均偏离因子健康状况就诊人员综合平均偏离因子健康状况61392.474患病76302.614患病62336.181患病77210.761健康63244.334健康78168.849健康64421.964患病79274.647健康65349.828患病80101.304健康66310.015患病81114.409健康67389.302患病82126.904健康68294.137患病83336.838患病69352.827患病84184.945健康70118.315健康85311.354患病71520.079患病8633.556健康72408.781患病87253.177健康7336

14、4.965患病8882.606健康7474.744健康89222.772健康75192.175健康90160.747健康此外,我们再由判别分析法中的判别函数和利用SPSS软件对就诊人员进行判断,结果如下表4: 表4 判别函数判断健康状况表就诊人员健康状况就诊人员健康状况就诊人员健康状况61患病71患病81健康62患病72患病82健康63健康73患病83患病64患病74健康84健康65患病75患病85患病66患病76患病86健康67健康77健康87健康68患病78健康88健康69患病79患病89健康70健康80健康90健康5.3 影响患病主要因素模型的建立与求解通过对数据表B.1的观察分析我们可

15、以知道,健康者与患病者的某些元素的含量存在着明显的差异,比如的含量,健康的明显要比患病的多。于是,当中应该存在着某些元素是起到关键作用的,或者是有几种元素对判断起到主要的作用。为此,我们就要找出它们之间与健康状况的关系。但是,健康状况是一个比较模糊的概念,并且没有直接的数据可以运用,因此无法直接建立关系。于是我们考虑到判断患病与健康模型中的综合平均偏离因子,既然它的偏离情况与健康状况间存在关系,我们就可以通过求得各因素与综合平均偏离因子的关系,来反映各因素与健康状况的关系。为此,我们想到多元回归模型,这里利用七元回归方程模型来求得它们的关系。于是我们设: (8)其中表示综合平均偏离因子,分别表

16、示、元素的值,其对应的回归系数分别为、,为常数项,为随机误差。为1到60病历号人员综合平均偏离因子的601矩阵,为对应回归系数的数据矩阵,这是一个608矩阵,其中第一列为全1向量。根据表 B.1的数据,运用MATLAB软件中的regress命令求解,求解结果如下表5表5参数参数估计值参数置信区间31.15115.9414 56.36080.2368-0.0538 0.52740.5513-0.3073 1.40980.0080-0.3007 0.31670.12080.1006 0.14100.22350.0317 0.41520.15670.0798 0.23360.11030.0325 0

17、.1881于是我们得到的回归方程: (9) 根据表5果的显示,说明值的94.47%都可由模型确定,所以本模型从整体来看是合理可用的。对表5各参数的置信区间进行检查分析,我们可以发现,只有、的置信区间包括0,它们分别是-0.0538 0.5274 、-0.3073 1.4098和-0.3007 0.3167。这表明,回归变量对因变量的影响不明显,于是我们可以不考虑对的影响。所以我们就可以得出结论,影响人们患肾炎的主要因素是,即分别是、。由我们求得的判断函数可知,各元素之间的系数权重是不同的。其中、的系数的影响不大,所以,影响患病的主要因素是、。可见,两种方法求得的主要因素虽然都有所差异,但是也有

18、相同的元素,这些相同的就是影响患病的关键因素。5.4 主要元素对就诊人员的判断根据影响患病的主要因素模型求得的结果我们知道,影响患肾炎的主要因素是、,于是我们就可以只考虑这4种元素对患病的影响,再利用判断患病与健康模型的方法,对表B.2的30名就诊人员进行判断,我们首先计算出它们的偏离量因子,然后通过取其平均值得到综合平均偏离因子,再根据合平均偏离因子的界限指标运用公式(5)对各人员的健康状况进行判断,结果如下表6:表6就诊人员的综合平均偏离因子及健康状况表(2)就诊人员综合平均偏离因子健康状况就诊人员综合平均偏离因子健康状况61644.922患病76517.337患病62560.172患病7

19、7351.912患病63403.672患病78284.022患病64695.997患病79464.762患病65586.912患病80160.212健康66500.037患病81183.571健康67654.394患病82207.762健康68495.372患病83575.547患病69603.177患病84299.959患病70197.104健康85531.582患病71898.922患病8629.041健康72698.547患病87432.872患病73613.837患病88131.262健康74116.057健康89387.163患病75323.462患病90258.737健康同样,可根

20、据利用SPSS软件和判断函数对就诊人员进行判断,判断的结果与之前的一致(见表4)。5.5 利用主要因素和用全部元素判断模型的进一步分析对于方法一,利用主要因素和用所有元素进行判断模型都是运用同样的方法,利用标准值计算出各元素的偏离量因子,再计算出综合平均偏离因子运用公式(5)来进行判断的。不同的是,模型四只选用了5种主要因素()进行判断.从判断的结果(见表3和表6)中可以看到,两者判断的结果基本一致。对于方法二的效则更为明显,两次得到的结果都一致。这也就证明了我们所用方法的正确性。所以我们在化验检查时,就可以减少指标,只化验主要元素即可。这样将可以减少化验时间和费用。但是,从方法一得出的结果中

21、我们还可以发现,第63、75、77、78、79、84、87、89号就诊人员的检查结果不一致,也就是说这两中方法所判断的结果有出入。这也是说明,虽然某些因素对患病不起关键或主要作用,但仍然存在一定的影响。而经过分析,我们发现,这两个的值都与综合平均偏离因子的界限值比较接近。因此,产生这种原因可能是由于某些非主要元素起到一定的影响,但效果是很不明显的。因此,因此相比之下,方法一的误差是比方法二的要大的。6 模型的评价和推广在本题的方法一中,为了解决对化验结果的处理,我们引入了标准值、偏离量因子和综合平均偏离因子。通过这些指标,利用偏离指标越大则为患病的原理来建立模型。所以,这是比较符合实际的,有其

22、实用价值。并且,通过对判断结果的检验分析看出,该模型确实比较准确的。因此,具有可行性。但是,由于我们没有找到一个准确的标准值作为参考,本题中的标准值是通过求平均值所得到的。因此,可能会对判断的结果产生影响。而且,我们只是单单从一个简单的偏离量来对健康状况做出判断,并且所用的综合平均偏离因子的界限值只是观察得到,没有得到合理的论证。更没有深入的考虑到其各元素之间的内在联系,如各元素之间的比例等。所以本模型还有待进一步改进。而对于方法二则是利用判别分析法,其更具科学性和专业性。该模型还广泛适用于各医学领域和其它化学、生物、农业等领域的检验判断。参考文献1 张宜华.精通SPSS.北京:清华大学出版社

23、,2002.2 姜启源.数学模型(第三版).北京:高等教育出版社,2003.3 张瑞丰.精通MATLAB 6.5 .北京:中国水利出版社,2002附录:附录1 各元素偏离量因子表元素偏离量病历号1()2()3()4()5()6()7()120.66.1237.511811.13183.1488.63145.7921.63.3730.511810.13170.1493.6359.7936.42.5336.111970.13132.1437.63274.79427.61.8722.311615.13195.94148.63358.79539.43.8738.211905.13143.1420.07

24、149.21615.63.0452.722204.13108.1444.87110.21714.40.9735.411960.13194.1440.97226.21839.62.1732.011852.13193.1463.63312.79914.63.4854.151960.13219.448.0349.211030.60.8329.511872.13188.1412.63184.791154.63.5744.311933.13202.741223.631004.79124.61.0350.711744.13184.14173.63304.79130.63.0724.911553.1362.

25、1417.3720.211424.64.1034.911886.13187.1427.9797.791536.65.7041.011884.13155.1488.63271.791627.61.6350.311899.13105.148.1322.791769.63.7754.971523.13199.6445.63204.79185.62.2357.971074.13111.1410.63174.791940.68.3738.211279.13167.1459.63724.7920144.32.0352.311882.13201.44348.63520.7921158.40.078.9121

26、41.13251.04363.63484.792232.61.478.711890.13190.1469.63355.79237.60.1344.111372.13145.1445.17149.2124173.18.9745.212376.13262.5438.77185.212511.66.4937.111704.13172.1434.77241.212673.63.4714.711885.13241.5477.63259.7927136.10.7355.711903.13236.2431.47228.21281082.2752.312090.13224.3442.6396.792996.69.0653.841889.13242.84679.63484.79308.616.4729.611519.13183.1420.17198.213126.46.7725.81291.1346.1450.37199.213216.61.5732.211226.1369.1442.4737.213324.60.8742.21990.13129.1454.17234.213416.40.6728.79967.13133.148.5326.793519.60.7747.91233.1383.1444.07233.213622.60.5743.41481.8798.1454.07272

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论