版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档精品文档乳腺癌的数据处理摘要本文解决的是乳腺肿瘤的“良”“恶”性判别问题。现在是通过乳腺肿瘤的9项指标来判定乳腺肿瘤患者是否患有乳腺癌,我们通过运用Logistic回归分析 判定模型和费歇尔(Fisher)判别模型,对9项指标进行综合判定、分析,最终 制定了一个科学的乳腺肿瘤的判别方法,以便人们能及早发现并且治疗。对于问题一:我们建立了两种模型一一Logistic回归分析判定模型和费歇尔(Fisher)判别模型。对于Logistic回归模型,我们对数据进行分析并运用MATLAB软件求出回归系数,再由Logistic回归方程求出概率p,进而与概率 值0.5进行判断,小于0.5则为良性,反
2、之,则为恶性,最终得出正确率为85%的判定方法。对于费歇尔(Fisher)判别模型,我们借助方差分析的思想构造判 定函数,通过样本SPSS软件对数据进行分析得出判定系数Ci,接着求出临界值y。,最终把要检验的样本数据代入判定函数求出y值,将y值与临界值y。进行比较,从而确定肿瘤性质,最终得出正确率为95%的判别方法。对于问题二:由第一问得出模型二费歇尔(Fisher)判别模型正确率更高, 所以可以根据费歇尔(Fisher)判别方法来判断所给组是良性还是恶性,先将各 组数据直接代入模型二中求出的判定公式中,求得各组相应的y值,通过与yo进行比较,来判断肿瘤患者是为良性还是恶性。最终判定结果如下表
3、:编号12345678910检测结果1011010101编号11121314151617181920检测结果0100100000(注:检测结果“T代表肿瘤为恶性,“0”代表肿瘤为良性)对于问题三:为区分肿瘤是良性还是恶性的主要指标,我们根据Fisher模型, 求出系数 c 和良性、恶性肿瘤中各项指标的均值 x、x,最终求出指标剔除判(+、定数组 c.*ax),剔除当中绝对值最小的一个,依次类推,得到剔除的先后 2顺序,并求出相应的检验准确率,选择高准确率情况下指标剔除较多的一组,最 终得出区分肿瘤是良性还是恶性的主要指标为: 乳腺肿瘤肿块的厚度、单层上皮 细胞的大小、裸核、正常的核仁。关键词:
4、logisticlogistic 判别法费歇尔判别法BPBP 神经网络SPSSSPSS精品文档精品文档一、问题重述问题背景 : 如今,癌症越来越多,发病率越来越高,不断威胁着人们的生命安全,其中 乳腺癌就是其中一种严重威胁女性生命的癌症之一, 全世界每年约有120万妇女 患乳腺癌,50万人死于乳腺癌,乳腺癌已经成为全球女性发病率最高的恶性肿 瘤。下面是某医院乳腺肿瘤患者的一组数据(具体数据见附录) ,其中前面9个 指标分别表示乳腺肿瘤肿块的厚度、细胞大小的均匀性、 细胞形状的均匀性、 边缘的粘连、单层上皮细胞的大小、裸核、温和的染色质、正常的核仁、有丝分 裂,尾数0表示确诊为“良性”,1表示确
5、诊为“恶性”,数据已经归一化为0到10之间的自然数。所要解决的问题如下:问题一、通过以上数据, 建立一种或多种判别方法, 用来判断乳腺肿瘤是属于 “良 性”还是 “恶性”,并检验这些方法的正确性。问题二、现有一组乳腺肿瘤患者的九个指标数据如下, 根据问题一中提出的方法 分别判别属于“良性”还是“恶性”1,1,1,1,1,1,1,3,13,4,4,10,5,1,3,3,14,2,3,5,3,8,7,6,15,1,1,3,2,1,1,1,1问题三、试确定区分乳腺肿瘤是“良性”还是“恶性”的主要指标,并采用主要 指标建立区分“良性”和“恶性” 乳腺肿瘤的模型,以便用于乳腺肿 瘤的辅助诊断时可以减少化
6、验的指标。10, 4,7,2,2,8,6,1,15,2,2,2,2,1,2,2,18,6,7,3,3,10,3,4,26,5,5,8,4,10,3,4,11,1,1,1,1,1,2,1,110,3,3,1,2,10,7,6,12,1,1,1,2,1,1,1,17,6,4,8,10,10,9,5,35,1,1,1,2,1,3,1,2,5,4,6,6,4,10,4,3,11,1,1,1,2,1,1,1,11,1,1,1,2,1,3,1,18,5,5,5,2,10,4,3,11,1,1,1,2,1,3,1,11,1,1,1,2,1,1,1,11,1,1,1,2,1,1,1,1精品文档精品文档假设1:
7、各种指标对肿瘤的影响是相对独立的。假设2:9个指标中的数据都是0-10之间的自然数。假设3:肿瘤只有良性和恶性两种情况。假设4:每组数据独立作用互不影响。假设5:数据缺失组对判定无影响。假设6:除了9中指标的影响外,不考虑其他因素的影响三、符号说明符号符号说明p经logistic转换后肿瘤为恶性的判定概率q肿瘤为恶性的概率生回归系数(k =1,2,39)Xk患者体内第k种指标的大小Ci判定系数(i =1,2,3.9)G良性患者的总体G2恶性患者的总体T)yi第i组良性的判定函数一yi第i组恶性的判定函数ycFisher判定临界值四、问题分析本文研究的是乳腺癌是良性还是恶性的判定方法以及影响乳腺
8、肿瘤是良性 还是恶性的主要因素的问题。通过题中乳腺肿瘤肿块的厚度、细胞大小的均匀性、 细胞形状的均匀性、边缘的粘连、单层上皮细胞的大小、裸核、温和的染色质、 正常的核仁、有丝分裂这9个指标的数据分析,来判断是良性还是恶性。针对问题一:为了更好的判定乳腺癌是良性还是恶性,我们建立了两种模 型Logistic回归分析判定模型和费歇尔(Fisher)判别模型。我们先运用模型假设精品文档精品文档Logistic回归分析方法对数据进行分析并求出回归系数,再由Logistic回归方程求精品文档精品文档出概率p,进而与概率值0.5进行判断,小于0.5则为良性,反之,则为恶性。接着, 我们运用费歇尔(Fish
9、er)判别模型,借助方差分析的思想构造判定函数:y =CiXiC2X2 -. CnjXn 1- CnXn,然后代入样本数据对其进行求解得出判定系数Ci,接着求出临界值 yo,最终把要检验的样本数据代入判定函数求出y值,将y值与临界值 yo进行比较,从而确定肿瘤性质。针对问题二:因为模型二费歇尔(Fisher)判别模型正确率更高,所以可以 根据问题一中模型二费歇尔(Fisher)判别模型来判断所给组是良性还是恶性, 先将各组数据直接代入模型二中求出的判定公式中,求得各组相应的y值,通过与 yo进行比较,来判断肿瘤患者是为良性还是恶性。针对问题三:要区分肿瘤是良性还是恶性的主要指标, 可以先弄清楚
10、哪些指 标可以剔除,剔除的先后顺序,因此我们可以根据Fisher模型,求出系数 c 和良 性、恶性肿瘤中各项指标的均值 X、X,再求出 C.*住 D,进而剔除出当2中绝对值最小的一个,依次类推,得到剔除的先后顺序,并求出相应的检验准确 率,从而得到区分肿瘤是良性还是恶性的主要指标。五、模型的建立问题(一)1.模型一的建立1.1 Logistic回归分析判定模型的建立1.1.1确定目标函数在分析乳腺肿瘤患者体内乳腺肿瘤肿块的厚度、细胞大小的均匀性、细胞形 状的均匀性、边缘的粘连、单层上皮细胞的大小、裸核、温和的染色质、正常的 核仁、有丝分裂9个指标的基础上,将其肿瘤分为良性和恶性两种情况。对任一
11、患者定义随机变量丫。若该患者肿瘤为良性,则丫= 0;否则,丫= 1。并以q =PY=1表示该患者肿瘤属恶性的概率。设 Xk(k=1,2,3.9)为患者体内第k种指标的大小,则可将q看做自变量 Xk的线性函数:q =PY = 1=Bo+ 0X 古 B X2t0kXk引入p的Logistic变换得:q7可得Logistic回归方程为:eqe-X八乂?. (1)精品文档精品文档P(2)在知道乳腺肿瘤肿块的厚度等9个指标的大小之后,只要根据Logistic回归分析 模型计算出其良性的概率,再与概率值0.5进行判断,以确定患者肿瘤是否良性。若 p ::: 0.5,则表示该患者肿瘤为良性;反之,则为恶性。
12、.2 确定约束条件i.i. 因为 q=PY“表示该患者肿瘤属恶性的概率,所以有:q 二 PY (0,1)ii.ii. 因为p也是表示的概率,所以有:0:p : 11.1.3综上所述,得到问题一的最优化模型:q =PY =1=氏 + B X 郴 X .2+?kXkq =1 n(厂)1-pJ丿祁X祁X2.習Xkee、p=q二PY =1 (0,1)s.t0:p : 11.2 Logistic回归分析判定模型的求解采用某医院检测的42组良性肿瘤患者和38组恶性肿瘤患者(见下表),选 取样本60人(良性患者130号,恶性患者130号),将样本60人的9个指 标直接输入matlab软件,应
13、用regress函数求出回归系数 订,、订,如表三 所示。表一:良性患者指标第 1 项第 2 项第 3 项第 4 项 第 5 项 第 6 项第 7项第 8 项第 9 项肿瘤性编号指标指标指标指标指标指标指标指标指标质1511121cV1/02311122c31/03411321cV1/04011412121/041311123cV1/04222211171/0精品文档精品文档表二:恶性患者指标第 1 项第 2 项第 3 项第 4 项第 5 项第 6 项第 7 项第 8 项第 9 项肿瘤性编号指标指标指标指标指标指标指标指标指标质15333234412875107955J4 1310776410
14、412: 13691010110831378383498C8: 1381064134cV23i表三:各元素回归系数指标常数第 1 项第 2 项第 3 项第 4 项第 5 项第 6 项第 7 项第 8 项第 9 项系数-42.370.036-0.0230.0550.0300.0110.009-0.0340.0490.038将上表中的回归系数代入Logistic回归方程(2)得:4/2.37 0.036X1-0.023X2O055X30030X4:0.011X50009X6-0.034X7O049X80.038X9)将剩余样本代入上式检验,同时与概率值0.5比较,结果如表四、表五所示:表四:良性患
15、者验证编号313233343536P-195.33X10-195.34X10-195.24X10?-195.28X10-194.62X10良性VVVVV编号373839404142P-194.97X10-181.07X10-194.50X10-195.46X10-194.88X10-194.13X10良性VVVVVV注:表中“?”表示数据出现缺失,无法进行判断表五:恶性患者验证编号3132333435363738P10.998?-181.07X100.9878111恶性VVXVVVV注:表中“?”表示数据出现缺失,无法进行判断1.3LogisticLogistic 回归分析判定模型的结果分析通
16、过对表四与表五的观察发现:在对表四中良性患者的验证中,包括未判断 的数据缺失者,正确率高达91.67%;在对表五中恶性患者的验证中,包括未判断的数据缺失者,正确率达75%所以,在整体验证中,包括未判断的数据缺失 者,正确率达85%由此表明,本文中的Logistic回归分析判定模型是可行的。精品文档精品文档2.模型二的建立2.12.1 费歇尔(FisherFisher)判别模型的建立.1 确定目标函数费歇尔 (Fisher) 判别法的思想: 利用选取的30组“良性”指标数据与30组“恶性”指标数据,借助方差分析的思想构造判定函数:其中,系数 CC2,C9确定的原则是使两组间的区别
17、最大,而使每个组内 部的离差最小 将属于不同总体的样本代入判别函数得:%“人 C2X2|l( C9X9,(i =1,|1(,30)yi二CNC2X2QX9,(i =1,|1(,30).2 费歇尔(FisherFisher)判别模型的求解根据判定函数,代入剩下的20组指标数据,将求得的y值与判定临界值进行比较,从而判定乳腺肿瘤是良性还是恶性。我们运用SPSS软件:进行Fisher判定求得判别式函数系数以及样本数据各 项指标的均值:表六:Fisher 判别式函数系数指标第 1 指标 第 2 指标 第 3 指标 第 4 指标 第 5 指标 第 6 指标 第 7 指标 第 8 指标 第
18、 9 指标系数0.527-0.4830.5830.2300.1970.2430.1000.4700.419所以将上述系数代入Fisher判别式得:y =0.527*x1-0.483*x2+0.583*x3+0.230*X4 0.197*X5+0.243*X6+0.100* X7 0.470* x8 0.419*x9表七:为恶性、良性肿瘤中各项指标均值指标-一一_ 二_k四r五六七八九恶性7.33 :5.575.534.53:5.435.67 1良性2.801.501.401.272.101.872.671.301.17通过对乳腺肿瘤患者中良性与恶性的各项指标的平均值进行
19、统计计算 (见上 表),求得良性肿瘤的“重心”y)和恶性肿瘤的“重心”y(2),利用SPSS软 件对数据进行处理后得:9第一组样品的“重心”丁八c_x= 4.0 9 2 5kzfcy 7 人沁.Cn/Xnd訥(n - 9)(3)精品文档精品文档为建立判定准则,确定判定临界值y,我们取yo为 y1与产加权平均值:n2通过计算得:y0=7.9819将检测者的各项指标的值x(刘,,xj,代入(3)式中,求得y的值(1)当 y f ) y(2)时,若 y yo,则判定 x 己 G?;若 y v yo,则判定 X 乏 G1(2)当 y0)c y ?)时,若 yy,贝 U 判定 x 乏 G1;若 y c
20、yo,贝 U 判定 x 乏 G?根据Fisher模型的判定函数,代入剩下的20组指标数据,将求得的y值与 判定临界值进行比较,从而判定乳腺肿瘤是良性还是恶性。通过对Fisher判定模型的计算,得到结果如下:表 Fisher 判定模型结果显示良性患者的判定样本号313233343536y 值4.6913.6494.22(11.89,14.08)4.7242.583检测正确YYYNYY样本号373839404142y 值4.2645.8573.9834.3324.2233.513检测正确YYYYYY注:表中“ Y ”表示检测正确,“ N”表示检测错误。 恶性患者的判定样本号313233343536
21、3738y 值15.5212.26(8.35,10.54)8.6512.0912.0219.488.99检测正确YYYYYYYY注:表中 y 值为区间的组为数据缺失组,其缺失项分别用0 到 10 来代替,以求出 y 值范围,将范围内的极值与y比较,最终求得结果。.3 结果分析通过对上述两表的观察知:在良性患者的验证中,包括数据缺失者,正确率 高达91.67%;在恶性患者的验证中,包括数据缺失者,正确率达100%。所以,在整体验证中,包括数据缺失者,正确率达95%。由此表明,本文中的费歇尔(Fisher)判别模型是可行的。通过对模型一和模型二最终结果的正确率进行比较知:模型二的正
22、确率较 高,故应选取模型二来进行问题二和问题三的解答。第二组样品的“重心”y(2=Z CkXk= 1 1 . 87 1 3k丄厲y(1)n2y(1)精品文档精品文档问题(二)经过比较分析知模型二的正确率较高,故此处用模型二进行解答。由模型二知判定函数为:y =0.527*x1-0.483*x2+0.583*x3+0.230* x4 0.197*x5+0.243*x6+0.100* x7 0.470* x8 0.419*x9则根据所给数据可求得各组数据相对应的y值,再与临界值7.9819进行比较:若 y yo,则判定 x G!;若y .yo,则判定 x G?故通过Matlab软件可得出对20组患
23、者检测结果如下表:编号12345678910检测结果1011010101编号11121314151617181920检测结果0100100000注:检测结果中“ T 表示恶性,“ 0”表示良性由上表知:第1、3、4、6、&10、12、15组为恶性肿瘤患者,其他的为良性患 者。问题(三)3.由Fisher模型知:c =0.527;-0.483;0.583;0.230;0.197;0.243;0.100;0.470;0.419良性、恶性肿瘤中各项指标的均值分别为:x(1)=2.80;1.50;1.40;1.27;2.10;187;2.67;130;1.17x二7.33;5.57;5.53;
24、4.53;5.43;5.63;5.10;5.20;2.47由Matlab软件处理得:(尹孑)C.*( 2.6693 -1.7074 2.0201 0.6670 0.7417 0.9113 0.3885 1.52752(.*是matlab中的符号,是对应项相乘,结果仍然为向量),比较各项的大小,剔除绝对值最小的项(因为该项数据对总的结果的平均影响最小),由已知数据可知首先应该剔除倒数第三项,即第七项指标所对应的所有数据,再按照问题一 的求解方法求解得:c =0.519 -0.458 0.606 0.243 0.202 0.233 0.494 0.427良性、恶性肿瘤中各项指标的均值分别为:x(1
25、)=2.80;1.50;140;1.27;2.10;187;1.30;1.17x二7.33;5.57;5.53;4.53;5.43;5.63;5.20;2.47同理:由Matlab软件处理得:0.7626)精品文档精品文档故应该剔除第四项指标在此我将逐次减少化验的指标(方法同上),并将其求解结果列表如下:剔除指标判别式 y=临界值准确率对原检验样 本20 人的 判断结果第七指标0.519*x1-0.458*x2+0.606*x3+0.243*x4+0.202*x5+0.233*x6+0.494*x8+0.427*x97.7895%9 人恶性11 人良性第四指标0.556*x1-0.369*x2
26、+0.497*x3+0.281*x5+0.330*x6+0.480*x8+0.408*x97.8395%9 人恶性11 人良性第九指标0.646*x1-0.108*x2+0.188*x3+0.377*x5+0.325*x6+0.395*x87.4695%9 人恶性11 人良性第二指标0.639*x1+0.115*x3+0.351*x5+0.328*x6+0.382*x87.4395%9 人恶性11 人良性第三指标0.682*x1+0.372*x5+0.348*x6+0.412*x87.5095%9 人恶性11 人良性第八指标0.667*x1+0.447*x5+0.491*x86.6690%10
27、 人恶性10 人良性第八指标0.807*x1+0.603*x56.3690%11 人恶性9 人良性由表中结果可知:剔除第三项指标之后,检验准确率仍然在95%,而剔除第六项指标后,检验准确率降为90%,所以剔除的前四项均为次要指标,从第六项 开始是主要指标,所以区分肿瘤是良性还是恶性的主要指标是第一、五、六、八 指标,即是乳腺肿瘤肿块的厚度、 单层上皮细胞的大小、 裸核、 正常的核仁, 故 可由判断式 y =0.667* x1 0.447*x5 0.491* x8 来判断。六、误差分析本文主要有三方面的误差,分别为题中模型的误差、数据的误差、算法的误 差。1.模型一的误差:(1)logistic
28、模型中样本仅有60组数据,这对于求解模型中的回归系数而 言,数据过少,可能会使回归系数产生较大的误差,从而影响最终的判定结果。(2)logistic模型检验时,是用所得概率值与0.5进行比较,以判定肿瘤性 质,此处的0.5有一定的不合理性,可能会在最终判定结果时造成一定的误差。(3)logistic模型对数据缺失项不能进行有效的判定,这就降低了其检验的 准确率,在进行这种判定时会产生一定的误差。2.模型二的误差:(1)fisher模型是一系列判定变量的线性组合,它只适用于区分和判定线 性可分的总体。对于非线性判定模型有较大的误差和局限性。(2)fisher模型要求有足够多的样本数据时,才能最大
29、限度的保证其算法 精度,c.*理亠72-1.61902.09980.70470.76050.87381.60550.7771)精品文档精品文档但是本题中只有六十组数据, 这对于求解判定系数及临界值时均会产生一 定的误差。3数据的误差: 主要是数据的准确性以及有几组数据的缺失,数据的缺失使在某些模型中这些组无法进行计算,而总体又保持不变,这就相应的产生了一些误差。4算法的误差: 本文虽然采用了两个模型,但是两个模型主要都是用来求解线性问题的,对于本题中指标之间的交叉影响不能很好的处理,可能会对结果产生一定的误 差。七、模型的评价模型的优点:1.模型的实用性和通用性强并且与实际生活紧密相关, 对医
30、生的判断具有很 大的指导意义。尤其在第三问中区分肿瘤是良性还是恶性的关键因素的方法比较 简单易行。2.本文采用了两种判别分析方法来检查肿瘤是恶性还是良性,并得到了影响其的主要因素,为合理的诊断提供了一个很好的解决方案。3求解的过程中采用Matlab、Excel、SPSS数学软件编程求解,计算过程方 便快捷,且结果准确。4.由于建模过程中使用的六十组样本数据与检验时所用的二十组数据不重 复,有效地避免了数据间的相互影响, 彼此独立, 因而检验结果具有很强的可靠 性。模型的缺点:1.在诊断过程中并没有综合考虑所有的因素共同的影响,这与现实生活不 符。如果综合考虑,将会更具有实用价值。2.本文中模型
31、对就诊者判断的正确率没有达到100%,存在误差,这种误差会导致误判,而在现实中这是很危险的。3.在第一问中的模型中只考虑某一种元素单独对结果的影响,其间存在着交叉项。八、模型的改进和推广模型的改进:1.本文中所用的两个模型对就诊者判断的正确率都没有达到100%,方法都 很传统,存在着误差,我们可以采用BP神经网络模型。其思想是:通过输入学 习样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使 输出的向量与期望向量尽可能地接近,当网络输出层的误差平方和小于指 定的误差时训练完成,保存网络的权值和偏差,从而使判断的正确率提高。 其算法流程图如下:精品文档精品文档初始化给定输出向量和目标
32、输出求隐层,输出层的各单元输出求目标值与输出值得误差 EE 满足要求丫ES全部 E 满足丫ES结束NO上计算隐层单元误差*- NO1求误差梯度权值学习图一:学习算法框图由于本题中有9项指标,故分析可得其指标与各层之间的关系,作出具体BP神经网络示意图如下所示:输入层隐层输出层图二:BP 神经网络示意图综上,可得BP神经网络模型大致步骤如下:1)能量函数选取1n平方型误差函数为 E 二丄 a (Yk-Y? )22 心2)隐层数取1,隐层单元数取93)传输函数选取logsig型函数通过matlab软件应用上述函数,最终可对数据进行判定检验。精品文档精品文档2.在诊断过程中这9个指标的作用不是独立的
33、,应该存在着相互的影响, 有交叉项,而模型只考虑了各自单独作用,所以模型中应该添加交叉项的影响,即采用一次项和交叉项的回归模型,具体的我们可以从模型总体中选取良性1-30号、恶性1-30号作为研究样本,故可设多元线性回归模型的一般形式为:9999?=氏+瓦?Xi+区 c?x2+瓦无 xXj+si 4i 4i 4 j二建立相应的模型,并将数据代入上式,用Matlab软件求得各参数项的线性回归系数,得到多元回归模型的表达式,再将良性中31-42号、恶性中31-38号代入模型中进行检验,得到良性、恶性的相关情况。为此我们可以看出,我们所 运用的判别函数与所检验的结果和实际情况存在着一定的误差,也就是
34、说运用原来的Logistic回归分析判定模型(一次线性模型)存在一定的误判,从而得到 误判率。3.题中所给数据有几个出现缺失,在我们模型建立与求解的过程中都将数 据缺失部分不考虑,认为无此项,而实际上却存在着此项的影响,观察数据知缺 失项都为第六个指标,所以可以将第六个指标项去掉,考虑剩下的其他指标项。模型的推广:在当今经济科技社会,人们经常对某一事物现象进行观察研究归类,并用于合适的地方,例如,医院里医生对肾炎;非典时期对非典;还有肺炎等疾病进行 类似的模型应用;经济领域里某产品输入与输出是畅销还是停滞;在科学领域, 某植物或动物的分类判别以及科研人员或地质学家对某地质土壤的判别;考古学家对
35、墓年代的判别等都用到了此类判别式分析法的模型,应用十分的广泛。九、参考文献1宣明数学建模与数学实验,浙江浙江大学出版社20102谢金星优化建模与LINDO/LINGO软件,北京清华大学出版社20053宋来忠数学建模与实验,北京科学出版社20054朱道元数学建模案例精选,北京科学出版社2003彭祖赠数学模型与实验方法,大连大连海事大学出版社1997刘爱玉SPSS基础教程,上海上海人民出版社2007附录附表一:良性患者指标第 1 项第 2 项第 3 项第 4 项第 5 项第 6 项第 7 项第 8 项第 9 项肿瘤性编号指标指标指标指标指标指标指标指标指标质1511121cV10精品文档精品文档2
36、311122c1/03411321c1/04111121031/05211121115. 06111111c1/0741112121/0831112121/0911112131/01032111121/01121112121/01231111121/01321122131/01421112121/01562111171/016111121212: 01711112121/01811112221/019111121c321020112122彳2102153122121/02221113121/0235445710c321024688134c71025212121c1/02642112121/02
37、721112121/028111123c1/029411121c31/030611121c1/03151112121/03211312111/03331212121/03466696?78/03541132131/03611112121/03741112131/03851312121/03913322172104011412121/04131112331/04222211171/0附表二:恶性患者指标精品文档精品文档编号项1标第指第 2 项指标第 3 项指标第 4 项指标第 5 项指标第 6 项指标第指第 8 项指标第 9 项指标肿瘤性质1533323441287510795J5J413107
38、76410412:441525336775/16104313V65J2: 175656101c31/18787248cV82: 19533424cV411055581087371111066345cV61128241515j441139552225J1114634152cVcJ*11510421324J1011653418104cJ*11761028102781(1189451061048/119810108710cJ7112074646143/1211055367710/12281010136cVcJ*123523427cV612410773857i25101010
39、8618cJ23i问题二答案:精品文档精品文档编|第1|第2丨第3|第4|第5|第6|第7丨第8|第9丨肿编第1第2第3第4第5第6第7第8第9肿精品文档精品文档号项指标项指标项指标项指标项指标项指标项指标项指标项指标瘤 性质1。14722861112522221221O386733134115111111211O6O13312O176117211121111O87648O1O195319111111131OO142353876111511121312O254664O143113111121111O41111121311O5185552O143116111112131
40、1O71111121111O8111121111O9344O151331O22511321111O程序-一(Logistic回归 分析判定) : x =511121 31 13111223114113213111111210311211121115111111311411121211311121211111121311321111211211121211311111211211221311211121211621111711111121212精品文档精品文档111121211111122211精品文档精品文档1111213211121224215312212112111312115445710
41、321688134371212121311421121211211121211111123311411121311611121311533323441875107955410 7764104127321051054425336775110 431336525656101311787248382533424341555810873710 6634536182415154495522251163415239110 42132431053418104916102810278 10945106104818101087 1097174646143110 5536771018101013639152342
42、736110 7738574310 101086189154492105616101028 1073310 10104818101377449481958123215; 0 ?0?0?0?00;0;0精品文档精品文档0;0;0;0;0;0;0;0;0;00;0;0;0;0;0;0;0;0;00;1;1;1;1;1;1;1;1;11;1;1;1;1;1;1;1;1;11;1;1;1;1;1;1;1;1;11;b=regress(y,x)%regress函数为回归分析函数,可直接求出回归系数程序二 (Fisher检验)function tt=jiance(x)x=51112121113121111
43、312121211411321311111121211411121311513121211133221721114121211311123311222111711103623541021055688711523161051153553341019101011083318383498981064134323;c=0.527 -0.483 0.583 0.230 0.197 0.243 0.100 0.470 0.419;%Fisher判定函数系数值row,col=size(x);for i=1:rowy=sum(c*x(i,:);%求得的观察比较值if y=7.9819%与临界值比较tt(i)=1;else tt(i)=0;endenddisp( 1代表恶性肿瘤,0代表良性肿瘤 )精品文档精品文档第二问检测程序functiontt=jiancex= 1047228611522221221867331034265584103411111112111033121076121112111176481010953111111131423538761511121312546641043111112111111112131185552104311111213111111211111111211113441051331511321111;c=0.527 -0.483 0.58
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年广东科学技术职业学院单招职业适应性考试题库带答案详解(完整版)
- 2026年广州工程技术职业学院单招职业技能测试题库含答案详解(精练)
- 2026年广西体育高等专科学校单招职业适应性测试题库附答案详解ab卷
- 2026年广西信息职业技术学院单招职业技能考试题库带答案详解(培优a卷)
- 2026年广东松山职业技术学院单招职业适应性考试题库含答案详解(研优卷)
- 2026年山西运城农业职业技术学院单招职业倾向性测试题库附答案详解(完整版)
- 2026年广西工业职业技术学院单招职业倾向性考试题库附答案详解(培优a卷)
- 2026年崇左幼儿师范高等专科学校单招职业适应性测试题库含答案详解ab卷
- 2026年高考文综全国甲卷试题含解析及答案
- 2026年广西卫生职业技术学院单招职业倾向性考试题库附参考答案详解(黄金题型)
- 医院健康教育与健康促进培训课件
- 近三年内未发生重大事故的安全生产承诺范本
- 岳阳职业技术学院单招职业技能测试参考试题库(含答案)
- 量子密码学与后量子密码学
- 部编版四年级下册语文写字表生字加拼音组词
- 威斯特年产10000吨纳米铜盐系列产品、6000吨叔丁基过氧化氢精馏及3000吨糊状过氧化二苯甲酰项目环境影响报告
- 广西-黄邵华-向量的数量积
- 1.2 国内外网络空间安全发展战略
- 2023年湖南省长沙县初中学生学科核心素养竞赛物理试题(含答案)
- 东北大学最优化方法全部课件
- 人教新课标六年级数学下册全册大单元教学设计(表格式)
评论
0/150
提交评论