医学统计学 讲义.doc_第1页
医学统计学 讲义.doc_第2页
医学统计学 讲义.doc_第3页
医学统计学 讲义.doc_第4页
医学统计学 讲义.doc_第5页
免费预览已结束,剩余55页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学之1-平均数与标准差(在医科院皮研所统计培训班编写的讲义)2008年05月06日 星期二 06:51平均数是分析测量资料常用的一种统计指标。它说明一组观察值的平均水平或集中趋势。在麻风病统计中常用的有算术均数、几何均数和中位数。标准差也是分析测量资料常用的统计指标,它说明一组观察值的离散程度。在应用中,常常把平均数和标准差结合运用,综合表达一组观察值的集中和离散特性。(一)小样本均数、标准差直接计算法1、公式 _ X X (1.1) N _ (XX)2 S (1.2) N 1 (X)2 X2 N S (1.3) N 1 _ X: 观察值X: 算术均数 N: 观察值个数S: 标准差X: 观察值总和X2: 观察值平方的总和 _ (XX)2: 观察值的离均差平方和2、应用范围及注意事项(1). 观察值必须是同质的。(2). 观察值资料必须大体符合正态分布才能计算均数,而偏态分布的资料不宜用均数描述其集中趋势。(3). 标准差越大,表示观察值的分布越分散、标准差越小,说明观察值分布越集中。(4). 常以“均数标准差”的写法综合表达一组观察值的集中和离散特征。3、实例例1.110例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位,求GPT的平均值和标准差。计算步骤:X4350363240412 X243250236232240217228代入公式(1.1)求均数得 _ 412 X 41.2 10 代入公式(3.2)求标准差得 4122 17228 10 S 5.308 101 故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为: 41.25.308。(二)、大样本均数、标准差的计算法1、公式 _ fx X (1.4) f (fx)2 fX2 f S (1.5) f 1 _ X: 均数 X: 各组的组中值f: 频数 S: 标准差2、应用范围及注意事项(1)样本观察值与小样本资料一样,必须同质并呈正态分布。(2)大样本资料应先整理成频数表后再进行计算。频数表一般以815个组段为宜。3、实例例1.2 某地在1975年调查麻风发病情况,共发现640例麻风病人,其年龄分布如表1.1所示,求麻风病人发现时平均年龄。 表1.1某地麻风病人发现年龄统计(1975)年龄组组中值病人数0 2.5 3 5 7.5 11 10 12.5 46 15 17.5 95 20 22.5 110 25 27.5 181 30 32.5 90 35 37.5 68 40 42.5 30 45 47.5 13 50 52.5 85560 57.5 7 合 计 640计算步骤:(1). 首先将数据分组,整理成如表1.1所示的频数分布表。可利用函数型电子计算器的统计计算功能,方便地求得均数及其标准差。不同的计算器其操作方法有些差别,本书均以CASIOfx180P为例,其它种类计算器请参考说明书。(2). 将计算器置于“SD”工作状态,即按下 MODE 3,液晶屏显示“SD”,然后按下 INVAC,清除内存中遗留的数字。在每次进行新的运算之前,都应进行上述操作。 (3). 输入数据: 2.53 RUN 7.511 RUN 12.546RUN 57.57 RUN。(4). 取出结果: INV 3,显示: 9.6137 (标准差SD),INV1,显示:27.145(均数值)。医学统计学之2-平均数与标准差,t检验(在医科院皮研所统计培训班编写的讲义)2008年05月07日 星期三 14:20(三)几何均数1、公式 lgX G lg1() (1.6) N flgX G lg1() (1.7) f G: 几何均数X: 观察值 N: 观察值个数f: 频数2、应用范围及注意事项(1). 当样本观察值呈等比关系或对数正态分布而求均数时,如计算抗体平均滴度、传染病平均潜伏期等,可用几何均数。(2). 一般采用以10或 e 为底的对数进行计算。(3). 公式(1.6)适用于未分组小样本资料,公式(1.7)适用于分组的大样本资料。3、实例例1.8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年,求其平均潜伏期。计算步骤:(1)lgX lg2lg3lg5lg31 7.2730 7.2730 (2)G lg1() 8 lg1(0.9091) 8.1(年) (四)中位数计算法1、公式小样本未分组资料计算法:一组观察值按大小顺序排列,如个数为单数,则居中的一个观察值即为中位数;如个数为双数,则居中的两个观察值的平均数为中位数。大样本分组资料计算法: N C 2 M L (i) (1.8) fm M: 中位数 N: 总频数L: 中位数所在组段的下限 i: 组距 fm: 中位数组段内的频数 C:小于L的各组段的累计频数2、应用范围及注意事项(1). 中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。这种资料的算术均数易受极端值的影响,而对中位数则影响很小。(2)大样本资料应先编制频数表再计算中位数。3、实例例1.4 有204例麻风病人血中大单核细胞百分数资料,制成频数分布表如表1.2所示,计算其中位数。表1.2204例麻风病人大单核细胞百分数中位数计算表。 分组频数累积频数 0 24 24 2 40 64 4 55 119 6 37 8 27 10 18 12 1 14 0 16 1 18 0 20 1 204 计算步骤: (1). 自上而下累计各组段频数。(2). 找中位数所在组段。本例中位数在第3组。(3). 本例: L 4, N 204, i 2, fm 55, C 64 204 64 2 M 4 25.38 55 二、 t 检验 用计算 t 值进行差异显著性检验的方法称做t检验。检验适用于服从正态分布而且符合随机抽样原则的资料。t检验习惯上按下列标准判定检验结果:tt(0.05) P0.05 无显著性差异t(0.05)tt(0.01) 0.05P0.01 有显著性差异tt(0.01) P0.01 有高度显著性差异检验有显著性差异并不等于有实际意义,还需要根据专业知识判断,谨慎地下结论。(一)、样本均数的标准误1、公式 S Sx (2.1) N Sx: 样本均数的标准误 S : 样本标准差N : 样本例数2、应用范围及注意事项(1). 标准误是样本均数的标准差,表示样本平均数分布的离散程度。可用于估计总体均数的可信区间和进行均数间的差异显著性检验。(2). 表示样本均数离散情况时,可以写成“均数标准误”的形式。但必须标明是标准误,或用符号SE表示,以便和标准差相区别。医学统计学之3-t检验(在医科院皮研所统计培训班编写的讲义)2008年05月08日 星期四 06:40(二)、配对资料的t检验1,公式 _ d t (2.2) Sd _d: 差数均数 Sd:差数均数标准误2、应用范围及注意事项(1). 医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。(2). 配对资料t检验比用两个分组均数的差异显著性检验法的效率高,但事先未经配对设计的资料不能用本法检验。3,实例例2.1用DDS、RFP和B663联合用药治疗10例瘤型麻风病人,治疗前及治疗一年后的BI值如表2.1所示,试问治疗前后的BI值是否有显著性差异?表2.110例麻风病人联合化疗前后BI变化例号治疗前治疗后差数(d)d21 5.4 4.0 1.4 1.962 3.2 2.5 0.7 0.493 2.5 2.6 -0.1 0.014 3.0 1.9 1.1 1.215 4.2 3.3 0.9 0.816 4.6 3.7 0.9 0.817 3.4 2.7 0.7 0.498 4.1 3.4 0.7 0.499 3.6 2.8 0.8 0.6410 2.7 2.1 0.6 0.36 7.7 7.271、检验假设:治疗前后BI值无差异。2、计算步骤:(1). 求治疗前后BI差数d和d2(见表2.1第4和第5列),计算其总和,d7.7,d27.27。 _ (2). 把数据代入公式(1.1)和(1.3)计算差数的均数d和标准误Sd得: 7.7 d 0.77 10 7.72 7.27 10 Sd 0.3860 101(3). 把数据代入公式(2.1)求标准误 Sd 得 0.3860Sd 0.1221 10(4)把数据代入公式(2.2)求t值得: 0.77 t 6.308 0.12213、确定P值计算自由度(df), df 101 9, 查 t 值表(见附表),t(0.01(9)3.250, 本例tt(0.01(9),故P0.01。4、统计判断:该组病例在治疗前与治疗一年后,BI有非常显著性差别(P0.01),所以可以认为该疗法有显著降低BI的作用。(三)、两样本均数差别的t检验1,公式 _ _ (X1X1) (X2X2) Sc2 N1 N2 2 (x1)2 (x2)2 X12 X12 N1 N2 (2.3) N1 N2 2 1 1 Sx1x2 Sc2 ( ) (2.4) N1 N2 _ _ X1 X2 t (2.5) Sx1x2 _ _ X1: 样本I的均数 X2:样本II的均数 S2c: 合并方差 X1: 样本I的观察值 X2: 样本II的观察值 N1: 样本I的例数 N2: 样本II的例数 Sx1x2: 两样本均数之差的标准误2、应用范围及注意事项(1). 两个样本均数差别的t检验,适用于按完全随机化设计的两样本均数的差异显著性检验。(2). 两样本例数不相等也可以检验,但当两样本例数相等时,检验的效率最高。(3). 如每组例数大于10,而两标准差的平方相差5倍以上时,不能直接用t检验,可考虑用非参数统计方法。3、实例例2.2为研究正常成年男、女血液红细胞均数之差别,检查了某地2529岁正常成年男子156名,正常女子74名,男性红细胞均数为465.13万/mm3,标准差为54.80万/mm3。问两组均数差别有无显著意义? 1、检验假设:两性间红细胞数无差异。2、计算步骤:将数值代入公式(2.3)、(2.4)和(2.5): (1561)(54.80)2(741)(44.20)2 Sc2 156742 2667.05(万/mm3) 15674 Sx1x22667.05 7.29(万/mm3) 15674 465.13422.16 t5.89 7.29 3、确定P值:计算自由度df156742228,查t值表t(0.01(120)2.67,n越大则t的临界值越小,本例tt(0.01(120),则必大于t(0.01(228),故P0.01。 4、统计判断2529岁正常男女间红细胞数之差别有极显著意义。(四)、两样本含量较大时均数差别的t检验1、公 式 _ _ X1X2 u (2.6) S2x1S2x2_ _ u: u值, X1:样本I的均数, X2:样本II的均数 Sx1:样本I的标准误 Sx2:样本II的标准误2、应用范围及注意事项(1)样本量大于100时,t分布近似正态分布,可用u检验。(2)按下列标准判定结果:u1.96, P0.05 差异不显著1.96u2.58, 0.05P0.01差异显著u2.58, P0.01差异非常显著(3)其它条件与(三)相同。3、实例例2.3某院测定200例银屑病人的血清铜含量均数为110.49ug,标准差为29.13ug;健康对照组165例,平均值为125.91ug,标准差为17.74ug。比较两组的血清铜值是否有差异?1、检验假设: 两者血清铜值无差异。2、计算步骤:将数值代入公式(2.6) |110.49125.91| u4.224 29.13 17.74 ()2 ()2 100 65 3、确定P值:u2.58, 故P0.014、统计判断本例两样本均数差别非常显著(P0.01),说明银屑病人的血清铜含量比正常人偏低。(五)、关于t检验的说明1、显著性检验有双侧检验和单侧检验之分,请读者参考有关统计书。2、t检验只有在两个样本均数的方差没有显著差别的前提下,才可使用,否则须改用t检验。3、例2.1是对配对资料BI进行t检验,BI属半定量资料,有些BI值并不服从正态分布,所以使用t检验时要慎重;但目前国内外普遍使用t检验来比较治疗前后BI均数差异,故在此举一例。医学统计学之4-卡方检验(在医科院皮研所统计培训班编写的讲义)2008年05月10日 星期六 09:31X2检验是一种用途广、简单常用的差异显著性检验方法之一。主要可以用于计数资料(Enumeration data)的两组或两组以上的两类属性、两类或两类以上现象之间的比较,如检验两个样本率、构成比等之间的差别。一、基本原理和步骤:X2检验的基本原理是假设各个样本(Sample)来自同一属性的总体(Population),各组中实际数之间的差别仅仅由于抽样误差造成的;通过分别计算各组实际数与理论数的离散情况,求得总的误差X2值,从而测定假设存在的概率(Probability),即可能性 P,如果假设成立,那么X2值就不会很大,而保持在一定范围内,相应的 P值就大于 5(P0.05),即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5,说明各样本间的差别本质上无明显差异,它们来之于同一属性的总体,假设被肯定。反过来说,如果推算出的X2值很大,而超出了一定范围,相应的P值就小于 5或1,即由于抽样误差造成样本之间如此大的差别的可能性小于5或1%;说明各组间差别不是由于抽样造成的,可能两者的确有差别,它们不是来之于同一属性的总体,假设被否定。具体步骤:(一)、建立22的四格表(Fourbold table)或rc的行列表: 分析资料,将实验组(Exporimental group)和对照组(Control group)资料,按两类属性分类,组成如下计算表格: 属性 属性 合计实验组 Ta b Tb b对照组cTc d Td c d合计 c b d N bcda b表格中 以 a、b、c、d 四个数为基础计算统计量,故称四格表。c d(二)、 建立检验假设: 假设两组间无显著差异。(三)、 计算理论数:同行合计数同列合计数任何一格理论数 总合计数T代表理论数(theoretical),那么 a、b、c、d 分别有四个理论数:Ta, Tb,Tc,Td, (a b)(a c) Ta N (a b)(b d) Tb (a b) Ta N (a c)(c d) Tc (ac)Ta N (b d)(c d) Td (cd)Tc N用字母表达写成通式为: NrNcT N Nr: 为行合计数,(N: numberr:row)。Nc:为列合计数,(c:Column)。(四)、计算X2值: (AT)2 基本公式:X2 (1) T: (Sigma)即总和的意思,表示各个格子实际数与理论数之间的误差总和。A: 代表a、b、c、d 实际数(actual)。上式展开: (aTa)2 (bTb)2 (cTc)2 (dTd)2 X2 Ta Tb Tc Td (五)、求自由度:自由度(n) (行数1)(列数1) n (r1)(c1) (六)、差X2表,确定P值:X2X2(0.05(n), P0.05,无显著性差异。X2(0.0(n)X2X20.0(n), 0.05P0.0, 有显著性差异。X2X20.01(n), P0.01,有高度显著性差异。(七)、结论:1、有否显著性。2、P值为多少。3、由本资料推论总体,应当从实际出发,谨慎地下结论。二、四格表资料的X2检验。(一)、计算X2值的四格表基本公式:例1:某研究所进行HLA与麻风的相关研究,随机选取32例瘤型病人和65例健康人为对照组。病人组中18例HLADR2抗原阳性,健康人组中有14例HLADR2阳性。是否可以认为HLADR2抗原阳性率在瘤型麻风病人比健康人中为高?表1HLADR2在瘤型麻风病人和健康人中的测定结果 瘤型病人健康人 合计 1814 32HLADR2 1451 65合计 32 65 97(徐可愚等:中华皮肤科杂志,Vol. 16(1):24,1983)1、检验假设: LADR2抗原在瘤型麻风病人和正常健康人中分布无显著性差别。 32322、求X2值:Ta 10.557 (小数点后保留三位有效数字) 97Tb 3210.557 21.443 Tc 3210.557 21.443 Td 6521.443 43.557 此例,每个格子T5,N40,可用公式(1)。 (AT)2X2 T (1810.557)2 (1421.443)2 (1421.443)2 (143.557)2 10.557 21.443 21.443 43.557 11.69 (小数点后保留两位有效数字)2、确定P值: 自由度n (21)(21) 1,查X2表,X2(0.01(1) 6.63, 11.696.63, 则 X2X2(0.01(1), 所以 P0.01 4、结论: HLADR2抗原在二组人群中分布有高度显著性差别(P0.01),就本资料可以认为HLADR2抗原在瘤型麻风病人中出现的频率比健康人为高。 医学统计学之5-卡方检验(在医科院皮研所统计培训班编写的讲义)2008年05月11日 星期日 09:11(二)、应用四格表专用公式计算X2值。对于四格表资料,可直接用公式(2)计算X2值,免去了求T值的麻烦。 (ad bc)2N X (2) (ab)(cd)(ac)(bd)式中各字母意义同前。例2、某医院为研究吐温80对灰黄霉素治疗头癣是否有增效作用,随机选了193例头癣病人,分为两组分别以吐温80(0.25)灰黄霉素(7.5mg/kg)和单纯灰黄霉素(15mg/kg)治疗二十天,结果如下:表2. 吐温80对灰黄霉素的增效作用实验结果痊愈未愈合计治愈率吐温80灰黄霉素123 14 137 89.7灰黄霉素 41 15 56 73.2合计 164 29 193 84.971、检验假设:二组疗效基本相同。2、求X2值:估计T值均大于5,N40,用公式(2)。 (123154114)2193 X2 8.54 1642913756以基本公式计算: 164137 Ta 116415 193 Tb 137116415 20585 Tc 164116415 47585 Td 29 20535 8415 (123-116.415)2 (14-20.585)2 (41-47.585)2 (15-8.415)2 X 116.415 20.585 47.585 8.415 0.3722.1060.9115.152 8.54 与用专用公式计算结果基本相同。3、确定P值:自由度n (21)(21) 1 因为X2(0.01(1) 6.63, 8.546.63 所以P0.01 4、结论:两组疗效有高度显著性差异(P0.01).实验组中灰黄霉素为半量但疗效比单纯全量灰黄霉素疗效为佳,可以认为吐温80对灰黄霉素有增效作用。(三)、用四格表校正公式计算X2值。当四格表中任何一T值大于5,且N40,可用公式(1)(2)。但当1T5,N大于40时,用公式(1)(2)算出的X2值比实际的X2偏小,必须加以校正,使X2值更加合理。例3: 为了解兔眼畸形在瘤型麻风与结核样麻风病人中的发生情况,某医院随机抽样调查了二组病人,结果见下表。问在L和T型麻风中发生兔眼损害的情况是否一样。表3:L和T型麻风病人中兔眼发生情况兔眼(只)正常眼(只)合计瘤型病人183048 37.5结核样病人 2 12 14 14.3合计20 42 62 (谢晶辉:皮防战线12、5、1981)1,检验假设: 兔眼畸形在两型麻风中发生率相同。2,求X2值: 其中Tc5,且N40公式: (AT0.5)2X2 (3) T 或: (adbc N2 )2NX2 (4) (ab)(cd)(ac)(bd)我们用公式(4)计算: (1812302- 62/2)262X2 1.69 48142042 3、确定P值: n (21)(21) 1, 因为X2(0.05(1) 3.84, 1.690.054、结论:兔眼在L和T型麻风病人中无显著差异(P0.05),仅根据此资料还不能认为兔眼在两型麻风病人中发生率有差异。应在增大样本继续观察。 医学统计学之6-卡方检验(在医科院皮研所统计培训班编写的讲义)2008年05月13日 星期二 15:25(二)、应用四格表专用公式计算X2值。对于四格表资料,可直接用公式(2)计算X2值,免去了求T值的麻烦。 (ad bc)2N X (2) (ab)(cd)(ac)(bd)式中各字母意义同前。例2、某医院为研究吐温80对灰黄霉素治疗头癣是否有增效作用,随机选了193例头癣病人,分为两组分别以吐温80(0.25)灰黄霉素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论