



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。均数反映了一组观察值的平均水平, 适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化 (等比关系 ),此时不宜用算术均数描述其集中位置,而应该使用几何均数 ( geometric mean)。几何均数一般用 G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。中位数和百分位数:中位数( median)就是将一组观察值按升序或降序排列,位次居中的数, 常用 M 表示。理论
2、上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。 所谓 “开口 ”资料,是指数据的一端或者两端有不确定值。百分位数( percentile)是一种位置指标,以PX 表示,一个百分位数PX 将全部观察值分为两个部分,理论上有 X的观察值比 PXX大。故百小,有( 100-X)观察值比 P分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以
3、方差和标准差最为常用。极差( range,记为 R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、 食物中毒等的最短、 最长潜伏期等。 其缺点是: 1.不灵敏;2.不稳定。四分位数间距( inter-quartile range)就是上四分位数与下四分位数之差,即: Q QU QL ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信
4、息, 因此仍然不足以完整地反映资料的离散程度。方差( variance)和标准差( standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。变异系数( coefficient of variance ,CV)亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。3.答:常用的相对数指标有:比,构成比和率。比( ratio),又称相对比,是A、 B 两个有关指标之比,说明A 为 B 的若干倍或百分之几,
5、它是对比的最简单形式。其计算公式为比A/B率 (rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率 ( )、千分率( )、万分率 (1/万)、十万分率 (1/10 万 )等表示。计算公式为:实际发生某现象的观察 单位数率比例基数( K)可能发生某现象的观察 单位总数构成比 (proportion)又称构成指标, 它说明一种事物内部各组成部分所占的比重或.分布,常以百分数表示,其计算公式为:构成比某一组成部分的观察单位数100%同一事物内各组成部分的观察单位总数4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或
6、低估总率。在这种情况下,直接进行两个总率的比较,会产生错误的结论。此时,必须首先设法消除这种内部构成上的差别,才能进行比较。统计学上将这种方法称为率的标准化 (standardization method of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。5(1)编制频数分布表并绘制频数分布图,简述这组数据的分布特征;组段频数频率 (%);累计频组中值数 (%)10832.52.5109.5111108.3310.83112.51142218.3329.17115.51173831.6760.83118.51202016.677
7、7.5121.5123181592.5124.512675.8398.33126.512913221.67100129.5合计12010035.0030.0025.00yc 20.00nuqreF 15.0010.005.000.00108.00111.00114.00117.00120.00123.00126.00129.00132.00135.00''height (cm)''(2)计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?答:X3 109.510 112.522 115.538 118.520 121.518 124.57 126.521
8、39.5 /120=119.4135Xglg 1lg3109.5lg10 112.5lg 22 115.5lg38118.5lg 20 121.5lg18 124.5lg7126.5lg 2 139.5 /120=119.25125.M d116.63用均数较好 .( 3) 计算极差、标准差,用何者表示这组数据的离散趋势好?答:极差: 22.62四分位数间距: 5.915标准差: 4.380736用标准差表示较好 .6答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。适宜用中位数表示其平均水平,中位数为4,四分位数间距为 4。7.40 名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗
9、体滴度如下表。试计算平均滴度。抗体滴度1:41:81:161:321:641:1281:2561:512人数156271045几何均数:exp(ln(4)+5 ln(8)+16× ×ln(16)+2 ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512)/40)×1288.答:此医生的分析是不正确的,原因在于:首先明确率的定义: 率实际发生某现象的观察 单位数比例基数( K)可能发生某现象的观察 单位总数发病率的分子为 “某时期内发病人数 ”,而被观察对象某时期内可能发病多次,所以发病人
10、数是人次数;分母为“同时期平均人口数 ”,而按率的定义应为 “同时期暴露总人数该单位抽样检查2839 名职工,其中高血压患者中,男性是178 例,女性是 49 例,共 227 例,可以计算高血压患者占接受检查所有职工的构成比为7.995773%至于 40 岁以上的患者占接受检查总人数的90.3%,也是构成比; 60 岁以上者占接受检查总人数的 10.2%也是构成比,不能与发病率混为一谈。关于高血压与性别有关的结论也不妥。 因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消除内部构成比的差异,即就是率的标准化,然后比较。第三章1 正态分布与标准正态分布的区别:正态分布是一簇单峰
11、分布的曲线, 和 可以有任意取值;标准正态分布是一条单峰曲线, 和 有固定的值, =0, =1。2 u = (x- )/ =-(- )/ -1=查标准正态分布表,得(-1)=0.1587,所以小于-者所占的比例为15.87%。3 医学参考值范围的含义: 是根据正常人的数据估计绝大多数正常人某项指标所在的范围。选定同质的正常人作为研究对象。 所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。确定原则:选定同质的正常人群作为研究对象控制检测误差.判断是否分组单、双侧问题选择百分界值确定可疑范围方法:正态分布法:适用于服从正态分布或近似正态分布的资料百分位数法:适用于不服从正态分布的资料对
12、数正态分布法:适用于对数正态分布的资料4 如果资料服从正态分布,那么双侧 95%正常值范围为 ± 1.96;如果资料不服从正态分布,那么双侧 95%正常值范围就不能用正态分布来做。5 1 人以下的概率: P(x 1)=P(0)+P(1)=C1000.200.810+C1010.210.89 =0.3758 人以上的概率:P(X 8)=P(8)+P(9)+P(10)=C1080.280.82+C109 0.29 0.81 +C10100.2100.80 =7.79 ×1056 二项分布的应用条件:观察单位只能有互相对立的两种结果之一。已知发生某一结果的概率 不变,其对立结果的
13、概率则为 1- n 次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。7 二项分布和正态分布之间的关系:随着 n 的增大, 二项分布逐渐逼近正态分布。当 n较大时,二项分布B(n, )近似正态分布。举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料; 某地区 12 岁男孩的身高,某学校同年级女生的体重等属于正态分布。第四章1标准差标准误不同:意义上:描述一组变量值的离散程描述样本均数的离散称度度应用上:1、标准差越小,说明变量1、标准误越小,说明样本值围绕均值分布越紧密,均均数和总体均数的差异越数的
14、代表性越好。小,用样本均数估计总体均数的可靠性越大。2、 x u s 估计变量值的分2、用 x t sx 估计总体均数布范围。的可信区间。与 n 的关系:n 越大,标准差越稳定n 越大,标准误越小相同:1、都是描述变异度的统计指标.2、 xx与x 成正比,与n 成反比;xn3、n 一定时,同一组资料,标准差越大,标准误也越大。2 水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯型错误的最大风险,是事前概率; P 值是指由 H0 所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝H0,是事后概率。3 配对设计的差值的总体均数的可信区间表
15、达公式:dt , n 1 sd22两均数差值的总体均数的可信区间表达公式: x1 x2 t ,n1 1 s1n21 s211n1n2 2n1n2可以用可信区间回答假设检验的问题。 可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数, 即可推断该样本是否来自已知均数的总体;用假设检验的方法, 先假设样本均数代表的总体均数等于某已知的总体均数,再判断样本提供的信息是否支持这种假设。4 拒绝实际上成立的 H0,这类
16、“弃真 ”的错误称为型错误或第一类错误;不拒绝实际上是不成立的 H0,这类 “存伪 ”的错误称为型错误或第二类错误。 第一类错误的概率用 表示,第二类错误的概率用 表示。 越大, 越小;反之, 越小, 越大。拒绝 H0,只可能犯第一类错误,不可能犯第二类错误;不拒绝0H ,只可能犯第二类错误,不可能犯第一类错误。由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。5 t 检验的应用条件:独立性、正态性、方差齐性。 u 检验的应用条件:适用于大样本资料。t 检验和 u 检验的关系:随自由度的增加,t 分布逐渐趋向于标准正态分布。因此u检验是 t 检验的一种近似检验方法。当自由度大于5
17、0 时,近似程度比较满意。6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。假设检验应注意的问题:要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因素外,其他影响结果的因素应一致。选用的假设检验方法应符合应用条件。结论不能绝对化。正确理解差别有无显著性的统计意义:.差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。 统计学意义与其他专业上的意义不同。7 H0:矽肺患者的血红蛋白与健康人相同,即 =0H
18、1:矽肺患者的血红蛋白与健康人不同,即0 =0.05x= |12.59 14.02 |t = s2.7743n 1.63/ 10 =10-1=9,t0.05,9=2.262<t ,p<0.05 ,拒绝 H0,接受 H1,差别有统计学意义,可以认为矽肺患者的血红蛋白与健康人不同。8 H0:新药与常规药物的疗效没有差别,即1=2H1:新药与常规药物的疗效不同,即12 =0.05tx1x2=1.28232x122x22x1n1x2n211nn2nn2121 =n1+n2-2=20-2=18 ,t0.05,18=2.101<t ,p>0.05,不拒绝 H0,差别无统计学意义,尚
19、不能认为新药与常规药物的疗效不同。9甲药:H0:甲药无效,即d=0H1:甲药有效,即d0 =0.05td=5.2372sdn = 10-1=9,t0.05,9 =2.262<t, p<0.05,拒绝 H0,接受 H1,差别有统计学意义,可以认为甲药有效。乙药:H0:乙药无效,即d=0H1:乙药有效,即d0 =0.05td=5.3033sdn = 10-1=9,t0.05,9=2.262<t ,p<0.05,拒绝 H0,接受 H1,差别有统计学意义,可以认为乙药有效。 H0:甲乙两药的疗效没有差别,即 1=2.H1:甲乙两药的疗效有差别,即12tx1x2=1.60222x
20、1222x1nx2x2n2111n1 n22n1n2=n1+n2-2=20-2=18 ,t0.05,18=2.101>t ,p>0.05 ,不拒绝 H0,差别无统计学意义,可以认为甲乙两药的疗效没有差别。第六章1 不满足正态近似条件,所以采用直接计算概率法。H0:加维生素 C 的治愈率与不加相同,即 =0=0.6H :加维生素 C 的治愈率高于不加维生素C,即 >10 =0.0599110100= 0.9536>0.05P(X 8)=1-P(X 9)=1-P(X=9)-P(X=10)=1-C 10*0.6*0.4 -C10*0.6*0.4不拒绝 H0,差别无统计学意义,
21、可以认为加维生素C 的治愈率与不加相同。2 满足正态近似条件,采用正态近似法。H0:经健康教育后的高血压患病率与以前相同,即 =0=0.610H :经健康教育后的高血压患病率比以前降低,即 <单侧 =0.05p04.9453536u0 10 / nu>u0.05, 单侧 =1.64p<0.05,拒绝 H0,接受 H1 ,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。3建立检验假设和确定检验水准H0:男女大学生 HBV 感染对其心理影响相同,即 1 =2 H1:男女大学生 HBV 感染对其心理影响不同,即 12 检验水准 =0.05计算检验统计量2=( ad
22、-bd)2*n/(a+b)(c+d)(a+c)(b+d)=(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651 =1确定 p 值2 届值表,得 p<0.05查 统计推断按 =0.05水准,拒绝 HO,接受 H1,差别有统计学意义,可以认为 HBV 感染对不同性别的大学生在心理行为方面的影响不同。4建立检验假设和确定检验水准H0:两组的治愈率相等,即1 =2.H1:两组的治愈率不等,即12检验水准 =0.05 Fisher 精确概率法序号治愈人数未愈人数缓解率p1 与|p1-p2|概率(i)Pp211701.0000.86
23、72130.13321610.9410.7413120.20031520.8820.6154110.26741430.8240.4915100.33351340.7650.365690.40061250.7060.239780.46771160.6470.114870.53381070.5880.012960.6009980.5290.1381050.66710890.4710.2621140.733117100.4120.3881230.800126110.3530.5141320.867135120.2940.6391410.933144130.2350.7651501.000P(i) =
24、 0.280>0.05统计推断按 =0.05水准,不拒绝H0 ,差别无统计学意义,尚不能认为两组治愈率有差别。5建立检验假设和确定检验水准H0:治疗三种类型病人的有效率相同,即1 =2 =3H1:治疗三种类型病人的有效率不等或不全相等。检验水准 =0.05计算检验统计量.Ai Ti22A2Tin1inRnC= 286* ( 712+ 272+1042+ 422+ 242+182-1) =3.6389199*9887*98199*14687*146199*4287*42确定 p 值2 界值表,得 p>0.05查 统计推断按 =0.05水准,不拒绝 H0,拒绝 H1 ,差别无统计学意义
25、,尚不能认为治疗三种类型病人的有效率有差别。6建立检验假设和确定检验水准H0:该三种人群有相同的血型分布,即1 =2 =3H1:该三种人群的血型分布不等或不全相等。检验水准 =0.05计算检验统计量2Ai Ti2A 2Tin1inR nC9312* (6792+1342+ +4352- 1) = 71.1803720*1883788*1883546*6522 确定 p 值2 界值表,得 p<0.05查 统计推断按 =0.05水准,拒绝 H0,接受 H1,差别有统计学意义,可以认为三种人群的血型分布不等或不全相等。7建立检验假设和确定检验水准H0:两种检验方法的结果相同,即总体B=CH1:
26、两种检验方法的结果不同,即总体BC检验水准 =0.05计算检验统计量22bc11.1364b c 确定 p 值2 界值表,得 p>0.05查 统计推断按 =0.05水准,不拒绝 H0,差别无统计学意义,尚不能认为两种免疫学方法的阳性率有差别。第八章1 答:适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。.2 答:属于非参数检验。因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。但本题即使 n1 > 10,n2 n1
27、 > 10 时采用的是 u 检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。3 答:有序分类资料可做秩和检验、等级相关分析。4 答:(一)建立检验假设H0:两种药的治疗效果总体分布相同;H1:两种药的治疗效果总体分布不同; 0.05;(二)编秩和求秩和 T两组治疗心绞痛疗效比较人数合计秩次平均秩和疗效缓释片普通片范围秩次缓释片普通片(1)(2)( 3)( 4)( 5)( 6)( 7)( 8)显效6235971974930381715有效18314998 14612221963782无效51419147 1651567802184加重347166 172169507676合计n
28、1 88n28417265218357(三)计算检验统计量T由于 n1 > n2 , 则取 n2 组的秩和为 T,故检验统计量T T2 8357。(四)确定P 值,做出推断结论由于 n2>10 ,T 分布已接近均数为 n1 (N 1)/2,方差为 n1 n 2 (N 1)/12 的正态分布,按书上式( 8.3)( 8.4)求出 uc =3.7439uc > 2.56, P<0.01, 按 0.05 水准拒绝 H0,接受 H1,差异有统计学意义。可以认为缓释片和普通片治疗心绞痛的疗效有差别。5 答:(一)建立检验假设H0:治疗前后HCG 值的总体分布相同;H1:治疗前后
29、HCG 值的总体分布不同; 0.05;(二)计算检验统计量T肿瘤患者灌注治疗前后HCG 值病例号治疗前治疗后差值秩次(1)( 2)(3)(4)(5).1128000021000010700007275500330072200631245022101024044150000093149990785100002500750026970012038497371558848251076358422391433091T 36T 0本例 T 36 ,T 0,任取 T 或(T )作为检验统计量T,本例取 T 36 。(三)确定P 值,做出推断结论由于 n<50 ,查附表 9, T 界值表。本例n8,
30、T 36,查附表 9,得 0.05 时的 T 界值为 531,T 在双侧界值范围外,故P<0.05。按 0.05 水准拒绝H0,接受H1 ,差异有统计学意义。可以认为肿瘤患者灌注治疗前后HCG 值有差别。6 答:(一)建立检验假设H0:三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;H1 三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同; 0.05;(二)计算检验统计量T卵巢功能异常患者血清中促黄体素的含量卵巢发育不良秩次丘脑性闭经秩次垂体性闭经秩次(1)( 2)(3)( 4)(5)(6)44.10246.71104.597.542.50233.3262.75540.50224.597.511.141638.31211.6715.98935.762010.51141.90335.12199.4511.52.10433.60181.7429.4511.531.381710.211310.8615Ri1646571ni888按书上式( 8.5)求出 H=15.4184(三)确定P 值,做出推断结论由于 k=3,每
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人民币定期赠与合同范本8篇
- 2025年安徽速写考试题目及答案
- 2025年初中英语期末真题及答案
- 2025年高级电子商务师考试试题及答案
- 成都个人与公司技术合同4篇
- 5C培训模拟试题及答案、重症医学专科资质培训班模拟考试试题
- 2025年中医康复考试题及答案
- 2025年煤矿安全实务试题及答案
- 2025年【金属非金属矿山(地下矿山)主要负责人】考试试卷及答案及金属非金属矿
- 药学专业考研试题及答案
- 综合性医院疼痛科建设课件
- WES溢流堰堰面设计
- 水产品安全控制
- 养老服务公司经营范围(41个范本)
- 青少年脊柱侧弯筛查课件
- 北京十一学校2+4模式
- 第四章 解离平衡
- 小学生仪容仪表课件
- 初中语文中考复习 专题01 名著阅读之《朝花夕拾》(课内文言文+课外文言文)-2022年中考语文一轮复习黄金考点讲练测
- GB/T 38207-2019中国地理实体通名汉语拼音字母拼写规则
- GB/T 14181-2010测定烟煤粘结指数专用无烟煤技术条件
评论
0/150
提交评论