版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数, 中位数。均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平 均水平的描述。几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态, 各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使 用几何均数(geometric mean)。几何均数一般用 G表示,适用于各变量值之间成倍数关 系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。中位数和百分位数:中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中
2、有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈 偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。 所谓 开口”资料,是指数据的一端或者两端有不确定值。百分位数(percentile)是一种位置指标,以 Px表示,一个百分位数 Px将全部观察 值分为两个部分,理论上有 X%的观察值比Px小,有(100-X) %观察值比Px大。故百 分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。2 .答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标
3、准差最为常用。极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大, 说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如 用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏;2.不稳定。四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Qu Ql ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的 极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述 偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足
4、以完整地反映资料的离散程度。方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了 广泛应用,常用于描述正态分布资料的离散程度。变异系数(coefficient of variance , CV) 亦称离散系数( coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单 位不同或均数相差悬殊的两组或多组资料的离散程度。3 .答:常用的相对数指标有:比,构成比和率。比(ratio),又称相对比,是 A、B两个有关指标之比,说明 A为B的若干倍或百 分之几,它是对比的最简单
5、形式。其计算公式为比=人生率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率 (卜千分 率(%卜万分率(1/万)、十万分率(1/10万)等表示。计算公式为:率 实际发生某现象的观察单位数 比例基数(K)可能发生某现象的观察单位总数构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:如卡山某一组成部分的观察单位数构成比 100%同一事物内各组成部分的观察单位总数4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影 响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况下,直
6、接进行两个总率的比较,会产生错误的结论。此时,必须首先设法消除这种内部构 成上的差别,才能进行比较。统计学上将这种方法称为率的标准化(standardizationmethod of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方 法,调整后的率为标准化率,简称为标化率。5(1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;组段频数频率(%);累计频 数(%)组中值10832.52.5109.5111108.3310.83112.51142218.3329.17115.51173831.6760.83118.51202016.6777.5121.5123
7、39;181592.5124.512675.8398.33126.512913221.67100129.5合计120100vcneuaapr(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?答:X 3 109.5 10 112.5 22 115.5 38 118.5 20 121.5 18 124.5 7 126.5 2 139.5 /120=119,41351 _ _Xg lg lg3 109.5 lg10 112.5 Ig 22 115.5 lg38 118.5 Ig 20 121.5 lg18 124.5 lg7 126.5 Ig 2 139.5 /120= 119,2
8、5125Md 116.63用均数较好.(3) 计算极差、标准差,用何者表示这组数据的离散趋势好?答:极差:22.62四分位数间距:5.915标准差:4.380736用标准差表示较好6.答:本例频数分布为偏态分布,长尾拖向 x轴正方向,故为正偏态。适宜用中位数 表示其平均水平,中位数为 4,四分位数间距为4。7.40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平均滴度。抗体滴度人数1:41:81:161:321:64156271:128101:25641:5125几何均数exp(ln(4)+5 In(8)+16 E(16)+2 lK(32)+7 lK(64)+10 ln(1
9、28)+4 lK(256)+5 ln(512)/40) = 128 8.答:此医生的分析是不正确的,原因在于:首先明确率的定义:率比例基数(K 发病率的分子为 某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病 人数是人次数;分母为 同时期平均人口数”,而按率的定义应为 同时期暴露总人数该单位抽样检查2839名职工,其中高血压患者中,男性是 178例,女性是49例, 共227例,可以计算高血压患者占接受检查所有职工的构成比为7.995773%至于40岁以上的患者占接受检查总人数的90.3%,也是构成比;60岁以上者占接受检查总人数的10.2%也是构成比,不能与发病率混为一谈。关于高
10、血压与性别有关的结论 也不妥。因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消 除内部构成比的差异,即就是率的标准化,然后比较。第三章1正态分布与标准正态分布的区别:正态分布是一簇单峰分布的曲线,和。可以有任意取值;标准正态分布是一条单峰曲线,和6有固定的值,/0片12 U = (X- (1)/ 6二(pjl)/ C-U查标准正态分布表,得中-1)=0.1587,所以小于 归b者所占的比例为15.87%。3医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范 围。选定同质的正常人作为研究对象。所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。
11、确定原则:选定同质的正常人群作为研究对象控制检测误差判断是否分组单、双侧问题选择百分界值确定可疑范围方法:正态分布法:适用于服从正态分布或近似正态分布的资料百分位数法:适用于不服从正态分布的资料对数正态分布法:适用于对数正态分布的资料4如果资料服从正态分布,那么双侧95%正常值范围为± 1.96如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。5 1 人以下的概率:P(x < 1)=P(0)+P(1)=(1bo0.2o0.81o+Ci010.210.89 =0.3758人以上的概率:P(X>8)=P(8)+P(9)+P(10)=O080.280.82+
12、C1090.290.81+C10100.2100.80 =7.79 1056二项分布的应用条件:观察单位只能有互相对立的两种结果之一。已知发生某一结果的概率式不变,其对立结果的概率则为1-nn次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。7二项分布和正态分布之间的关系:随着n的增大,二项分布逐渐逼近正态分布。当nn较大时,二项分布 B(n,汽近似正态分布。举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。第四章1标准差标准误小同:意
13、义上:描述一组变量值的离散程 度描述样本均数的离散称度应用上:1、标准差越小,说明变量 值围绕均值分布越紧密,均 数的代表性越好。1、标准误越小,说明样本 均数和总体均数的差异越 小,用样本均数佶计总体均 数的可靠性越大。2、x u s估计变量值的分布范围。2、用又t 5估计总体均数 的可信区间。与n的关系:n越大,标准差越稳thn越大,标准误越小相同:1、都是描述变异度的统计指标2、 x 一卷 x与x成正比,与jn成反比; n3、n定时,同一组资料,标准差越大,标准误也越大。2 a水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯I型 错误的最大风险,是事前概率;P值是指由
14、H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝Ho,是事后概率。3配对设计的差值的总体均数的可信区间表达公式:d t ,n 1sd2.2两均数差值的总体均数的可信区间表达公式:x1 x2 tni 1 sin2 1S2 11ni n2 2n1 年可以用可信区间回答假设检验的问题。可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角 度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息 估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均数的
15、总体;用假设检验的方法,先假设样本均数代表的总体均数等于某已知的总体均数, 再判断样本提供的信息是否支持这种假设。4 拒绝实际上成立的 H。,这类 弃真”的错误称为I型错误或第一类错误;不拒绝实际上是不成立的Ho,这类存伪”的错误称为n型错误或第二类错误。第一类错误的概率用a表示,第二类错误的概率用 B表示。a越大,B越小;反之,a越小,B越大。拒绝Ho,只可能犯第一类错误,不可能犯第二类错误;不拒绝Ho,只可能犯第二类错误,不可能犯第一类错误。由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。5 t检验的应用条件:独立性、正态性、方差齐性。u检验的应用条件:适用于大样本资料。t
16、检验和u检验的关系:随自由度的增加,t分布逐渐趋向于标准正态分布。因此 u 检验是t检验的一种近似检验方法。当自由度大于50时,近似程度比较满意。6假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。假设检验应注意的问题: 要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因 素外,其他影响结果的因素应一致。选用的假设检验方法应符合应用条件。结论不能绝对化。 正确理解差别有无显著性的统计意义:差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说 它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒 绝原假设的理
17、由还不够充分,并不意味着我们很相信它。 统计学意义与其他专业上的意义不同。7 H0:矽肺患者的血红蛋白与健康人相同,即 科=3Hi:矽肺患者的血红蛋白与健康人不同,即 科W 5=0.05x,x |12.59 14.021 -t = s _ =-2.7743,n 1.63/10V =10-1=9, t0.05,9=2.262<t, p<0.05,拒绝H。,接受H1,差别有统计学意义,可以认 为矽肺患者的血红蛋白与健康人不同。8 H。:新药与常规药物的疗效没有差别,即 H1:新药与常规药物的疗效不同,即园一 22四才2a =0.05=1.2823差别有统计学意义,可以认H0:甲乙两药的
18、疗效没有差别,即(J1= )J2X1 X2Hi:甲乙两药的疗效有差别,即 四子也=i.6022Xi X22222 TXiXiniX2X2n? Jni n? 2ni产ni+n2-2=20-2=I8, to.o5,i8=2.IOI>t, p>0.05,不拒绝Ho,差别无统计学意义,可以认 为甲乙两药的疗效没有差别。第六章I不满足正态近似条件,所以采用直接计算概率法。H0:加维生素C的治愈率与不加相同,即TT =0=0.6Hi:加维生素C的治愈率高于不加维生素C,即汽 >宛5=0.05P(X<8)=1P(X>9)=1P(X=9)-P(X=I0)=I-C i09*0.69
19、*0.4I-Ci0I0*0.6I0*0.40= 0.9536>0.05 不拒绝H。,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。2满足正态近似条件,采用正态近似法。H。:经健康教育后的高血压患病率与以前相同,即=0=0.6Hi:经健康教育后的高血压患病率比以前降低,即 汽 <宛 单侧a =0.05p0u0=4.94535360 i0/nu>U0.05,单侧=i.64p<0.05,拒绝H0,接受Hi,差别有统计学意义,可以认为经健康教育后的高血压患病 率与以前有差别。3建立检验假设和确定检验水准H。:男女大学生HBV感染对其心理影响相同,即 1=能Hi:男女大
20、学生HBV感染对其心理影响不同,即 mW%检验水准a =0.05计算检验统计量x= (ad-bd) 2*n/(a+b)(c+d)(a+c)(b+d)=(250*2I3-246*320)/(250+320)(246+2I3)(250+246)(320+2I3)=9.65Iv =i确定p值查,届值表,得p<0.05统计推断按a =0.05水准,拒绝Ho,接受Hi,差别有统计学意义,可以认为 HBV感染对不同 性别的大学生在心理行为方面的影响不同。4建立检验假设和确定检验水准H0:两组的治愈率相等,即 川=光Hi:两组的治愈率不等,即 mW 2检验水准a =0.05Fisher精确概率法1 丁
21、 P治愈人数未愈人数缓解率p1与P2|p1-p2|概率P(i)11701.0000.8672130.13321610.9410.7413120.20031520.8820.6154110.26741430.8240.4915100.33351340.7650.365690.40061250.7060.239780.46771160.6470.114870.53381070.5880.012960.6009980.5290.1381050.66710890.4710.2621140.733117100.4120.3881230.800126110.3530.5141320.867135120.2
22、940.6391410.933144130.2350.7651501.000P(i)= 0.280>0.05统计推断按a =0.0球准,不拒绝H。,差别无统计学意义,尚不能认为两组治愈率有差别5建立检验假设和确定检验水准H0:治疗三种类型病人的有效率相同,即 8二龙=世Hi:治疗三种类型病人的有效率不等或不全相等。检验水准a =005计算检验统计量 一 222 Ai TiAn 1 iTinRnc=286*(71 + 272+1042+ 422+ 242 +18 -1) =3.6389199*9887*98 199*14687*146199*4287*42确定p值查夕界值表,得p>0
23、.05统计推断按a =0.05水准,不拒绝H。,拒绝Hi,差别无统计学意义,尚不能认为治疗三种类 型病人的有效率有差别。6建立检验假设和确定检验水准H。:该三种人群有相同的血型分布,即 1=能=演Hi:该三种人群的血型分布不等或不全相等。检验水准a =0.05计算检验统计量2Ai T 2A2.n 1 iTinm-1) = 71.180=9312* (6792+1342+ +43523720*1883788*1883546*6522确定p值查:界值表,得p<0.05统计推断按a =0.05水准,拒绝 Ho,接受Hi, 分布不等或不全相等。差别有统计学意义,可以认为三种人群的血型7建立检验假
24、设和确定检验水准Ho:两种检验方法的结果相同,即总体Hi:两种检验方法的结果不同,即总体检验水准a =0.05计算检验统计量B=CBWCb c| 12b c= 1.1364确定p值查:界值表,得p>0.05统计推断按a =0.0球准,不拒绝H。,差别无统计学意义,尚不能认为两种免疫学方法的阳性 率有差别。第八章1答:适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。2答:属于非参数检验。因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而 其中的参数是未知的, 统计分析的目的就是对这些未知参
25、数进行估计或检验。但本题即 使ni > 10, n2-ni > 10时采用的是u检验,但它比较的是分布而不是参数,所以它还是 属于非差数检验。3答:有序分类资料可做秩和检验、等级相关分析。4答:(一)建立检验假设Ho:两种药的治疗效果总体分布相同;Hi:两种药的治疗效果总体分布不同;a= 0.05;(二)编秩和求秩和 T两组治疗心绞痛疗效比较人数秩次疗效缓释片普通片范围秩次缓释片普通片(2)(3)(4)(5)(6)(8)显效6235971-974930381715后效18314998- 14612221963782无效514191471651567802184加重347166172
26、169507676ni 88n2 8417265218357(三)计算检验统计量 T由于ni > n2 ,则取n2组的秩和为T,故检验统计量 T = T2=8357。(四)确定P值,做出推断结论由于n2>10 , T分布已接近均数为 ni(N+1)/2,方差为ni n2 (N+1)/12的正态分 布,按书上式(8.3) (8.4)求出Uc =3.7439uc > 2.56, P<0.01,按 户0.05水准拒绝H。,接受Hi,差异有统计学意义。可以认 为缓释片和普通片治疗心绞痛的疗效有差别。5答:(一)建立检验假设H。:治疗前后HCG值的总体分布相同;Hi:治疗前后HC
27、G值的总体分布不同;a= 0.05;(二)计算检验统计量 T肿瘤患者灌注治疗前后 HCG值病例号治疗前治疗后差值秩次(1)(2)(3)(4)1128000021000010700007275500330072200631245022101024044150000093149990785100002500750026970012038497371558848251076358422391433091T+ = 36 T =0本例T+ =36 , T =0,任取T+或(T)作为检验统计量 T,本例取T+ =36 。(三)确定P值,做出推断结论由于n<50 ,查附表9, T界值表。本例n = 8
28、, T=36,查附表9,得“=0.05时 的T界值为5 31, T在双侧界值范围外,故 P<0.05。按a= 0.05水准拒绝H。,接受 Hi,差异有统计学意义。可以认为肿瘤患者灌注治疗前后HCG值有差别。6答:(一)建立检验假设H。:三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;Hi三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全 不相同;e= 0.05;(二)计算检验统计量 T卵巢功能异常患者血清中促黄体素的含量卵巢发育小良(1)秩次(2)丘脑性闭经(3)秩次(4)垂体性闭经 秩次(6)44.10246.71104.597.542.50233.3262.755
29、40.50224.597.511.141638.31211.6715.98935.762010.51141.90335.12199.4511.52.10433.60181.7429.4511.531.381710.211310.8615Ri1646571ni888按书上式(8.5)求出H=15.4184(三)确定P值,做出推断结论由于k=3,每组例数ni = 9 ,查附表11, H界值表得P<0.01。按0.05水准拒绝H。,接受H1,差异有统计学意义。可以认为三种卵巢功能异常患者血清中促黄体素的 含量有差别。7答:(一)建立检验假设H。:针刺三个穴位的镇痛效果的总体分布相同;H1:针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;E= 0.05;(二)计算检验统计量 T针刺三个穴位的镇痛效果镇痛效果各穴位的观察频数合计(4)秩次 范围(5)平均 秩次(6)各穴位的观察频数合谷(1)足三里 扶突 (3)合谷(1)足三里扶突十3853471381-13869.526413683.53266.5+ +44292396139- 234186.582065408.54289.5+ + +12281959235 293264316873925016+ + + +24163373294 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文书模板-向上级申请资金的报告怎么写
- 初中生实验探究:隔音材料对比实验与分析教学研究课题报告
- 2026年广元市公共交通有限公司面向社会公开招聘公交车辆驾驶员(第一批)的备考题库及参考答案详解
- 2026年上海市青浦区教育系统公开招聘高端教育人才(管理方向)备考题库及完整答案详解
- 儿童Peutz - Jeghers综合征内镜术后并发症处理及外科手术时机选择
- 曲周县医院2026年公开招聘人事代理人员备考题库及1套完整答案详解
- 2026年吉林铁道职业技术学院单招职业技能笔试备考试题及答案解析
- 2026年南京航空航天大学电子备考题库工程学院微波工程创新中心专职科研人员招聘备考题库及答案详解(易错题)
- 2026年选调峡江籍在外事业单位工作人员返乡工作的备考题库及答案详解(夺冠系列)
- 2026年机场集团工程建设指挥部招聘备考题库及参考答案详解一套
- 江苏省高新技术产业统计分类目录
- 协议书代还款协议书
- 全省通信线路培训班通信电缆讲稿教学课件
- 数学人教版五年级上册课件练习二十四
- 高考语文复习二元思辨作文结构模式+课件42张
- 国开电大公共行政学形考任务二答案
- GB/T 33248-2016印刷技术胶印橡皮布
- GB/T 18487.1-2015电动汽车传导充电系统第1部分:通用要求
- 金风科技-风电产业集团-供应商现场作业基础安全考试附答案
- 高三期末考试心态调整和考试技巧指导课件
- 输出DAG的所有拓扑排序序列
评论
0/150
提交评论