医学统计学课后答案_第1页
医学统计学课后答案_第2页
医学统计学课后答案_第3页
医学统计学课后答案_第4页
医学统计学课后答案_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数 。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。中位数与百分位数:中位数就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈

2、偏态分布或不规那么分布时集中位置的描述,也适用于开口资料的描述。所谓“开口资料,是指数据的一端或者两端有不确定值。百分位数是一种位置指标,以表示,一个百分位数将全部观察值分为两个局部,理论上有X的观察值比小,有100观察值比大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差与标准差最为常用。极差,记为R,又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,

3、简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。四分位数间距 就是上四分位数与下四分位数之差,即:Q ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。极差与四分位数间距均没有利用所研究资料的全部信息,因此仍然缺乏以完整地反映资料的离散程度。方差与标准差 由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。变异系数 ,亦称离散系数 ,为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位

4、,常用于比拟度量单位不同或均数相差悬殊的两组或多组资料的离散程度。3.答:常用的相对数指标有:比,构成比与率。比,又称相比照,是A、B两个有关指标之比,说明A为B的假设干倍或百分之几,它是比照的最简单形式。其计算公式为率()又称频率指标,用以说明某现象发生的频率或强度。常以百分率()、千分率()、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:构成比() 又称构成指标,它说明一种事物内部各组成局部所占的比重或分布,常以百分数表示,其计算公式为:4.答:当比拟两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况

5、下,直接进展两个总率的比拟,会产生错误的结论。此时,必须首先设法消除这种内部构成上的差异,才能进展比拟。统计学上将这种方法称为率的标准化( ),即采用统一的标准对内部构成不同的各组频率进展调整与比照的方法,调整后的率为标准化率,简称为标化率。5(1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;组段频数 频率(%);累计频数(%)组中值108311110114221173812020123181512671291322100合计120100(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?答:用均数较好.(3) 计算极差、标准差,用何者表示这组数据的离散趋势好?用

6、标准差表示较好.6答:本例频数分布为偏态分布,长尾拖向x轴正方向,故为正偏态。适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。7.40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平均滴度。抗体滴度1:41:81:161:321:641:1281:2561:512人数156271045几何均数:(4)+5×(8)+16×(16)+2×(32)+7×(64)+10×(128)+4×(256)+5×(512)/40)1288.答:此医生的分析是不正确的,原因在于:首先明确率的定义:发病率的分子为“某

7、时期内发病人数,而被观察对象某时期内可能发病屡次,所以发病人数是人次数;分母为“同时期平均人口数,而按率的定义应为“同时期暴露总人数该单位抽样检查2839名职工,其中高血压患者中,男性是178例,女性是49例,共227例,可以计算高血压患者占承受检查所有职工的构成比为7.995773%至于40岁以上的患者占承受检查总人数的90.3%,也是构成比;60岁以上者占承受检查总人数的10.2%也是构成比,不能与发病率混为一谈。关于高血压与性别有关的结论也不妥。因为在承受检查人群中的男女内部构成比是不同的,要进展比拟首先要设法消除内部构成比的差异,即就是率的标准化,然后比拟。第三章1 正态分布与标准正态

8、分布的区别: 正态分布是一簇单峰分布的曲线,与可以有任意取值;标准正态分布是一条单峰曲线,与有固定的值,=0,=1。2 u = ()/= (-)/= -1查标准正态分布表,得(-1)=0.1587,所以小于-者所占的比例为15.87%。3 医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范围。选定同质的正常人作为研究对象。所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。 确定原那么:选定同质的正常人群作为研究对象 控制检测误差 判断是否分组 单、双侧问题 选择百分界值 确定可疑范围方法:正态分布法:适用于服从正态分布或近似正态分布的资料 百分位数法:适用于不

9、服从正态分布的资料 对数正态分布法:适用于对数正态分布的资料4 如果资料服从正态分布,那么双侧95%正常值范围为±1.96;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。 8人以上的概率:6 二项分布的应用条件:观察单位只能有互相对立的两种结果之一。 发生某一结果的概率不变,其对立结果的概率那么为1- n次试验在一样的条件下进展,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。7 二项分布与正态分布之间的关系:随着n的增大,二项分布逐渐逼近正态分布。当n较大时,二项分布B(n,)近似正态分布。 举例:病人的治愈与不治愈,理化检

10、验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。第四章1 标准差标准误不同:意义上:描述一组变量值的离散程度描述样本均数的离散称度应用上:1、标准差越小,说明变量值围绕均值分布越严密,均数的代表性越好。1、标准误越小,说明样本均数与总体均数的差异越小,用样本均数估计总体均数的可靠性越大。2、估计变量值的分布范围。2、用估计总体均数的可信区间。与n的关系:n越大,标准差越稳定n越大,标准误越小一样:1、都是描述变异度的统计指标2、 与成正比,与成反比;3、n一定时,同一组资料,标准差越大,标准误也越大。2 水准是在假设检验之

11、前确定的,说明按不超过多大的误差为条件作结论,是犯型错误的最大风险,是事前概率;P值是指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝H0,是事后概率。3 配对设计的差值的总体均数的可信区间表达公式: 两均数差值的总体均数的可信区间表达公式: 可以用可信区间答复假设检验的问题。可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。例如:样本均数与总体均数的比拟,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含的总体均数,即可推断该样本是否来自均数的总体;用假

12、设检验的方法,先假设样本均数代表的总体均数等于某的总体均数,再判断样本提供的信息是否支持这种假设。 4 拒绝实际上成立的H0,这类“弃真的错误称为型错误或第一类错误;不拒绝实际上是不成立的H0,这类“存伪的错误称为型错误或第二类错误。第一类错误的概率用表示,第二类错误的概率用表示。越大,越小;反之,越小,越大。拒绝H0,只可能犯第一类错误,不可能犯第二类错误;不拒绝H0,只可能犯第二类错误,不可能犯第一类错误。由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。5 t检验的应用条件:独立性、正态性、方差齐性。 u检验的应用条件:适用于大样本资料。 t检验与u检验的关系:随自由度的增

13、加,t分布逐渐趋向于标准正态分布。因此u检验是t检验的一种近似检验方法。当自由度大于50时,近似程度比拟满意。6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。 假设检验应注意的问题: 要有严密的抽样研究方案:要保证样本是从同质总体中随机抽取,除了比照的因素外,其他影响结果的因素应一致。 选用的假设检验方法应符合应用条件。 结论不能绝对化。 正确理解差异有无显著性的统计意义:差异有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差异;差异无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信

14、它。 统计学意义与其他专业上的意义不同。7 H0:矽肺患者的血红蛋白与安康人一样,即=0 H1:矽肺患者的血红蛋白与安康人不同,即0t = = = 10-1=9,t0.05,9=2.262<t,p<0.05,拒绝H0,承受H1,差异有统计学意义,可以认为矽肺患者的血红蛋白与安康人不同。8 H0:新药与常规药物的疗效没有差异,即1=2 H1:新药与常规药物的疗效不同,即12 =1.2823 12-2=20-2=18,t0.05,18=2.101<t,p>0.05,不拒绝H0,差异无统计学意义,尚不能认为新药与常规药物的疗效不同。9甲药:H0:甲药无效,即0 H1:甲药有效

15、,即d0= 10-1=9,t0.05,9=2.262<t,p<0.05,拒绝H0,承受H1,差异有统计学意义,可以认为甲药有效。 乙药:H0:乙药无效,即0 H1:乙药有效,即d0= 10 -1=9,t0.05,9=2.262<t,p<0.05,拒绝H0,承受H1,差异有统计学意义,可以认为乙药有效。 H0:甲乙两药的疗效没有差异,即1=2 H1:甲乙两药的疗效有差异,即1212-2=20-2=18,t0.05,18=2.101>t,p>0.05,不拒绝H0,差异无统计学意义,可以认为甲乙两药的疗效没有差异。第六章1不满足正态近似条件,所以采用直接计算概率法

16、。 H0:加维生素C的治愈率与不加一样,即=0 H1:加维生素C的治愈率高于不加维生素C,即>0 不拒绝H0,差异无统计学意义,可以认为加维生素C的治愈率与不加一样。2满足正态近似条件,采用正态近似法。 H0:经安康教育后的高血压患病率与以前一样,即=0 H1:经安康教育后的高血压患病率比以前降低,即<0u>u0.05,单侧 p<0.05,拒绝H0,承受H1,差异有统计学意义,可以认为经安康教育后的高血压患病率与以前有差异。3建立检验假设与确定检验水准 H0:男女大学生感染对其心理影响一样,即1 =2 H1:男女大学生感染对其心理影响不同,即12 计算检验统计量 2=2

17、*()()()() =1 确定p值 查2统计推断按=0.05水准,拒绝,承受H1,差异有统计学意义,可以认为感染对不同性别的大学生在心理行为方面的影响不同。4建立检验假设与确定检验水准 H0:两组的治愈率相等,即1 =2 H1:两组的治愈率不等,即12 准确概率法序号治愈人数未愈人数缓解率p1与p212|概率P(i)1170213216131231524114143510513469612578711687810796998105108911411710123126111321351214114413150P(i)统计推断 按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两组治愈率有

18、差异。5建立检验假设与确定检验水准 H0:治疗三种类型病人的有效率一样,即1 =2 =3 H1:治疗三种类型病人的有效率不等或不全相等。 计算检验统计量= 286*712 + 272 +1042 + 422 + 242 +182 199*98 87*98 199*146 87*146 199*42 87*42 确定p值 查2 统计推断 按=0.05水准,不拒绝H0,拒绝H1,差异无统计学意义,尚不能认为治疗三种类型病人的有效率有差异。6建立检验假设与确定检验水准 H0:该三种人群有一样的血型分布,即1 =2 =3 H1:该三种人群的血型分布不等或不全相等。 计算检验统计量 9312*6792

19、+1342 + +4352 3720*1883 788*1883 546*6522 确定p值 查2统计推断 按=0.05水准,拒绝H0,承受H1,差异有统计学意义,可以认为三种人群的血型分布不等或不全相等。7建立检验假设与确定检验水准 H0:两种检验方法的结果一样,即总体 H1:两种检验方法的结果不同,即总体BC 计算检验统计量 确定p值 查2统计推断 按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种免疫学方法的阳性率有差异。第八章1 答:适用于有序分类资料、偏态分布资料、 变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。2答:属于

20、非参数检验。 因为参数检验针对的是总体变量服从某种分布,即具有某个的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进展估计或检验。但此题即使n1 > 10,n2n1 > 10时采用的是u检验,但它比拟的是分布而不是参数,所以它还是属于非差数检验。3 答:有序分类资料可做秩与检验、等级相关分析。4 答:一建立检验假设H0:两种药的治疗效果总体分布一样; H1:两种药的治疗效果总体分布不同; 0.05; 二编秩与求秩与T 两组治疗心绞痛疗效比拟疗效1 人数合计4秩次范围5平均秩次6 秩与缓释片 2普通片3缓释片 7普通片 8 显效有效 无效 加重62 18 5 3 3

21、5 31 14 4 97 49 19 719798146147165166172 49 122 156 16930382196780507 1715 3782 2184 676 合计n188n284172 6521 8357三计算检验统计量T 由于n1 > n2 , 那么取n2 组的秩与为T,故检验统计量TT28357。 四确定P值,做出推断结论 由于n2>10 ,T分布已接近均数为n1 (N1)/2,方差为n1 n2 (N1)/12的正态分布,按书上式8.38.4求出 0,承受H1,差异有统计学意义。可以认为缓释片与普通片治疗心绞痛的疗效有差异。5 答:一建立检验假设H0:治疗前

22、后值的总体分布一样; H1:治疗前后值的总体分布不同; 0.05; 二计算检验统计量T 肿瘤患者灌注治疗前后值病例号 1 治疗前 2 治疗后 3 差值4秩次5 1 2 3 4 5 6 7 8 1280000 75500 12450 1500000 10000 9700 15588 4223 210000 3300 2210 93 2500 1203 4825 914 1070000 72200 10240 1499907 7500 8497 10763 3309 7 6 4 8 2 3 5 1 T 36 T 0本例T 36 ,T 0,任取T 或T 作为检验统计量T,本例取T 36 。三确定P值

23、,做出推断结论0,承受H1,差异有统计学意义。可以认为肿瘤患者灌注治疗前后值有差异。6 答:一建立检验假设H0:三种卵巢功能异常患者血清中促黄体素的含量的总体分布一样; H1三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全一样或全不一样; 0.05; 二计算检验统计量T卵巢功能异常患者血清中促黄体素的含量卵巢发育不良 1秩次 2 丘脑性闭经 3 秩次 4 垂体性闭经 5秩次6 24 23 22 21 20 19 18 17 10 6 1 14 2 13 5 16 9 3 4 15 164 8 65 8 71 8三确定P值,做出推断结论0,承受H1,差异有统计学意义。可以认为三种卵巢功能异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论