远程教育医学统计学习题册参考答案.doc_第1页
远程教育医学统计学习题册参考答案.doc_第2页
远程教育医学统计学习题册参考答案.doc_第3页
远程教育医学统计学习题册参考答案.doc_第4页
远程教育医学统计学习题册参考答案.doc_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海交通大学网络教育学院医学院分院 医学统计学 课程练习册参考答案专业: 公共事业管理(专科)、护理学(专升本)第一章 医学统计中的基本概念一、 单选题1.B 2.A 3.A 4.B 5.C 6.C 7.D 8.D 9.B 10.B 11.D 12. A二、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。2.小概率事件:统计学上一般把P0.05或P0.01的事件称为小概率事件,表示某事件发生的可能性很小,在实际的一次抽样中可认为不会发生。3.总体:根据研究目的性质相同的观察单位的全体。4. 分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。5. 数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。三、问答题1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这类资料一般有度量衡单位。计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。2.什么叫计数资料,它的统计分析方法有哪些(包括统计描述和统计推断)?在科研中,将全体观察单位按照某种性质或特征分组,再分别清点各组中观察单位的个数,这样得到的数据资料称为计数资料。计数资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、常用的相对数描述,相对数包括率、构成比和相对比。统计推断包括率的点估计、区间估计和假设检验。常用的假设检验方法包括:u检验、秩和检验、四格表卡方检验、配对资料卡方检验、行列表卡方检验以及二项分布、泊松分布的检验。3.举例说明总体与样本的关系。总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。4简述3种变量类型的特征。(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。第二章 平均水平(集中趋势)的统计描述一、单选题1. D 2. B 3. A 4. B 5. A 6. C 7. D 8. D 9. C 10. C 11. D 12. C二、名词解释1.几何均数:常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。2.中位数:一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。三、计算题1.2. 几何平均滴度为1:83.平均抗体水平为1:10004.抗体平均滴度为1:7.65. 新生儿均数:3.38 10岁儿童均数:29.56. 平均最高抗体滴度为1:2847. (1) 几何均数为1:96.5(2) 算术均数为14.4 (3)中位数为 (49+89)/2698. 几何平均滴度为1:8 9.10. 故5人的平均血清抗体效价为11000。11.35人血清抗体平均滴度为144。四、问答题1均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。第三章 离散趋势的统计描述一、单选题1. A 2. C 3. B 4. D 5. A 6. B 7. B 8. B 9. C 10.A 11. B 12. A 13. D 14. D 15. B 16. B 17. B 18. A 19. B 20. B 21. D 22. B 23. B 24. A 25. A 二、名词解释1.医学参考值范围:医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。2.变异系数:变异系数(coefficient of variance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。3.四分位间距:第75百分位数(75)称为上四分位数U, 第25百分位数(25)称为下四分位数L,则四分位数间距(quartile interval)QUL。四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。三、问答题1. 标准差用于计量资料中正态或者近似正态分布的统计描述标准差的应用有四个方面:(1)表示个体变异的大小(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误2. 变异系数与标准差的联系和区别是什么? 联系:变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100得到。 区别:在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。而变异系数可以用在以上两个条件任意一个不能满足的情况。3. 正态分布的特征是什么?正态分布有如下特征:正态分布曲线在在横轴上方均数处最高;正态分布以均数为中心,左右对称;正态分布上有两个参数:均数和标准差,均数是位置参数,决定正态曲线的中心位置,越大,曲线越向右移动;越小,曲线越向左移动,标准差是形状参数,决定正态分布曲线的陡峭或扁平程度,越小,表示数据越集中,曲线越陡峭,越大,表示数据越分散,曲线越扁平;正态分布曲线下的面积分布有一定的规律。4.全距、四分位数间距、方差、标准差、变异系数各有何特点? (1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。5制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选用恰当的方法估计参考值范围。四、计算题1. 2. 3. (1) 因此收入变异最大的是农民工(2)4. (1) 故收入的变异大于年龄(2)5. 6. 体重变异大于身高7. 口腔压力波幅的变异加阻前大于加阻后8. 第四章 抽样误差与假设检验一、单选题1. A 2. A 3. C 4. A 5. B 6. C 7. B 8. C 9. C 10 . D 11. A 12. C 13. C 14. C 15. C 16. B 17. A 18. A 19.C 20. D 21.C 22. B 23. C 24. D 25. C 26. B 27. D 28. C二、名词解释1. 标准误:为了与前面所述的一般变量值与均数的离散程度的指标-标准差相区别,我们把样本均数的标准差称为标准误,用 表示。标准误愈大,样本均数的抽样误差愈大;标准误愈小,样本均数的抽样误差愈小。2. 统计推断:在医学研究中,常常是采用抽样研究的方法,即从总体中用随机的方法抽取部分个体(样本)进行研究,目的是用样本的信息推论总体的特征,这在统计学上称为统计推断。3. 检验水准: 检验水准也称显著性水准,符号为,是假设检验时发生第一类错误的概率三、问答题1. 标准误的用途?(1)可用于反映样本均数的可靠性。标准误小表示样本均数与总体均数较接近,用样本均数代表总体均数的可靠程度较大;反之标准误大,则表示用样本均数代表总体均数的可靠程度较小。(2)可用于估计总体均数的可信区间。(3)可用于均数的假设检验。2. t分布的特征是什么?分布有以下特征:以0为中心,左右对称 ;分布曲线形态与(确切地说与自由度)大小有关。与标准正态分布曲线相比,自由度愈小,分布曲线愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高;自由度愈大,分布曲线愈接近正态分布曲线,当自由度= 时,分布曲线为标准正态分布曲线。3. 标准差与标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: 概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。4. 参考值范围与可信区间有何区别?(1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。 (2)计算方法不同: 参考值范围用计算。可信区间用或计算,前者用标准差,后者用标准误。5. 何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤: 建立假设:包括: H0,称无效假设;H1: 称备择假设; 确定检验水准:检验水准用表示,一般取0.05; 计算检验统计量:根据不同的检验方法,使用特定的公式计算;确定P值:通过统计量及相应的界值表来确定P值;推断结论:如P,则接受H0,差别无统计学意义;如P,则拒绝H0, 差别有统计学意义。四、计算题1.当地女子体温总体均数的95可信区为2.当地男子脉搏总体均数的95可信区间为3. 金融行业收入均数的95可信区间为农民工收入均数的95可信区间为公司普通职员收入均数的95可信区间为4.100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。请分别计算护士年龄和收入的总体均数95可信区间。护士年龄总体均数95可信区间为护士收入总体均数95可信区间为5.体重总体均数的95可信区间为身高总体均数的95可信区间为6. 7. 自由度 = n 1 = 10-1 =9 ,查界值表得= 2.262 =(3.212.2620.149,3.21 +2.2620.149) =(2.87,3.55 ) 即该地男孩出生体重均数的95%可信区间为2.87 3.55kg 。8. 该地健康女性血红蛋白总体均数95的可信区间为1389. 总体均数的95%可信区间为: 即:(92.1,93.5) 即该地3岁女孩身高总体均数的95%可信区间为92.193.5cm。第五章 t检验一、单选题1. B 2.C 3. D 4. A 5. C 6. D 7. C 8. B 9. A 10 .C 11. D 12. C 13. A 14. D 15. C 二、问答题1. t检验、u检验的应用条件各是什么?t检验的应用条件是:未知而且n较小时,要求样本来自正态总体;两小样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件是:已知;未知但样本含量较大。2.在医学研究中,常见的配对设计资料有哪些情况?配对的两个受试对象分别接受两种处理的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪器等)检验的结果。此类设计的目的是推断两种处理(方法等)的结果有无差别。三、计算题1. (1)建立假设 0 :0 =4.4,1:0 =0.05 (2)计算值 =6.5,0 =4.4,S=0.7,n=15。代入公式(15.12)。 (3)确定P值和作出推断结论。 0.05,14 =2.145,本例=11.6670.05,14 =2.145,所以,P0.05。 因P0.01,7 =3.499,所以,P0.01。因Pt0.05/2,22=2.07 pt0.05(9),Pt0.05(9),P0.05,按a=0.05检验水准,拒绝H0,认为不同药物对病人的呼吸频率有影响。6. 7.8. 9.(1)x1.96s=3.286 1.96 * 0.438 =(2.16, 4.42)KG (2)(3)4.51KG超过了99%的医学参考值范围,所以该男婴超重(4)建立假设: H0:m1m=2, H1:m1m2, =a0.05 计算u值 :u 0.05差异无统计学意义,故市区和郊区男婴出生体重没有差别(5)1. 建立假设: H0:m=m0, H1:mm0, =a0.05 2.计算u值 :u 2.58 所以 pt0.05(9),Pt0.05(9),Pt0.05(18), P,故P50且n,np5)凡是能使用u检验进行两个率比较的资料,都可以使用检验,同一资料二者是等价的即u2=(=1)。(2)u检验和检验都存在连续性校正问题。不同点:(1)由于正态分布可确定单、双侧检验界值,当满足正态近似条件时,可用u检验进行单侧检验。(2)满足四格表u检验的资料,计算两率之间的95%可信区间,还可分析两度之差有无实际意义。(3)检验不可用于检验22配对资料的关联性。四、计算题1. 2. 34. (1)检验假设H0:男女同学近视眼患病率相同 H1:男女同学近视眼患病率不相同 (2)计算统计量计算各格子的理论频数:故(3)确定P值、下结论 四格表的自由度,=(2-1)(2-1)=1,按查界值表, 故P3.84,P40且Tmin=18*11/45=4.4故应该用校正公式1建立假设: H0:1 = 2 H1: 1 2 0.052 =0.61 2 0.05(1) = 3.84, P 0.05,差异无统计学意义, 认为两药疗效没有差异。8. 1、建立假设:H0: 三种药物疗效相同H1:三种药物疗效不同或不全相同 =0.05自由度=(3 1)(2 1) = 2 2 =15.56 2 0.05(2)=5.99 P0.05,差异有统计学意义, 按=0.05水准, 拒绝H0, 可以三种药物疗效不同或不全相同。9. 对于非表格资料会整理成典型的四格表资料剂量 死亡 未死 合计一 14 11 25二 5 13 18合计 19 24 43首先n40且Tmin=18*19/43=7.95故可以用专用公式1建立假设: H0:1 = 2 H1: 1 2 0.052 =3.38 2 0.05(1) = 3.84, P 0.05,差异无统计学意义, 认为两剂量对小白鼠致死作用没有差异。第九章 非参数检验方法一、单选题1A 2. C 3. D 4. B 5D 6. B 7. B 8. D 9. B 10 . D 二、问答题1. 参数检验与非参数检验的有何区别,各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高;缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。2. 常见的秩和检验方法有哪些?(1)符号秩和检验的基本思想;(2)成组设计的两样本比较的秩和检验;(3)H检验;(4)等级资料的秩和检验。3简述非参数检验的适用资料(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性。三、计算分析题1(1) 该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2) 对资料进行编秩;见表 (3) 该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组 39.5 (4) 写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。 H1: 两组生存时间的总体分布是不相同的第十章 线性相关与回归一、单选题1.B 2.C 3.D 4.B 5.A 6.A 7.D 8.B 9.B 10.B 11.D 12.B 13.C 14.C 15.B 16. A二、名词解释1. 直线相关:是探讨服从双变量正态分布的两个变量间有无相关关系的一种统计分析方法。当一个变量X增大或减少,另一个变量Y亦相应地增大或减少,两变量在散点图呈直线趋势,此时这两个变量间可能存在线性相关关系。2. 直线回归:是探讨两个变量间依存关系的一种统计分析方法。它是根据观察的两个变量的数据资料得到两个变量间关系的直线回归方程并确定一条回归直线,用于描述两个变量间变化的数量关系。回归分析的主要任务是确定自变量与应变量的依存关系。3. 线性相关系数:又称积差相关系数,简称相关系数,是描述两个变量间线性相关关系的密切程度与方向的统计指标。样本的相关系数用r来表示,总体相关系数用表示。4样本回归系数:即回归直线的斜率。表示当X变动一个单位时,Y平均变化多少个单位。,表示Y随X增大而增大;,表示Y随X增大而减少;,表示直线与X轴平行,即X与Y无直线关系。三、问答题1直线相关与回归有何联系与区别?联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的t检验与相关系数的t检验其数值相等,即tr=tb。(2)可以用回归解释相关。r的平方称为决定系数(coefficient of determination) 区别:回归要求因变量Y是正态分布的随机变量;X可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称型回归。当X是呈正态分布的随机变量时,此时的回归称为型回归。相关要求变量X、Y都是呈正态分布的随机变量。当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关。2简述进行直线相关回归分析应注意的事项(1)相关分析注意的事项相关系数r是用来描述两个变量间线性相关关系的密切程度和方向的统计指标。所以,如果目的是想定量的描述两个变量间相互关系的密切程度和方向,则应作相关分析。而且,r的绝对值大小,对利用回归方程进行变量预测具有指导意义,如果r的绝对值很小,利用回归方程从一个变量预测另一个变量的值是没有多大意义的。应用相关分析时应注意的问题:进行相关分析时要有实际意义,不能把毫无关联的两事物或现象做相关分析。相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显著性检验。另外,不要把相关系数的显著性误解为两事物或现象相关的强度。关于相关分析的样本的合并与分层问题,应审慎对待。. 散点图在相关分析中具有重要作用,要充分利用。 (2)回归分析的注意事项 作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律。直线回归分析的资料,一般要求因变量Y是来自正态分布总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严格控制的值。进行回归分析时,应先绘制散点图。绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查。回归直线不要外延。3等级相关常于哪些资料?(1)不服从双变量正态分布而不宜作积差相关分析(2)总体分布类型未知(3)原始数据是用等级表示的。四、计算题1.=0.05本例,n=6,r=0.8927 = n-2 = 6-2 =4 tr t0.05(4) =2.776 ,故Pr0.05(6) P0.05,差异有显著意义,按=0.05水准,拒绝H0,认为有相关= 0.679 =0.05r和b的假设检验是等价的,即对同一样本,二者的t值相等,故拒绝H0,认为有回归= 7.14 3.44=3.70回归方程为3. 计算相关系数 从表中,已得出基本数据:,,n=16。代入公式19-1中,可得: =2.6350,=2910,=79.77。建立假设,确定检验水准。H0:两变量间无线性相关关系,即=0;H1:两变量间无线性相关关系,即0;计算检验统计量将n=16, r=0.91097代入公式(19.5),计算检验统计量t得:3查界值表,确定P值,下结论。按自由度,查t界值表,得,P0.01,按水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正相关关系。第十二章 统计表与统计图一、单选题1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论