医学统计学三(共7页)_第1页
医学统计学三(共7页)_第2页
医学统计学三(共7页)_第3页
医学统计学三(共7页)_第4页
医学统计学三(共7页)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学(yxu)统计学复习题三一、名词解释可信区间(q jin) (1)按一定(ydng)的 HYPERLINK /view/45320.htm t /_blank 概率或 HYPERLINK /view/1613755.htm t /_blank 可信度(1-)用一个区间来估计 HYPERLINK /view/50441.htm t /_blank 总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-)称为 HYPERLINK /view/1613755.htm t /_blank 可信度或者 HYPERLINK /

2、view/434404.htm t /_blank 置信度(confidence level),常取95%或99%。(2)置信区间是指由 HYPERLINK /view/3962171.htm t /_blank 样本统计量所构造的总体参数的估计区间。在 HYPERLINK /view/50313.htm t /_blank 统计学中,一个 HYPERLINK /view/45320.htm t /_blank 概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的 HYPERLINK /view/364109.htm t /_blank 区间估计。置信区间展

3、现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。置信区间的两端被称为置信 HYPERLINK /view/17644.htm t /_blank 极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。统计推断 推断统计是研究如何利用样本数据来推断总体特征的统计方法。其包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。做法包括:1.假设检验:原假设和对立假设。2.单边检验与双边检验。3.抽样误差计算4.p-值决策5.效应

4、量计算。3.参数估计 parameter estimation根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。 点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。 区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。估计量的评价标准:(1)无偏性,(2)一致性,(3)有效性,(4)充分性。构成比 构成比(constituent ratio)表示某事物内部

5、各组成部分在整体中所占的比重,常以百分数表示,计算公式如下:构成比=(某一组成部分的观察单位数/同一事物各组成部分的观察单位总数)X100%率率,rate,频率指标或强度指标。它表示某现象发生的频率和强度。,说明(shumng)某现象实际发生的例数占可能发生某现象的比值。公式(gngsh): (一)古典(gdin)概率是最简单的随机现象的概率计算。(二)统计概率上述“事件”是指不能再进行分解或不能由其它事件构成的基本事件。抽样误差指在遵循了随机原则的条件下,不包括等级误差和系统误差在内的,用样本指标代表总体指标而产生的不可避免的误差,由于总体平均数、总体成数是唯一确定的,而样本平均数、样本成数

6、是随机变量,因而抽样误差也是一个随机变量。抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差说明样本指标与总体指标的相差范围,因此,它总是推断总体指标的依据。抽样误差是统计推断固有的,无法避免,但可以运用数学公式计算。因此,抽样误差也称为可控制的误差。直线相关系数 如果通过绘制散点图,发现两变量存在线性相关,就可以进一步计算相关系数来定量描述两变量相关程度。直线相关系数又称积差相关系数,常用r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两变量间,相关关系的密切程度与相关方向的统计指标。其公式为:相关系数的特点是:1)没有单位,2)取值范围是-1r1。当两变量

7、呈同向变化,0r1,为正相关;两变量呈反向变化,-1r0,为负相关;r0,为零相关,表示无直线相关。二、单项选择1.观察单位为研究中的( D )。A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标2.总体是由( D )组成。A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标3.抽样的目的是( B )。A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊(tsh)个体的特征4.参数(cnsh)是指( D ) 。A.参与个体数B.总体中研究对象的总和(zngh)C.样本的统计指标D.样本的总和E.总体的统计指标5

8、.关于随机抽样,下列哪一项说法是正确的( A )。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.抽样的目的是( B )。A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征7.表示总体均数的符号是( B ) 。A. B. C.X D.S E.M8.下述( C )种资料为计量资料。A.血型 B.性别 C.抗体滴度 D.肝炎发病人数 E.职业9.以下适宜描述计量资料离散趋势的

9、指标有( B )。A.均数、标准差、方差 B.极差、标准差、中位数 C.均数、中位数、变异系数 D.标准差、四分位数间距、变异系数E.几何均数、标准差、变异系数10.描述一组分布不清的偏态分布资料的集中位置用( A )。A.中位数 B.均数 C.极差 D.几何均数 E.标准差11.方差分析的应用条件为( D )。A.随机性 B.正态性 C.方差齐性 D.A+B+C E.以上都不对12.在方差分析中,如果P,则结论为( C )。A.各个总体均数全相等B.至少有两个总体均数不等C.至少有两个样本均数不等D.各个样本均数不全相等E. 各个总体均数不全相等13.某地某年肝炎的发病人数占同年传染病人数的

10、10.1%,该指标为( B )。A.率B.构成比C.发病率D.集中趋势E.时点患病率14.已知男性的钩虫病感染率高于女性。要比较两地居民的钩虫总的感染率,但是两地的性别构成不同,适当的比较方法是( D )。A. 分性别进行比较B. 两个率比较的x2检验C. 不具有可比性,不能比较D. 对性别进行标准化后再比较E. 作两个率差别的假设检验15. x2分布的形状( D )。A.同正态分布B.同t分布C.为对称分布D.与自由度有关E.与样本量n有关16. 当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数( C )。A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增

11、减17. RC表x2检验的自由度为( D )。A.R-1 B.C-1C. RC-1 D.(R-1)(C-1) E.RC-218.对统计图和统计表标题(biot)的要求是( D )。A. 两者标题都在上方(shn fn) B.两者标题都在下方 C.统计表标题在下方,统计图标题在上方D.统计表标题在上方,统计图标题在下方(xi fn) E. 可由研究者随意设定位置19. 要反映某一城市连续五年甲肝发病率的变化情况,宜选择的统计图是( B )。A.直条图 B.线图 C.直方图 D.圆图 E.散点图20. 描述某地某年流行性乙脑患者的年龄分布,宜选择的统计图是( A )。A.直方图 B.线图 C.直条

12、图 D.圆图 E.箱式图21.实验研究中设立实验组和对照组的原则是( D )。A. 实验因素和非实验因素在两组中均不同B.实验因素和非实验因素在两组中均相同C.实验因素在两组中齐同,非实验因素在两组中不同D.实验因素在两组中不同,非实验因素在两组中齐同E. 以上都不是三、简答题1.x2检验用于解决哪些问题?X2检验亦称 HYPERLINK /view/852140.htm t /_blank 卡方检验。统计学中 HYPERLINK /view/1445854.htm t /_blank 假设检验的方式之一。x是一个希腊字母,x2可读音为卡方,所以译为 HYPERLINK /view/85214

13、0.htm t /_blank 卡方检验。 HYPERLINK /view/852140.htm t /_blank 卡方检验主要用于定类或 HYPERLINK /view/6638513.htm t /_blank 定序变量的 HYPERLINK /view/1445854.htm t /_blank 假设检验,在社会统计中应用非常广泛。卡方检验的步骤一般为:(1)建立假设,确定显著水平a与自由度df、查x2值表得到否定域的临界值;(2)由样本资料计算x2值;(3)将计算所得的x2值与临界x2值(负值都取绝对值)作比较,若计算值大于临界值,则否定0;反之,则承认0。计算卡方值的公式一般可表示

14、为:x2=(fofc)2/fc式中:fo表示实际所得的次数,fc表示由假设而定的理论次数,为加总符号。四格表x2检验的应用条件有哪些?A为实际数值,T为理论数值, n为总病例数。 当1T5,而n40时,应校正. T1或n40时,也应校正。标准差和标准误在应用上有何区别? 标准差和标准误都是变异指标,但它们之间有区别,也有联系。 区别:概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差; 用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。 它们与样本含量的关系不同: 当样本含量 n 足够大时,标准

15、差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。叙述(xsh)正态分布的特征。均匀(jnyn)变动性:1)集中性:正态曲线(normalcurve)在横轴上方(shn fn)均数处最高,是均数所在位置。2)对称性:正态分布以均数为中心,左右对称,曲线两端永不与横轴相交。3)均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线

16、越尖峭。通常用表示均数为,方差为的正态分布。用N(0,1)表示标准正态分布。5.某市1990年肝炎发病数占总的传染病发病数的18.1%,而2000年为22.6%,能否认为6年来肝炎的防治工作无明显的成效?为什么? 不能认为无明显成效。因为所占比例是定量资料,而且是百分比,以这类资料来评价成效是不科学的。6.医学实验为什么常常要设立对照组,常用的对照形式有哪些(至少写出三个)?对照是实验所控制的手段之一,目的在于消除无关变量对实验结果的影响,增强实验结果的可信度。临床试验要求设立的对照组与试验组来自同一个受试者群体,两组受试者基本情况相似。对照组的种类有:1).阳性对照以标准方法或常规方法作为对

17、照组,以新方法或需要研究的方法作为试验组。这种对照方法的效率较高,在新疗法或新药物的研究时,试验组和对照组的受试者都能得到治疗。2).阴性对照对照组使用的方法除了试验组的研究因素外医学教|育网搜集整理,其他部分均与试验组相同。如在研究含氟牙膏的防龋作用时,对照组所用的牙膏除了没有氟化物,其他成分都与试验组相同。3).安慰剂对照(duzho)对照组使用的制剂在形状、颜色、味道(wi dao)方面与试验组使用的干扰药物相似,这种对照称为安慰剂对照。安慰剂对照常用于消除主观因素的干扰,包括来自于研究者和受试者的干扰。4).空白对照对照组不使用任何措施。临床试验(shyn)一般不采用空白对照,因为它违

18、反盲法原则。但在某些情况下,盲法试验无法进行,如手术等,此时使用安慰剂对照没有意义,这时可以使用空白对照。除以上这些对照方法以外,还有交叉对照、历史对照、潜在对照等方法。8.平均数主要有哪几种,各自适用范围是什么? (1)算数平均数(),在统计中算术平均数常用于表示统计对象的一般水平,它是描述数据集中位置的一个统计量。既可以用它来反映一组数据的一般情况、和平均水平,也可以用它进行不同组数据的比较,以看出组与组之间的差别。 (2)调和平均数(),调和平均数是标志值倒数的算术平均数的倒数。所以又叫倒数平均数,调和平均数也有简单调和平均数和加权调和平均数两种。 (3)几何平均数,几何平均数是n个比率

19、乘积的n次方根。社会经济统计中,几何平均法适用于计算平均比率和平均速度。 (4)中位数(Me)。中位数是将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值为中位数。中位数将数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。在许多情况下,不易计算平均值时,可用中位数代表总体的一般水平。例如,人口年龄中位数,可表示人口总体年龄的一般水平。 (5)众数(Mo)。众数是总体中出现次数最多的标志值。用字母 表示。四、计算题1. 用甲药小儿重症上呼吸道感染61例,45例有效;用乙药治疗同样病人55例,48例有效,求两组有效率差值的95%可信区间,并作简单推断。 有效率=(61+45)/(61+45+55+48)=51% 率的标准误=3.45%=0.0345 95%可信区间(q jin)40%-1.96(3.45%)40%+1.96(3.45%),即估计(gj)在33.22%46.78%之间已知某地16名21 岁女大学生的平均(pngjn)体重=48.83Kg,标准差S=3.54Kg,求该地21 岁女大学生平均体重的95%医学参考值范围和95%可信区间。本案例自由度V=16-1=15,查表的t0.01/2,15=2.94748.83-2.947*3.54=38.4Kg48.83+2.947*3.54=59.56KgS=*S=0.365*3.54=1.29则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论