统计学复习题_第1页
统计学复习题_第2页
统计学复习题_第3页
统计学复习题_第4页
统计学复习题_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计复习题(一)名词解释:变异总体样本随机抽样抽样误差概率计量资料(数值变量)等级资料计数资料(分类变量)正态分布U分布率的标准化相对数假设检验(二)填空:1、统计工作的基本步骤包括 设计 、 收集 、 整理 和 分析 ,其中最关键的是设计 。2、统计分析包括 统计描述 和 统计推断 。3、误差可分为 系统误差 、 随机测量误差 和 抽样误差 ,其中 抽样误差 不可避免,但可用抽样设计来控制。3、四种基本抽样方法的抽样误差大小顺序为 整群抽样 > 单纯随机抽样 > 系统抽样 > 分层抽样 。4、频数分布的两个重要特征是 集中趋势 和 离散趋势 。5、频数分布可分为 正态分布 和 偏态分布 。6、利用 均数 和 标准差 可全面描述正态分布的频数特征。7、若频数分布明显呈偏态,各观察值之间常呈倍数关系,宜用 几何均数 反映其平均增减倍数。8、比较度量衡单位不同的各组资料的变异度,宜用 变异系数 指标。9、对于两组正态分布资料,且均数相近,度量单位相同, 标准差 大, 均数 的代表性较差。10、正态分布的特征有: 均数为中心对称 ; 中间高两边低 ; 参数包括均数和标准差。11、正常值指 绝大多数正常人的生理生化指标所在范围 。制度正常值范围的方法根据指标的 分布特征 而判断,可有 正态近似 法和 百分位数法 。12、标准误是 样本均数的标准差,与标准差的关系可用公式 表示。13、对于相同的值, 自由度 越大,t,值 越小 ,当=,t,= Z 。14、统计推断包括两个重要方面: 参数估计 和 假设检验 。15、假设检验的目的是推断 被比较的样本或样本与总体参数的差别是抽样误差引起还是总的性质不同引起。16、假设检验结果具有显著性意义,是根据 p而判定的,结论具有 相对性。17、作两样本均数比较的t检验,要求(1) 正态分布 ;(2) 方差齐。18、两个或两个以上样本均数的比较,可用。应用时要求:(1) 独立随机样本 ;(2) 正态分布 ;(3) 方差齐 。19、假设检验时根据检验结果作出的判断,可能发生两种错误,第一类错误的概率为 ,第二类错误的概率为 ,同时减少两类错误的唯一方法是 增大样本量 。20、构成比有两个特点:(1) 内部各构成比之和等于1,(2) 内部构成发生改变影响其他内部构成大小 。21、率的标准化的目的是 消除内部构成不同对总率比较产生的影响 ,常用的计算方法有 直接法 和 间接法 。22、率的标准误Sp= ,是描述 率的抽样误差 的统计指标。23、2检验的基本思想是比较 理论数 和 实际数 的吻合程度,其基本公式是 。24、2的大小由 1A-T1 和 自由度 两方面因素决定。25、四格表2检验的基本数据是两对 实测阳性数 和两对 实测阴性数 。26、四格表2检验的基本条件是 n≥40,T≥1 ,当 5>T≥1 ,需用校正公式。27、配对计数资料2检验的无效假设是 B=C ,2检验的公式是 (b-c)2/(b+c)。28、统计表由 标题 、 标目 、 线条 和 数字 构成。29、绘制统计表要求线条不宜过多,除有 顶 线和 底 线以及 标目下线 线以外,其余如竖线、斜线均不宜有。30、统计图除园图外,长宽比例一般以 5:7 为宜,标题一般标于 图的下方 。(三)单选题1、抽样误差是指BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观察值之间的差别E.测量误差与过失误差的总称2、为了由样本推断总体,总体应该是EA.总体中任意的一部分B.总体中的典型部分C.总体中有意义的部分D.总体中有价值的部分E.总体中有代表性的部分3、随机样本的特点有DA.能消除系统误差B.能消除测量误差C.能缩小抽样误差D.能消除样本偏差E.以上都不是4、搞好统计工作,达到预期目标,最重要的是BA.原始资料要多B.原始资料要正确C.分析资料要先进D.整理资料要详细E.统计计算精度要高5、计数资料、计量资料和等级资料的关系是CA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是6、如果X服从总体均数为,总体标准差为的正态分布,则作u=(x-)/变换后,有DA.u符合正态分布,且均数不变B.u符合正态分布,且标准差不变C.u符合正态分布,且均数与标准差都不变D.u符合正态分布,且均数与标准差都改变E.u不符合正态分布7、某人群的某个生理指标或生化指标的正常值范围一般指CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围8、总体标准差描述的是AA.所有个体值对总体均数的离散程度B.某样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有某个含量相同的样本均数对总体均数的离散程度9、t分布曲线与标准正态曲线比较:CA.中心位置左移B.中心位置右移C.分布曲线平坦一些D.分布曲线陡峭一些E.两尾部翘得低一些10、当数值变量分布末端无确切数据时,平均数宜用CA.均数B.几何均数C.中位数D.相对数E.四分位数11、从同一正态分布总体中随机抽样,理论上95%的样本均数在下述范围内DA.x1.96sxB.1.96sxC.x1.96xD.1.96xE.以上都不对12、下面哪一指标较小时,可说明有样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位间距13、横轴上,正态曲线下从-1.96到的面积为DA.95%B.45%C.97.5%D.47.5%E.49.5%14、两样本均数比较作t检验,差别有显著性时,P值越小,说明CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.第一类错误越大15、假设检验过程中,下列哪一项不可以由研究者事先设定DA.所比较的总体参数B.单侧或双侧C.检验水准D.P值E.以上都不对16、若总例数相同,则配对资料的t检验与成组资料的t检验相比BA.成组t检验的效率高些B.配对t检验的效率高些C.两者效率相等D.两者效率相差不大E.两者效率不可比17、用样本推断正态总体均数的95%可信区间的公式为DA.x1.96sxB.x1.96sC.xt0.05,sD.xt0.05,sxE.以上都不是19、说明某现象发生强度的指标为EA.构成比B.相对比C.定基比D.环比E.率20、相对比所具有的特点是CA.一定要小于100%B.一定大于100%C.可以大于也可以小于100%D.各相对比的和为100%E.以上都正确21、用正态近似法进行总体率的区间估计,应满足DA.n足够大B.p或(1-p)不太小C.np或n(1-p)均大于5D.以上均要求E.以上均不要求22、RC列联表2检验的自由度为EA.R-1B.C-1C.R+C-1D.RC-1E.(R-1)(C-1)23、RC列联表2检验应注意EA.任一格理论数小于5则要用校正公式B.任一各实际数小于5则要用校正公式C.任一格理论数小于5则应将相应组合并D.任一格实际数小于5则应将相应组合并E.以上都不对24、2检验不适用于DA.两个率差别的显著性检验B.两个率差别的显著性检验C.两组或多组构成比差别的显著性检验D.相对比差别的显著性检验E.频数分布拟和优度检验25、已知男性的钩虫感染率高于女性,今欲比较甲、乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是CA.分性别进行比较B.两个率比较的2检验C.对性别进行标准化后在比较D.不具可比性E.用秩和检验26、四个样本率作比较,2>20.01,(3),可认为AA.各总体率不等或不全相等B.各总体率均不相等C.各总体率均相等D.各样本率均不相等E.各样本率不等或不全相等27、用大样本估计总体率的95%可信区间的计算公式为DA.1.96spB.p1.96sxC.1.96sxD.p1.96spE.pt0.05,sp28、计算某年某病的发病率的分子是EA.该年年初有该病人数B.该年年中有该病人数C.该年年末有该病人数D.该年平均患该病人数E.以上都不是29、计算某年总死亡率的分母是BA.年初人口数B.年中人口数C.年末人口数D.年任意时刻人口数E.上年末人口数30、一组1000名女性乳腺癌患者,其中50例为孕妇,据此可推断EA.孕妇易患乳腺癌B.孕妇不易患乳腺癌C.妊娠可诱发患乳腺癌D.乳腺癌与妊娠无关E.该组乳腺癌患者中5.0%是孕妇31、关于显著性检验,下列叙述哪项不正确EA.资料须符合随机抽样的原则B.资料须具有可比性C.t检验条件必须两样本的方差不能相差太大D.相差有显著性说明比较的两样本来自不同总体E.相差有显著性说明比较的两总体差别较大32、以下哪种调查属于可作统计推断的范围BA.普查B.抽样调查C.典型调查D.普查与抽样调查E.非全面调查33、比较某地区某年3种疾病的发病率,可绘制AA.条图B.百分条图C.线图D.半对数线图E.直方图34、不同性质的统计资料,常用不同的统计图加以表达,一般来讲EA.连续性资料宜用直条图B.连续性资料宜用园图或构成图C.按质分组的资料宜用线图D.按质分组的资料宜用直方图或多边图E.以上都不对35、统计分析表有简单表和复合表两种,复合表是指BA.有主词和宾词B.主词分成2个或2个以上标志C.宾词分成2个或2个以上标志D.包含2张简单表E.包含2张或2张以上简单表36、一个调查设计的指标是指DA.调查表的调查项目B.调查表的备考项目C.调查表的调查项目和备考项目D.预期分析指标E.以上都不是37、已知某山区、丘陵、湖区婴幼儿体格发育有较大的差异,现需制度该省婴幼儿体格发育有关指标的正常值范围,调查设计最好采用BA.单纯随机抽样B.分层随机抽样C.整群抽样D.机械抽样E.以上都不是38、不可计算中位数作为代表值的是DA.正偏态分布B.负偏态分布C.分布类型未知资料D.一切非连续性资料E.变量值一端或两端无确定值39---40共用选择A.普查B.抽样调查C.典型调查D.病例对照研究E.定群研究39、欲了解某居民肝癌发病的真实水平,可采用A40、欲估计某地肝癌的死亡率可采用B(四)间答题1、均数、中位数和几何均数的适用范围有何异同?2、列出离散程度的指标,说出它们的应用条件。3、正态分布、标准正态分布与对数正态分布在概念和应用上有何异同?4、医学参考值范围的涵义是什么?确定的原则和方法是什么?5、说出标准差和标准误的联系和区别。6、简述t分布与u分布的联系与区别。8、可信区间和正常值范围有何不同。9、简述第一类错误与第二类错误的区别与联系。10、说出t检验、u检验的应用条件。11、列出常用相对数,并解释其作用。12、简述应用相对数应注意的问题。13、四格表资料与配对计数资料的2检验有何不同?14、行列表资料2检验应注意什么?15、四格表资料的U检验和2检验的应用条件有何异同?16、列出常用统计图,说出它们的应用条件。17、简述制作统计表和统计图的基本要求。18、说出两种变量类型及其含义。试举例说明。(五)计算分析题1、某地某年不同年龄组身高资料如下:年龄组人数均数(cm)标准差(cm)1-2月10056.32.15-6月12066.52.23-3.5岁30096.13.15-5.5岁400107.83.3问:(1)上述资料是否表明6岁以下男童身高的均数和变异度随年龄增长而增加?(2)若以上各年龄组的身高均服从正态分布,试估计上述300名3-3.5岁男童身高在95.0-100.0cm范围内有多少?并确定3-3.5岁男童身高的正常值。(3)试估计3-3.5岁男童身高的总体均数可信区间。(4)若抽样调查100名某山区5-6月男童身高,得均数60.2cm,标准差3.0cm,问山区5-6月男童身高是否与该地5-6月男童身高均数不同。(5)试将该组资料的均数绘制成相应的统计图。2、某地某年肿瘤普查资料整理如下表某地某年肿瘤普查资料年龄人口数肿瘤患者数构成比(%)患病率(1/万)063300019()()30570000171()()40374000486()()50143000574()()6030250242()()合)()据上述资料(1)填充。(2)分析讨论哪个年龄组最易患肿瘤?哪个年龄组病人最多?3、为比较槟榔煎剂和阿的平驱绦虫的效果,对45名绦虫患者进行治疗,其结果如下,问两药疗效是否相同。药物治疗人数有效人数槟榔煎剂2722阿的平1812合计45344、用两种不同剂量的电离辐射照射小白鼠,第一种剂量照射25只,在照射后14天内死亡14只;第二种剂量照射18只,同时期内死亡5只。(1)绘制分析模式图。(2)判断这两种剂量对小白鼠的致死作用是否相同。5.某医师抽样调查了某山区部分健康成年人血红蛋白的含量,结果见表:例数均数标准差标准值男40013.450.7114.02女22511.761.0212.47就上表资料:(1):有人认为女性血红蛋白的抽样误差大于男性?对否?为什么?(2):有人对该山区男、女性血红蛋白的平均值含量与标准误比较得:男:t=16.1p<0.01女:t=10.4p>0.01请作分析。抽样误差指标是标准误根据结果判断,指出是否正确。6.为了了解某乡钩虫病感染情况,随机抽查南500人,感染100人,女200人,感染80人,若全乡人口为10人,000,问:该乡钩虫病感染率是否有性别差异?若对该乡居民做驱钩虫治疗,至少需要按多少人准备药物?7.某医生抽样调查了49名健康男性的血清总胆固醇值,得均数4.73mmol/L,标准差为.90mmol/L,同时抽样调查了25名冠心病病人,得均数7.98mmol/L,标准差1.02mmol/L,(1)试估计健康男性血清总胆固醇值的总体可信区间。(2)试比较冠心病病人与健康男性的血清总胆固醇值有无不同。是非题卫生统计学研究的主要内容是社区医疗。错随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不可能发生。对正态分布的特点有算术均数等于中位数。对变异系数越大表示标准差越大。错随着样本含量的逐渐加大,标准误与标准差则逐渐变小。错6.如果有少数几个数据比大部分数据大几百倍,这组资料就不宜计算算术均数。对7.标准误越大,说明样本均数的抽样误差越大。对8.两组计量资料的假设检验是否采用t检验,主要取决于样本含量。错9.在假设检验中,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则增大了第一类错误。对10.两个大样本(一般n>30例)均数的比较可用样本均数与总体均数差异的显著性检验。错11.率是说明某现象发生强度的指标。对12.构成比可说明某种事物发生的可能性大小。错13.配对设计四格表资料比较两个率有无差别的无效假设是b=c.对14.四格表资料的自由度为1。对15.x2值反映了实际数与理论数之吻合程度,如果假设成立,则A与T之差一般不会很大,因而P值也不会很大。错16.两样本比较,得P<0.05,此时一定可认为两总体率不同。两行三列X2检验,理论数不可小于5。错17.行×列表x2检验,若1/5格子以上1<T<5或任一格子T<1,则应进行合理合并。对18.只研究某一种药物预防、治疗某疾病时,可以不设置对照组。错19.比较5所中学的近视患

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论