医学统计学复习.doc_第1页
医学统计学复习.doc_第2页
医学统计学复习.doc_第3页
医学统计学复习.doc_第4页
医学统计学复习.doc_第5页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体:根据研究目的所确定的同质观察单位的全体。样本:从总体中随机抽取的部分个体。参数:从统计量可以估计相应的总体均数、总体标准差、总体率等,这些总体的统计指标或特征值称为参数。样本统计量:由样本所计算出的统计指标或特征值称为统计量?抽样误差:从某总体中随机抽取一个样本进行研究,所得的样本统计量和总体参数常不一致,这种由抽样引起的样本统计量和总体参数间的差异称为抽样误差。标准误:样本统计量的标准差称为标准误(SE),用来衡量抽样误差的大小。小概率原理:小概率事件虽不是不可能事件,但一般认为小概率事件在一次试验中是不会发生的,这就是小概率原理。小概率事件:若某事件的发生率很小,则称该事件为小概率事件。医学研究中将概率小于等于0.05或0.01者称为小概率事件。P值的含义:从H0 规定的总体中随机抽样,获得等于大于现有样本获得的检验统计量值得概率。P值的大小表明以多大的误差拒绝H0 。 P值越小越有理由说明拒绝H0 接受H1。检验效能: 1就是对真实的H1作出肯定结论之概率,常被用来表达某假设检验方法的检验的功效。一类错误:假设检验的核心是推断H0,当H0是真实的,拒绝H0就是错误的,不拒绝H0则是正确的;当H0是不真实的,拒绝H0就是正确的,不拒绝H0就是错误的。因此拒绝了实际上成立的H0,这类弃真的错误称为一类错误。不拒绝实际上不成立的H0,这类存伪的错误就是二类错误。可信区间:(CI)区间估计是按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间,又称置信区间、相关系数:反映两定量指标间的相关关系。说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标。 1关于正态分布的特征,下面说法错误的是:CA高峰位置在均数 = 处 B为位置参数,越大,则曲线沿横轴向右移动;越小,曲线沿横轴向左移动C为形态参数,表示数据的离散程度,若小,则曲线形态“矮胖”;大,则曲线形态“瘦高”D正态分布以均数为中心,左右完全对称 2. 各观察值均加上同一数后,( B )(A)均数不变,标准差改变(B)均数改变,标准差不变(C)两者均改变 (D)两者均不变 3. 某地5人接种某疫苗后抗体滴度为1:20、1:40、1:80、 1:16 0、1:320。为求平均抗体滴度,最好选用( B )(A)中位数 (B)几何均数(C)算术平均数 (D)标准差 4正态分布曲线下,横轴上从均数到( + 1.96)的面积为:C A95% B45% C47.5% D90% 5. 某人群血糖的正常值范围是指 ( C )(A)该指标在所有人中的波动范围(B)该指标在所有正常人中的波动范围(C)该指标在绝大部分正常人中的波动范围(D)该指标在一个人不同时间的波动范围 6假设检验中的第一类错误是指AA拒绝了实际上成立的H0 B不拒绝实际上成立的H0C拒绝了实际上不成立的H0 D不拒绝实际上不成立的H0 7. X2.58s包括变量值的DA. 68.3% B. 90.0% C. 95.0% D. 99.0% 8. 均数与标准差之间的关系是AA.标准差越小,均数代表性越好 B. 标准差越小,均数代表性越差C. 均数越大,标准差越小 D. 均数越大,标准差越大 9.分析定性资料时,最常用的显著性检验方法是D A.t检验 B.正态检验 C.U检验 D.2检验 10.四格表如有一个实际数为0 CA.就不能做2检验; B.就不能用校正2检验;C.还不能决定是否可做2检验; D.肯定可做校正2检验。1.简述中心极限定理的涵义?从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为,标准差为X从正态分布总体N(,) 中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。从非正态分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。2.描述定量资料的集中位置和离散趋势各有哪些指标?集中位置的指标有:1、算数均数(均数):反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。2、几何均数:(G):适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。3、中位数:(M)将一组观察值按升序或降序排列,位次居中的数。4、百分位数:是一个位置指标,以PX表示,一个百分位数PX将全部观察值分为两个部分,理论上有X%的观察值比PX小,有(100-X)%观察值比PX大。离散趋势的指标有:1、极差:(R):又称全距。是指一组数据中最大值和最小值之差。2、四分位数间距(Q):上四分位数和下四分位数之差。两个特定的百分位数,常用于描述不对称资料的特征。3、方差和标准差:常用来描述正态分布的资料。5、变异系数:(CV):又称离散系数,为标准差与均数之比。常用于比较度量衡单位不同的两组或多组资料的变异度3.标准差与标准误区别与联系?适用于何种情况? 标准误 VS 标准差意义上: 描述统计量的抽样误差 描述个体值之间的离散程度 越小,用样本均数来反 越小,均数的代表性越好 映总体均数越可靠用途上: 表示标准误大小 表示观察值的波动范围 估计总体参数可信区间 用以计算参考值范围随样本量变化:随n的增大标准误趋近于0 随n的增大标准差不会消失 趋于稳定 联系:1)表示变异的大小 2) 样本含量一定时,标准差越大,标准误越大。4.参考值范围和区间估计的区别与联系?5.假设检验的步骤有哪些?1、建立假设(H0:=0 H1:0)2、确定检验水准:3、计算检验统计量和 P值:4、推断结论(P,拒绝H0接受H1;P,不拒绝H0)6.ANOVA的应用条件是什么?当资料不符合方差齐性条件时,需对资料进行变换,常见的变换形式有?(1)方差分析的应用条件:1、各组样本是相互独立的随机样本(独立性)2、各样本来自正态总体(正态性)3、各组总体方差相等(方差条件)(2)变换形式:1、平方根变换 poisson分布,轻度偏态等2、对数变换 对数正态分布, 等比,正偏态3、倒数变换4、平方根反正弦变换 ,7.秩和检验的条件?秩和检验可用于任意分布的资料;(1)等级资料;(2)计量资料中:极度偏态资料,或个别数值偏离过大各组离散度相差悬殊资料中含有不确定值大于5年 、0.001、1:1024以上 分布类型尚未确知(3)兼有等级和定量性质的资料8.直线回归与直线相关的区别与联系联系均表示线性关系;符号相同:共变方向一致;假设检验结果相同:是否存在共变关系区别r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关;相关表示相互关系;回归表示依存关系;对资料的要求不同:当X和Y都是随机的,可以进行相关和回归分析;当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析;9.简述实验设计的基本要素,基本原则。基本要素:1、 处理因素2、 受试对象3、 实验效应基本原则:1、 对照原则:体现均衡性。消除干扰因素的影响,给一个被比较的标准,使处理因素和非处理因素的差异有一个科学的对比。2、 随机原则:体现客观性。分为抽样随机、分组随机、实验顺序随机三种。3、 重复原则:体现可靠性。整个实验的重复。用多个实验单位进行重复(样本含量)。同一实验单位的重复观察。1、为了考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校(UC Berkley)的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)男婴x17.37.97.98.09.37.86.57.66.68.46.77.5女婴x27.17.96.46.68.06.07.26.87.85.36.67.3(1) 该资料是数值变量资料还是分类资料?数值变量资料(2) 要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验? 成组t检验(3) 经过计算t值为2.16,已知自由度为22时,双侧面积0.05对应的t界值为2.07,自由度为11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。P0.05,可认为男婴出生体重高于女婴是配对设计的T检验t=2.45,自由度11,P0.05,可以认为两种测量结果不同,改进法的测量结果低于碘量法11名志愿者接受胆固醇试验,受试者在用药前后各测量一次血清胆固醇(mmol/l)数据如下,试判断此药是否有效?前6.11,6.81,6.48,7.59,6.42,6.94,9.17,7.33,6.94,7.67,8.15后 6.00,6.83,6.49,7.28,6.30,6.64,8.42,7.00,6.58,7.22,6.571.该资料属于什么研究类型?配对设计2.写出该假设检验的假设?H0:Ud=0(用药前后血清胆固醇相同)H1:Ud0(用药前后血清胆固醇不同)3.若算得到t=2.8518,查表知自由度为10时,双侧面积0.05对应的t界值为2.228,自由度为20时,双侧面积0.05对应的t界值为2.086,请问如何下统计结论?P0.05,甲乙两种方法治疗效果无统计学差异比较缺氧条件下猫和兔的生存时间(时间:分)猫兔生存时间秩次生存时间秩次255.5 14 13410 15 23811 16 34012 18 44113 25 5.54214 26 74515 28 8 30 9该资料属于什么试验设计方式?对资料进行编秩;该资料总秩和为多少?各组的实际秩和各为多少? 总秩和=56猫生存时间秩和=80.5兔生存时间秩和=39.5写出对该资料进行假设检验的假设。H0:猫和兔生存时间相同H1:猫和兔生存时间不同该资料来自于什么试验设计?配对设计秩和检验对该资料进行编秩,以便进行统计分析。请写出对两法测量结果有无差异之假设检验的假设。H0:两法测量结果相同若H0成立,正秩和和负秩和的理论值应为多少?28已知n=7时,双侧0.05对应的T界值为2-26。请写出假设检验的结论。P0,05,两法测量结果不同(1) 与间是否存在直线相关关系?如果存在,直线相关系数为?(根据Stata 输出结果写出假设检验的详细分析步骤,并下结论)H0=0H10t=5.17,P0.05存在线性关系 相关系数=(2) 将上述Stata 结果中的方差分析表补充完整。1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论