




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品复习资料(资料总结,仅供参考)判断题1 .研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。X2 .统计分析包括统计描述和统计推断。3 .计量资料、计数资料和等级资料可根据分析需要相互转化。4 .均数总是大于中位数。X5 .均数总是比标准差大。X6 .变异系数的量纲和原量纲相同。X7 .样本均数大时,标准差也一定会大。X8 .样本量增大时,极差会增大。9 .若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。X10 .对同一参数的估计,99%可信区间比90%可信区间好。X11 .均数的标准误越小,则对总体均数的估计越精密。12 .四个样本率做比较,/2>
2、;72.05(3),可认为各总体率均不相等。X13 .统计资料符合参数检验应用条件,但数据量很大,可以采用非参数方法进行初步分析。14 .对同一资料和同一研究目的,应用参数检3方法,所得出的结论更为可靠。X15 .等级资料差别的假设检验只能采用秩和检验,而不能采用列联表2检验等检验方法X。16 .非参数统计方法是用于检验总体中位数、极差等总体参数的方法。X17 .剩余平方和SS剩1=SS剩2,则1必然等于2。X18 .直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。19 .两变量关系越密切值越大。X20 .一个绘制合理的统计图可直观的反映事物间的正确数量关系。21 .在一
3、个统计表中,如果某处数字为0",就填0",如果数字暂缺则填“;如果该处没有数字,则不填。X22 .备注不是统计表的必要组成部分,不必设专栏,必要时,可在表的下方加以说明。23 .散点图是描写原始观察值在各个对比组分布情况的图形,常用于例数不是很多的间断性分组资料的比较。24 .百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的原始顺序依次进行绘制,其他置于最后。X25 .用元参钩藤汤治疗80名高血压患者,服用半月后比服用前血压下降了2.8kPa,故认为该药有效(X)。26 .在实验设计中,样本含量越大,越符合其重复原则,越能降低实验误差(X)。填空
4、题1、 X-1.96S彳后力7:o2、X±2.58SX表示3、配对四格表资料的2检验采用校正公式的条件为。4、四格表资料的2检验采用校正公式的条件为。5、横轴上,正态曲线下,从内1.96b到.1.96b的面积为。6、横轴上,正态曲线下,从内1.96b到廿2.58b的面积为。7、随机区组设计的方差分析,可将总变异分解为:。8、完全随机设计的方差分析,可将总变异分解为:。9、表示计量资料集中趋势的统计指标有、。10、表示计量资料离散趋势的统计指标有:、<1112131415161718192021222324252627、回归系数b的假设检验,Ho表不为。、相关系数b的假设检验,H
5、o表示为。、两样本均数比较的假设检验,Ho表示为。、配对t检验,Ho表不'为o、两样总体率比较的2检验,Ho表示为。、两样本率比较的£检验,其自由度为。、单样本t检验,其自由度为。、成组(两样本)t检验,其自由度为。、回归(相关)假设检验,其自由度为。、四格表资料的声检验的基本条件是、两个样本均数比较的u检验,其应用条件为:、F检验的条件为、t检验的条件为、在直线相关分析中,用积差法计算相关系数的条件是:、用百分位数法计算某指标的95%正常值范围,如取单侧界限,需计算的统计指标、用百分位数法计算某指标的99%正常值范围,如取单侧界限,需计算的统计指标J1Lo、完全随机设计多组
6、差别比较的秩和检验的检验统计量为、常用的相对数有、。、医学资料的类型有、。、统计学中所指的误差,主要有、QxO、比较甲乙两地血型的构成比有无差别,宜用检验。、总、概率28293031323334353637383940414243、平均数是,常用平均数有、中位数和四分位数间距适用一-特征O分布资料,各反映该分布的感谢下载载、变异系数用于、可信区间是指、率的抽样误差、b是指对科的离散程度;仃X是指对科的离散程度。2.、X服从N(8,2)的正态分布,X的P97.5为:。、统计分析包括和。、完全随机设计多组差别比较的秩和检验,计算统计量H的公式为:H12-“旦-3(N1)N(N1)nini表不式中R
7、i表不44、用最小二乘法原理确定回归直线是使为最小。45、两样本率比较的*检验中,结果为P<0.05,则在汽=0.05水准上拒绝H0,接受H1,P愈小则。名词解释总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。变异:个体间测量结果的差异称为变异。变异是生物医学研究领域普遍存
8、在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。(S:样本标准差5:总体标准差)标准误:通常将样本统计量的标准差称为标准误。许多样本均数的标准差仃X称为均数的标准误(standarderrorofmean,SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。(Op:率的标准误,仃X:均数的标准误,SX:标准误的点估计值)中位数:将一组观察值由小到大排列或
9、从大到小排列,位次居中的那个数。四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断(statisticalinference)。抽样误差(均数/率的误差):由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差(samplingerror)。参数估计:指用样本统计量估计总体参数。参数估计有两种方
10、法:点估计和区间估计。可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(CI)。它的确切含义是:可信区间包含总体参数的可能性是1-a,而不是总体参数落在该范围白可能性为1-«oI型和II型错误:I型错误(typeIerror),指拒绝了实际上成立的Ho,这类弃真”的错误称为I型错误,其概率大小用a表示;II型错误(typeIIerror),指接受了实际上不成立的Ho,这类存伪”的错误称为II型错误,其概率大小用P表示。假设检验中P的含义:指从Ho规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。完全随机设计:只考虑一
11、个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。率:又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:多发生某现象的观察单位数”100%可能发生某现象的观察单位总数,表示方式有:百分率()、千分率(%。)等。构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。小某一组成部分的观察单位数dnno/构
12、成比=-丈100%计算公式为:同一事物各组成部分的观祭单位总数,通常以百分数表示。比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几。A一B计算公式为:比,表示方式为倍数或分数。二项分布:若一个随机变量X,它的可能取值是0,1,,n,且相应的取值概率为n、kn_kP(X=k)=(k)二(1-二)则称此随机变量X服从以n、兀为参数的二项分布(BinomialDistribution),记为XB(n,Tt)oPoisson分布:若离散型随机变量X的取值为0,1,,n,且相应的取值概率为IlkP(X=k)=e*(20)k!则称随机变量X服从以科为参数的Poisson分
13、布(PoissonDistribution),记为XP(四)。直线回归(linearregression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simpleregression)。回归系数rregressioncoefficient)即直线的斜率(slope),在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。直线相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布资料。有正相关、负相关和零相
14、关等关系。直线相关的性质可由散点图直观的说明。相关系数又称积差相关系数(coefficientofproduct-momentcorrelation),以符号r表示样本相关系数,p表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。方差分析:方差分析(analysisofvariance,ANOVA)就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对
15、观测指标有无影响。配对四格表:配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A处理,另一个接受B处理,每种处理的反应都按二项分类。全部n对实验结果的资料以表8-12表示,这样的表称为配对四格表。表8-12配对四格表的形式.E处理A处理+一+ab一cd等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。正态分布:若资料X的频率曲线对
16、应于数学上的正态曲线,则称该资料服从正态分布。通常用记号N(%仃2)表示均数为标准差为仃的正态分布。5、简答题1.简述二项分布、Poisson分布和正态分布间的联系。答:二项分布、Poisson分布和正态分布间的联系为:(1)在n很大,而兀很小,且n兀二九为常数时,二项分布的极限分布为Poisson分布;(2)在n较大、兀不接近0也不接近1时,二项分布B(n,兀)2、近似正态分布N(n%nn(1-兀),而相应的样本率P的分布也近似正态分布N(n,ctp)。(3)当K增大时,Poisson分布渐近正态分布。一般而言,九>20时,Poisson分布资料可作为正态分布处理。2、假设检验中a与P
17、的区别何在?答:畸口P均为概率,其中3是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在Ho成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与印寸比来得到Z论,若P<«,则才I绝Ho,接受Hi,有统计学意义,可以认为不同或不等;否则,若P>«,则不拒绝Ho,无统计学意义,还不能可以认为不同或不等。3、均数、几何均数、和中位数的适用范围?均数:适用于对称分布,特别是正态分布资料。几何均数:适用于成等比级数的资料,特别是对数正态分布资料中位
18、数:各种分布类型的资料,特别是偏态分布资料和开口资料4、均数的可信区间与参考值范围有何不同?答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。次抽样算得的可信区间要么包含了总体均数,要么不包含。化某项指标的波动范围。义但可以说:该可信区间有多大(如当S0.05时为95%)的可能性包含了总体均数。计算公式冰知:SX72,n二已知:-CTX 二 U :以一n正态分布:X二U-./2 s*战知但n>60 :一 SX 工 u(y 2偏态分布:PXP100_X用途 估计总体均数判断观察对象的某项指标正常与否5、简述回归系数与相关系数的区别与联系。答:二
19、者的联系:(1)对于既可作相关又可作回归分析的同一组数据,计算出的b与r正负号一致。(2)相关系数与回归系数的假设检验等价,即对于同一样本,tb=tr。(3)同一组数据的相关系数和回归系数可以相互换算:r=bY_X父SX/SY。2(4)用回归解释相关:由于决定系数r=ss回/ss总,当总平万和固定时,回归平万.,、.一2.一和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r越接近1,说明引入相关的效果越好。二者的区别:(1)资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析称为n型回归;回归要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为I型
20、回归。(2)应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。(3)意义上:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致Y的平均变化量。(4)计算上:r=lXY/JlXXlYY,b=1XY/1XX。(5)取值范围:一14厂£1,8Mb<8。(6)单位:r没有单位,b有单位。6、为什么假设检验的结论不能绝对化?答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;接受"H0时可能犯II型错误
21、。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如肯定",定”,必定”就不恰当。7、在完全随机设计方差分析中SS组间、SS酗各表示什么含义?答:SSt间表示组间变异,指各处理组样本均数大小不等,是由处理因素(如果有)和随机误差造成的;SSa内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。8、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?答:区别点完全随机设计随机区组设计设计采用完全随机化的分组方法,将随机分配的次数要重复多次,每次随全部试验对象分配到g个处理组机分配都对同一个区组内的受试对(水平组),各组分别接受
22、不同的象进行,且各个处理组受试对象数量处理。相同,区组内均衡。变异分解三种变异:四种变异:SS总=SS且间.SS且内(S'=SS处理+SS误差)S&=SSt理Sa组S盘差9、试举例说明均数的标准差与标准误的区别与联系。答:例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X为138.5g/L,标准差S为5.20g/L,标准误SX为1.04g/L。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则
23、是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误S.=4=520=1.04,此式将标准差和标准误从数学上有,n,25机地联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。10、正态分布与标准正态分布联系与区别?答:二种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。11、常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特
24、点。答:有强度相对数(率)、结构相对数(构成比)、相对比三种。率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强弱。x比例基数、十管/志某时期内发生某现象的观察单位数十同期可能发生某现象的观察单位总数构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称为百分比。其特点为:一组构成比的总和应等于100%,即各个分子的总和等于分母;各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其他部分数值变
25、化的影响。计算公式:100%构成比二某一组成部分的观察单位数一同一事物各组成部分的观察单位总数相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。计算公式:相对比3乙指标(100%)12、应用相对数时应注意哪些问题?答:(1)算相对数时分母应该有足够数量;(2)分析时不能以构成比代替率;(3)分别将分子和分母合计求合计率或平均率;(4)相对数的比较应该注意其可比性;(5)样本率或构成比比较时应做假设检验13、对于四格表资料,如何正确选用检验方法?答:(1)首先应分清是两样本率比较的四格表资料还是配对
26、设计的四格表资料。(2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择2不同的72计算公式:当n240且所有的T之5时,用人检验的基本公式2(AT)2-2,a2(adbc)2n_廿=2或四格表资料检验的专用公式e=;T(ab)(cd)(ac)(bd)当n至40但有1 <T <5时,用四格表资料2检验的校正公式 :二' c(A-T-0.5)2 或T2(|ad -bc| 一)n(a+b )(c+ d)(a+c )(b+ d),或改用四格表资料的Fisher确切概率法;当n < 40 ,或T<1时,用四格表资料的Fisher确切概率法。若资料满
27、足两样本率u检验的条件,也可用u检验。(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时当22(|b_c_1)2(b-c)2.c=u二(b+c)之40时,2=-当(b+c)<40时,b+c。bc14、什么叫做非参数检验?它和参数检验有什么区别?答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。15. I型错误与II型错误有何区别与联系?了解这两类错误有何实际意义?(1) 误是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用a表示。I
28、I型错误则是指“接受”了实际上不成立的Ho所犯的“取伪”错误,其概率大小用P表示。当样本含量n确定时,仃愈小,口愈大;反之a愈大,口愈小。了解这两类错误的实际意义在于,若在应用中要重点减少可如一般的假设检验),则取口=0.05;若在应用中要重点减少P(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取豆=0.10或0.20甚至更高。6、计算题,Sx =0.04(mmol/L)1、某医生随机检测了某地225名健康成年男子的血清胆固醇含量,得X=4.0(mmol/L),S=0.6(mmol/L)(1)、指出本研究的总体、观察单位(或研究单位)和变量。总体:所有成年男子。观察单位
29、:一名成年男子。变量:一个成年男子的血清胆固醇含量(2)、本研究的抽样误差为多少?0.04(3)、试估计某地健康成年男子的血清胆固醇含量总体均数的95%的可信区间。4.0±1.96X0.04(4) 试估计某地健康成年男子白血清胆固醇含量的95%的医学参考值范围。4.0±1.96X0.6(5) 已知健康成年男子的血清胆固醇含量的标准值为4.08(mmol/L),用统计学专业术语回答某地健康成年男子的血清胆固醇含量是否不同于标准值?(o=0.01,u0.05=1.96,u0.01=2.58;采用t检验方法,t值为2.00。)由U0.05=1.96,u0.01=2.58;t=2.
30、00得P>0.01,按0=0.01水准,不拒绝H0,无统计学意义,尚不认为某地健康成年男子的血清胆固醇含量不同于标准值。2.某市20岁男学生160人的脉搏数(次/分钟),经正态性检验服从正态分布。求得X=76.10,S=9.32。试估计脉搏数的95%、99%参考值范围。解:脉搏数的95%正常值范围为:X±1.968=76.10±1.96(9.32)=57.8394.37脉搏数的99%正常值范围为:X±2.588=76.10±2.58(9.32)=52.05100.373、某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中发病者
31、有108人,其中男性患者79人,而女性患者29人。试计算:该院总流感发病率?男、女流感发病率?男、女患者占总发病人数的百分比?该院总流感发病率为:(108/900)M00%=12%男性流感发病率为:(79/760)X100%=10.39%;女性流感发病率为:(29/140)M00%=20.71%男性患者占总发病人数的百分比为:(79/108)X100%=73.15%;女性患者占总发病人数的百分比为:(29/108)X100%=26.85%4、用甲乙两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%,问:1、该资料为何种类型的资料?
32、计数资料2、欲比较甲、乙两法何者为优,宜用何种假设检验方法?配对设计2检验3、列出计算检验统计量的计算表。_乙法1+一+ab一cd算出a=42b=30c=18d=302(b-c)2(b+c)"0,=()-bc'4、若计算得的检验统计量小于相应于P=0.05的检验统计量的值时(检验水准行0.05),应如何下结论?即P>0.05,按0=0.05水准,不拒绝H0,无统计学意义,尚不认为两种方法有差别。5、据你所作的结论,可能犯何种类型的统计错误?n型5、测得8名健康人和8名I期矽肺病人血清粘蛋白含量(毫克/100亳升)如下所示:健康人I期矽肺病人64.2669.6342.8469.7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 绿地集团防水合同协议
- 老师事业单位合同协议
- 联排厂房改造合同协议
- 美发店入股协议合同协议
- 股权分配合同协议英文版
- 膜结构车棚施工合同协议
- 美国清洁工外包合同协议
- 耕地居间合同协议书范本
- 能源车位销售合同协议
- 美容聘用合同协议书范本
- 厨房消防安全培训课件
- 提高护士的创新能力和研究素养培养培训课件
- 全国工会财务知识竞赛题库及答案
- 保险学(第五版)课件 魏华林 第9、10章 再保险、保险经营导论
- 田忌赛马何捷教学设计
- 人工智能原理与技术智慧树知到课后章节答案2023年下同济大学
- 某高速公路岩土工程勘察报告
- SL631-637-2012-水利水电工程单元工程施工质量验收评定标准
- 人教版七年级生物下册《血流的管道-血管》评课稿
- 门诊办运用PDCA提高门诊预约挂号率品管圈成果汇报
- 市场开拓委托合同书
评论
0/150
提交评论