统计背诵版(三份整合)_第1页
统计背诵版(三份整合)_第2页
统计背诵版(三份整合)_第3页
统计背诵版(三份整合)_第4页
统计背诵版(三份整合)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学资料背诵版一、单选题:其次章:计量资料的统计描述1、 描述一组偏态分布资料的变异度,以四分位数间距指标较好。2、 用均数和标准差可以全面描述正态分布资料的特征。3、 各观看值均加(或减)同一数后标准差不变。4、 比较某地12岁和55.5岁儿童身高的变异程度,宜用变异系数。5、 偏态分布宜用中位数描述其分布的集中趋势。6、 各观看值同乘以一个不等于0的常数后,变异系数不变。7、 正态分布的资料,均数等于中位数。8、 对数正态分布是一种右偏态分布(说明:设X变量经Y=lgX变换后听从正态分布,问X变量属何 种分布?)9、 横轴上,标准正态曲线下从0到2.58的面积为49.5%10、 当各观看

2、值呈倍数变化(等比关系)时,平均数宜用几何均数。第3章 :总体均数的估量与假设检验1、 均数的标准误反映了样本均数与总体均数的差异。2、 两样本均数比较的t检验,差别有统计学意义时,P越小,说明越有理由认为两总体均数不同。3、 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1和S12、2和S22,则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括04、 在参数未知的正态总体中随机抽样,丨丨t0.05/2,S的概率为5%5、 某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范

3、围为74±1.96×46、 关于以0为中心的t分布,叙述错误的是相同时,丨t丨越大,P越大。7、 在两样本均数比较的t检验中,无效假设为两总体均数相等。8、 两样本均数比较作t检验时,分别取以下检验水准,犯其次类错误概率最小的是=0.309、 正态性检验,按=0.10水准,认为总体听从正态分布,此时若推断有错,其错误的概率等于,而未知。10、 关于假设检验,说法正确的是接受配对t检验还是两样本t检验是由试验设计方案所打算的。第4章 :多个样本均数比较的方差分析1、完全随机设计资料的方差分析中,必定有SS总=SS组间SS组内2、随机区组设计资料的方差分析中,对其各变异关系表达

4、正确的是SS总=SS处理SS区组SS误差3、当组数等于2时,对于同一资料,方差分析结果与t检验结果完全等价且t=4、方差分析结果,F处理F0.05,(1,2),则统计推论是各总体均数不全相等5、完全随机设计方差分析中的组间均方是表示某处理因素的效应和随机误差两者综合影响的结果的统计量。6、配对设计资料,若满足正态性和方差齐性,要对两样本均数的差别作比较,可选择随机区组设计的方差分析7、个组方差齐性检验有统计学意义,可认为12、22、.k2不全相等第五章、计数资料的统计描述1、医院日门诊各科疾病分类资料,可作为计算构成比指标的基础。2、计算某地某年肺癌发病率,其分子应为该地某年新发生肺癌患者3、

5、一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列状况该病患病率将增加4、在使用相对数时,简洁犯的错误是将构成比当做率看待5、在实际工作中,发生把构成比当做率分析的错误的主要缘由是由于计算构成比的原始资料较率简洁得到6、已知男性的钩虫感染率高于女性。欲比较甲、乙两乡居民的钩虫总感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是对性别进行标准化后再比较7、要比较甲乙两厂某工种工人某种职业病患病率的凹凸,实行标准化法的原理是假设甲乙两厂某工种工人的工龄构成比相同8、要比较甲乙两厂工人换某种职业病的患病率,对工龄进行标化,其标准构成的选择是甲乙两厂合并后的工人工龄构成。9、某项关于某

6、种药物的广告声称:“在服用本制剂的1000名上感的儿童中,有970名儿童在72小时内症状消逝。”因此推断此药治疗儿童的上感是格外有效的,可以推广应用。这项推论是不正确,因未设对比组或对比组10、定基比和环比属于相对比指标。第六章:几种离散型变量的分布及其应用1、若某人群某疾病发生的阳性数X听从二项分布,则从该人群随机抽出n个人,阳性数X不少于k人的概率为P()P(1).P()2、Poisson分布的标准差和均数的关系是=23、用计数器测得某放射性物质10min内发出的脉冲数为660个,据此可估量该放射性物质平均每分钟脉冲计数的95%可信区间为661.964、Poisson分布的方差和均数分别记

7、为2和,当满足条件220时,Poisson分布近似正态分布。5、能用来较好地描述传染性疾病发生规律的离散型分布是负二项分布6、在负二项分布的两个参数和中,用来衡量分布的聚集趋向的程度是第七章:2检验1、2分布的外形与自由度有关2、2值的取值范围023、当四格表的周边合计数不变时,假如某格的实际频数有变化,则其理论频数不变4、下列检验不适用2检验的是两样本均数的比较5、以下关于2检验的自由度的说法,正确的是若20.05,120.05,2,则自由度126、5个样本率作比较,220,01,4,则在=0.05检验水准下,可认为各总体率不全等第8章 :秩转换的非参数检验1、 两个独立小样本计量资料比较的

8、假设检验,首先应考虑资料是否符合t检验条件2、 配对样本差值的Wilcoxon符号秩检验,确定P值的方法为T值在界值范围内,P大于相应的3、 等级资料比较宜用非参数检验4、 多样本计量资料的比较,当分布类型不清时选择H检验5、 以下检验方法中,不属于非参数检验的方法是t检验6、 成组设计两样本比较的秩和检验,其检验统计量T是以例数较小者秩和为T第9章 :双变量回归与相关1、 直线回归中,假如自变量X乘以一个不为0或1的常数,则有回归系数转变2、 利用直线回归估量X值所对应Y值的均数可信区间时,增加样本含量、令X值接近其均数、减小剩余标准差、减小可信度(以上都可以)可以减小区间长度。3、 直线相

9、关假设检验得到P,可认为两变量无直线关系4、 假如直线相关系数=1,则肯定有SS总=SS回5、 假如直线相关系数=0,则肯定有直线回归的截距等于或6、 假如两样本1=2,12,那么b1=r17、 用最小二乘法确定直线回归方程的原则是各观测点距直线的纵向距离平方和最小8、 曲线拟合时,打算系数R2的大小肯定是与的积差相关系数的平方。第10章 :统计表与统计图1、 欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用半对数线图2、 202例腰椎间盘后突患者年龄分布如下所示(略),为了形象地描述该人群的年龄分布状况,宜选用直方图3、 比较某地在两个年份几种传染病的发病率可用复式条图4、 某地

10、一班级12名高校生的体重与肺活量数据如下(略),期望用统计图来反映肺活量与体重之间的变化趋势,宜绘制散点图5、 表示某地区某年各种死因的构成比,可绘制圆图6、 关于统计表的制作,不正确的叙述是统计表包含的内容越多越好7、 关于统计图的制作,正确的叙述是直条图的纵轴必需从零开头二、简答题1、资料的分类:A 计量资料:又称定量资料或数值变量资料。为观测每个观看单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。依据其观测值取值是否连续,又可分为连续型或离散型两类。B 计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观看单位依据某种属性或类别分组

11、计数,分组汇总各组观看单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。C 等级资料:又称半定量资料或有序分类变量资料,是将观看单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观看单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。2、试述频数发布表的用途1) 描述频数分布的类型:看是正态分布还是偏态分布;2) 描述频数发布的特征:如可看出是数据变异范围和统计分布规律;3) 便于发觉一些特大或特小的离群值;4) 便于进一步做统计分析和处理。3、集中趋势和离散趋势的描述性指

12、标及其应用条件1)集中趋势描述性指标:算术平均数,几何均数,中位数和百分位数。应用条件:算术平均数:可用于反映一组呈对称分布的变量值在数量上的平均水平;几何均数:可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平;中位数和百分位数:是一种位置指标,可用于各种分布类型的资料,尤其是偏态分布资料和一端或两端无精确数值的资料;2)离散趋势的描述性指标:极差,四分位间距,方差与标准差,变异系数。应用条件:极差:可用于各种类型分布;四分位间距:一般和中位数一起描述偏态分布资料的分布特征;方差与标准差:可用于各种类型发布,反映一组数据的平均离散水平;变异系数(CV):多用于所观看的指标单位不同

13、时,如身高与体重的比较,或者均数相差太大时。4、医学参考值范围的制定方法依据资料的分布类型不同有以下2种计算医学参考值的方法:1)对于数据为正态分布或近似正态分布的资料,以及虽然为偏态发布但假如可以经适当的变量变换转化为正态分布的资料都可以接受正态分布法制定医学参考值范围,接受此方法前一般要对资料进行正态性检验,且要求样本含量较大(如n100)。2) 偏态分布资料医学参考值范围的制定通常接受百分位数法,所要求的样本含量比正态分布法要多(不低于100). 5、均数的抽样误差与标准误的概念 均数的抽样误差:由个体变异产生、随机抽样造成的样本统计量与总体均数的差异,叫做抽样误差。标准误的概念:样本均

14、数的标准差也称均数的标准误(SEM),它反映了样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明白均数抽样误差的大小。6、可信区间的概念及其精确含义可信区间的概念:可信区间通常是由2个界值即可信限/置信限(CL)构成并按预先给定的概率所确定的包含未知总体参数的一个范围。其中较小值为可信下限,较大值为可信上限,一般表示为(L,U),用圆括号表示。精确含义:从固定样本含量的已知总体中进行重复随机抽样试验,依据每个样本可以算得一个可信区间,那么平均有1-a(如95%)的可信区间包含了总体参数,而不是总体参数该范围的可能性为1-a。7、假设检验的基本步骤及其P值的精确含义基本步骤:(

15、1)建立检验假设,确定检验水准a, Ho:为无效假设, H1: 为对立假设,a为预先规定的概率值.(2)计算检验统计量, (3)确定P值,做出推断结论。P值的精确含义:依据获得的事后概率P值与事先规定的概率检验水准a进行比较,看其是否为小概率大事而得出结论。若Pa,则结论为按所取检验水准a,拒绝Ho,接受H1,差异有统计学意义。若Pa。则结论为所取检验水准a,不拒绝Ho,差异无统计学意义。8、假设检验2类错误的概念类错误:拒绝了实际上成立的Ho,这类“弃真”的错误为类错误,前面所讲的检验水准,就 是预先规定的允许犯类错误概率的最大值,类错误概率大小也用a表示.类错误:“接受”了实际上不成立的H

16、o,这类“取伪”的错误为类错误,其概率大小用表示。只取单尾,值的大小一般未知,须在知道两总体差值、a及n时,才能算出。9、方差分析的基本思想及应用条件:A、基本思想:是依据试验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过比较不同变异的来源的均方,借助F分布作出统计推断从而推论各种争辩因素对试验结果的影响。B、应用条件:各样本是相互独立的随机样本,均听从正态分布。相互比较的各样本的总体方差相等。具有方差齐性。10、率与构成比的区分:A 率:强度相对数,说明某现象发生的频率或强度。B

17、 构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布11、四格表卡方检验的应用条件当n40且全部的T5时,用检验的基本公式(7-1)或四格表资料检验的专用公式7-4;当P时,改用四格表资料的Fisher精确法。当n40但有1T<5时,用四个表资料检验的校正公式7-5或7-6;或改用四格表资料的Fisher精确概率法。 当n<40,或T<1时,用四个表资料的Fisher精确概率法12、参数检验与非参数检验的区分参数检验是指总体分布为已知的数学形式,对其总体参数做假设检验,如F检验、T检验。非参数检验对总体分布

18、不作严格假定,又称任意分布假设检验。它直接对总体分布(或分布位置)做假设检验,它的优点是不受总体分布的限制,适用范围广。13、配对样本比较的Wilcoxon秩和检验基本步骤第一步:做无效假设,设定检验标准其次步:求检验统计量T值:省略全部差值为0的对子数,令余下的有效对子数为n;按n个差值的确定数从小到大编正秩和负秩,遇差值的确定值相等者取平均秩,称为相同秩;任取正秩和负秩和为T。第三步:确定P值:当n50时,查T界值表。若n>50,可用正态近似法作u检验。14、直线回归与直线相关在应用中的区分直线相关用于说明两变量间直线关系的方向和亲密程度,X与Y没有主次之分;直线回归更进一步地用于定

19、量刻画应变量Y对自变量X在数值上的依存关系,其中哪一个作为应变量主要是依据专业上的要求而定,可以考虑将易于精确测量的变量作为X,另一个随即变量作为Y。绘制散点图时,直线回归要求X与Y听从双变量正态分布,直线回归要求至少对于每个X值相应的Y要听从正态分布,X可以使听从正态分布的随机变量也可以是能精确计算和严格把握的非随即变量。直线回归在用于结果的猜测时,其适用范围一般不应超出样本中自变量的取值范围。15、统计表的制表原则和要求原则:首先,统计表编制要重点突出,一张表一般只表达一个中心内容,与其把过多的内容放在一个庞杂的大表里,不如用多个表格表达不同的指标和内容。其次,统计表就犹如完整的一句话,有

20、其描述的对象(主语)和内容(宾语)。通常主语放在表的左边,作为横标目,宾语放在右边,作为纵标目。由左向右读,构成完整的一句话。最终,统计表应简洁明白,一切文字、数字和线条都尽量从简。基本要求:1、标题:概括表的主要内容,包括争辩的时间、地点和争辩内容,放在表的上方。假如整个表的指标统一时,可以将争辩指标的单位标在标题后面。2、标目:分别用横标目和纵标目来说明表格每行和每列内容或数字的意义.留意标明指标的单 位。3、线条:至少用三条线,表格的顶线和底线将表格与文章的其他部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分隔开。其他

21、的竖线和斜线一概省去。4、数字:用阿拉伯数字表示很多字用“-”表示,缺失数字用“.”表示,数值为0者记为“0”,不要留空顶。数字按小数位对齐。表中数字区不要插入文字。必需说明者标“*”号,在表格下方以备注的形式说明。16、常用统计图的应用 1、直条图:用于相互独立的统计指标的比较 2、圆图和百分条图:适合描述分类变量资料的各类别所占的构成比。 3、线图:适合于描述某统计量随另一 连接性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。一般线图: 适用于连续性资料,反映事物在时间上的进展变化的趋势,或某现象随另一现象变迁的状况。半对数线图,适用于连续性资料,反映事物进展速度(相

22、对比)。 4、直方图:适合表示连续性数值变量资料的频数分布。 5、统计地图:适宜描述争辩指标的地理分布 6、箱式图:适用于多组数据分布的比较。 7、茎叶图:可以格外直观地显示数据的分布范围和形态。 8、误差条图:适合于多个样本间的差异状况的比较。三、计算分析题样本率与总体率的比较:直接法:在诸如疗效评价中,利用二项分布直接计算有关概率,推断样本所在的总体率与已知总体率有无差别。比较时,经常遇到单侧检验,即“优”或“劣”的问题。那么,在总体阳性率为的n次独立重复试验中,一般有下面两种情形的概率计算。(1)若是回答“差”或“低”的问题,则需计算消灭“阳性”次数至多为k次的概率,即 k k n! P

23、(Xk)= P(X)= X(1-)n-X (6-11) X=0 X=0 X!(n-X)!(2)若是回答“优”或“高”的问题,则需计算消灭“阳性”次数至少为k次的概率,即 n n n! P(Xk)= P(X)= X(1-)n-X (6-12) X=k X=k X!(n-X)!明显,P(Xk)+ P(Xk)=1+P(k)。 对于双侧检验而言,由于要回答的是“有无差别”,即备择假设H1:0是否成立,因此,所要计算的双侧检验概率P值应为实际样本(记“阳性”次数为k次)消灭的概率与更背离无效假设的大事(记“阳性”次数为i次,ik)消灭的概率之和,即P=P(X=k)+P(X=i), 其中i满足P(X=i)

24、P(X=k)。 i例6-4 已知输卵管结扎的育龄妇女实施壶腹部-壶腹部吻合术后受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施壶腹部-壶腹部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术的受孕率?明显,这是单侧检验的问题,属上述第2种状况,记峡部-峡部吻合术后的受孕率为,其假设检验为H0:=0.55 H1:>0.55 =0.05 对这10名实施峡部-峡部吻合术的妇女,按0.55的受孕率,若消灭至少9人受孕的概率大于0.55,则不拒绝H0;否则,可视为小概率大事,拒绝H0,接受H1。本例n=10,=0.55,k=9。按公式(6-12)有 10

25、10 10! P=P(X9)= P(X)= 0.55X(1-0.55)10-X =0.023257 X=9 X=9 X!(10-X)!0.01<P<0.05,按=0.05水准,拒绝H0,接受H1,即认为实施峡部-峡部吻合术妇女的受孕率要高于壶腹部-壶腹部吻合术的受孕率。例65已知某种非传染性疾病接受甲药治疗的有效率为0.60。今改乙药治疗该疾病患者10人,发觉9人有效。问甲、乙两种药物的疗效是否不同? 明显这是双侧检验的问题。记乙药治疗该疾病的有效率为,其假设检验为: H0:=0.60 H1:0.60 =0.05 本例n=10,按=0.60,实际按样本阳性数X=9消灭的概率由公式P

26、(X)= X=0,1,2,3,n 则有:P(X=9)=0.040311这实际样本更背离无效假设的大事,即满足P(X=i)0.040311的i(i9)分别有:0、1、2、10。因此,所要检验的双侧检验概率P值为 P= P(X=9)+ P(X=0)+P(X=1)+ P(X=2)+ P(X=10) =0.040311+0.000104858+0.001572864+0.010617+0.006046618 =0.0586520.05P0.10,按=0.05水准,不拒绝H0 ,尚不能认为甲、乙两种药物的疗效不同。2、样本均数与总体均数的比较:直接法:当总体均数<20时,可接受直接计算概率的方式对

27、样本均数与已知总体均数间的差别进行有无统计学意义的比较。如用于发病率很低的非传染性疾病,则是对以样本均数X为代表的总体率与已知的总体率0是否有差别进行推断。例6-12 一般人群先天性心脏病的发病率为80/00,某争辩者为探讨母亲吸烟是否会增大其小孩的先天性心脏病的发病危急,对一群20-25岁有吸烟嗜好的孕妇进行了生育观看,在她们生育的120名小孩中,经筛查有4人患了先天性心脏病,试作统计推断。 对于这样一群低发病率的样本计数资料可看作听从Poisson分布,在120名被调研的小孩中,按0=0.008的发病水平,若有4名及以上的小孩患先天性心脏病的概率大于0.05,则尚不能认为母亲吸烟会增大其小

28、孩的先天性心脏病的发病危急,否则,即说明母亲吸烟会增大其小孩的先天性心脏病的发病危急,为此,本例可以作如下假设检验:H0:=0.008,即母亲吸烟不会增大其小孩的先天性心脏病的发病危急H1:>0.008,即母亲吸烟会增大其小孩的先天性心脏病的发病危急本例n=120,=n0=120X0.008=0.96 3 3 e-0.960.96x P=P(X4)=1-P(X)= P(X)=1-=0.016633 X=0 X=0 X!0.01<P<0.05,按a=0.05水准,拒绝H0,接受H1,即认为母亲吸烟会增大其小孩的先天性心脏病的发病危急。直接计算概率法也可用于两个低的发(患)病率的

29、比较,具体做法类似例6-12,只需把这两个发(患)病率中的一个看做0,而另一个当做即可,对于双侧检验的情形与二项分布类似。例613 有争辩表明,一般人群精神发育布裙的发生率为3,今调查了有亲缘关系血统婚配关系的后代25000人,发觉123人精神发育不全,问有亲缘关系血统婚配关系的后代其精神发育不全的发生率是否高于一般人群?可以认为人群中精神发育不全的发生数听从Poisson分布。本例n=25000,X=123,0 =0.003, =n0 =25000×0.003=75 H0:=0.003 H1:0.003 =0.05 按公式 u= 有:u=5.543 查u界值表得单侧P0.0005。

30、按=0.05水准,拒绝H0 ,接受H1 ,即认为有亲缘血统关系婚配关系的后代其精神发育不全的发生率高于一般人群。课后习题:1、 已知某种常规药物治疗某种非传染性疾病的有效率为0.70,今改用一种新药治疗该疾病患者10人,发觉9人 有效,问新药的疗效是否优于常规药物?2、 一项争辩表明,15岁女孩青春痘的发生率为0.60。现在某中学的一学校班上对15岁的女生以其学号为抽样框,随机抽取了10人,发觉9人长有青春痘。问该班15岁女生青春痘的发生率与同龄女孩青春痘的发生率是否不同?3、 一课题组对某职业人群的艾滋病学问知晓状况进行基线调查,发觉其知晓率为60%。课题组现实行整群抽样的方法对120名该职

31、业人员开展艾滋病学问的同伴教育活动,活动结束后按事先的设计进行了相应学问的问卷调查,发觉有96人回答正确。问这种同伴教育活动是否能提高该人群艾滋病学问的知晓率?4、 在对4550岁男性人群胃癌的发病状况争辩中,某医师在甲、乙两个地区进行了调查。甲地区调查了8000人,胃癌患者有42人;乙地区调查了7600人,胃癌患者有25人。问乙地区4550岁男性人群胃癌的发病率是否低于甲地区完全随机设计和随机区组设计离均差平方和及其自由度的分解、均方的计算例4-2某医生为了争辩一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,接受完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度

32、脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?4个处理组低密度脂蛋白测量值分组niX2劝慰组3.534.594.342.663.593.132.642.563.503.25303.43102.91367.853.304.043.533.563.854.073.523.934.192.961.373.932.332.984.003.552.964.304.162.59降脂药2.4组2.423.364.322.342.682.951.563.111.811.77302.7281.46233.001.982.632.862.932.172.722.652.222

33、.902.972.362.562.522.272.983.722.803.574.022.314.8组2.862.282.392.282.482.283.212.232.322.68302.7080.94225.542.662.322.613.642.583.652.663.682.563.023.482.422.412.663.292.703.042.811.971.687.2组0.891.061.081.271.631.891.192.172.281.72301.9758.99132.131.981.742.163.372.971.690.942.112.812.521.312.511.8

34、81.413.191.922.471.022.103.71H0:u1=u2=u3=u4,即4个试验组的总体均数相等H1:4个试验组的总体均数不全相等a=0.05按表中的公式计算各离均差平方和SS、自由度v、均方MS和F值。ij=102.91+81.46+80.94+58.99=324.30ij2=367.85+233.00+225.54+132.13=958.52C=(324.30)2/120=876.42SS总=958.52-876.42=82.10 v总=120-1=119SS组间=(102.91)2/30+(81.46)2/30+(80.94)2/30+(58.99)2/30-876.4

35、2=32.16 v组间=4-1=3SS组内=82.10-32.16=49.94,v组内=120-4=116MS组间=32.16/3=10.72,MS组内=49.94/116=0.43,F=10.72/0.43=24.93方差分析表变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.93P<0.01组内11649.940.43按v1=3、v2=116查附表3的F界值表,得F0.01,(3,116)=3.98,24.93>F0.01,(3,116),P<0.01。结论:按a=0.05水准,拒绝H0,接受H1,认为4个处理组患者 低密度脂蛋白总体均数不全

36、相等,即不同剂量药物对血脂中低密度脂蛋白降低有影响。例题4-4 某争辩者接受随机区组设计进行试验,比较三种抗癌药物对小白鼠肉瘤的抑制效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随即接受三种抗癌药物,以肉瘤的重量为指标,试验结果见下表:问三种不同药物的抑制效果有无差别? H0:1=2=3,即三种不同药物作用后小白鼠肉瘤重量的总体均数相等H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等=0.05计算C=6.812/15=3.0917=3.6245-3.0917=0.5328, =15-1=14=1/5(3.072+2.172+1.572)-3.0917=0.2

37、280, =3-1=2=1/3(1.982+1.502+1.052+0.932+1.352)-3.0917=0.2284, =5-1=4=0.5328-0.2280-0.2284=0.0764, =(5-1)(3-1)=8方差分析见下表:变异来源 自由度 SS MS F P 总变异 14 0.5328 处理间 2 0.2280 0.1140 11.88 <0.01区组间 4 0.2264 0.0571 5.59 <0.05误差 8 0.0746 0.0096 查F界值表,得F0.05,(2,8)=4.46,F0.01,(2,8)=8.65,11.88F0.01,(2,8),p0.0

38、1.按=0.05水准,拒绝H0,接受H1,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别。课后习题:1、争辩动物被随机分成三个组来比较对三宗不同刺激的反应时间,问动物在三种不同刺激下的反应时间是否有差别。按v1=2,v2=39 查F界值表,得F0.01(2,39)=19.47,F=123.65>F0.01(2,39),P<0.01,结论:依据a=0.05水准,拒绝H0,接受H1,3种不同刺激下动物的反应时间有差别。2、为争辩某药物的的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A、B、C三个试验组和一个对比组,分别接受不同的处

39、理,A、B、C三个试验组,分别注射0.5、1.0和1.5ml30%的注射液,对比组不用药。经肯定时间以后,测定四组小白鼠的肿瘤肿瘤,测量结果见下表。问不同剂量药物注射液的抑癌作用有无差别。按v1=3,v2=36查F界值表,得F0.01(3,36)=4.38,F=13.71>F0.01(3,36) P<0.01。结论:按a=0.05水准,拒绝H0,接受H1,认为4个不同剂量药物注射液的抑癌作用有差别。3、为争辩注射不同剂量雌激素对大白鼠子宫质量的影响,取4窝不同种系的大白鼠,每窝3只,随机第安排到3个组内接受不同剂量雌激素的注射,然后测定其子宫质量,结果见下表。问注射不同剂量的雌激素

40、对大白鼠子宫质量是否有影响。4、某医院在苯扎溴铵(新洁尔灭)器械消毒液以工业亚硝酸钠为防腐剂的抑菌试验中,观看了五种含不同品种防腐剂的苯扎溴铵溶液的抑菌效果,第20天抑菌试验结果(抑菌直径)如下表,问五种溶液的抑菌效果有无差别?四种细菌被抑制的效果有无差别?2、 统计重点:闭卷 期末考试80%,平常作业20%。 1、名词解释(10分) 5道*2 2、选择(40分): 20道*2部分来自课后练习题 3、简答(20分) 4道*5.分析统计图/表,可能会以改错的形式消灭。 4、计算分析(30分): 34道 4、可能的重点 1、计量资料:给出X,S,(样本均数,标准差)推断95%CI。参考值范围,t检

41、验公式,I类、II类错误的推断。2、 计数资料:卡方检验的四格表公式。3、方差分析:不考计算过程,可能会考自由度的计算。4、学会推断结论的对错,以及它简洁犯哪一类错误?5、各检验方法适应条件:t检验,方差分析,正态分布,二项分布,POSSION分布的使用条件(何种状况用线性相关?何种状况用等级相关?)6、统计学是什么?用来干什么?7、计量资料的统计描述,集中和离散趋势分别从哪几个方面进行描述、分析?8、推断数据属于哪一种资料类型?小概率大事的定义9、医学参考值范围的概念,U界值表。如何用正态分布法、百分位数法计算医学参考值范围?10、正态分布的概念和特点, 标准正态分布全部把握,常见的正态曲线

42、面积分布。(1%,5%的面积分布)11、t分布的基本公式。P33可信区间的概念及精确含义。总体均数的参数估量:单一总体均数的可信区间计算。为什么要对总体均数进行估量?12、P35,假设检验(小概率反证法):基本思想,基本步骤。 如何确立 H0检验假设?13、 t检验:用途,分类,适用条件,留意事项。单样本t检验公式。I类错误,II类错误的定义。可能的考核形式“分析结果是否正确,不正确的话,推断简洁犯哪一类错误”?P44-45,正态性检验的适用范围,方差齐性F检验的概念,适用范围。14、 方差分析的基本思想,变异分解,自由度的分解。推断正态分布总体,总体方差齐性 公式不要求背,变异分解可能会以选

43、择题的形式消灭。多样本方差齐性比较的方法, 方差分析(不考计算过程,或许会考查自由度。任意基本思想即可)16、 计数资料的统计描述:强度相对数,结构相对数,相对比的计算。率与构成比的区分。标准化的方法,理解,不考大题。17、 二项分布的应用条件,性质,二项分布的应用分布,什么时候用正态分布法,什么时候用直接法。 POSSION分布的特点:可加性。POSSION的分布应用,尤其是两样本均数的比较。 负二项分布的应用调整。18、 第七章:卡方检验。 四格表的卡方检验基本思想,专用公式,校正公式及它们的使用条件,P114(大题)。拟合优度。行*列表资料的卡方检验专用公式,P119。关联性检验公式,P

44、120。检验水准和,P122。19、第八章: 【问答题?】参数检验与非参数检验的概念及区分。每种的编秩过程,应用条件。20、 第九章: 什么是最小二乘法?直线相关与直线回归的区分。相关系数,回归系数,确定系数的定义。回归方程的假设检验的剩余标准差,残差,可信区间。 21、统计图、统计表。 标目,可能以改错问答题的形式消灭。统计图分类,各种用途,关注各检验分析适用的条件,何种状况用等级相关,何种状况用线性相关。 P2,变量与资料。P4小概率大事的定义。一、名解:1.总体:依据争辩的目的确定的同质观看单位的全体,更精确的说,它是同质的全部观看单位某种观看值的集合。2、参数:描述总体数量特征的统计指

45、标3、抽样争辩:在医学争辩中,为节省人力,物力,财力和时间,一般都实行从总体中抽取样本,依据样本信息推断总体特征的方法,即抽样争辩的方法来实现,这种从总体中抽取部分观看单位的过程称为抽样4.样本含量:从总体中随机抽得的观看单位,其实测值的集合,就称样本,该样本中所包含的观看单位数称为该样本的样本含量5.变量:确定总体之后,争辩者应对每个观看单位的某项特征进行观看或测量,这种特征能表现观看单位的变异性,称为变量6.计量资料:为观测每个观看单位某项指标的大小,而获得的资料,一般有度量衡单位7.计数资料:为将观看单位按某种属性或类别分组计数,分组汇总各组观看单位数后而得到的资料8.等级资料:又称半定

46、量资料或有序分类变量资料,为将观看单位按某种属性的不同程度分为等级后分组计数,分类汇总各组观看单位数后而得到的资料。9.误差:泛指实测值与真值之差。按其产生的缘由和性质可粗分为随机误差和非随机误差,后者又可分为系统误差与非系统误差。10.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法把握的因素引起。在抽样过程中由于抽样的偶然性而消灭的抽样误差。随机误差是不行避开的,在大量的重复测量中,或在抽样过程中,它可消灭或大或小或正或负,呈肯定规律的变化。11.系统误差:在试验过程中产生的误差,它的值或恒定不变,或遵循肯定的变化规律,其产生的缘由往往是克制的或可以把握。12.频率与概率:在重复多次后,消灭“正面”(或“反面”)这个结果的比例称之为频率;描述随机大事发生可能性大小的一个度量,称之为概率。13.几何均数:可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。14.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。15.抽样误差:这种由个体变异产生,随机抽样造成的样本统计量与总体参数的差异。15.检验效能:1-称为检验效能,过去称为把握度,其意义为当两总体确有差异,按规定检验水准所能发觉该差异的力量。16.率:说明某现象发生的频率或强度;率=(某时期内发生某现象的观看单位数/同期可能性某现象的观看单位总数)*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论