卫生(医学)统计学.ppt_第1页
卫生(医学)统计学.ppt_第2页
卫生(医学)统计学.ppt_第3页
卫生(医学)统计学.ppt_第4页
卫生(医学)统计学.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生(医学)统计学,普通高等教育“十一五”国家级规划教材,第四章 总体均数的估计和假设检验,第一节 均数的抽样误差与标准误,总体,样本,统计推断,抽样,抽样误差,一、抽样误差的概念,由于总体中存在个体变异,(所以)由抽样得到的样本指标与总体指标之间存在差异,这种差异称抽样误差。,在抽样研究中,抽样误差是不可避免的,但其大小可以控制和估计的。,二、中心极限定理,1、在正态总体中,随机抽取例数为n的样本,样本均数服从正态分布; 2、在偏态总体中随机抽样,当n足够大时(n30),也近似正态分布; 3、从均数为,标准差为的正态或偏态总体中,抽取例数为n的样本,样本均数的均数仍为,标准差 。,三、标准误

2、意义及其计算方法,1、标准误意义:说明抽样误差大小的指标。均数抽样误差用表示;率的抽样误差用p 表示。,2、计算公式:,.(理论值),.(估计值),随着 n S 稳定 0,均数的标准误与标准差成正比,与样本例数n的平方根成反比。,因此,减少抽样误差最有效的办法:,增加样本例数,例4.1 已知n=144, =5.381012 /L, S=0.441012 /L 求其标准误。,(1012 /L),3、标准误的应用,标准差,标准误有何区别和联系? 标准差和标准误都是变异指标,但它们之间有区别,也有联系。 区别: 概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是

3、描述样本均数的抽样误差, 越小,均数的可靠性越高;,与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。 联系: 标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。,用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。,第二节 t 分 布,一、t 分布的概念,t值分布称t分布,u变换:,u值的分布称u分布, ,不同自由度下t分布图,t值的表示方法:t,为界值以外的面积;自由度,三、t界值表(附表2) 对应每一自由度取值,就有一条t分布曲线,每条曲线都有自身曲线

4、下t值的分布规律,因此,计算t值较为繁杂。为此,统计学家已制成t值表,通过查表即获得相应的t值。,查表须注意: (1)t值有正负值,由于t分布是以0为中心的对称分布,故表中只列正值,查表时,不管t值正负只用绝对值; (2)t值表中插图阴影部分,表示t,以外尾部面积占总面积的百分比, 即概率;,(5)当一定时, 双侧2单侧 即 双侧t /2,单侧t , 。,单侧:t0.025,10=2.228 双侧:t0.05/2,10=2.228,二者相等,/2,/2,2(/2),双侧,单侧,第三节 总体均数估计,一、可信区间的概念,统计推断,参数估计,假设检验,点估计,区间估计,用样本指标来估计总体指标,参

5、数估计的估计方法: 1、点值估计:用样本均数来估计总体均数 缺点:没有考虑抽样误差(可靠性) 2、区间估计:按一定的概率估计总体均数所在范围。1称可信度。 习惯上,常取1=0.95,即95%可信区间 或取1=0.99,即99%可信区间,若无特别说明,一般取双侧95%可信区间,总体均数的区间估计方法:,(1)当未知,且n较小(n30)时:,(2)当已知,或未知但样本例数足够大(n30)时,按正态分布原理处理:,可信区间的两个要素: 准确度:反映在可信度(1)的大小。1越接近1,就越准确。如可信度99%比95%准确。 精确度:反映在区间的长度。长度越小越好。 在例数n确定的情况下,二者呈反比关系:

6、准确度, 精确度(范围变宽)。 要兼顾准确度和精确度,一般取95%可信区间。,三、可信区间与参考值范围区别,(1)意义不同: 正常值范围是指绝大多数观察值在某个范围; 可信区间是指按一定的可信度估计总体均数(参数)的所在范围;,(2)计算公式不同,可信区间,正常值范围,(3)应用不同,可信区间:估计总体均数,参考值范围: 判断某项指标是否正常,第四节 假设检验的基本步骤,一、假设检验原理,例 4.5,0=72次/分,已知总体,X=74.2 S=6.0,未知总体,二、假设检验思想 根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法,根据样本提供的信息,推断此假设应当拒绝或不拒绝,以便研

7、究者了解在假设条件下, 差异由抽样误差引起的可能性大小。,三、假设检验的一般步骤,1、建立假设和确定检验水准,基本步骤,(1)两个假设 无效假设: H0 备择假设: H1,( 2 )确定单侧或双侧检验,根据专业知识和研究目的而定,单侧检验:在比较两种药物的疗效时,根据专业知识可认为新药不会比旧药差,只关心新药是否比旧药好(至多相同,绝对排除出现相反的可能性),可用单侧检验。,双侧检验:在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。,双侧检验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定有差别。,(3)确定检验水准 一般取0.

8、05,2、选定检验方法和计算检验统计量,不同设计、不同的资料类型和不同的推断目的,选用不同的检验方法;,3、确定P值 P值是指由所规定的总体作随机抽样, 获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。,手工计算:一般是通过查界值表获得。,统计软件:直接给出精确的P值,4、作出推断结论(含统计结论和专业 结论),统计结论:拒绝H0,接受H1,差异有统计学意义),专业结论:可认为 不同或不等。,当 P时,,将获得的事后概率P与事先规定的概率进行比较。,当P时, 统计结论: 不拒绝H0,差异无统计学意义,专业结论: 还不能认为 不同或不等。,假设检验的特点,假设检验中值与P值的区别

9、: 1、假设检验中值是检验水准,是拒绝或不拒绝H0的概率标准。的大小是人为选定的,一般取0.05。 2、P值是指有H0所规定的总体中作随机抽样,获得等于或大于(等于或小于)现有样本统计量的概率。通过P值与值的比较来确定拒绝或不拒绝H0。,第五节 t检验和u检验,t检验和u检验类型:,应用条件: 1、t检验应用条件: (1)样本来自正态总体 (2)两样本均数比较,还要求样本的总体方差相等,2、u检验应用条件: 样本例数n较大,或n虽小而总体标准差已知。,一、单样本t检验,样本均数代表的未知总体均数和已知总体均数0的比较,0,理论值、标准值、稳定值,X,公式 :,= n-1,例4.6 (对例4.5

10、进行t检验),例 4.5,0=72次/分,已知总体,X=74.2 S=6.0,未知总体,检验步骤:,例4.6,建立假设和确定检验水准 H0:=72次/分 H1:72次/分 单侧=0.05 今n=25, =74.2次/分,s=6.0次/分, 0=72次/分,例4.6,选定检验方法和计算检验统计量 按式(4.10),v=n-1=25-1=24,例4.6,确定P值 以v=24查附表2,t界值表,得: t0.05,24=1.771, t0.025,24=2.064 t0.05,24=1.771P0.025,(v一定时,t值越大,P值越小),查t值表时,先查P=0.05时的界值。 当P0.05时,需继续

11、往P更大的一侧查,直到最大的P值为止。,如使用统计软件,会给出确切的概率值。,注意,例4.6,作出推断结论(两个结论:统计结论和专业结论) 今0.05P0.025,按=0.05水准,拒绝H0,接受H1(统计结论),可认为该山区健康成年男子脉搏均数高于一般健康成年男子脉搏均数(专业结论)。,二、 配对t检验(paired t-test),(1)同对的两个受试对象分别给予两种处理(例4.7) (2)同一受试对象分别给予两种处理(同一标本用两种方法检测)(例4.8) (3)同一受试对象处理前后比较(例4.9),例 随机选择9窝中年大鼠,每窝中取两只雌性大鼠随机地分入甲、乙两组,甲组大鼠不接受任何处理

12、(即空白对照),乙组中的每只大鼠接受3mg/Kg的内毒素。分别测得两组大鼠的肌酐(mg/L)测定结果如下。,窝别编号: 1 2 3 4 5 6 7 8 9 甲(对照)组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙(处理)组:7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2,例 检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 问:检验甲乙两法检出血磷是否相同,用何统计方法?,样本号 1 2 3 4 5 6 7 乙 法 2.74 0.54 1.20 5.00 3.85 1.82

13、6.51 甲 法 4.49 1.21 2.13 7.52 5.81 3.35 9.61,例 某脑电图室观察家兔注射AT3前后脑电图波形的变化,观测结果如下。试分析注射AT3前后脑电图波形是否发生了显著性变化。,注射AT3前后脑电图波形的变化率(%),家兔编号 注射前 注射后 1 29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 43,检验公式:,例4.7,配对号 新药组 安慰剂组 差值 (1) (2) (3) (4)=(2)-(3) 1 4.4 6.2 -1.8 2 5.0 5.2 -0.2 3 5.8 5.5 0.3 4 4.6 5.0 -0.4 5 4.

14、9 4.4 0.5 6 4.8 5.4 -0.6 7 6.0 5.0 1.0 8 5.9 6.4 -0.5 9 4.3 5.8 -1.5 10 5.1 6.2 -1.1 -4.3,新药组与安慰剂组血清总胆固醇含量(mol;/L),检验步骤:,1、建立检验假设,确定检验水准 H0: 00 H1:0 0 0.05,2、本例为配对计量资料,用配对t检验,= -1.542,n-1=10-1=9,3、确定P值,以t=1.542, =9,查附表2,得 0.10P0.20,4、作出推断结论,按0.05水准,不拒绝H0,无统计学意义。还不能认为该新药对女性血清胆固醇含量有影响。,三、两样本t检验,应用条件:

15、(1)两样本均来自正态总体 (2)两样本的方差齐 在正式的统计分析中,先要看方差是否齐,如果不齐,要选方差不齐的结果!,在一般的统计软件中,都会同时给出方差齐性检验的结果,两小样本均数比较,t检验,t检验,方差不齐,方差齐,变量变换,秩和检验,两个样本几何均数比较,1、应用条件: a.两样本的对数值均来自正态总体 b.两样本的对数值的方差齐,2、检验公式 与两样本均数的t检验和u检验公式相同, 只是原始数据要作对数变换,用对数值的均数和标准差代公式。,3、检验步骤 与两样本均数的t检验,在使用统计软件进行分析时,先将原始数据取对数,然后用对数值作一般的t检验。,注意啦!,四、u检验,1、应用条

16、件:例数较大(n50),2、方法:,样本均数与总体均数比较,两样本均数比较,第六节 型错误与型错误,型错误:拒绝实际上是成立的H0, 这类“弃真”的错误称型错误或第一类错误。其概率大小用表示。,型错误:不拒绝(接受)实际上是不成立的H0, 这类“存伪”的错误称型错误或第二类错误。其概率大小用表示,但一般不知道.,即拒绝H0,犯型错误; 不拒绝H0 ,犯型错误。,两类错误的关系:,型错误的概率为, 型错误的概率为,一般的大小是不知道的。 1:称为检验效能(又称把握度),即两总体确有差别, 则按水准能发现它们有差别的能力。,越大,越小 ;越小,越大。,呈反比关系,如何确定和的取值? 1、若重点减少

17、(例如,为避免把疗效与常规药本无差别的新药当做有差别,致使无故废弃常规药,即严格要求),则取0.01,2、若重点减少(例如,当欲用新方法取代旧方法时,为了慎重起见,宁可把无差别当成有差别),则取0.1或0.2。,3、若需兼顾和,则取0.05较为恰当。 4、若要同时减少和,只能增加样本的含量。,第七节 假设检验应注意的问题,1、要有严密的抽样研究设计,应考虑到被比较的样本的可比性,这是假设检验的前提。,2、选用的假设检验方法应符合其应用条件。,3、正确理解差别有无显著性的统计意义。,是否拒绝H0,取决于: 1、被研究的事物有无本质的差异 2、抽样误差大小: (1)个体差异大小 (2)样本例数多少 3、检验水准的高低,甲组(n=18) 乙组(n=12) P值 XS XS 甲指标 3.481.65 4.762.52 0.10 乙指标 5.231.12 6.381.21 0.01,两均数相差1.28,两均数相差1.15,解释,差值大小,抽样误差大小,变异度,例数多少,4、结论不能绝对化。,即 拒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论