卫生统计学 t-test.ppt_第1页
卫生统计学 t-test.ppt_第2页
卫生统计学 t-test.ppt_第3页
卫生统计学 t-test.ppt_第4页
卫生统计学 t-test.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Nov, 10, 2009,第七章 两组定量(或等级)资料 平均值的比较,Nov, 10, 2009,计量资料的统计分析,统计描述,统计推断,集中趋势,离散趋势,参数估计,假设检验,点估计,区间估计,两样本均数比较t,u-test,多个样本均数比较F-test,Nov, 10, 2009,两组定量资料(或等级资料)平均值的比较,是通过比较两组样本资料的平均值,来推断两组样本资料分别来自的总体的平均值是否相等,是统计推断的另一内容,即假设检验(hypothesis test)。,Nov, 10, 2009,假设检验的步骤和原理,例 已知一般中学男生的心率的均数为0=74次/分,为研究经常参加体育锻炼的中学生心脏功能是否增强,在某地中学生中随机抽取常年参加体育锻炼的男生100名,得到心率平均值为65次/分,标准差s=6次/分。问常年参加体育锻炼的中学男生心率与一般中学男生的心率是否相等?,Nov, 10, 2009,Hypothesis test task, 0(6574),Why?,True difference between two populations,Chance (sampling error),evidence,So the hypothesis task is to differentiate that the difference between the samples is from the true difference between two populations or from the chance!,Nov, 10, 2009,假设检验的步骤,建立检验假设,确定检验水准 H0:= 0=74次/分 (检验假设/零假设; hypothesis under test/ null hypothesis) H1:0 (备择假设/ alternative hypothesis) =0.05 (检验水准/significance level),双侧检验 (Two-sided test),Nov, 10, 2009,假设检验的步骤,根据资料和研究设计类型,选用公式计算统计量 (本研究属于样本均数与总体均数比较/ 单样本t检验one-sample t-test),Nov, 10, 2009,假设检验的步骤,根据样本统计量的大小,确定值,按水平作出统计推断 P值的定义是:指从规定的总体随机抽样,其检验统计量(如t,u等)等于及大于(或和等于及小于)现有样本统计量的概率,Nov, 10, 2009,假设检验统计推断标准,双侧检验 |t|t/2,P,接受,拒绝,差异无 统计学意义; |t|t/2, ,P,接受,拒绝,差异有 统计学意义;,Nov, 10, 2009,单侧检验 |t|t, ,P,接受,拒绝,差异无统计学意义; |t|t, ,P,接受,拒绝,差异有统计学意义;,Nov, 10, 2009,本例=100-1=99,t0.05/2,991.984; t0.01/2,992.626 |t|t0.01/2,99,0.01,接受,拒绝,差异有统计学意义 专业结论:可认为经常参加体育锻炼的中学男生心率的平均水平低与一般男生,Nov, 10, 2009,假设检验的基本思想-概率反证法,先提出一个假设,然后借助一定的分布,看实际样本情况是否属小概率事件,对所提出的假设做出统计推断-是否拒绝它。这种推断的基础是“小概率事件在一次试验(或观察)中是不发生的”。,Nov, 10, 2009,第一节 样本均数与总体均数的比较,样本均数与总体均数的比较是检验样本均数代表的未知总体均数和已知总体均数0 (一般为理论值、标准值或经过大量观察所得的稳定值等)的是否相等。,Nov, 10, 2009,一、服从正态分布样本均数与总体均数的比较,正态分布样本均数与总体均数比较的t检验又称为单样本t检验,其运用条件为:样本含量n较小(一般n50),样本来自的总体是正态分布或近似正态分布,总体标准差未知;如样本量较小,但总体标准差已知,可选用u 检验。 特殊情况:当样本含量较大,样本来自偏态分布的总体也可采用t-test;,Nov, 10, 2009,Nov, 10, 2009,H0 :0 ,即该地难产儿体重与一般婴儿出生体重相等 H1 :0 , 即该地难产儿体重与一般婴儿出生体重不同 0.05 0.002P0.005,按0.05水准,拒绝H0,接受H1,有统计学意义。可认为该地难产儿体重与一般婴儿出生体重不同。根据现有资料,难产儿出生体重高于一般婴儿出生体重。,3.3,Nov, 10, 2009,SAS程序p65,Nov, 10, 2009,当样本含量较大(n50)时,或者小样本总体标准差已知时,选用u检验。,Nov, 10, 2009,例73 成年男子血红蛋白的平均值为155g/L,为检验高原地区居民的血红蛋白增高的假设,某研究者随机抽取144名高原地区男性进行进行检查,其血红蛋白均数为165g/L,标准差25g/L。请检验此假设。,Nov, 10, 2009,H0 :0 ,高原地区男子的血红蛋白含量和一般成年男子相等 H1 :0 ,高原地区男子的血红蛋白含量高于一般成年男子 0.05 因单侧界值u0.01 =2.33, u=4.82.33,故概率P0.01.按0.05水准,拒绝H0 ,接受H1 ,有统计学意义。可认为高原地区男子的血红蛋白含量高于一般成年男子。,Nov, 10, 2009,二、服从Poisson分布样本均数与总体均数的比较,服从Poisson分布资料的样本均数X与总体均数0 的比较,常用的方法有 直接计算概率法和正态近似法,Nov, 10, 2009,直接计算概率法,例74 据以往大量观察得某溶液中平均每毫升有细菌3个。某研究者想了解该溶液放在5冰箱中3天,溶液中细菌是否会增长。他采取已放在5冰箱中3天的该溶液1毫升,测得细菌5个,请作统计推断。,Nov, 10, 2009,H 0:3 在5冰箱中放置3天,溶液中的细菌数不会增长(仍为3个) H1 :3 在5冰箱中放置3天,溶液中的细菌数会增长(超过3个) 单侧0.05,Nov, 10, 2009,正态近似法,当总体均数相当大时,Poisson分布近似正态分布,故当未知总体均数相当大时(一般20),可用标准正态统计量u公式,Nov, 10, 2009,第二节 配对设计定量资料的假设检验,配对设计有两种情况,自身配对和异源配对。自身配对是同一受试对象处理前后的比较或不同部位给予不同处理后比较,目的是推断该处理有无作用;异源配对是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。解决这类问题,先求出各对差值d,根据差值d的总体资料是否呈正态分布,配对设计数值变量资料的假设检验可选用t检验或非参数检验,Nov, 10, 2009,一、配对设计数值变量资料的t检验,Nov, 10, 2009,H0 :d 0,避孕新药对女性血清总胆固醇含量无影响 H1 :d 0,避孕新药对女性血清总胆固醇含量有影响 0.05 以t1.542,查附表2,t界值表得双尾概率0.10P0.20。按0.05水准,不拒绝H0,无统计学意义。还不能认为该新药对女性血清总胆固醇含量有影响。,Nov, 10, 2009,二、配对设计数值变量资料的非参数检验,参数检验(parametric statistic ):t检验和u检验等一些统计推断方法要求样本来自的总体分布类型已知(如正态分布),在这种假设基础上,对总体参数(如总体均数)进行估计或检验 非参数统计(non-parametric statistic):这种方法并不依赖于总体的分布类型,应用时可以不考虑被研究的对象为何种分布以及分布是否已知,也由于这种假设检验方法并非是参数间的比较,而是用于分布之间的比较,Nov, 10, 2009,参数检验与非参数检验优缺点比较,Nov, 10, 2009,什么时候做非参数检验?,对于小样本的计量资料做t、F检验时,如不满足正态性、方差齐性的要求;即使经过变量变换后仍不满足要求; 当资料的分布未知时; 当资料中有不确定值时,如1.0; 出现等级资料时,一般要用非参数检验。,Nov, 10, 2009,Wilcoxon配对秩和检验,18.5,Nov, 10, 2009,第三节 完全随机设计两样本平均值的比较,(一) t 检验/成组设计t检验,Nov, 10, 2009,条件:独立性、正态性和方差齐性,Nov, 10, 2009,正态性检验,图示法: 正态概率纸图:横坐标是指标的刻度(组段),纵坐标是用概率单位的尺度表示的累积概率,应用起来较为方便。如果资料服从正态分布,所画图形应为一条直线。 P-P图:横坐标是所观察数据的累计概率(observed cumulative proportion),纵坐标是假设数据是正态分布的累计概率的期望值(expected cumulative proportion)。,Nov, 10, 2009,Nov, 10, 2009,统计检验方法,W检验(S.S.Shapiro and M.B.Wilk):在样本量为3n50时使用 D检验(DAgostino):样本量为50n1000时使用。 矩法 利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficient of skewness)衡量,样本偏度系数用g1表示,总体偏度系数用1表示;而峰度指分布与正态曲线相比峰的尖峭程度,用峰度系数(coefficient of kurtosis)衡量,样本峰度系数用g2表示,总体峰度系数用2表示。,Nov, 10, 2009,正态检验的假设检验格式: H0 :样本来自正态分布的总体 H1 :样本不是来自正态分布的总体 检验水准0.05,Nov, 10, 2009,方差齐性检验,Nov, 10, 2009,(二)u检验,当两个样本含量较大(均大于50),t-test公式可用u-test来近似,Nov, 10, 2009,(三)检验,当两总体呈正态分布,但方差不等即 时,两小样本均数比较,可选用近似t检验检验。,Nov, 10, 2009,二、两样本分布比较的秩和检验,成组设计的两组数值资料在不满足正态分布的条件下,比较分布情况时选用两样本分布比较的秩和检验(Wilcoxon)。,Nov, 10, 2009,Nov, 10, 2009,步骤,建立假设 编秩 求秩和 T 确定P值和作出推断结论 查表 正态近似法,Nov, 10, 2009,三、两组等级资料比较的秩和检验,当要比较的成组设计的两组资料为等级资料时,亦应用秩和检验。,Nov, 10, 2009,Nov, 10, 2009,四、两Poisson分布均数比较的u检验,两组Poisson分布的资料均服从近似正态分布时,两均数进行比较,可根据正态近似原理选用u检验。 当两样本观察单位(时间、面积、容积)相同时 当两样本观察单位(时间、面积、容积)不同时,需先将观察单位化为相等,Nov, 10, 2009,假设检验的注意事项(一),要有严密的设计 不同的资料要有不同的检验方法 结论不能绝对化(差别有统计学意义) 结论要与专业知识相结合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论