单因素方差分析级硕士生.ppt_第1页
单因素方差分析级硕士生.ppt_第2页
单因素方差分析级硕士生.ppt_第3页
单因素方差分析级硕士生.ppt_第4页
单因素方差分析级硕士生.ppt_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

标准运行管理科 冯 丹 2014年11月20日,Email: TEL:第六章 定量资料的方差分析,主要内容,2019/6/16,中国人民解放军总医院 标准运行管理科,2/110,复 习,1. 卫生统计学中变量分类?,分类变量,定量变量,二分类变量,无序多分类变量,有序多分类变量,离散型变量,连续型变量,2019/6/16,3/110,中国人民解放军总医院 标准运行管理科,复 习,2. 卫生统计学核心内容?,统计推断,即由样本推知总体,1.参数估计:通过抽样来估计总体参数,包括总体均数、总体概率的估计;,2. 假设检验:基于对总体的假设,通过样本数据推断总体参数的差异性。,2019/6/16,4/110,中国人民解放军总医院 标准运行管理科,复 习,3. 何时应用t 检验?,定量变量两总体均数差异性检验,随机样本,来自正态分布总体,两总体方差相等(方差齐),2019/6/16,5/110,中国人民解放军总医院 标准运行管理科,复 习,4. t 检验类型?,单样本资料的t 检验,配对设计资料的t 检验,两独立样本资料t 检验-方差齐,两独立样本资料t 检验-方差不齐,大样本资料的Z检验,2019/6/16,6/110,中国人民解放军总医院 标准运行管理科,复 习,5. 资料的统计分析策略?,?资料类型:,?比较指标:,定量变量,无序分类,?设计类型:,?水平数量:,?参数分布:,均数,方差,率,构成比,完全随机,配伍组,单水平,两水平,三水平,正态分布,非正态分布,有序分类,?分析方法:,t 检验,方差分析,2019/6/16,7/110,中国人民解放军总医院 标准运行管理科,复 习,2019/6/16,8/110,中国人民解放军总医院 标准运行管理科,数据资料,变量类型,数值变量,分类变量,比较参数,两个样本,2019/6/16,9/110,中国人民解放军总医院 标准运行管理科,1 样本;1总体,比较参数,样本个数,设计类型,多个个样本,配对设计,完全随机设计,2019/6/16,10/110,中国人民解放军总医院 标准运行管理科,问题 1,研究目的:评估阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者的运动心肺功能变化,以期发现心血管疾病的潜在危险。,研究设计:将30例(OSAHS)患者均应用多导睡眠监测仪进行监测,根据呼吸紊乱指数(AHI)分为轻中度和重度组,单纯打鼾组患者20例。测得心肺功能指标见表。,2019/6/16,11/110,中国人民解放军总医院 标准运行管理科,问题 1,2019/6/16,12/110,中国人民解放军总医院 标准运行管理科,问题 1,结果:采用t 检验进行分析得出 OSAHS组患者FCV、FEV1 、 FVC% pred 、 FEF25 、 FEF50与单纯打鼾组比较差异有统计学意义(P0.05); OSAHS组患者与单纯打鼾组运动心肺功能指标比较, OSAHS组在最大耗氧最大运动负荷、无氧阈(AT)及心率均低于单纯打鼾组(P0.05)。,2019/6/16,13/110,中国人民解放军总医院 标准运行管理科,问题 1,分析:本研究有一个试验因素,即阻塞性睡眠呼吸暂停,研究者设计之初分为3个水平,即轻中度和重度组,单纯打鼾组。此试验为单因素3水平设计。,存在问题:研究者误用t检验进行统计分析。t检验仅适用于单因素且水平数最多为2个的定量资料均数比较,2019/6/16,14/110,中国人民解放军总医院 标准运行管理科,问题 1,正确方法:如单因素3水平设计定量资料满足参数检验前提条件,应选用单因素3水平设计的定量资料方差分析;否则选用单因素3水平设计的定量资料Kruskal-Wallis秩和检验。,2019/6/16,15/110,中国人民解放军总医院 标准运行管理科,2019/6/16,16/110,中国人民解放军总医院 标准运行管理科,问题 2,例1 为研究钙离子对体重的影响作用,某研究者将36只肥胖模型大白鼠随机分为三组,每组12只,分别给予高脂正常剂量钙(0.5%)、高脂中剂量钙(1.0%)和高脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其喂养前后体重的差值,问三组不同喂养方式下大白鼠体重改变是否剖不同?,2019/6/16,17/110,中国人民解放军总医院 标准运行管理科,问题 2,2019/6/16,18/110,中国人民解放军总医院 标准运行管理科,问题 2,分析: 处理因素:单因素,即饲料; 水平数:3水平,即高脂正常剂量钙(0.5%)、高脂中剂量钙(1.0%)和高脂高剂量钙(1.5%) 实验效应:喂养前后体重的差值 设计类型:单因素3水平设计 统计方法:完全随机设计资料的方差分析,2019/6/16,19/110,中国人民解放军总医院 标准运行管理科,主要内容,ANOVA,ANALYSIS OF VARIANCE,2019/6/16,20/110,中国人民解放军总医院 标准运行管理科,1. 方差分析的含义,方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析也就是对变异的分析。 是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。,2019/6/16,21/110,中国人民解放军总医院 标准运行管理科,根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。 通过比较不同来源变异的方差(也叫均方MS),借助F分布做出统计推断,从而判断某因素对观察指标有无影响。,2019/6/16,22/110,中国人民解放军总医院 标准运行管理科,问题 2,2019/6/16,23/110,中国人民解放军总医院 标准运行管理科,1. 总变异 36只大白鼠喂养9周后体重差值X大小各不相同,这种变异称为总变异(total variation)。总变异的大小用 SS总= (观测数据-总均数)2 与总均方MS 总描述。 其中N为总例数,总=N-1为总自由度,2019/6/16,24/110,中国人民解放军总医院 标准运行管理科,2. 组间变异 3组饲料饲养大白鼠,其体重差值的样本均数各不相同,这种变异称为组间变异(variation between groups),反映不同饲料对大白鼠体重的影响,也包含了随机误差。组间总变异的大小用 SS组间= (组均数-总均数)2 与组间均方MS 组间描述。 其中k为组数,组间=k-1为组间自由度,2019/6/16,25/110,中国人民解放军总医院 标准运行管理科,3. 组内变异 各组内大白鼠体重差值大小各不相同,这种变异称为组内变异(variation within groups),反映随机误差。组内总变异的大小用 SS组内= (观测数据-组均数)2 与组内均方MS 组内描述。 其中组内=N-k为组内自由度,2019/6/16,26/110,中国人民解放军总医院 标准运行管理科,方差分析的零假设为 H0:1=2= = k ,即所有总体均数相等;备择假设为H1 :至少有两个总体均数不相等。如H0成立,则组间变异应与组内变异一样,只反映随机误差的作用大小。,2019/6/16,27/110,中国人民解放军总医院 标准运行管理科,主要内容,2019/6/16,28/110,中国人民解放军总医院 标准运行管理科,例2 某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载蛋白测定,结果如下,问3种人的载蛋白有无差别?,2019/6/16,29/110,中国人民解放军总医院 标准运行管理科,n1=11 n2=9 n3=10 N=30,2019/6/16,30/110,中国人民解放军总医院 标准运行管理科,所有人的载脂蛋白的变异可分解为两部分: 组内变异(SSE),反映载脂蛋白测定值的随机误差和个体差异; 组间变异(SSA),反映随机误差和不同的生理病理状态对载脂蛋白的影响。,2019/6/16,31/110,中国人民解放军总医院 标准运行管理科,2019/6/16,32/110,中国人民解放军总医院 标准运行管理科,Xij第i 个组的第j 个观察值 I=1,2,k J=1,2,ni ni第i 个处理组的例数 ni=N Xi = X=,2019/6/16,33/110,中国人民解放军总医院 标准运行管理科,列举存在的变异及意义,1.全部的30个实验数据之间大小不等,存在变异(总变异)。 2.各个组间存在变异(组间变异):反映处理因素之间的作用,以及随机误差。 3.各个组内个体间数据不同:反映了观察值的随机误差(组内变异)。,2019/6/16,34/110,中国人民解放军总医院 标准运行管理科,各种变异的表示方法,SS总 总 MS总,SS组内 组内 MS组内,SS组间 组间 MS组间,三者之间的关系: SS总= SS组内+ SS组间 总= 组内+ 组间,2019/6/16,35/110,中国人民解放军总医院 标准运行管理科,2019/6/16,36/110,中国人民解放军总医院 标准运行管理科,计算:,2019/6/16,37/110,中国人民解放军总医院 标准运行管理科,方差分析的步骤,1.建立假设 H0 :1 = 2 = 3 =. H1 :总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F 4.求概率值P 5.做出推论:统计学结论和专业结论。,2019/6/16,38/110,中国人民解放军总医院 标准运行管理科,F=MS组间/MS组内 公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很小, F值应该接近于1。那么要接近到什么程度呢?(Fisher计算出了F的分布规律,即标准的F値) 通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。,计算统计量F,2019/6/16,39/110,中国人民解放军总医院 标准运行管理科,2019/6/16,中国人民解放军总医院 医疗统计科,40/110,完整书写方差检验的过程,1.建立假设 H0 :3种载脂蛋白的总体均数相等 1 = 2 = 3 H1 :3种载脂蛋白的总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F:F=MS组间/MS组内=5.854 组间=组数-1 =312 组内=N-组数30327 4.计算概率值P: F0.05(2,27) 3.35 F5.854, P是F所对应的概率値。 P与的大小进行比较,? 5.做出推论:统计学结论? 专业结论?,2019/6/16,41/110,中国人民解放军总医院 标准运行管理科,2019/6/16,中国人民解放军总医院 医疗统计科,42/110,应用条件,各样本是相互独立的随机样本 各样本来自正态分布 各样本方差相等,即方差齐。,2019/6/16,43/110,中国人民解放军总医院 标准运行管理科,主要内容,(Randomized block design Two-way ANOVA),2019/6/16,44/110,中国人民解放军总医院 标准运行管理科,例3 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果,采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。 现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)如下,问小白鼠经三种不同营养素喂养后所增体重有无差别?,2019/6/16,45/110,中国人民解放军总医院 标准运行管理科,2019/6/16,46/110,中国人民解放军总医院 标准运行管理科,将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。 注:是配对资料的扩充。,2019/6/16,47/110,中国人民解放军总医院 标准运行管理科,分析变异,1.总变异:24只小白鼠的增重不等,与均数之间存在差别。 2.处理间变异:喂不同营养素的小白鼠增重不同。 3.区组间变异:不同窝别的小白鼠增重不同 4.误差:各组内小白鼠增重不同,2019/6/16,48/110,中国人民解放军总医院 标准运行管理科,SS总 总,SS误差 误差 MS误差,SS处理 处理 MS处理,变异之间的关系: SS总= SS处理+ SS区组+ SS误差 总= 处理+ 区组+误差,变异间的关系,SS区组 区组 MS区组,2019/6/16,49/110,中国人民解放军总医院 标准运行管理科,统计量F 的计算,F1=MS处理/MS误差 F2=MS区组/MS误差 自由度: 处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14,2019/6/16,50/110,中国人民解放军总医院 标准运行管理科,方差分析结果,2019/6/16,51/110,中国人民解放军总医院 标准运行管理科,2019/6/16,52/110,中国人民解放军总医院 标准运行管理科,完整书写方差分析的过程,1.建立假设: H0 :3种营养素喂养的小白鼠体重增量相等 1 = 2 = 3 H1 : 3种营养素喂养的小白鼠体重增量不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F: F=MS处理/MS误差 4.求概率值P: 5.做出推论:,2019/6/16,53/110,中国人民解放军总医院 标准运行管理科,例 某湖水不同季节的氯化物含量测定值如下,问在不同季节该湖水中氯化物含量有无差别?,区别完全随机化设计和随机区组设计,2019/6/16,54/110,中国人民解放军总医院 标准运行管理科,某湖水中不同季节氯化物含量测定值(mg/L),完全随机设计,2019/6/16,55/110,中国人民解放军总医院 标准运行管理科,某湖水中不同季节氯化物含量测定值(mg/L),随机区组设计,2019/6/16,56/110,中国人民解放军总医院 标准运行管理科,例 某医师为研究脾切除手术过程中门静脉压力kPa的变化,测得以下数据,试作分析。,方法不当会影响统计结果,2019/6/16,57/110,中国人民解放军总医院 标准运行管理科,脾切除手术中不同时期的门静脉压力kPa,2019/6/16,58/110,中国人民解放军总医院 标准运行管理科,Analysis of Variance Procedure Sum of Mean Source DF Squares Square F Value Pr F GROUP 2 0.4281 0.2141 0.20 0.8198 Error 21 22.4065 1.0670 Corrected Total 23 22.8346,结论:,完全随机设计,随机区组设计,2019/6/16,59/110,中国人民解放军总医院 标准运行管理科,存在问题,方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。 为了得到这方面的信息,可进行多个样本间的两两比较。,2019/6/16,60/110,中国人民解放军总医院 标准运行管理科,主要内容,(Multiple comparison),2019/6/16,61/110,中国人民解放军总医院 标准运行管理科,能否用t检验或检验? 每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:? 远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。,2019/6/16,62/110,中国人民解放军总医院 标准运行管理科,1多个样本均数间每两个均数的比较 适用于:在研究设计阶段未预先考虑或未预料到,经数据结果的提示后,才决定的多个均数间的两两比较,常见于探索性研究。 采用的检验方法称为最小显著极差法(LSR法) 常用方法: (1)q检验(又称Student-Newman-Keuls法,简称SNK法) (2)新复极差检验(SSR法, Duncan法),2019/6/16,63/110,中国人民解放军总医院 标准运行管理科,检验统计量 q检验界值表, 它有两个自由度,一个是=E,另一个是a,a指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身)。,q检验,2019/6/16,64/110,中国人民解放军总医院 标准运行管理科,H0: 任2个人群的载脂蛋白的总体均数相等,即A=B H1: AB 将3组样本均数从小到大(或从大到小)顺序排列,并编上组次 组次 1 2 3 均数 102.39 105.45 122.80 组别 IGT异常 糖尿病患者 正常人,例(续例3)对三个人群的载脂蛋白作两两比较。,2019/6/16,65/110,中国人民解放军总医院 标准运行管理科,三组均数比较的q检验,从p值一栏中可以推断出结论,即IGT异常与正常人的载脂蛋白有差别, 糖尿病患者与正常人的载脂蛋白有差别。,=E,2019/6/16,66/110,中国人民解放军总医院 标准运行管理科,有时并不需要将几组均数都一一作比较,而只须将对照组与几个实验组作比较。常用的方法有: 最小显著差数法(LSD法),实质为两个均数比较的t检验法(查t表).,2多个实验组与一个对照组均数间的两两比较,=E,2019/6/16,67/110,中国人民解放军总医院 标准运行管理科,IGT异常与糖尿病患者的比较 H0:1=2 H1: 12 =0.05 p0.05, 认为二者无差别,例(续例2),2019/6/16,68/110,中国人民解放军总医院 标准运行管理科,IGT异常与正常人的比较 H0:2=3 H1: 23 =0.05 =27 查t表 t(0. 05,27)=2.052 t(0. 01,27)=2.771 0.002p0.005, 认为二者有差别,2019/6/16,69/110,中国人民解放军总医院 标准运行管理科,当处理组k=2时,LSD法和q检验方法尺度相同; 当处理组k3时,LSD法和q检验方法尺度不同; LSD法较低,而q检验方法较高. 在实际工作中,要求精度高的用q检验,实验组与对照相比用LSD法.,多重比较方法的比较,2019/6/16,70/110,中国人民解放军总医院 标准运行管理科,标记字母法,多重比较的表示方法,2019/6/16,71/110,中国人民解放军总医院 标准运行管理科,梯形法,多重比较的表示方法,2019/6/16,72/110,中国人民解放军总医院 标准运行管理科,小结:方差分析思路,1 . 方差分析用于进行多组均数之间的比较;即采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,说明处理因素的影响的确存在。 总变异=随机变异+处理因素导致的变异 总变异=组内变异(误差)+组间变异,2019/6/16,73/110,中国人民解放军总医院 标准运行管理科,小结:方差分析思路,2 . 多重比较:针对两两比较时如何控制一类错误的大小,统计学上已经发展出一系列方法。 3 . 方差分析要求各样本来自正态总体,且各总体方差相等。如果这些条件不满足,应进行变量变换,或更改分析方法。,2019/6/16,74/110,中国人民解放军总医院 标准运行管理科,求出变异平方和与自由度; 列出方差分析表,进行F检验; 若F检验差异显著,进行多重比较.,方差分析的基本步骤,小结:方差分析思路,2019/6/16,75/110,中国人民解放军总医院 标准运行管理科,方差分析,76,小 结,单因素方差分析的SPSS实现,2019/6/16,77/110,中国人民解放军总医院 标准运行管理科,SPSS单因素方差分析过程名,2019/6/16,78/110,中国人民解放军总医院 标准运行管理科,1. 完全随机设计资料的方差分析One-Way ANOVA,例1 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。,2019/6/16,79/110,中国人民解放军总医院 标准运行管理科,2019/6/16,80/110,中国人民解放军总医院 标准运行管理科,n行2列 (指标变量、分组变量),数据格式,2019/6/16,81/110,中国人民解放军总医院 标准运行管理科,Analyze Compare Means One-Way ANOVA,检验步骤,2019/6/16,82/110,中国人民解放军总医院 标准运行管理科,One-Way ANOVA 对话框,2019/6/16,83/110,中国人民解放军总医院 标准运行管理科,Post Hoc Multiple Comparisons 对话框,2019/6/16,84/110,中国人民解放军总医院 标准运行管理科,Option对话框,2019/6/16,85/110,中国人民解放军总医院 标准运行管理科,点击“OK”,运行结果,2019/6/16,86/110,中国人民解放军总医院 标准运行管理科,结果输出,2019/6/16,87/110,中国人民解放军总医院 标准运行管理科,基本统计描述,2019/6/16,88/110,中国人民解放军总医院 标准运行管理科,方差齐性检验,2019/6/16,89/110,中国人民解放军总医院 标准运行管理科,方差分析表,2019/6/16,90/110,中国人民解放军总医院 标准运行管理科,多重比较(LSD法),2019/6/16,91/110,中国人民解放军总医院 标准运行管理科,多重比较(SNK法),2019/6/16,92/110,中国人民解放军总医院 标准运行管理科,2.随机区组(或单位组、配伍组)设计的方差分析,例2 下表是11名战士在不同海拔高度的血氨值。试 分析,2019/6/16,93/110,中国人民解放军总医院 标准运行管理科,1行3列 (指标变量、处理组分组变量、 单位组分组变量),数据格式,2019/6/16,94/110,中国人民解放军总医院 标准运行管理科,Analyze General Linear Models(广义线性模型) Univariate (单变量),检验步骤,2019/6/16,95/110,中国人民解放军总医院 标准运行管理科,Univariate对话框,多重比较,2019/6/16,96/1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论