




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,方差分析(AnalysisofVariance,ANOVA),广州医学院公共卫生与全科医学学院朱春燕,2,例研究者要比较四种新型避孕药对雌激素分泌水平的影响。试验对象为相同品系的雌性大鼠,将20只大鼠随机分入四组中,给予相应的药物,两周后通过测量大鼠的子宫重量来衡量其雌激素水平,现希望通过对实验数据的分析来回答这一研究问题。,3,可以做两两检验吗?上例共有4组的均数需要比较。如果用t检验进行两两比较,共要进行6次t检验。如果每次t检验犯第一类错误的概率为0.05,则不犯第一类错误的概率为0.95,6次都不犯第一类错误的概率为0.95的6次方,即0.7351,因此在6次t检验中至少有一次犯第一类错误的概率为0.2649。由此可见用两两检验的方式进行多组间的比较会增大犯第一类错误的概率。,?问题的提出,将所研究的对象分为多个处理组,施加不同的干预,施加的干预称为处理因素(factor),处理因素至少有两个水平(level)。用这类资料的样本信息来推断各处理组间多个总体均数是否存在差别,常采用的统计分析方法为方差分析(analysisofvariance,ANOVA)。由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。,一、方差分析的基本思想及应用条件,4,5,方法的提出,方差分析同样用于连续性变量的统计分析,但是其理论的出发点与t检验不同,从而能够处理多组均数比较的问题。例从某社区随机抽取了共30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dL)测定,问三种人的载脂蛋白有无差别?糖尿病:85.7105.2109.596115.295.3110100125.6111106.5IGT异常:96124.5105.176.495.311095.299120正常人:144117110109103123127121159115,6,检验某一个影响因素的差异是否会给观察变量带来显著影响例如:考察不同疗法的效果是否不同?考察不同的推销策略是否对推销额产生显著影响?,分析目的,7,方差是描述变异的一种指标,方差分析也就是对变异的分析。对总变异进行分析,看总变异是由哪些部分组成的,这些部分之间的关系如何。,方差分析的概念,8,标准差(S):由于有根号,难以进行四则运算均方(MS):标准差的平方,即方差(2,S2),解决了上述问题离均差平方和(SS):其大小不仅与资料的离散程度有关,另外还与样本例数有关,确切地说,应该与样本的自由度(degreeoffreedom)有关,自由度增大,SS增大,变异的测量指标,总变异(Totalvariation):全部测量值Xij与总均数间的差别组间变异(betweengroupvariation)各组的均数与总均数间的差异组内变异(withingroupvariation)每组的10个原始数据与该组均数的差异,试验数据有三个不同的变异,用离均差平方和(sumofsquaresofdeviationsfrommean,SS)表示变异的大小,9,总变异,SS总反映了所有测量值之间总的变异程度,SS总=各测量值Xij与总均数差值的平方和,10,SS组间反映了各组均数间的变异程度组间变异随机误差+处理因素效应,组间变异,11,在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异。SS组内仅仅反映了随机误差的影响。也称SS误差,组内变异,mi,12,13,在单因素方差分析中,整个样本的变异可以看成由如下两个部分构成:总变异=随机变异+处理因素导致的变异处理因素导致的变异就是要研究的对象,我们希望能够证明它是否大于0,理论上的变异分解,14,实际数据的变异分解,分开各组观察:各处理组内部的每一个个体测量值和该组均数间存在着差异显然,由于该组使用相同的处理策略,处理因素应当对这种变异无作用这种组内变异只反映了个体差异(随机变异)的大小?思考:有哪些指标可以反映这种变异?,15,合并观察各组的均数差异各治疗组都可以计算出一个均数,各组均数间一般也存在着差异(和总样本均数不相等)显然,如果不同治疗策略的效果存在区别,则必然会反映到各组均数之差中去除此以外,各组均数的差异(组间变异)也应当反映了个体差异(随机效应)的影响SS总变异=SS组内变异+SS组间变异,实际数据的变异分解,16,基本分析原理,变异的理论分解与实际分解间的关系:,17,三种“变异”之间的关系,离均差平方和分解:,18,均方(meansquare,MS),19,各种变异的表示方法,SS总总MS总,SS组内组内MS组内,SS组间组间MS组间,三者之间的关系:SS总=SS组内+SS组间总=组内+组间,均方之比Fvalue,20,21,F=MS组间/MS组内自由度:组间=组数-1组内=N-组数MS=SS/通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。,F界值表,附表4F界值表(方差分析用,单侧界值)上行:P=0.05下行:P=0.01,22,23,方差分析的基本思想,首先将总变异分解为组间变异和误差(组内)变异,然后比较两者的均方,即计算F值,若F值大于某个临界值,表示处理组间的效应不同,若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅由随机原因所致)。对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。,24,方差分析的应用条件,各样本是相互独立的随机样本;各样本来自正态总体;各处理组总体方差相等,即方差齐性或齐同(homogeneityofvariance)。,25,二、完全随机设计的方差分析,完全随机设计(completelyrandomdesign)也叫单因素方差分析(onewayANOVA)。将受试对象随机地分配到各个处理组的设计。,26,27,1.建立假设并确定检验水准H0:3种载脂蛋白的总体均数相等,1=2=3H1:3种载脂蛋白的总体均数不全相等=0.052.计算检验统计量根据计算公式,可计算各变异部分的离均差平方和、自由度、均方和检验统计量F值。,方差分析的步骤,28,表1成组设计方差分析的计算公式,29,表2糖尿病患者、IGT异常及正常人的载脂蛋白测定结果,30,31,3.下结论由F界值表可知F0.05(2,27)=3.35本例F=5.8540,所以P0.05,在0.05的水准上,拒绝H0,可以认为不同人群的载脂蛋白的总体均数不全相同。,32,三、随机区组设计的两因素方差分析,随机区组设计、配伍组设计,也叫双因素方差分析(two-wayANOVA),是配对设计的扩展。应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究因素的水平数相等,且随机地接受研究因素某一水平的处理。减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。,33,例对小白鼠喂以A、B、C三种不同的营养素,以了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系、同体重的24只小白鼠随机分为8个区组,每组3只。3周后测量增重结果,结果如下表。问3种不同营养素喂养后所增体重有无差别?,表A、B、C三种营养互喂养小白鼠所增体重(克),34,方差分析的步骤,H0:m1=m2=m3=.=mk,m1=m2m3,H1:notallthemiareequal,m1m2m3,与完全随机设计的方差分析基本相同,区别:F值计算的方差分析表(ANOVAtable)不同变异来源从组内变异中分解出区组间变异与误差变异。,35,36,分析变异,总变异组间变异误差(组内)变异配伍间变异,SS总总,SS组内组内MS组内,SS组间组间MS组间,变异之间的关系:SS总=SS组内+SS组间+SS区组间总=组内+组间+区组间,变异间的关系,SS区组间区组间MS区组间,37,38,统计量F的计算,F1=MS组间/MS组内F2=MS区组间/MS组内自由度:组间=组数-1=3-1=2区组间=区组数-1=8-1=7组内=(组数-1)(区组数-1)=14,39,40,41,42,问题的提出,方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。,43,多个样本均数间的多重比较,方差分析本身是完美的,但在解决实际问题的时候,我们往往仍需要回答多个均数间究竟是哪些和哪些存在差异,这样问题又回到了两两比较上。显然,在两两比较时关键的问题就是如何控制好总的一类错误的大小。实际上,所有的两两比较方法都是在解决如何控制一类错误这一问题,采用的方式和标准不同,就衍生出了不同的方法,若用上一章的两样本均数比较的t检验进行多重比较,将会加大犯类错误(把本无差别的两个总体均数判为有差别)的概率。例如,有4个样本均数,两两组合数为,若用t检验做6次比较,且每次比较的检验水准选为,则每次比较不犯类错误的概率为(10.05),6次均不犯类错误的概率为这时,总的检验水准变为,为什么一般t检验作多重比较是错误的?,44,45,两两比较结果如何报告和解释?,报告:abcd结果出现嵌套时的解释:统计结论本身就是概率性的,不存在递推关系存在检验效能的问题由统计结论进行的应用性外推,统计方法本身不负任,46,两两比较结果如何报告和解释?,如果结果可以外推:头上一根头发都没有的人毫无疑问是秃子头上有一根头发的人和一根头发都没
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省菏泽单县北城三中2026届九上化学期中检测模拟试题含解析
- 2026届陕西省西安市陕西师大附中化学九上期中达标测试试题含解析
- 河北省石家庄康福外国语学校2026届九上化学期中学业质量监测模拟试题含解析
- 2026届四川省遂宁四校联考化学九年级第一学期期末学业水平测试模拟试题含解析
- 山东省德州市八校2026届九年级英语第一学期期末经典试题含解析
- 2026届辽宁省沈阳市和平区化学九上期中统考模拟试题含解析
- 2026届舟山市重点中学九年级化学第一学期期中联考试题含解析
- 2026届安庆九一六校九年级化学第一学期期末达标检测试题含解析
- 一般合同和租赁合同5篇
- 文化创意产业园区土地出让与产业孵化服务合同
- 患者身份识别管理标准WST840-2025学习解读课件
- 2025全国企业员工全面质量管理知识竞赛题库(含答案)
- 内分泌科进修总结课件
- 人民陪审员培训民事课件
- 妊娠期贫血的诊断及治疗
- 学堂在线 大数据系统基础 章节测试答案
- ICU常见体位护理
- 污水处理厂运营管理及提升方案
- 骨科无痛病房护理课件
- 2025年国家司法考试《一卷》模拟题及答案(预测版)
- 机电设备安装安全管理体系及安全保证措施
评论
0/150
提交评论