医学统计学(方差分析)_第1页
医学统计学(方差分析)_第2页
医学统计学(方差分析)_第3页
医学统计学(方差分析)_第4页
医学统计学(方差分析)_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,19名要求持续镇痛的病人被随机分到四组,接受同剂量的吗啡,6小时后测量血中游离吗啡水平,问四组之间有无差别?,用什么检验方法?,总体样本?,已知多组样本的信息推断多个总体的信息(均数),.,统计推断,随机抽样,参数?,统计量,(、),(x、s、p),参数估计假设检验,.,方差分析ANOVA,ANALYSISOFVARIANCE,第6章,均方分析,变异数分析,F检验(由英国著名统计学家R.A.Fisher推导出来的),是对变异的来源及大小进行分析的一种统计方法。,.,教学目的与要求,掌握:1、方差分析的基本思想2、方差分析前提条件3、多重比较4、重复测量资料方差分析了解:1、两因素方差分析,.,教学内容提要,重点讲解:方差分析的基本思想完全随机设计的单因素方差分析多个样本均数间的多重比较介绍:方差分析的原理与条件,.,不同的是:方差分析用于多个均数的比较。,与前面讲过的假设检验相同的是:,方差分析的任务:统计量F的计算FMS1/MS2,t检验是用t值进行假设检验,方差分析则用F值进行假设检验,.,7,方差分析的几个概念和符号,什么是方差?离均差离均差之和离均差平方和(SS)方差(2S2)也叫均方(MS)标准差:S自由度:关系:MS=SS/,方差分析的基本概念,.,方差分析的几个符号,xij表示第i组第j个观察值,表示第i组的均数(=)表示总平均=,.,基本思想:先假设(H0)各总体均数全相等;将总变异SS总,按设计和资料分析的需要分为两个或多个组成部分,其自由度也相应地分为几个部分,以随机误差为基础,按F分布的规律作统计推断。,目的:推断总体平均数是否相等.独特之处:不直接比较均数,利用变异的关系进行判别.,第一节完全随机设计资料的方差分析,(单因素方差分析),.,一、方差分析的意义前一章介绍了两个样本均数比较的假设检验方法,但对于3个、4个、5个均数或更多个的比较,t检验或u检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验时通常检验水平取0.05,亦即弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,可信度成为(1-0.05)3=0.857,.,四均数比较作6次(1-0.05)6=0.735五均数比较作10次(1-0.05)10=0.599六均数比较作15次(1-0.05)15=0.463鉴于以上的原因,对多组均数的比较问题我们采用方差分析,.,例1某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者x1:0.841.051.201.201.391.531.671.801.872.072.11健康人x2:0.540.640.640.750.760.811.161.201.341.351.481.561.87,二、单因素方差分析的基本思想,.,24名患者与健康人的血磷值大小不等,称这种变异为总变异。可以用总离均差平方和及N来反映,总自由度T=N-1。,SS总,.,2个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用2组组内离均差平方和及各组例数ni来反映,自由度组内=N-k(k是组数),它反映了随机误差。,SS组内,.,2组样本均数也不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差,组间变异(betweengroupsvariation):SS组间,v组间k1,.,三者关系,SS总=SS组间+SS组内v总=组间+组内,.,直观意义,检验统计量F统计量具2个自由度:v1,v2,.,如果两组样本来自同一总体,即克山病患者与健康人血磷值相同,则理论上F应等于1,因为两种变异都只反映随机误差。由于抽样误差的影响,F值未必是1,但应在1附近。若F较小,我们断定2组均数相同,或者说来自同一总体,F较大,推断不是来自同一总体。,.,三、优点,不受比较的组数限制。可同时分析多个因素的作用。可分析因素间的交互作用。,四、方差分析的应用条件,各样本是相互独立的随机样本各样本来自正态总体各组总体方差相等,即方差齐,.,【例题1】,某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载脂蛋白测定,结果如下,问3种人的载脂蛋白有无差别?问题:1、分析问题,选择合适的统计方法2、如何整理资料、输入计算机,.,.,列举存在的变异及意义,全部的30个实验数据之间大小不等,存在变异,总变异。各个组间存在变异:反映处理因素之间的作用,以及随机误差。各个组内个体间数据不同:反映了观察值的随机误差。各种变异的表示方法,.,各种变异的表示方法,SS总总MS总,SS组内组内MS组内,SS组间组间MS组间,三者之间的关系:SS总=SS组内+SS组间总=组内+组间,.,统计量F的计算及其意义,F=MS组间/MS组内自由度:组间=组数-1组内=N-组数通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。,.,各种符号的意义,xij第i个组的第j个观察值i=1,2,kj=1,2,nini第i个处理组的例数ni=Nxi=x=,.,(x)2,.,(1)建立假设和确定检验水准H0:三种人载脂蛋白的总体均数相等,1=2=3H1:三组总体均数不相等或不全等=0.05(2)计算C=(x)2/N=(3309.5)2/30=365093SS总=x2-C=372974.87-365093=7881.87,.,SS组内=SS总-SS组间=7881.87-2384.026=5497.84总=N-1=29,组间=k-1=2,组内=N-k=30-3=27MS组间=SS组间/组间=1192.01MS组内=SSE/组内=203.62F=MS组间/MS组内=5.8540,.,(3)查方差分析F界值表8确定P值:F0.05(2,30)=3.32;F0.01(2,30)=5.39,(4)作出推断结论按=0.05水平拒绝H0,接受H1,认为三种人载脂蛋白的总体均数不同。,组间,组内,.,完整书写方差分析的过程,建立假设,确定显著性水平:H0:3种载脂蛋白的总体均数相等1=2=3H1:3种载脂蛋白的总体均数不相等或不全相等H1与H0相反,如果H0被否决,则H1成立。常取0.05,区分大小概率事件的标准。计算统计量F:根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。计算概率值P:P的含义。做出推论:统计学结论和专业结论。,.,四组不同摄入方式人的血浆游离吗啡水平,单因素方差分析,.,完整书写方差分析的过程,建立假设:H0:4组病人血浆游离吗啡水平1=2=3=4H1:4组病人血浆游离吗啡水平的总体均数全不相等或不全相等确定显著性水平,用表示。区分大小概率事件的标准,常取0.05。计算统计量F:F=MS组间/MS组内根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。计算概率值P:P的含义。做出推论:统计学结论和专业结论。,单因素方差分析,.,方差分析表(练习,完成该表。例题,写在黑板上),单因素方差分析,F0.05(3,15)3.29,F与它所对应的P值成反比,.,结合上题理解:方差分析的基本思想,将全部观察值总的离均差平方和(SS总)及自由度(总)分解为两个或多个部分除随机误差外,其余每个部分的变异可由某个因素的作用加以解释通过比较不同来源变异的均方(MS),借助F分布做出统计推断,从而了解该因素对观察指标有无影响。,.,存在问题,方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。,.,第二节多个样本均数间的两两比较(又称多重比较),多重比较即多个样本均数间的两两比较,由于涉及的对比组数大于2,若仍用t检验作每两个对比组比较的结论,会使犯第一类错误的概率增大,即可能把本来无差别的两个总体均数判为有差别。4个样本均数间的比较,.,多重比较方法(两两比较),对满足正态性和方差齐性的资料:多个实验组分别与一个对照组比较常用Dunnet-t法。每两个均数比较常用最小显著差值法(LSD-t)、SNK(Student-Newman-Keuls,即q检验)法、Tukey(可靠显著差异)法、Bonferroni-t(校正最小显著差异)调整法等。对不满足正态性和方差齐性的资料:可通过数据变换,使满足方差分析的应用条件。可用非参数检验法,如秩和检验。可采用近似检验,如TamhanesT2,DunnettsT3,Games-Howell,DunnettsC等方法。,.,检验统计量q检验界值表见附表10,它有两个自由度,一个是m(k),m指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身);另一个是=e。,误差,一、q检验(又称Student-Newman-Keuls法,简称SNK-q检验法),常用于多个样本均数间每两个均数的比较。,.,例(续例3)对三个人群的载脂蛋白作两两比较。,(1)建立假设,确定检验水准H0:任2个人群的载脂蛋白的总体均数相等,即A=BH1:AB,=0.05。(2)样本均数排序将3组样本均数从小到大(或从大到小)顺序排列,编上组次,并注上组别.组次123均数102.39105.45122.80组别IGT异常糖尿病患者正常人,.,(3)列出两两均数比较的q检验计算表,从p值一栏中可以推断出结论,即IGT异常(1)与正常人(3)的载脂蛋白有差别,糖尿病患者(2)与正常人(3)的载脂蛋白有差别。,.,二、LSD-t检验,由Fisher提出,称为最小显著性差异法。在H0:ij假设下,t统计量检验i与j是否相同。,(dfdfe)(6-9),可查统计附表7确定概率P的大小。,常用于多个样本均数间每两个均数的比较。,.,三、Dunnett-t检验,常用于多个实验组与一个对照组均数间的两两比较。,实验组,对照组,可查统计附表9确定概率P的大小。,.,四、Bonferroni-t检验,Bonferront=(6-12),假设比较次数为m,则=b/m作为每次比较的水平。,调整检验水准法,.,例题,对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表,问3种不同营养素喂养后所增体重有无差别?,.,.,方法:应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近目的:减少了个体间差异对结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。是配对资料的扩充。,双因素方差分析,第三节随机区组(配伍组)设计的多个样本均数的比较(双因素方差分析),.,例题,对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表,问3种不同营养素喂养后所增体重有无差别?,.,.,分析变异,总变异组间变异误差(组内)变异配伍间变异,.,SS总总,SS误差误差MS误差,SS组间组间MS组间,变异之间的关系:SS总=SS误差+SS组间+SS区间总=误差+组间+区间,变异间的关系,SS区间区间MS区间,.,统计量F的计算,F1=MS组间/MS误差F2=MS区间/MS误差自由度:组间=组数-1=3-1=2区间=区数-1=8-1=7误差=总-组间-区间=23-7-2=14,.,.,.,.,.,.,完整书写方差分析的过程,建立假设,确定显著性水平:H0:3种营养素喂养的小白鼠体重增量相等1=2=3H1:3种营养素喂养的小白鼠体重增量不全相等常取0.05,区分大小概率事件的标准。计算统计量F:F1=MS组间/MS误差计算概率值P:P的含义。做出推论:统计学结论和专业结论。,.,完整书写方差分析的过程,建立假设,确定显著性水平:H0:8窝小白鼠体重增量相等1=2=3H1:8窝小白鼠体重增量不相等或不全相等常取0.05,区分大小概率事件的标准。计算统计量F:F2=MS区间/MS误差计算概率值P:P的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论