




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方差分析 ( Analysis of variation),一、思考几个问题,前面学过的t检验适用于何种资料类型? t检验解决了两样本均数比较的问题,当出现多组比较时能否直接用两两比较的t检验得出结论?,对资料中3组数据用t检验作两两比较 比较组别 检验水准 不犯1型错误概率 A组与B组 =0.05 (10.05) A组与C组 =0.05 (10.05) B组与C组 =0.05 (10.05) 3 次均不犯1型错误概率为(10.05)3 总的检验水准为=1(10.05)3=0.14,可以看出犯错误的概率远远大于所要控制的=0.05,多个样本均数间比较不能采用t检验,否则将增大犯类错误概率。,方
2、差分析(ANOVA) 由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称 F 检验 (F test)。用于推断多个总体均数有无差异,有关方差分析的几个符号,什么是方差? 离均差 离均差平方和SS 自由度: 方差S2,也叫均方MS 关系: MS= SS/ ,8,方差分析的基本思想是首先将总变异分解为组间变异和误差变异,然后比较平均变异MSB和MSE,比较时采用两者的比值F值,即,9,1.1m,30位跳高的“苗苗” 2000年9月1日进入广东省体校,10,2年后A组的跳高成绩,A,11,2002年9月1日,三组各自的情形,A,B,C,12,广西的情形,第9章 方差
3、分析,方差分析的基本思想和应用条件 完全随机设计资料的方差分析 多个样本均数的两两比较 多个样本的方差齐性检验 随机区组设计资料的方差分析 交叉设计资料的方差分析 析因设计资料的方差分析 重复测量资料的方差分析,二、方差分析的基本思想,将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。,例9.1:某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml),如表
4、1,问四组家兔血清ACE浓度是否相同?,1、离均差平方和的分解,总变异 概念:26只家兔的血清ACE浓度 各不相同,并与总体均数 也不相同。 大小:用全体数据的方差表示,也称总均方(MS总),总离均差平方和,总=N-1,MS总 =SS总/(N-1),概念:四组家兔的血清ACE浓度均数 也各不相同,并与总 体均数 也不相同。 大小:用组间均方MS组间表示 组间变异是由处理因素效应和随机误差(含个体差异和测量误差)造成的。,组间变异,组间离均差平方和,组间=k-1,MS组间 =SS组间/(k-1),概念:同一组内部的家兔血清ACE浓度 相互间也不相 同,并 与也不相同。 大小:用组间均方MS组内表
5、示。 组内变异是由随机误差(含个体差异和测量误差)造成,组内离均差平方和,组内=N-k,MS组内=SS组内/(N-k),组内变异,三种变异的关系,组内变异SS组内: 随机误差 组间变异SS组间:处理因素随机误差,组间变异,总变异,组内变异,2、变异的比较,,,如果处理因素无作用: 组间变异组内变异 F = 如果处理因素有作用: 组间变异组内变异 F ,F 界值表,例:某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml
6、),如表1,问四组家兔血清ACE浓度是否相同?,二、完全随机设计资料的方差分析,二、完全随机设计资料的方差分析,用于成组设计多个样本均数的比较,属单因素方差分析。处理因素只有一个。多个样本均数不同,推断它们各自代表的总体均数是否相同。 基本步骤: 1、建立检验假设 2、确定检验水准 3、计算F统计量 4、查F界值表得到相应P值 5、作推断结论,建立检验假设,确定检验水准 H0:四组家兔的血清ACE浓度总体均数相等, 1=2=3=4 H1:四组家兔的血清ACE浓度总体均数不等或不全相等,各i不等或不全相等 =0.05,二、完全随机设计资料的方差分析,二、完全随机设计资料的方差分析,计算F统计量,
7、确定P值,并作出统计推断,二、完全随机设计资料的方差分析,39,例9-2某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表91所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?,40,表922型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L),41,(1) 建立假设并确定检验水准 H0: 三个总体均数相等, 即1= 2= 3 H1: 三个
8、总体均数不等或不全相等 =0.05 (2) 计算检验统计量F值,42,表9-6例9-2的方差分析表,43,3)确定P值并作出推断结论 以分子的自由度组间 =2为1,分母的自由度组内 =57为2,查附表3.1,方差分析用F界值表,F0.05(2,60)=3.15 F0.01(2,60)=4.98, F=5.537 F0.01(2,60)=4.98,P 0.01。,在=0.05水准上拒绝H0,接受 H1可以认为三种人的血糖下降值的总体水平不同。,44,注意:以上结论表明,总的说三种人的血糖下降水平不同,但并不能说明任何两种人间均不同。只能说可能至少有两组人的血糖下降水平不同,可能有的组间相同。要了
9、解那些组均数间不同,那些组均数间却水平相同,需要进一步做两两比较。 当k=2时,对同一资料,单因素方差分析等价于成组设计的t检验,且F= t2。,1. 各样本是相互独立的随机样本,均服从正态分布 2. 各样本的总体方差相等,即方差齐性,方差分析应用的条件:,二、完全随机设计资料的方差分析,多个样本均数的两两比较,当方差分析得到拒绝H0,接受H1时,说明多个总体均数不全相等(不是均不相等)。若想进一步了解多个总体均数中哪些不等,则需要做两两比较或称多重比较。,多个样本均数的两两比较,常用的多重比较分为两种情形: 在研究阶段未预料到,经数据结果提示后决定做两两比较,往往涉及到每两个均数的比较:SN
10、K法 设计阶段根据专业知识计划好的某些均数间的两两比较,它常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较:Dunnett-t检验,48,一、多个样本均数间每两个均数的比较:即SNK-q检验。,为两个对比组的样本均数,为比较两组差值的标准误,当各处理组例数相等时,,也相等,,MS误差为方差分析中算得的误差均方(组内均方),nA和nB分别为两对比组的样本例数。,49,计算的检验统计量为q值,q的分布与两比较组之间的组间跨度a及自由度有关。组间跨度a是指,之间涵盖的均数个数(包括,自身在内),每个对比组所包含的组数(组间跨度) a =2,3K。,根据检验统计量q值,组间跨度a ,误差自
11、由度 误差及检验水准,查q界值表,确定P值。,例9-5 对例9-2资料做两两比较,H0:任两 对比组的总体均数相等,即A= B H1:任两 对比组的总体均数不等,即A B =0.05,50,将三个样本均数从小到大排列,并编上组次:组次 1 2 3均数 9.1952 5.8000 5.4300组别 高剂量组 低剂量组 对照组 表9-18 例9-1的SNK检验计算表,51,二、 Dunnett-t检验:它适用于多个实验组与一个对照组的比较,根据算得的t值、误差的自由度、试验组数(K-1)及检验水准查Dunnett-t界值表,作出统计推断结论。,三、随机区组设计资料的方差分析,三、随机区组设计资料的
12、方差分析,两因素:区组因素和处理因素,随机区组设计区组的概念,是“配对”概念的扩展,不是按每两个配对,而是按每三个、每四个或更多个配起来,这就超出了“对子”的涵义,而是配伍组设计了。,先按影响实验结果的非处理因素(如性别、 体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将区组内的受试对象随机分配到各处理组或对照组。,三、随机区组设计资料的方差分析,例9.3 利用随机区组设计研究不同温度对家兔血糖浓度的影响,某研究者进行了如下实验:将24只家兔按窝别配成6个区组,每组4只,分别随机分配到温度15、20、25、30摄氏度的4个处理组中,测量家兔的血糖浓度值(mmol/L),结果如下表9
13、.4所示,分析4种温度下测量家兔的血糖浓度值是否不同?,(1) 总变异 (2) 处理间变异 (3) 误差变异,三、随机区组设计资料的方差分析,概念:每一区组的样本均数 各不相同,与总均数 也不相同. 大小:用组间均方MS组间表示 组间变异是由区组因素效应和随机误差(含个体差异和测量误差)造成的。,(4)区组间变异,三、随机区组设计资料的方差分析,三、随机区组设计资料的方差分析,变异的分解: (1) 总变异: 所有观察值之间的变异 (2) 处理间变异:处理因素随机误差 (3) 区组间变异:区组因素随机误差 (4) 误差变异: 随机误差,三、随机区组设计资料的方差分析,三、随机区组设计资料的方差分
14、析,单向方差分析:处理因素效应+随机效应 (完全随机设计资料) 双向方差分析:处理因素效应+随机效应 +区组效应 (随机区组设计资料的方差分析),三、随机区组设计资料的方差分析,随机区组设计方差分析的基本步骤: 1. 建立检验假设,确定检验水准 对于处理组(试验因素): H0:4种温度下家兔血糖浓度值相同, 1=2=3=4 H1:4种温度下家兔血糖浓度值不全相同, 各i不等或不全相等,三、随机区组设计资料的方差分析,2、确定检验水准,对于区组(干扰因素): :6个总体均数全相等,即不同窝别家兔血糖浓度相同 :6个总体均数不全相等,即不同窝别家兔血糖浓度不全相同,三、随机区组设计资料的方差分析,
15、3、计算检验统计量F,列方差分析表,三、随机区组设计资料的方差分析,4、确定P值,作出统计推断,按 =0.05水准,对于不同区组间,不拒绝 ,尚不能认为不同窝别家兔血糖浓度值不同;对于不同处理组间,拒绝 ,接受 ,差异具有统计学意义,可以认为4种温度下家兔血糖浓度值不全相同,即处理组4个总体均数中至少有2个不同。,四、交叉设计资料的方差分析,例9.4 某医师研究A、B两种药物对失眠患者改善睡眠的效果,将12名患者按交叉设计方案随机分为两组,观察两种药物、两个阶段睡眠时间增加量(小时),每个阶段两周,间隔两周。第一组患者为AB顺序,即第一阶段服用A药,第二阶段服用B药;第二组为BA顺序,即第一阶
16、段服用B药,第二阶段服用A药。,变异的分解: (1) 总变异 (2) 处理变异 (3)阶段的变异 (4)个体间的变异 (5) 误差变异,四、交叉设计资料的方差分析,四、交叉设计资料的方差分析,两阶段交叉设计资料方差分析的具体步骤: 1. 建立检验假设,确定检验水准 处理,四、交叉设计资料的方差分析,阶段,个体,四、交叉设计资料的方差分析,2. 计算检验统计量,四、交叉设计资料的方差分析,3. 确定P值,作出统计推断 按 =0.05水准,均不拒绝 ,还不能认为两处理因素间、两阶段间和个体间的总体均数不同。,四、交叉设计资料的方差分析,五、析因设计资料的方差分析,例9.5 为研究某降血糖药物对糖尿
17、病及正常大鼠心肌磺脲类药物受体SUR1的mRNA的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的两组分别进行给药物和不给药物处理,剩余两组正常大鼠也分别进行给药物和不给药物处理,测得各组mRNA吸光度的值(%).,单独效应、主效应和交互效应,五、析因设计资料的方差分析,单独效应:是指其它因素水平固定时,同一因素不同水平的效应之差 A因素固定在1水平时,B因素的单独效应为 : A因素固定在2水平时,B因素的单独效应为 : B因素固定在1水平时,A因素的单独效应为 : B因素固定在2水平时,A因素的单独效应为:,五、析因设计资料的方差分析
18、,主效应:是指某一因素单独效应的平均值 A因素的主效应-6.58; B因素的主效应为 -8.58 交互效应:是指两个或多个因素间的效应互不独立的情形。,五、析因设计资料的方差分析,五、析因设计资料的方差分析,析因设计资料的方差分析步骤: 1. 建立检验假设,确定检验水准 因素A,五、析因设计资料的方差分析,因素B,五、析因设计资料的方差分析,AB交互作用,2. 计算检验统计量,五、析因设计资料的方差分析,3. 确定P值,作出统计推断 首先判断A因素和B因素交互效应AB的P 值, P 0.05,按 =0.05水准,拒绝H 0,表明两个因素间存在交互效应。这时,如要分析A因素或B因素的单独效应,应
19、固定在A因素的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。 如果交互作用无统计学意义,可直接采用表9.17对A、B两因素的假设检验结果。,五、析因设计资料的方差分析,六、重复测量资料的方差分析,重复测量资料(repeated measurement data) 是同一受试对象的同一观察指标在不同时间点上进行多次测量所获得的资料,常用来分析该观察指标在不同时间点上的变化特点。,例9.6 临床上为指导脑梗患者的治疗和预后,某研究人员对不同类型脑梗患者酸性磷脂(AP)在不同时间点的变化,进行了如下观察:随机选取三种不同类型的脑梗(TIA、脑血栓形成、腔隙性脑梗塞)患者各
20、8例,分别于脑梗发生的第24小时、48小时、72小时、7天分别采血,测量血中AP的值.,六、重复测量资料的方差分析,六、重复测量资料的方差分析,六、重复测量资料的方差分析,离均差平方和与自由度的分解,六、重复测量资料的方差分析,六、重复测量资料的方差分析,重复测量资料的方差分析步骤: 1. 建立检验假设,确定检验水准 处理因素K,六、重复测量资料的方差分析,时间因素I,六、重复测量资料的方差分析,交互作用KI,2. 计算检验统计量,六、重复测量资料的方差分析,3. 确定P值,作出统计推断 根据表9.20的P值,时间与处理因素的交互项有统计学意义,可认为三种不同类型的脑梗患者的AP值在不同时间点
21、上的变化是不同的。若想进一步了解三种不同类型的脑梗患者和四个时间点之间的差别,可固定某一因素的水平分析另一因素的效应,六、重复测量资料的方差分析,96,第六节 方差分析的前提条件和变量变换,方差分析的前提条件为各样本是相互独立的随机样本,均服从正态分布且各样本的总体方差相等。 在进行方差分析时,实际资料有时不能完全满足任何观察值都独立地来自具有等方差正态总体的假定,此时进行方差分析时,可能导致F值偏大,从而有增大第一类错误的危险。 在样本例数较多的情况下,样本均数可看成近似正态分布,此时,方差分析对总体的非正态性并不苛求。 当每组样本例数相等时,方差分析对于方差的齐性并不苛求,故在方差分析时,最好采用每组例数相等的平衡设计方案。,97,变量变换的目的: 1)使各组达到方差齐性。 2)使资料转换为正态分布,以满足方差分析和t检验的应用条件。 通常情况下,一种适当的函数转换可使上述两个目的同时达到。 3)直线化。常用于曲线拟合。,98,对数变换 即将原始数据X的对数值作为新的分析数据。 常用于: 1)使服从对数正态分布的数据正态化。可用对数变换改善其正态性。 2)使资料达到方差齐性的要求,特别是各样本的标准差与均数成比例或变异系数CV接近一个常数时。,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届湖南省凤凰县皇仓中学物理高二下期末联考模拟试题含解析
- 宣传学校特色课件
- 2025届湖南省常德市石门一中物理高二第二学期期末统考试题含解析
- 2025版汽车经销商代理服务合同范本修订
- 2025版彩钢屋顶绿化施工与养护管理合同
- 2025版学校安全管理保安服务临时协议
- 二零二五年度日常公司经营知识产权保护合同
- 2025版高端餐饮品牌加盟管理服务合同范本
- 二零二五年度房地产开发按揭贷款合同范本
- 二零二五“绿色家园”生态社区智能化系统施工合同
- 室内电梯安装安全技术交底
- 智胜软件任九过滤使用说明
- 汽车保险业务投保与核保培训
- 2022年11月四川省监狱管理局度凉山监狱、金堂监狱公开考试转任30名公务员(人民警察)参考题库+答案详解
- 妇科门诊工作流程
- 钢筋加工厂安全教育培训
- 学校章程样稿
- GB 11122-2006柴油机油
- GA/T 458-2021居民身份证质量要求
- 宁夏大学2023年808文学基础与写作考研真题(回忆版)
- 风险分级管控责任清单(公路改扩建工程)
评论
0/150
提交评论