




已阅读5页,还剩81页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章 协方差分析,主要内容,方差分析、回归分析原理回顾 协方差分析基本思想 协方差分析应用条件 协方差分析步骤,方差分析原理,完全随机设计: SS总SS处理SS误差 随机区组设计: SS总SS处理SS区组SS误差,回归分析原理,线性回归模型 模型的估计和检验 SS总SS回归SS残差,回顾,方差分析 自变量是离散型分类变量,比较自变量的不同水平上因变量均值的差异。 回归分析 自变量是连续型数值变量,用来估计自变量改变一个单位时因变量的平均改变量。,回顾,一般线性模型(GLM) 将线性回归分析中自变量的数据要求放宽,方差分析和线性回归分析可以统一在一个模型里面。 因变量:连续型 自变量:任意类型,协方差分析的基本思想,将回归分析和方差分析结合应用的一种统计分析方法; 将方差分析和回归分析方法统一到一个模型中,应用起来更加方便; 更主要的目的是将统计分析领域中两种最重要的分析手段结合起来并加以拓展,使实用性和准确性得到进一步提高。,协方差分析的基本思想,方差分析的目的 检验处理因素不同水平的因变量均值有无差异。 或者说研究处理因素对应变量的影响。 变异分解:处理因素效应 误差:随机误差(抽样产生) 其它未知因素或混杂因素的效应,20名男性篮球运动员和20名大学生的肺活量(cm3)比较,协方差分析基本思想,在科研中,实验效应除了受到处理因素的作用外,尚受到许多非处理因素的影响。如在研究临床疗效时,疗效的好坏不仅与治疗措施有关,还受病人的年龄、性别、病情、心理、环境、社会等因素的影响。,药物临床疗效研究,疗效,药物,病情,心理因素,患者的状况(性别、年龄,其他因素,混杂因素,举 例,各组间的效应进行比较,必须保持组间的影响因素(混杂因素的比例)相同,组间才具有可比性。,T + S1 e + s1 (实验组) S2 s2 (对照组) T e,处理因素,混杂因素,(在设计阶段控制混杂因素的方法),常见的实例,(1)比较不同施肥量对果树单株产量的影响,果树起始干周是混杂因素。 (2)比较两种药物治疗高血压的疗效,年龄是一个混杂因素。 (3)研究不同饲料对动物增加体重的作用时,动物的初始体重、进食量等因素。 (4) ,在分析阶段控制混杂因素的方法: 1、采用分层分析:如把年龄分组,再比较同一年龄组的正常体重与超重组有无差别。(适用:计量、计数资料) 2、协方差分析(适用:计量资料) 3、多因素分析(适用:计量、计数资料),协方差分析基本思想,20名男性篮球运动员和20名大学生的肺活量(cm3)比较,协 变 量,协方差分析基本思想,比较肺活量时,要消除身高的影响。 方法1:抽样时,选身高相近的。 方法2:从统计分析技巧上平衡数据。 校正了身高的影响后(回归分析),再比较两组肺活量的均数有无差异(方差分析)。,协方差分析(analysis of covariance,ANCOVA) 将线性回归与方差分析结合起来,检验两组或多组修正均数间有无差异的一种统计方法,用于消除混杂因素对分析指标的影响。,协变量:在进行协方差分析时,混杂因素统称为协变量。,大学生 篮球运动员,图1 协方差分析示意图,调 整 均 数,协方差分析是将线性回归与方差分析相结合 的一种分析方法。 把对反应变量Y有影响的因素X看作协变量, 建立Y对X的线性回归,利用回归关系把X值 化为相等,再进行各组Y的修正均数间比较。 修正均数是假设各协变量取值固定在其总 均数时的反应变量Y的均数。,其实质是从Y的总离均差平方和 中 扣除协变量X对Y的回归平方和 , 对离回归平方和 作进一步分解后再进行方差分析。,协方差分析有二个意义 , 一是对试验进行统计控制,二是对协方差组分进行估计,现分述如下。 一、对试验进行统计控制 为了提高试验的精确性和准确性 ,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。,但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如: 研究大学生和运动员肺活量的差异,希望试验人员身高相同,因为身高不同,将影响到肺活量的高低。但是,在实际试验中很难满足试验人员身高相同这一要求。 经研究发现:身高与肺活量之间存在线性回归关系。,这时可利用身高(记为x)与其肺活量(记为y)的回归关系, 将肺活量都矫正为身高相同时的肺活量,于是身高不同对肺活量的影响就消除了。由于矫正后的肺活量是应用统计方法将身高控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更为准确。,若 y 的变异主要由x的不同造成(处理没有显著效应),则各矫正后的 间将没有显著差异(但原y间的差异可能是显著的)。 若 y的变异除掉x不同的影响外, 尚存在不同处理的显著效应,则可期望各 间将有显著差异 (但原y间差异可能是不显著的)。此外,矫正后的 和原y的大小次序也常不一致。,所以, 处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysis of covariance)。,第i组第j个观测值,随机误差,第i组的组效应,一般均值,方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,首先,我们看看方差分析数据结构:,观测值=一般均值+水平影响+协变量影响+随机误差,回归系数,协变量效应,可见,协方差分析将方差分析与回归分析结合了起来.,方差分析,回归分析,下面我们再看协方差分析数据结构(单因素完全随机设计试验资料的协方差分析):,协方差分析的应用条件 要求各组资料都来自正态总体,且各组的方差相等;(t检验或方差分析的条件) 各组的总体回归系数i相等,且都不等于0(回归方程检验)。 因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。,协方差分析的应用条件,各比较组协变量X与分析指标Y存在线性关系(按直线回归分析方法进行判断)。 各比较组的总体回归系数i相等,即各直线平行(绘出回归直线,看是否平行)。,两条回归直线不平行,结论:本资料不宜做协方差分析,两条条回归直线基本平行,结论:本资料可以做协方差分析,各回归系数不为零,不满足条件时的处理方法,X与Y不满足线性关系时,通常情况下是对X或Y或两者作适当的变量变换,使之符合线性关系。,协方差分析适用的资料 协方差分析可用于: 完全随机设计、随机区组设计、拉丁方设计、析因设计等资料; 协变量X可以仅有一个,称一元协方差分析; 协变量也可以有多个,称多元协方差分析。,协方差分析步骤,完全随机设计的协方差分析 应用条件检验 回归分析 求调整均数 对调整均数作方差分析,第二节 单因素试验资料的协方差分析,设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表101所示。,表101 kn对观测值x、y的单向分组资料的 一般形式,表101的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为: 总变异的乘积和SPT是xji与 和yji与 的离均差乘积之和,即: (10-5) =kn-1,其中,,处理间的乘积和SPt是 与 和 与 的离均差乘积之和乘以n,即: (10-6) 处理内的乘积和SPe是 与 和 与 的离均差乘积之和,即: (10-7),=k(n-1) 以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、nk,其和为 ,则各项乘积和与自由度的计算公式为: (10-8),=SPT-SPt = -k =dfT-dft (10-9),有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。 【例10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验: 试验设对照、配方1、配方2、配方3共四个处理,重复12 次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头 ,完全随机分为4组进行试验,结果见表102,试作分析。,表102 不同食欲增进剂仔猪生长情况表 (单位:kg),此例, =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80 =550.50 k=4,n=12,kn=412=48,协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和与自由度 dfT(x)=kn-1=412-1=47,2、处理间平方和与自由度,=k-1=4-1=3,3、处理内平方和与自由度 (二)求y变量各项平方和与自由度 1、总平方和与自由度,2、处理间平方和与自由度 3、处理内平方和与自由度 (三) 求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度,=kn-1=412-1=47 2、处理间乘积和与自由度 =1.64,=k-1=4-1=3 3、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表103。 表103 x与y的平方和与乘积和表,(四) 对x和y各作方差分析(表104) 表104 初生重与50日龄重的方差分析表,分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50 日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。 (五) 协方差分析,1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出50日龄重(y)与初生重(x)之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值(50日龄重)以消去仔猪初生重(x)不同对它的影响。然后根据校正后的y值(校正50日龄重)来进行方差分析。如线性回归关系不显著,则无需继续进行分析。,回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和,离回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系数: (10-10) 误差项回归平方和与自由度 (10-11) dfR(e)=1,误差项离回归平方和与自由度 =85.08-47.49=37.59 (10-12) (2) 检验回归关系的显著性(表105) 表105 哺乳仔猪50日龄重与初生重的 回归关系显著性检验表,F检验表明,误差项回归关系极显著,表明哺乳仔猪50 日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。 2、对校正后的50日龄重作方差分析 (1)求校正后的50日龄重的各项平方和及自由度 利用线性回归关系对50日龄重作校正 ,并由校正后的50日龄重计算各项平方和是相当 麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。, 校正50日龄重的总平方和与自由度,即总离回归平方和与自由度 (10-13) = - =47-1=46 校正50日龄重的误差项平方和与自由度,即误差离回归平方和与自由度 (10-14) = - =44-1=43 上述回归自由度均为1,因仅有一个自变量x。, 校正50日龄重的处理间平方和与自由度 =57.87-37.59=20.28 (10-15) =k-1=4-1=3 (2) 列出协方差分析表,对校正后的50日龄重进行方差分析(表106),表106 表10-2资料的协方差分析表,查F值: =4.275,由于F=7.63 ,P0.01,表明对于校正后的50日龄重不同食欲添加剂配方间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。,3、根据线性回归关系计算各处理的校正50日龄平均重 误差项的回归系数 表示初生重对50日龄重影响的性质和程度,且不包含处理间差异的影响,于是可用 根据平均初生重的不同来校正每一处理的50日龄平均重。校正50日龄平均重计算公式如下: (10-16),公式中: 为第i处理校正50日龄平均重; 为第i处理实际50日龄平均重(见表102); 为第i处理实际平均初生重(见表102); 为全试验的平均数, 为误差回归系数, =7.1848 将所需要的各数值代入(1016)式中,即可计算出 各处理的校正50日龄平均重(见表 107)。,表107 各处理的校正50日龄平均重计算表,4、各处理校正50日龄平均重间的多重比较 各处理校正50日龄平均重间的多重比较,即各种食欲添加剂的效果比较。 (1) t检验 检验两个处理校正平均数间的差异显著性,可应用t检验法: (10-17) (10-18),式中, 为两个处理校正平均数间的差异; 为两个处理校正平均数差数标准误; 为误差离回归均方; n为各处理的重复数; 为处理i的x变量的平均数; 为处理j的x变量的平均数; SSe(x)为x变量的误差平方和 例如,检验食欲添加剂配方1与对照校正50日龄平均重间的差异显著性:,=10.3514-12.0758=-1.7244 =37.59/43=0.8742 n=12 =1.52, =1.28, SSe(x)=0.92 将上面各数值代入(1018)式得: 于是,查t值表,当自由度为43时 (见表106误差自由度),t0.01(43)=2.70 ,|t| t0.01(43),P0.01 ,表明对照与食欲添加剂1号配方校正50日龄平均重间存在着极显著的差异,这里表现为1号配方的校正50日龄平均重极显著高于对照。 其余的每两处理间的比较都须另行算出 ,再进行t检验。,(2)最小显著差数法 利用t检验法进行多重比较,每一次比较都要算出各自的 ,比较麻烦。当误差项自由度在 20以上,x变量的变异不甚大(即x变量各处理平均数间差异不显著),为简便起见,可计算一个平均的 采用最小显著差数法进行多重比较。 的计算公式如下:,(10-19) 公式中SSt(x)为x变量的处理间平方和。 然后按误差自由度查临界t值,计算出最小显著差数: (10-20),本例x变量处理平均数间差异极显著,不满足“x变量的变异不甚大”这一条件 ,不应采用此处所介绍的最小显著差数法进行多重比较。为了便于读者熟悉该方法,仍以本例的数据说明之。 此时 由 =43,查临界t值得: t0.05(43)=2.017,t0.01(43)=2.70 于是 LSD0.05=2.0170.4353=0.878 LSD0.01 =2.700.4353 =1.175,不同食欲添加剂配方与对照校正50日龄平均重比较结果见表108。 表108 不同食欲添加剂配方与对照间的 效果比较表,多重比较结果表明: 食欲添加剂配方1、2、3号与对照比较, 其校正50 日龄平均重间均存在极 显 著的差异,这 里 表 现 为 配 方1、2、3号的校正50日龄平均重均极显著高于对照。,(3) 最小显著极差法 当误差自由度在20以上,x变量的变异不甚大,还可以计算出平均的平均数校正标准误 ,利用LSR 法进行多重比较。 的计算公式如下: (10-21),然后由误差自由度 和秩次距k查SSR表(或q表),计算最小显著极差: (10-22) 对于【例10.1】资料, 由于不满足“x变量的变异不甚大”这一条件, 不应采用此处所介绍的LSR法进行多重比较。为了便于读者熟悉该方法,仍以【例10.1】的数据说之。,=0.8742, n=12,SSt(x)=0.83, SSe(x)=0.92,k=4,代入(1021)式可计算得: SSR值与LSR值见表109。,此时,表10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电工技能竞赛实操题库及答案
- 2025年4月自考领导科学真题及答案
- 关于仓库的面试题及答案
- 2025年重症医学护理考试题库及答案
- 副科考试面试试题及答案
- 2025年沈阳艺术概论真题及答案
- 2025年甘肃天水英语试卷及答案
- DB51-T 3313-2025 同步摊铺超薄沥青混凝土施工技术规程
- 肇庆公考面试试题及答案
- 2025年三峡大学护理专业题库及答案
- 城乡燃气管道维护保养技术方案
- 2025年西藏公开遴选公务员笔试试题及答案(A类)
- 水土保持治理工应急处置考核试卷及答案
- 工业园区储能项目商业计划书
- 仓库搬运安全培训内容课件
- 急性重症胰腺炎个案护理
- 生命体征测量操作流程及评分标准
- 美术学院 本科培养方案 - 清华大学 - Tsinghua University
- 部编版道德与法治小学四年级上册同步配套教案(全册)
- 突发环境事件危险废物专项应急预案
- 财务收支记账表
评论
0/150
提交评论