已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
协方差分析理论与案例假设我们有N个个体的K个属性在T个不同时期的样本观测值,用,,N,t=1,T,k=1,K表示。一般假定的观测值是某随机实验的结果,该实验结果在属性向量和参数向量下的条件概率分布为。使用面板数据的最终目标之一就是利用获取的信息对参数进行统计推断,譬如常假设假定的是关于的线性函数的简单模型。协方差分析检验是识别样本波动源时广泛采用的方法。方差分析:常指一类特殊的线性假设,这类假设假定随机变量y的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。常用来分析定量因素和定性因素影响的线性模型为:从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其次,回归截距系数的同质性。检验过程主要有三步:(1) 检验各个个体在不同时期的斜率和截距是否都相等;(2) 检验(各个体或各时期的)回归斜率(向量)是否都相等;(3) 检验各回归截距是否都相等。显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来的。基本思想:在作两组或多组均数,的假设检验前,用线性回归分析方法找出协变量X与各组Y之间的数量关系,求得在假定X相等时修定均数,然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。协方差分析的应用条件:要求各组资料都来自正态总体,且各组的方差相等;(检验或方差分析的条件)各组的总体回归系数相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。各比较组协变量X与分析指标Y存在线性关系(按直线回归分析方法进行判断)。各比较组的总体回归系数相等,即各直线平行(绘出回归直线,看是否平行)。 协方差分析适用的资料:完全随机设计、随机区组设计、拉丁方设计、析因设计等资料;协变量X可以仅有一个,称一元协方差分析;协变量也可以有多个,称多元协方差分析。 协方差计算公式:相关系数:将公式右端的分子分母同除以自由度(n-1),得:其中:是x的均方MSx,它是x的方差 的无偏估计量;是y的均方MSy,它是y的方差的无偏估计量;称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy= COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:相应的总体相关系数可用x与y的总体标准差、,总体协方差COV(x,y)或表示如下:均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得相应均积的方法亦称为协方差分析。1.协方差分析是将线性回归与方差分析相结合的一种分析方法;2.把对反应变量Y有影响的因素X看作协变量,建立Y对X的线性回归,利用回归关系把X值;3.化为相等,再进行各组Y的修正均数间比较。修正均数是假设各协变量取值固定在其总均数时的反应变量Y的均数。其实质是从Y的总离均差平方和中,扣除协变量X对Y的回归平方和,对离回归平方和作进一步分解后再进行方差分析。方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,方差分析数据结构:第i组第j个观测值随机误差第i组的组效应一般均值协方差分析将方差分析与回归分析结合了起来,协方差分析数据结构:协变量效应回归系数协方差案例: 设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表101所示。表 1 kn对观测值x、y的单向分组资料的一般形式处 理处理1处理2处理i处理k观测指标x yx yx yx y观测值xij、yij(i=1,2,kj=1,2,n)x11x12x1jx1ny11y12y1jy1nx21x22x2jx2ny21y22y2jy2nxi1xi2xijxinyi1yi2yijyinxk1xk2xkjxknyk1yk2ykjykn总 和x1.y1.x2.y2.xi.yi.xk.yk.平均数 表1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为: 总变异的乘积和是与和与的离均差乘积之和,即: (1) =kn-1 其中, 。 处理间的乘积和是与和与的离均差乘积之和乘以n,即: (10-6) 处理内的乘积和是与和与的离均差乘积之和,即: (10-7) =k(n-1) 以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、nk,其和为,则各项乘积和与自由度的计算公式为: =-1 (10-8) -=SPT-SPt =-k =dfT-dft (10-9) 有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。【例10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表102,试作分析。此例, =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80=550.50 k=4,n=12,kn=412=48 表102 不同食欲增进剂仔猪生长情况表 (单位:kg)处 理对照配方1配方2配方3观 测指 标初生重x50日龄重y初生重x50日龄重y初生重x50日龄重y初生重x50日龄重y观 察 值xij,yij1.50 12.401.35 10.201.15 10.001.20 12.401.85 12.001.20 9.401.10 10.601.00 9.801.35 10.801.45 12.201.10 10.401.15 11.601.45 10.001.20 10.301.05 9.201.10 10.601.40 11.001.40 11.301.40 13.001.00 9.201.45 11.801.30 11.401.45 13.501.45 13.901.50 12.501.15 12.801.30 13.001.35 12.801.55 13.401.30 10.901.70 14.801.15 9.301.40 11.201.35 11.601.40 12.301.10 9.601.50 11.601.15 8.501.45 13.201.20 12.401.60 12.601.35 12.201.25 12.001.05 11.201.70 12.501.20 9.301.30 12.801.10 11.00总 和 xi.,yi.18.25 141.8015.40 130.8015.65 144.8013.85 133.80平 均 1.52 11.821.28 10.841.30 12.071.15 1.15 协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和及自由度=kn-1=412-1=472、处理间平方和与自由度 =k-1=4-1=3 3、处理内平方和与自由度 =-=1.75-0.83=0.92 =-=47-3=44 (二)求y变量各项平方和与自由度 1、总平方和与自由度=kn-1=412-1=47 2、处理间平方和与自由度=k-1=4-1=3 3、处理内平方和与自由度 =-=96.76-11.68=85.08 =-=47-3=44 (三)求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度=kn-1=412-1=47 2、处理间乘积和与自由度 =1.64 =k-1=4-1=3 3、处理内乘积和与自由度 =-=8.25-1.64=6.61 =-=47-3=44 平方和、乘积和与自由度的计算结果列于表103。 表103 x与y的平方和与乘积和表变异来源df处理间(t)30.8311.681.64处理内(误差)(e)440.9285.086.61总变异(T)471.7596.768.25 (四)对x和y各作方差分析(表104) 表104 初生重与50日龄重的方差分析表变异来源dfx变量y变量F值SSMSFSSMSF处理间30.830.2813.33*11.683.892.02F0.05=2.82F0.01=4.26处理内(误差)440.920.02185.081.93总变异471.7596.76 分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50 日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。 (五)协方差分析 1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出50日龄重(y)与初生重(x)之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值(50日龄重)以消去仔猪初生重(x)不同对它的影响。然后根据校正后的y值(校正50日龄重)来进行方差分析。如线性回归关系不显著,则无需继续进行分析。 回归分析的步骤如下: (1)计算误差项回归系数,回归平方和,离回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系数: (10-10) 误差项回归平方和与自由度 (10-11)dfR(e)=1 误差项离回归平方和与自由度 =-=85.08-47.49=37.59 (10-12)=-=44-1=43 (2)检验回归关系的显著性(表105) 表105 哺乳仔猪50日龄重与初生重的回归关系显著性检验表变异来源SSdfMSFF0.01误差回归47.49147.4954.32*7.255误差离回归37.59430.8742误差总和85.0844 F检验表明,误差项回归关系极显著,表明哺乳仔猪50 日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。 2、对校正后的50日龄重作方差分析 (1)求校正后的50日龄重的各项平方和及自由度 利用线性回归关系对50日龄重作校正,并由校正后的50日龄重计算各项平方和是相当麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。 校正50日龄重的总平方和与自由度,即总离回归平方和与自由度 (10-13) =-=47-1=46 校正50日龄重的误差项平方和与自由度,即误差离回归平方和与自由度 (10-14)=-=44-1=43 上述回归自由度均为1,因仅有一个自变量x。 校正50日龄重的处理间平方和与自由度 =57.87-37.59=20.28 (10-15)=k-1=4-1=3 (2)列出协方差分析表,对校正后的50日龄重进行方差分析(表106)查F表:=4.275(由线性内插法计算),由于F=7.63,P0.01,表明对于校正后的50日龄重不同食欲添加剂配方间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。 表106 表10-2资料的协方差分析表变异来源df SSx SSy SPxy b校正50日龄重的方差分析FdfSSMS处理间(t)30.8311.681.64机 误(e)440.9285.086.617.18484337.590.8742总 和(T)471.7596.768.254657.87校正处理间320.286.767.63* 3、根据线性回归关系计算各处理的校正50日龄平均重 误差项的回归系数表示初生重对50日龄重影响的性质和程度,且不包含处理间差异的影响,于是可用根据平均初生重的不同来校正每一处理的50日龄平均重。校正50日龄平均重计算公式如下: (10-16)公式中:为第i处理校正50日龄平均重; 为第i处理实际50日龄平均重(见表102); 为第i处理实际平均初生重(见表102); 为全试验的平均数, 为误差回归系数,=7.1848将所需要的各数值代入(1016)式中,即可计算出各处理的校正50日龄平均重(见表 107)。 表107 各处理的校正50日龄平均重计算表处 理-(-)实际50日龄平均重校正50日龄平均重-(-)对 照1.52-1.3156=0.20447.18480.2044=1.468611.8211.82-1.1686=10.3514配方11.28-1.3156=-0.03567.1848(-0.0356)=-0.258810.8410.84+0.2558=12.0758配方21.30-1.3156=-0.01567.1848(-0.0156)=-0.112112.0712.07+0.1121=12.1821配方31.15-1.3156=-0.16567.1848(-0.1656)=-1.189811.1511.15+1.1898=12.3398 4、各处理校正50日龄平均重间的多重比较 各处理校正50日龄平均重间的多重比较,即各种食欲添加剂的效果比较。 (1)t检验 检验两个处理校正平均数间的差异显著性,可应用t检验法: (10-17) (10-18)式中,为两个处理校正平均数间的差异; 为两个处理校正平均数差数标准误; 为误差离回归均方; n为各处理的重复数; 为处理i的x变量的平均数; 为处理j的x变量的平均数; SSe(x)为x变量的误差平方和例如,检验食欲添加剂配方1与对照校正50日龄平均重间的差异显著性:=10.3514-12.0758=-1.7244=37.59/43=0.8742 n=12=1.52,=1.28, SSe(x)=0.92将上面各数值代入(1018)式得:=于是 查t值表,当自由度为43时(见表106误差自由度),t0.01(43)=2.70(利用线性内插法计算),|t| t0.01(43),P0.01,表明对照与食欲添加剂1号配方校正50日龄平均重间存在着极显著的差异,这里表现为1号配方的校正50日龄平均重极显著高于对照。 其余的每两处理间的比较都须另行算出,再进行t检验。 (2)最小显著差数法 利用t检验法进行多重比较,每一次比较都要算出各自的,比较麻烦。当误差项自由度在 20以上,x变量的变异不甚大(即x变量各处理平均数间差异不显著),为简便起见,可计算一个平均的采用最小显著差数法进行多重比较。的计算公式如下: = (10-19)公式中SSt(x)为x变量的处理间平方和。然后按误差自由度查临界t值,计算出最小显著差数: (10-20)本例x变量处理平均数间差异极显著,不满足“x变量的变异不甚大”这一条件,不应采用此处所介绍的最小显著差数法进行多重比较。为了便于读者熟悉该方法,仍以本例的数据说明之。此时 =由=43,查临界t值得:t0.05(43)=2.017,t0.01(43)=2.70于是 LSD0.05=2.0170.4353=0.878LSD0.01=2.700.4353=1.175不同食欲添加剂配方与对照校正50日龄平均重比较结果见表108。 表108 不同食欲添加剂配方与对照间的效果比较表食欲添加剂配方校正50日龄平均重对照校正50日龄平均重差数112.075810.35141.72
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信息通信网络动力机务员安全意识水平考核试卷含答案
- 锅炉操作工岗前诚信品质考核试卷含答案
- 混料式立窑石灰煅烧工常识知识考核试卷含答案
- 煤层气修井工操作安全知识考核试卷含答案
- 电力交易员岗前规划考核试卷含答案
- 二甲基甲酰胺装置操作工安全宣教考核试卷含答案
- 船舶木匠岗前操作考核试卷含答案
- 烯烃转换装置操作工创新应用考核试卷含答案
- 电线电缆挤塑工安全管理评优考核试卷含答案
- 传承之美中医
- 【高中语文】《逻辑的力量》教学设计+统编版+选择性必修上册
- 家长会课件:数学五年级上册家长会课件
- 2023年中国糖尿病肾脏病防治指南
- 痛风饮食演示文稿
- 鉴赏家-教学讲解课件
- 学问海鲜智慧树知到答案章节测试2023年
- 影像三基试题及答案
- BB/T 0071-2017包装玻璃容器卡式瓶口尺寸
- 农村宅基地永久转让合同
- DB44∕T 1455-2014 气凝胶绝热材料
- 统编版二年级语文上册课文2 写话 :自己喜欢的玩具课件(27页)
评论
0/150
提交评论