高级生物统计011课件_第1页
高级生物统计011课件_第2页
高级生物统计011课件_第3页
高级生物统计011课件_第4页
高级生物统计011课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

返回一、直线回归设相关变量y(依变量)与x(自变量)间存在的线性关系,有n对实际观测值(xi

,yi),i=1、2、┅、n:(一)数学模型

其中:x—预先确定,不受试验误差影响;

y—随x而变,且受试验误差影响;或x、y都受试验误差的影响(x、y都为可观测的随机变量)α—总体回归截距,β—总体回归系数,εi为随机变量,相互独立,且都服从N(0,σ2)即εi~N(0,σ2),E(εi)=0,V(εi)=σ2;

y~N(α+βx,σ2),

E(y)=α+βx,V(y)=σ2b、a的计算公式为:其中离回归标准误,表示回归方程估测的偏离度离回归均方(三)显著性检验2、F检验Ho:β=0,HA:β≠0平方和与自由度的划分式:SSy

—y的总平方和,SSR

—回归方平方和,SSr

—离回归平方和,dfy

=n-1—y的总自由度,dfR

=1—回归自由度,dfr

=n-2—离回归自由度(剩余自由度)(舍入误差小)

(便于推广)各项平方和的计算公式如下:

在直线回归分析中,F检验与t检验等价,这是因为t(n-2)与F(1,n-2)有如下关系:也就是说,凡是F检验中的大均方自由度为1,则相应有一个与之等价的t检验,反之亦然。

相关系数r

表示x与y线性相关的性质与程度

将∣r∣与r0.05(n-2)、r0.01(n-2)比较,进行显著性检验,从而推断y与x间是否存在线性关系。3、由相关系数r

的显著性检验进行判断(四)决定系数r2

决定系数r2

决定系数r2表示回归方程估测的可靠程度。1、的置信区间

a是α的点估计值∵其中——样本回归截距标准误于是,可以得出:

α的95%置信区间:a±t0.05(n-2)Sa

α的99%置信区间:a±t0.01(n-2)Sab是β的点估计值∵其中——样本回归系数标准误2、的置信区间是α+βx的点估计值∵

其中——回归估计值标准误3、E(y)=+x的置信区间于是,可以得出:α+βx的95%置信区间:α+βx的99%置信区间:∵其中——观测值y的标准误4、单个y值的置信区间

二、加权回归(weightedregression)

【例1.1】为了研究某品种水稻中蛋白质和赖氨酸含量的关系,把不同地区的水稻进行分组,每组抽测若干个样品的蛋白质和赖氨酸,结果如表1-1所示,进行回归分析。mi—样本数;xi、yi均为平均数。组号12345678910mi35481174629xi8.908.419.808.099.0010.228.568.7810.089.90yi0.2830.3200.2760.2990.2670.2550.2900.2950.2630.270表1-1水稻蛋白质和赖氨酸测定结果

回归方程的建立于是

回归方程

回归方程的显著性检验由于

说明y与x间存在极显著的线性关系,可以用所建立的回归方程来进行预测与控制。决定系数

表明回归方程估测可靠程度高。回归方程估测可靠程度变异系数:表明回归方程估测值相对偏离度较小。三、有重复观察值的回归

t=b/sb

或F=MSR

/MSr显著表明相对于其它因素、x的高次项及试验误差来说,因素x的一次项对y的影响是主要的,但未回答:影响y的除x外是否还有其它不可忽略的因素,x与y是否确是线性关系。也就是说,还须检验一个回归方程的失拟性。这个问题可以通过做一些重复试验从而估计出真正的试验误差来解决。设一个试验有n个处理,其中x1、x2、…、xn-1重复1次,xn重复m次,观测结果如下:

x1

x2…xn-1

xn

xn+1…xn+m-1(xn=xn+1=…=xn+m-1)

y1

y2…yn-1

yn

yn+1…yn+m-1

m次重复(一)部分试验有重复的回归对这一资料可按有(n+m-1)组观测值进行回归分析。进行显著性检验时各项平方和与自由度计算如下:

利用xn处理的m个重复观测值,可以计算出反应真正的试验误差的平方和——称为纯误平方和相应的自由度:

——纯误平方和——纯误自由度失拟平方和及其自由度此时,SSr-SSe反映除x的一次项以外的其它因素(包含别的因素和x的高次项)所引起的变异,是x的一次项所未能拟合的部分,称为失拟平方和,记为SSLf,相应的自由度记为dfLf。SSLf、dfLf计算公式如下:

SSLf

=SSr

-SSe

dfLf

=[(n+m-1)-2]-(m-1)=n-2SSrdfr或SSLf+SSedfLf

+dfe平方和与自由度的划分式用统计量来检验回归方程的失拟性。回归方程的失拟性检验1、若FLf显著

(1)影响y除x外,至少还有一个不可忽略的因素;或(2)y与x是曲线关系;或(3)y与x无关。此时用MSe估计σ2。可把SSLf与SSe合并来检验SSR

2.FLf

不显著

若FLf

不显著,FR显著,则称回归方程是拟合得好的;若FLf不显著,FR也不显著:1°没有什么因素对y有系统影响;或2°试验误差过大。3、FLf显著,FR亦显著

说明所得的一元线性回归方程有一定作用,但不能说明此方程是拟合得好的,需查明原因,选用别的数学模型,作进一步研究。(二)全部试验都有重复的回归

(等重复)

设一试验有n个处理,每个处理重复m次,观测结果如下:xax1x2…xa…xnmmm…m…myaiy11y12…y1my21

y22…y2m…ya1

ya2…yam…yn1

yn2…ynm…………

此时,由xa、计算b、a,建立回归方程:回归方程的建立而其中SSLf+SSedfLf

+dfe平方和与自由度的划分式平方和和自由度的计算失拟性检验回归方程的显著性检验若FLf不显著,则(三)全部试验都有重复的回归

(不等重复)设一试验有n个处理,每个处理的重复数不等,分别为m1、m2、…、mn,观测结果如下:

xax1x2…xa…xnmam1m2…ma…mnyaiy11

y12

…y1m1y21

y22

…y2m2…ya1

ya2

…yama

…yn1

yn2

…ynmn

……

上表中:

此时,由xa、利用加权法计算b、a,建立回归方程:其中:平方和与自由度的划分式仍为:

SSLf+SSe

dfLf+dfe各项平方和与自由度的计算公式为:若FLf不显著,则[例1-2]已知观测结果如下,试进行回归分析a123456xa49.049.349.549.850.050.2297.8ya116.616.816.816.917.017.0ya216.716.816.917.017.117.116.6516.8016.8516.9517.0517.05101.35

这是一个有6个处理,每个处理有2个重复观测值的资料,即n=6,m=2。进行回归分析的具体步骤如下:1、作出散点图(scatterdiagram)

2、利用xa、求b、a,建立回归方程因为所以回归方程为3、进行显著性检验平方和的计算当m=2时========自由度的计算dfy=nm-1=6×2-1=11;dfR=1;dfr=nm-2=6×2-2=10;dfe=n(m-1)=6×(2-1)=6;dfLf=dfr

–dfe

=n-2=6–2=4。失拟性检验回归方程的显著性检验

表明:此线性回归模型与测得的数据是拟合得较好的,回归方程估测可靠程度达87.67%

四、两条回归直线的比较

两条回归直线的比较包括二个内容:一是回归系数的比较,判断这两条回归直线是否平行;二是回归截距的比较,判断这两条回归直线与y轴的交点是否相同。若经比较,两条回归直线平行,且与y轴交点相同,则可将这两条回归直线合并为一条回归直线。【例1·3】

分别利用n1=10、n2=12组数据进行直线回归分析,其数学模型、回归方程及有关数据如下,进行这二条回归直线的比较。(一)检验、差异是否显著(误差方差齐性检验)

(将较大的放在分子)(两尾F检验)

查两尾F检验临界值表:两尾F0.05(10,8)=4.29。表明与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论