《直线回归与相关》PPT课件.ppt_第1页
《直线回归与相关》PPT课件.ppt_第2页
《直线回归与相关》PPT课件.ppt_第3页
《直线回归与相关》PPT课件.ppt_第4页
《直线回归与相关》PPT课件.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 直线回归及简单相关分析,第一节 回归及相关分析简介,前面各章我们讨论的问题都只涉及一个变量(试验指标),如产量、发芽率等,未对变量之间的关系进行研究。,实际研究中常常需要研究两个或两个以上变量之间的关系:,产量和施肥量之间的关系,人的身高与体重之间的关系,那么,变量之间究竟有哪些关系呢?,1. 变量之间的关系,分为两种:函数关系和相关关系,(1)函数关系:变量之间存在完全确定性关系,可以用精确的数学表达式来表示,这种关系称为函数关系。,例如:长方体的体积(V)与长(a)、宽(b)、高(h)的关系可表达为:Vabh,它们之间的关系是确定性的,只要知道了其中3个变量的值就可以精确地计算出另一个变量的值。,(2)相关关系:变量之间不存在完全确定性关系,不能用精确的数学公式来表示,但它们仍然存在十分密切的关系,这种关系常称为相关关系。,例如:产量与施肥量的关系,路面损害程度与路面使用时间长度的关系,这些变量之间都存在着密切的联系,但是由于随机误差的影响,不能由一个或几个变量的值精确地求出另一个变量的值,统计学上常研究的变量之间的关系是指相关关系,2. 相关关系:因果关系和平行关系,相关关系可细分为两种:因果关系和平行关系,(1)因果关系指一个变量的变化受到另一个或几个变量的影响。如:,小麦单位面积产量受单位面积穗数、每穗粒数等的影响,子女的身高受父母身高的影响,(2)平行关系指两个变量相互影响,互为因果。如:,人的身高与体重之间的关系,小麦的株高与穗长之间的关系,3. 变量关系的统计学研究方法,回归分析(Regression Analysis),统计学上采用回归分析研究呈因果关系的变量间的关系。表示原因的变量称为自变量,表示结果的变量称为因变量。,研究“一因一果”,即一个自变量与一个因变量的回归分析称为一元回归分析;,研究“多因一果”,即多个自变量与一个因变量的回归分析称为多元回归分析。,回归分析的任务是揭示出呈因果关系的相关变量的联系形式,即建立它们之间的回归方程,利用所建立的回归方程由自变量来预测因变量。,相关分析(Correlation Analysis),统计学上采用相关分析研究呈平行关系的变量间的关系。,对两个变量之间的关系进行相关分析称为简单相关分析;,对多个变量进行相关分析称为多元相关分析。,相关分析中,不区分自变量和因变量。相关分析只研究两个变量之间线性相关的程度或一个变量与多个变量之间线性相关的程度,不能用一个或多个变量去预测另一个变量的值,这是回归分析与相关分析的主要区别。,4. 总结:变量间的关系及分析方法,第二节 一元线性回归方程,数据结构,对于两个变量x和y,通过试验或调查获得了n对观测值,线性方程函数表达式 y=a+bx,通过解方程:得a=1,b=2,散点图,为了直观地看出x和y之间的关系,可以将每对观测值在坐标系里描点,得到的图称为散点图。,图(a)(d)表明x与y是完全直线关系,这种情况在生物界不多见;,图(b)(e)表明x与y是线性相关关系,这种情况在生物界较常见;,图(f)表明x与y是曲线关系,这种情况在生物界也较为常见,图(c)表明x与y无关,1.一元线性回归方程的建立,如果x和y之间的关系如散点图(b)(e)所示,则x,y间存在线性相关关系。,因此我们可以把变量y与x的内在联系用线性方程 yx 来表示。,但由于因变量y的实际观测值总是带有随机误差,因而实际观测值yi可表示为,在x,y散点图上可以作出无数条直线,回归直线是指所有直线中最接近散点图上全部散点的直线。,设回归直线的方程为,整理上两式,得到关于a,b的正规方程组,解方程组,得,称为x和y的校正交叉乘积和,记为 Sxy,称为x的校正平方和,记为Sxx,得到b后,由方程组中第一个方程可算出a,,例一,在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。,解:1,作散点图。,从图上可以看到x和y之间有明显的线性相关关系;提示我们可以进一步地建立线性回归方程。,2,计算a和b,建立线性回归方程。,所以,,第三节 一元线性回归的显著性检验,显然,这样的回归方程所反映的两个变量之间的直线关系是不正确的。,如何判断直线回归方程所反映的两个变量之间的线性关系的正确性呢?,1.回归关系的显著性检验F检验,我们从探讨因变量y的变异入手,总变异,Y与x之间的直线回归关系引起的变异,随机误差引起的变异,可以证明:,称为y的总平方和,记为SSy,或Syy,称为回归平方和,记为SSR,反映了由于回归关系引起的变异,称为误差平方和,或者剩余平方和;记为SSe,反映了随机误差引起的变异,类似于方差分析,每个平方和有对应的自由度,dfy = dfR + dfe,这里,总自由度dfy等于观测值数目减1,即dfyn1; 回归自由度dfR等于自变量个数,即dfR1; 误差自由度dfedfydfRn2,因此,均方可写成: 回归均方MSRSSR/1=SSR 误差均方MSeSSe/n-2,回归关系是否显著可以通过构造F统计量比较MSR和MSe的相对大小来进行判断,如果MSR比MSe显著的大,则说明回归关系显著。,若F大于临界值,则说明回归关系显著,也就是x和y之间的线性相关关系显著,可以用建立的回归方程进行y值的预测。,F统计量的简易求法:,例一,以上节四川白鹅的体重资料为例,检验70日龄重y与雏鹅重x之间是否存在显著的线性回归关系,解:在求回归方程时已

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论