生物统计学:第七章 直线回归与相关_第1页
生物统计学:第七章 直线回归与相关_第2页
生物统计学:第七章 直线回归与相关_第3页
生物统计学:第七章 直线回归与相关_第4页
生物统计学:第七章 直线回归与相关_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章直线回归与相关

1湛江师范学院生科院欧阳乐军制作引言

这一章研究的对象:由一个变数

两个或多个变数,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如:研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数;研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。2湛江师范学院生科院欧阳乐军制作1、函数关系与统计关系函数关系是一种确定的关系。例如圆面积与半径的关系为:统计关系是一种非确定关系,即一个变数的取值受到另一变数的影响,两者之间有关系,但又不存在完全确定的函数关系。7.1回归与相关的基本概念3湛江师范学院生科院欧阳乐军制作2、自变数与依变数对有统计关系的两个变数,分别用变数符号Y和X表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。两个变数间的关系若有原因和反应(结果)的性质,则称这两个变数间存在因果关系,并定义原因变数为自变数(自变量)(independentvariable),以X表示;4湛江师范学院生科院欧阳乐军制作定义结果变数为依变数(因变量)(dependentvariable),以Y表示。如果两个变数并不是原因和结果的关系,而呈现一种共同变化的特点,则称这两个变数间存在相关关系。相关关系中没有自变数和依变数之分。5湛江师范学院生科院欧阳乐军制作3、回归分析和相关分析(1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y随X的改变而改变的方程,称之为回归方程(regressionequationofYonX),这一过程称为回归分析。6湛江师范学院生科院欧阳乐军制作(2)对具有相关关系的两个变数,统计分析的目标是计算表示Y和X相关密切程度的统计数,并测验其显著性。这一过程称为相关分析。4、两个变数资料的散点图将两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上得到的图,称为散点图(scatterdiagram)。7湛江师范学院生科院欧阳乐军制作根据散点图可初步判定双变数X和Y间的关系,包括:①X和Y相关的性质(正或负)和密切程度;②X和Y的关系是直线型的还是非直线型的;③是否有一些特殊的点表示其他因素干扰等。8湛江师范学院生科院欧阳乐军制作1234x,生物产量(g)0.00.51.01.52.0y,稻谷产量(g)水稻单株生物产量与稻谷产量的散点图9湛江师范学院生科院欧阳乐军制作3.23.644.44.8x,每平方米颖花数(万)05560657075y,结实率(%)水稻每平方米颖花数和结实率的散点图10湛江师范学院生科院欧阳乐军制作34567890250300350400450x,最高叶面积指数y,产量(kg/亩)水稻最高叶面积指数和亩产量的散点图11湛江师范学院生科院欧阳乐军制作7.2直线回归7.2.1直线回归方程12湛江师范学院生科院欧阳乐军制作7.2.1直线回归方程称为直线回归方程(linearregressionequation)。其中a是x=0时的值,即回归直线在y轴上的截距,叫回归截距(regressionintercept);b

是x每增加一个单位数时,平均地将要增加(b>0时)或减少(b<0时)的单位数,叫回归系数(regressioncoefficeint)。一、直线回归方程式13湛江师范学院生科院欧阳乐军制作

y

②③直线回归方程的图象

①a>0,b<0②a>0,b>0③a<0,b>014湛江师范学院生科院欧阳乐军制作从上图得知,要使能够最好地代表y和x在数量上的互变关系,必须使yx0xiyi(yi-)实际观察值与估计值之差15湛江师范学院生科院欧阳乐军制作分别对a和b求偏导并令其为0,即:16湛江师范学院生科院欧阳乐军制作式中是x的离均差和y的离均差的乘积之和,简称乘积和(sumofproducts),记作SP。二、直线回归方程的计算[例7.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于下表。试计算其直线回归方程。17湛江师范学院生科院欧阳乐军制作x累积温35.534.131.740.336.840.231.739.244.2y盛发期12169273139-1由观察值计算一级数据18湛江师范学院生科院欧阳乐军制作由一级数据计算二级数据19湛江师范学院生科院欧阳乐军制作因而有:从而得到回归方程:20湛江师范学院生科院欧阳乐军制作故得表中资料的回归方程为:上述方程中回归系数和回归截距的意义为:当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三化螟的盛发期将在6月27—28日(x=0时,y=48.5;因y是以5月10日为0,故48.5为6月27—28日)。由于x变数的实测区间为[31.7,44.2],当x<31.7或>44.2时,y的变化是否还符合=48.5-1.1x的规律,观察数据中未曾得到任何信息。=48.5485-1.0996x21湛江师范学院生科院欧阳乐军制作所以,在应用=48.5-1.1x于预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2的区间外延,则必须有新的依据。22湛江师范学院生科院欧阳乐军制作练习

设某食品感官评定时,测得食品甜度与蔗糖浓度的关系如下表,试求y对x的直线回归方程。蔗糖质量分数x/%1.03.04.05.57.08.09.5甜度y1518192122.623.826食品甜度与蔗糖浓度23湛江师范学院生科院欧阳乐军制作这是一个二无一次方程组,解这个方程组可以得到:24湛江师范学院生科院欧阳乐军制作首先计算6个一级数据25湛江师范学院生科院欧阳乐军制作

然后由一级数据算出5个二级数据26湛江师范学院生科院欧阳乐军制作从而有所求直线回归方程为:27湛江师范学院生科院欧阳乐军制作直线回归方程的图示28湛江师范学院生科院欧阳乐军制作三、直线回归方程的图示直线回归图包括回归直线的图象和散点图,它可以醒目地表示x和y的数量关系。方法:制作直线回归图时,首先以x为横坐标,以y为纵坐标构建直角坐标系(纵、横坐标皆需标明名称和单位);然后取x坐标上的一个小值x1代入回归方程得,取一个大值x2代入回归方程得,连接坐标点(x1,)和(x2,)即成一条回归直线。如例9.1资料,以x1=31.7代入回归方程得=13.69;29湛江师范学院生科院欧阳乐军制作

以x2=44.2代入回归方程得=-0.05。在图9.3上确定(31.7,13.69)和(44.2,-0.05)这两个点,再连接之,即为=48.5485-1.0996x的直线图象。注意:此直线必通过点(,),它可作为制图是否正确的核对。最后,将实测的各对(xi,yi)数值也用坐标点标于下图上。30湛江师范学院生科院欧阳乐军制作303438425/5-55/1005/1555/20105/2515(月/日)x,3月下旬至4月中旬平均温度累积值y,一代三化螟盛发期31湛江师范学院生科院欧阳乐军制作四、直线回归的估计标准误满足为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。

SSE就是误差的一种度量,称之为误差平方和(sumofsquarestodeviationfromregression)或剩余平方和。32湛江师范学院生科院欧阳乐军制作由于在建立回归方程时用了a和b两个统计数,故SSE的自由度ν=n-2。因而,可定义回归方程的估计标准误为:33湛江师范学院生科院欧阳乐军制作SSE值的计算:在例7.1中:34湛江师范学院生科院欧阳乐军制作回归方程的估计标准误为:35湛江师范学院生科院欧阳乐军制作7.2.2直线回归的假设测验一、直线回归的假设测验1、回归关系的假设测验(1)t测验若总体不存在直线回归关系,则总体回归系数β=0;若总体存在直线回归关系,则总体回归系数β≠0。36湛江师范学院生科院欧阳乐军制作所以对直线回归的假设测验为:H0:β=0对HA:β≠0。回归系数b的标准误为:遵循ν=n-2的t分布。37湛江师范学院生科院欧阳乐军制作[例7.3]试测验7.1资料回归关系的显著性。查附表4,38湛江师范学院生科院欧阳乐军制作接受HA:β≠0,即认为积温和一代三化螟盛发期是有真实的直线回归关系。(2)F测验39湛江师范学院生科院欧阳乐军制作40湛江师范学院生科院欧阳乐军制作[例7.4]试用F测验法检测7.1资料回归关系的显著性。变异来源DFSSMSFF0.01回归1174.8886174.888616.4012.25离回归774.667010.6667总变异8249.555641湛江师范学院生科院欧阳乐军制作7.3直线相关7.3.1相关系数和决定系数7.3.2相关系数的假设测验42湛江师范学院生科院欧阳乐军制作7.3.1相关系数和决定系数一、相关系数前面所述两个变量之间的线性回归是否显著,可以通过检验回归系数b的显著性和方差分析来确定。另一个衡量线性回归好坏的标志就是相关系数43湛江师范学院生科院欧阳乐军制作相关系数是指由于回归因素引起的变异与总变异之比的平方根,若由于回归因素引起的变异占总变异的比率愈大,直线相关就愈密切,故样本的相关系数r为:44湛江师范学院生科院欧阳乐军制作二、决定系数决定系数(determinationcoefficient):由x不同引起的y的平方和占总平方和的比率。可见,决定系数即为相关系数r的平方值。45湛江师范学院生科院欧阳乐军制作46湛江师范学院生科院欧阳乐军制作7.4直线回归与相关的应用要点7.4直线回归和相关的应用要点47湛江师范学院生科院欧阳乐军制作7.4直线回归和相关的应用要点1、回归和相关分析要有学科专业知识指导。2、要严格控制研究对象(X和Y)以外的有关因素。3、直线回归和相关不显著,并不意味X和Y没有关系。48湛江师范学院生科院欧阳乐军制作4、一个显著的r或b并不代表X和Y的关系就一定是线性的。5、对难以发现X和Y的真实曲线关系,允许X和Y在一定的范围之内用线性关系进行描述,但是使用范围也必须严格限制在观察值范围之内。49湛江师范学院生科院欧阳乐军制作6、一个显著的相关或回归并不一定具有实践上的预测意义。例如,当ν=50时,|r|=0.273即显著,但r2=0.074,表明X和Y可用线性关系说明的部分仅占总变异的7.4%,未说明的部分占92.6%,显然由X预测Y并不可靠。因此,当需要用X预测Y时要求|r|>0.7。50湛江师范学院生科院欧阳乐军制作7、为了提高回归和相关分析的准确性,两个变数的样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论