第十章 直线回归和相关分析 《试验设计与统计分析》PPT课件.ppt_第1页
第十章 直线回归和相关分析 《试验设计与统计分析》PPT课件.ppt_第2页
第十章 直线回归和相关分析 《试验设计与统计分析》PPT课件.ppt_第3页
第十章 直线回归和相关分析 《试验设计与统计分析》PPT课件.ppt_第4页
第十章 直线回归和相关分析 《试验设计与统计分析》PPT课件.ppt_第5页
免费预览已结束,剩余49页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章直线回归和相关分析,英国生物学家高尔顿(FrancisGalton,18221911)提出“回归”一词。1889年出版的自然遗传(Naturalinheritance)一书中首次提出并阐明了“相关”的概念及计算两个变数相关程度的“相关系数”(Correlation)的概念。,第一节回归和相关意义,一、基本概念一般变量之间的关系可以分为两类:一类是函数关系,另一类是统计关系。函数关系是一种确定性的关系,一个变量的取值和变化完全取决于另一个或几个变量的取值和变化。统计关系是一种非确定性的关系,即一个变量的取值受到另一变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。,对具有统计关系的两个变量的资料进行初步考察的简便而有效的方法,是将这两个变量的n对观察值(x1,y1)、(x2,y2)、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatterdiagram)。,根据散点图可初步判定双变量X和Y间的关系,包括:X和Y相关的性质(正或负)和密切程度;X和Y的关系是直线型的还是非直线型的;是否有一些特殊的点表示着其他因素的干扰等。,x生物产量(g),y稻谷产量(g),y结实率(%),x每m2颖花数(万),x最高叶面积指数,y产量103kg/hm2,二、回归分析和相关分析,1回归分析对两个变量进行回归分析是定量地研究X和Y的数值变化规律,根据这种规律可由一个变量的变化来估计另一个变量的变化。在回归模型中,两个变量有因果关系,原因变量称自变量(independentvariable),一般用X表示;结果变量称依变量(dependentvariable),以Y表示。X是已知的或是可控制的,没有误差或误差很小,而Y则不仅随X的变化而变化,还要受到随机误差的影响。,2相关分析对两个变量进行相关分析,其目的是研究X和Y间有无相关以及相关程度、相关性质(方向)。在相关模型中,两个变量是平行的,没有因果关系的自变量和依变量之分,且皆有随机误差。,第二节直线回归一、直线回归方程(linearregressionequation)1直线回归方程与参数估计上式读作“y依x的直线回归方程”。x是自变量;是和x的量相对应的依变量y的点估计值;a是x=0时的值,即回归直线在y轴上的截距;,b是x每增加一个单位数时,平均地将要增加(b0时)或减少(bF0.01=10.04,所以同样表明一年级女大学生体重和肺活量是有真实直线回归关系的。用t检验和用F检验的结果是完全一致的。,(3)相关系数法相关系数即标准化的回归系数。因此,同一资料的回归关系与相关关系的显著与否是一致的,由于相关系数的计算和检验都比较容易,所以在实践中常采用计算相关系数假设检验来完成对回归关系的假设检验。该方法在直线相关中介绍,三、回归预测与控制1条件总体平均数Y/X()的区间预测根据回归模型的定义,每一个X上都有一个变量的条件总体,当X=x0时,该条件总体的平均数为其标准误为于是预测条件总体平均数Y/X()的95%置信区间为:,2个别值的预测这是以一定的保证概率估计任一X上Y单个预测值的存在范围。个别值的估计不仅受和b的抽样影响,而且还受到总体分布变异度的影响,当x=x0时,y0的标准误为:于是y0的(1)100%可靠度的区间预测为:,例10.5测定迟熟早籼广陆矮4号在5月5日至8月5日播种时(每隔10d播一期),播种至齐穗的天数(x,d)和播种至齐穗的总积温(y,)的关系于表10.3。试计算在x=65时,95%可靠度的总积温平均值和个别值的预测区间。表10.3广陆矮4号播种至齐穗天数x和总积温()的关系,解:由表10.3可算得:SSx=444.0000,SSy=55273.4022,SP=4718.2000,进而得:a=1496.0444(10.6358)=879.50()故有直线回归方程,当x=65时,其点预测为:在x=65处,及y的标准差分别为:因而,当x=65时,95%可靠度的总积温平均值预测区间为:,而95%可靠度的总积温个别值y预测区间为:对于表10.3资料,95%可靠度的预测区间的变化见图10.3。图10.3也叫预测图,图10.3表10.3资料的95%可靠度预测图,3、控制控制问题是预测问题的反问题,若要求Y的个别值在内的可靠性为(1-)100%,应把X控制在什么范围?首先,由于Y个别值(1-)100%可靠度的上下限分别为因而当控制个别值时,应满足。同理当控制平均值时,控制区间应满足:,对个别值的控制应满足方程组(x1r0.01=0.708,所以否定H0。,第四节直线回归与相关的应用要点,1、回归和相关分析要有学科专业知识作指导.2、要严格控制研究对象(X和Y)以外的有关因素.3、直线回归和相关分析结果不显著,并不意味着X和Y没有关系.4、一个显著的r或b并不代表X和Y的关系就一定是直线的,因为它并不排斥能够更好地描述X和Y的各种曲线的存在。,5、虽然显著的直线相关和回归并不意味着X和Y的真实关系就是直线的,但在X和Y的一定区间内,用直线关系作近似描述是允许的。6、一个显著的相关或回归并不一定具有实践上的预测意义。7、为了提高回归和相关分析的准确性,两个变量的样本容量n(观察值对数)要尽可能大一些.,小结:,回归分析:1、先计算6个一级数据和5个二级数据。2、计算r,根据|r|查ra值表检验H0:r=0,从而间接检验H0:b=0(因为相关显著回归必显著,相关不显著回归亦必不显著。)3、若回归显著,计算回归方程。(不必再检验回归关系)相关分析:1、计算r2、根据|

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论