9简单相关回归分析.ppt_第1页
9简单相关回归分析.ppt_第2页
9简单相关回归分析.ppt_第3页
9简单相关回归分析.ppt_第4页
9简单相关回归分析.ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章线性相关和回归分析,第一节回归和相关分析的概念,第二节线性相关回归方案设计,第三节线性回归分析和第四节线性相关分析。引言:本章从一个变量研究两个或两个以上的变量,因为在实际的生产实践和科学实验中往往有一个以上的变量需要研究。例如,要研究温度和作物发育进程之间的关系,有两个变量:温度和发育进程;为了研究每亩穗数、每穗粒数与亩产量的关系,有三个变量:穗数、粒数和产量。函数关系(确定性关系)有精确的数学表达式。线性回归分析。单变量回归分析。变量之间的关系。因果曲线回归分析(回归分析)。多元线性回归分析。统计关系。多元非线性回归分析(不确定关系)。简单相关分析。线性相关分析。相关分析。多重相关分

2、析。偏相关分析。1.相关和回归分析的定义。函数关系和统计关系函数关系:变量之间存在完全确定的关系,可以用精确的数学表达式来表示。统计关系:变量之间没有完全确定的关系,不能用精确的数学公式来表示。受误差影响的变量之间的关系称为统计关系。第一节是回归和相关分析的概念,因果关系:如果两个变量之间的关系具有因果关系(结果)。相关性:如果它呈现一个共同的变化,那么这两个变量之间就存在相关性。回归分析:基于计算回归方程的统计分析方法。x,单株生物产量和水稻产量散点图,x,每平方米小穗数和结实率散点图,x,最高叶面积指数和亩产量散点图,2。相关分析研究两个或两个以上变量的相关程度和性质,即研究两种变量。两个

3、变量的变化趋势是否一致或相反,以及一致和相反的程度。两个变量之间线性关系的相关分析称为线性相关或简单相关;分析多变量之间的线性关系,单变量和多变量之间的线性相关称为复相关分析(多元相关分析);当其他变量保持不变时,两个变量之间的线性相关被称为偏相关分析。3.回归分析研究一个变量受另一个或几个变量的影响程度,揭示变量之间的联系形式,建立回归方程,用回归方程控制或预测自变量或因变量。自变量和因变量的回归分析称为单变量回归分析。多元独立变量和一个因变量的回归分析称为多元回归分析。单变量回归分析可分为线性回归和曲线回归;多元回归分析可以分为多元线性回归和多元非线性回归。相关分析和回归分析的区别相关分析

4、的任务是确定两个变量之间是否存在相关性,以及相关性的方向和接近程度。回归分析的任务是找出因变量对自变量的依赖关系和依赖程度的表达式。相关分析不需要确定两个变量中的哪一个是自变量,哪一个是因变量,但是回归分析必须区分因变量和自变量。在相关分析中,两个变量是相等的,改变它们的位置不会影响相关系数的值。在回归分析中,两个独立的回归方程可以为两个因果变量解出。在相关分析中,两个变量都可以是随机的,而在回归分析中,因变量X是随机的,而因变量Y不是随机的。2.相关回归分析中应注意的问题。1.相关和回归仅用作帮助相关理解和解释的工具。变量之间是否存在相关性,在什么条件下等。必须由每个学科本身决定。不相关的数

5、据不能随机放在一起进行相关回归分析。2.由于自然界中各种事物之间的相互联系和制约,一个事物的变化通常会受到许多其他事物的影响。因此,如果我们只研究事物Y和X之间的关系,我们就需要尽可能地严格控制其他事物;否则,相关和回归分析可能会导致完全错误的结果。3.为了提高相关和回归分析的准确性,两个变量的观测值对应该尽可能多,通常至少有5对观测值,最好的数对是10-30对,X变量的取值范围应该尽可能宽。相关和回归的类型可分为:1 .根据研究变量的数量进行简单相关回归和多重相关回归。前者指研究两个变量之间的关系;后者是指对两个或多个变量之间关系的研究。2.根据变量之间的关系图,它可以分为线性和非线性相关回

6、归。相关和回归的异同:(以两个变量为例)相同:两者都研究两个变量之间的关系。区别如下:第2节,线性响应试验方案设计,和第1节,等长间隔试验方案设计。等距意味着测试因子X的值是根据等差值设计的。例如,研究了葡萄扦插苗的高度与扦插后天数的关系;中间砧长和矮化效应。在研究中,采用天数和中间砧木长度的算法,便于研究和分析试验结果。这种方法一般适用于线性相关和回归研究。第二,等比区间测试方案设计,所谓等比是指测试因子x的值是根据相同的比值设计的。一般来说,它适用于实验效果与实验因素之间呈对数或指数关系的实验设计研究。例如,叶面喷施B9与苹果新梢生长的关系;1000、2000、4000、ck .3。优化方

7、法区间测试方案设计(0.618法)。所谓优化方法区间测试方案设计以测试因子的上限和下限为两个端点,上限和下限的乘积乘以0.618作为水平区间,从两端向中间扩展。众所周知,开花前10天叶面喷施15%多效唑可提高巨峰葡萄的坐果率,有效范围为500-1200PPM,此时,1200-500=700700 * 0.618=423.6;设计处理浓度为500 423.6=923.6;1200-423.6=776.4加500;1200;0,设计了五个治疗点。即0.618方法设计。该优化方法适用于试验效果与因素呈二次曲线反应的试验方案设计,该设计的中心目的是寻找试验中的最佳处理值(极值点)。但是,在使用这种测试

8、设计方案时,首先要对测试内容有一个基本的了解,也就是要知道有效使用区间(上限和下限),才能正确使用。第三部分是线性回归。一、线性回归方程的建立方法。第一步:绘制散点图,找出相应的线段类型;2.确定线段类型,找出相应的数学计算公式;3.通过数学运算计算回归系数和回归截距;4.写出回归方程。对于线性回归,只有当线段类型显示线性趋势时,才能将其视为直线。此时,相应的数学公式为,根据X,该公式读作Y的回归方程。在该公式中,X和Y是实际观测值,b称为回归系数,它是指当X增加一个单位时,Y将增加(b0)或减少(b0)的单位数,也称为斜率,a称为回归截距。表示根据x的值计算的y的估计值。(2)线性回归方程(

9、3)回归系数和回归截距的计算(3) Re根据最小二乘法原理,甲、乙应使回归估计值与观测值的偏差平方和最小,即:2。回归系数和回归截距的计算;1.回归系数和回归截距的计算应使Q最小,并根据微积分中的极值原理,使Q对A和B的一阶偏导数等于0,即:即求解上述方程:2。线性回归与回归标准误差的偏离度表示回归线与测点之间的偏离度,即回归估计值的实际观测值Y的偏离度,因此我们用偏离标准误差来表示回归方程的偏离度。回归方程的验证将被代入方程得到:否则,方程是错误的。3.回归线的绘制回归线的绘制从理论上讲,直线可以通过连接任意两点来绘制。然而,由于部分回归的存在,这是一条真正的回归线,必须通过连接两点来绘制,

10、因为这两点是直线上最具代表性的点。1。线性回归的变异源;3.线性回归的显著性检验;总变异数SSy来自回归SSe回归SSR、2。回归关系F的显著性检验:检验X和Y之间是否存在回归关系,我们需要进行假设检验,首先提出其无效假设:=0,替代假设:0。在无效假设条件下,回归均方差与回归均方差之比服从F分布,因此可以用以下公式进行计算和检验。3。回归系数的显著性检验回归系数的显著性检验采用T检验,也可以检验X和y之间是否存在线性关系。回归系数显著性检验的无效假设和替代假设分别为0和0。,4,回归关系与回归系数显著性之间的关系,对于线性相关和回归的显著性检验,有一个t2=F的关系,因为大方差的自由度等于1

11、;因此,回归系数、回归关系、相关系数和相关显著性检验本质上是一回事,所以在具体应用中只进行一次检验,其他不再检验,差异显著性检验只是方法上的差异。第四部分是线性相关。首先,测量相关度的基本公式有一个二元总体,n对观测值是:如果正相关,大值和大值将在一起;小价值和小价值结合在一起;如果负相关;那么大值和小值在一起;小值和大值在一起;在这两个变量的数据中,变量是最有代表性的观测值;就变量而言,它是最具代表性的观测值;每个变量值的变化程度可以用偏离平均值来表示:如果偏离平均值除以变量的标准差,就可以得到一个没有任何单位的纯数;即通过将这些纯相关系数对的乘积之和除以自由度得到的商。也就是说,在进一步整

12、理公式后,相关系数的取值范围是-1-1,1。相关系数和决定系数,以及1。如果相关系数(x,y)总体上不相关,则落在象限、和中的点是均匀分散的,因此正负相互抵消,即=0。当(x,y)作为一个整体正相关时,象限中的点一定比象限中的多,所以它一定是正的。同时,落入象限的点数比例越大,正值越大。当(x,y)作为一个整体呈负相关时,落在象限中的点一定比落在象限中的点多,所以它一定是负的;落入象限的点的比例越大,这个负值的绝对值就越大。2,相关系数的计算,甜樱桃杂交苗蜜腺大小与果实重量相关系数的计算:X 1 . 61 . 61 . 81 . 9222 . 12 . 22 . 3 2 . 4y 33 . 2

13、3 . 63 . 744 . 24 . 44 . 555 . 1输入X数据为:输入Y数据为:输入XY数据为: for r=0.98。最后,根据结果,Df=n-2和自变量的数量可以在R表中找到:值0.0与线性回归关系的显著性检验一样,t检验和f检验可以用来检验相关系数r,的显著性。相关系数的显著性检验,相关系数R的显著性检验的临界值见附表,相关系数R的显著性检验可采用查表法直接进行。具体方法是根据自由度n-2检查临界R值。如果|r|,相关系数r不显著;如果|r|,相关系数r是显著的,并且在r的右上方标记“* ”;如果|r|,相关系数r极显著,r的右上方标“* *”。f检验公式如下:4。相关性的显

14、著性检验;5.相关系数和决定系数的应用:r2,相关系数的平方,称为决定系数,用来解释x(或y变量)可以解释的y变量(或x变量)的变异比例。相关系数的显著性有时不同于相关程度。例如,在一个小样本中,需要一个大的R值才能达到显著水平,并且相关程度与相关显著性一致,这在生产中具有重要意义;然而,对于大样本,较小的R值也可以达到显著水平,但实际上相关程度不高,如:df=50,0.05=0.276,df=100,0.05=0.195,df=1000,0.05=0.062。在两个变量的相关回归研究中,相关系数的T检验、回归系数和回归关系的假设检验,6。线性相关和回归的关系。1.r和B都使用某些值来表示两个

15、变量之间的相关性;两者的变异性质和方向是完全一致的。2.r只能根据数值的大小来判断两类变量之间的相关性;b是根据数值得到回归方程,从而根据自变量的变化推测因变量灵敏度的变化规律;r的值总是在-1和1之间,而b的值变化很大。总之,如果相关回归只研究两类变量之间的关系,那么回归关系的显著性、回归系数的显著性和相关系数的显著性是完全一致的,因为大方差的自由度等于1,所以在实际应用中,只有一个是显著的,其他的都是显著的。然而,在科学研究中,虽然有一些研究内容是相互关联的,但必然存在回归关系,因此有必要对具体问题逐一进行分析。4.线性相关和回归的关系;4.非线性回归。我们之前研究过线性相关和回归。然而,

16、在生产和科学研究中,有许多研究的现象不是线性的,而是曲线相关和回归的,如实际生长发育动态、新梢生长动态等。而且,有不同的类型,所以我们必须对曲线相关和回归进行具体的研究。1。多项式曲线(1)y=BX(2)y=BX CX2(3)y=BX CX2 DX3,2,指数曲线,3,对数曲线,4,倒数曲线,为双曲线。当b0时,曲线从上到下,如图7-18a所示。当b0时,曲线从下到上显示;5.有渐近线的s形曲线。使用电子表格进行曲线回归分析。1.在表格中输入数据。2.选择数据,选择“标准类型”和“XY散点图”。3.单击“下一步”和“完成”。显示图形表格中会出现一个图形。4.右键单击“曲线上的一点”,选择“添加趋势线”。5.确定曲线类型,选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论