第十二章-非线性回归分析-《试验设计与统计分析》课件_第1页
第十二章-非线性回归分析-《试验设计与统计分析》课件_第2页
第十二章-非线性回归分析-《试验设计与统计分析》课件_第3页
第十二章-非线性回归分析-《试验设计与统计分析》课件_第4页
第十二章-非线性回归分析-《试验设计与统计分析》课件_第5页
已阅读5页,还剩209页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章非线性回归分析第十二章非线性回归分析1第一节可化为直线回归的非线性回归有些形式的曲线可以采用适当的数据转换方法转化为直线,从而用直线回归的方法来分析。第一节可化为直线回归的非线性回归有些形式的曲线可以采用适2一、指数曲线当α>0时其曲线形状见图12.1。图12.1指数曲线

一、指数曲线当α>0时其曲线形状见图12.1。图12.13对公式(12.1)取导数可知随着x的增加,β>0的曲线的绝对生长速度越来越快,而β<0的曲线的衰减速度越来越慢。再对公式(12.1)取二阶导数因此β是生长或衰减的加速度,又称相对生长率或相对衰减率,是固定不变的。对公式(12.1)取导数4指数曲线的回归分析模型为:要求ε相互独立且服从同一对数正态分布。令并用直线回归分析的方法解得α和β的估计值指数曲线的回归分析模型为:5从而建立指数曲线回归方程〔例12.1〕棉花红铃虫的产卵数(y,粒/头)与温度(x,℃)有关,调查结果见表12.1,试作回归分析。从而建立指数曲线回归方程6xyy’=lnyx2xy’y’22171.945944140.86413.78666.423112.397952955.15165.749911.125213.044562576.11319.269119.127243.178172985.807510.100033.029664.1897841121.500017.553256.8321154.74491024151.837822.5144128.5353255.78381225202.433933.4526290.5Σ19225.28485414733.708102.4258表12.1棉花红铃虫温度x(℃)与产卵数y(粒/头)的调查结果xyy’=lnyx2xy’y’22171.9459441407解:首先作调查数据的散点图(图12.2)将y做对数转换,根据表12.1中的x与y’可求得解:首先作调查数据的散点图(图12.2)8图12.2棉花红铃虫温度x与产卵数y的散点图

图12.2棉花红铃虫温度x与产卵数y的散点图9据此建立指数曲线回归方程回归方程的显著性检验,选用相关系数检验法。查r0.01(5)=0.874,|r|=0.9926>0.874,因此指数曲线回归关系在0.01水平上显著(实际P=9.01×10-6)。据此建立指数曲线回归方程10带常数的指数函数当β<0时其曲线见图12.3。其中,α<0的曲线经常用来描述孵化过程,又称孵化曲线。图12.3带常数的指数曲线

带常数的指数函数当β<0时其曲线见图12.3。其中,α<011由于是3参数曲线,所以要先求K值。选3个等距的x值所对应的y值,有然后作数据转换y’=ln(y-K),a’=lnay’=ln(y-K),a’=lna(12.8)

即可将其线性化并估计a和b值了由于是3参数曲线,所以要先求K值。选3个等距的x值所对应的y12其图形见图12.4。图12.4幂函数曲线二、幂函数曲线

其图形见图12.4。图12.4幂函数曲线二、幂函数曲线13幂函数曲线常用于描述体积、重量等倍数性资料的变化规律。采用与指数曲线回归模型类似的方法,令y’=lny,x’=lnx,a’=lna,’=ln(12.10)

即可将幂函数曲线回归模型线性化从而建立幂函数曲线回归方程

幂函数曲线常用于描述体积、重量等倍数性资料的变化规律。采用与14〔例12.2〕玉米杂交种四单19的果穗直径(x,cm)与穗粒重(y,g)间的关系如表12.2,试作回归分析。表12.2玉米果穗直径x(cm)和穗粒重y(g)的调查数据xyx’=lnxy’=lnyx’2y’2x’y’4.61201.52614.78752.328822.92027.3062113.54.71281.54764.85202.394923.54197.5090128.34.81411.56864.94882.460624.49067.7627144.74.91581.58925.06262.525725.62998.0455162.75.01751.60945.16482.590326.67528.2122182.65.12021.62925.30832.654428.17808.6483204.45.22301.64875.43812.718129.57298.9653228.45.32671.66775.58722.781231.21689.3178254.6Σ12.786541.149320.454212.225565.767〔例12.2〕玉米杂交种四单19的果穗直径(x,cm)与穗粒15图12.5玉米果穗直径x和穗粒重y的散点图(左)和对数散点图(右)

图12.5玉米果穗直径x和穗粒重y的散点图(左)和对数散16解:从调查数据的散点图(图12.5)中可以看出x与y之间呈一种中间略下凹的曲线关系,x’与y’之间呈直线关系,因此作幂函数曲线回归分析。由表12.2可求得解:从调查数据的散点图(图12.5)中可以看出x与y之间呈一17查r0.01(6)=0.834,|r|=0.9922>0.834,因此幂函数曲线回归关系在0.01水平上显著(实际P=1.26×10-6),可建立幂函数曲线回归方程:查r0.01(6)=0.834,|r|=0.9922>0.818其图形也见图12.5,不同的x值对应的值见表12.2。本例也可作直线回归和指数曲线回归分析,结果均极为显著。还可能求出其它也显著的曲线形式。实践中通常不存在支持某种曲线形式的绝对依据,选择合适的曲线形式的考虑之一是所研究问题的生物学意义。如温度或时间与生长量的关系一般应选用指数曲线,而直径或长度与重量或体积的关系一般可选用幂函数曲线等。其图形也见图12.5,不同的x值对应的值见表119考虑之二是曲线的显著性。可根据散点图的特征试配几种不同的曲线,从中选择显著程度最高或较高的。本例从散点图看可配合直线、指数曲线和幂函数曲线,显著程度相差不多,但以幂函数曲线的生物学意义最为吻合,因此较合适。考虑之二是曲线的显著性。可根据散点图的特征试配几种不同的曲线20三、对称S形曲线回归许多害虫的日发生量在暴发期以前逐日增加,过了暴发期又逐日减少,基本上是对称的,接近正态分布。因此其累积发生量就成为上下对称的S形曲线,与正态累积函数曲线差不多,见图12.6。三、对称S形曲线回归许多害虫的日发生量在暴发期以前逐日增加21图12.6对称S形曲线

图12.6对称S形曲线22以y为累积发生量,x为日期并令可将此对称S形曲线转换为线性并估计a和b了。y’一般称为概率单位,可由概率单位表中查出。由回归方程求得后也可从该表中反查出。〔例12.3〕江苏东台县测定了1972年越冬代棉红铃虫不同时期(x,以5月31日为0)的化蛹进度(y,%)结果见表12.3,试作回归分析。以y为累积发生量,x为日期并令23xyy’x2xy’y’253.53.18812515.94010.16403.12643.1106.43.478010034.78012.09653.56277.51514.63.946322559.19515.57333.999115.82031.44.515540090.31020.38974.435428.62545.64.8895625122.23823.90724.871844.93060.45.2637900157.91127.70655.308262.13575.25.68081225198.82832.27155.744577.24090.26.29301600251.72039.60196.180988.14595.46.68492025300.82044.68796.617294.75097.56.96002500348.00048.44167.053698.0Σ27550.899896251579.742274.8401表12.3棉红铃虫不同时期x(以5月31日为0)的化蛹进度y(%)xyy’x2xy’y’253.53.18812515.94024图12.7棉红铃虫不同时期x和化蛹进度y的散点图

图12.7棉红铃虫不同时期x和化蛹进度y的散点图25解:从散点图(图12.7)中看出x与y基本上呈对称的S形曲线关系,将y转换为概率单位y’后与x呈直线关系,因此作x与y’的直线回归分析。解:从散点图(图12.7)中看出x与y基本上呈对称的S形曲线26查r0.01(8)=0.765,|r|=0.9983>0.765,因此回归关系在0.01水平上显著(实际P=3.64×10-11),也即有概率单位y’与日期x间的直线回归方程成立。将各x值代入回归方程求出同并反查出值列于表12.3的最后两列,可见吻合得相当好。查r0.01(8)=0.765,|r|=0.9983>0.727四、不对称S形曲线回归动植物生长的普遍规律是先越来越快,过了生长高峰以后由于内外条件的限制则越来越慢直至停止。生长速度的变化呈不对称的单峰曲线,因此累积生长量呈不对称的S形曲线。有许多描述不对称S形曲线的方程,如四、不对称S形曲线回归动植物生长的普遍规律是先越来越快,过了28等,也可用y的概率单位对x的对数作线性回归。但是最常用且最符合生物学意义的还是Logistic曲线,见图12.8。图12.8Logistic曲线等,也可用y的概率单位对x的对数作线性回归。但是最常用且最符29如果无阻抑时的生长情况可用指数曲线来描述,有限制条件时的生长情况可用孵化曲线来描述,那么整个生长周期可用Logistic曲线如果无阻抑时的生长情况可用指数曲线30可知当y<<K时绝对生长速度为βy,而当接近K时绝对生长速度趋近于0。再根据二阶导数可求出拐点为此时的生长速度最快,为可知当y<<K时绝对生长速度为βy,而当接近K时绝对生长速度31生长速度在此之前逐渐加快,在此之后逐渐下降直至y=K时为0。令然后解得即可求出Logistic曲线回归方程生长速度在此之前逐渐加快,在此之后逐渐下降直至y=K时为0。32如有多组数据(可含1个已用过的x值)均符合此条件,可用加权法平均之,即如有多组数据(可含1个已用过的x值)均符合此条件,可用加权法33〔例12.4〕东北农业大学2004年测定了玉米品种“东农252”的灌浆天数(x,d)与百粒重(y,g)的变化关系,结果见表12.4,试作Logistic曲线回归分析。〔例12.4〕东北农业大学2004年测定了玉米品种“东农2534xyy’x2xy’y’2’51.922.99522514.97608.97133.16831.628102.802.594710025.94706.73262.53482.961155.121.927322528.90953.71461.90125.239208.551.312040026.24001.72121.26778.8532512.360.815662520.39000.66520.634113.9683019.350.07929002.38200.00630.000620.1453526.14-0.61301225-21.45500.3758-0.633026.3234031.16-1.22651600-49.06001.5042-1.266531.4404536.64-2.30372025-103.66555.3069-1.900135.0575037.85-2.73752500-136.87507.4941-2.533637.3365538.07-2.83743025-156.05708.0510-3.167238.671Σ330182.290.005912650-348.26844.5432表12.4玉米品种“东农252”的灌浆天数x(d)与百粒重y(g)xyy’x2xy’y’2’51.922.99522514.935解:从散点图(图12.9)可看出试验数据呈不对称的S形分布,因此作Logistic曲线回归分析。取等距的3个x值5、30和55,用相应的y值1.92,19.35和38.07求得然后做数据转换转换后的y’见表12.4的第3列,其与x之间呈近似的直线关系,见图12.9。解:从散点图(图12.9)可看出试验数据呈不对称的S形分布,36图12.9玉米品种“东农252”的灌浆天数x与百粒重y的散点图图12.9玉米品种“东农252”的灌浆天数x与百粒重y的37根据表12.4可计算得根据表12.4可计算得38查r0.01(9)=0.735,|r|=0.9956>0.735,回归关系在0.01水平上显著(实际P=1.45×10-10),因此得Logistic曲线回归方程:此曲线的拐点为查r0.01(9)=0.735,|r|=0.9956>0.739即灌浆30d左右的灌浆速率最快,大约为即灌浆30d左右的灌浆速率最快,大约为40第二节多项式回归多项式函数y=0+1x+2x2+…+kxk

的曲线见图12.10。图12.10二次和三次多项式曲线

任何一种连续函数都可以用分段多项式来逼近。第二节多项式回归多项式函数41多项式回归的通用数学模型为此模型即转化为一般的多元线性回归模型(11.1)多项式回归的通用数学模型为42一、二次多项式回归

令一、二次多项式回归令43可得正规方程组并从中解出β0、β1和β2的估计值建立二次多项式曲线(抛物线)回归方程可得正规方程组44为了进行回归的显著性检验需将y的平方和分解为回归平方和及离差平方和两部分U=b1L1y+b2L2y,Q=Ly,y-U

各有2个和n-3个自由度。对回归系数的显著性检验不能完全沿用偏回归系数的检验方法,已知一次回归的平方和是因此二次回归增加的平方和是各有一个自由度。为了进行回归的显著性检验需将y的平方和分解为回归平方和及离差45〔例12.5〕有一小麦施肥量试验的结果见表12.5,试作二次多项式回归分析。表12.5小麦施肥量x(10kg/hm2)与产量y(10kg/hm2)的试验结果xyx2x3x4xyx2yy20465000002162254584166424623369344341056865564512409652404192042902512691144172820736829299504477481166642564096655361062416998444089620639400800016000012780255600408321Σ60369888014400250624392725763522313004〔例12.5〕有一小麦施肥量试验的结果见表12.5,试作二次46图12.11小麦施肥量(x,10kg/hm2)与产量(y,10kg/hm2)的散点图图12.11小麦施肥量(x,10kg/hm2)与产量(y47解:散点图(图12.11)显示施肥量x与产量y间的呈抛物线关系,因此做二次多项式曲线回归分析。根据表2.5的数据可求出解:散点图(图12.11)显示施肥量x与产量y间的呈抛物线关48得正规方程组解之有得正规方程组49得到二次多项式回归方程回归方程进行显著性检验首先分解平方和得到二次多项式回归方程50然后进行F检验,结果见表12.6。显然,二次回归比一次回归增加的回归变异是显著的,因此用二次多项式曲线来描述本例的施肥量与产量之间的关系是合适的。然后进行F检验,结果见表12.6。显然,二次回归比一次回归增51表12.6小麦施肥量与产量试验结果的方差分析表

变异来源DFSSMSFF0.01P回归233481.516740.8156.02**30.820.0009一次118761.718761.7174.91**34.120.0009二次114719.814719.8137.22**34.120.0013离差3321.8107.3总533803.3表12.6小麦施肥量与产量试验结果的方差分析表变异来源52抛物线属单峰曲线,其峰顶(谷底)值称极值。令二次多项式的导数为零可解得极值即:抛物线属单峰曲线,其峰顶(谷底)值称极值。令二次多项式的导数53由于肥料与粮食的价格不同,最高的产量不一定能获得最大的经济效益。设肥料的单价为px,粮食的单价为py。令即可解出最佳效益的施肥量

由于肥料与粮食的价格不同,最高的产量不一定能获得最大的经济效54xmax是px=0也即肥料资源无限时的施肥量,当px>0时xopt必然小于xmax。本例如设px=15,py=5,则相应的产量为opt=468.3+33.0072×12.19-1.2411×12.192

=686(10kg/hm2)

xmax是px=0也即肥料资源无限时的施肥量,opt=46855成本及效益比较肥料用量(kg/hm2)成本(元/hm2)产量(kg/hm2)总收入(元/hm2)纯收入(元/hm2)最高产量时133199.5687834393239.5最佳效益时121.9182.85686034303247.15注:肥料按1.5元/kg计;小麦按5元/kg计成本及效益比较肥料用量成本产量总收入(元/hm2)纯收入最高56图12.12小麦施肥量试验的总收入p1和去掉肥料成本后的收入p2的变化曲线

注:p1为总收入;p2为纯收入

图12.12小麦施肥量试验的总收入p1注:p1为总收入;57二、高次多项式回归分析一般称最高次数k≥3的多项式为高次多项式。令x1=x,x2=x2,…,xk=xk

二、高次多项式回归分析一般称最高次数k≥3的多项式为高次多项58可得多项式回归方程的矩阵形式y=Xb

及其正规方程组X’X=X’y

并用多元线性回归分析的方法解得b=(X’X)-1X’y,

可得多项式回归方程的矩阵形式59一般来说多项式曲线回归分析的次数不宜太高,否则不但计算量大而且X’X阵容易退化(xj间高度相关),求得的b不稳定。为了确定合适的次数需要检验每提高一次所增加的回归平方和,但除了最高次项所增加的回归平方和以外,其余的只能由本次与低一次多项式的回归平方和之差求出。为此可采用消去变换求解正规方程组,从一次项开始每一次消去运算都可得到本次多项式的系数和逆阵,由此可求出本次所增加的回归平方和。

一般来说多项式曲线回归分析的次数不宜太高,否则不但计算量大而60当k=3时问题更简单。因为一次项的回归平方和是三次比两次增加的回归平方和是所以两次比一次增加的回归平方和是U2=U-U1-U3

当k=3时问题更简单。因为一次项的回归平方和是61〔例12.6〕测定某水稻土用HCl和Na2CO3调酸后的pH值x和铵态N含量y的结果见表12.7,试作多项式回归分析。表12.7某水稻土PH值x和铵态N含量y的测定结果xyx2x3x4x5x6xyx2yx3yy2213.04816326426.052.0104.0169.0039.29278124372927.682.8284.484.6446.616642561024409626.4105.6422.443.5654.72512562531251562523.5117.5587.522.0964.036216129677764665624.0144.0864.016.0077.14934324011680711764949.7347.92435.350.41813.264512409632768262144105.6844.86758.4174.24920.081729656159049531441180.01620.014580.0400.00Σ4477.8284202415332120824978404462.83314.626000.0959.94〔例12.6〕测定某水稻土用HCl和Na2CO3调酸后的pH62图12.13水稻土PH值(x)和铵态N含量(y)的散点图图12.13水稻土PH值(x)和铵态N含量(y)的散点图63解:散点图(图12.13)显示x与y间呈近似的倒抛物线关系,部分点的拟合不算太好,因此做三次曲线回归分析可能有较好的效果。根据表12.7的数据可求得正规方程组42b1+462b2+4200b3=34.9462b1+5250b2+48972b3=552.74200b1+48972b2+466332b3=6316.6解之有解:散点图(图12.13)显示x与y间呈近似的倒抛物线关系,64由此得三次多项式回归方程为了检验回归方程的显著性对y平方和进行分解由此得三次多项式回归方程65表12.8例12.6的方差分析表变异来源DFSSMSFF0.05P回归3201.49067.133145.626.590.0002一次129.00029.00062.86*7.710.0014二次1169.601169.601367.60*7.714.36×10-5三次12.8892.8896.267.710.0666离差41.8450.461总7203.335表12.8例12.6的方差分析表变异来源DFSSMSFF66在0.05水平上一次和二次回归是显著的,但三次项不显著应去掉。与多元线性回归的方法一样,新的一次和二次回归系数为回归截距为得二次多项式回归方程 在0.05水平上一次和二次回归是显著的,但三次项不显著应去掉67第三节作物密度与产量关系的回归分析作物的种植密度与产量之间的关系通常是非线性的。设x为种植密度,Y为群体产量,则个体产量y=Y/x,其倒数y-1=x/Y意为获得单位产量所需的株数。根据y-1与x的变化规律来看密度-产量关系可分为四种基本类型,它们的区别见图12.14。第三节作物密度与产量关系的回归分析作物的种植密度与产量之68图12.14四种密度-产量关系曲线一般说来等差型和混合型适用于群体调节能力较强的作物如小麦和水稻等,等比型和抛物线型适用于群体调节能力较差的作物如玉米等。图12.14四种密度-产量关系曲线69一、等差型密度-产量回归分析等差型密度-产量关系中y-1与x的关系为意为随着种植密度x的变化形成单位产量所需株数y-1呈等差级数线性变化。α的含义为x=0时的y-1即形成单位产量所需的最少株数。β的含义为x每变化一个单位时形成单位产量所需株数的变化数,也即形成单位产量所需的面积。此时y与x的关系为一、等差型密度-产量回归分析等差型密度-产量关系中y-1与x70呈双曲线。Y与x的关系为呈渐近线,见图12.15。图12.15等差型x-y,x-Y曲线呈双曲线。Y与x的关系为71当x=0时可得y的极大值即无限稀植时的单株产量ymax=–1

当x=∞时可得Y的极大值即无限密植时的群体产量Ymax=–1

当x=0时可得y的极大值即无限稀植时的单株产量72因为y–1与x的关系是线性的,所以只要令即可运用直线回归分析的方法解出α和β的估计值a和b了。〔例12.7〕低肥条件下春小麦密度x(104苗/hm2)与产量Y(10kg/hm2)的试验结果见表12.9,试分析密度与产量间的关系。因为y–1与x的关系是线性的,所以只要令73xYy=Y/xy’=x/Yx2y’2xy’75100.51.34000.746356250.556955.97115.8150162.31.08200.9242225000.8542138.63165.2300217.20.7241.3812900001.9078414.36209.8450245.10.54471.83602025003.3708826.19230.6600250.00.41672.40003600005.76001440.00242.6900248.70.27633.618881000013.09583256.92255.9Σ247510.9065149062525.54556132.07表12.9低肥下春小麦等比型密度-产量回归关系分析数据表xYy=Y/xy’=x/Yx2y’2xy’75100.574图12.16低肥下春小麦的密度x与群体产量Y和单株产量y的散点图

图12.16低肥下春小麦的密度x与群体产量Y和单株产量y75解:从散点图(图12.16)可看出随着x的增加Y达最大值后基本不再变化,有点象一条渐进曲线,而y却逐步下降,有点象一条指数曲线,因此作等比型密度-产量回归分析。利用表12.9右边的数据求出解:从散点图(图12.16)可看出随着x的增加Y达最大值后基76查r0.01(4)=0.917,|r|

=0.9963>0.917,回归关系在0.01水平上显著(实际P=2.05×10-5)。因此有等差型密度-产量回归方程成立。当x=0和x=∞时分别有查r0.01(4)=0.917,|r|=0.996377二、混合型密度-产量回归分析混合型密度-产量关系中y-1对x的回归方程为K为常数,是x=0时的y-1,即形成单位产量所需的最少株数。y-1的变化当x较小时近似等差型,而当x较大时则趋于等比型。y与x的关系为

二、混合型密度-产量回归分析混合型密度-产量关系中y-1对x78Y与x的关系为均呈混合曲线,见图12.17。图12.17混合型x-y和x-Y曲线

Y与x的关系为图12.17混合型x-y和x-Y曲线79最适密度为此时的群体产量为最适密度为80因为是3参数曲线,所以需先求K值。选具备如下关系的3个x值及对应的y-1值,有如有多组数据(可含1个已用过的x值)均符合此条件,可用加权法平均之,即因为是3参数曲线,所以需先求K值。选具备如下关系81然后令y’=ln(y-1-K),x’=lnx,α’=lnα

即可将方程线性化,并求得和的估计值。

然后令82〔例12.8〕高肥条件下春小麦密度x(104苗/hm2)与产量Y(10kg/hm2)的试验结果见表12.10,试作混合型密度-产量回归分析。表12.10高肥下春小麦混合型密度-产量回归关系分析数据表xYy=Y/xx’=lnxy’=ln(y-1-K)x’2y’2x’y’75361.54.82004.3715-2.049718.64084.2013-0.8496150378.02.52005.0106-1.145325.10611.3117-5.7386300376.01.25335.7038-0.329632.53330.1086-1.8800450364.50.81006.10920.144937.32230.02100.8852600346.50.57756.39690.502540.92030.25253.2144900344.00.38226.80240.931346.27260.86736.3351Σ34.3404-1.9459200.79566.7624-6.0335〔例12.8〕高肥条件下春小麦密度x(104苗/hm2)与产83图12.18高肥下小麦的密度x与群体产量Y和单株产量y的散点图

图12.18高肥下小麦的密度x与群体产量Y和单株产量y的84解:从散点图(图12.18)中可以看到随着x的上升Y达最大值后缓慢下降,而y却逐步下降,有点象一条指数曲线,因此做混合型密度-产量关系曲线回归分析。先求K值,本例有2组x值符合条件(12.48),即x1=75,x2=150,x3=300x1=150,x2=300,x3=600

代入式(12.50)得解:从散点图(图12.18)中可以看到随着x的上升Y达最大值85代入表12.10求出y’后作线性回归分析,得查r0.01(4)=0.917,|r|=0.9996>0.917,回归关系在0.01水平上显著(实际P=2.40×10-7),代入表12.10求出y’后作线性回归分析,得86因此有混合型密度-产量回归方程成立。其最适密度为:因此有混合型密度-产量回归方程87此密度下的最高群体产量为此密度下的最高群体产量为88三、等比型密度-产量回归分析在等比型密度-产量关系中y-1对x的回归方程为意为随着x的变化y-1呈等比级数即指数曲线变化。此时y与x的关系为呈负指数曲线。Y与x的关系为三、等比型密度-产量回归分析在等比型密度-产量关系中y-1对89呈不对称的单峰曲线。这2条曲线示于图12.19。图12.19等比型x-y和x-Y曲线

呈不对称的单峰曲线。这2条曲线示于图12.19。90当xopt=–1

时为最适密度,此时的群体产量为:因为y-1与x呈指数关系,所以令即可将方程(12.52)线性化并解出α和β的估计值了。〔例12.9〕一个玉米密度x(104株/hm2)试验的产量Y(10kg/hm2)结果见表12.11,试作等比型密度-产量回归分析。当91xYy=Y/x(g/株)y’x2y’2xy’1313313-5.7462133.0188-5.7462337.82490245-5.5013430.2643-11.0026468.53552184-5.2149927.1952-15.6447525.44524131-4.87521623.7676-19.5008504.5546092-4.52182520.467-22.6090454.1642671-4.26273618.1706-25.5762392.3729442-3.73774913.9704-26.1639329.6Σ28-33.8598140166.8336-126.2434表12.11玉米等差型密度-产量回归关系分析数据xYy=Y/x(g/株)y’x2y’2xy’131331392图12.20玉米密度试验的密度x与群体产量Y和单株产量y的散点图

图12.20玉米密度试验的密度x与群体产量Y和单株产量y93解:从散点图(图12.20)中可以看出随着x的增加,Y呈单峰曲线,y呈指数曲线,因此可作等比型密度-产量回归分析。根据表12.11数据有解:从散点图(图12.20)中可以看出随着x的增加,Y呈单峰94查r0.01(5)=0.874,|r|=0.9951>0.874,回归关系在0.01水平上显著(实际P=3.22×10-6),因此有等比型密度-产量回归方程成立。其最适密度为xopt=0.3284-1=3.045(104株/hm2)

查r0.01(5)=0.874,|r|=0.9951>0.895相应的群体产量为相应的群体产量为96四、抛物线型密度-产量回归分析抛物线型密度-产量回归方程为据此得y与x的关系为呈双曲线。Y与x的关系为也是一种不对称的单峰曲线,见图12.21。四、抛物线型密度-产量回归分析抛物线型密度-产量回归方程为97图12.21抛物线型x-y和x-Y曲线

返回图12.21抛物线型x-y和x-Y曲线返回98对Y求导可得其极值点为此时群体的产量为对Y求导可得其极值点为99〔例12.10〕从〔例12.9〕的散点图(图12.20)中可看出群体产量的变化曲线也近似抛物线型密度-产量回归曲线,见图12.22,因此也可进行抛物线型密度-产量回归分析,有关分析数据见表12.12。表12.12玉米抛物线型密度-产量回归关系分析数据xYy’=x/Y(株/kg)x2x3x4xy’x2yy’213133.19491113.19493.194910.207424904.081648168..163216.326416.659535525.43489278116.304448.913229.537145247.6336166425630.5344122.137658.2718546010.86962512562554.3480271.7400118.1482642614.084536216129684.5070507.0420198.3731729423.8095493432401166.66651166.6655566.8923Σ2869.10851407844676363.71842136.0196998.0894〔例12.10〕从〔例12.9〕的散点图(图12.20)中可100图12.22玉米密度试验的密度x与群体产量Y和单株产量y的抛物线型图

图12.22玉米密度试验的密度x与群体产量Y和单株产量y101解:根据表12.12进行计算得和正规方程组解:根据表12.12进行计算得102解得解得103回归关系的显著性检验见表12.13。表12.13玉米抛物线型密度-产量回归关系的显著性检验在0.01水平上回归关系以及一次和二次回归系数都(接近)显著,即有抛物线型密度-产量回归方程变异来源DFSSMSFF0.05F0.01P回归2308.8602154.430188.89**6.9418.000.0005一次1272.0917272.0917156.62**7.7121.200.0002二次136.768536.758521.16*7.7121.200.0100离差46.94931.7373总6315.8095回归关系的显著性检验见表12.13。变异来源DFSSMSFF104成立。其图形见图12.21。据此方程得最适密度为成立。其图形见图12.21。105同一个问题经常可以用多种曲线来描述,如本例用等比型和抛物线型曲线都可描述。一般情况下可通过显著程度的比较来确定最合适的曲线,如本例用抛物线型曲线对应的概率为0.0005,大于等比曲线对应的概率0.0001,因此后者的显著程度更高,可能更合适一些。同一个问题经常可以用多种曲线来描述,如本例用等比型和抛物线型106本章学习要点1、各类可化为线性回归的非线性回归分析2、多项式回归分析3、线性化方程中待定常数(回归截距与回归系数)与原非线性回归方程中对应待定常数的关系以及他们的专业意义。本章学习要点1、各类可化为线性回归的非线性回归分析107第十二章非线性回归分析第十二章非线性回归分析108第一节可化为直线回归的非线性回归有些形式的曲线可以采用适当的数据转换方法转化为直线,从而用直线回归的方法来分析。第一节可化为直线回归的非线性回归有些形式的曲线可以采用适109一、指数曲线当α>0时其曲线形状见图12.1。图12.1指数曲线

一、指数曲线当α>0时其曲线形状见图12.1。图12.1110对公式(12.1)取导数可知随着x的增加,β>0的曲线的绝对生长速度越来越快,而β<0的曲线的衰减速度越来越慢。再对公式(12.1)取二阶导数因此β是生长或衰减的加速度,又称相对生长率或相对衰减率,是固定不变的。对公式(12.1)取导数111指数曲线的回归分析模型为:要求ε相互独立且服从同一对数正态分布。令并用直线回归分析的方法解得α和β的估计值指数曲线的回归分析模型为:112从而建立指数曲线回归方程〔例12.1〕棉花红铃虫的产卵数(y,粒/头)与温度(x,℃)有关,调查结果见表12.1,试作回归分析。从而建立指数曲线回归方程113xyy’=lnyx2xy’y’22171.945944140.86413.78666.423112.397952955.15165.749911.125213.044562576.11319.269119.127243.178172985.807510.100033.029664.1897841121.500017.553256.8321154.74491024151.837822.5144128.5353255.78381225202.433933.4526290.5Σ19225.28485414733.708102.4258表12.1棉花红铃虫温度x(℃)与产卵数y(粒/头)的调查结果xyy’=lnyx2xy’y’22171.945944140114解:首先作调查数据的散点图(图12.2)将y做对数转换,根据表12.1中的x与y’可求得解:首先作调查数据的散点图(图12.2)115图12.2棉花红铃虫温度x与产卵数y的散点图

图12.2棉花红铃虫温度x与产卵数y的散点图116据此建立指数曲线回归方程回归方程的显著性检验,选用相关系数检验法。查r0.01(5)=0.874,|r|=0.9926>0.874,因此指数曲线回归关系在0.01水平上显著(实际P=9.01×10-6)。据此建立指数曲线回归方程117带常数的指数函数当β<0时其曲线见图12.3。其中,α<0的曲线经常用来描述孵化过程,又称孵化曲线。图12.3带常数的指数曲线

带常数的指数函数当β<0时其曲线见图12.3。其中,α<0118由于是3参数曲线,所以要先求K值。选3个等距的x值所对应的y值,有然后作数据转换y’=ln(y-K),a’=lnay’=ln(y-K),a’=lna(12.8)

即可将其线性化并估计a和b值了由于是3参数曲线,所以要先求K值。选3个等距的x值所对应的y119其图形见图12.4。图12.4幂函数曲线二、幂函数曲线

其图形见图12.4。图12.4幂函数曲线二、幂函数曲线120幂函数曲线常用于描述体积、重量等倍数性资料的变化规律。采用与指数曲线回归模型类似的方法,令y’=lny,x’=lnx,a’=lna,’=ln(12.10)

即可将幂函数曲线回归模型线性化从而建立幂函数曲线回归方程

幂函数曲线常用于描述体积、重量等倍数性资料的变化规律。采用与121〔例12.2〕玉米杂交种四单19的果穗直径(x,cm)与穗粒重(y,g)间的关系如表12.2,试作回归分析。表12.2玉米果穗直径x(cm)和穗粒重y(g)的调查数据xyx’=lnxy’=lnyx’2y’2x’y’4.61201.52614.78752.328822.92027.3062113.54.71281.54764.85202.394923.54197.5090128.34.81411.56864.94882.460624.49067.7627144.74.91581.58925.06262.525725.62998.0455162.75.01751.60945.16482.590326.67528.2122182.65.12021.62925.30832.654428.17808.6483204.45.22301.64875.43812.718129.57298.9653228.45.32671.66775.58722.781231.21689.3178254.6Σ12.786541.149320.454212.225565.767〔例12.2〕玉米杂交种四单19的果穗直径(x,cm)与穗粒122图12.5玉米果穗直径x和穗粒重y的散点图(左)和对数散点图(右)

图12.5玉米果穗直径x和穗粒重y的散点图(左)和对数散123解:从调查数据的散点图(图12.5)中可以看出x与y之间呈一种中间略下凹的曲线关系,x’与y’之间呈直线关系,因此作幂函数曲线回归分析。由表12.2可求得解:从调查数据的散点图(图12.5)中可以看出x与y之间呈一124查r0.01(6)=0.834,|r|=0.9922>0.834,因此幂函数曲线回归关系在0.01水平上显著(实际P=1.26×10-6),可建立幂函数曲线回归方程:查r0.01(6)=0.834,|r|=0.9922>0.8125其图形也见图12.5,不同的x值对应的值见表12.2。本例也可作直线回归和指数曲线回归分析,结果均极为显著。还可能求出其它也显著的曲线形式。实践中通常不存在支持某种曲线形式的绝对依据,选择合适的曲线形式的考虑之一是所研究问题的生物学意义。如温度或时间与生长量的关系一般应选用指数曲线,而直径或长度与重量或体积的关系一般可选用幂函数曲线等。其图形也见图12.5,不同的x值对应的值见表1126考虑之二是曲线的显著性。可根据散点图的特征试配几种不同的曲线,从中选择显著程度最高或较高的。本例从散点图看可配合直线、指数曲线和幂函数曲线,显著程度相差不多,但以幂函数曲线的生物学意义最为吻合,因此较合适。考虑之二是曲线的显著性。可根据散点图的特征试配几种不同的曲线127三、对称S形曲线回归许多害虫的日发生量在暴发期以前逐日增加,过了暴发期又逐日减少,基本上是对称的,接近正态分布。因此其累积发生量就成为上下对称的S形曲线,与正态累积函数曲线差不多,见图12.6。三、对称S形曲线回归许多害虫的日发生量在暴发期以前逐日增加128图12.6对称S形曲线

图12.6对称S形曲线129以y为累积发生量,x为日期并令可将此对称S形曲线转换为线性并估计a和b了。y’一般称为概率单位,可由概率单位表中查出。由回归方程求得后也可从该表中反查出。〔例12.3〕江苏东台县测定了1972年越冬代棉红铃虫不同时期(x,以5月31日为0)的化蛹进度(y,%)结果见表12.3,试作回归分析。以y为累积发生量,x为日期并令130xyy’x2xy’y’253.53.18812515.94010.16403.12643.1106.43.478010034.78012.09653.56277.51514.63.946322559.19515.57333.999115.82031.44.515540090.31020.38974.435428.62545.64.8895625122.23823.90724.871844.93060.45.2637900157.91127.70655.308262.13575.25.68081225198.82832.27155.744577.24090.26.29301600251.72039.60196.180988.14595.46.68492025300.82044.68796.617294.75097.56.96002500348.00048.44167.053698.0Σ27550.899896251579.742274.8401表12.3棉红铃虫不同时期x(以5月31日为0)的化蛹进度y(%)xyy’x2xy’y’253.53.18812515.940131图12.7棉红铃虫不同时期x和化蛹进度y的散点图

图12.7棉红铃虫不同时期x和化蛹进度y的散点图132解:从散点图(图12.7)中看出x与y基本上呈对称的S形曲线关系,将y转换为概率单位y’后与x呈直线关系,因此作x与y’的直线回归分析。解:从散点图(图12.7)中看出x与y基本上呈对称的S形曲线133查r0.01(8)=0.765,|r|=0.9983>0.765,因此回归关系在0.01水平上显著(实际P=3.64×10-11),也即有概率单位y’与日期x间的直线回归方程成立。将各x值代入回归方程求出同并反查出值列于表12.3的最后两列,可见吻合得相当好。查r0.01(8)=0.765,|r|=0.9983>0.7134四、不对称S形曲线回归动植物生长的普遍规律是先越来越快,过了生长高峰以后由于内外条件的限制则越来越慢直至停止。生长速度的变化呈不对称的单峰曲线,因此累积生长量呈不对称的S形曲线。有许多描述不对称S形曲线的方程,如四、不对称S形曲线回归动植物生长的普遍规律是先越来越快,过了135等,也可用y的概率单位对x的对数作线性回归。但是最常用且最符合生物学意义的还是Logistic曲线,见图12.8。图12.8Logistic曲线等,也可用y的概率单位对x的对数作线性回归。但是最常用且最符136如果无阻抑时的生长情况可用指数曲线来描述,有限制条件时的生长情况可用孵化曲线来描述,那么整个生长周期可用Logistic曲线如果无阻抑时的生长情况可用指数曲线137可知当y<<K时绝对生长速度为βy,而当接近K时绝对生长速度趋近于0。再根据二阶导数可求出拐点为此时的生长速度最快,为可知当y<<K时绝对生长速度为βy,而当接近K时绝对生长速度138生长速度在此之前逐渐加快,在此之后逐渐下降直至y=K时为0。令然后解得即可求出Logistic曲线回归方程生长速度在此之前逐渐加快,在此之后逐渐下降直至y=K时为0。139如有多组数据(可含1个已用过的x值)均符合此条件,可用加权法平均之,即如有多组数据(可含1个已用过的x值)均符合此条件,可用加权法140〔例12.4〕东北农业大学2004年测定了玉米品种“东农252”的灌浆天数(x,d)与百粒重(y,g)的变化关系,结果见表12.4,试作Logistic曲线回归分析。〔例12.4〕东北农业大学2004年测定了玉米品种“东农25141xyy’x2xy’y’2’51.922.99522514.97608.97133.16831.628102.802.594710025.94706.73262.53482.961155.121.927322528.90953.71461.90125.239208.551.312040026.24001.72121.26778.8532512.360.815662520.39000.66520.634113.9683019.350.07929002.38200.00630.000620.1453526.14-0.61301225-21.45500.3758-0.633026.3234031.16-1.22651600-49.06001.5042-1.266531.4404536.64-2.30372025-103.66555.3069-1.900135.0575037.85-2.73752500-136.87507.4941-2.533637.3365538.07-2.83743025-156.05708.0510-3.167238.671Σ330182.290.005912650-348.26844.5432表12.4玉米品种“东农252”的灌浆天数x(d)与百粒重y(g)xyy’x2xy’y’2’51.922.99522514.9142解:从散点图(图12.9)可看出试验数据呈不对称的S形分布,因此作Logistic曲线回归分析。取等距的3个x值5、30和55,用相应的y值1.92,19.35和38.07求得然后做数据转换转换后的y’见表12.4的第3列,其与x之间呈近似的直线关系,见图12.9。解:从散点图(图12.9)可看出试验数据呈不对称的S形分布,143图12.9玉米品种“东农252”的灌浆天数x与百粒重y的散点图图12.9玉米品种“东农252”的灌浆天数x与百粒重y的144根据表12.4可计算得根据表12.4可计算得145查r0.01(9)=0.735,|r|=0.9956>0.735,回归关系在0.01水平上显著(实际P=1.45×10-10),因此得Logistic曲线回归方程:此曲线的拐点为查r0.01(9)=0.735,|r|=0.9956>0.7146即灌浆30d左右的灌浆速率最快,大约为即灌浆30d左右的灌浆速率最快,大约为147第二节多项式回归多项式函数y=0+1x+2x2+…+kxk

的曲线见图12.10。图12.10二次和三次多项式曲线

任何一种连续函数都可以用分段多项式来逼近。第二节多项式回归多项式函数148多项式回归的通用数学模型为此模型即转化为一般的多元线性回归模型(11.1)多项式回归的通用数学模型为149一、二次多项式回归

令一、二次多项式回归令150可得正规方程组并从中解出β0、β1和β2的估计值建立二次多项式曲线(抛物线)回归方程可得正规方程组151为了进行回归的显著性检验需将y的平方和分解为回归平方和及离差平方和两部分U=b1L1y+b2L2y,Q=Ly,y-U

各有2个和n-3个自由度。对回归系数的显著性检验不能完全沿用偏回归系数的检验方法,已知一次回归的平方和是因此二次回归增加的平方和是各有一个自由度。为了进行回归的显著性检验需将y的平方和分解为回归平方和及离差152〔例12.5〕有一小麦施肥量试验的结果见表12.5,试作二次多项式回归分析。表12.5小麦施肥量x(10kg/hm2)与产量y(10kg/hm2)的试验结果xyx2x3x4xyx2yy20465000002162254584166424623369344341056865564512409652404192042902512691144172820736829299504477481166642564096655361062416998444089620639400800016000012780255600408321Σ60369888014400250624392725763522313004〔例12.5〕有一小麦施肥量试验的结果见表12.5,试作二次153图12.11小麦施肥量(x,10kg/hm2)与产量(y,10kg/hm2)的散点图图12.11小麦施肥量(x,10kg/hm2)与产量(y154解:散点图(图12.11)显示施肥量x与产量y间的呈抛物线关系,因此做二次多项式曲线回归分析。根据表2.5的数据可求出解:散点图(图12.11)显示施肥量x与产量y间的呈抛物线关155得正规方程组解之有得正规方程组156得到二次多项式回归方程回归方程进行显著性检验首先分解平方和得到二次多项式回归方程157然后进行F检验,结果见表12.6。显然,二次回归比一次回归增加的回归变异是显著的,因此用二次多项式曲线来描述本例的施肥量与产量之间的关系是合适的。然后进行F检验,结果见表12.6。显然,二次回归比一次回归增158表12.6小麦施肥量与产量试验结果的方差分析表

变异来源DFSSMSFF0.01P回归233481.516740.8156.02**30.820.0009一次118761.718761.7174.91**34.120.0009二次114719.814719.8137.22**34.120.0013离差3321.8107.3总533803.3表12.6小麦施肥量与产量试验结果的方差分析表变异来源159抛物线属单峰曲线,其峰顶(谷底)值称极值。令二次多项式的导数为零可解得极值即:抛物线属单峰曲线,其峰顶(谷底)值称极值。令二次多项式的导数160由于肥料与粮食的价格不同,最高的产量不一定能获得最大的经济效益。设肥料的单价为px,粮食的单价为py。令即可解出最佳效益的施肥量

由于肥料与粮食的价格不同,最高的产量不一定能获得最大的经济效161xmax是px=0也即肥料资源无限时的施肥量,当px>0时xopt必然小于xmax。本例如设px=15,py=5,则相应的产量为opt=468.3+33.0072×12.19-1.2411×12.192

=686(10kg/hm2)

xmax是px=0也即肥料资源无限时的施肥量,opt=468162成本及效益比较肥料用量(kg/hm2)成本(元/hm2)产量(kg/hm2)总收入(元/hm2)纯收入(元/hm2)最高产量时133199.5687834393239.5最佳效益时121.9182.85686034303247.15注:肥料按1.5元/kg计;小麦按5元/kg计成本及效益比较肥料用量成本产量总收入(元/hm2)纯收入最高163图12.12小麦施肥量试验的总收入p1和去掉肥料成本后的收入p2的变化曲线

注:p1为总收入;p2为纯收入

图12.12小麦施肥量试验的总收入p1注:p1为总收入;164二、高次多项式回归分析一般称最高次数k≥3的多项式为高次多项式。令x1=x,x2=x2,…,xk=xk

二、高次多项式回归分析一般称最高次数k≥3的多项式为高次多项165可得多项式回归方程的矩阵形式y=Xb

及其正规方程组X’X=X’y

并用多元线性回归分析的方法解得b=(X’X)-1X’y,

可得多项式回归方程的矩阵形式166一般来说多项式曲线回归分析的次数不宜太高,否则不但计算量大而且X’X阵容易退化(xj间高度相关),求得的b不稳定。为了确定合适的次数需要检验每提高一次所增加的回归平方和,但除了最高次项所增加的回归平方和以外,其余的只能由本次与低一次多项式的回归平方和之差求出。为此可采用消去变换求解正规方程组,从一次项开始每一次消去运算都可得到本次多项式的系数和逆阵,由此可求出本次所增加的回归平方和。

一般来说多项式曲线回归分析的次数不宜太高,否则不但计算量大而167当k=3时问题更简单。因为一次项的回归平方和是三次比两次增加的回归平方和是所以两次比一次增加的回归平方和是U2=U-U1-U3

当k=3时问题更简单。因为一次项的回归平方和是168〔例12.6〕测定某水稻土用HCl和Na2CO3调酸后的pH值x和铵态N含量y的结果见表12.7,试作多项式回归分析。表12.7某水稻土PH值x和铵态N含量y的测定结果xyx2x3x4x5x6xyx2yx3yy2213.04816326426.052.0104.0169.0039.29278124372927.682.8284.484.6446.616642561024409626.4105.6422.443.5654.72512562531251562523.5117.5587.522.0964.036216129677764665624.0144.0864.016.0077.14934324011680711764949.7347.92435.350.41813.264512409632768262144105.6844.86758.4174.24920.081729656159049531441180.01620.014580.0400.00Σ4477.8284202415332120824978404462.83314.626000.0959.94〔例12.6〕测定某水稻土用HCl和Na2CO3调酸后的pH169图12.13水稻土PH值(x)和铵态N含量(y)的散点图图12.13水稻土PH值(x)和铵态N含量(y)的散点图170解:散点图(图12.13)显示x与y间呈近似的倒抛物线关系,部分点的拟合不算太好,因此做三次曲线回归分析可能有较好的效果。根据表12.7的数据可求得正规方程组42b1+462b2+4200b3=34.9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论