版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 线性回归与相关线性回归与相关060120180施氮量施氮量 (kg N/ha)2468产量产量 (Tons/ha)Chapter 5 Linear regression and correlation第一节第一节 一元线性回归与相关一元线性回归与相关1. 回归与相关的概念回归与相关的概念1)变量)变量 (Variable) 描述事物特征或特质的数量指标,这些指标因条件不同而按一定的规律变化,描述事物特征或特质的数量指标,这些指标因条件不同而按一定的规律变化,故称变量。如:不同田块的土壤有机质含量故称变量。如:不同田块的土壤有机质含量; ; 不同小麦品种的千粒重不同小麦品种的千粒重
2、; ;不同大丽轮枝不同大丽轮枝菌的致病力等等。菌的致病力等等。2)变量间的关系)变量间的关系 (Relationships between variables) 函数关系函数关系 (Functional relationship): 处于同一个统一体中的两个变量,它们之间互相联系着同时在变化,其中一个处于同一个统一体中的两个变量,它们之间互相联系着同时在变化,其中一个变化,另一个也按一定的规律相应地变化,而且一个变量取定某个数值,另一个变变化,另一个也按一定的规律相应地变化,而且一个变量取定某个数值,另一个变量也按照一定的规律有一个完全确定的数值与之对应。常以量也按照一定的规律有一个完全确定的
3、数值与之对应。常以 y=(x) 表示。如:路程表示。如:路程和时间的关系:和时间的关系:s = vt;消光值和溶液浓度的关系:;消光值和溶液浓度的关系:E = RC,等等。,等等。 相关关系相关关系 (Correlation relationship): 当一个变量取定某个数值时,另一个变量出现的对应值不是完全确定的。如:当一个变量取定某个数值时,另一个变量出现的对应值不是完全确定的。如:施氮量和作物产量的关系;施氮量和作物产量的关系; 土壤有机质和土壤全氮含量。土壤有机质和土壤全氮含量。2. 2. 相关关系的类型相关关系的类型 yxxyxy xy xyxy 相关关系的规律是概率性的,相关关系
4、资料必须用相关关系的规律是概率性的,相关关系资料必须用适当的统计方法处理后,才能使其规律呈现出来。适当的统计方法处理后,才能使其规律呈现出来。 1) 对具有相关关系的变量进行抽样研究,建立能表达两者关系对具有相关关系的变量进行抽样研究,建立能表达两者关系的回归方程。的回归方程。3. 3. 回归分析回归分析 (Regression analysis)(Regression analysis)研究相关关系中变量与变量间数量关系的一种数学方法。研究相关关系中变量与变量间数量关系的一种数学方法。主要包括:主要包括:2) 2) 通过对方程的统计检验,判断变量相关关系的密切程度;通过对方程的统计检验,判断
5、变量相关关系的密切程度;3) 3) 依据回归方程及其误差(精度),从一个或多个变量的已知值依据回归方程及其误差(精度),从一个或多个变量的已知值估测另一个变量的取值范围,进行预测。估测另一个变量的取值范围,进行预测。Relationship between ear length (cm) and yield per plant of maize (g)陕西旬邑县苹果黑星病病叶率随时间变化图陕西旬邑县苹果黑星病病叶率随时间变化图陕西杨凌小麦条锈病病叶率随时间变化图陕西杨凌小麦条锈病病叶率随时间变化图表表1 双变量(双变量(X, Y)总体模式表)总体模式表X Y y,x X1 Y11 Y12 Y1
6、n Y1 X2 Y21 Y22 Y2n Y2 Xn Yn1 Yn2 Ynn Yn对于一个双变量总体对于一个双变量总体 :令令 是是 时所有时所有 的平均值,在统计学上称为的平均值,在统计学上称为 的条的条件平均数或条件期望值则:件平均数或条件期望值则:称为回归函数,表示称为回归函数,表示 y 依依 x 变化而回归。变化而回归。 如果变量如果变量 x 和和 y 是直线相关关系,则上述回归函数可表示成:是直线相关关系,则上述回归函数可表示成:称为直线回归方程。称为直线回归方程。ixy,ixx yy)(,xfixyixy,xxyi0,又称为又称为Y的回归值。的回归值。),(ijiyx如果变量如果变量
7、 x 和和 y 是直线相关关系,则上述回归方程可表示成:是直线相关关系,则上述回归方程可表示成:用用 作为作为 的估计值,则上述回归函数可表示为:的估计值,则上述回归函数可表示为:称为样本回归方程。称为样本回归方程。 称为样本线性回归方程。称为样本线性回归方程。如果变量如果变量 x 和和 y 呈曲线相关关系(如抛物线),则上述回归方程可表示成:呈曲线相关关系(如抛物线),则上述回归方程可表示成:称为样本非线性回归方程。称为样本非线性回归方程。对于一个双变量样本对于一个双变量样本 :),(ijiyxy ixy,)(xfy bxby020bxbxby1 1)当两个变量有因果关系时,则原因变量为自变
8、量,结果变量为依变量。)当两个变量有因果关系时,则原因变量为自变量,结果变量为依变量。2 2)当两个变量没有因果关系时,则根据研究目的确定。)当两个变量没有因果关系时,则根据研究目的确定。3 3)当两个变量中,有一个是非随机变量时,则非随机变量必为自变量。)当两个变量中,有一个是非随机变量时,则非随机变量必为自变量。4 4)当两个变量均为随机变量时,则根据研究目的确定。)当两个变量均为随机变量时,则根据研究目的确定。例:例:1 1)施肥量)施肥量 (x) 作物产量作物产量 (y)。2 2)土壤有机质含量)土壤有机质含量 (x) 土壤全氮含量土壤全氮含量 (y) 。自变量自变量 (x, inde
9、pendent variable) 和依变量和依变量 (y, dependent variable)4. 4. 相关分析相关分析 (Correlation analysis) 研究变量之间相关关系的密切程度及其性质研究变量之间相关关系的密切程度及其性质 (正相关正相关或负相关或负相关), 并用一个数量性指标来描述,这个指标称为并用一个数量性指标来描述,这个指标称为相相关系数关系数 (r) 。相关分析不具备预测功能相关分析不具备预测功能。?相关分析与回归分析有何关系?相关分析与回归分析有何关系? 5. 相关分析与回归分析必须注意的问题相关分析与回归分析必须注意的问题1)相关的科学性。)相关的科学
10、性。2)相关的可比性。)相关的可比性。3)作回归和相关分析时,)作回归和相关分析时,x 的取值范围要尽可能大,而且观察值应在的取值范围要尽可能大,而且观察值应在5 对以上。对以上。表表1 一个双变量(一个双变量(X,Y)样本的模式表)样本的模式表X XX X1 1 Y Y1111 Y Y1212 Y Y1n1n X X2 2 Y Y2121 Y Y2222 Y Y2n2nX Xm m Y Ym m1 1 Y Ym2 m2 Y YmamaY Y二、二、 一元线性回归分析一元线性回归分析 1. 一元线性回归方程的建立一元线性回归方程的建立1)利用变量)利用变量 (x, y) 作散点图作散点图 (S
11、catter diagram) 进行初步判断。进行初步判断。 xy2)直线回归方程)直线回归方程 (Linear regression equation) 的配置的配置确定直线方程的原则:确定直线方程的原则:xy y y y y直线方程的通式直线方程的通式为为:称为称为 依依 的的直线直线回归方程回归方程式式。:回归系数:回归系数 (Regression coefficient);:回归截矩:回归截矩 (Regression intercept).:自变量:自变量 (Independent variable); :回归值:回归值;bxby0y y xb0bx欲使建立的回归方程最好,须使欲使建立
12、的回归方程最好,须使 和和 之间的之间的差异差异最小最小。 y 2)(yyQ= = 最小最小y确定确定 b0 及及 b 值的方法值的方法 (最小二乘法最小二乘法):要使要使则有:则有:2)(yyQ= = 最小最小bxby0yxbnb0 xyxbxb20 xxxynnllxxyyxxxxyxxyb22121)()()(xbyb00222)(200)(0200 xbybbxbybbxbybQ0222)(2020)(20 xbxyxbxbxbybbxbybQ因为因为 上式及本式称为正规方程组上式及本式称为正规方程组 (Normal equations). 亦可用矩阵形式表示。 直线回归方程的特点直线
13、回归方程的特点(1)直线回归方程一定通过点)直线回归方程一定通过点(2)回归系数)回归系数 b 的符号取决于的符号取决于 lxy b 0 时,时,x 与与y 正相关;正相关; b |r| under H0: Rho=0 Prob |r| under H0: Rho=0 x y x y x 1.00000 0.96412 x 1.00000 0.96412 .0001 .0001 y 0.96412 1.00000 y 0.96412 1.00000 .0001 |r| under H0: Rho=0 Prob |r| under H0: Rho=0 x y x y x 1.00000 -0.8
14、3714 x 1.00000 -0.83714 0.0049 0.0049 y -0.83714 1.00000 y -0.83714 1.00000 0.0049 0.0049outp, Pearsonouts, Spearmanoutk, Kendallouth, Hoeffding50. 305. 4|05. 4|50. 305. 42067. 08371. 02067. 0298371. 018371. 07,01. 02tttSrr说明3月下旬至4月中旬积温和一代三化螟蛾盛发期间存在真实的直线相关关系。相关系数的t测验T T测验法测验法 查查r表,当自由度为表,当自由度为7,显著水平
15、分别为,显著水平分别为0.05和和0.01时,对应的时,对应的r值分别为值分别为0.666和和0.798。|r|=0.83710.798 因此,两个变量在因此,两个变量在0.01 水平上显著,即认为水平上显著,即认为两个变量之间存在显著的直线相关关系。两个变量之间存在显著的直线相关关系。r r值法值法第三节第三节 多元线性回归与相关多元线性回归与相关Multivariate linear regression00.10.20.30.41317212529-200204060籽粒产量( 克/ 盆)苗期施氮( g N / Kg土 )土壤含水量( % ) 在自然界中,与依变量在自然界中,与依变量y
16、y有关系的变量不止有一个,而有关系的变量不止有一个,而是多个,它们之间的关系也不一定是线性的。是多个,它们之间的关系也不一定是线性的。例如,作物产量的高低。例如,作物产量的高低。多元回归多元回归: 研究变量研究变量y 与多个变量之间的定量关系称为多元回归与多个变量之间的定量关系称为多元回归 (Multiple regression)。许多多元非线性回归都可以化为多元。许多多元非线性回归都可以化为多元线性回归来处理。线性回归来处理。 播期播期 (Sowing date)密度密度(Density)施肥量施肥量 (Fertilization rates)土壤肥力土壤肥力 (Soil fertilit
17、y)雨量雨量 (Rainfall)光照光照 (Sunshine)气温气温 (Temperature)病虫害病虫害 (Damage by pests and disease)1. 多元线性回归的数学模型多元线性回归的数学模型(Mathematical model of multiple regression)NNpNNpppyxxxNyxxxyxxxyxxx212222211112112121试验号试验号 设变量设变量 y y 与另外与另外 p p 个变量个变量 x1x1, , x2x2, , , , xp xp 的内在关的内在关系是线性的,如果做了系是线性的,如果做了 N N 次试验,其结果如
18、下表:次试验,其结果如下表: NNppNNNppppxxxyxxxyxxxy2211022222211021112211101上表中的数据可以假定具有如下数学模型:上表中的数据可以假定具有如下数学模型: ppxxxy22110N,2,1即 NNpNNpppyxxxNyxxxyxxxyxxx212222211112112121试验号试验号 NNppNNNppppxxxyxxxyxxxy2211022222211021112211101或者 ppxxxy22110N,2,1p,10N,21), 0(2N式中式中 是待估计参数,是待估计参数, 是是N个独立且服从正态分布个独立且服从正态分布 的随机变
19、量。的随机变量。 、称为多元线性回归的数学模型。称为多元线性回归的数学模型。 ppxbxbxbby22110用试验结果进行估计时,可得相应的多元线性回归方程为:用试验结果进行估计时,可得相应的多元线性回归方程为: ppxbxbxbby22110 式中式中 b0 为常数项,为常数项,bj 为为 y 对对 xj 的偏回归系数,它是表示当其它的偏回归系数,它是表示当其它 x 固固定不变时,定不变时,xj 变化一个单位而使变化一个单位而使 y 平均变化的数值。平均变化的数值。 如果令: Nyyyy321YNpNNpppxxxxxxxxxxxx213323122221112111111Xp10N10则模
20、型可以写成矩阵形式则模型可以写成矩阵形式: XYNNppNNNppppxxxyxxxyxxxy2211022222211021112211101多元线性回归多元线性回归的数学模型的数学模型:YNyyyy321XNpNNpppxxxxxxxxxxxx213323122221112111111p10则模型可以写成矩阵形式则模型可以写成矩阵形式: XYN 1N (p+1)(p+1) 1N 1Why?N212. 2. 多元线性回归方程的建立多元线性回归方程的建立确定直线方程的原则:确定直线方程的原则:确定确定 b0 及及 bj 值:值:欲使建立的回归方程最好,须使欲使建立的回归方程最好,须使 和和 之
21、间的之间的差异差异最小最小。 yy = = 最小最小2)(yyQ要使要使则有:则有:2)(yyQ= = 最小最小,0)(20)(222110)(22110)(22211002221100jppbxbxbxbbybQppbxbxbxbbybQxxbxbxbbyxbxbxbbyjppjpp0)(20)(222110)(22110)(22211002221100jppbxbxbxbbybQppbxbxbxbbybQxxbxbxbbyxbxbxbbyjppjpp即即 yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxNbpppppppppppp)()()()()()
22、()()()()()()()()()(2221102222212102112211210122110上式及本式称为正规方程组上式及本式称为正规方程组 (Normal equations). 对正规方程组求解,即得对正规方程组求解,即得b0, bj. 如果令如果令A为正规方程组的系数矩阵,即为正规方程组的系数矩阵,即 :yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxNbpppppppppppp)()()()()()()()()()()()()()()(222110222221210211221121012211022122221212121121ppppp
23、ppxxxxxxxxxxxxxxxxxxxxxNANpNNpppxxxxxxxxxxxx213323122221112111111NpppNNxxxxxxxxx212221212111111XX(p+1) (p+1),方阵方阵 (p+1) pp (p+1)Structure matrixByxyxyxyp21YXNpppNNxxxxxxxxx212221212111111Nyyyy321(p+1) pN 1令令B B为正规方程组右端的常数项矩阵,即:为正规方程组右端的常数项矩阵,即:令令 则正规方程组则正规方程组YXBbXXAb)(对上式求解,得:对上式求解,得: bYXXXBA11)(),(
24、210pbbbbbpbbbb210yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxNbpppppppppppp)()()()()()()()()()()()()()()(2221102222212102112211210122110可以写成矩阵形式:可以写成矩阵形式:表表 10株玉米穗行数株玉米穗行数 x1,行粒数,行粒数 x2与单株产量与单株产量 y例:例:处理处理 穗行数穗行数 x1 行粒数行粒数 x2 单株产量单株产量 y 1 16 29 139 2 16 32 150 3 14 32 133 4 12 39 142 5 18 26 143 6 14
25、 37 160 7 16 31 147 8 14 38 161 9 14 40 169 10 14 28 134 欲欲建立建立的二元线性回归方程二元线性回归方程为: 调查某玉米综合种调查某玉米综合种1010株,该品种每株玉米皆为单果穗。试建立每穗株,该品种每株玉米皆为单果穗。试建立每穗行数、行粒数与单株产量间的二元线性回归方程。行数、行粒数与单株产量间的二元线性回归方程。 22110 xbxbbyYXXXBA11)(bb210bbbYXXXBA11)(pbbbb210XYNyyyy321常数项矩阵y y 矩阵矩阵结构矩阵结构矩阵YXBNpNNpppxxxxxxxxxxxx21332312222
26、1112111111yxyxyxyp21X28161401413814131161371412618139121321413216129161134169161147160143142133150139YXXA222122121121xxxxxxxxxxN1124449143324914227615033215010结构矩阵结构矩阵y y 矩阵矩阵YXB49450221201478XXA222122121121xxxxxxxxxxN1124449143324914227615033215010常数项矩阵常数项矩阵该方程有唯一解的条件是该方程有唯一解的条件是:A-1 是方程系数矩阵的逆矩阵是方程
27、系数矩阵的逆矩阵, 称相关矩阵。称相关矩阵。 是系数矩阵是系数矩阵 A 的行列式。的行列式。Aij 是是 中元素中元素 aij 的代数余子式的代数余子式。式中:式中:对对 求解得:求解得:BAb 210bbbbBA10AAA33231332221231211111AAAAAAAAAAA33231332221231211111AAAAAAAAAAAb210bbbBA16888. 49790. 95480.157每穗行数、行粒数与单株产量间的二元线性回归方程为:每穗行数、行粒数与单株产量间的二元线性回归方程为: 2606601853266022165515218532551521443948140
28、561216888. 4979. 9548.157xxy3. 3. 多元线性回归方程的显著性检验多元线性回归方程的显著性检验1) 因变量观察值的变异来源划分因变量观察值的变异来源划分2) 变异平方和的分解与计算变异平方和的分解与计算(1) 回归方程的显著性检验回归方程的显著性检验)()(yyyyyy总变异总变异 = 剩余变异剩余变异 + 回归变异回归变异222)()()(yyyyyySSTSST = SS剩剩 + SS回回其中其中 B0, Bj为常数项矩阵为常数项矩阵 B 中的元素中的元素平方和的计算平方和的计算yyNyTlyyySS2)(22)(SST = SS剩剩 + SS回回即2)(yy
29、Q2)(yyU令 jjBbBbyyyQ0022)(QlQSSUyyTUQSST3) 自由度的分解与计算自由度的分解与计算4) F值的计算值的计算5) 统计推断统计推断F F 否定否定H0 ,接受,接受 HA总自由度:总自由度: dfT = N 1 回归自由度:回归自由度: df回回 = m 剩余剩余自由度自由度: df剩剩 = dfT - df回回 = N m 1F =S S2 2回回S S2 2剩剩SS回回/ /df回回 SSSS剩剩/ /dfdf剩剩 =1) 偏回归平方和偏回归平方和各偏回归系数的平方和,称为偏各偏回归系数的平方和,称为偏 回归平方和。记作回归平方和。记作 PjCjj为正规
30、方程组系数矩阵为正规方程组系数矩阵 A 的逆矩阵的逆矩阵 A-1 主对角线上元素。主对角线上元素。bj为为 y 对对 xj 的偏回归系数的偏回归系数2) 自由度的计算自由度的计算 3) F值的计算值的计算4) 统计推断统计推断(2) (2) 偏回归系数的显著性检验偏回归系数的显著性检验jjjCbjP2F =Pj / /1 SS剩剩/ / df剩剩 F F 否定否定H0 ,接受,接受 HA偏偏 回归平方和的自由度为偏回归系数的自由度,即为:回归平方和的自由度为偏回归系数的自由度,即为:1(3) (3) 自变量的重要性和取舍自变量的重要性和取舍 对于偏回归系数不显著的自变量应按照其偏回归对于偏回归
31、系数不显著的自变量应按照其偏回归平方和的大小,从小到大逐步舍去,并重新进行回归及平方和的大小,从小到大逐步舍去,并重新进行回归及检验,直到所保留自变量的偏回归系数均显著为止。此检验,直到所保留自变量的偏回归系数均显著为止。此称为逐步回归。称为逐步回归。多元线性回归方程的显著性检验多元线性回归方程的显著性检验 (F (F检验检验) ) H H0 0: : 回归关系不显著;回归关系不显著;H HA A: : 回归关系显著回归关系显著; ; 计算统计量计算统计量F:F:Nyyyyl2)(26 .132110/1478)134150139(22222211002BbBbBbyQ31.294994506
32、888. 422120979. 91478548129231.296 .1321QlUyy49450221201478YXB回归回归 1292.29 2 646.145154.318* 4.74 9.55剩余剩余 29.31 7 4.1871 变因变因 SS df MS F F0.05 F0.01总变异总变异 1321.6 9 二元线性回归方程的显著性检验二元线性回归方程的显著性检验方差分析表方差分析表故该故该二元线性回归方程的二元线性回归方程的回归关系极显著水平回归关系极显著水平偏回归系数的显著性检验偏回归系数的显著性检验 计算偏回归平方和计算偏回归平方和 x1 6
33、31.455 1 631.455150.81* 5.59 12.2 x2 1188.47 1 1188.47 283.84* 5.59 12.2变因变因 SS df MS F F0.05 F0.01总变异总变异 1321.6 9 剩余剩余 29.31 7 4.1871 回归 1292.29 2 646.145154.318* 4.74 9.551577. 0979. 9121121cbP455.6310185. 0689. 4222222cbP471.1188偏回归系数的偏回归系数的显著性检验显著性检验方差分析表方差分析表216888. 4979. 9548.157xxy可以使用 二、二、 多
34、元相关分析多元相关分析1. 多元相关多元相关 指指 m 个自变量与个自变量与 1 个因变量的总相关。多元相关系数记作:个因变量的总相关。多元相关系数记作: R = = SSSS回回SSSST TR的存在区间为的存在区间为 0,1 。1)计算)计算 R; 2)由)由Df= N M-1,变量个数为,变量个数为M, 查相关系数表(附表查相关系数表(附表10)得得R,如果:,如果: R R 表明两变量的相关关系达显著或极显著水平。表明两变量的相关关系达显著或极显著水平。, ,myR12简记作:简记作:R多元相关系数或多元相关系数或复相关系数 (R) yylUR 或或多元相关系数的显著性检验多元相关系数
35、的显著性检验:Nyyyyl2)(229.129231.296 .1321QlUyy6 .132110/1478)134150139(2222yylUR = 0.9888 * m=3, df剩剩 = N m 1=6, R0.01= 0.886, 2. 偏相关偏相关 (Partial correlation) 偏相关系数偏相关系数 (Partial correlation coefficient) 偏相关系数的定义偏相关系数的定义: 在其它各个变量都保持一定时,指定在其它各个变量都保持一定时,指定的两个变量间相关的密切程度。偏相关又称为净相关。的两个变量间相关的密切程度。偏相关又称为净相关。 偏相
36、关系数的表示方法偏相关系数的表示方法: r12, 34m, 简记作:简记作: r12 , rij 偏相关系数的取值范围偏相关系数的取值范围 : -1, 1mmmmmmmmrrrrrrrrrrrrrrrrR321233323122322211131211mmmmmmmmCCCCCCCCCCCCCCCCR3212333231223222111312111jjiiijCCCijr 由由 Df= N m,查表变量个数为,查表变量个数为 2, 查相关系数表(附表查相关系数表(附表10)得)得 r,如果:如果: r r 表明两变量的相关关系达显著或极显著水平。表明两变量的相关关系达显著或极显著水平。333
37、231232221131211rrrrrrrrrR17029. 02697. 07029. 018695. 02697. 08695. 013332312322211312111CCCCCCCCCR7232.355847.689998.495847.687740.1355582.999998.495582.990809.749927.022111212CCCr9719.033111313CCCr9848.033222323CCCrDf = N m =7,查表变量个数为,查表变量个数为 2666. 07,05. 0r798. 07,01. 0r以下内容自学以下内容自学例例 支崇远对贵阳成年水牛支
38、崇远对贵阳成年水牛39头实测了体重头实测了体重(y/kg)、胸围、胸围(x1 /cm) 、体斜长、体斜长(x2 /cm)和体高和体高(x3 /cm) ,资料列于表,资料列于表4-4-2中,试建立三元线性回归方程。中,试建立三元线性回归方程。 编号12345678体重443.5507.5462.5514.0471.5545540.5536胸围194200194211205204315207体长146150150153153153154142体高122.1123.5126.5134.5129.5125.5133.0128.5编号910111213141516体重468550.5492.058344
39、2.5439.5477.5450胸围201199200210194190203194体长153160149160140147148135体高128.7127.5123.5138.6124121129118编号1718192021222324体重466480422413.5471.0414.5410428.5胸围190190185183193188179193体长135138.5140130145133140140体高122124119.5114123.5119119116编号2526272829303132体重468517.5578620481702420491胸围190195.5207.52
40、11203220197194体长155150160150137165142149体高120.5129.5128.5132.5130142.2124122编号33343536373839体重515483505465460404496胸围198200197192185187194体长150135153144154151152体高131.5128124119.5119.5123.0120.0表表 39头成年水牛实测体重、体尺数据表头成年水牛实测体重、体尺数据表25.847574, 5 .5741; 5 .1520646,7693222211xxxx233124885.1,613312.86;1133
41、959xxx x1 323965451.85,720207.7;19034.5x xx xy2129434166.25;3772275.25,2814701yx yx y7 .23954923yx由表4-4-2数据计算一级统计数据:由一级统计数据计算二级统计数据:06.488,26.125,22.147,26.197321yxxx9359.315239)(212111xxl3974.261539)(222222xxl5344.138439)(232333xxl212121123205.160139)(lxxxxl313131138103.181339)(lxxxxl323232232987.1
42、13839)(lxxxxl0897.14411039)(22yylyy1090.1759839)(111yxyxly4551.1292039)(222yxyxly9526.1119239)(333yxyxly平方和lxx交叉积lxy3152.93591601.32051813.81031601.32052615.39741138.29871813.81031138.29871384.5344xxL17598.109012920.455111192.9526xyL计算 并估计各偏回归系数得出回归方程:1xxL10.00129958.51792230.00163248.51792230.00060
43、100.00038250.0016340.00038250.00317522xx LT1T123( ,)(3.49698, 1.984559, 1.871436)xxxyb b bL L3371.7283322110 xbxbxbyb123728.3371 3.496981.9845591.871436xxx y计算U,Q,U1,U2,U3并检验 5351.108128332211yyylblblbU5546.35981ULQyye4418.94100012995. 049698. 3211211cbU4201.65530006010. 0984559. 1222222cbU0016.1103
44、00317522. 0871436. 1233233cbUUUUUUj8635.17066321表表 三元线性回归方程的方差分析三元线性回归方程的方差分析12. 4)35, 1 (05. 0F145. 7)35, 1 (01. 0F40. 4)35, 3(01. 0F变异来源 df(自由度)SS(平方和)MS(均方)FFaX119410.4418(U1)9410.44189.154*X216553.4201(U2)6553.42016.3746*X311103.0016(U3)1103.00161回归3(p)108128.5546(U)36042.84535.06*剩余35(n-p-1)359
45、81.5546(Q)1028.0444总变异38(n-1)144110.0897(Lyy)275%,yyRU l*0.8662R 01109. 4871436. 100317522. 00016324. 049698. 33333111bccbb10502. 2871436. 100317522. 00003825. 0984559. 13333222bccbb5335.1070250016.11035351.1081283*UUU5562.370840016.11035546.359813*UQQ,36, 2*eUff*9478.51362QUF25. 5)36, 2(01. 0F0687.
46、6132*21*1*0 xbxbyb12613.06874.011092.10502xx y%3 .740897.1441105335.1070252R剔除x3后:111222()()()pppyb xxbxxbxxyT()ybxxT120000T120000001 ,()()1, 1()()xxxxNynyNynyyxxLxxxxLxx002T1002T1001()()(1)11()()(1)xxeyxxeSQnpnSQnpnyxxLxxxxLxx其中 10.00129958.51792230.00163248.51792230.00060100.00038250.0016340.00038
47、250.00317522xx L200-7693/39=2.7436150-5741.5/39=2.7821123.5-4885.1/39=-1.7590(2.7436,2.7821,1.7590)示例: 用线性回归解决多项式非线性回归问题用线性回归解决多项式非线性回归问题 ppxxxy2210,221ppxxxxxxppxxxy2211031622521421322110zzzzzzzy,2142132211zzxzxzxzx3322110 xxxy如:如:令:令:表表 废品率废品率y y与化学成分与化学成分x x的记录的记录xx 122xx xx 122xx y (%)(0.01%)y (
48、%)(0.01%)1.303411560.444016001.003612960.564116810.733713690.304217640.903814440.424318490.813915210.354318490.703915210.404520250.603915210.414722090.504016000.60482304354045500.20.40.60.811.2图4-4-1 废品率y与化学成分x的散点图及回归曲线图,02.10y 6263. 01602.10y,6511x 6875.40166511x,267092x 3125.166916267092x44.221)(1
49、212111xnxl1513685)(1222222xnxl18283)(121212112xxnxxll649.11)(1111yxnyxly05.923)(1222yxnyxly4982. 1)(122ynylyy正则方程组为05.923151368518283649.111828344.2212121bbbb,009301. 0,8205. 021bb484.1822110 xbxbyb218.4840.82050.009301xxy2102bbx,20210244b bbby极值:11.44009301. 02)8205. 0(0 x204 18.484 0.009301 ( 0.82
50、05)0.394 0.009301 y当某化学成分含量在0.44%左右时,平均废品率最小,约为0.39% 通径分析与偏相关分析 偏相关(Partial Correlation):是在其余M2个变量皆固定时,指定的两个变量间的相关。偏回归系数bi不能反映自变量的相对重要性,因为:bi 带有具体的单位,单位不同无法比较;即使单位相同,Xi的变异程度不同,也不能比较。但可以采用标准化的偏回归系数,也称通径系数(Path coefficient):):yxiixyiiSSSSbnSSnSSbP) 1/(/1) 1/(/1即对分子和分母分别除以即对分子和分母分别除以Y和和Xi的标准差,就可以消除单位和变
51、异度的影响,的标准差,就可以消除单位和变异度的影响,其统计学意义是若增加一个标准差单位,其统计学意义是若增加一个标准差单位,Y将增加或减少将增加或减少Pi个标准差单位。个标准差单位。通径分析实质上是标准化的多元线性回归分析 *11221212PPPyPyxxxxxxbbbSSSSypjSSbbnlSnlSyjjjjjjyyy, 2 , 1,1,1*1b*2b*3b*eb12r23r1x2x3x13ry图图4-5-1 y关于各关于各x的通径图的通径图 yyyrbbrbrrbrbbrrbrbrb3*3*232*1312*323*2*1211*1313*1212*1*T12(,) ,pb bbb)
52、1,() 1/()1 (/) 1/(/22pnpFpnRpRpnQpUF) 1(1)1 (2*pntpnRcbtjjjj2*T1 12 2yyp pyxyRUb rb rb rb R*T*2*112ppxxjjjkkjjj kbb r bb R b2*2(=2()jjjjkkjjjkkjkRbxyRRb r bxxy对 的直接决定系数), 相关路对 的相关决定系数jkjjyjjkjjbrbRRR2*2)(2决策系数 【例4-5-2】 关于小麦产量y与其构成因素x1(百粒重)、x2 (每株穗数)、x3(每穗粒数)x4(每穗粒重)的通径分析试验为随机区组设计,参试品种10个,重复3次误差自由度为1
53、8,遗传型的自由度为9,遗传相关系数的显著性临界值为 x1X2X3X4yX110.2740.7060.5250.050X210.3000.4740.477X30.6650.256X410.440735. 0)9(,602. 0)9(01. 005. 0rr050. 0525. 0706. 0274. 0*4*3*2*1bbbb477. 0474. 0300. 0274. 0*4*3*2*1bbbb256. 0665. 0300. 0706. 0*4*3*2*1bbbb440. 0665. 0474. 0525. 0*4*3*2*1bbbb313. 0321. 0*2*1bb908. 0180. 1*4*3bb14 42.02240.09101.29640.15650.09101.29460.09350.6280()1.29640.09352.62491.10930.15650.62801.10932.1175xxjicR861. 0)9(,931. 0,867. 001. 0*2RRrbRjyj325. 3)9(,262. 2)9(, )9(9)1 (01. 005. 02*tttRcbtjjjj*4*3*2*12659.10,9826.11,5259. 4,7136. 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 省级教育考试命题规范解读
- 二手房商品房买卖合同(标准版)
- 建筑工程项目环境保护方案
- 活动摄像合同(标准版)
- 企业绩效改进方案与实施步骤
- 门诊承包合同(标准版)
- 商场服装联营合同(标准版)
- 饭店中餐摆台流程及服务标准
- 现代物流运输方案优化分析
- 财政税务改革政策解析及企业应对策略
- 2025年人力资源管理考试题及答案电大
- 2025全球汽车供应链核心企业竞争力白皮书
- 拆迁拆除作业人员配置及机械设备安排
- 氨机房安全管理制度
- 爆破保管员复训考试题及答案
- 数字经济概论(第二版)-课件全套 戚聿东 第1-13章 数据要素-数据垄断与算法滥用
- 麻醉疑难病例讨论
- 2025至2030年中国泌尿科输尿管支架行业市场动态分析及发展战略研判报告
- 低空空域管理课件
- 食用菌公司管理制度
- 电影公司的背景意义及必要性
评论
0/150
提交评论