版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章第八章 相关分析和回归分析相关分析和回归分析n8.1 相关分析和回归分析概述相关分析和回归分析概述n8.2 相关分析相关分析n8.3 直线回归直线回归n8.4 多元线性回归多元线性回归n8.5 逐步回归逐步回归n8.6 非线性回归非线性回归1课堂教育8.1 相关、回归分析概述相关、回归分析概述相关分析计算反映各变量之间相关密切程度和性质的统计数。相关分析计算反映各变量之间相关密切程度和性质的统计数。8.1.1 相关分析概述相关分析概述简单相关简单相关:研究两变量直线相关的密切程度和性质,也:研究两变量直线相关的密切程度和性质,也称直线相关。称直线相关。偏相关偏相关:排除其余的影响因子,求
2、出:排除其余的影响因子,求出x 与与y的纯相关,这的纯相关,这种相关称偏相关。种相关称偏相关。复相关复相关:研究一个变量与一组变量之间的相关性关系。:研究一个变量与一组变量之间的相关性关系。典型相关典型相关:研究两组变量的相关性。:研究两组变量的相关性。2课堂教育8.1.2 回归分析概述回归分析概述由自变数预测因变数的问题都叫回归分析。由自变数预测因变数的问题都叫回归分析。 相关分析反映各变量间相关密切程度,回归分析反映相关分析反映各变量间相关密切程度,回归分析反映因变量因变量(y)和自变量和自变量(x)之间的数量关系,用回归方程表之间的数量关系,用回归方程表示。回归模型不一定是因果关系,自变
3、量可多于一个。示。回归模型不一定是因果关系,自变量可多于一个。回归分析依回归分析依自变量个数自变量个数的多少分为:的多少分为:一元回归和多元回归一元回归和多元回归因变量和自变量间因变量和自变量间关系的性质分关系的性质分:线性回归和非线性回归线性回归和非线性回归回归分析的回归分析的sas过程:主要有过程:主要有reg(回归分析)回归分析) glm (广义线性模型)(广义线性模型) 如由温度表水银柱高度(如由温度表水银柱高度(x)来估计温度()来估计温度(y )时,)时,自变量实际上是依赖于因变量。自变量实际上是依赖于因变量。3课堂教育n1 简单相关简单相关n2 偏相关偏相关n3 复相关复相关8.
4、2 相关分析相关分析(analysis of correlation)补:秩相关补:秩相关4课堂教育1 简单相关简单相关简单相关简单相关: 是对有联系的两类事物(是对有联系的两类事物(x与与y)表面关)表面关系密切程度的衡量。系密切程度的衡量。(simple correlation)一、简单相关系数一、简单相关系数yxssyxyyxxyyxxr),cov()()()(221|r相关系数相关系数r(无单位)(无单位)的取值:的取值:即:即:11r5课堂教育二、简单相关系数二、简单相关系数r的显著性测验的显著性测验由由d.f=n-2查出相关系数的临界值查出相关系数的临界值r0.05 、r0.01(
5、degree of freedom)sas直接输出直接输出prob|r|概率值,记为概率值,记为a.统计假设统计假设h0:总体相关系数:总体相关系数=0若若a 0.05,接受,接受h0,相关不显著,即总体相关不显著,即总体x与与y间不存在相关关系。间不存在相关关系。若若0.01a 0.05,拒绝,拒绝h0,相关显著,即总体相关显著,即总体x与与y间存在相关关系。间存在相关关系。若若a |r| under ho: rho=0 / n = 26 x y x 1.00000 0.71019 0.0 0.0001 y 0.71019 1.00000 0.0001 0.0结论:因结论:因r=0.7101
6、9,其出现的概率,其出现的概率=0.0001 |r| x1x2x3x11.00000 0.799490.00100.775490.0018x20.799490.00101.00000 0.869310.0001x30.775490.00180.869310.00011.00000 20课堂教育corr 过程过程1 partial 变量:变量:x32 变量:变量:x1 x2 简单统计量简单统计量变变量量n均值均值标准偏差标准偏差总和总和最小值最小值最大值最大值偏方差偏方差偏标准偏差偏标准偏差x31315.738460.99544204.6000013.7000017.90000 x11328.6
7、076920.18875371.900000.4000052.30000177.2425913.31325x21315.484621.13420201.3000013.1000017.600000.342840.58552 pearson 偏相关系数偏相关系数, n = 13 当当 h0: partial rho=0 时,时,prob |r| x1x2x11.00000 0.401690.1956x20.401690.19561.00000 21课堂教育统计结论: r12=0.79949 p=0.0010.01 相关极显著 r13=0.77549 p=0.00180.01 相关极显著 r23=
8、0.86931 p=0.00010.05 相关不显著 r13.2=0.27108 p=0.271080.05 相关不显著22课堂教育实例:实例:p170例例8.2 8.2 腰果分期播种试验,采用腰果分期播种试验,采用1010天播种一次,每次天播种一次,每次播种播种1010粒。粒。19861986年年4 4月至月至19871987年年3 3月,共进行月,共进行3333次分期次分期播种。表播种。表1111是腰果种子发芽是腰果种子发芽“普遍期普遍期”天数、平均气天数、平均气温、平均最低气温、及平均最高气温的观察资料。试温、平均最低气温、及平均最高气温的观察资料。试求简单相关系数及二级偏相关系数。求简
9、单相关系数及二级偏相关系数。普遍天数普遍天数平均气温平均气温平均最低气温平均最低气温平均最高气温平均最高气温121229.029.024.224.234.634.6151527.827.823.623.632.632.6424219.219.214.914.925.225.2表8.3 腰果种子“普遍期”天数与气温表23课堂教育data cashew; input x1 x2 x3 x4 ; cards;12 29.0 24.2 34.6 .42 19.2 14.9 25.2;proc corr; var x1 x2 x3 x4;proc corr; var x3 x4; partial x2;
10、proc corr; var x1 x4; partial x2 x3;run;24课堂教育 correlation analysis 2 partial variables: x2 x3 2 var variables: x1 x4pearson partial correlation coefficients / prob |r| under ho: partial rho=0 / n = 33 x1 x4 x1 1.00000 0.07517 0.0 0.6878 x4 0.07517 1.00000 0.6878 0.0统计结论统计结论: r34.2=-0.8031 p=0.00010
11、.05 相关不显著相关不显著部分输出结果:部分输出结果:25课堂教育 组合代号组合代号 x1 x2 x3 yx1 x2 x3 y 1 10.37 29.56 33.31 10.520 1 10.37 29.56 33.31 10.520 2 10.47 34.25 29.05 10.070 2 10.47 34.25 29.05 10.070 3 9.67 35.25 37.65 12.790 3 9.67 35.25 37.65 12.790 4 9.87 29.25 31.52 9.230 4 9.87 29.25 31.52 9.230 5 8.20 37.85 33.62 10.360
12、 5 8.20 37.85 33.62 10.360 6 8.67 37.78 38.09 12.570 6 8.67 37.78 38.09 12.570 7 10.03 40.97 30.42 12.560 7 10.03 40.97 30.42 12.560 8 9.00 46.00 29.10 11.388 8 9.00 46.00 29.10 11.388 9 10.07 39.73 32.06 12.830 9 10.07 39.73 32.06 12.830实习四实习四实实 习习作业作业:21个小麦双列杂交组合个小麦双列杂交组合f1的单株产量的单株产量y(克),每株穗(克),每株
13、穗数数x1,每穗的粒数,每穗的粒数x2,千粒重千粒重x3(克)数据如下:(克)数据如下:26课堂教育 组合代号组合代号 x1 x2 x3 yx1 x2 x3 y 10 10.57 36.30 30.59 11.800 10 10.57 36.30 30.59 11.800 11 8.73 37.10 27.17 8.730 11 8.73 37.10 27.17 8.730 12 10.20 35.67 32.21 11.790 12 10.20 35.67 32.21 11.790 13 8.93 35.44 33.22 10.420 13 8.93 35.44 33.22 10.420 1
14、4 9.83 34.28 28.40 9.830 14 9.83 34.28 28.40 9.830 15 8.60 33.31 35.49 10.920 15 8.60 33.31 35.49 10.920 16 8.83 35.10 27.54 8.440 16 8.83 35.10 27.54 8.440 17 8.80 34.45 34.20 10.500 17 8.80 34.45 34.20 10.500 18 8.80 30.65 29.47 7.940 18 8.80 30.65 29.47 7.940 19 9.40 31.20 30.75 8.830 19 9.40 31.
15、20 30.75 8.830 20 10.03 39.27 29.21 11.330 20 10.03 39.27 29.21 11.330试求试求ry1、ry3、ry1.2、 ry1.23 , 并确定其显著性。并确定其显著性。27课堂教育&8.3 直线回归分析直线回归分析(一元线性回归一元线性回归)一、直线回归方程一、直线回归方程正相关正相关r0 曲线相关曲线相关 负相关负相关rf0.05,显著,即,显著,即x与与y之间的直线回归关系显著。之间的直线回归关系显著。若若ff0.01,极显著。,极显著。若若ff0.05,不显著。,不显著。22剩余回归ssf 0:0h即两变量间不存在线性关
16、系即两变量间不存在线性关系目的:了解样本所来自的集团中两变数间是否确实存目的:了解样本所来自的集团中两变数间是否确实存 在回归关系。在回归关系。二、回归的显著性测验二、回归的显著性测验31课堂教育但必须注意,应用时但必须注意,应用时x的取值范围只能在拟合回归方的取值范围只能在拟合回归方程时所用样本的范围内,不能外推。程时所用样本的范围内,不能外推。显著时当bxay,可用于预测、控制等,可用于预测、控制等,1.1.预测:当预测:当x=xx=x0 0时,用回归方程预测值时,用回归方程预测值00bxay2)(1(200nqssxxnsxy其中:的置信区间:的条件总体均数1) 1 (/ xy , 00
17、)2(0)2(0ynynstysty三、用直线方程预测三、用直线方程预测32课堂教育2)(11 (20nqssxxnsxy其中: , )2(0)2(0ynynstysty的置信区间:预测值的1)2(33课堂教育p175例例8.3:橡胶树大型系比:橡胶树大型系比试验,刺检干胶量(试验,刺检干胶量(x:毫克)毫克)与正式割胶产量(与正式割胶产量(y:克)如克)如下下:编号编号刺检干胶量刺检干胶量 正式割胶产量正式割胶产量x y12.2677 8.864 7.9. . . .73 3.5 试求试求y关于关于x的回归方程,的回归方程,并对回归方程作显著性测验。并对回归方程作显著性测验。data lat
18、ex; input x y ; cards;77 8.8 64 7.9 73 3.5; proc reg corr; model y=x/ cli clm;/*cli输出输出y值的值的95%预测区间预测区间*/plot y*x/conf95;run;其其sas程序:程序:四、直线回归实例四、直线回归实例conf95在散点图(在散点图(x,y)上附加回归直线和均值置信区间)上附加回归直线和均值置信区间/*选项选项corr,要求输出简单相关系数,要求输出简单相关系数*/clm输出条件总体平均数的输出条件总体平均数的95%置信区间置信区间34课堂教育sas 系统系统the reg procedure
19、correlationvariablexyx1.00000.7057y0.70571.0000sas输出结果:输出结果:说明:说明:proc reg corr; 选项选项corr输出变量间的简单输出变量间的简单相关系数相关系数 35课堂教育the reg proceduremodel: model1dependent variable: y analysis of variancesourcedfsum ofsquaresmeansquaref valuepr fmodel1137.80902137.8090223.81 |t|intercept12.007461.530371.310.202
20、0 x10.077090.015804.88.0001截距 截距截距a=2.00746,其标准误为,其标准误为1.53037。回归系数回归系数b=0.07709,其标准误为,其标准误为0.01580,t=4.88,p fmodel22852.83453 1426.4172615.37 0.0027error7649.6094792.80135 corrected total93502.44400 root mse9.63335 r-square0.8145dependent mean28.56000 adj r-sq0.7615coeff var33.73020 52课堂教育parameter
21、 estimatesvariabledfparameterestimatestandarderrort valuepr |t|intercept1-135.0996261.37574-2.200.0636x1110.195684.316042.360.0502x211.283601.370170.940.38002128360. 119568.1009962.135xxy求二元回归方程求二元回归方程53课堂教育output statisticsobsdependentvariablepredictedvaluestd errormean predict95% cl predictresidua
22、l111.800021.67184.9777-3.968747.3123-9.8718100.5000-1.53626.7356-29.331426.25902.036211.31.09738.9945-0.067562.2621. 预测出预测出1977年最终病情指数值年最终病情指数值95%的预测区间为的预测区间为-0.0675,62.26210973.31 y54课堂教育2:三元线性回归:三元线性回归p180p180例例8.4 8.4 甘蔗糖分与气象资料如表甘蔗糖分与气象资料如表8.58.5。试求。试求y y关于关于x x1 1,x x2 2,x x3 3的线性回归方程,并对方程作显著性测验
23、。当的线性回归方程,并对方程作显著性测验。当方程达显著时,再对方程达显著时,再对19841984年糖分作预测。年糖分作预测。年份年份糖份糖份(y y)9 91212月份降月份降雨量(雨量(x x1 1)1010月份相对月份相对湿度(湿度(x x2 2)1212月份最低月份最低温度(温度(x x3 3)64/6564/6513.9313.93408.6408.683834.34.365/6665/6613.8513.85460.9460.983833.03.066/6766/6714.2114.21151.8151.882824.74.783/8483/84390.0390.080804.64.
24、655课堂教育data sgca; input y x1-x3; cards;13.93 408.6 834.3 13.85 460.9 833.0 .11.59 480.4 831.5 . 390.0 804.6;proc reg;model y=x1-x3/stb cli;run;sas结果及解释结果及解释p14756课堂教育analysis of variancesourcedfsum ofsquaresmeansquaref value pr fmodel37.79038 2.596799.08 0.0011error154.29100 0.28607 corrected total1
25、8 12.08138 parameter estimatesvariabledfparameterestimatestandarderrort valuepr |t|standardizedestimateintercept119.714623.189266.18 fmodel14.288054.288059.350.0071error177.793330.45843 corrected total1812.08138 variableparameterestimatestandarderrortype ii ssf valuepr fintercept24.903503.5133123.03
26、36750.24 fmodel26.215533.107778.480.0031error165.865850.36662 corrected total1812.08138 variableparameterestimatestandarderrortype ii ssf valuepr fintercept22.951993.2550818.2275349.72 fmodel37.790382.596799.080.0011error154.291000.28607 corrected total1812.08138 variableparameterestimatestandarderr
27、ortype ii ssf valuepr fintercept19.714623.1892610.9311238.21 fmodel27.076633.5383111.310.0009error165.004750.31280 corrected total1812.08138 variableparameterestimatestandarderrortype ii ssf valuepr fintercept14.727280.47031306.71958980.570 b20 b30 的图象 的图象 75课堂教育最简单的多项式是最简单的多项式是二次多项式二次多项式,其方程为:,其方程为
28、:22102xbxbby2212xbxbayb20 b2f model 1 29.00024 29.00024 0.998 0.3563 error 6 174.33476 29.05579 c total 7 203.33500 root mse 5.39034 r-square 0.1426 dep mean 9.72500 adj r-sq -0.0003 c.v. 55.42769 parameter estimates parameter standard t for h0: variable df estimate error parameter=0 prob |t| interc
29、ep 1 5.154762 4.95571021 1.040 0.3384 x 1 0.830952 0.83174792 0.999 0.356379课堂教育model: model2 sourcedfsum ofsquaresmeansquaref valuepr fmodel2198.6040599.30202104.95 |t|intercept130.273812.0784214.57.0001x1-10.221430.83905-12.18.0001x211.004760.0750513.39 fmodel3201.4895067.16317145.570.0002error41.845500.46137 corrected total7203
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度信阳航空职业学院《形势与政策》期末考试测试卷【综合题】附答案详解
- 2024-2025学年园林绿化作业人员检测卷及完整答案详解【名校卷】
- 2024-2025学年冶金工业技能鉴定过关检测试卷含完整答案详解【夺冠系列】
- 2024-2025学年度一级建造师练习题附参考答案详解【模拟题】
- 2024-2025学年度执业药师考前冲刺练习试题(综合卷)附答案详解
- 2024-2025学年度农村信用社招聘考试检测卷【考点精练】附答案详解
- 2024-2025学年度农村信用社招聘考试考前冲刺练习附答案详解【研优卷】
- 2024-2025学年度监理工程师自我提分评估附答案详解(B卷)
- 2024-2025学年度山东省公务员考试经典例题(满分必刷)附答案详解
- 2024-2025学年度施工员模拟试题附答案详解(基础题)
- GB/T 4026-2025人机界面标志标识的基本和安全规则设备端子、导体终端和导体的标识
- 放射性皮肤损伤护理指南
- GB/T 45997-2025科技成果五元价值评估指南
- 项目职责分工方案(3篇)
- 2025事业单位工勤技能考试题库及参考答案
- 期末素养评价卷(试卷)(含答案)2024-2025学年一年级数学下册人教版
- 检验科危化品培训
- 美容场地合作使用协议书
- 【50万吨年产量的煤制乙二醇合成工段工艺设计7900字(论文)】
- 正反转培训课件
- CJ/T 206-2005城市供水水质标准
评论
0/150
提交评论