版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、简介
在现实生活中,客观事物常受多种因素影响,我们记录下相应数据并加以分析,目的是为了找出对我们所关心的指标(因变量)Y有影响的因素(也称自变量或回归变量)x1、x2、…、xm,并建立用x1、x2、…、xm预报Y的经验公式:从而用以进行预测或控制,达到指导生产活动的目的。多元线性回归第1页/共35页第一页,共36页。以年龄为自变量x,血压为因变量y,可作出如下散点图:年龄394745476545674267563650392144血压144120138145162142170124158154136142120120116年龄645659344248451720195363292569血压162150140110128130135114116124158144130125175例1、某医学研究所对30个不同年龄的人的血压(高压)进行了测量,得到如下数据:第2页/共35页第二页,共36页。
为了判断经验公式是否可用线性函数来拟合,可以画出散点图观察。其方法如下:第3页/共35页第三页,共36页。第4页/共35页第四页,共36页。双击改变显示格式改变坐标轴的显示第5页/共35页第五页,共36页。为了求得经验公式,可通过如下步骤进行:从散点图可以看出年龄与血压有线性关系:第6页/共35页第六页,共36页。当自变量和因变量选好后,点击OK键第7页/共35页第七页,共36页。Model为回归方程模型编号(不同方法对应不同模型)R为回归方程的复相关系数RSquare即R2系数,用以判断自变量对因变量的影响有多大,但这并不意味着越大越好——自变量增多时,R2系数会增大,但模型的拟合度未必更好AdjustedRSquare即修正R2,为了尽可能确切地反映模型的拟合度,用该参数修正R2系数偏差,它未必随变量个数的增加而增加Std.ErroroftheEstimate是估计的标准误差结果说明——常用统计量:第8页/共35页第八页,共36页。SumofSquares为回归平方和(Regression)、残差平方和(Residual)、总平方和(Total)df为自由度MeanSquareFSig为大于F的概率,其值为0.000,拒绝回归系数为0的原假设:b0=b1=0——即认为回归方程显著性成立结果说明——方差分析:第9页/共35页第九页,共36页。Model为回归方程模型编号UnstandardizedCoefficients为非标准化系数,B为系数值,Std.Error为系数的标准差StandardizedCoefficients为标准化系数t为t检验,是偏回归系数为0(和常数项为0)的假设检验Sig.为偏回归系数为0(和常数项为0)的假设检验的显著性水平值B为Beta系数,Std.Error为相应的标准差结果说明——回归系数分析:第10页/共35页第十页,共36页。
第一导丝盘速度Y是合成纤维抽丝的重要因素,它与电流的周波X有密切关系,由生产记录得:周波X49.250.049.349.049.049.549.849.950.250.2速度Y16.717.016.816.616.716.816.917.017.017.1
试求Y对X的经验回归直线方程,并求误差方差σ2的无偏估计值。检验X与Y之间是否存在显著的线性关系(取α=0.01)?例.《概率论与数理统计》P267例9.2.1第11页/共35页第十一页,共36页。检验说明线性关系显著操作步骤:Analyze→Regression→Linear…→Statistics→ModelfitDescriptives结果:第12页/共35页第十二页,共36页。对于多元线性回归主要需研究如下几个问题:建立因变量Y与x1、x2、…、xm的经验公式(回归方程)对经验公式的可信度进行检验判断每个自变量xi(i=1,…,m)对Y的影响是否显著?利用经验公式进行预报、控制及指导生产诊断经验公式是否适合这组数据第13页/共35页第十三页,共36页。方差分析的主要思想是把yi的总方差进行分解:模型平方和误差平方和二、多元线性回归参数估计方法——最小二乘法回归方程显著性的检验——就是检验以下假设是否成立(采用方差分析法):第14页/共35页第十四页,共36页。
如果自变量对Y的影响显著,则总方差主要应由xi引起,也就是原假设不成立,从而检验统计量为:方差来源自由度平方和均方Fp值自变量mMSSMMSMMS——EMSp随机误差n-m-1ESSEMS和n-1TSS多元线性回归的方差分析表:第15页/共35页第十五页,共36页。
在实际问题中,影响因变量Y的因素(自变量)可能很多。在回归方程中,如果漏掉了重要因素,则会产生大的偏差;但如果回归式中包含的因素太多,则不仅使用不便,且可能影响预测精度。如何选择适当的变量,建立最优的回归方程呢?
在最优的方程中,所有变量对因变量Y的影响都应该是显著的,而所有对Y影响不显著的变量都不包含在方程中。选择方法主要有:逐步筛选法(STEPWISE)(最常用)向前引入法(FORWARD)向后剔除法(BACKWARD)等逐步回归——变量选择问题第16页/共35页第十六页,共36页。开始对不在方程中的变量考虑能否引入?引入变量能对已在方程中的变量考虑能否剔除?能剔除变量否筛选结束否逐步回归的基本思想和步骤:第17页/共35页第十七页,共36页。某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据如下表,寻求大春粮食产量的预报模型。例2、大春粮食产量的预报模型第18页/共35页第十八页,共36页。按Graphs→Scatter→Simple顺序展开对话框将y选入YAxis,然后将其余变量逐个选入XAxis,绘出散点图,观察是否适宜用线性方程来拟合。1.初步分析(作图观察)第19页/共35页第十九页,共36页。按Statistics→Regression→Linear顺序展开对话框将y作为因变量选入Dependent框中,然后将其余变量选入作为自变量选入Independent(s)框中Method框中选择Stepwise(逐步回归)作为分析方式单击Statistics按钮,进行需要的选择,单击Continue返回单击OK按钮执行2.回归模型的建立第20页/共35页第二十页,共36页。被引入与被剔除的变量回归方程模型编号引入回归方程的自变量名称从回归方程被剔除的自变量名称回归方程中引入或剔除自变量的依据3.结果分析第21页/共35页第二十一页,共36页。由复相关系数R=0.982说明该预报模型高度显著,可用于该地区大春粮食产量的短期预报常用统计量第22页/共35页第二十二页,共36页。方差分析表第23页/共35页第二十三页,共36页。回归方程为:按常识理解,粮食产量和播种面积关系密切,但预报模型中,变量x1未引入,这是因为:多年来该地区的大春粮食播种面积变化甚微,近于常数,因而对产量的影响不大而失去其重要性。回归系数分析第24页/共35页第二十四页,共36页。
在汽油中加入两种化学添加剂,观察它们对汽车消耗1公升汽油所行里程的影响,共进行9次试验,得到里程Y与两种添加剂用量X1、X2之间数据如下:xi1010120231xi2001102213yi15.816.015.916.216.516.316.817.417.2试求里程Y关于X1、X2的经验线性回归方程,并求误差方差σ2的无偏估计值。例.《概率论与数理统计》P280例9.3.1第25页/共35页第二十五页,共36页。检验说明线性关系显著结果:第26页/共35页第二十六页,共36页。
在实际问题中,常会遇到变量之间关系不是线性的相关关系,而是某种曲线的非线性相关关系。此时首先要确定回归函数的类型,其原则是:根据问题的专业知识或经验确定根据观测数据的散点图确定常选曲线类型:双曲线、幂函数曲线、对数曲线、指数曲线、倒数指数曲线、S形曲线三、非线性回归第27页/共35页第二十七页,共36页。鼠标在选项上点击右键可看到相应模型类型操作步骤:Analyze→Regression→CurveEstimation…结合SPSS的曲线模型选择:第28页/共35页第二十八页,共36页。
测量13个样品中某种金属含量Y与该样品采集点距中心观测点的距离X,有如下观测值:xi23457810yi106.42108.20109.58109.50110.00109.93110.49xi111415161819yi110.59106.62110.90110.76111.00111.20求Y关于X的关系式。例.《概率论与数理统计》P286例9.4.1第29页/共35页第二十九页,共36页。首先绘出散点图:Graphs→Scatter…→Simple
步骤:
根据散点图的形态可以认为变量X与Y之间具有对数曲线类型的回归方程:第30页/共35页第三十页,共36页。通过点击右键观看选择适当的类型:Logarithmic操作步骤:Analyze→Regression→CurveEstimation…结果如右:由图易知,结果方程与书上结果有差距第31页/共35页第三十一页,共36页。因此我们有理由怀疑,原来的数据可能有错误(一般是打印错误),再结合原数据分析发现,Y=110.62是比较合适的,更改后再求解由图易知,结果方程与书上结果很接近
通过对图形仔细分析,可以发现X=14时,Y=106.62导致图形剧烈变化!第32页/共35页第三十二页,共36页。例.《概率论与数理统计》P286例9.4.2
电容器充电到电压100伏时,开始放电测得时刻ti时的电压ui数据如下:ti(秒)012345678910ui(伏)10075554030201510853找出时刻ti与电压ui的关系式。思考:仍有差异的原因?第33页/共35页第三十三页,共36页。第34页/共35页第三十
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中述职报告
- 2025年给排水专业试题及答案
- 江苏省2025年公务员考试行测专项突破卷
- 2025年电子白板试题及答案
- 2025年输血相关简答试题及答案
- 2025年二甲评审院感应知应会试题及答案(共160题)
- 河北省2025年公务员考试冲刺押题卷
- 2025年安徽省公务员考试言语理解真题卷
- 2025年标准电脑设备采购合同
- 01-赵燕《财私客群(企业主)综合开发》6课时
- 融资入股协议书样本
- 加油站安全生产管理台账21种台账样本完整版
- 纸箱厂质量控制奖惩条例
- 2025年水利系统职称考试水利专业技术人员职称考试题库及答案
- 湖南省湘潭市2024-2025学年九年级上学期1月期末历史试题
- 库蚊环境适应性-深度研究
- 新能源行业人力资源规划与招聘
- DB33 1121-2016 民用建筑电动汽车充电设施配置与设计规范
- 自动化电气元器件介绍与使用
- 【MOOC】温病学-河南中医药大学 中国大学慕课MOOC答案
- 直线和圆的方程 直线与圆的位置关系 教学设计
评论
0/150
提交评论