版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元线性回归1编辑ppt内容根底概念一元线性回归一元回归方程、线性回归条件步骤强影响点判断多元线性回归1、回归方程、线性回归条件2、线性回归步骤3、评价方程的优度4、强影响点判断5、多重共线性的判断2编辑ppt根底概念3编辑ppt回归什么是回归?变量间存在相关关系时,也就具备了建立预测关系的根底。在相关变量见建立预测方程式的统计学方法叫做回归分析。在问卷调查中用得多包括线性和非线性、一元和多元回归分析4编辑ppt一元和多元线性回归一元线性回归:在两个变量具有线性关系的根底上,建立预测方程式。用一个变量预测另一个变量。如儿童的身高和体重存在线性相关,当得知身高时,预测被试的体重范围。多元线性回归:多个变量都与一个变量存在相关关系,建立用预测方程式。用多个变量预测某一个变量。例如:儿童的体重和年龄,都与身高存在线性关系,当体重和年龄时,对身高进行预测。一元和多元线性回归的差异在于自变量的个数5编辑ppt一元线性回归6编辑ppt一元线性回归方程〔使用原始数据计算的回归方程〕Y是因变量,X是自变量,alpha和beta是待求的参数。β=〔δy/δx〕*r,称为非标准化回归系数α=μy-βμx标准化回归方程〔使用标准化的数据计算的回归方程〕ZY=BZxB=〔δZy/δZx〕*r=1*r=r,称为标准化回归系数两种方程表现形式7编辑ppt回归分析的一般过程1、提出假设的回归模型,确定自变量和因变量。自变量是现实中容易测量的,而因变量是难测量的,如幸福感、自我效能感等2、估计回归是线性还是非线性,用散点图判断。如果是线性那么用线性回归。(必须做)3、建立回归方程4、回归方程的有效性检验,测定系数和回归系数8编辑ppt一元线性回归的条件1、线性趋势〔用散点图检测〕2、独立性:因变量y的取值相互独立,残差独立。用durbin-watson计算,值在0-4。如果残差间相互独立,那么取值在2附近。D小于2说明相邻误差存在负相关。大于2,说明存在正相关3、正态性:自变量的任何一个线性组合,因变量y都服从正态分布,残差正态〔直方图和PP图〕。4、方差齐性:自变量的任何一个线性组合,因变量y的方差均相同〔把ZPRED放入Y轴,把ZRESID放入X轴做图〕9编辑ppt注意的问题强影响点判断〔极端值的判断〕Cook’sdistance:当值>1,说明是特别大的极端值。leverage值〔杠杆值〕:当值>3倍均数,均数为〔自变量个数+1〕/N画散点图:最后把cook距离值和leverage杠杆值分别作为X和Y轴画散点图,方便判断。强影响点处理判断原因,考虑是否删除10编辑ppt一元线性回归例子建立体重和肺活量的回归方程〔用练习1的数据〕11编辑ppt一元线性回归步骤先探索数据,判断是否整态、极端值画散点图〔画出散点图后,双击图,右键选addfitlineattotaltool〕Analyze-regression-把肺活量放入因变量dependent-体重放入自变量independentStatistics-默认的-residuals-durinwastonsave——distance–勾上Cook’s和leverage值Plots-histogram和normalprobabilityplot勾上-把ZPRED放入Y,把ZRESID放入X轴——OK12编辑pptβ=〔δy/δx〕*r=〔0.41989/7.426〕*0.881=0.04981α=μy-βμx=3.1027-0.04981*53.43=0.441原始回归方程Y=0.0498X+0.441标准化回归方程Zy=0.881Zx13编辑ppt测定系数判断因变量Y是独立的回归方程的显著性检验回归方程的系数、标准化回归系数、回归系数的显著性检验14编辑ppt决定系数决定系数R2值域在[0,1],越接近于1,说明方程的自变量对y的解释能力越强。当变量的关系是线性关系时,R2越大,说明回归方程拟合数据越好,共变越多。校正的决定系数:随着自变量的增加,R2自然就会随之增加。所以R2是一个受自变量个数与样本规模影响的系数,一般的常规是1:10为好。当这个比例小于1:5时,R2倾向于高估实际的拟合优度。为了防止这种情形,常用校正的R2代替。15编辑ppt回归方程显著:说明X与Y有显著的线性关系。用该方程表示X与Y之间的关系是可靠的。如果不显著,那么不能用回归方程表示X与Y之间的关系。16编辑ppt残差的正态性比照直方图和正态曲线的相似性,是否是中间高,两头低。P-P图的点是不是接近对角线。17编辑ppt残差齐性18编辑ppt多元回归19编辑ppt偏回归系数:当其他变量不变时,xi每改变一个单位,所预测的y的平均变化量。受到自变量的单位影响。因此可以用标准化回归系数。标准化偏回归系数:可以用来比较哪个自变量是影响y的主要因素,哪个是次要因素〔即哪个自变量对y的影响更多〕。多元回归方程20编辑ppt回归系数计算标准化偏回归系数(假设有两个自变量)B1=(r1y-r2y*r12)/(1-r212)B2=(r2y-r1y*r12)/(1-r212)非标准化偏回归系数b1=B1*〔sy/sx1〕21编辑ppt多元回归的样本量要求多元回归模型的样本量要求根据经验,希望样本量在自变量数的20倍以上。比方:有5个自变量,那么样本量应该在100以上,少于此数可能会出现检验效能缺乏的问题22编辑ppt多元线性回归的条件同一元线性回归的条件23编辑ppt回归分析的5个步骤24编辑ppt回归分析的步骤1、做出散点图,观察变量间的趋势〔是否线性〕。这些图是用来观察是否是线性趋势。如果不是线性,可能考虑其他对变量进行预处理,或用曲线回归注意:是否是曲线关系,或者强影响点造成的线性,或者极端值〕25编辑ppt2、考察数据的分布,进行必要的预处理。3、进行直线回归,选入变量进入计算。回归方程是否显著偏回归系数显著根据决定系数,校正决定系数判断拟合得好不好。决定最优方程回归分析的步骤26编辑ppt4、残差分析,分析两方面:残差是否独立:用durbin-watson进行分析〔取值0<d<4〕。如果独立,那么d约等于2。如果相邻两点的残差为正相关,d<2。当相邻两点的残差为负相关时,d>2。残差是否正态:采用残差图显示〔勾选Histogram和Normalprobabilityplot就行〕。残差的方差齐性:以标准化预测值〔ZPRED〕为横轴,标准化残差(ZRESID)为纵轴做散点图。假设散点随机分布,且绝大局部在2倍标准差以内,那么最好,说明没有相关。如最左图最好。中间图随着x值,残差越来越大。最右图,残差非正态。回归分析的步骤27编辑ppt残差是否正态:画图来评价1、残差直方图:标准化残差为x轴,标准化残差频数为Y轴。与正态曲线比较,是否拟合。2、残差p-p图:累积残差观测分布为x轴,期望分布为Y轴。如果符合的话数据会和理论的直线〔对角线〕重合。回归分析的步骤28编辑ppt5、根据散点图,对强影响点进行判断和对多重共线性进行判断〔自变量之间不能有强相关。〕最后两幅图是有强影响点。需要判断是否数据出错,出错那么删掉。回归分析的步骤29编辑ppt步骤同一元回归补充步骤在statistic勾上Rsquarechange,partandpartialcorrelation〔半偏相关和偏相关〕,conlineraritydiagnostics〔共线性判断〕30编辑ppt分层回归方法Enter:强制进入Forward:前向选择法Backward:反向删除法Stepwise:逐步回归,最常用把需要控制的变量用这种方法强制enter法放入方程自由进入变量用forward、backward和stepwise方法放入方程31编辑pptEnter法32编辑ppt逐步回归法〔可以得出更优的方程〕33编辑ppt决定系数的变化量34编辑ppt回归方程的显著性检验保存的变量,因为回归系数和偏回归系数显著删除的变量,因为标准化回归系数不显著35编辑ppt多重共线性判断36编辑ppt回归方程的显著性检验偏回归系数的显著性检验决定系数R2,校正决定系数R2复相关系数R回归方程的解释能力37编辑ppt回归方程的解释能力回归方程的显著性检验当显著时,便可以认为回归方程中至少有一个回归系数是显著的,但是并不一定多有的回归系数都是显著的。偏回归系数的显著性检验判断指定的某个自变量的回归系数是否显著。显著的话,代表与残差相比,该x变量对y的奉献是显著的。根据回归系数显著、偏回归系数显著、校正的决定系数判断最优方程。38编辑ppt复相关系数R值域在[0,1],是因变量y与所有自变量之间的多元线性相关程度的度量。R值越接近于1,说明y与所有x之间的线性关系越密切。39编辑ppt对强影响点的诊断和处
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年家庭智能照护系统项目可行性研究报告
- 2026福建龙岩漳平市招聘高校师范类毕业生101人备考题库带答案详解(能力提升)
- 2026福建泉州安溪六中招聘编外合同制教师备考题库及答案详解(夺冠系列)
- 2026甘肃武威凉州区五和镇选聘专业化管理村文书招聘1人备考题库及参考答案详解一套
- 2026福建漳州招商局经济技术开发区海滨学校招聘2人备考题库带答案详解ab卷
- 2026湖北事业单位联考咸宁市招聘132人备考题库带答案详解(精练)
- 2026年后方交叉碰撞预警系统 (RCTA)项目可行性研究报告
- 2026湖北襄阳市东风井关农业机械有限公司招聘6人备考题库附参考答案详解(培优)
- 萍乡市事业单位2026年统一公开招聘工作人员备考题库附参考答案详解(典型题)
- 2026河南周口市中心医院劳务派遣岗位招聘4人备考题库附参考答案详解(预热题)
- 2026届高考地理一轮基础复习训练2地图、等高线地形图和地形剖面图
- 生物基戊二酸绿色合成工艺与催化剂优化设计
- 名企参考:万达集团组织结构及部门职责
- 电力林地占用赔补协议书
- 酒店高级技师试题及答案
- 2024年全国职业院校技能大赛高职组(社区服务实务赛项)考试题库(含答案)
- 2025廉洁过春节紧绷纪律弦春节廉洁提醒课件
- 招商证券科创板评测10题及答案2021
- DL∕T 2591-2023 垃圾发电厂垃圾储运系统运行规程
- 2024 年咨询工程师《宏观经济政策与发展规划》猛龙过江口袋书
- 笔迹鉴定技术规范
评论
0/150
提交评论