




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元线性回归 内容 基础概念一元线性回归一元回归方程 线性回归条件步骤强影响点判断多元线性回归1 回归方程 线性回归条件2 线性回归步骤3 评价方程的优度4 强影响点判断5 多重共线性的判断 基础概念 回归 什么是回归 变量间存在相关关系时 也就具备了建立预测关系的基础 在相关变量见建立预测方程式的统计学方法叫做回归分析 在问卷调查中用得多包括线性和非线性 一元和多元回归分析 一元和多元线性回归 一元线性回归 在两个变量具有线性关系的基础上 建立预测方程式 用一个变量预测另一个变量 如儿童的身高和体重存在线性相关 当得知身高时 预测被试的体重范围 多元线性回归 多个变量都与一个变量存在相关关系 建立用预测方程式 用多个变量预测某一个变量 例如 儿童的体重和年龄 都与身高存在线性关系 当已知体重和年龄时 对身高进行预测 一元和多元线性回归的差别在于自变量的个数 一元线性回归 一元线性回归方程 使用原始数据计算的回归方程 Y是因变量 X是自变量 alpha和beta是待求的参数 y x r 称为非标准化回归系数 y x 标准化回归方程 使用标准化的数据计算的回归方程 ZY BZxB Zy Zx r 1 r r 称为标准化回归系数 两种方程表现形式 回归分析的一般过程 1 提出假设的回归模型 确定自变量和因变量 自变量是现实中容易测量的 而因变量是难测量的 如幸福感 自我效能感等2 估计回归是线性还是非线性 用散点图判断 如果是线性则用线性回归 必须做 3 建立回归方程4 回归方程的有效性检验 测定系数和回归系数 一元线性回归的条件 1 线性趋势 用散点图检测 2 独立性 因变量y的取值相互独立 残差独立 用durbin watson计算 值在0 4 如果残差间相互独立 则取值在2附近 D小于2说明相邻误差存在负相关 大于2 说明存在正相关3 正态性 自变量的任何一个线性组合 因变量y都服从正态分布 残差正态 直方图和PP图 4 方差齐性 自变量的任何一个线性组合 因变量y的方差均相同 把ZPRED放入Y轴 把ZRESID放入X轴做图 注意的问题 强影响点判断 极端值的判断 Cook sdistance 当值 1 表明是特别大的极端值 leverage值 杠杆值 当值 3倍均数 均数为 自变量个数 1 N画散点图 最后把cook距离值和leverage杠杆值分别作为X和Y轴画散点图 方便判断 强影响点处理判断原因 考虑是否删除 一元线性回归例子 建立体重和肺活量的回归方程 用练习1的数据 一元线性回归步骤 先探索数据 判断是否整态 极端值画散点图 画出散点图后 双击图 右键选addfitlineattotaltool Analyze regression 把肺活量放入因变量dependent 体重放入自变量independentStatistics 默认的 residuals durinwastonsave distance 勾上Cook s和leverage值Plots histogram和normalprobabilityplot勾上 把ZPRED放入Y 把ZRESID放入X轴 OK y x r 0 41989 7 426 0 881 0 04981 y x 3 1027 0 04981 53 43 0 441 原始回归方程Y 0 0498X 0 441标准化回归方程Zy 0 881Zx 测定系数 判断因变量Y是独立的 回归方程的显著性检验 回归方程的系数 标准化回归系数 回归系数的显著性检验 决定系数 决定系数R2值域在 0 1 越接近于1 表明方程的自变量对y的解释能力越强 当变量的关系是线性关系时 R2越大 说明回归方程拟合数据越好 共变越多 校正的决定系数 随着自变量的增加 R2自然就会随之增加 所以R2是一个受自变量个数与样本规模影响的系数 一般的常规是1 10为好 当这个比例小于1 5时 R2倾向于高估实际的拟合优度 为了避免这种情形 常用校正的R2代替 回归方程显著 说明X与Y有显著的线性关系 用该方程表示X与Y之间的关系是可靠的 如果不显著 则不能用回归方程表示X与Y之间的关系 残差的正态性 对比直方图和正态曲线的相似性 是否是中间高 两头低 P P图的点是不是接近对角线 残差齐性 多元回归 偏回归系数 当其他变量不变时 xi每改变一个单位 所预测的y的平均变化量 受到自变量的单位影响 因此可以用标准化回归系数 标准化偏回归系数 可以用来比较哪个自变量是影响y的主要因素 哪个是次要因素 即哪个自变量对y的影响更多 多元回归方程 回归系数计算 标准化偏回归系数 假如有两个自变量 B1 r1y r2y r12 1 r212 B2 r2y r1y r12 1 r212 非标准化偏回归系数b1 B1 sy sx1 多元回归的样本量要求 多元回归模型的样本量要求根据经验 希望样本量在自变量数的20倍以上 比如 有5个自变量 则样本量应该在100以上 少于此数可能会出现检验效能不足的问题 多元线性回归的条件 同一元线性回归的条件 回归分析的5个步骤 回归分析的步骤 1 做出散点图 观察变量间的趋势 是否线性 这些图是用来观察是否是线性趋势 如果不是线性 可能考虑其他对变量进行预处理 或用曲线回归 注意 是否是曲线关系 或者强影响点造成的线性 或者极端值 2 考察数据的分布 进行必要的预处理 3 进行直线回归 选入变量进入计算 回归方程是否显著偏回归系数显著根据决定系数 校正决定系数判断拟合得好不好 决定最优方程 回归分析的步骤 4 残差分析 分析两方面 残差是否独立 用durbin watson进行分析 取值02 残差是否正态 采用残差图显示 勾选Histogram和Normalprobabilityplot就行 残差的方差齐性 以标准化预测值 ZPRED 为横轴 标准化残差 ZRESID 为纵轴做散点图 若散点随机分布 且绝大部分在2倍标准差以内 则最好 表明没有相关 如最左图最好 中间图随着x值 残差越来越大 最右图 残差非正态 回归分析的步骤 残差是否正态 画图来评价1 残差直方图 标准化残差为x轴 标准化残差频数为Y轴 与正态曲线比较 是否拟合 2 残差p p图 累积残差观测分布为x轴 期望分布为Y轴 如果符合的话数据会和理论的直线 对角线 重合 回归分析的步骤 5 根据散点图 对强影响点进行判断和对多重共线性进行判断 自变量之间不能有强相关 最后两幅图是有强影响点 需要判断是否数据出错 出错则删掉 回归分析的步骤 步骤同一元回归 补充步骤在statistic勾上Rsquarechange partandpartialcorrelation 半偏相关和偏相关 conlineraritydiagnostics 共线性判断 分层回归方法 Enter 强制进入Forward 前向选择法Backward 反向删除法Stepwise 逐步回归 最常用把需要控制的变量用这种方法强制enter法放入方程自由进入变量用forward backward和stepwise方法放入方程 Enter法 逐步回归法 可以得出更优的方程 决定系数的变化量 回归方程的显著性检验 保留的变量 因为回归系数和偏回归系数显著 删除的变量 因为标准化回归系数不显著 多重共线性判断 回归方程的显著性检验偏回归系数的显著性检验决定系数R2 校正决定系数R2复相关系数R 回归方程的解释能力 回归方程的解释能力 回归方程的显著性检验当显著时 便可以认为回归方程中至少有一个回归系数是显著的 但是并不一定多有的回归系数都是显著的 偏回归系数的显著性检验判断指定的某个自变量的回归系数是否显著 显著的话 代表与残差相比 该x变量对y的贡献是显著的 根据回归系数显著 偏回归系数显著 校正的决定系数判断最优方程 复相关系数R值域在 0 1 是因变量y与所有自变量之间的多元线性相关程度的度量 R值越接近于1 表明y与所有x之间的线性关系越密切 对强影响点的诊断和处理 同一元线性回归 多重共线性 conlineraritydiagn
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 3451-5:2025 EN Plastics - Determination of ash - Part 5: Poly(vinyl chloride)
- 【正版授权】 IEC 60950-21:2002 EN-D Information technology equipment - Safety - Part 21: Remote power feeding
- 【正版授权】 IEC 60364-7-712:2002 FR-D Electrical installations of buildings - Part 7-712: Requirements for special installations or locations - Solar photovoltaic (PV) power supply syst
- 【正版授权】 IEC 60228:2004 FR-D Conductors of insulated cables
- 骨伤科考试试题及答案
- 校园安全知识培训课件通讯稿
- 森林采伐考试题及答案
- 透析器反应试题及答案
- 就业帮扶面试题及答案
- 测字考试题及答案
- 唯奋斗最青春+课件-2026届跨入高三第一课主题班会
- 2025民办中学教师劳务合同模板
- 2025年事业单位考试贵州省毕节地区纳雍县《公共基础知识》考前冲刺试题含解析
- 高中喀斯特地貌说课课件
- 黄冈初一上数学试卷
- 2025年中国花盆人参行业市场发展前景及发展趋势与投资战略研究报告
- QGDW11337-2023输变电工程工程量清单计价规范
- 航天飞行器模型设计教学
- 边坡稳定性分析评价报告
- 记账实操-节能环保企业的全盘账务处理实例
- 居间合同协议书范本txt下载
评论
0/150
提交评论