第7章SAS回归分析.ppt_第1页
第7章SAS回归分析.ppt_第2页
第7章SAS回归分析.ppt_第3页
第7章SAS回归分析.ppt_第4页
第7章SAS回归分析.ppt_第5页
免费预览已结束,剩余24页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章回归分析 一元线性回归多元线性回归曲线回归非线性回归Logistic回归 一 一元线性回归 1 基本模型 一 一元线性回归 1 基本模型 一 一元线性回归 2 模型的检验 一 一元线性回归 2 模型的检验 一 一元线性回归 3 利用回归方程进行预测 一 一元线性回归 4 REG过程 REG过程是SAS系统中提供的用于一般线性回归的过程 通过此过程可以实现一元回归分析 包括模型的建立和检验等 REG过程中有很多的语句和选项 其中用于一元回归的基本语句格式为 PROCREGDATA 数据集名 MODEL因变量名 自变量名 PLOT纵轴变量名 横轴变量名 BY分组变量名 RUN 其中 PROC语句和MODEL语句是必须的 其他语句可以根据用户需要进行选用 一 一元线性回归 4 REG过程 语句说明 1 PROC语句规定开始运行REG过程并指定要分析的数据集名 2 MODEL语句用于规定回归模型中的因变量和自变量 MODEL语句中常用的选项有 CLB 规定计算参数估计值的置信区间 CLI 规定计算预测值的置信区间 CLM 规定计算因变量估计值 期望值 的置信区间 P 规定计算预测值 ALPHA 值 规定显著性水平 3 PLOT语句用于对两个变量绘制散点图 前一个变量为纵轴变量 后一个变量为横轴变量 符号选项用来指定散点图中表示点的符号 二 多元线性回归 1 基本模型 二 多元线性回归 2 模型的检验 二 多元线性回归 2 模型的检验 二 多元线性回归 2 模型的检验 二 多元线性回归 3 逐步回归 在实际问题中 影响因变量的因素可能很多 其中有些因素的影响显著 而有些因素的作用可以忽略 如何从大量的因素中挑出对因变量有显著影响的自变量来 这就涉及到变量的选择问题 逐步回归是在建立模型的过程中对变量进行逐个筛选的回归方法 其基本思想是 在建立回归模型时 逐个引入自变量 每次引入的变量都经过检验对因变量的影响是显著的 同时对已有的变量也进行检验 将不显著的变量剔除 这样最后得到的回归方程中 所有变量都是显著的 二 多元线性回归 3 逐步回归 二 多元线性回归 3 逐步回归 二 多元线性回归 4 回归诊断 回归诊断的主要任务是检验回归假设是否成立 回归模型的形式是否恰当 如何识别数据中的异常点等 回归诊断的基本方法包括残差分析和共线性诊断 以残差为纵坐标 因变量的预测值为横坐标绘制散点图 称为残差图 表现在残差图中 数据点应该对称地紧密分布在横轴附近 如果表现为其他异常的类型 则模型或数据存在各种异常的情况 共线性是指在建立的回归模型中出现几个自变量高度相关的情况 自变量间的这种线性关系会掩盖检验的显著性 造成模型的不稳定 并可能引起估计值的较大误差 共线性诊断就是要找出那些变量间存在共线性关系 然后采取相应的方法来消除这些影响 判断共线性的常用指标有方差膨胀因子 条件指数和方差比例等 二 多元线性回归 5 REG过程 REG过程具有强大的功能 可以实现多元回归分析 包括模型建立 模型检验 逐步回归和回归诊断等 REG过程的语句格式为 PROCREGDATA 数据集名 MODEL因变量名 自变量名列表 PLOT纵轴变量名 横轴变量名 RUN 其中 PROC语句和MODEL语句是必须的 其他语句可以根据用户需要进行选用 二 多元线性回归 5 REG过程 语句说明 1 PROC语句规定开始运行REG过程并指定要分析的数据集名 2 MODEL语句用于规定回归模型中的因变量和所有要考虑的自变量 选项 SELECTION 选项 规定逐步回归中所采用的变量筛选方法COLLIN 规定进行共线性分析VIF 规定计算方差膨胀因子 3 PLOT语句用于对两个变量绘制散点图 除了自变量和因变量外 PLOT语句还可以对一些重要统计量进行绘图以进行更深入的分析和回归诊断 当使用这些统计量作为绘图变量时 注意应该在表示统计量的关键字后加一个圆点 二 多元线性回归 6 GLM过程 GLM过程用来分析符合一般线性模型 GeneralLinearModeling 的数据 利用该过程也可以实现一元线性回归和多元线性回归 其语句格式为 PROCGLMDATA 数据集名 MODEL因变量名 自变量名列表 BY分组变量名 RUN 其中 PROC语句和MODEL语句是必须的 其他语句可以根据用户需要进行选用 三 曲线回归 1 可化为线性的曲线回归 由于曲线回归没有固定的模型和方法 因而很难进行处理和分析 但是对于一些基本的曲线模型 我们可以通过变换将它们转化为线性模型 继而利用线性回归的方法进行分析 三 曲线回归 2 REG过程 由于部分曲线回归可以转化为线性回归 所以利用REG过程就可以实现对转换后的线性模型的拟合 其中 REG过程的语句和选项与直接实现线性回归的情形完全相同 进行这类曲线回归的关键在于变量替换 这一步骤一般在数据步完成 根据变换形式建立新的变量 然后在过程步对新的变量建立线性回归模型 三 曲线回归 3 GLM过程 如果曲线回归的模型是多项式形式 则可以不进行变量替换 使用GLM过程来直接拟合模型 GLM过程实现多项式曲线回归的语句格式为 PROCGLMDATA 数据集名 MODEL因变量名 自变量效应列表 RUN GLM过程的语句说明和选项与线性回归的情形完全相同 其中自变量效应列表用于规定模型中自变量的形式 四 非线性回归 1 非线性模型 四 非线性回归 2 迭代法 在非线性回归中 通常用迭代法来实现对非线性模型参数的最小二乘估计 常用的迭代方法有 最速下降法 SteepestDescent 牛顿法 Newton 高斯 牛顿法 Gauss Newton Marquardt法 四 非线性回归 3 NLIN过程 NLIN过程是SAS系统中专门用于实现非线性回归的过程 由于非线性模型要比线性模型更难作出估计 因此对于某些模型 NLIN过程并不能保证进行成功的拟合 NLIN过程的语句格式为 PROCNLINDATA 数据集名 MODEL因变量名 表达式 PARAMETERS参数名 值 BOUNDS表达式 DER 参数名 表达式 DER 参数名 参数名 表达式RUN 其中PROC语句 MODEL语句和PARAMETERS语句是必须的 其他语句可根据用户以及模型的需要而进行选用 四 非线性回归 3 NLIN过程 语句说明 1 PROC语句用于规定运行NLIN过程 并制定要分析的数据集名 选项有 METHOD 选项 规定NLIN过程所使用的迭代方法 SMETHOD 选项 规定迭代过程中所使用的步长搜索方法 2 MODEL语句用于规定因变量和要拟合的模型表达式 3 PARAMETERS语句用于规定模型中的参数名 以及它们的初始值 4 BOUNDS语句用于限定参数估计的范围 5 DER语句用来规定对参数的一阶或二阶导数的表达式 五 Logistic回归 1 基本模型 LOGISTIC过程是SAS系统中专门用于实现Logistic回归的过程 LOGISTIC过程的语句格式为 PROCLOGISTICDATA 数据集名 MODEL因变量名 自变量名列表 FREQ频数变量名 BY分组变量名 RUN 其中 PROC语句和MODEL语句是必须的 其他语句可根据用户以及模型的需要而进行选用 五 Logistic回归 2 LOGISTIC过程 语句说明为 1 PROC语句用于规定运行LOGISTIC过程 并指定要分析的数据集名 2 MODEL语句用于规定Logistic回归模型中的因变量和自变量 其中 因变量可以是两值变量或多值有序变量 可以是数值型的也可以是字符型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论