多重线性回归.ppt_第1页
多重线性回归.ppt_第2页
多重线性回归.ppt_第3页
多重线性回归.ppt_第4页
多重线性回归.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一 多重线性回归的知识回顾二 多重线性回归软件实现 主要内容 1 1多重回归分析的一般步骤 一 多重线性回归分析的知识回顾 1 确定回归方程中的解释变量和被解释变量2 确定回归模型3 建立回归方程4 对回归方程进行检验5 利用回归方程进行预测 1 2多重回归分析的数据格式 1 3多重线性回归的数学模型 回归常数 偏回归系数 1 4多重线性回归的应用条件 线性 独立 正态 齐性 1 5 1回归方程的显著性检验 检验被解释变量和所有解释变量全体之间线性关系是否显著 即用线性模型来描述它们之间的关系是否恰当 1 5多重回归方程的检验与评价 检验步骤 1 建立检验假设 确定检验水准 H0 各个偏回归系数同时为0 H1 各个偏回归系数不全为0 0 05 2 计算统计量 3 确定P值 作出推断结论 接受原假设即回归系数全为0 回归方程无效 接受备择假设 即回归系数不全为0 自变量与因变量的关系用线性关系表示有统计学意义 1 5 2回归系数的显著性检验 检验的是回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系 检验步骤 1 建立检验假设 确定检验水准 H0 某一回归系数为0 H1 某一回归系数不为0 0 05 2 计算t统计量 3 确定P值 作出推断结论 1 5 3残差分析 残差是指实际样本值与回归方程计算所得的预测值之差 如果回归方程能较好地反映被解释变量的特征和变化规律 那么残差序列应不包含明显的规律和趋势 残差分析主要任务 残差是否服从均值为0的正态分布 是否为方差齐性 残差序列是否独立 借助残差探测样本中的异常值 1 5 4回归方程的拟合优度检验 检验回归方程对样本数据的代表程度 计算的统计量称为复相关系数R或确定系数R2 复相关系数R衡量模型中所有自变量与因变量的线性相关程度 在心理研究中R 0 4即可 确定系数R2表示因变量的总变异中可由回归模型中自变量解释的部分所占的比例 R2越大越好 二 多重线性回归SPSS实现 例1有学者认为血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因 现测量30名怀疑患有动脉硬化的就诊患者的栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C 低密度脂蛋白中的胆固醇 高密度脂蛋白中的胆固醇含量 资料见data12 1 分别求出低 高密度脂蛋白中的胆固醇含量对栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C的回归方程 二 多重线性回归SPSS实现 2 1操作讲解 单击Analyze Regression Linear打开线性回归分析主对话框 选择分析 统计分析菜单 统计分析 统计表描述性统计分析均值比较和T检验一般线性模型相关分析回归分析聚类和判别分析数据降维 简化数据等级分析非参数检验多重反应分析 被解释变量 解释变量 解释变量筛选方法 对样本数据筛选 只对符合条件数据分析 加权最小二乘法回归分析 统计量 图形 保存 其它选项 选择一个变量作样本数据点的标志变量 该变量值将标在回归分析的输出图形中 定义不同的分析模块 统计量对话框 统计量对话框 统计量对话框 图形对话框 表示被解释变量标准化预测值标准化残差剔除残差调整预测值学生化残差学生化剔除残差 图形对话框 上一组坐标的变量名 绘制散点图 下一组坐标的变量名 直方图正态概率P P图 绘制标准化残差图 依次绘制因变量和各自变量残差的散点图 保存对话框 保存对话框 保存预测值选项 保存非标准化预测值保存标准化预测值保存调整的预测值保存预测值的均值标准误差 保存对话框 保存对话框 设置预测区间 条件均数的置信区间 个体y值的置信区间 设置置信度 保存对话框 设置残差选项 用于模型诊断 原始残差标准化残差采用t变换产生的残差 即学生化残差剔除残差 可发现可疑的强影响点 学生化剔除残差 保存对话框 设置诊断影响点的统计量选项 表示不考虑该观察值后回归系数的变化值 标准化的回归系数变化值 表示不考虑该观察值后预测值的变化值 表示标准化预测值的变化值 在多重回归中 表示不考虑该观察值后协方差矩阵与含该观察值协方差矩阵的比率 保存对话框 保存结果到新文件 默认在当前数据文件中生成新变量 新变量保存到新数据文件中 设置变量筛选标准和缺省值处理方法话框 解释变量进入或剔除回归方程的标准 表示以偏F统计量的理论概率 值为标准判定变量是否进入或剔除回归方程 表示若某一自变量的偏F统计量的概率值P小于0 05则该自变量进入回归方程 表示若某一自变量的偏F统计量的概率值P大于0 10则该自变量剔除回归方程 设置变量筛选标准和缺省值处理方法话框 回归方程中是否包含常数项 缺失值处理方式 凡是有缺失值的数据都不分析不分析进入模型变量有缺失值的记录用该变量的均数替代缺失值 自变量筛选方法选项 不做筛选自变量全部进入模型逐步法 由Options对话框设置筛选标准强制剔除法后退法前进法 例1有学者认为血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因 现测量30名怀疑患有动脉硬化的就诊患者的栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C 低密度脂蛋白中的胆固醇 高密度脂蛋白中的胆固醇含量 资料见data12 1 分别求出低 高密度脂蛋白中的胆固醇含量对栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C的回归方程 2 2实例操作讲解 2 2 1建立数据文件 2 2 2操作步骤 第一步 单击Analyze Regression Linear打开线性回归分析主对话框 选择分析 第二步 选择低密度脂蛋白中的胆固醇含量进入因变量框 选择栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C进入自变量框 第二步 选择低密度脂蛋白中的胆固醇含量进入因变量框 选择栽脂蛋白A 栽脂蛋白B 栽脂蛋白E 栽脂蛋白C进入自变量框 第三步 设置统计量对话框 选项如下图 单击确定返回 第三步 设置统计量对话框 选项如下图 单击确定返回 第四步 设置图形对话框 选项如下图 单击确定返回 初步操作完成 第四步 设置图形对话框 选项如下图 单击确定返回 初步操作完成 结果解释 结果解释 练1有学者认为血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因 现测量30名怀

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论