




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,SPSS统计分析从基础到实践(第2版) 联系Email:,第6讲 回归分析,6.1 回归分析概述,回归分析的概念 回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程。,X与Y1,X与Y2相关系数相等 此时仅仅用相关系数描述它们的关系显然不够,回归分析分类 按照经验公式的函数类型:线性回归和非线性回归。 按自变量个数:一元回归和多元回归。 按自变量和因变量的类型:一般的回归分析、含有哑变量的回归分析、Logistic回归分析。,回归分析的一般步骤 对数据进行预处理,选择合适的变量进行回归分析。 做散点图,观察变量间的趋势,初步选取回归分析方法。 进行回归分析,拟合自变量与因变量之间的经验公式。 拟合完毕之后进行残差分析,检验模型是否恰当。 利用拟合结果进行预测控制。,6.2 线性回归Linear过程,一元线性回归,多元线性回归 注意:模型是否恰当,也需要进行假设检验。,回归分析的适用条件,多元回归分析的方法选择,注意: 变量的选择不是单纯的数学问题,一定要结合实际问题的背景来处理。一定要认识到统计和传统数学的不同。 传统数学是一门要求严密逻辑推理的学科。统计学作为一门从应用中发展起来的学科,一定不能脱离实际问题。否则,统计学也丧失了其存在的意义。,在十九世纪四、五十年代,苏格兰物理学家James D.Forbes,试图通过水的沸点来估计海拔高度。由于可以通过气压来估计海拔,他在阿尔卑斯山以及苏格兰收集了沸点及海拔的数据如表所示。现在通过线形回归拟合气压与沸点的关系。,执行【Analyze】/【Regression】/【Linear】命令,弹出【Linear】对话框,结果解读 模型拟合度检验,方差分析表,回归分析结果,残差统计量检验,雇员对其主管满意度的调查,结果解读 共线性检验,共线性检验指标,共线性检验结果,6.3曲线拟合,拟线性,是指变量之间的关系是非线性关系,但是可以通过一些特殊的变化使之线性化。 譬如,非线性方程线性化,曲线拟合就是研究两变量间拟线性关系的一种方法。 曲线拟合的基本步骤是首先选择一种常见的曲线模型及其数学表达式。然后对变量做变换使得曲线模型线性化,再利用已知数据,用最小二乘的方法来估计模型中的参数。 注意:利用曲线拟合的方法来估计两变量间的关系,必须选取恰当的曲线模型。模型的选取首先依赖于实际问题,同时也依赖于数据的特征。这一点可以通过作变量间的散点图来对两变量间的关系做一个预估计。在根据预估计结果选择恰当的统计模型。,曲线拟合的可选模型,已知有某次泥石流的各阵观测数据保存在如图所示的数据文件“nishiliu.sav”中,试拟合各阵泥石流泥面宽与泥深之间的关系。,执行【Analyze】/【Regression】/【Curve Estimation】命令,弹出【Curve Estimation】对话框,结果解读 模型拟合度以及方差分析表同线性回归类似 二次模型拟合系数如下,三类模型的拟合曲线,6.4二分类变量Logistic回归,在Logistic回归模型中,因变量是定性变量。 二分类变量的情况十分普遍。譬如 致癌因素的研究中,收集了若干人的健康记录,包括年龄、性别、抽烟史、日常饮食及家庭病史等变量的数据。因变量为一个人得了癌症(Y=1),还是没有得癌症(Y=0)。 在金融界,最关心的是企业的“健康”状况。自变量是公司的各项财务指标。而因变量即是公司的偿付能力(破产0,有偿付能力1)。,二分类变量Logistic回归简介, 注意 二分类变量Logistic回归其核心思想是对因变量二值取一的概率建模而不是直接预测其取值。 拟合二分类变量的Logistic回归模型的参数问题可通过Logistic变换转换为拟合线性模型的参数。,诊断发现运营不良的金融商业机构 下表列出了66家公司的一些运营的财务比率,其中33家在2年后破产,另外33家在同期保持偿付能力。用变量X1、X2、X3拟合一个Logistic回归模型。,执行【Analyze】/【Regression】/【Binary Logistic】命令,弹出【Logistic】对话框,结果解读,代入Logistic函数,即得到Y=1的概率值表达式,其它分类变量回归简介 因变量是多分类无序变量【Multinomial】过程 因变量是多分类有序变量【Ordinal】过程 自变量是分类变量,因变量是数值变量定义哑元变量,6.5 非线性回归Nonlinear过程,非线性回归简介 线性回归模型:回归参数是线性的,【Linear】过程。 内蕴线性(拟线性)回归模型:其回归参数不是线性的,但是可以通过转换变为线性的参数,【Curve Estimation】过程。 非线性回归模型:其回归参数不是线性的,也不能通过转换的方法将其变为线性的参数,【Nonlinear】过程。,棉花单株在不同时期的成铃数(Y)与初花后天数(X)存在非线性的关系,假设这一非线性关系可用Gompertz模型表示 。 某一棉花品种7月5日至9月3日每隔5天的单株成铃数观测值如表所示 试根据观测值拟合模型中的参数。,执行【Analyze】/【Regression】/【Nonlinear】命令,弹出如图所示的对话框。,结果解
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年曲靖师范学院辅导员考试真题
- 以业绩为导向的工作规划计划
- 2025届浙江省新昌县联考七下数学期末预测试题含解析
- 手术室流程优化与反思计划
- 2024年宁波市附海镇招聘工作人员笔试真题
- 2024年国务院国资委研究中心招聘笔试真题
- 软件更新管理测试题及答案分析
- 避开雷区2025年法学概论考试试题及答案
- 2025届吉林省延边七年级数学第二学期期末统考模拟试题含解析
- 客户端与服务器设计考察试题及答案
- 2024年四川西华师范大学招聘辅导员笔试真题
- 2025年河南省洛阳市中考数学一模试卷
- 2025年武汉铁路局集团招聘(180人)笔试参考题库附带答案详解
- 信息安全管理员-初级工练习题(附答案)
- 深圳学位锁定合同协议
- 2025全国不动产登记代理人《不动产登记代理实务》考试真题(附完整解析)
- 农产品供应链应急保障措施
- 食品原料报废管理制度
- 2025年高级政工师理论考试题库(浓缩500题)
- 乡村振兴学习课件
- 2025年施工现场质量员继续教育考试题库(继续教育)含答案
评论
0/150
提交评论