




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计案例 第三章 3 1回归分析的基本思想及其初步应用 第三章 通过典型案例的探究 了解回归分析的基本思想 方法及初步应用 体会统计方法的特点及应用的广泛性 提高对现代计算技术与统计的应用的认识 重点 线性回归模型及相关概念 用回归分析方法作出推断 难点 对线性回归模型 残差分析 相关性检验的理解和用相关指数检验模型的拟合效果 温故知新请回顾复习在必修3中学过的两个变量的线性相关 回归直线 回归直线方程的求法 回归直线方程 新知导学1 回归分析是处理两个变量之间 的一种统计方法 若两个变量之间具有线性相关关系 则称相应的回归分析为 相关关系 线性回归分析 相关系数r 当r 0时 表明两个变量 当r 0时 表明两个变量 r的绝对值越接近1 表明两个变量的线性相关性越 r的绝对值接近于0时 表明两个变量之间几乎不存在线性相关关系 通常当 r 大于 时 认为两个变量有很强的线性相关关系 正相关 负相关 强 0 75 线性回归分析 新知导学4 随机误差 1 随机误差的概念 当样本点散布在某一条直线的附近 而不是在一条直线上时 不能用一次函数y bx a来描述两个变量之间的关系 而是用线性回归模型 来表示 这里 称为解释变量 称为预报变量 称为随机误差 E e D e y bx a e x y e 0 2 2 随机误差及其产生的原因从散点图中我们可以看到 样本点散布在某一条直线附近 而不是在一条直线上 所以不能用一次函数y bx a来描述它们之间的关系 我们用下面的线性回归模型来表示 y bx a e 其中a b为模型的未知数 e称为随机误差 产生随机误差的主要原因有以下3个方面 用线性回归模型近似真实模型 真实模型是客观存在的 通常我们并不知道真实模型是什么 所引起的误差 可能存在非线性的函数能更好地描述y与x之间的关系 但是现在却用线性函数来表述这种关系 结果会产生误差 这种由模型近似所引起的误差包含在e中 忽略了某些因素的影响 影响变量y的因素不只变量x 可能还包括其他许多因素 例如在描述身高和体重关系的模型中 体重不仅受身高的影响 还会受遗传基因 饮食习惯 生长环境等其他因素的影响 它们的影响都体现在e中 观测误差 由于测量工具等原因 导致y的观测值产生误差 比如一个人的体重是确定的数 但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值 与真实值之间存在误差 这样的误差也包含在e中 残差 样本编号 7 残差分析 1 在研究两个变量间的关系时 首先要根据散点图来粗略判断它们是否线性相关 是否可以用线性回归模型来拟合数据 然后 通过残差 来判断模型拟合的效果 判断原始数据中是否存在可疑数据 这方面的分析工作称为残差分析 2 在残差图中 如果残差点比较均匀地落在 中 说明选用的模型比较合适 这样的带状区域的宽度越窄 说明模型拟合精度 回归方程的预报精度也 如果图中有某个样本点的残差比较大 需要确认在采集这个样本点的过程中是否有人为的错误 如果数据采集有错误 就予以纠正 然后再重新利用线性回归模型拟合数据 如果数据采集没有错误 则需要寻找其他的原因 水平的带状 区域 越高 越高 在线性回归模型中 R2表示解释变量对预报变量变化的 R2越接近于1 表示解释变量和预报变量的线性相关性越强 反之 R2越小 说明随机误差对预报变量的效应越大 R2的值越大 说明残差平方和越小 也就是说模型的拟合效果 即回归效果 越 在含有一个解释变量的线性模型中 R2恰好等于 的平方 贡献率 好 相关系数r 答案 C 2 为了考察两个变量x和y之间的线性相关性 甲 乙两位同学各自独立地做了100次和150次试验 并且利用线性回归方法 求得回归直线分别为l1和l2 已知两个人在试验中发现对变量x的观测数据的平均值都是s 对变量y的观测数据的平均值都是t 那么下列说法正确的是 A l1和l2有交点 s t B l1与l2相关 但交点不一定是 s t C l1与l2必定平行D l1与l2必定重合 答案 A 解析 由题意知 s t 是甲 乙两位同学所做试验的样本点的中心 而线性回归直线恒过样本点的中心 故选A 3 2014 天门市调研 下图是根据变量x y的观测数据 xi yi i 1 2 10 得到的散点图 由这些散点图可以判断变量x y具有相关关系的图是 A B C D 答案 D 解析 根据散点图中点的分布情况 可判断 中的变量x y具有相关的关系 答案 8 95 变量间的相关性检验 方法规律总结 变量间是否具有线性相关关系 可通过散点图或相关系数作出判断 散点图只是粗略作出判断 用相关系数能够较准确的判断相关的程度 现随机抽取了我校10名学生在入学考试中的数学成绩 x 与入学后的第一次考试数学成绩 y 数据如下表 请问 这10个学生的两次数学考虑成绩是否具有显著性的线性相关关系 求回归直线方程 1 作出散点图 你能从散点图中发现含碳量与冶炼时间的关系吗 2 求回归直线方程 3 预测当钢水含碳量为160时 应冶炼多长时间 解析 1 以x轴表示含碳量 y轴表示冶炼时间 可作散点图如图 从图中可以看出 各点散布在一条直线附近 即含碳量与冶炼时间线性相关 答案 B 线性回归分析 分析 y与x呈线性相关关系 用线性相关的公式分别计算 解析 1 由已知条件制成下表 4 按一定规则估计回归方程中的参数 如最小二乘法 5 得出结果后分析残差图是否有异常 个别数据对应残差过大 或残差呈现不随机的规律性等等 若存在异常 则检查数据是否有误 或模型是否合适等 再重新求得回归方程 6 用回归方程作出预报 2 比较拟合效果的基本步骤 1 对于给定的样本点 x1 y1 x2 y2 xn yn 分别选取两个拟合模型 求出相应的回归方程分别计算其相关指数R2 R2大的模型拟合效果更好 2 残差平方和越小 预报精确度越高 解析 1 散点图如下图所示 3 由表中数据可以看出残差点比较均匀地落在不超过0 15的狭窄的水平带状区域中 说明选用的线性回归模型的精度较高 由以上分析可知 弹簧长度与拉力成线性关系 由残差表中的数值可以看出第3个样本点的残差比较大 需要确认在采集这个数据的时候是否有人为的错误 如果有的话 需要纠正数据 重新建立回归模型 非线性回归问题 分析 作散点图 观察确定y与x的近似函数关系 作变量替换 列出新的对应值表求出对应的线性回归方程 再作变量替换得回归方程 解析 根据测得数据作出散点图 如图 根据已有的函数知识 可以发现样本点分布在某一条幂函数型曲线Q h 是待定的正常数 的周围 为此将Q h 两边取对数 得到lgQ lgh lg 令lgQ y lgh x 于是 式可化为y x lg 这样y就是x的线性函数了 可以利用线性回归模型来建立y和x之间的线性回归方程y bx a b lg a 了 方法规律总结 1 在建立经验公式时 选择合适的函数类型是十分重要的 通常是根据实验数据 画出散点图 从中观察其变化规律 并与已知函数的图象对比 看接近于什么函数 根据实践经验来决定选取公式的类型 所选的类型是否符合实际 还需要通过实践来检验 有时候还需要选择不同的模拟函数作比较 2 如果观察散点图 发现点的分布不呈条状分布 而是与某种曲线相近 这时可选择这条曲线对应的函数作为拟合函数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药品经营企业质量培训测试题及答案
- 解析卷北师大版9年级数学上册期末试题及完整答案详解(必刷)
- 押题宝典高校教师资格证之《高等教育法规》考试题库带答案详解(b卷)
- 基础强化人教版8年级数学下册《平行四边形》章节练习试题(详解)
- 推拿治疗学考试题库附参考答案详解(巩固)
- 2025年新能源项目承包经营权长期转让合同范本
- 2025二手房买卖合同范本:全流程服务保障
- 2025版现代商务空间租赁管理合同书
- 2025版国际劳务派遣与员工权益保护合同
- 2025年度水库渔业承包与生态旅游开发合作协议
- CJ/T 448-2014城镇燃气加臭装置
- 项目经理业绩合同范本
- 租房开午托园合同范本
- 水电维修外包合同范本
- T/CECS 10344-2023绿色装配式边坡防护面层
- 护理分层培训体系构建与应用
- 员工自付社保协议书
- 混改公司合同协议模板
- 儿童多种维生素课件
- GA/T 2159-2024法庭科学资金数据清洗规程
- 2025年职工职业技能竞赛(物业管理师)参考试题(附答案)
评论
0/150
提交评论