




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3 1回归分析的基本思想及其初步应用 第一课时 1 通过典型案例的探究 进一步了解回归分析的基本思想 方法及其初步应用 2 让学生经历数据处理的过程 培养他们对数据的直观感觉 体会统计方法的特点 认识统计方法的应用 通过使用转化后的数据 求相关指数 运用相关指数进行数据分析 处理的方法 3 从实际问题中发现已有知识的不足 激发好奇心 求知欲 通过寻求有效的数据处理方法 开拓学生的思路 培养学生的探索精神和转化能力 通过案例的分析使学生了解回归分析在实际生活中的应用 增强数学取之生活 用于生活的意识 提高学习兴趣 本节课通过必修3熟悉有例题回顾线性相关关系知识 通过实际问题中发现已有知识的不足 引出随机误差 残差 残差分析的概念 进而运用残差来进行数据分析 通过例题讲解掌握用残差分析判断线性回归模型的拟合效果 掌握建立回归模型的步骤 本节内容学生内容不易掌握 通过知识整理与比较引导学生进行区分 理解 通过对典型案例的探究 练习进行巩固了解回归分析的基本思想方法和初步应用 从某大学中随机选取8名女大学生 其身高和体重数据如下表所示 怎样根据一名女大学生的身高预报她的体重 并预报一名身高为172cm的女大学生的体重 根据必修32 3变量相关关系解决这个问题的方法 1 先判断是两个变量是否具有线性相关关系 1 作散点图 如图所示 见课本p82 图3 1 1 2 根据线性回归的系数公式 求回归直线方程 0 849x 85 712 3 由线性回归方程可以估计其位置值为 60 316 千克 左右 具有较好的线性相关关系 性质 回归直线一定过样本中心点 2 计算相关系数 这些点并不都在同一条直线上 上述直线并不能精确地反映x与y之间的关系 y的值不能完全由x确定 它们之间是统计相关关系 y的实际值与估计值之间存在着误差 因此 在统计学中设它们的线性回归模型为 其中a b为模型的未知参数 e为y与bx a之间的误差 称它为随机误差 它是随机变量 且 线性回归模型完整表达式为 x称为 变量 y称为 变量 解释 预报 线性回归模型中随机误差的主要来源 线性回归模型中的预报值与真实情况y引起的误差 观测与计算 用代替ba 产生的误差 省略了一些因素的影响 如生活习惯等 产生的误差 在线性回归模型中 e为用bx a的预报真实值y的随机误差 它是一个不可观测的量 那么应该怎样研究随机误差 称相应于点的残差 坐标纵轴为残差变量 横轴可以有不同的选择 若模型选择的正确 残差图中的点应该分布在以横轴为中心的带形区域 对于远离横轴的点 要特别注意 身高与体重残差图 残差的作用 1 通过残差表或残差图发现原始数据中的可疑数据 通过残差来判断模型拟合的效果这种分析工作称为残差分析 通过残差表或残差图判断模型拟合的效果是直观判断 如何精确判断模型拟合的效果 引入参数r2 来精确该画模型拟合效果 对于己获取的样本数据 在上式子中是定值 越小 即残差平方和越小 r2越大 说明模型拟合效果越好 引入例中参数r2计算得约为0 64说明女大学生体重差异有百分之六十四是由身高引起的 知识点线性回归分析1 对线性回归模型的三点说明 1 非确定性关系 线性回归模型y bx a e与确定性函数y bx a相比 它表示y与x之间是统计相关关系 非确定性关系 其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a b的工具 2 线性回归方程中 的意义是 以为基数 x每增加1个单位 y相应地平均增加个单位 3 线性回归模型中随机误差的主要来源 线性回归模型与真实情况引起的误差 观测与计算产生的误差 省略了一些因素的影响产生的误差 2 线性回归模型的模拟效果 1 残差图法 观察残差图 如果残差点比较均匀地落在水平的带状区域中 说明选用的模型比较合适 这样的带状区域的宽度越窄 说明模型拟合精度越高 回归方程的预报精度越高 2 残差的平方和法 一般情况下 比较两个模型的残差比较困难 某些样本点上一个模型的残差的绝对值比另一个模型的小 而另一些样本点的情况则相反 故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果 残差平方和越小的模型 拟合的效果越好 3 r2法 r2的值越大 说明残差平方和越小 也就是说模型拟合的效果越好 3 相关系数与r2 1 r2是相关系数的平方 其变化范围为 0 1 而相关系数的变化范围为 1 1 2 相关系数可较好地反映变量的相关性及正相关或负相关 而r2反映了回归模型拟合数据的效果 3 当 r 接近于1时说明两变量的相关性较强 当 r 接近于0时说明两变量的相关性较弱 而当r2接近于1时 说明线性回归方程的拟合效果较好 微思考 1 残差与我们平时说的误差是一回事儿吗 提示 这两个概念在某程度上具有很大的相似性 都是衡量不确定性的指标 二者的区别是 误差与测量有关 误差可以衡量测量的准确性 误差越大表示测量越不准确 残差与预测有关 残差大小可以衡量预测的准确性 残差越大表示预测越不准确 2 r2与原来学过的相关系数r有区别吗 提示 它们都是刻画两个变量之间的的相关关系的 区别是r2表示解释变量对预报变量变化的贡献率 其表达式为r2 1 相关系数r是检验两个变量相关性的强弱程度 其表达式为 建立回归模型的基本步骤 1 确定研究对象 明确哪个变量是解释变量 哪个变量是预报变量 2 画出确定好的解释变量和预报变量的散点图 观察它们之间的关系 如是否存在线性关系等 3 由经验确定回归方程的类型 如我们观察到数据呈线性关系 则选用线性回归方程 4 按一定规则 如最小二乘法 估计回归方程中的参数 5 得出结果后分析残差图是否有异常 如个别数据对应残差过大 或残差呈现不随机的规律性等 若存在异常 则检查数据是否有误 或模型是否合适等 为研究重量x 单位 克 对弹簧长度y 单位 厘米 的影响 对不同重量的6个物体进行测量 数据如下表所示 1 作出散点图并求线性回归方程 2 求出r2 3 进行残差分析 作残差分析时 一般从以下几个方面予以说明 1 散点图 2 相关指数 3 残差图中的异常点和样本点的带状分布区域的宽窄 解答 1 散点图如图 3 由残差表中的数值可以看出第3个样本点的残差比较大 需要确认在采集这个数据的时候是否有人为的错误 如果有的话 需要纠正数据 重新建立回归模型 由表中数据可以看出残差点比较均匀地落在不超过0 15的狭窄的水平带状区域中 说明选用的线性回归模型的精度较高 由以上分析可知 弹簧长度与拉力成线性关系 规律方法当资料点较少时 也可以利用残差表进行残差分析 注意计算数据要认真细心 残差分析要全面 1 判一判 正确的打 错误的打 1 残差平方和越小 线性回归方程拟合效果越好 2 在画两个变量的散点图时 预报变量在x轴上 解释变量在y轴上 3 r2越接近于1 线性回归方程的拟合效果越好 2 做一做 请把正确的答案写在横线上 1 从散点图上看 点散布在从左下角到右上角的区域内 两个变量的这种相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园重阳节特色主题策划方案
- 甲状腺手术护理常规课件
- 元宵节教学课件
- 《永远的丰碑》教学课件
- 用电安全知识培训课件新闻稿
- 用iPad进行课件编辑
- 2025年考研英语(一)阅读理解历2025年真题 深度解析与模拟试卷
- 2025年电气工程师考试试卷:电气工程设计规范应用专项训练
- 2025至2030中国糖尿病足溃疡的治疗行业项目调研及市场前景预测评估报告
- 2025至2030中国礼品行业发展分析及行业发展前景与战略报告
- 施工组织设计施工总体部署完整版
- TUPSW微机控制电力专用不间断电源(UPS)系统使用说明书
- 骨质疏松诊治与中医药
- LY/T 2383-2014结构用木材强度等级
- GB/T 528-2009硫化橡胶或热塑性橡胶拉伸应力应变性能的测定
- 中日关系历史
- GB/T 15171-1994软包装件密封性能试验方法
- 2023年江苏省中学生生物学竞赛(奥赛)初赛试题和答案
- 信息系统运维服务方案
- 化工试生产总结报告
- DB32-T 3129-2016适合机械化作业的单体钢架塑料大棚 技术规范-(高清现行)
评论
0/150
提交评论