人教A版选修23 3.1回归分析的基本思想及其初步应用 课件(79张).ppt_第1页
人教A版选修23 3.1回归分析的基本思想及其初步应用 课件(79张).ppt_第2页
人教A版选修23 3.1回归分析的基本思想及其初步应用 课件(79张).ppt_第3页
人教A版选修23 3.1回归分析的基本思想及其初步应用 课件(79张).ppt_第4页
人教A版选修23 3.1回归分析的基本思想及其初步应用 课件(79张).ppt_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 统计案例 3 1回归分析的基本思想及其初步应用 自主预习学案 2015年4月25日尼泊尔发生了8 1级地震 此次地震系本世纪陆地第5次八级大地震 余震频繁而且震级还高 仅7级以上余震就发生了2次 你知道地震的震级与地震次数之间有什么关系吗 相关关系 线性回归分析 相关系数r 当r 0时 表明两个变量 当r 0时 表明两个变量 r的绝对值越接近1 表明两个变量的线性相关性越 r的绝对值接近于0时 表明两个变量之间几乎不存在线性相关关系 通常当 r 大于 时 认为两个变量有很强的线性相关关系 负相关 强 0 75 正相关 二 线性回归分析1 随机误差 1 随机误差的概念 当样本点散布在某一条直线的附近 而不是在一条直线上时 不能用一次函数y bx a来描述两个变量之间的关系 而是用线性回归模型 来表示 这里 称为解释变量 称为预报变量 称为随机误差 e e d e 2 随机误差及其产生的原因从散点图中我们可以看到 样本点散布在某一条直线附近 而不是在一条直线上 所以不能用一次函数y bx a来描述它们之间的关系 我们用下面的线性回归模型来表示 y bx a e 其中a b为模型的未知数 e称为随机误差 产生随机误差的主要原因有以下3个方面 y bx a e x y e 0 2 用线性回归模型近似真实模型 真实模型是客观存在的 通常我们并不知道真实模型是什么 所引起的误差 可能存在非线性的函数能更好地描述y与x之间的关系 但是现在却用线性函数来表述这种关系 结果会产生误差 这种由模型近似所引起的误差包含在e中 忽略了某些因素的影响 影响变量y的因素不只变量x 可能还包括其他许多因素 例如在描述身高和体重关系的模型中 体重不仅受身高的影响 还会受遗传基因 饮食习惯 生长环境等其他因素的影响 它们的影响都体现在e中 观测误差 由于测量工具等原因 导致y的观测值产生误差 比如一个人的体重是确定的数 但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值 与真实值之间存在误差 这样的误差也包含在e中 残差 样本编号 贡献率 好 相关系数r 1 在对两个变量x y进行线性回归分析时 有下列步骤 对所求出的回归直线方程作出解释 收集数据 xi yi i 1 2 n 求线性回归方程 求相关系数 根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量x y具有线性相关的结论 则在下列操作顺序中正确的是 a b c d d 解析 对两个变量进行回归分析时 首先收集数据 xi yi i 1 2 n 根据所搜集的数据绘制散点图 观察散点图的形状 判断线性相关关系的强弱 求相关系数 写出线性回归方程 最后依据所求出的回归直线方程作出解释 故正确顺序是 故选d b d 4 为了考察两个变量x和y之间的线性相关性 甲 乙两位同学各自独立地做了100次和150次试验 并且利用线性回归方法 求得回归直线分别为l1和l2 已知两个人在试验中发现对变量x的观测数据的平均值都是s 对变量y的观测数据的平均值都是t 那么下列说法正确的是 a l1和l2有交点 s t b l1与l2相关 但交点不一定是 s t c l1与l2必定平行d l1与l2必定重合 解析 由题意知 s t 是甲 乙两位同学所做试验的样本点的中心 而线性回归直线恒过样本点的中心 故选a a 5 下图是根据变量x y的观测数据 xi yi i 1 2 10 得到的散点图 由这些散点图可以判断变量x y具有相关关系的图是 a b c d 解析 根据散点图中点的分布情况 可判断 中的变量x y具有相关的关系 d 互动探究学案 命题方向1 变量间的相关性检测 典例1 规律总结 变量间是否具有线性相关关系 可通过散点图或相关系数作出判断 散点图只是粗略作出判断 用相关系数能够较准确的判断相关的程度 命题方向2 求线性回归方程 典例2 规律总结 1 散点图是定义在具有相关关系的两个变量基础上的 对于性质不明确的两组数据 可先作散点图 从图中看它们有无关系 关系的密切程度 再进行相关的回归分析 2 求回归直线方程 首先应注意到 只有在散点图大致呈线性时 求出的回归直线方程才有实际意义 否则 求出的回归直线方程毫无意义 解析 1 散点图如图所示 从图中可以看出这些点大致分布在一条直线附近 因此两个变量线性相关 命题方向3 线性回归分析 典例3 解析 1 作出该运动员训练次数 x 与成绩 y 的散点图 如图所示 由散点图可知 它们之间具有相关关系 2 残差图也是用来刻画回归效果的 判断依据是 残差点比较均匀地分布在水平带状区域中 带状区域越窄 说明模型拟合精度越高 回归方程预报精度越高 命题方向4 非线性回归问题 典例4 思路分析 作散点图 观察确定y与x的近似函数关系 作变量替换 列出新的对应值表求出对应的线性回归方程 再作变量替换得回归方程 解析 根据测得数据作出散点图 如图 根据已有的函数知识 可以发现样本点分布在某一条幂函数型曲线q h 是待定的正常数 的周围 为此将q h 两边取对数 得到lgq lgh lg 令lgq y lgh x 于是 式可化为y x lg 这样y就是x的线性函数了 可以利用线性回归模型来建立y和x之间的线性回归方程y bx a b lg a 了 规律总结 1 在建立经验公式时 选择合适的函数类型是十分重要的 通常是根据实验数据 画出散点图 从中观察其变化规律 并与已知函数的图象对比 看接近于什么函数 根据实践经验来决定选取公式的类型 所选的类型是否符合实际 还需要通过实践来检验 有时候还需要选择不同的模拟函数作比较 2 如果观察散点图 发现点的分布不呈条状分布 而是与某种曲线相近 这时可选择这条曲线对应的函数作为拟合函数 作恰当变换 转化为线性函数 用线性回归模型求解 跟踪练习4 以模型y cekx去拟合一组数据时 为了求出回归方程 设z lny 其变换后得到线性回归方程z 0 3x 4 则c 解析 y cekx 两边取对数 可得lny ln cekx lnc lnekx lnc kx 令z lny 可得z lnc kx z 0 3x 4 lnc 4 c e4 故答案为e4 e4 利用线性回归方程可以进行预报 线性回归方程将部分观测值所反映的规律进行延伸 是我们对有线性相关关系的两个变量进行分析和控制的依据 利用线性回归方程进行预报变量的估计 规律方法 典例5 c 解析 1 散点图如图所示 可以看出x和y具有线性相关关系 必须在两变量线性相关的条件下 才能用最小二乘法求回归直线方程 典例6 辨析 此题解法是错误的 原因是这两个变量之间不是线性相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论