高中数学 3.1 回归分析的基本思想及其初步应用复习课件 新人教A版选修23.ppt_第1页
高中数学 3.1 回归分析的基本思想及其初步应用复习课件 新人教A版选修23.ppt_第2页
高中数学 3.1 回归分析的基本思想及其初步应用复习课件 新人教A版选修23.ppt_第3页
高中数学 3.1 回归分析的基本思想及其初步应用复习课件 新人教A版选修23.ppt_第4页
高中数学 3.1 回归分析的基本思想及其初步应用复习课件 新人教A版选修23.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3 1回归分析的基本思想及其初步应用 1 通过典型案例的探究 进一步了解回归分析的基本思想 方法及初步应用 2 了解线性回归模型与函数模型的差异 了解判断模型拟合效果的方法 相关指数和残差分析 3 体会有些非线性模型通过变换可以转化为线性回归模型 了解在解决实际问题的过程中寻找更好的模型的方法 1 本节的重点是刻画模型拟合效果的方法 相关指数和残差分析 2 本节的难点是求回归直线方程 会用所学的知识对实际问题进行回归分析 1 线性回归模型 1 回归方程的相关计算假设已经得到两个具有线性相关关系的变量的一组数据 x1 y1 x2 y2 xn yn 设所求回归方程为y bx a 其中a b是待定参数 由最小二乘法得 其中 分别是a b的估计值 2 线性回归模型 线性回归模型 e e 为均值 d e 为方差 其中a b为未知参数 通常e为随机变量 称为 x称为 变量 y称为 变量 随机误差 解释 预报 2 线性回归分析 1 残差对于样本点 xi yi i 1 2 n 的随机误差的估计值称为相应于点 xi yi 的残差 称为残差平方和 2 残差图利用图形来分析残差特性 作图时纵坐标为 横坐标可以选为 也可用其他测量值 这样作出的图称为残差图 3 r2越接近于 表示回归效果越好 残差 样本编号 1 1 有什么区别 提示 yi是样本点 xi yi 的纵坐标 是样本点的中心 的纵坐标 由可知是yi的估计值 其中 是a和b的估计值 2 如图是x和y的一组样本数据的散点图 去掉一组数据 后 剩下的4组数据的相关指数最大 解析 由图可知 去掉d 3 10 这一组数据后 其他4组数据对应的点都集中在某一条直线附近 即两变量的线性相关性最强 此时相关指数最大 答案 d 3 10 3 若一组观测值 x1 y1 x2 y2 xn yn 之间满足yi bxi a ei i 1 2 n 若ei恒为0 则r2为 解析 ei恒为0 说明随机误差对yi贡献为0 答案 1 1 建立回归模型的步骤 1 确定研究对象 明确哪个变量是解释变量 哪个变量是预报变量 2 画散点图 画出确定好的解释变量和预报变量的散点图 观察它们之间的关系 如是否存在线性关系等 3 模型选择 由经验确定回归方程的类型 如我们观察到数据呈线性关系 则选用线性回归方程y bx a 4 求回归方程 按一定规则估计回归方程中的参数 如最小二乘法 5 残差分析 得出结果后分析残差图是否有异常 如个别数据对应残差过大 残差呈现不随机的规律性等 若存在异常 则检查数据是否有误或模型是否合适等 2 残差变量e的主要来源 1 用线性回归模型近似替代真实模型 真实模型是客观存在的 通常我们并不知道真实模型到底是什么 所引起的误差 可能存在非线性的函数能够更好地描述y与x之间的关系 但是现在却用线性函数来表述这种关系 结果就会产生误差 这种由于模型近似所引起的误差包含在e中 2 忽略了某些因素的影响 影响变量y的因素不只变量x一个 可能还包含其他许多因素 例如在描述身高和体重关系的模型中 体重不仅受身高的影响 还会受遗传基因 饮食习惯 生长环境等其他因素的影响 但通常它们每一个因素的影响可能都是比较小的 它们的影响都体现在e中 3 观测误差 由于测量工具等原因 得到的y的观测值一般是有误差的 比如一个人的体重是确定的数 不同的秤可能会得到不同的观测值 它们与真实值之间存在误差 这样的误差也包含在e中 上面三项误差越小 说明我们的回归模型的拟合效果越好 求线性回归方程 技法点拨 求线性回归方程的三个步骤 1 画散点图 由样本点是否呈条状分布来判断两个量是否具有线性相关关系 2 求回归系数 若存在线性相关关系 则求回归系数 3 写方程 写出回归直线方程 并利用回归直线方程进行预测说明 典例训练 1 2011 山东高考 某产品的广告费用x与销售额y的统计数据如下表 根据上表可得回归方程中的为9 4 据此模型预报广告费用为6万元时销售额为 a 63 6万元 b 65 5万元 c 67 7万元 d 72 0万元 2 某地最近十年粮食需求量逐年上升 下表是部分统计数据 1 利用所给数据求年需求量与年份之间的回归直线方程 2 利用 1 中所求出的直线方程预测该地2012年的粮食需求量 解析 1 选b 由表可计算因为点 42 在回归直线上 且 9 4 所以解得 9 1 故回归直线方程为 9 4x 9 1 令x 6得 65 5 选b 2 1 由所给数据看出 年需求量与年份之间是近似直线上升 下面来求回归直线方程 先将数据预处理如下 由预处理后的数据 容易算得 由上述计算结果 知所求回归直线方程为即 2 利用所求得的直线方程 可预测2012年的粮食需求量为6 5 2012 2006 260 2 6 5 6 260 2 299 2 万吨 300 万吨 想一想 在题1 2中 通过线性回归方程求出的函数值一定是真实值吗 在题2中对数据处理的好处在哪里 提示 1 不一定是真实值 例如 人的体重与身高存在一定的线性关系 但体重除了受身高的影响外 还受其他因素的影响 如饮食情况 是否喜欢运动等 2 在题2中对数据处理的好处是使运算简便 出错率较小 变式训练 某产品广告费支出x 单位 万元 与销售额y 单位 万元 具有相关关系 且它们之间有如下的对应数据 求出回归直线方程 并估计当广告费为10万元时 销售额约为多少 解析 所以回归直线方程为 6 5x 17 5 当广告费支出为10万元时 收入约为 线性回归分析 技法点拨 刻画回归效果的三个方式 1 残差图法 残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适 2 残差平方和法 残差平方和越小 模型的拟合效果越好 3 相关指数法 越接近1 表明回归的效果越好 典例训练 1 甲 乙 丙 丁4位同学各自对a b两变量进行回归分析 分别得到散点图与残差平方和如下表 哪位同学的试验结果体现拟合a b两变量关系的模型拟合精度高 a 甲 b 乙 c 丙 d 丁 2 假设关于某设备的使用年限x和所支出的维修费用y 万元 有如下的统计资料 若由资料知 y对x呈现线性相关关系 试求 1 线性回归方程中的的值 2 残差平方和 3 相关指数r2 4 估计使用年限为10年时 维修费用是多少 解析 1 选d 根据线性相关的知识 散点图中各样本点条状分布越均匀 同时保持残差平方和越小 对于已经获取的样本数据 r2的表达式中为确定的数 则残差平方和越小 r2越大 由回归分析建立的线性回归模型的拟合效果越好 由试验结果知丁要好些 故选d 2 y对x呈线性相关关系 转化为一元线性相关的方法 根据公式分别计算 1 由已知数据制成下表 于是有 2 残差平方和为 0 34 2 0 032 0 52 0 272 0 46 2 0 651 3 4 回归方程 1 23x 0 08 当x 10时 1 23 10 0 08 12 38 万元 即估计使用10年时 维修费用是12 38万元 互动探究 试解释题2 3 中相关指数r2的含义 解析 由题意可知相关指数r2 0 9587 其含义为 该设备的维修费用的多少有95 87 是由使用年限引起的 思考 两变量的相关指数r2 1说明什么 计算残差平方和的关键是什么 提示 1 两变量的相关指数r2 1说明两变量间是函数关系 2 计算残差平方和的关键是求 即求线性回归方程 变式训练 在一段时间内 某种商品的价格x 元 和需求量y 件 之间的一组数据如下表所示 求出y对x的回归直线方程 并说明拟合效果的好坏 解析 7 4 1 15 18 28 1 从而所求的回归直线方程为 1 15x 28 1 列出残差表为 因为r2 0 994 因而拟合效果比较好 非线性回归问题 技法点拨 非线性回归问题的处理方法 1 指数函数型y ebx a 函数y ebx a的图象 处理方法 两边取对数得lny lnebx a 即lny bx a 令z lny 把原始数据 x y 转化为 x z 再根据线性回归模型的方法求出a b 2 对数函数型y blnx a 函数y blnx a的图象 处理方法 设x lnx 原方程可化为y bx a 再根据线性回归模型的方法求出a b 3 y bx2 a型处理方法 设x x2 原方程可化为y bx a 再根据线性回归模型的方法求出a b 典例训练 1 在研究两个变量的相关关系时 观察散点图发现样本点集中于某一条指数曲线y ebx a的周围 令 lny 求得回归直线方程为 0 25x 2 58 则该模型的回归方程为 2 某企业技术改造的投入和销售额的数据如下 1 画出散点图 2 试建立销售额y与技改投入资金x之间的回归方程 解析 1 0 25x 2 58 lny y e0 25x 2 58 答案 y e0 25x 2 58 2 1 根据题设条件 作出散点图如下 2 直线模型由表中所给出的数据 利用最小二乘法 得回归直线方程为 2 5575x 0 3675 其残差平方和为 对数函数模型建立对数函数模型 所得的回归方程为 7 242lnx 0 7374 其残差平方和为 指数函数模型回归方程为 3 1013e0 2967x 其残差平方和为 二次函数模型回归方程为 3 918 0 396x2 其残差平方和为由于残差平方和越小 说明拟合效果越好 由此可得回归方程应为 3 1013e0 2967x 3 1013 1 3454x 思考 散点图的作用是什么 题2是如何判断模型拟合效果的优劣的 提示 1 散点图的作用在于发现变量间是否存在相关关系 只有在散点图大致呈线性时 求出的回归直线方程才有实际意义 否则 求出的回归直线方程毫无意义 当散点图大致不呈线性时 常利用其他函数模型进行拟合 2 题2利用 残差平方和越小 其拟合效果越好 来判断回归模型的拟合效果的优劣 变式训练 电容器充电后 电压达到100v 然后开始放电 由经验知道 此后电压u随时间t变化的规律公式u aebt b 0 表示 观测得时间t s 时的电压u v 如下表所示 试求电压u对时间t的回归方程 解题指南 由于两个变量不呈线性相关关系 所以不能直接利用线性回归方程来建立两个变量之间的关系 我们可通过对数变换把指数关系变为线性关系 通过线性回归模型来建立u与t之间的非线性回归方程 解析 对u aebt两边取自然对数得lnu lna bt 令y lnu a lna 即y bt a 由所给数据可得其散点图为 由散点图可知y与t具有线性相关关系 可用来表示 经计算得 0 3t 4 6 即lnu 0 3t 4 6 所以 u e 0 3t 4 6 规范解答 有关线性回归模型的应用问题 典例 12分 在一段时间内 某种商品价格x 万元 和需求量y t 之间的一组数据为 1 画出散点图 2 求出y对x的回归直线方程 并在 1 的散点图中画出它的图象 3 若价格定为1 9万元 预测需求量大约是多少 精确到0 01t 解题指导 规范解答 1 2分 2 采用列表的方法计算与回归系数 6分 7分 7 4 11 5 1 8 28 1 8分y对x的回归直线方程为 10分 3 当x 1 9时 y 28 1 11 5 1 9 6 25t 所以价格定为1 9万元 需求量大约是6 25t 12分 阅卷人点拨 通过阅卷后分析 对解答本题的失分警示和解题启示总结如下 注 此处的 见规范解答过程 规范训练 12分 为了研究三月下旬的平均气温 x 与四月二十号前棉花害虫化蛹高峰日 y 的关系 某地区观察了2007年至2012年的情况 得到下面的数据 据气象预测 该地区在2013年三月下旬平均气温为27 试估计2013年四月化蛹高峰日为哪天 解题设问 求解本题的关键点是什么 求平均气温 x 与棉 花害虫化蛹高峰日 y 的线性回归方程 规范答题 6分 8分 回归直线方程 2 2x 71 6 10分当x 27时 2 2 27 71 6 12 2 据此 可估计该地区2013年4月12日或13日为化蛹高峰日 12分 1 在画两个变量的散点图时 下面哪个叙述是正确的 a 预报变量在x轴上 解释变量在y轴上 b 解释变量在x轴上 预报变量在y轴上 c 可以选择两个变量中任意一个变量在x轴上 d 可以选择两个变量中任意一个变量在y轴上 解析 选b 通常把自变量x称为解释变量 因变量y称为预报变量 2 在回归分析中 残差图中纵坐标为 a 残差 b 样本编号 c x d en 解析 选a 结合残差图的画法可知a正确 3 对于指数曲线y aebx 令u lny c lna 经过非线性化回归分析后 可转化的形式为 a u c bx b u b cx c y c bx d y b cx 解析 选a y aebx lny lna bx u c bx 4 在研究身高与体重的关系时 求得相关指数r2 可以叙述为 身高解释了69 的体重变化 而随机误差贡献了剩余 解析 由相关指数的含义可知 身高解释了69 的体重变化 即相关指数r2 0 69 随机误差贡献了剩余的31 答案 0 6931 5 在利用线性回归模型进行预报时 有以下说法 样本数据是来自哪个总体 预报时也仅适用于这个总体 线性回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论