回归分析的基本思想及其初步应用PPT.ppt_第1页
回归分析的基本思想及其初步应用PPT.ppt_第2页
回归分析的基本思想及其初步应用PPT.ppt_第3页
回归分析的基本思想及其初步应用PPT.ppt_第4页
回归分析的基本思想及其初步应用PPT.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 1回归分析的基本思想及其初步应用 课标要求 1 了解随机误差 残差 残差分析的概念 2 会用残差分析判断线性回归模型的拟合效果 3 掌握建立回归模型的步骤 4 通过对典型案例的探究 了解回归分析的基本思想方法和初步应用 核心扫描 1 利用散点图分析两个变量是否存在相关关系 求线性回归方程 重点 2 回归模型的选择 特别是非线性回归模型 难点 易错点 自学导引1 回归分析回归分析是对具有的两个变量进行统计分析的一种常用方法 2 线性回归模型 1 由散点图易发现 样本点散布在某一条直线附近 而不是一条直线上 不能用一次函数y bx a描述它们之间的关系 因此用线性回归模型y bx a e来表示 其中a b为未知参数 e为 相关关系 随机误差 3 解释变量和预报变量线性回归模型与一次函数模型的不同之处是增加了随机误差项e 因变量y由和共同确定 即自变量x只解释部分y的变化 在统计中 我们也把自变量x称为解释变量 因变量y称为预报变量 自变量x 随机误差e 试一试 下表是x和y之间的一组数据 则y关于x的线性回归方程必过 A 点 2 3 B 点 1 5 4 C 点 2 5 4 D 点 2 5 5 3 刻画回归效果的方式 残差 样本编号 身高数据 体重估计值 越小 解释 预报 想一想 回归分析中 利用线性回归方程求出的函数值一定是真实值吗 为什么 提示不一定是真实值 利用线性回归方程求的值 在很多时候是个预报值 例如 人的体重与身高存在一定的线性关系 但体重除了受身高的影响外 还受其他因素的影响 如饮食 是否喜欢运动等 4 非线性回归分析 1 非线性相关关系 样本点分布在某一条曲线的周围 而不是一条直线附近 我们就称这两个变量之间不具有线性相关关系而是非线性相关关系 2 非线性回归方程线性化 y axn 其中a x y均为正值 幂函数型函数 lgy lga nlgx 令u lgy v lgx b lga 则u nv b 图象为一直线 y cax a 0 c 0 指数型函数 lgy xlga lgc 令u lgy b lgc d lga 则u dx b 图象为一直线 2 线性回归分析 1 由线性回归方程给出的是一个预报值而非精确值 2 随机误差的主要来源 线性回归模型与真实情况引起的误差 省略了一些因素的影响产生的误差 观测与计算产生的误差 3 残差分析是回归分析的一种方法 4 用相关指数R2来刻画回归效果 R2越大 意味着残差平方和越小 即模型的拟合效果越好 R2越小 残差平方和越大 即模型的拟合效果越差 1 确定研究对象 明确哪个变量是解释变量 哪个变量是预报变量 2 画出确定好的解释变量和预报变量的散点图 观察它们之间的关系 如是否存在线性关系等 3 由经验确定回归方程的类型 如我们观察到数据呈线性关系 则选用线性回归方程 4 按一定规则 如最小二乘法 估计回归方程中的参数 5 得出结果后分析残差图是否有异常 如个别数据对应残差过大或残差呈现不随机的规律性等 若存在异常 则检查数据是否有误 或模型是否合适等 3 建立回归模型的基本步骤 题型一求线性回归方程 例1 某班5名学生的数学和物理成绩如下表 1 画出散点图 2 求物理成绩y对数学成绩x的回归直线方程 3 一名学生的数学成绩是96 试预测他的物理成绩 思路探索 先利用散点图分析物理成绩与数学成绩是否线性相关 若相关再利用线性回归模型求解 规律方法 1 散点图是定义在具有相关关系的两个变量基础上的 对于性质不明确的两组数据 可先作散点图 在图上看它们有无关系 关系的密切程度 然后再进行相关回归分析 2 求回归直线方程 首先应注意到 只有在散点图大致呈线性时 求出的回归直线方程才有实际意义 否则 求出的回归直线方程毫无意义 变式1 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据 1 画出数据对应的散点图 2 求线性回归方程 并在散点图中加上回归直线 3 据 2 的结果估计当房屋面积为150m2时的销售价格 题型二线性回归分析 例2 为研究重量x 单位 克 对弹簧长度y 单位 厘米 的影响 对不同重量的6个物体进行测量 数据如下表所示 1 作出散点图并求线性回归方程 2 求出R2 3 进行残差分析 思路探索 作残差分析时 一般从以下几个方面予以说明 1 散点图 2 相关指数 3 残差图中的异常点和样本点的带状分布区域的宽窄 2 列表如下 3 由残差表中的数值可以看出第3个样本点的残差比较大 需要确认在采集这个数据的时候是否有人为的错误 如果有的话 需要纠正数据 重新建立回归模型 由表中数据可以看出残差点比较均匀地落在不超过0 15的狭窄的水平带状区域中 说明选用的线性回归模型的精度较高 由以上分析可知 弹簧长度与拉力成线性关系 规律方法当资料点较少时 也可以利用残差表进行残差分析 注意计算数据要认真细心 残差分析要全面 变式2 已知某种商品的价格x 元 与需求量y 件 之间的关系有如下一组数据 求y对x的回归直线方程 并说明回归模型拟合效果的好坏 题型三非线性回归分析 例3 下表为收集到的一组数据 1 作出x与y的散点图 并猜测x与y之间的关系 2 建立x与y的关系 预报回归模型并计算残差 3 利用所得模型 预报x 40时y的值 1 画出散点图或进行相关性检验 确定两变量x y是否线性相关 由散点图得x y之间的回归模型 2 进行拟合 预报回归模型 求回归方程 规范解答 1 作出散点图如下图 从散点图可以看出x与y不具有线性相关关系 根据已有知识可以发现样本点分布在某一条指数函数曲线y c1ec2x的周围 其中c1 c2为待定的参数 4分 2 对两边取对数把指数关系变为线性关系 令z lny 则有变换后的样本点应分布在直线z bx a a lnc1 b c2的周围 这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了 数据可以转化为 求得回归直线方程为 0 272x 3 849 e0 272x 3 849 8分 残差 题后反思 解决非线性回归问题的方法及步骤 1 确定变量 确定解释变量为x 预报变量为y 2 画散点图 通过观察散点图并与学过的函数 幂 指数 对数函数 二次函数 作比较 选取拟合效果好的函数模型 3 变量置换 通过变量置换把非线性问题转化为线性回归问题 4 分析拟合效果 通过计算相关指数等来判断拟合效果 5 写出非线性回归方程 变式3 为了研究某种细菌随时间x变化时 繁殖个数y的变化 收集数据如下 1 用天数x作解释变量 繁殖个数y作预报变量 作出这些数据的散点图 2 描述解释变量x与预报变量y之间的关系 3 计算相关指数 解 1 所作散点图如图所示 2 由散点图看出样本点分布在一条指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论