高三理科数学回归分析的基本思想及初步应用.ppt_第1页
高三理科数学回归分析的基本思想及初步应用.ppt_第2页
高三理科数学回归分析的基本思想及初步应用.ppt_第3页
高三理科数学回归分析的基本思想及初步应用.ppt_第4页
高三理科数学回归分析的基本思想及初步应用.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计案例 第三 四课时 3 1回归分析的基本思想及其初步应用 问题提出 1 随机误差是什么概念 对具有线性相关关系的两个变量x y 可以用线性回归模型y bx a e来表示 其中a b为模型的未知参数 e是y与之间的随机误差 2 残差与随机误差的方差的估计值分别如何计算 3 残差分析是统计学中的一个基础内容 根据残差图和随机误差的方差 可以反映回归模型拟合的精度或回归方程的预报精度 此外 还有其它统计指标也能反映这种精度吗 对于不具有线性相关关系的随机变量 如何建立相应的回归方程 也是需要解决的问题 相关指数与非线性回归方程 探究 一 相关指数 思考1 称为相关指数 在线性回归模型中 可以证明相关指数恰好等于相关系数的平方 即R2 r2 那么R2的取值范围是什么 0 1 思考2 相关指数与残差平方和有什么关系 相关指数的大小变化与回归模型的拟合精度有何内在联系 R2取值越大 残差平方和越小 模型拟合的精度越高 思考3 在线性回归模型中 R2表示解释变量对于预报变量变化的贡献率 它能说明解释变量对预报变量产生影响的百分比 对前面给出的女大学生身高与体重的样本数据 计算得R2 0 64 这表明什么内涵 女大学生的体重差异有64 是由身高引起的 思考4 建立回归模型的基本步骤是什么 1 确定研究对象 明确解释变量和预报变量 2 画出散点图 观察两个变量之间的关系 3 由经验确定回归方程的类型 4 按一定规则估计回归方程中的参数 5 分析残差图是否有异常 并作适当处理 思考5 利用回归模型进行预报时需要注意些什么问题 1 回归方程只适用于所研究的样本的总体 2 所得回归方程一般都有时间性 3 样本取值的范围会影响回归方程的取值范围 4 由回归方程得到的预报值是预报变量的可能取值的平均值 探究 二 非线性回归方程 思考1 作这组样本数据的散点图 变量x y是否呈线性相关关系 呈非线性相关关系 思考2 从散点图来看 可认为这些样本点大致分布在一条指数函数曲线的周围 那么这个指数函数的解析式可设为哪种形式 思考3 如何将函数转化为一次线性函数 两边取自然对数 可将函数变换为z bx a的形式 思考5 由计算可得这组样本数据的线性回归方程为 0 272x 3 849 退回原变量 红铃虫的产卵数y对温度x非线性回归方程是什么 z 0 272x 3 849 思考6 对原样本数据的散点图 也可认为这些样本点大致分布在一条二次函数曲线的周围 那么这个二次函数的解析式可设为哪种形式 思考7 如何将函数转化为一次线性函数 令t x2 可将函数变换为y c3t c4 这组样本数据不具有线性相关关系 即不宜用二次曲线来拟合y和x之间的关系 思考9 由上述样本数据也可以得到y关于t的线性回归方程 0 367t 202 543 退回原变量 红铃虫的产卵数y对温度x非线性回归方程是什么 100 50 0 50 100 150 200 250 300 350 0 200 400 600 800 1000 1200 1400 0 367t 202 543 思考10 我们可以通过残差来比较指数回归方程和二次回归方程的拟合程度 计算得两个模型的残差如下表 比较这些残差的大小可以说明什么问题 指数模型残差的绝对值小 其拟合效果比二次模型好 思考11 计算得 指数模型的残差平方和为 1550 538 相关指数R2 0 98 二次模型的残差平方和为 15448 431 相关指数R2 0 8 这些数据说明什么问题 指数模型的拟合效果比二次模型好 思考12 一般地 对于给定的样本点 x1 y1 x2 y2 xn yn 两个含有未知参数的模型和 如何比较它们的拟合效果 建立对应于两个模型的回归方程 计算两个回归方程的残差平方和 比较残差平方和的大小 残差平方和小所对应的回归方程的拟合效果好 理论迁移 例1993年到2002年中国的国内生产总值 GDP 的数据 单位 亿元 如下 1 作GDP和年份的散点图 根据该图猜想它们之间的关系应是什么 2 建立年份为解释变量GDP为预报变量的回归模型 并计算残差 3 根据你得到的模型 预报2003年的GDP 看看你的预报与实际的GDP 117251 9亿元 的误差是多少 4 你认为这个模型能较好地刻画GDP和年份的关系吗 请说明理由 GDP与年份近似地呈线性关系 2003年GDP预报值为112976 4 预报与实际相差 4275 5 相关指数R2 0 974 说明年份能够解释97 4 的GDP值变化 所建模型能很好地刻画GDP和年份的关系 小结作业 1 若散点图中的样本点分布在一个直线状带形区域内 则可以选用线性回归模型建模 2 若散点图中的样本点分布在一个曲线状带形区域内 表明样本数据呈非线性相关关系 可以根据散点图分布选择指数函数 对数函数 幂函数 二次函数 三角函数等回归模型 再通过变换转化为线性回归模型求回归直线方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论