




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 1 11 1 回归分析的基本思想及其初步应用 一 回归分析的基本思想及其初步应用 一 教学要求教学要求 通过典型案例的探究 进一步了解回归分析的基本思想 方法及初步应用 教学重点教学重点 了解线性回归模型与函数模型的差异 了解判断刻画模型拟合效果的方法 相关指数和残差分 析 教学难点教学难点 解释残差变量的含义 了解偏差平方和分解的思想 教学过程教学过程 一 复习准备一 复习准备 1 提问 名师出高徒 这句彦语的意思是什么 有名气的老师就一定能教出厉害的学生吗 这两者之间 是否有关 2 复习 函数关系是一种确定性关系 而相关关系是一种非确定性关系 回归分析是对具有相关关系的两 个变量进行统计分析的一种常用方法 其步骤 收集数据作散点图求回归直线方程利用方程进行 预报 二 讲授新课 二 讲授新课 1 教学例题 教学例题 例例 1 1 从某大学中随机选取 8 名女大学生 其身高和体重数据如下表所示 编 号 1 2 3 4 5 6 7 8 身高 cm165165 157 170 175 165 155 170 体重 kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程 并预报一名身高为 172cm 的女大学生的体重 分 析思路教师演示学生整理 第一步 作散点图第一步 作散点图第二步 求回归方程第二步 求回归方程第三步 代值计算第三步 代值计算 提问 身高为 172cm 的女大学生的体重一定是 60 316kg 吗 不一定 但一般可以认为她的体重在 60 316kg 左右 解释线性回归模型与一次函数的不同 事实上 观察上述散点图 我们可以发现女大学生的体重和身高之间的关系并不能用一次函数yx 来严格严格刻画 因为所有的样本点不共线 所以线性模型只能近似地刻画身高和体重的关系 在ybxa 数据表中身高为 165cm 的 3 名女大学生的体重分别为 48kg 57kg 和 61kg 如果能用一次函数来描述体重与 身高的关系 那么身高为 165cm 的 3 名女在学生的体重应相同 这就说明体重不仅受身高的影响还受其他 0 10 20 30 40 50 60 70 150155160165170175180 身高 cm 体重 kg 2 因素的影响 把这种影响的结果 即残差变量或随机变量 引入到线性函数模型中 得到线性回归模型e 其中残差变量中包含体重不能由身高的线性函数解释的所有部分 当残差变量恒等于 0 时 ybxae e 线性回归模型就变成一次函数模型 因此 一次函数模型是线性回归模型的特殊形式 线性回归模型是一一次函数模型是线性回归模型的特殊形式 线性回归模型是一 次函数模型的一般形式次函数模型的一般形式 2 相关系数相关系数 相关系数的绝对值越接近于 1 两个变量的线性相关关系越强 它们的散点图越接近一条直 线 这时用线性回归模型拟合这组数据就越好 此时建立的线性回归模型是有意义 3 小结 小结 求线性回归方程的步骤 线性回归模型与一次函数的不同 1 11 1 回归分析的基本思想及其初步应用 二 回归分析的基本思想及其初步应用 二 教学要求教学要求 通过典型案例的探究 进一步了解回归分析的基本思想 方法及初步应用 教学重点教学重点 了解评价回归效果的三个统计量 总偏差平方和 残差平方和 回归平方和 教学难点教学难点 了解评价回归效果的三个统计量 总偏差平方和 残差平方和 回归平方和 教学过程教学过程 一 复习准备一 复习准备 1 由例 1 知 预报变量 体重 的值受解释变量 身高 或随机误差的影响 2 为了刻画预报变量 体重 的变化在多大程度上与解释变量 身高 有关 在多大程度上与随机误差有 关 我们引入了评价回归效果的三个统计量 总偏差平方和 残差平方和 回归平方和 二 讲授新课 二 讲授新课 1 教学教学总偏差平方和 残差平方和 回归平方和总偏差平方和 残差平方和 回归平方和 1 1 总偏差平方和 总偏差平方和 所有单个样本值与样本均值差的平方和 即 2 1 n i i SSTyy 残差平方和 残差平方和 回归值与样本值差的平方和 即 A 2 1 n ii i SSEyy 回归平方和 回归平方和 相应回归值与样本均值差的平方和 即 A 2 1 n i i SSRyy 2 2 学习要领 学习要领 注意 的区别 i y A i yy 预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和 即 AA 222 111 nnn iiii iii yyyyyy 当总偏差平方和相对固定时 残差平方和越小 则回归平方和越大 此时模型的拟合效果越好 对于多个不同的模型 我们还可以引入相关指数来刻画回归的效果 它表示解释变 A 2 21 2 1 1 n ii i n i i yy R yy 3 量对预报变量变化的贡献率 的值越大 说明残差平方和越小 也就是说模型拟合的效果越好 2 R 2 教学例题 教学例题 例例 2 关于与有如下数据 xY x 2 4 5 6 8 y 30 40 60 50 70 为了对 两个变量进行统计分析 现有以下两种线性模型 试比较哪一xY 6 517 5yx 717yx 个模型拟合的效果更好 分析 分析 既可分别求出两种模型下的总偏差平方和 残差平方和 回归平方和 也可分别求出两种模型下的 相关指数 然后再进行比较 从而得出结论 答案答案 84 5 82 所以甲选用的模型拟 A 5 2 2 1 15 2 1 155 110 845 1000 ii i i i yy R yy 2 2 1R A 5 2 1 5 2 1 180 10 82 1000 ii i i i yy yy 合效果较好 3 小结 小结 分清总偏差平方和 残差平方和 回归平方和 初步了解如何评价两个不同模型拟合效果的好坏 1 11 1 回归分析的基本思想及其初步应用 三 回归分析的基本思想及其初步应用 三 教学要求教学要求 通过典型案例的探究 进一步了解回归分析的基本思想 方法及初步应用 教学重点教学重点 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型 了解在解决实际问题 的过程中寻找更好的模型的方法 教学难点教学难点 了解常用函数的图象特点 选择不同的模型建模 并通过比较相关指数对不同的模型进行比较 教学过程教学过程 一 复习准备一 复习准备 1 给出例例 3 3 一只红铃虫的产卵数和温度有关 现收集了 7 组观测数据列于下表中 试建立与之间yxyx 的回归方程 温度 xC 21 23 25 27 29 32 35 产卵数个 y 7 11 21 24 66 115 325 学生描述步骤 教师演示 2 讨论讨论 观察右图中的散点图 发现样本点并没有分布在某个带状区 域内 即两个变量不呈线性相关关系 所以不能直接用线性回归方程 来建立两个变量之间的关系 二 讲授新课 二 讲授新课 1 探究非线性回归方程的确定 探究非线性回归方程的确定 如果散点图中的点分布在一个直线状带形区域 可以选线性回归模型来建模 如果散点图中的点分布在 一个曲线状带形区域 就需选择非线性回归模型来建模 0 100 200 300 400 010203040 温度 产卵数 4 根据已有的函数知识 可以发现样本点分布在某一条指数函数曲线y 的周围 其中是待定的 2 C 1e x C 12 c c 参数 故可用指数函数模型来拟合这两个变量 在上式两边取对数 得 再令 则 而与间的关系如下 21 lnlnyc xc lnzy 21 lnzc xc zx X 21 23 25 27 29 32 35 z1 9462 3983 0453 1784 1904 7455 784 观察与的散点图 可以发现变换后样本点分布在一条直线的附近 因zx 此可以用线性回归方程来拟合 利用计算器算得 与间的线性回归方程为3 843 0 272ab zx 因此红铃虫的产卵数对温度的非线性回归方程为 0 2723 843zx 0 2723 843x ye 利用回归方程探究非线性回归问题 可按 作散点图建模确定方程 这三个步骤进行 其关键在于如何通过适当的变换 将非线性回归问题转化成线性回归问题 2 小结 小结 用回归方程探究非线性回归问题的方法 步骤 三 巩固练习 三 巩固练习 为了研究某种细菌随时间 x 变化 繁殖的个数 收集数据如下 天数 x 天 1 2 34 56 繁殖个数 y 个 6 12 25 49 95190 1 用天数作解释变量 繁殖个数作预报变量 作出这些数据的散点图 2 试求出预报变量对解释变量的回归方程 答案 答案 所求非线性回归方程为 0 691 112 y e x 1 11 1 回归分析的基本思想及其初步应用 四 回归分析的基本思想及其初步应用 四 教学要求教学要求 通过典型案例的探究 进一步了解回归分析的基本思想 方法及初步应用 教学重点教学重点 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型 了解在解决实际问题 的过程中寻找更好的模型的方法 了解可用残差分析的方法 比较两种模型的拟合效果 教学难点教学难点 了解常用函数的图象特点 选择不同的模型建模 并通过比较相关指数对不同的模型进行比较 教学过程教学过程 一 复习准备一 复习准备 1 提问 在例 3 中 观察散点图 我们选择用指数函数模型来拟合红铃虫的产卵数和温度间的关系 yx 还可用其它函数模型来拟合吗 2 讨论 能用二次函数模型来拟合上述两个变量 2 34 yc xc t 44152962572984110241225 y 711212466115325 0 1 2 3 4 5 6 7 010203040 x z 0 100 200 300 400 050010001500 t y 5 间的关系吗 令 则 此时与 间的关系如下 2 tx 34 yc tc yt 观察与 的散点图 可以发现样本点并不分布在一条直线的周围 因此不宜用线性回归方程来拟合它 即yt 不宜用二次曲线来拟合与之间的关系 小结 小结 也就是说 我们可以通过观察变换后的散 2 34 yc xc yx 点图来判断能否用此种模型来拟合 事实上 除了观察散点图以外 我们也可先求出函数模型 然后利用残 差分析的方法来比较模型的好坏 二 讲授新课 二 讲授新课 1 教学残差分析 教学残差分析 残差 残差 样本值与回归值的差叫残差 即 AA iii eyy 残差分析残差分析 通过残差来判断模型拟合的效果 判断原始数据中是否存在可疑数据 这方面的分析工作称 为残差分析 残差图 残差图 以残差为横坐标 以样本编号 或身高数据 或体重估计值等为横坐标 作出的图形称为残差 图 观察残差图 如果残差点比较均匀地落在水平的带状区域中 说明选用的模型比较合适 这样的带状区 域的宽度越窄 模型拟合精度越高 回归方程的预报精度越高 2 例例 3 中的残差分析 中的残差分析 计算两种模型下的残差 一般情况下 比较两个模型的残差比较困难 某些样本点上一个模型的残差的绝对值比另一个模型的小 而另一些样本点的情况则相反 故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果 残差残差 平方和越小的模型 拟合的效果越好平方和越小的模型 拟合的效果越好 由于两种模型下的残差平方和分别为 1450 673 和 15448 432 故选用指数函数模型的拟合效果远远优于选用 二次函数模型 当然 还可用相关指数相关指数刻画回归效果 3 小结 小结 残差分析的步骤 作用 1 21 2 独立性检验的基本思想及其初步应用 一 独立性检验的基本思想及其初步应用 一 教学要求教学要求 通过探究 吸烟是否与患肺癌有关系 引出独立性检验的问题 并借助样本数据的列联表 柱 形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高 让学生亲身体验独立性检验的 实施步骤与必要性 教学重点教学重点 理解独立性检验的基本思想及实施步骤 6 教学难点教学难点 了解独立性检验的基本思想 了解随机变量的含义 2 K 教学过程教学过程 一 复习准备一 复习准备 回归分析的方法 步骤 刻画模型拟合效果的方法 相关指数 残差分析 步骤 二 讲授新课 二 讲授新课 1 教学与列联表相关的概念 教学与列联表相关的概念 分类变量 变量的不同 值 表示个体所属的不同类别的变量称为分类变量 分类变量的取值一定是离 散的 而且不同的取值仅表示个体所属的类别 如性别变量 只取男 女两个值 商品的等级变量只取一 级 二级 三级 等等 分类变量的取值有时可用数字来表示 但这时的数字除了分类以外没有其他的含义 如用 0 表示 男 用 1 表示 女 列联表 分类变量的汇总统计表 频数表 一般我们只研究 每个分类变量只取两个值 这样的列联表称为 如吸烟与患22 肺癌的列联表 2 教学三维柱形图和二维条形图的概念 教学三维柱形图和二维条形图的概念 由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异 教师在课堂上用 教师在课堂上用 EXCELEXCEL 软件演示三软件演示三 维柱形图和二维条形图 引导学生观察这两类图形的特征 并分析由图形得出的结论 维柱形图和二维条形图 引导学生观察这两类图形的特征 并分析由图形得出的结论 3 独立性检验的基本思想 独立性检验的基本思想 独立性检验的必要性 为什么中能只凭列联表的数据和图形下结论 列联表中的数据是样本数据 它只是总体的代表 具有随机性 故需要用列联表检验的方法确认所得结论在多大程度上适用于总体 独立性检验的步骤 略 及原理 与反证法类似 反证法 假设检验 要证明结论 A 备择假设 H1 在 A 不成立的前提下进行推 理 在 H 不成立的条件下 即 H 成立的条件下进行推理 10 推出矛盾 意味着结论 A 成 立 推出有利于 H 成立的小概率事件 概率不超过的事件 发 1 生 意味着 H 成立的可能性 可能性为 1 很大 1 没有找到矛盾 不能对 A 下 任何结论 即反证法不成功 推出有利于 H 成立的小概率事件不发生 接受原假设 1 上例的解决步骤 第一步 提出假设检验问题 H 吸烟与患肺癌没有关系 H 吸烟与患肺癌有关系 0 1 不患肺癌患肺癌总计 不吸烟 7775 427817 吸 烟 2099 492148 总 计 9874 919965 7 第二步 选择检验的指标 它越小 原假设 H 吸烟与患肺癌没有 2 2 K n adbc ab cd ac bd 0 关系 成立的可能性越大 它越大 备择假设 H 吸烟与患肺癌有关系 成立的可能性越大 1 第三步 查表得出结论 P k2 k 0 500 400 250 150 100 050 0250 0100 0050 001 k0 4550 7081 3232 0722 7063 845 0246 6357 87910 83 1 21 2 独立性检验的基本思想及其初步应用 二 独立性检验的基本思想及其初步应用 二 教学要求教学要求 通过探究 吸烟是否与患肺癌有关系 引出独立性检验的问题 并借助样本数据的列联表 柱 形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高 让学生亲身体验独立性检验的 实施步骤与必要性 教学重点教学重点 理解独立性检验的基本思想及实施步骤 教学难点教学难点 了解独立性检验的基本思想 了解随机变量的含义 2 K 教学过程教学过程 教学过程教学过程 一 复习准备一 复习准备 独立性检验的基本步骤 思想 二 讲授新课 二 讲授新课 1 教学例教学例 1 例例 1 在某医院 因为患心脏病而住院的 665 名男性病人中 有 214 人秃顶 而另外 772 名不是因为患心脏 病而住院的男性病人中有 175 名秃顶 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系 你 所得的结论在什么范围内有效 第一步 第一步 教师引导学生作出列联表 并分析列联表 引导学生得出 秃顶与患心
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高端住宅小区物业管理合同签订与物业服务标准
- 精细定制事实婚姻离婚房产分割及赡养费支付协议范本
- 离婚财产分割协议书范本:股权、股票、投资收益分配
- 盐湖提锂技术2025年成本优化与产能扩张产业政策与市场环境适应性策略创新报告
- 2025设施租赁与安装协议
- 影视工业化制作流程2025年质量控制与影视行业标准化建设分析报告
- 2025年新能源汽车充电设施智能化对电动汽车充电服务市场拓展影响报告
- 2025建筑材料采购协议范本下载
- 2025年中国高速吹风机行业市场全景分析及前景机遇研判报告
- 智慧社区团购2025年运营管理与用户持续活跃度提升策略报告
- 【2025年】蚌埠市12345政务服务便民热线岗位招聘20名考试笔试试题(含答案)
- 同期线损培训课件
- 反诈知识竞赛试题及答案
- 钢筋加工棚租赁合同范本
- 眼整形课件教学课件
- 公司法务知识培训会课件
- 2025-2026学年秋季第一学期学校德育工作安排表
- 2025年全面质量管理知识竞赛题库及参考答案
- 医药行业KA经理工作汇报
- 浙教版2025-2026学年八年级上科学第1章 对环境的察觉 单元测试卷
- 纤维素基包装生物力学性能-洞察及研究
评论
0/150
提交评论