高考数学一轮复习 10.4 回归分析与独立性检验课件 文 新人教A版.ppt_第1页
高考数学一轮复习 10.4 回归分析与独立性检验课件 文 新人教A版.ppt_第2页
高考数学一轮复习 10.4 回归分析与独立性检验课件 文 新人教A版.ppt_第3页
高考数学一轮复习 10.4 回归分析与独立性检验课件 文 新人教A版.ppt_第4页
高考数学一轮复习 10.4 回归分析与独立性检验课件 文 新人教A版.ppt_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10 4回归分析与独立性检验 一 变量间的相关关系 常见的两变量之间的关系有两类 一类是函数关系 另一类是相关关系 与函数关系不同 相关关系是一种非确定性关系 二 两个变量的线性相关 1 从散点图上看 如果这些点从整体上看大致分布在一条直线附近 称这两个变量之间具有线性相关关系 这条直线叫做回归直线 2 从散点图上看 点分布在从左下角到右上角的区域内 两个变量的这种相关关系称为正相关 点分布在左上角到右下角的区域内 两个变量的相关关系称为负相关 3 回归直线方程为y bx a 其中b a b 其中 xi yi 点 称为样本点的中心 三 相关系数 相关系数r 当r 0时 表示两个变量正相关 当r 0时 表示两个变量负相关 r的绝对值越接近1 表示两个变量的线性相关性越强 r的绝对值越接近0 表示两个变量之间几乎不存在线性关系 四 独立性检验设a b为两个变量 每个变量都可以取两个值 变量a a1 a2 变量b b1 b2 2 在统计中 用以下结果对变量的独立性进行判断 1 当 2 2 706时 没有充分的证据判定变量a b有关联 可以认为变量a b是没有关联的 2 当 2 2 706时 有90 的把握判定变量a b有关联 3 当 2 3 841时 有95 的把握判定变量a b有关联 4 当 2 6 635时 有99 的把握判定变量a b有关联 1 设有回归直线方程y 2 1 5x 当变量x增加1个单位时 a y平均增加1 5个单位 b y平均增加2个单位 c y平均减少1 5个单位 d y平均减少2个单位 1 5x 1 5 y 1 5 答案 c 解析 设变量x增加1个单位后y变为y 则y 2 1 5 x 1 2 2 实验测得四组 x y 的值为 1 2 2 3 3 4 4 5 则y与x间的回归直线方程为 a y x 1 b y x 2 c y 2x 1 d y x 1 解析 因回归直线方程过点 而 1 2 2 3 3 4 4 5 的样本中心点 为 代入选项可知只有a符合 答案 a 3 若由一个2 2列联表中的数据计算得 2 4 013 那么有多大的把握认为两个变量有关系 a 85 b 90 c 95 d 99 解析 2 4 013 3 841 故有95 的把握认为两个变量有关系 答案 c 题型1对相关概念和思想的考查 例1 1 对变量x y有观测数据 xi yi i 1 2 10 得散点图1 对变量u v有观测数据 ui vi i 1 2 10 得散点图2 由这两个散点图可以判断 a 变量x与y正相关 u与v正相关 b 变量x与y正相关 u与v负相关 c 变量x与y负相关 u与v正相关 d 变量x与y负相关 u与v负相关 2 对分类变量x与y的随机变量 2的值 下列说法正确的是 b 2越小 x与y有关系 可信度越小 c 2越接近于0 x与y无关 程度越小 d 2越大 x与y无关 程度越大 分析 对比概念及相关公式可知 a 2越大 x与y有关系 可信度越小 越小 故选b 答案 1 c 2 b 点评 要透彻理解一些常见参数或概念的意义 像 相关系数 2 等 解析 1 由这两个散点图可以判断 变量x与y负相关 u与v正相关 选c 2 2越小 x与y无关 程度越大 x与y有关系 可信度 变式训练1 1 有一组样本数据 x1 y1 x2 y2 xn yn 得到直线方程y bx x 那么下列说法不正确的是 a y bx a中a b b 直线y bx a至少经过点 x1 y1 x2 y2 xn yn 中的一个点 c 直线y bx a的斜率为b d 直线y bx a和各点 x1 y1 x2 y2 xn yn 的偏差 yi bxi a 2是该坐标平面上所有的直线与这些点的偏差中最小的直线 2 如果 2的观测值为7 012 那么可以认为 x和y无关 的可信度为 a 95 b 5 c 99 d 1 2 2 7 012 6 635 有99 的把握认为 x和y有关联 故选d 答案 1 b 2 d 解析 1 注意用最小二乘法求出的直线y bx a是与各点的总体偏差最小的直线 而不一定过其中的样本点 题型2回归直线分析 例2假设关于某设备使用年限x和所支出的维修费用y 万元 有如下的统计资料 试求 1 线性回归方程y bx a的回归系数a b 2 估计使用年限为10年时 维修费用是多少 分析 求回归直线方程的计算量较大 需要细心 谨慎地计算 可以通过列表 计算出xiyi 后将这些量代入公式计算 若有资料知y对x呈线性相关关系 解析 1 制表如下 于是b 1 23 a b 5 1 23 4 0 08 2 回归直线方程为y 1 23x 0 08 当x 10年时 y 1 23 10 0 08 12 3 0 08 12 38 万元 即估计使用10年时 维修费用是12 38万元 点评 本题若没有告诉我们y与x线性相关 应首先进行相关性检验 如果本身两个变量不具备线性相关关系 或者说它们之间相关关系不显著时 即使求出回归方程也是没有意义 的 而且其估计与预测也是不可靠的 变式训练2某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究 他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数 得到如下资料 该农科所确定的研究方案是 先从这5组数据中选取2组 用剩下的3组数据求线性回归方程 再对被选取的2组数据进行检验 1 若选取的是12月1日与12月5日的2组数据 请根据12月2日至12月4日的数据 求出y关于x的线性回归方程y bx a 2 若由线性回归方程得到的估计数据与所选出的检验数据差的绝对值均不超过2颗 则认为得到的线性回归方程是可 靠的 试问 1 中所得的线性回归方程是否可靠 解析 1 由数据求得 12 27 由公式求得 b a b 3 y关于x的线性回归方程为y x 3 2 当x 10时 y 10 3 22 22 23 2 当x 8时 y 8 3 17 17 16 2 所以该研究所得到的线性回归方程是可靠的 例3为了比较注射a b两种药物后产生的皮肤疱疹的面积 选200只家兔做试验 将这200只家兔随机地分成两组 每组100只 其中一组注射药物a 另一组注射药物b 下表1和表2分别是注射药物a和b后的试验结果 疱疹面积单位 mm2 题型3独立性检验 表1 注射药物a后皮肤疱疹面积的频数分布表 表2 注射药物b后皮肤疱疹面积的频数分布表 1 完成下面频率分布直方图 并比较注射两种药物后疱疹面积的中位数大小 射药物a后的疱疹面积与注射药物b后疱疹面积有差异 表3 2 完成下面2 2列联表 并回答能否有99 的把握认为 注 附 2 分析 第 1 问画频率分布直方图时 应该首先计算出相应的频率 要注意其纵轴为频率与组距的比值 在频率分布直方图中 中位数将小矩形的面积分为相等的两部分 据此可以估计中位数所在的范围 第 2 问可以根据给出的频数分布表得到2 2列联表 然后利用给定的公式和对应表来确定其可信程度 解析 1 在频率分布直方图中 中位数两边对应的小长方形的面积相等 都等于0 5 可以看出注射药物a后的疱疹面积的中位数在65至70之间 而注射药物b后的疱疹面积的中位数在70至75之间 所以注射药物a后疱疹面积的中位数小于注射药物b后疱疹面积的中位数 2 表3 2 24 56 由于 2 6 635 所以有99 的把握认为 注射药物a后的疱疹面积与注射药物b后的疱疹面积有差异 点评 本题将频率分布表 频率分布直方图 2 2列联表 利用 2进行独立性检验等知识有机地结合在一起 是一道关于统计的综合性题目 但题目难度不大 符合新课标对于本部分的要求 是一道不可多得的好题 希望同学们仔细品味 通过 本题将相关知识掌握好 变式训练32011年3月 日本发生了9 0级地震 地震引发了海啸及核泄漏 某国际组织用分层抽样的方法从心理专家 核专家 地质专家三类专家中抽取若干人组成研究团队赴日本工作 有关数据见表1 单位 人 核专家为了检测当地动物受核辐射后对身体健康的影响 随机选取了110只羊进行了检测 并将有关数据整理为不完整的2 2列联表 表2 表1 表2 参考公式 2 1 求被抽取的研究团队的总人数 2 写出表2中a b c d e的值 并判断有多大的把握认为羊受到高度辐射与身体不健康有关 3 若从研究团队的心理专家和核专家中随机选2人撰写研究报告 求其中恰好有1人为心理专家的概率 解析 1 依题意 y 4 x 2 故研究小组的总人数为2 4 6 12 人 2 根据列联表特点得a 20 b 50 c 80 d 30 e 110 可求得 2 7 486 6 635 由此可知 有99 的把握认为羊受到高度辐射与身体不健康有关 3 设研究小组中心理专家为a1 a2 核专家为b1 b2 b3 b4 从中随机选择2人 不同的选取结果有a1a2 a1b1 a1b2 a1b3 a1b4 a2b1 a2b2 a2b3 b2b4 b1b2 b1b3 b1b4 b2b3 b2b4 b3b4 共15种 其中恰有1人为心理专家的结果有a1b1 a1b2 a1b3 a1b4 a2b1 a2b2 a2b3 a2b4 共8种 所以恰好有1人为心理专家的概率为p 1 设x y是具有相关关系的两个变量 且相应于n组观测值的n个点若大致分布在一条直线附近 那么在整体上与这几个点最接近的一条直线就是回归直线 3 回归分析是数理统计中最常用的统计方法 它研究的是一个变量与另一个变量之间的相关关系 2 求回归直线方程时 应先对数据进行线性相关分析 只有变量y与x之间具有线性相关关系 求回归直线方程才有实际意义 具体求法是直接套用有关公式 但由于计算量很大 一般要借助科学计算器才能完成 复习时重在理解其原理 例在研究吸烟与患肺癌的关系中 通过收集数据 整理分析数据得 吸烟与患肺癌有关 的结论 并且有99 以上的把握认为这个结论是成立的 下列说法正确的是 a 100个吸烟者中至少有99人患有肺癌 b 1个人吸烟 那么这个人有99 的概率患有肺癌 c 在100个吸烟者中一定有患肺癌的人 d 在100个吸烟者中可能一个患肺癌的人也没有 错解 a 剖析 吸烟与患肺癌有关 是一种统计关系 这种关系是指 吸烟的人患肺癌的可能性的风险更大 而不是说 吸烟的人一定患肺癌 正解 99 仅是指 吸烟与患肺癌有关 可信程度 但也有 在100个吸烟者中一个患肺癌的人也没有 的可能 选d 答案 d 一 选择题 本大题共5小题 每小题6分 1 基础再现 废品率x 和每吨生铁成本y 元 之间的回归直线方程为y 256 2x 表明 a 废品率每增加1 生铁成本增加258元 b 废品率每增加1 生铁成本增加0 02元 c 废品率每增加1 生铁成本增加2元 d 废品率不变 生铁成本为256元 解析 当废品率为1 时 y 256 2 258 元 当废品率为2 时 y 256 2 2 260 元 所以成本增加2元 答案 c 2 基础再现 为研究变量x和y的线性相关性 甲 乙二人分别做了研究 利用线性回归方法得到回归直线方程l1和l2 两人计算知x相同 y也相同 则l1与l2的关系为 a 重合 b 平行 c 相交于点 d 无法判断 解析 两人在计算中都用了计算公式a b 因此两条直线相交于点 答案 c 3 视角拓展 在吸烟与患肺病这两个分类变量的计算中 下列说法正确的是 若 2的观测值满足 2 6 635 我们有99 的把握认为吸烟与患肺病有关系 那么在100个吸烟的人中必有99人患有肺病 从独立性检验可知有99 的把握认为吸烟与患肺病有关系时 我们说某人吸烟 那么他有99 的可能患有肺病 从统计量中得知有95 的把握认为吸烟与患肺病有关系 是指有5 的可能性使得推断出现错误 a b c d 解析 推断在100个吸烟的人中必有99人患有肺病 说法错误 排除a b 不正确 正确 答案 c 4 视角拓展 已知数组 x1 y1 x2 y2 x10 y10 满足线性回归方程y bx a 则 x0 y0 满足线性回归方程y bx a 是 x0 y0 的 a 充分不必要条件 b 必要不充分条件 c 充要条件 d 既不充分也不必要条件 解析 x0 y0为这10组数据的平均值 因为根据公式计算线性回归方程y bx a的b以后 再根据a b 为样本平均值 求得a 因此 一定满足线性回归方程 但满足线性回归方程的除了 外 可能还有其他样本点 答案 b 5 能力综合 变量x和y具有线性相关关系 当x取16 14 13 10时 观测得到y的值分别为11 9 8 5 若在实际问题中 y最大值为10 则x的最大值不能超过 a 16 b 17 c 12 d 15 解析 易得y x 5 由y 10得x 5 10 即x 15 答案 d 6 基础再现 已知回归方程y 4 4x 838 19 则可估计x与y的增长速度之比约为 解析 x每增长1个单位 y增长4 4个单位 故增长的速度之比约为1 4 4 5 22 事实上所求的比值为回归直线方程斜率的倒数 答案 5 22 二 填空题 本大题共4小题 每小题7分 7 基础再现 在进行对某小学的学生吃零食的调查中 得到下表数据 解析 2 3 689 答案 3 689 根据上述数据分析 我们得出随机变量 2 8 基础再现 对四对变量y与x进行相关性检验 已知n是观测值的组数 r是相关系数 且已知 1 n 7 r 0 9533 2 n 15 r 0 3012 3 n 17 r 0 4991 4 n 3 r 0 9950 则变量y与x的线性关系很强的是 解析 统计学中常用相关系数r来衡量两个变量之间线性关系的强弱 r 1 r 越接近于1 则y与x的线性关系越强 答案 1 4 9 视角拓展 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系 下表记录了小李某月1号到5号每天打篮球时间x 单位 小时 与当天投篮命中率y之间的关系 小李这5天的平均投篮命中率为 用线性回归分析的方法 预测小李该月6号打6小时篮球的投篮命中率为 解析 3 0 5 b 0 01 a b 0 5 0 01 3 0 47 故回归方程为y 0 01x 0 47 当x 6时 y 0 53 答案 0 50 53 10 基础再现 已知x y之间的一组数据如下表 对于表中数据 甲 乙两同学给出的拟合直线分别为y x 1与y x 试利用最小二乘法判断哪条直线拟合程度更好 三 解答题 本大题共3小题 每小题14分 1 2 2 2 2 3 3 2 4 2 5 2 用y x 作为拟合直线时 所得y值与y的实际值的差的平方和为 1 1 2 2 2 2 3 2 4 4 2 5 2 由于 故用直线y x 拟合程度更好 解析 用y x 1作为拟合直线时 所得y值与y的实际值的差的平方和为 11 高度提升 2010年某市全面启动老旧楼房保暖节能改造的 暖房子工程 准备用3年的时间从根本上解决群众的冬季取暖问题 下面记录了某县居民住宅实施改造后 每日的用煤量x 百吨 标准煤 与相应居

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论