高考数学 9.4 变量间的相关关系与统计案例课件.ppt_第1页
高考数学 9.4 变量间的相关关系与统计案例课件.ppt_第2页
高考数学 9.4 变量间的相关关系与统计案例课件.ppt_第3页
高考数学 9.4 变量间的相关关系与统计案例课件.ppt_第4页
高考数学 9.4 变量间的相关关系与统计案例课件.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节变量间的相关关系与统计案例 知识梳理 1 必会知识教材回扣填一填 1 回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法 判断相关性的常用统计图是 统计量有 取值范围 1 1 相关指数等 散点图 相关系数 2 线性回归方程两个具有线性相关关系的变量的一组数据 x1 y1 x2 y2 xn yn 其回归方程为其中 是回归方程的 是在y轴上的截距 斜率 3 独立性检验 2 2列联表 假设有两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称2 2列联表 为 a b b d k2统计量 k2 其中n a b c d为样本容量 2 必备结论教材提炼记一记 1 从散点图看相关性 正相关 样本点分布在从 的区域内 负相关 样本点分布在从 的区域内 左下角到右上角 左上角到右下角 2 从相关系数看相关性 当r 0时 表明两个变量正相关 当r0 75时具有较强的相关性 越弱 越强 3 从相关指数看相关性 r2的值越大 说明残差平方和越小 也就是说模型的拟合效果越好 在线性回归模型中 r2表示解释变量对于预报变量变化的贡献率 r2越接近于1 表示回归的效果越好 3 必用技法核心总结看一看统计思想的应用 结论都是估计结果 不是精确结果 小题快练 1 思考辨析静心思考判一判 1 相关关系的两个变量是非确定关系 2 散点图中的点越集中 两个变量的线性相关性越强 3 对于分类变量x与y 它们的随机变量k2的观测值越小 x与y有关联 的把握程度越大 解析 1 正确 相关关系不是确定关系 2 错误 散点图上的点大致分布在通过散点图中心的那条直线附近 整体上呈线性分布时 两个变量相关关系越强 3 错误 k2越大 x与y有关联 的把握程度越大 答案 1 2 3 2 教材改编链接教材练一练 1 选修2 3p81例1改编 若8名学生的身高和体重数据如下表 第3名学生的体重漏填 但线性回归方程是 0 849x 85 712 则第3名学生的体重估计为 解析 设第3名学生的体重为a 根据样本点的中心一定在回归直线上 可得解得a 50 答案 50kg 2 选修2 3p97习题3 2t1改编 为了解某班学生喜爱打篮球是否与性别有关 对该班50名学生进行了问卷调查 得到了如下的2 2列联表 则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关 附 k2 解析 由公式可得k2 8 333 7 879 故填0 005 答案 0 005 3 真题小试感悟考题试一试 1 2014 湖北高考 根据如下样本数据 得到的回归方程为 bx a 则 a a 0 b0 b 0c a0 解析 选a 画出散点图如图所示 y的值大致随x的增加而减小 所以b0 2 2015 兰州模拟 如表提供了某厂节能降耗技术改造后在生产a产品过程中记录的产量x 吨 与相应的生产能耗y 吨 的几组对应数据 根据表提供的数据 求出y关于x的线性回归方程为 0 7x 0 35 则下列结论错误的是 a 产品的生产能耗与产量呈正相关b t的取值必定是3 15c 回归直线一定过 4 5 3 5 d a产品每多生产1吨 则相应的生产能耗约增加0 7吨 解析 选b 由题意 因为 0 7x 0 35 所以 0 7 4 5 0 35 3 5 所以t 4 3 5 2 5 4 4 5 3 故选b 3 2015 泉州模拟 已知某产品连续4个月的广告费用x1 千元 与销售额y1 万元 经过对这些数据的处理 得到如下数据信息 广告费用x和销售额y之间具有较强的线性相关关系 回归直线方程中的 0 8 用最小二乘法求得 那么 广告费用为6千元时 可预测销售额约为 a 3 5万元b 4 7万元c 4 9万元d 6 5万元 解析 选b 因为所以因为回归直线方程所以所以x 6时 可预测销售额约为4 7万元 故选b 考点1相关关系的判断 典例1 1 已知变量x y呈线性相关关系 回归方程为 0 5 2x 则变量x y呈 a 线性正相关关系b 由回归方程无法判断其正负相关c 线性负相关关系d 非常强的相关关系 2 甲 乙 丙 丁四位同学各自对a b两变量的线性相关性做试验 并用回归分析方法分别求得相关系数r与残差平方和m如下表 则哪位同学的试验结果体现a b两变量有更强的线性相关性 a 甲b 乙c 丙d 丁 解题提示 1 看随x的变化y的变化趋势 2 利用相关系数和残差平方和的意义判断 规范解答 1 选a 因为 2 0 所以变量x y呈线性正相关关系 2 选d 在验证两个变量之间的线性相关关系时 相关系数的绝对值越接近于1 相关性越强 在四个选项中只有丁的相关系数最大 残差平方和越小 相关性越强 只有丁的残差平方和最小 综上可知丁的试验结果体现了a b两变量有更强的线性相关性 故选d 互动探究 题 1 中 x增加3个单位 y的变化是 解析 因为是正相关关系 所以y增加6个单位 答案 增加6个单位 规律方法 线性相关关系与函数关系的区别 1 函数关系中的两个变量间是一种确定性关系 例如 正方形面积s与边长x之间的关系s x2就是函数关系 2 相关关系是一种非确定性关系 即相关关系是非随机变量与随机变量之间的关系 例如 商品的销售额与广告费是相关关系 两个变量具有相关关系是回归分析的前提 变式训练 1 两个变量y与x的回归模型中 分别选择了4个不同模型 它们的相关指数r2如下 其中拟合效果最好的模型是 a 模型1的相关指数r2为0 98b 模型2的相关指数r2为0 80c 模型3的相关指数r2为0 50d 模型4的相关指数r2为0 25 解析 选a 相关指数r2越大 拟合效果越好 2 对于给定的两个变量的统计数据 下列说法正确的是 a 都可以分析出两个变量的关系b 都可以用一条直线近似表示两者的关系c 都可以作出散点图d 都可以用确定的表达式表示两者的关系 解析 选c 给出一组样本数据 总可以作出相应的散点图 故c正确 但不一定能分析出两个变量的关系 故a不正确 更不一定符合线性相关 不一定用一条直线近似表示 故b不正确 两个变量的统计数据不一定有函数关系 故d不正确 故选c 加固训练 1 下列命题 线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法 利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示 通过回归直线及回归系数 可以估计和预测变量的取值和变化趋势 其中正确的命题是 a b c d 解析 选d 线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法 找拟合效果最好的直线 故 正确 利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示 正确 通过回归直线及回归系数 可以估计和预测变量的取值和变化趋势 正确 综上可知 正确 故选d 2 某棉业公司的科研人员在7块并排 形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验 得到如表所示的一组数据 单位 kg 1 画出散点图 2 判断是否具有相关关系 解析 1 散点图如图所示 2 由散点图知 各组数据对应点大致都在一条直线附近 所以施化肥量x与棉花产量y具有线性相关关系 考点2独立性检验 典例2 1 某高校 统计初步 课程的教师随机调查了选该课程的一些学生的情况 具体数据如表 为了判断主修统计专业是否与性别有关系 根据表中的数据 得到k2 4 844 因为k2 3 841 所以判定主修统计专业与性别有关系 那么这种判断出错的可能性为 2 2014 辽宁高考改编 某大学餐饮中心为了解新生的饮食习惯 在全校一年级学生中进行了抽样调查 调查结果如下表所示 根据表中数据 问是否在犯错误的概率不超过5 的前提下认为 南方学生和北方学生在选用甜品的饮食习惯方面有差异 已知在被调查的北方学生中有5名数学系的学生 其中2名喜欢甜品 现在从这5名学生中随机抽取3人 求至多有1人喜欢甜品的概率 附 k2 解题提示 1 对照临界值表判断 2 代入公式求出k2值再判断 利用古典概型的概率公式求解 规范解答 1 因为p k2 3 841 0 05 4 844 3 841 所以判断出错的可能性不超过5 答案 不超过5 2 将2 2列联表中的数据代入计算公式 得k2 由于4 762 3 841 所以在犯错误的概率不超过5 的前提下认为 南方学生和北方学生在选用甜品的饮食习惯方面有差异 从5名数学系学生中抽取3人的一切可能结果所组成的基本事件为下列10个 a1 a2 b1 a1 a2 b2 a1 a2 b3 a1 b1 b2 a1 b1 b3 a1 b2 b3 a2 b1 b2 a2 b1 b3 a2 b2 b3 b1 b2 b3 其中ai i 1 2 表示喜欢甜品的学生 bj j 1 2 3 表示不喜欢甜品的学生 这10个基本事件的出现是等可能的 抽取3人 至多有1人喜欢甜品的事件为以下7个 a1 b1 b2 a1 b1 b3 a1 b2 b3 a2 b1 b2 a2 b1 b3 a2 b2 b3 b1 b2 b3 从这5名学生中随机抽取3人 至多有1人喜欢甜品的概率为 规律方法 解独立性检验的应用问题的关注点 1 两个明确 明确两类主体 明确研究的两个问题 2 两个关键 准确画出2 2列联表 准确理解k2 提醒 准确计算k2的值是正确判断的前提 变式训练 2014 安徽高考改编 某高校共有学生15000人 其中男生10500人 女生4500人 为调查该校学生每周平均体育运动时间的情况 采用分层抽样的方法 收集300位学生每周平均体育运动时间的样本数据 单位 小时 1 应收集多少位女生的样本数据 2 根据这300个样本数据 得到学生每周平均体育运动时间的频率分布直方图 如图所示 其中样本数据的分组区间为 0 2 2 4 4 6 6 8 8 10 10 12 估计该校学生每周平均体育运动时间超过4小时的概率 3 在样本数据中 有60位女生的每周平均体育运动时间超过4小时 请完成每周平均体育运动时间与性别的列联表 并判断是否在犯错误的概率不超过5 的前提下认为 该校学生的每周平均体育运动时间与性别有关 附 k2 解题提示 分清样本总体 个体的概念 识别频率分布直方图 正确列出列联表求解 本题属于容易题 解析 1 300 90 所以应收集90位女生的样本数据 2 由频率分布直方图得2 0 150 0 125 0 075 0 025 0 75 所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0 75 3 由 2 知 300位学生中有300 0 75 225人的每周平均体育运动时间超过4个小时 75人的每周平均体育运动时间不超过4个小时 又因为样本数据中有210份是关于男生的 90份是关于女生的 所以每周平均体育运动时间与性别的列联表如下 每周平均体育运动时间与性别列联表 结合列联表可算得k2的观测值所以在犯错误的概率不超过5 的前提下认为 该校学生的每周平均体育运动时间与性别有关 加固训练 2014 长治模拟 为了调查某大学学生在周日上网的时间 随机对100名男生和100名女生进行了不记名的问卷调查 得到了如下的统计结果 表1男生上网时间与频数分布表表2女生上网时间与频数分布表 1 若该大学共有女生750人 试估计其中上网时间不少于60分钟的人数 2 完成表3的2 2列联表 并回答能否在犯错误的概率不超过0 1的前提下认为 学生周日上网时间与性别有关 3 从表3的男生中 上网时间少于60分钟 和 上网时间不少于60分钟 的人数中用分层抽样的方法抽取一个容量为5的样本 再从中任取两人 求至少有一人上网时间超过60分钟的概率 表3 解析 1 设上网时间不少于60分钟的人数为x 依据题意有解得 x 225 所以估计其中上网的时间不少于60分钟的人数是225人 2 根据题目所给数据得到如下列联表 其中k2 2 198 2 706 因此 不能在犯错误的概率不超过0 1的前提下认为 学生周日上网时间与性别有关 3 因为上网时间少于60分钟的有3个 记为a b c 上网时间不少于60分钟的有2人 记为d e 所以从中任取两人的所有基本事件为 ab ac ad ae bc bd be cd ce de 共10种 其中 至少有一人上网时间超过60分钟 包含7种 所以p 考点3线性回归分析及应用知 考情高考中对线性回归分析的考查主要在两个方面 一是求回归直线方程 尤其是回归直线必过样本点中心是常考知识点 二是利用回归直线方程进行预测 明 角度命题角度1 求线性回归方程 典例3 2014 重庆高考 已知变量x与y正相关 且由观测数据算得样本的平均数 2 5 3 5 则由观测的数据得线性回归方程可能为 a 0 4x 2 3b 2x 2 4c 2x 9 5d 0 3x 4 4 解题提示 利用回归方程必过样本点中心进行排除 规范解答 选a 因为y bx a正相关 则b 0 所以排除c d 因为过 所以将 2 5代入a b 算得a中结果更接近3 5 所以选a 命题角度2 线性回归方程的应用 典例4 2014 新课标全国卷 某地区2007年至2013年农村居民家庭人均纯收入y 单位 千元 的数据如下表 1 求y关于t的线性回归方程 2 利用 1 中的回归方程 分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况 并预测该地区2015年农村居民家庭人均纯收入 解题提示 1 利用公式求得回归方程 2 利用回归方程中的正负分析变化情况 将2015年的年份代号代入回归方程 估计家庭人均纯收入 规范解答 1 因为 2 因为 0 所以2007年至2013年该地区人均纯收入稳步增长 预计到2015年 该地区人均纯收入y 9 2 3 6 8 千元 所以预计到2015年 该地区人均纯收入约6800元左右 悟 技法线性回归分析问题的类型及解题方法 1 求线性回归方程 利用公式 求出回归系数b a 待定系数法 利用回归直线过样本点中心求系数 2 利用回归方程进行预测 把回归直线方程看作一次函数 求函数值 3 利用回归直线判断正 负相关 决定正相关还是负相关的是系数b 通 一类1 2013 湖北高考 四名同学根据各自的样本数据研究变量x y之间的相关关系 并求得回归直线方程 分别得到以下四个结论 y与x负相关且 2 347x 6 423 y与x负相关且 3 476x 5 648 y与x正相关且 5 437x 8 493 y与x正相关且 4 326x 4 578 其中一定不正确的结论的序号是 a b c d 解题提示 x的系数的符号决定变量x y之间的正 负相关关系 解析 选d x的系数大于0为正相关 小于0为负相关 2 2015 沈阳模拟 高三某班学生每周用于物理学习的时间x 单位 小时 与物理成绩y 单位 分 之间有如下关系 根据上表可得回归方程的斜率为3 53 则回归直线在y轴上的截距为 答案保留到0 1 解析 由已知可得设回归直线方程为 3 53x 则74 9 3 53 17 4 解得 13 5 答案 13 5 3 2015 重庆模拟 重庆市某知名中学高三年级甲班班主任近期对班上每位同学的成绩作相关分析时 得到石周卓婷同学的某些成绩数据如下 1 求总分年级名次关于数学总分的线性回归方程 必要时用分数表示 2 若石周卓婷同学想在下次的测试时考入年级前100名 预测该同学下次测试的数学成绩至少应考多少分 取整数 可四舍五入 解析 1 因为 2 因为y 100 所以100 x 533 所以x 128 所以该同学下次测试的数学成绩至少应考128分 4 2015 贵阳模拟 为了分析某个高三学生的学习状态 对其下一阶段的学习提供指导性建议 现对他前7次考试的数学成绩x 物理成绩y进行分析 下面是该生7次考试的成绩 1 他的数学成绩与物理成绩哪个更稳定 请给出你的证明 2 已知该生的物理成绩y与数学成绩x是线性相关的 若该生的物理成绩达到115分 请你估计他的数学成绩大约是多少 并请你根据物理成绩与数学成绩的相关性 给出该生在学习数学 物理上的合理建议 其中 数据 xi yi i 1 2 n 的线性回归方程为 解析 1 因为从而 所以该生的物理成绩更稳定 2 由于x与y之间具有线性相关关系 所以所以线性回归方程为 0 5x 50 当y 115时 x 130 建议 进一步加强

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论