高考数学大一轮复习 第十章 统计与统计案例 10.3 相关性、最小二乘估计与统计案例课件 文 北师大版.ppt_第1页
高考数学大一轮复习 第十章 统计与统计案例 10.3 相关性、最小二乘估计与统计案例课件 文 北师大版.ppt_第2页
高考数学大一轮复习 第十章 统计与统计案例 10.3 相关性、最小二乘估计与统计案例课件 文 北师大版.ppt_第3页
高考数学大一轮复习 第十章 统计与统计案例 10.3 相关性、最小二乘估计与统计案例课件 文 北师大版.ppt_第4页
高考数学大一轮复习 第十章 统计与统计案例 10.3 相关性、最小二乘估计与统计案例课件 文 北师大版.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10 3变量间的相关关系 统计案例 第十章统计与统计案例 基础知识自主学习 课时作业 题型分类深度剖析 内容索引 基础知识自主学习 1 相关性 1 通常将变量所对应的点描出来 这些点就组成了变量之间的一个图 通常称这种图为变量之间的 2 从散点图上可以看出 如果变量之间存在着某种关系 这些点会有一个集中的大致趋势 这种趋势通常可以用一条光滑的曲线来近似 这样近似的过程称为 3 若两个变量x和y的散点图中 所有点看上去都在一条直线附近波动 则称变量间是的 若所有点看上去都在某条曲线 不是一条直线 附近波动 则称此相关是的 如果所有的点在散点图中没有显示关系 则称变量间是的 知识梳理 散点图 曲线拟合 非线性相关 线性相关 任何 不相关 2 线性回归方程 1 最小二乘法如果有n个点 x1 y1 x2 y2 xn yn 可以用 y1 a bx1 2 y2 a bx2 2 yn a bxn 2来刻画这些点与直线y a bx的接近程度 使得上式达到最小值的直线y a bx就是所要求的直线 这种方法称为最小二乘法 2 线性回归方程方程y bx a是两个具有线性相关关系的变量的一组数据 x1 y1 x2 y2 xn yn 的线性回归方程 其中a b是待定参数 b a 3 回归分析 1 定义 对具有的两个变量进行统计分析的一种常用方法 2 样本点的中心对于一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 中 称为样本点的中心 相关关系 当r 0时 表明两个变量 当r 0时 表明两个变量 当r 0时 表明两个变量 r 值越接近于1 表明两个变量之间的线性相关程度 r 值越接近于0 表明两个变量之间的线性相关程度越低 3 相关系数 正相关 负相关 越高 线性不相关 2 2 4 独立性检验设a b为两个变量 每一个变量都可以取两个值 变量a a1 a2 变量b b1 b2 2 2列联表 构造一个统计量 2 利用统计量 2来判断 两个分类变量有关系 的方法称为独立性检验 当 2 2 706时 没有充分的证据判定变量a b有关联 可以认为变量a b是没有关联的 当 2 2 706时 有90 的把握判定变量a b有关联 当 2 3 841时 有95 的把握判定变量a b有关联 当 2 6 635时 有99 的把握判定变量a b有关联 题组一思考辨析1 判断下列结论是否正确 请在括号中打 或 1 相关关系与函数关系都是一种确定性的关系 也是一种因果关系 2 名师出高徒 可以解释为教师的教学水平与学生的水平成正相关关系 3 只有两个变量有相关关系 所得到的回归模型才有预测价值 基础自测 1 2 3 4 5 6 4 某同学研究卖出的热饮杯数y与气温x 之间的关系 得线性回归方程y 2 352x 147 767 则气温为2 时 一定可卖出143杯热饮 5 事件x y关系越密切 则由观测数据计算得到的 2值越大 1 2 4 5 6 3 题组二教材改编2 为调查中学生近视情况 测得某校男生150名中有80名近视 在140名女生中有70名近视 在检验这些学生眼睛近视是否与性别有关时 用下列哪种方法最有说服力a 回归分析b 均值与方差c 独立性检验d 概率 答案 解析 近视 与 性别 是两类变量 其是否有关 应用独立性检验判断 解析 1 2 4 5 6 3 3 下面是2 2列联表 答案 解析 a 21 73 a 52 又a 22 b b 74 解析 1 2 4 5 6 则表中a b的值分别为a 94 72b 52 50c 52 74d 74 52 3 4 某车间为了规定工时定额 需要确定加工零件所花费的时间 为此进行了5次试验 根据收集到的数据 如下表 由最小二乘法求得回归方程y 0 67x 54 9 设表中的 模糊数字 为a 则62 a 75 81 89 75 5 a 68 解析 答案 1 2 4 5 6 现发现表中有一个数据看不清 请你推断出该数据的值为 68 3 题组三易错自纠5 某医疗机构通过抽样调查 样本容量n 1000 利用2 2列联表和 2统计量研究患肺病是否与吸烟有关 计算得 2 4 453 经查阅临界值表知p 2 3 841 0 05 现给出四个结论 其中正确的是a 在100个吸烟的人中约有95个人患肺病b 若某人吸烟 那么他有95 的可能性患肺病c 有95 的把握认为 患肺病与吸烟有关 d 只有5 的把握认为 患肺病与吸烟有关 解析 答案 1 2 4 5 6 解析由已知数据可得 有1 0 05 95 的把握认为 患肺病与吸烟有关 3 现已知其线性回归方程为y 0 36x a 则根据此线性回归方程估计数学得90分的同学的物理成绩为 四舍五入到整数 6 在一次考试中 5名学生的数学和物理成绩如下表 已知学生的数学和物理成绩具有线性相关关系 解析 答案 1 2 4 5 6 73 3 1 2 4 5 6 3 所以66 0 36 70 a a 40 8 即线性回归方程为y 0 36x 40 8 当x 90时 y 0 36 90 40 8 73 2 73 题型分类深度剖析 1 观察下列各图形 解析 答案 题型一相关关系的判断 自主演练 其中两个变量x y具有相关关系的图是a b c d 解析由散点图知 中的点都分布在一条直线附近 中的点都分布在一条曲线附近 所以 中的两个变量具有相关关系 a 逐年比较 2008年减少二氧化硫排放量的效果最显著b 2007年我国治理二氧化硫排放显现成效c 2006年以来我国二氧化硫年排放量呈减少趋势d 2006年以来我国二氧化硫年排放量与年份正相关 2 2018 广州质检 根据下面给出的2004年至2013年我国二氧化硫排放量 单位 万吨 的条形统计图 以下结论不正确的是 解析 答案 解析从2006年 将每年的二氧化硫排放量与前一年作差比较 得到2008年二氧化硫排放量与2007年排放量的差最大 a选项正确 2007年二氧化硫排放量较2006年降低了很多 b选项正确 虽然2011年二氧化硫排放量较2010年多一些 但自2006年以来 整体呈递减趋势 c选项正确 自2006年以来我国二氧化硫年排放量与年份负相关 d选项错误 故选d x y是负相关关系 在该相关关系中 若用y 拟合时的相关系数为r1 用y bx a拟合时的相关系数为r2 则r1 r2 x y之间不能建立线性回归方程 3 x和y的散点图如图所示 则下列说法中所有正确命题的序号为 解析 答案 由散点图知用y 拟合比用y bx a拟合效果要好 则r1 r2 故 正确 解析在散点图中 点散布在从左上角到右下角的区域 因此x y是负相关关系 故 正确 x y之间可以建立线性回归方程 但拟合效果不好 故 错误 判定两个变量正 负相关性的方法 1 画散点图 点的分布从左下角到右上角 两个变量正相关 点的分布从左上角到右下角 两个变量负相关 2 相关系数 r 0时 正相关 r0时 正相关 b 0时 负相关 典例 2017 全国 为了监控某种零件的一条生产线的生产过程 检验员每隔30min从该生产线上随机抽取一个零件 并测量其尺寸 单位 cm 下面是检验员在一天内依次抽取的16个零件的尽寸 题型二线性回归分析 师生共研 1 求 xi i i 1 2 16 的相关系数r 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 若 r 0 25 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 解答 由于 r 0 25 因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 2 一天内抽检零件中 如果出现了尺寸在之外的零件 就认为这条生产线在这一天的生产过程可能出现了异常情况 需对当天的生产过程进行检查 从这一天抽检的结果看 是否需对当天的生产过程进行检查 解答 解答 解剔除离群值 即第13个数据 剩下数据的平均数为 因此这条生产线当天生产的零件尺寸的均值的估计值为10 02 剔除第13个数据 剩下数据的样本方差为 线性回归分析问题的类型及解题方法 1 求线性回归方程 利用公式 求出回归系数b a 待定系数法 利用回归直线过样本点的中心求系数 2 利用回归方程进行预测 把线性回归方程看作一次函数 求函数值 3 利用回归直线判断正 负相关 决定正相关还是负相关的是系数b 4 回归方程的拟合效果 可以利用相关系数判断 当 r 越趋近于1时 两变量的线性相关性越强 跟踪训练 2018 惠州月考 以下是某地收集到的新房屋的销售价格y和房屋的面积x的数据 1 画出数据对应的散点图 解答 解数据对应的散点图如图所示 2 求线性回归方程 并在散点图中画出回归直线 解答 设所求线性回归方程为y bx a 则 故所求线性回归方程为y 0 1962x 1 8142 3 根据 2 的结果估计当房屋面积为150m2时的销售价格 解答 解根据 2 当x 150时 销售价格的估计值为y 0 1962 150 1 8142 31 2442 31 2 万元 典例 2017 全国 海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 题型三独立性检验 师生共研 1 记a表示事件 旧养殖法的箱产量低于50kg 估计a的概率 解答 解旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 因此 事件a的概率估计值为0 62 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 解答 解根据箱产量的频率分布直方图得列联表如下 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 对两种养殖方法的优劣进行比较 附 解答 解箱产量的频率分布直方图表明 新养殖法的箱产量平均值 或中位数 在50kg到55kg之间 旧养殖法的箱产量平均值 或中位数 在45kg到50kg之间 且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高 因此 可以认为新养殖法的箱产量较高且稳定 从而新养殖法优于旧养殖法 1 比较几个分类变量有关联的可能性大小的方法 通过计算 2的大小判断 2越大 两变量有关联的可能性越大 通过计算 ad bc 的大小判断 ad bc 越大 两变量有关联的可能性越大 2 独立性检验的一般步骤 根据样本数据制成2 2列联表 比较 2与临界值的大小关系 作统计推断 跟踪训练 2017 石家庄质检 微信是现代生活进行信息交流的重要工具 某公司200名员工中90 的人使用微信 其中每天使用微信时间在一小时以内的有60人 其余的员工每天使用微信的时间在一小时以上 若将员工分成青年 年龄小于40岁 和中年 年龄不小于40岁 两个阶段 那么使用微信的人中75 是青年人 若规定 每天使用微信时间在一小时以上为经常使用微信 那么经常使用微信的员工中有是青年人 1 若要调查该公司使用微信的员工经常使用微信与年龄的关系 列出2 2列联表 解答 解由已知可得 该公司员工中使用微信的有200 90 180 人 经常使用微信的有180 60 120 人 使用微信的人中青年人有180 75 135 人 故2 2列联表如下 由于13 333 10 828 所以有99 9 的把握认为 经常使用微信与年龄有关 2 根据2 2列表中的数据利用独立性检验的方法判断是否有99 9 的把握认为 经常使用微信与年龄有关 解答 解将列联表中数据代入公式可得 思想方法指导回归分析是处理变量相关关系的一种数学方法 主要解决 1 确定特定量之间是否有相关关系 如果有就找出它们之间贴近的数学表达式 2 根据一组观测值 预测变量的取值及判断变量取值的变化趋势 3 求出线性回归方程 求线性回归方程的方法技巧 思想方法 典例 12分 某地最近十年粮食需求量逐年上升 下表是部分统计数据 1 利用所给数据求年需求量与年份之间的线性回归方程y bx a 2 利用 1 中所求出的线性回归方程预测该地2018年的粮食需求量 思想方法指导 规范解答 规范解答解 1 由所给数据看出 年需求量与年份之间近似直线上升 下面来求线性回归方程 先将数据处理如下表 由上述计算结果 知所求线性回归方程为y 257 6 5 x 2010 3 2 即y 6 5 x 2010 260 2 8分 2 利用所求得的线性回归方程 可预测2018年的粮食需求量大约为6 5 2018 2010 260 2 6 5 8 260 2 312 2 万吨 12分 课时作业 1 两个变量y与x的回归模型中 分别选择了4个不同模型 它们的相关系数r如下 其中拟合效果最好的模型是a 模型1的相关系数r为0 98b 模型2的相关系数r为0 80c 模型3的相关系数r为0 50d 模型4的相关系数r为0 25 基础保分练 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析相关系数r越大 拟合效果越好 因此模型1拟合效果最好 2 2018 洛阳月考 为了评价某个电视栏目的改革效果 在改革前后分别从居民点抽取了100位居民进行调查 经过计算 2 0 99 根据这一数据分析 下列说法正确的是a 有99 的人认为该电视栏目优秀b 有99 的人认为该电视栏目是否优秀与改革有关系c 有99 的把握认为该电视栏目是否优秀与改革有关系d 没有理由认为该电视栏目是否优秀与改革有关系 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析只有 2 6 635才能有99 的把握认为该电视栏目是否优秀与改革有关系 而即使 2 6 635也只是对 该电视栏目是否优秀与改革有关系 这个论断成立的可能性大小的结论 与是否有99 的人等无关 故只有d正确 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 线性回归方程为y 4x 70 将x 24代入上式 得y 4 24 70 166 故选c 假设根据上表数据所得的线性回归方程为y bx a 若某同学根据上表中的前两组数据 1 0 和 2 2 求得的直线方程为y b x a 则以下结论正确的是a b b a a b b b aa d b b a a 5 2018 湖南永州模拟 已知x与y之间的几组数据如下表 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析由两组数据 1 0 和 2 2 可求得直线方程为y 2x 2 b 2 a 2 而利用线性回归方程的公式与已知表格中的数据 所以ba 6 某地2009年至2015年中 每年的人口总数y 单位 万 的数据如下表 若t与y之间具有线性相关关系 则其回归直线y bt a一定过点a 3 9 b 9 3 c 6 14 d 4 11 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 所以回归直线y bt a一定过点 3 9 根据统计资料 居民家庭年平均收入的中位数是 家庭年平均收入与年平均支出有 相关关系 填 正 或 负 7 某市居民2010 2014年家庭年平均收入x 单位 万元 与年平均支出y 单位 万元 的统计资料如下表所示 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 13 解析 答案 解析中位数是13 由相关性知识 根据统计资料可以看出 当年平均收入增多时 年平均支出也增多 因此两者之间具有正相关关系 正 8 以下四个命题 其中正确的序号是 从匀速传递的产品生产流水线上 质检员每20分钟从中抽取一件产品进行某项指标检测 这样的抽样是分层抽样 两个随机变量相关性越强 则相关系数的绝对值越接近于1 在线性回归方程y 0 2x 12中 当自变量x每增加一个单位时 因变量y平均增加0 2个单位 对分类变量x与y的统计量 2来说 2越小 x与y有关系 的把握程度越大 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 是系统抽样 对于 统计量 2越小 说明两个相关变量有关系的把握程度越小 9 为了判断高中三年级学生选修文科是否与性别有关 现随机抽取50名学生 得到如图所示2 2列联表 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 95 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 因为5 024 4 844 3 841 所以有95 的把握认为选修文科与性别有关 由表中数据得线性回归方程y bx a中的b 2 预测当气温为 4 时 用电量约为 度 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 68 10 某单位为了了解用电量y 度 与气温x 之间的关系 随机统计了某4天的用电量与当天气温 并制作了对照表 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 因为回归直线过样本点的中心 所以a 40 2 10 60 所以当x 4时 y 2 4 60 68 所以用电量约为68度 11 某地区2009年至2015年农村居民家庭人均纯收入y 单位 千元 的数据如下表 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 求y关于t的线性回归方程 解由所给数据计算得 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 所求线性回归方程为y 0 5t 2 3 2 利用 1 中的线性回归方程 分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况 并预测该地区2018年农村居民家庭人均纯收入 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解由 1 知 b 0 5 0 故2009年至2015年该地区农村居民家庭人均纯收入逐年增加 平均每年增加0 5千元 将2018年的年份代号t 10代入 1 中的线性回归方程 得y 0 5 10 2 3 7 3 故预测该地区2018年农村居民家庭人均纯收入为7 3千元 12 2017 西安质检 某省会城市地铁将于2017年6月开始运营 为此召开了一个价格听证会 拟定价格后又进行了一次调查 随机抽查了50人 他们的收入与态度如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解 赞成定价者 的月平均收入为 认为价格偏高者 的月平均收入为 赞成定价者 与 认为价格偏高者 的月平均收入的差距是x1 x2 50 56 38 75 11 81 百元 1 若以区间的中点值为该区间内的人均月收入 求参与调查的人员中 赞成定价者 与 认为价格偏高者 的月平均收入的差异是多少 结果保留2位小数 解答 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 由以上统计数据填下面2 2列联表 分析是否有99 的把握认为 月收入以55百元为分界点对地铁定价的态度有差异 没有99 的把握认为 月收入以55百元为分界点对地铁定价的态度有差异 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解根据条件可得2 2列联表如下 技能提升练 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 14 为调查某地区老年人是否需要志愿者提供帮助 用简单随机抽样方法从该地区调查了500位老年人 结果如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 估计该地区老年人中 需要志愿者提供帮助的老年人的比例 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 能否有99 的把握认为该地区的老年人是否需要志愿者提供帮

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论