




已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲统计 统计案例 知识回顾 1 两种抽样方法的特点分层抽样 按比例抽样系统抽样 等距抽样 2 必记公式数据x1 x2 x3 xn的数字特征公式 1 平均数 2 方差 s2 3 标准差 s 3 重要性质及结论 1 频率分布直方图的三个结论 小长方形的面积 频率 各小长方形的面积之和等于1 小长方形的高 所有小长方形高的和为 2 回归直线方程 一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 其回归方程 其过样本点中心 3 独立性检验k2 其中n a b c d为样本容量 易错提醒 1 忽视两个比例关系 分层抽样中 易忽视每层抽取的个体的比例是相同的 即 2 频率分布直方图 茎叶图中的易错点 1 易忽视频率分布直方图中纵轴表示的应为 2 在绘制茎叶图时 易遗漏重复出现的数据 重复出现的数据要重复记录 同时不要混淆茎叶图中茎与叶的含义 3 混淆概念致误 相关关系与函数关系 两者的区别是函数关系是一种确定的关系 而相关关系是一种非确定的关系 函数关系是一种因果关系 而相关关系不一定是因果关系 也可能是伴随关系 4 对回归分析中样本点的认识错误 回归分析中易误认为样本数据必在回归直线上 实质上回归直线必过点 可能所有的样本数据点都不在直线上 考题回访 1 2016 全国卷 某旅游城市为向游客介绍本地的气温情况 绘制了一年中各月平均最高气温和平均最低气温的雷达图 图中a点表示十月的平均最高气温约为15 b点表示四月的平均最低气温约为5 下面叙述不正确的是 a 各月的平均最低气温都在0 以上b 七月的平均温差比一月的平均温差大c 三月和十一月的平均最高气温基本相同d 平均最高气温高于20 的月份有5个 解析 选d 根据雷达图可知全年最低气温都在0 以上 故a正确 一月平均最高气温是6 左右 平均最低气温2 左右 七月平均最高气温22 左右 平均最低气温13 左右 所以七月的平均温差比一月的平均温差大 b正确 三月和十一月的平均最高气温都是10 三月和十一月的平均最高气温基本相同 c正确 平均最高气温高于20 的有七月和八月 故d错误 2 2015 全国卷 根据下面给出的2004年至2013年我国二氧化硫排放量 单位 万吨 柱形图 以下结论不正确的是 a 逐年比较 2008年减少二氧化硫排放量的效果最显著b 2007年我国治理二氧化硫排放显现成效c 2006年以来我国二氧化硫年排放量呈减少趋势d 2006年以来我国二氧化硫年排放量与年份正相关 解析 选d 由柱形图得 从2006年以来 我国二氧化硫排放量呈下降趋势 故年排放量与年份负相关 3 2013 全国卷 为了解某地区的中小学生的视力情况 拟从该地区的中小学生中抽取部分学生进行调查 事先已了解到该地区小学 初中 高中三个学段学生的视力情况有较大差异 而男女生视力情况差异不大 在下面的抽样方法中 最合理的抽样方法是 a 简单随机抽样b 按性别分层抽样c 按学段分层抽样d 系统抽样 解析 选c 因为男女生视力情况差异不大 而学段的视力情况有较大差异 所以应按学段分层抽样 热点考向一抽样方法命题解读 主要考查抽样的三种方法 特别是系统抽样和分层抽样 以选择题 填空题为主 典例1 1 2016 安阳一模 某工厂在12月份共生产了3600双皮靴 在出厂前要检查这批产品的质量 决定采用分层抽样的方法进行抽取 若从一 二 三车间抽取的产品数分别为a b c 且a b c构成等差数列 则第二车间生产的产品数为 a 800b 1000c 1200d 1500 2 2016 绵阳一模 在一次马拉松比赛中 35名运动员的成绩 单位 分钟 的茎叶图如图所示 若将运动员按成绩由好到差编为1 35号 再用系统抽样方法从中抽取7人 则成绩在区间 139 151 上的运动员人数是 解题导引 1 由a b c构成等差数列 可求出抽样比 进而求解 2 先将成绩分组 再找出区间 139 151 包含的运动员人数即可求解 规范解答 1 选c 因为a b c成等差数列 所以2b a c 即第二车间抽取的产品数占抽样产品总数的三分之一 根据分层抽样的性质可知 第二车间生产的产品数占12月份生产总数的三分之一 即为1200双皮靴 2 35 7 5 因此可将编号为1 35的35个数据分成7组 每组有5个数据 在区间 139 151 上共有20个数据 分在4个小组中 每组取一人 共取4人 答案 4 规律方法 两种抽样方法的注意点 1 系统抽样 所分段数等于样本容量 即每段取一个 第一段入样个体编号为a1 当每段含有n0个个体时 第k段入样个体编号为a1 k 1 n0 当总体不能分成整数段时 要先在总体中等可能剔除若干个体 2 分层抽样 适用于总体由差异明显的几部分组成的情况 当总体容量为n 样本容量为n时 有下列关系式 题组过关 1 2016 重庆一模 采用系统抽样方法从960人中抽取32人做问卷调查 为此将他们随机编号为1 2 960 分组后在第一组采用简单随机抽样的方法抽到的号码为9 抽到的32人中 编号落入区间 1 450 的人做问卷a 编号落入区间 451 750 的人做问卷b 其余的人做问卷c 则抽到的人中 做问卷b的人数为 a 7b 9c 10d 15 解析 选c 抽取号码的间隔为 30 从而区间 451 750 包含的段数为 10 则编号落入区间 451 750 的人数为10人 即做问卷b的人数为10 2 2016 阳泉一模 学校高中部共有学生2000名 高中部各年级男 女生人数如表 已知在高中部学生中随机抽取1名学生 抽到高三年级女生的概率是0 18 现用分层抽样的方法在高中部抽取50名学生 则应在高二年级抽取的学生人数为 a 14b 15c 16d 17 解析 选b 由已知得高三女生数x 2000 0 18 360 故高三年级总共有360 340 700 人 而高一年级共有373 327 700 人 所以高二年级共有2000 700 700 600 人 设高二年级应抽取的学生数为n 则由分层抽样的特点知 解得n 15 加固训练 1 总体由编号为01 02 19 20的20个个体组成 利用下面的随机数表选取5个个体 选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字 则选出来的第5个个体的编号为 a 08b 07c 02d 01 解析 选d 由随机数表法的随机抽样的过程可知选出的5个个体是08 02 14 07 01 所以第5个个体的编号是01 2 将参加夏令营的600名学生编号为 001 002 600 采用系统抽样的方法抽取一个容量为50的样本 且随机抽得的号码为003 这600名学生分住在三个营区 从001到300在a营区 从301到495在b营区 从496到600在c营区 则三个营区被抽中的人数依次为 a 26 16 8b 25 17 8c 25 16 9d 24 17 9 解析 选b 依题意及系统抽样的意义可知 将这600名学生按编号依次分成50组 每一组各有12名学生 第k k n 组抽中的号码是3 12 k 1 令3 12 k 1 300 得k 因此a营区被抽中的人数是25 令300 3 12 k 1 495 得 k 42 因此b营区被抽中的人数是42 25 17 结合各选项知b正确 3 2015 福建高考 某校高一年级有900名学生 其中女生400名 按男女比例用分层抽样的方法 从该年级学生中抽取一个容量为45的样本 则应抽取的男生人数为 解析 由题意知 男生人数 900 400 500 所以抽取比例为男生 女生 500 400 5 4 样本容量为45 所以抽取的男生人数为45 25 答案 25 热点考向二用样本估计总体命题解读 用样本估计总体是考查的重点 利用频率分布直方图去估计总体 利用茎叶图估计总体 利用样本的数字特征去估计总体 若单独命题 则以选择题 填空题为主 命题角度一数字特征和茎叶图的应用 典例2 2016 枣庄一模 从甲 乙两个城市分别随机抽取16台自动售货机 对其销售额进行统计 统计数据用茎叶图表示 如图所示 设甲 乙两组数据的平均数分别为 中位数分别为m甲 m乙 则 a m甲 m乙b m甲m乙d m甲 m乙 解题导引 先由茎叶图求出m甲和m乙 再计算和 规范解答 选b 由茎叶图知m甲 20 m乙 29 所以m甲 m乙 41 43 30 30 38 22 25 27 10 10 14 18 18 5 6 8 42 43 48 31 32 34 34 38 20 22 23 23 27 10 12 18 所以 命题角度二频率分布直方图的应用 典例3 2016 山东高考 某高校调查了200名学生每周的自习时间 单位 小时 制成了如图所示的频率分布直方图 其中自习时间的范围是 17 5 30 样本数据分组为 17 5 20 20 22 5 22 5 25 25 27 5 27 5 30 根据直方图 这200名学生中每周的自习时间不少于22 5小时的人数是 a 56b 60c 120d 140 解题导引 利用频率乘以总体容量等于频数求解 规范解答 选d 由频率分布直方图可知 每周自习时间不少于22 5小时的学生所占频率为2 5 0 16 0 08 0 04 0 7 所以每周自习时间不少于22 5小时的学生人数为200 0 7 140 规律方法 1 方差的计算与含义 1 计算 计算方差首先要计算平均数 然后再按照方差的计算公式进行计算 2 含义 方差和标准差是描述一个样本和总体的波动大小的特征数 方差大说明波动大 2 与频率分布直方图有关问题的常见类型及解题策略 1 已知频率分布直方图中的部分数据 求其他数据 可根据频率分布直方图中的数据求出样本与整体的关系 利用频率和等于1就可求出其他数据 2 已知频率分布直方图 求某种范围内的数据 可利用图形及某范围结合求解 3 与概率有关的综合问题 可先求出频率 再利用古典概型等知识求解 题组过关 1 2016 太原一模 某公司10位员工的月工资 单位 元 为x1 x2 x10 其均值和方差分别为和s2 若从下月起每位员工的月工资增加100元 则这10位员工下月工资的均值和方差分别为 a s2 1002b 100 s2 1002c s2d 100 s2 解析 选d 利用样本的均值 方差公式求解 yi xi 100 所以y1 y2 y10的均值为 100 方差不变 2 2016 郑州一模 pm2 5是指大气中直径小于或等于2 5微米的颗粒物 也称为可入肺颗粒物 如图是根据某地某日早7点到晚8点甲 乙两个pm2 5监测点统计的数据 单位 毫克 立方米 列出的茎叶图 则甲 乙两地浓度的方差较小的是 a 甲b 乙c 甲 乙相等d 无法确定 解析 选a 从茎叶图上可以观察到 甲监测点的样本数据比乙监测点的样本数据更加集中 因此甲地浓度的方差较小 加固训练 2016 广州一模 某工厂36名工人的年龄数据如下表 1 用系统抽样法从36名工人中抽取容量为9的样本 且在第一分段里用随机抽样法抽到的年龄数据为44 列出样本的年龄数据 2 计算 1 中样本的均值和方差s2 3 36名工人中年龄在 s与 s之间有多少人 所占的百分比是多少 精确到0 01 解析 1 将36人编号为1 2 36 由系统抽样的知识可知 36人分成9组 每组4人 其中第一组的工人年龄为44 所以其编号为2 故所有样本数据的编号为4n 2 n 1 2 9 其数据为 44 40 36 43 36 37 44 43 37 2 由方差公式知 s2 44 40 2 40 40 2 37 40 2 3 因为s2 所以s 3 4 所以36名工人中年龄在 s和 s之间的人数等于在区间 37 43 内的人数 即40 40 41 39 共23人 所以36名工人中年龄在 s和 s之间的人数所占的百分比为 63 89 热点考向三回归分析与独立性检验命题解读 主要考查线性回归方程的求解及应用 独立性检验考查较少 以解答题为主 典例4 2016 全国卷 如图是我国2008年至2014年生活垃圾无害化处理量 单位 亿吨 的折线图 注 年份代码1 7分别对应年份2008 2014 1 由折线图看出 可用线性回归模型拟合y与t的关系 请用相关系数加以说明 2 建立y关于t的回归方程 系数精确到0 01 预测2016年我国生活垃圾无害化处理量 附注 参考数据 参考公式 相关系数回归方程中斜率和截距的最小二乘估计公式分别为 解题导引 1 利用所给数据及公式计算出回归系数r的值 2 利用 1 的结论及所给数据计算 再求 求回归方程并进行预测 规范解答 1 由折线图中的数据和附注中参考数据得 所以r 因为y与t的相关系数近似为0 99 说明y与t的线性相关程度相当高 从而可以用线性回归模型拟合y与t的关系 2 由 1 331及 1 得 1 331 0 103 4 0 92 所以 y关于t的回归方程为 0 92 0 10t 将2016年对应的t 9代入回归方程得 0 92 0 10 9 1 82 所以预测2016年我国生活垃圾无害化处理量约为1 82亿吨 规律方法 1 求回归直线方程的关键及实际应用 1 关键 正确理解计算的公式和准确地计算 2 实际
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美术素描几何体教学课件
- 遗址锚杆加固施工方案
- 隔断钢结构安装施工方案
- 运营部门上半年工作总结
- 文化传媒企业品牌营销策划方案
- 农村园区管理方案范本
- 饭店布局改造方案范本
- 渠道部经理月度工作总结
- 汽车制造行业质量管理体系建立方案
- 外墙装饰水包水施工方案
- 国有企业风险管理内控操作手册
- 缺血性卒中脑保护中国专家共识(2025)解读 3
- 2025年青海省中考道德与法治试题卷(含答案解析)
- 2025广西公需科目培训考试答案(90分)一区两地一园一通道建设人工智能时代的机遇与挑战
- 2025年检测员上岗证试题及答案
- 包装现场管理培训
- 企业安全生产体系五落实五到位规定的内容
- 肺结核心理指导健康教育
- 石家庄高速考试试题及答案
- 道路养护工程材料供应保障及进度措施
- 消除母婴三病传播培训课件
评论
0/150
提交评论