




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1讲统计与统计案例 考情分析 总纲目录 考点一抽样方法1 简单随机抽样的特点是从总体中逐个抽取 适用范围 总体中的个体数较少 2 系统抽样的特点是将总体均分成几部分 按事先确定的规则在各部分中抽取 适用范围 总体中的个体数较多 3 分层抽样的特点是将总体分成几层 分层进行抽取 适用范围 总体由差异明显的几部分组成 典型例题 1 2017陕西西安六校联考 某班对八校联考成绩进行分析 利用随机数表抽取样本时 先将60个同学按01 02 03 60进行编号 然后从随机数表第9行第5列的数开始向右读 则选出的第6个个体的编号是 注 下面摘取了随机数表的第8行和第9行 63016378591695556719981050717512867358074439523879 第8行 33211234297864560782524207443815510013429966027954 第9行 a 07b 25c 42d 52 2 2017江苏 3 5分 某工厂生产甲 乙 丙 丁四种不同型号的产品 产量分别为200 400 300 100件 为检验产品的质量 现用分层抽样的方法从以上所有的产品中抽取60件进行检验 则应从丙种型号的产品中抽取件 答案 1 d 2 18 解析 1 依题意得 依次选出的个体的编号分别是12 34 29 56 07 52 因此选出的第6个个体的编号是52 选d 2 应从丙种型号的产品中抽取60 18 件 方法归纳抽样方法主要有简单随机抽样 系统抽样和分层抽样三种 这三种抽样方法各自适用不同特点的总体 但无论哪种抽样方法 每一个个体被抽到的概率都是相等的 都等于样本容量与总体个体数的比值 跟踪集训1 2017江西南昌第一次模拟 某校为了解学生学习的情况 采用分层抽样的方法从高一1000人 高二1200人 高三n人中抽取81人进行问卷调查 已知高二被抽取的人数为30 那么n a 860b 720c 1020d 1040 答案d根据分层抽样方法 得81 30 可得n 1040 故选d 2 已知某商场新进3000袋奶粉 为检测是否达标 现采用系统抽样的方法从中抽取150袋进行检测 将3000袋奶粉按1 2 3000随机编号 若第一组抽出的号码是11 则第六十一组抽出的号码为 答案1211 解析由题意知抽样间隔k 20 因为第一组抽出的号码是11 则第六十一组抽出的号码为11 60 20 1211 考点二用样本估计总体 高频考点 命题点 1 用样本的频率分布估计总体分布 2 用样本的数字特征估计总体的数字特征 1 频率分布直方图的两个结论 1 小长方形的面积 组距 频率 2 各小长方形的面积之和等于1 2 统计中的四个数字特征 1 众数 在样本数据中 出现次数最多的那个数据 2 中位数 样本数据中 将数据按大小排列 位于最中间的数据 如果数据的个数为偶数 就取中间两个数据的平均数作为中位数 3 平均数 样本数据的算术平均数 即 x1 x2 xn 4 方差与标准差方差 s2 x1 2 x2 2 xn 2 标准差 s 典型例题某公司为了解用户对其产品的满意度 从a b两地区分别随机调查了40个用户 根据用户对产品的满意度评分 得到a地区用户满意度评分的频率分布直方图和b地区用户满意度评分的频数分布表 b地区用户满意度评分的频数分布表 1 作出b地区用户满意度评分的频率分布直方图 并通过直方图比较两地区满意度评分的平均值及分散程度 不要求计算出具体值 给出结论即可 2 根据用户满意度评分 将用户的满意度分为三个等级 估计哪个地区用户的满意度等级为不满意的概率大 说明理由 解析 1 通过两地区用户满意度评分的频率分布直方图可以看出 b地区用户满意度评分的平均值高于a地区用户满意度评分的平均值 b地区用户满 意度评分比较集中 而a地区用户满意度评分比较分散 2 a地区用户的满意度等级为不满意的概率大 记ca表示事件 a地区用户的满意度等级为不满意 cb表示事件 b地区用户的满意度等级为不满意 由直方图得p ca 的估计值为 0 01 0 02 0 03 10 0 6 p cb 的估计值为 0 005 0 02 10 0 25 所以a地区用户的满意度等级为不满意的概率大 方法归纳 1 关于平均数 方差的计算样本数据的平均数与方差的计算关键在于准确记忆公式 要特别注意区分方差与标准差 不能混淆 标准差是方差的算术平方根 2 求解频率分布直方图中相关数据的两个注意点 小长方形的面积表示频率 其纵轴是 而不是频率 各组数据频率之比等于对应小长方形的高度之比 跟踪集训1 2017课标全国 2 5分 为评估一种农作物的种植效果 选了n块地作试验田 这n块地的亩产量 单位 kg 分别为x1 x2 xn 下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 a x1 x2 xn的平均数b x1 x2 xn的标准差c x1 x2 xn的最大值d x1 x2 xn的中位数 答案b统计问题中 体现数据的稳定程度的指标为数据的方差或标准差 故选b 2 2017湖北武汉武昌调研 我国是世界上严重缺水的国家 城市缺水问题较为突出 某市政府为了鼓励居民节约用水 计划在本市试行居民生活用水定额管理制度 即确定一个合理的居民月用水量标准x 吨 月用水量不超过x的部分按平价收费 超出x的部分按议价收费 为了了解全市居民用水量的分布情况 通过抽样 获得了某年100位居民的月均用水量 单位 吨 将数据按照 0 0 5 0 5 1 4 4 5 分成9组 制成了如图所示的频率分布直方图 1 求频率分布直方图中a的值 2 已知该市有80万居民 估计全市居民中月均用水量不低于3吨的人数 并说明理由 3 若该市政府希望使85 的居民每月的用水量不超过标准x 吨 估计x的值 并说明理由 解析 1 由 0 08 0 16 a 0 40 0 52 a 0 12 0 08 0 04 0 5 1 解得a 0 30 2 由频率分布直方图知 100位居民每人月均用水量不低于3吨的频率为 0 12 0 08 0 04 0 5 0 12 则估计全市80万居民中月均用水量不低于3吨的人数为800000 0 12 96000 3 前6组的频率之和是 0 08 0 16 0 30 0 40 0 52 0 30 0 5 0 88 0 85 前5组的频率之和为 0 08 0 16 0 30 0 40 0 52 0 5 0 73 0 85 2 5 x 3 由0 3 x 2 5 0 85 0 73 解得x 2 9 因此 估计月用水量标准为2 9吨时 85 的居民每月的用水量不超过标准 考点三回归分析1 线性回归方程方程 x 称为线性回归方程 其中 称为样本点的中心 2 样本数据的相关系数rr 反映样本数据的相关程度 r 越大 相关性越强 典型例题 2017课标全国 19 12分 为了监控某种零件的一条生产线的生产过程 检验员每隔30min从该生产线上随机抽取一个零件 并测量其尺寸 单位 cm 下面是检验员在一天内依次抽取的16个零件的尺寸 经计算得 xi 9 97 s 0 212 18 439 xi i 8 5 2 78 其中xi为抽取的第i个零件的尺寸 i 1 2 16 1 求 xi i i 1 2 16 的相关系数r 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 若 r 0 25 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 2 一天内抽检零件中 如果出现了尺寸在 3s 3s 之外的零件 就认为这条生产线在这一天的生产过程可能出现了异常情况 需对当天的生产过程进行检查 i 从这一天抽检的结果看 是否需对当天的生产过程进行检查 ii 在 3s 3s 之外的数据称为离群值 试剔除离群值 估计这条生产线当天生产的零件尺寸的均值与标准差 精确到0 01 附 样本 xi yi i 1 2 n 的相关系数r 0 09 解析 1 由样本数据得 xi i i 1 2 16 的相关系数为r 0 18 由于 r 0 25 因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 2 i 由于 9 97 s 0 212 由样本数据可以看出抽取的第13个零件的尺寸在 3s 3s 以外 因此需对当天的生产过程进行检查 ii 剔除离群值 即第13个数据 剩下数据的平均数为 16 9 97 9 22 10 02 这条生产线当天生产的零件尺寸的均值的估计值为10 02 16 0 2122 16 9 972 1591 134 剔除第13个数据 剩下数据的样本方差为 1591 134 9 222 15 10 022 0 008 这条生产线当天生产的零件尺寸的标准差的估计值为 0 09 1 求线性回归方程的步骤 1 计算 2 计算xiyi 3 计算 4 写出线性回归方程 x 方法归纳 注意样本点的中心 必在回归直线上 2 相关系数r当r 0时 表明两个变量正相关 当r 0时 表明两个变量负相关 r的绝对值越接近于1 表明两个变量的线性相关性越强 r的绝对值越接近于0 表明两个变量之间几乎不存在线性相关关系 通常 r 大于0 75时 认为两个变量有很强的线性相关性 跟踪集训 2016课标全国 18 12分 下图是我国2008年至2014年生活垃圾无害化处理量 单位 亿吨 的折线图 1 由折线图看出 可用线性回归模型拟合y与t的关系 请用相关系数加以说明 2 建立y关于t的回归方程 系数精确到0 01 预测2016年我国生活垃圾无害化处理量 附注 参考数据 yi 9 32 tiyi 40 17 0 55 2 646 参考公式 相关系数r 回归方程 t中斜率和截距最小二乘估计公式分别为 解析 1 由折线图中数据和附注中参考数据得 4 ti 2 28 0 55 ti yi tiyi yi 40 17 4 9 32 2 89 r 0 99 因为y与t的相关系数近似为0 99 说明y与t的线性相关程度相当高 从而可以用线性回归模型拟合y与t的关系 2 由 1 331及 1 得 0 10 1 331 0 10 4 0 93 所以y关于t的回归方程为 0 93 0 10t 将2016年对应的t 9代入回归方程得 0 93 0 10 9 1 83 所以预测2016年我国生活垃圾无害化处理量将约为1 83亿吨 考点四独立性检验1 2 2列联表设两个变量a b 每一个变量都可以取两个值 变量a a1 a2 变量b b1 b2 则2 2列联表如下 2 k2的计算公式k2 其中n a b c d 3 两个分类变量a和b是否有关系的判断方法 1 当k2 2 706时 没有充分的证据判定变量a b有关联 可以认为变量a b没有关联 2 当k2 2 706时 有90 的把握判定变量a b有关联 3 当k2 3 841时 有95 的把握判定变量a b有关联 4 当k2 6 635时 有99 的把握判定变量a b有关联 5 当k2 10 828时 有99 9 的把握判定变量a b有关联 典型例题 2017课标全国 19 12分 海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 1 记a表示事件 旧养殖法的箱产量低于50kg 估计a的概率 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 对这两种养殖方法的优劣进行比较 附 k2 解析 1 旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 因此 事件a的概率估计值为0 62 2 根据箱产量的频率分布直方图得列联表 k2 15 705 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 3 箱产量的频率分布直方图表明 新养殖法的箱产量平均值 或中位数 在50kg到55kg之间 旧养殖法的箱产量平均值 或中位数 在45kg到50kg之间 且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高 因此 可以认为新养殖法的箱产量较高且稳定 从而新养殖法优于旧养殖法 独立性检验的一般步骤 1 根据样本数据制成2 2列联表 2 根据公式k2 计算k2的值 3 查表比较k2与临界值的大小关系 作统计判断 方法归纳 跟踪集训 2017甘肃张掖第一次诊断 中央政府为了应对因人口老龄化而造成的劳动力短缺等问题 拟定出台 延迟退休年龄政策 为了了解人们对 延迟退休年龄政策 的态度 责成人社部进行调研 人社部从网上年龄在15 65的人群中随机调查100人 调查数据的频率分布直方图和支持 延迟退休 的人数与年龄的统计结果如下 1 由以上统计数据填2 2列联表 并判断是否有95 的把握认为以45岁为分界点的不同人群对 延迟退休年龄政策 的支持度有差异 2 若以45岁为分界点 从不支持 延迟退休 的人中按分层抽样的方法抽取8人参加某项活动 现从这8人中随机抽2人 求至少有1人是45岁以上的概率 附 k2 解析 1 因为k2 6 25 3 841 所以有95 的把握认为以45岁为分界点的不同人群对 延迟退休年龄政策 的支持度有差异 2 从不支持 延迟退休 的人中 45岁以下应抽6人 45岁以上应抽2人 记45岁以下的6人为1 2 3 4 5 6 45岁以上的2人为a b 则有1 2 3 4 5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 张家口市中石化2025秋招面试半结构化模拟题及答案电气仪控技术岗
- 大唐电力通辽市2025秋招性格测评常考题型与答题技巧
- 2025年潜水科目考试题及答案
- 石嘴山市中石油2025秋招笔试模拟题含答案行测综合英语
- 七台河市中石油2025秋招网申填写模板含开放题范文
- 中国移动汉中市2025秋招半结构化面试模拟30问及答案
- 黄冈市中石化2025秋招面试半结构化模拟题及答案油田勘探开发岗
- 那曲市中石油2025秋招面试半结构化模拟题及答案油气储运与管道岗
- 岳阳市中石化2025秋招面试半结构化模拟题及答案炼化装置操作岗
- 上饶市中石化2025秋招面试半结构化模拟题及答案炼油工艺技术岗
- 食材配送服务方案投标方案(技术方案)
- JT-T-1180.2-2018交通运输企业安全生产标准化建设基本规范第2部分:道路旅客运输企业
- 中国省市县行政区划
- 快手磁力聚星星选达人认证考试试卷答案
- 一元二次方程-相似三角形-锐角三角函数复习
- 冰皮月饼的制作方法课件
- 在职党员到社区报到登记表“双报到”登记表
- 降低10炉脱硝系统液氨消耗量0
- 地下储藏室产权使用权转让协议
- 高考专题复习:小说专题训练人称的交替使用
- 大数据在高速公路收费稽查打逃方面的应用
评论
0/150
提交评论