




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计 统计案例 一 主干知识1 三种抽样方法 和 2 利用样本估计总体 1 利用样本的频率分布估计总体分布 频率分布表和频率分布直方图 茎叶图 简单随机抽样 系统抽样 分层抽样 2 利用样本的数字特征估计总体的数字特征 两差 与 最多 方差 标准差 二 必记公式1 数据x1 x2 xn的平均数 方差与标准差公式 1 平均数 2 方差 s2 3 标准差 s 2 回归直线方程 一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 其回归方程的截距和斜率分别为其中其过样本点中心 3 独立性检验 其中n a b c d为样本容量 1 2013 长春模拟 从某项综合能力测试中抽取100人的成绩 统计如表 则这100人成绩的标准差为 解析 选b 因为平均数是 所以所以 2 2013 福建高考 已知x与y之间的几组数据如下表 假设根据上表数据所得线性回归直线方程为若某同学根据上表中的前两组数据 1 0 和 2 2 求得的直线方程为y b x a 则以下结论正确的是 解析 选c 过 1 0 和 2 2 的直线方程为y 2x 2 画出六点的散点图 回归直线的大概位置如图所示 显然 3 2013 湖北高考 从某小区抽取100户居民进行月用电量调查 发现其用电量都在50至350度之间 频率分布直方图如图所示 1 直方图中x的值为 2 在这些用户中 用电量落在区间 100 250 内的户数为 解析 1 50 x 1 50 0 0012 0 0024 2 0 0036 0 0060 0 22 x 0 0044 2 100 0 18 0 3 0 22 70 答案 1 0 0044 2 70 4 2013 重庆模拟 某商场有来自三个国家的奶制品 其中a国 b国 c国的奶制品分别有40种 10种 30种 现从中抽取一个容量为16的样本进行三聚氰胺检测 若采取分层抽样的方法 则抽取来自b国的奶制品 种 解析 分层抽样即按比例抽样 共需抽取b国奶制品答案 2 热点考向1抽样方法 典例1 1 从编号为1 50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验 若采用每部分选取的号码间隔一样的系统抽样方法 则所选取5枚导弹的编号可能是 5 10 15 20 25 3 13 23 33 43 1 2 3 4 5 2 4 6 16 32 2 2013 合肥模拟 某校500名学生中 o型血有200人 a型血有125人 b型血有125人 ab型血有50人 为了研究血型与色弱的关系 需从中抽取一个容量为20的样本 按照分层抽样方法抽取样本 则从o型血 a型血 b型血 ab型血的人中分别抽 人 解题探究 1 本题用系统抽样抽取的间隔为 2 本题分层抽样比为 10 解析 1 用系统抽样的方法抽取的导弹编号应该是k k d k 2d k 3d k 4d 其中k是1到10中用简单随机抽样方法得到的数 因此只有选项 满足要求 答案 2 由已知得分层的抽样比为 所以抽取o型血人数为 抽取a型血人数为 抽取b型血人数为 抽取ab型血人数为 答案 8 5 5 2 方法总结 1 进行系统抽样的关键及关注点 1 关键 根据总体和样本的容量确定分段间隔 根据第一段确定编号 2 关注点 当总体不能被样本整除时 应采用等可能剔除的方法剔除部分个体 以获取整数间隔 2 分层抽样的适用条件及注意点 1 适用条件 适用于总体由差异明显的几部分组成时的情况 2 注意点 分层抽样中分多少层 如何分层要视具体情况而定 总的原则是 层内样本的差异要小 两层之间的样本差异要大 且互不重叠 为了保证每个个体等可能入样 所有层中每个个体被抽到的可能性相同 在每层抽样时 应采用简单随机抽样或系统抽样的方法进行抽样 变式训练 1 从2014名学生中选取50名学生参加英语比赛 若采用下面的方法选取 先用简单随机抽样从2014人中剔除14人 剩下的2000人再按系统抽样的方法抽取50人 则在2014人中 每人入选的概率 a 不全相等b 均不相等c 都相等 且为d 都相等 且为 2 2013 天津模拟 一个社会调查机构就某地居民的月收入调查了20000人 并根据所得数据画出了样本频率分布直方图 为了分析居民的收入与年龄 学历 职业等方面的关系 按月收入用分层抽样方法抽样 若从月收入 3000 3500 元 段中抽取了30人 则这20000人中共抽取的人数为 a 200b 100c 20000d 40 解析 1 选c 设个体为a a入选必须同时具备不被剔除和按照系统抽样能够入选 a不被剔除的概率是a按照系统抽样入选的概率是这两个事件同时发生则a入选 故个体a入选的概率是 2 选a 由题意得 月收入在 3000 3500 元 段中的频率是0 0003 500 0 15 该收入段的人数是20000 0 15 3000 从中抽取了30人 说明从每100人中抽取1人 故共抽取 热点考向2样本的频率分布 数字特征 典例2 1 甲 乙两名运动员在某项测试中的8次成绩如茎叶图所示 分别表示甲 乙两名运动员这项测试成绩的平均数 s1 s2分别表示甲 乙两名运动员这项测试成绩的标准差 则有 2 2013 北京模拟 某市电视台为了宣传环境保护举办问答活动 随机对该市15 65岁的人群抽样了n人回答问题 统计结果如所给频率分布表和频率分布直方图所示 分别求出a b x y的值 从第2 3 4组回答正确的人中用分层抽样的方法抽取6人 则第2 3 4组每组应各抽取多少人 解题探究 1 本题甲运动员的8次成绩为 乙运动员的8次成绩为 2 由频率分布直方图知第1 5组的频率分别为 n 第2 3 4组回答正确的人数比为 8 9 14 15 15 16 21 22 7 8 13 15 15 17 22 23 0 1 0 2 0 3 0 25 0 15 100 2 3 1 解析 1 选b 由已知茎叶图知 故有 2 第1组人数5 0 5 10 所以n 10 0 1 100 第2组人数100 0 2 20 所以a 20 0 9 18 第3组人数100 0 3 30 所以x 27 30 0 9 第4组人数100 0 25 25 所以b 25 0 36 9 第5组人数100 0 15 15 所以y 3 15 0 2 第2 3 4组回答正确的人数比为18 27 9 2 3 1 所以第2 3 4组每组应各依次抽取2人 3人 1人 互动探究 题 2 在 的前提下 电视台决定在所抽取的6人中随机抽取2人颁发幸运奖 则抽取人中第2组至少有一人获得幸运奖的概率为多少 解析 记抽取的6人中 第2组的记为a1 a2 第3组的记为b1 b2 b3 第4组的记为c 则从6人中任取2名的所有可能的情况有15种 它们是 a1 a2 a1 b1 a1 b2 a1 b3 a1 c a2 b1 a2 b2 a2 b3 a2 c b1 b2 b1 b3 b1 c b2 b3 b2 c b3 c 其中第2组至少有1人的情况有9种 它们是 a1 a2 a1 b1 a1 b2 a1 b3 a1 c a2 b1 a2 b2 a2 b3 a2 c 故所求概率为 方法总结 1 用样本估计总体的两种方法 1 用样本的频率分布 频率分布表 频率分布直方图 茎叶图等 估计总体的频率分布 2 用样本的数字特征 众数 中位数 平均数 方差 标准差 估计总体的数字特征 2 方差的计算与含义计算方差首先要计算平均数 然后再按照方差的计算公式进行计算 方差和标准差是描述一个样本和总体的波动大小的特征数 标准差大说明波动大 3 众数 中位数 平均数与频率分布直方图的关系 1 众数为频率分布直方图中最高矩形的底边中点的横坐标 2 中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标 3 平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 变式备选 2013 辽宁高考 为了考察某校各班参加课外书法小组的人数 从全校随机抽取5个班级 把每个班级参加该小组的人数作为样本数据 已知样本平均数为7 样本方差为4 且样本数据互不相同 则样本数据中的最大值为 解析 由定义知 样本的方差是各个数据与平均数之差的平方的平均数 若设互不相同的样本数据分别为x1 x2 x3 x4 x5 且x1 x2 x3 x4 x5 xi n i 1 2 3 4 5 则有 x2 7 2 x3 7 2 x4 7 2 x5 7 2 4 即 x1 7 2 x2 7 2 x3 7 2 x4 7 2 x5 7 2 20 若样本数据中的最大值为11 不妨设x5 11 则可得 x1 7 2 x2 7 2 x3 7 2 x4 7 2 4 由于样本数据互不相同 这是不可能成立的 若样本数据为4 6 7 8 10 代入验证可知符合题目要求 此时x5的最大值为10 故样本数据中的最大值为10 答案 10 热点考向3线性回归分析与独立性检验在实际中的应用 典例3 1 2013 广州模拟 某工厂的某种型号的机器的使用年限x 年 和所支出的维修费用y 万元 有下表的统计资料 根据上表可得回归方程据此模型估计 该型号机器使用年限为10年时维修费用约 万元 2 2013 合肥模拟 某校高一年级理科有8个班 在一次数学考试中成绩情况分析如下 求145分以上人数y对班级序号x的回归直线方程 精确到0 0001 能否在犯错误的概率不超过0 01的前提下 或有99 的把握 认为7班与8班的成绩是否优秀 大于145分 与班级有关系 解题探究 1 本题样本点中心为 2 求回归直线方程的步骤 计算 求 得回归直线方程 4 5 0 08 4 5 5 0 2143 5 9644 解析 1 由表知又在回归直线上 所以所以当x 10时 1 23 10 0 08 12 38 答案 12 38 2 所以回归直线方程为 因为1 8 6 635 不能在犯错误的概率不超过0 01的前提下认为7班与8班的成绩是否优秀 大于145分 与班级有关系 方法总结 1 求回归直线方程的关键及实际应用 1 关键 正确理解计算的公式和准确的计算 2 实际应用 在分析实际中两个变量的相关关系时 可根据样本数据作出散点图来确定两个变量之间是否具有相关关系 若具有线性相关关系 则可通过线性回归方程估计和预测变量的值 2 独立性检验的关键根据2 2列联表准确计算k2 若2 2列联表没有列出来 要先列出此表 变式训练 2013 厦门模拟 某班同学利用国庆节进行社会实践 对 25 55 岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查 若生活习惯符合低碳观念的称为 低碳族 否则称为 非低碳族 得到如下统计表和各年龄段人数频率分布直方图 1 补全频率分布直方图并求n a p的值 2 为调查该地区的年龄与生活习惯是否符合低碳观念有无关系 调查组按40岁以下为青年 40岁以上 含40岁 为老年分成两组 请你先完成下列2 2列联表 并判断在犯错误的概率不超过0 001的前提下 或能否有99 9 的把握 认定该地区的生活习惯是否符合低碳观念与人的年龄有关 参考公式 解析 1 第一组的人数为频率为0 04 5 0 2 所以由题可知 第二组的频率为0 3 所以第二组的人数为1000 0 3 300 所以第四组的频率为0 03 5 0 15 所以第四组的人数为1000 0 15 150 所以a 150 0 4 60 2 完成表格代入公式在犯错误的概率不超过0 001的前提下 或有99 9 的把握 认为该地区的生活习惯是否符合低碳观念与人的年龄有关 数形结合思想 解决与频率分布直方图 茎叶图有关的问题 思想诠释 1 主要类型 1 由频率分布直方图或茎叶图估计总体分布或其数字特征 三 数 两 差 2 由频率分布直方图各矩形的面积得出各段的频率 3 由频率分布直方图各段的频率得出各段的个体数 2 解题思想 结合给出的频率分布直方图或茎叶图 搜索出我们需要的数据信息 进而通过计算求解问题 3 注意事项 1 认真观察图表 准确将图形语言转化为数字语言 2 频率分布直方图中的每一个矩形的面积是数据落在该区间上的频率 所有小矩形的面积之和等于1 典例 12分 2013 惠州模拟 某校从高一年级学生中随机抽取40名学生 将他们的期中考试数学成绩 满分100分 成绩均为不低于40分的整数 分成六段 40 50 50 60 90 100 后得到如图所示的频率分布直方图 1 求图中实数a的值 2 若该校高一年级共有640名学生 试估计该校高一年级期中考试数学成绩不低于60分的人数 3 若从数学成绩在 40 50 与 90 100 两个分数段内的学生中随机选取两名学生 求这两名学生的数学成绩之差的绝对值不大于10的概率 审题 分析信息 形成思路 1 切入点 根据面积和等于1构建方程 关注点 注意各小矩形的高 2 切入点 人数为640人与成绩不低于60分的频率的积 关注点 图中成绩不低于60分的频率 3 切入点 分别计算从两个分数段内随机抽取2名学生的取法总数与所取两名学生数学成绩之差的绝对值不大于10的取法数 关注点 将这两名学生的数学成绩之差的绝对值不大于10 分类计数 解题 规范步骤 水到渠成 1 由于图中所有小矩形的面积之和等于1 所以10 0 005 0 010 0 020 a 0 025 0 010 1 解得a 0 030 2分 2 根据频率分布直方图 成绩不低于60分的频率为1 10 0 005 0 010 0 85 由于该校高一年级共有640名学生 利用样本估计总体的思想 可估计该校高一年级数学成绩不低于60分的学生数约为640 0 85 544 名 5分 3 成绩在 40 50 分数段内的学生数为40 0 05 2 名 成绩在 90 100 分数段内的学生数为40 0 1 4 名 7分设从 40 50 分数段的2名学生分别为a1 a2 从 90 100 分数段的4名学生分别为b1 b2 b3 b4 则从6名学生中抽取2名学生的情况为 a1 a2 a1 b1 a1 b2 a1 b3 a1 b4 a2 b1 a2 b2 a2 b3 a2 b4 b1 b2 b1 b3 b1 b4 b2 b3 b2 b4 b3 b4 共15种 9分 如果两名学生的数学成绩都在 40 50 分数段内或都在 90 100 分数段内 那么这2名学生的数学成绩之差的绝对值一定不大于10 如果一名学生的数学成绩在 40 50 分数段内 另一名学生的数学成绩在 90 100 分数段内 那么这2名学生的数学成绩之差的绝对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年智慧农业行业技术创新与市场前景研究报告
- 2025年清洁能源行业市场前景预测报告
- 固定铰支座课件
- 2025年生物科技行业生物信息学应用前景研究报告
- 国家事业单位招聘2025中外文化交流中心招聘2人笔试历年参考题库附带答案详解
- 国家事业单位招聘2025中国建筑文化中心招聘应届毕业生3人笔试历年参考题库附带答案详解
- 内江市2025上半年四川内江市威远县人力资源和社会保障局考核招聘事业单位人员1人笔试历年参考题库附带答案详解
- 万州区2025二季度重庆万州事业单位招聘222人笔试历年参考题库附带答案详解
- 2025重庆市大足区国衡商贸股份有限公司招聘大足区环境卫生工作人员12人笔试参考题库附带答案详解
- 2025浙江湖州市安吉县产业投资发展集团有限公司下属子公司招考14人笔试参考题库附带答案详解
- 快手运营课程培训课件
- 庭院绿化施工方案
- 《大学语文》课件 第16讲 智在纵横 苏秦始将连横
- 医院工作纪律培训课件
- 营房装修施工方案(3篇)
- 开远美景家乡课件
- 2025至2030中国仿制药行业市场深度分析及前景趋势与投资报告
- 监测数据智能分析
- 临床基于ERAS理念下医护患一体化疼痛管理实践探索
- 外科术后患者营养宣教要点
- 安全技术交底书
评论
0/150
提交评论