



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、章末复习 第二章统计 学习目标 XUEXIMUBIAO 1.梳理本章知识,构建知识网络. 2.会根据不同的特点选择适当的抽样方法获得样本数据. 3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计 总体. 4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进 行预测. NEIRONGSUOYIN 内容索引 知识梳理 题型探究 达标检测 1知识梳理 PART ONE 1.抽样方法 (1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时, 以位数较多的为准,在位数较少的数前面添“0”,凑齐位数. (2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽
2、样间隔为k ; 如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽 样间隔为k (其中KN多余个体数). (3)三种抽样方法的异同点 类别共同点各自特点相互联系适用范围 简单随机 抽样 抽样过程 中每个个 体被抽到 的可能性 相同 从总体中逐个抽取 总体中的个体数 较少 系统抽样 将总体平均分成几 部分,按事先确定 的规则分别在各部 分中抽取 在起始部分抽样 时,采用简单随 机抽样 总体中的个体数 较多 分层抽样 将总体分成几层, 按各层个体数之比 抽取 在各层抽样时采 用简单随机抽样 或系统抽样 总体由差异明显 的几部分组成 2.用样本估计总体 (1)用样本估计总体 用样本
3、频率分布估计总体频率分布时,通常要对给定的一组数据作频率_ 与频率 .当样本只有两组数据且样本容量比较小时,用 刻画 数据比较方便. (2)样本的数字特征 样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括 、 和 ;另一类是反映样本数据波动大小的,包括 及 . 分布直方图茎叶图 分布表 众数 中位数平均数方差标准差 3.变量间的相关关系 (1)两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判 断这两个变量最接近于哪种确定性关系(函数关系). (2)求回归方程的步骤: 散点图 2题型探究 PART TWO 题型一抽样方法 例1(1)大、中、小三个盒子中分别装有同一产品1
4、20个、60个、20个,现在 需从这三个盒子中抽取一个容量为25的样本,较为恰当的抽样方法是 A.分层抽样 B.系统抽样 C.简单随机抽样 D.以上三种均可 解析总体无明显差异,但总体中个体数较多,故采用系统抽样较恰当. (2)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果, 企业统计员制作了如下的表格: 产品类别ABC 产品数量(件)1 300 样本数量(件)130 由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产 品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是 _件. 800 解析设C产品的样本数量为n,则A产品的样本数
5、量为n10, 反思感悟系统抽样的特点是“等距离”抽样,分层抽样的特点是“等比 例”抽样. 跟踪训练1某高级中学有学生270人,其中一年级108人,二、三年级各81人. 现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样 和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三 年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号为 1,2,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况: 7,34,61,88,115,142,169,196,223,250; 5,9,100,107,111,121,180,195,200,265;
6、 11,38,65,92,119,146,173,200,227,254; 30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是 A.都不能为系统抽样B.都不能为分层抽样 C.都可能为系统抽样D.都可能为分层抽样 则在号码段1,2,108中抽取4个号码,在号码段109,110,189中抽取3 个号码,在号码段190,191,270中抽取3个号码,符合,所以 可能是分层抽样,不符合,所以不可能是分层抽样; 如果按系统抽样时,抽出的号码应该是“等距”的,符合,不符合, 所以都可能为系统抽样,都不能为系统抽样. 题型二用样本的频率分布估计总体
7、 例2某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个,测得 每个球的直径(单位:mm,保留两位小数)如下: 40.0340.0039.9840.0039.9940.0039.98 40.0139.9839.9940.0039.9939.9540.01 40.0239.9840.0039.9940.0039.96 (1)完成下面的频率分布表,并画出频率分布直方图; 分组频数频率 39.95,39.97) 39.97,39.99) 39.99,40.01) 40.01,40. 03 合计 解频率分布表如下: 分组频数频率 39.95,39.97)20.105 39.97,39.99
8、)40.2010 39.99,40.01)100.5025 40.01,40. 03 40.2010 合计201.0050 频率分布直方图如图. (2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数为 10 000,试根据抽样检查结果估计这批产品的合格个数. 解抽样的20个产品中在39.98,40.02范围内的有17个, 10 00085%8 500. 故根据抽样检查结果,可以估计这批产品的合格个数为8 500. 反思感悟总体分布中相应的统计图表主要包括:频率分布表、频率分布 直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估 计总体. 跟踪训练2从高三学
9、生中抽取50名同学参加数学竞赛,成绩的分组及各组的 频数如下:(单位:分) 40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8. (1)列出样本的频率分布表; 解频率分布表如下. 成绩分组频数频率频率/组距 40,50)20.040.004 50,60)30.060.006 60,70)100.20.020 70,80)150.30.030 80,90)120.240.024 90,10080.160.016 合计501.000.100 (2)画出频率分布直方图和频率分布折线图; 解频率分布直方图和折线图如图所示: (3)估计成绩在
10、60,90)分的学生比例. 解成绩在60,90)分的学生比例为0.20.30.240.7474%. 题型三用样本的数字特征估计总体的数字特征 例3为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽 样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样 本,样本数据的茎叶图如图. (1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数, 并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格); 解设甲校高三年级学生总人数为n. 样本中甲校高三年级学生数学成绩不及格的人数为5, (75)(55814)(241265)(26247
11、9)(2220)92 249537729215. 反思感悟样本的数字特征分为两大类:一类是反映样本数据集中趋势的特 征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和 标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和 方差(标准差),从而实现对总体的估计. 跟踪训练3对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观 测值如下: 甲6080709070 乙8060708075 问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡? 核心素养之数学运算与数据分析 HEXINSUYANGZHISHUXUEYUNSUANYUSHUJUFENXIHEXINSUYA
12、NGZHISHUXUEYUNSUANYUSHUJUFENXI 线性回归及应用 典例理论预测某城市2020到2024年人口总数与年份的关系如下表所示: 年份202x(年)01234 人口数y(十万)5781119 (1)请画出上表数据的散点图; 解数据的散点图如图: (2)指出x与y是否线性相关; 解由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关. (3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回 归方程 ; (4)据此估计2025年该城市人口总数. (参数数据:051728311419132,021222324230) 故2025年该城市人口总数约为
13、196万. 素养评析(1)最小二乘法估计的三个步骤 作出散点图,判断是否线性相关. 如果是,则用公式求 ,写出回归方程. 根据方程进行估计. (2)线性回归的应用,注意三个方面,一是收集数据,二是准确计算求得回归 方程,三是用回归方程进行估计预测,所以,这类题目培养的数学核心素养 为数学运算与数据分析. 3达标检测 PART THREE 1.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准 差是 A.1 B.2 C.3 D.4 12345 解析设这10个数为a1,a2,a10, 123 2.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是 4x
14、250,则当施肥量为50 kg时,可以预测小麦的产量为_kg. 450 解析直接将x50代入回归方程中, 54 123 3.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均 分为_. 75 解析利用组中值估算平均分,则有 550.1 650.2750.4850.2950.175, 故估计这次考试的平均分为75. 54 1234 4.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次 试验,得到的数据如下: 零件的个数x(个)2345 加工的时间y(小时)2.5344.5 (1)在给定的坐标系中画出表中数据的散点图; 5 1234 解散点图如图. 5 12345
15、12345 1234 (3)试预测加工10个零件需要多少小时? 解将x10代入线性回归方程, 5 故加工10个零件约需要8.05小时. 1234 5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和 195 cm之间,将测量结果按如下方式分成八组;第一组155,160),第二组 160,165),第八组190,195.如图是按上述分组方法得到的频率分布直 方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4. 5 (1)求第七组的频率; 12345 (2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的 人数. 12345 1
16、234 解身高在第一组155,160)的频率为0.00850.04, 身高在第二组160,165)的频率为0.01650.08, 身高在第三组165,170)的频率为0.0450.2, 身高在第四组170,175)的频率为0.0450.2, 由于0.040.080.20.320.5,0.040.080.20.20.520.5, 估计这所学校的800名男生的身高的中位数为m, 则170m175, 由0.040.080.2(m170)0.040.5,得m174.5,所以可估计这所学校 的800名男生的身高的中位数为174.5, 由频率分布直方图得后三组频率为0.060.080.00850.18, 所以身高在180 cm以上(含180 cm)的人数为0.18800144. 5 1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学生实习协议书范本完整版
- 2025年建筑工程施工授权协议示例
- 2025年陈思婚姻协议书模板
- 2025年无债务房产转让男方离婚策划协议书
- 2025年授权代付服务协议样本
- 2025年品牌联合推广协议模板
- 2025年公园绿化维护服务协议样本
- 2025年十堰市汽车销售协议书
- 2025年珠宝订购协议样式
- 2025年广告公司共荣发展协议范本
- 火龙罐综合灸疗法
- 新能源领域的隐患治理
- 物品借出申请表
- 2021上海慢行交通规划设计导则
- EOD项目策划、融资、落地、偏差、风险
- 汉堡店创业计划书
- 王洪图黄帝内经80课时讲稿
- GB/T 10322.1-2023铁矿石取样和制样方法
- 二手车鉴定评估表
- 中国思想史 马工程329P
- 2023年高考全国新高考1卷英语含答案(适用地区山东、广东、湖南、湖北、河北、江苏、福建、浙江)
评论
0/150
提交评论