2023届一轮复习北师大版 第9章 第2节用样本估计总体 学案_第1页
2023届一轮复习北师大版 第9章 第2节用样本估计总体 学案_第2页
2023届一轮复习北师大版 第9章 第2节用样本估计总体 学案_第3页
2023届一轮复习北师大版 第9章 第2节用样本估计总体 学案_第4页
免费预览已结束,剩余10页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 用样本估计总体考试要求1了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题1常用统计图表(1)频率分布表的画法第一步:求极差,决定组数和组距,组距eq f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表(

2、2)频率分布直方图:反映样本频率分布的直方图横轴表示样本数据,纵轴表示eq f(频率,组距),每个小矩形的面积表示样本落在该组内的频率(3)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线(4)茎叶图的画法第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将各个数据的茎按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧2样本的数字特征(1)众数:一组数据中出现次数最多的

3、那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(3)平均数:把eq xto(x)eq f(x1x2xn,n)称为x1,x2,xn这n个数的平均数(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为eq xto(x),则这组数据的标准差和方差分别是seq r(f(1,n)x1xto(x)2x2xto(x)2xnxto(x)2);s2eq f(1,n)(x1eq xto(x)2(x2eq xto(x)2(xneq xto(x)2常用结论1频率分布直方图的三个结论(1)小长方形的面积组距eq f(

4、频率,组距)频率(2)各小长方形的面积之和等于1(3)小长方形的高eq f(频率,组距),所有小长方形高的和为eq f(1,组距)2平均数、方差的公式推广(1)若数据x1,x2,xn的平均数为eq xto(x),那么mx1a,mx2a,mx3a,mxna的平均数是meq o(xto(x)a(2)数据x1,x2,xn的方差为s2数据x1a,x2a,xna的方差也为s2;数据ax1,ax2,axn的方差为a2s2一、易错易误辨析(正确的打“”,错误的打“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的方差越大,说明这组数据越集中()(3)频率分布直方图中,小矩

5、形的面积越大,表示样本数据落在该区间的频率越大()(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()答案(1)(2)(3)(4)二、教材习题衍生1一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A4B8C12D16B设频数为n,则eq f(n,32)0.25,n32eq f(1,4)82若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A91.5和91.5B91.5和92C91和91.5D92和92A这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数是eq f(9192,2)91.5,平均

6、数eq xto(x)eq f(8789909192939496,8)91.53如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民有_人25用水量为2,2.5)的频率为0.50.50.25,则用水量为2,2.5)的居民有1000.2525(人)4已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_0.15个数的平均数eq xto(x)eq f(4.74.85.15.45.5,5)5.1,所以它们的方差s2eq f(1,5)(4.75.1)2(4.85.1)2(5.15.1)2(5.45.1)2(5.55.1)20.1 考点一扇形图和折线图(1

7、)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势1(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A设新农村建设前经济收入的总量为x,则新农村建设后经济

8、收入的总量为2x建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确2某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12

9、月,波动性更小,变化比较平稳A对于选项A,由题图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由题图可知显然正确故选A 考点二茎叶图茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小1如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且

10、平均值也相等,则x和y的值分别为()A3,5B5,5C3,7D5,7A由两组数据的中位数相等可得6560y,解得y5,又它们的平均值相等,所以eq f(1,5)56626574(70 x)eq f(1,5)(5961676578),解得x3,故选A2在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A1B2C3D4B由题图可知该组数据的极差为482028,则该组数据的中位数为612833,易得被污染的数字为2,故选B3甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为eq xto(x)甲,

11、eq xto(x)乙,则下列结论正确的是()Aeq xto(x)甲eq xto(x)乙;乙比甲得分稳定Beq xto(x)甲eq xto(x)乙;甲比乙得分稳定Ceq xto(x)甲eq xto(x)乙;乙比甲得分稳定Deq xto(x)甲eq xto(x)乙;甲比乙得分稳定A因为eq xto(x)甲eq f(2781622,5)11,eq xto(x)乙eq f(812182125,5)16.8,所以eq xto(x)甲eq xto(x)乙且乙比甲成绩稳定,故选A点评:第3题,从数据重心位置及数据离散程度,亦可知道答案 考点三频率分布直方图1由频率分布直方图进行相关计算时,需掌握的两个关系式

12、(1)eq f(频率,组距)组距频率(2)eq f(频数,样本容量)频率,此关系式的变形为eq f(频数,频率)样本容量,样本容量频率频数2利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标典例1(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同

13、经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200.15,故a0.35b10.050.150.700.10(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.20

14、80.156.00点评:频率分布直方图中各小长方形的面积之和为1,在求参数的值时,经常用到这个结论跟进训练1(2021成都模拟)在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是()A成绩在70,80)分的考生人数最多B不及格的考生人数为1 000人C考生竞赛成绩的平均分约70.5分D考生竞赛成绩的中位数为75分D由频率分布直方图可得,成绩在70,80)的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在40,60)的频率为0.25,因此,不及格的人数为4 0000.251 000,故B正

15、确;由频率分布直方图可得:平均分等于450.1550.15650.2750.3850.15950.170.5,故C正确;因为成绩在40,70)的频率为0.45,由70,80)的频率为0.3,所以中位数为7010eq f(0.05,0.3)71.67,故D错误故选D2我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年100位居民每人的月均用水量(单位:吨)将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;

16、(3)估计居民月均用水量的中位数解(1)由频率分布直方图可知:月均用水量在0,0.5)内的频率为0.080.50.04同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.060.040.020.12由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.1236 000(3)设中位数为x吨因为

17、前5组的频率之和为0.040.080.150.210.250.730.5,又前4组的频率之和为0.040.080.150.210.480.5,所以2x2.5由0.50(x2)0.50.48,解得x2.04故可估计居民月均用水量的中位数为2.04吨 考点四样本的数字特征利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小;标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征样本数字特征的计算典例21(1)(2019全国卷)我

18、国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_(2)(2021全国卷乙)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为eq x

19、to(x)和eq xto(y),样本方差分别记为seq oal(2,1)和seq oal(2,2)求eq xto(x),eq xto(y),seq oal(2,1),seq oal(2,2);判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果eq xto(y)eq xto(x)2eq r(f(soal(2,1)soal(2,2),10),则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)(1)0.98eq xto(x)eq f(100.97200.98100.99,102010)0.98则经停该站高铁列车所有车次的平均正点率的估计值为0.98(2)解由表

20、格中的数据易得:eq xto(x)eq f(0.20.300.20.10.200.10.20.3,10)10.010.0,eq xto(y)eq f(0.10.40.100.10.30.60.50.40.5,10)10.010.3,seq oal(2,1)eq f(1,10)(9.710.0)22(9.810.0)2(9.910.0)22(10.010.0)2(10.110.0)22(10.210.0)2(10.310.0)20.036,seq oal(2,2)eq f(1,10)(10.010.3)23(10.110.3)2(10.310.3)22(10.410.3)22(10.510.3)

21、2(10.610.3)20.04由中数据可得eq xto(y)eq xto(x)10.310.00.3,而2eq r(f(soal(2,1)soal(2,2),10)eq r(f(2,5)soal(2,1)soal(2,2)eq r(0.030 4),显然有eq xto(y)eq xto(x)2eq r(f(soal(2,1)soal(2,2),10)成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高点评:本例中实际上就是用样本的平均数估计总体平均数样本的数字特征与频率分布直方图或茎叶图交汇典例22(2019全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企

22、业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表y的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)附:eq r(74)8.602解(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为eq f(147,100)0.21产值负增长的企业频率为eq f(2,100)0.02用样本频率分布估

23、计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%(2)eq xto(y)eq f(1,100)(0.1020.10240.30530.50140.707)0.30,s2eq f(1,100)eq o(,sup8(5),sdo8(i1)ni(yieq xto(y)2eq f(1,100)(0.40)22(0.20)22402530.202140.40270.029 6,seq r(0.029 6)0.02eq r(74)0.17所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17点评:求标准差时,应先求平均数,再求方差,最后求标准差跟进训练1(2021新高考卷改编)有一组样本数据x1,x2,xn,由这组数据得到新样本数据y1,y2,yn,其中yixic(i1,2,n),c为非零常数,则下列结论成立的是()两组样本数据的样本平均数相同;两组样本数据的样本中位数相同;两组样本数据的样本标准差相同;两组样本数据的样本极差相同ABCDC设样本数据x1,x2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论