




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第03讲用样本估计总体
学习目标
课程标准学习目标
1.结合实例,能用样本估计总体的集中趋势
参数(平均数、中位数、众数),理解集中趋
势参数的统计含义.
2.结合实例,能用样本估计总体的离散程度
参数(标准差、方差、极差),理解离散程度1.能用样本的数字特征估计总体的数字特征.
参数的统计含义.2.用样本的分布估计总体的分布
3.结合实例,能用样本估计总体的取值规3.通过用样本估计总体提升数据分析素养、数学运算素
律.养和逻辑推理素养.
4.结合实例,能用样本估计百分位数,理解
百分位数的统计含义
5.结合具体实例,掌握分层抽样的样本均值
和样本方差.
02思维导图
1.用样本数估计总体数
2.样本平均数估计总体平均数
3.样本方差估计总体方差
4.样本分布估计总体分布
03知识清单
知识点01用样本估计总体
1.用样本估计总体
⑴前提
样本的容量恰当,抽样方法合理.
⑵必要性
①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力等.
②有时候总体的数字特征不可能获得,只能用样本估计总体.
(3)误差
估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能
性将越来越大.
【即学即练1】(多选)对于用样本分布估计总体分布的过程,下列说法不正确的是()
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
知识点02用样本的数字特征来估计总体的数字特征
(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
(2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件假设第一层有m个数,分别为XI,X2,…,Xm,平均数为礼方差为s2;第二层有n个数,
分别为yi,y2,…,yn,平均数为歹,方差为t2.
结论
如果记样本均值为a,样本方差为b2,则五=些变,力2=」_(租$2+九严)+叵一歹)2,
m+nm+nm+n
【即学即练2】李大伯承包了一个果园,种植了100棵樱桃树,今年己进入收获期,收获时,从中任
选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号12345678910
质量/千克14212717182019231922
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量
与按批发价格销售樱桃所得的总收入分别约为()
A.200千克,3000元
B.1900千克,28700元
C.2000千克,30000元
D.1870千克,27770元
知识点03用样本的分布来估计总体的分布
如果总体在每一个分组的频率记为兀1,兀2,…,兀〃,样本在每一组对应的频率记为pi,P2,…,Pn,一
般来说,(阳不等于零.当样本的容量越来越大时,上式很小的可能性将越来越大.
nZ=1
【即学即练3】(多选)下列说法中正确的为()
A.数据的极差越小,样本数据分布越集中、稳定
B.数据的平均数越小,样本数据分布越集中、稳定
C.数据的标准差越小,样本数据分布越集中、稳定
D.数据的方差越小,样本数据分布越集中、稳定
知识点04“大数据”简介
凡是可以被“数据化”的信息载体都可以看成数据.信息载体包括的数据量达到一定的规模或者达到
一定的复杂程度,都可以被认为是“大数据”.
'P____________________
题型精讲
题型01用样本数估计总体数
【典例1】我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得
米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()
A.134石B.169石
C.338石D.1365石
【变式1】从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图,
则a的值为—,该市中学生中的全体男生的平均身高的估计值为—cm.
O140150160170180190200身高/cm
【变式2】为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画
出样本的频率分布直方图如图所示.根据此图,估计该校2000名高中男生中体重大于70.5公斤的人数为()
A.300B.380C.420D.470
【变式3】某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如
下:
成绩1分2分3分4分5分6分7分8分9分10分
人数6002423210
(1)求样本的均值;
(2)请问估计有多少学生可达7分(包括7分)以上?
题型02样本平均数估计总体平均数
【典例2】某校从参加高三模拟考试的学生中随机抽取80名学生,将其数学成绩(均为整数)分成六组
[90,100),[100,110),…,口40,150]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
频率
0.035
0.030
0.025
0.020
0.015
0.010
0.005
O9010010120130140150分数
(1)求分数在口20,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值(如组区间[100,110)的中点值为皿产2=105)作为这组
数据的平均分,据此,估计本次考试的平均分.
【变式1】(24-25高一上•四川成都•开学考试)廖老师为了了解学生周末利用网络进行学习的时间,在所任
教班级随机调查了10名学生,其统计数据如下表:
时间(单位:小时)43210
人数34111
则这10名学生周末利用网络进行学习的平均时间是小时.
【变式2】某公司为了了解广告投入对销售收益的影响,在若干地区各投入4万元广告费用,并将各地的销
售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从
0开始计数的.
(1)根据频率分布直方图计算图中各小长方形的宽度;
(2)估计该公司在若干地区各投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表
该组的取值).
【变式3】了解某医院急救中心病人的等待时间,现随机抽取20位病人,对他们的等待时间记录如下表:
等待时间/分钟[0,5)[5,10)[10,15)[15,20)[20,25]
频数48521
用上述数据估计该医院急救中心病人的平均等待时间为分钟.
【变式4】新冠肺炎疫情期间,某地为了解本地居民对当地防疫工作的满意度,从本地居民中随机抽取若干
居民进行评分(满分为100分),根据调查数据制成如下频率分布直方图.
频率
0.035
a-------------------------
0.020----------------------
0.014----------------1—
OO
OS.OO
f
分1
4050607080
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图估计本次评测分数的平均数(同一组中的数据用该组区间的中点值作代表,并精
确到0.1).
题型03样本方差估计总体方差
【典例3】(2024•浙江•三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分
层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估
计样本的方差不可熊为()
A.11B.13C.15D.17
【变式1】(2024•辽宁葫芦岛•二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分
层抽样,抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高
中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为
()
A.1.3B.1.5C.1.7D.1.9
【变式2】(23-24高一下•福建福州•期末)在对某中学高一年级学生身高(单位:cm)调查中,抽取了男生
20人,其平均数和方差分别为174和12,抽取了女生30人,其平均数和方差分别为164和30,根据这些
数据计算出总样本的平均数为,方差为.
【变式3](25-26高一上•全国•课后作业)2023年10月22日,2023襄阳马拉松成功举行,志愿者的服务
工作是马拉松成功举办的重要保障,某单位承办了志愿者选拔的面试工作.现随机抽取了100名候选者的
面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],
绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
⑴估计这100名候选者面试成绩的平均数.
(2)现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成
绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这
次第二组和第四组所有面试者的方差.
题型04总体百分数的估计
【典例4](24-25高三上•江苏苏州•开学考试)"绿水青山就是金山银山"的理念深入人心,人民群众的生态
环境获得感、幸福感、安全感不断提升.某校高一年级举行环保知识竞赛,共700人参加,若参赛学生成绩
的第80百分位数是80分,则关于竞赛成绩不小于80分的人数的说法正确的是()
A.至少为300人B.至少为200人
C.至多为300人D.至多为200人
【变式1】(24-25高二上•重庆・开学考试“绿水青山就是金山银山”的环境治理要求,
重庆市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x
(吨),一位居民的月用水量不超过X的部分按平价收费,超出X的部分按议价收费.为了了解居民用水情
况,通过抽样,获得了某年200位居民每人的月均用水量(单位:吨),将数据按照[0,1),[1,2),…,[8,9)
分成9组,制成了如图所示的频率分布直方图,其中0.4“=6.
⑴求直方图中人的值,并由频率分布直方图估计该市居民用水的平均数(每组数据用该组区间中点值作
为代表);
⑵设该市有40万居民,估计全市居民中月均用水量不低于2吨的人数,并说明理由;
⑶若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
【变式2](2024•四川南充•一模)甲同学近10次数学考试成绩情况如下:103,106,113,119,123,118,
134,118,125,121,则甲同学数学考试成绩的第75百分位数是()
A.118B.121C.122D.123
【变式3】(2024•贵州遵义期末)某景点某天接待了1270名游客,老年有625人,中青年有700人,少年有
125人,该景点为了提升服务质量,采用分层抽样从当天游客中抽取100人,以评分方式进行满意度回访.将
统计结果按照[70,80),[80,70),[70,80),[80,90),[90,100]分成5组,制成如下频率分布直方图:
(1)求抽取的样本中老年、中青年、少年的人数;
(2)求频率分布直方图中a的值;
(3)估计当天游客满意度分值的75%分位数;
(4)估计当天游客满意度分值不低于80分的人数.
题型05样本分布估计总体分布
【典例5】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据制作了样本的频率分布
直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层随
则在[2500,3000)段应抽出()
A.25人B.70人C.100人D.125人
【变式1】为了了解高一学生的体能情况,某校抽取部分学生进行1分钟跳绳测试,将所得数据整理后,画
出频率分布直方图(如图),图中从左到右各小矩形面积之比为2:4:17:15:9:3,第二小组频数为12.
(2)若次数在H0以上(含110)为达标,试估计该校全体高一学生的达标率是多少.
【变式2】某校为了解学生第一个“双减”后的暑假最期待什么活动,校学生会随机对该校七年级部分学生进
行了问卷调查,调查结果分为四个类别:A表示“广泛阅读”,B表示“劳动实践”,C表示“户外运动”,。表
示“其他”,每个同学只能选择其中的一项,根据调查统计结果,绘制成两种不完整的统计图.请结合统计图,
回答下列问题.
“双减”后的暑假最期待活动“双减”后的暑假最期待活动
扇形统计图
A;
(2)将条形统计图补充完整;
(3)该校七年级有800名学生,估计全校七年级学生中最期待“劳动实践”的约有多少名?
【变式3】为保障食品安全,某地食品药监管部门对辖区食品企业进行检查,从甲企业生产的某种同类产品
中随机抽取了100件作为样本,并以样本的一项关键质量指标值为检测依据.已知该质量指标值对应的产品
等级如下:
质量指标值[15,20)[20,25)[25,30)[30,35)[35,40)[40,45]
等级次品二等品一等品二等品三等品次品
根据质量指标值的分组,统计得到了甲企业的样本频率分布直方图(其中。>0).现从甲企业生产的产品中
任取一件,估计该件产品为次品的概率为.
05强化训练
一、单选题
1.(23-24高三上•天津•阶段练习)为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据
(单位:kg)进行分组,区间为[50,55),[55,60),[60,65),[65,70),[70,75],将其按从左到右的顺序分别编号
为第一组,第二组,……,第五组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率
之比为1:2:3,且第一组的频数为6,则报考飞行员的学生人数是()
1频率/组距
0.037...............----
O505560657075体重/kg
A.48B.5C.54D.80
2.(23-24高三下•河南•阶段练习)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在[50,100]
内,估计所有参赛同学成绩的第75百分位数为()
3.(2024高二下•湖北•学业考试)习近平总书记在致首届全民阅读大会的贺信中指出:"阅读是人类获取知
识、启智增慧、培养道德的重要途径,可以让人得到思想启发,树立崇高理想,涵养浩然之气;希望全社会
都参与到阅读中来,形成爱读书、读好书、善读书的浓厚氛围."为落实关于阅读的重要指示,复兴中
学开展了"读名著、品经典"活动.现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间f(单位:h),
分组整理数据得到如图所示的频率分布直方图,据此估计该校学生阅读时间不少于40h的概率为()
C.0.470D.0.870
4.(24-25高二上•海南海口•阶段练习)某学校高一年级在校人数为600人,其中男生350人,女生250人,
为了解学生身高发展情况,按分层随机抽样的方法抽出的男生身高为一个样本,其样本平均数为172cm,抽
出的女生身高为一个样本,其样本平均数为160cm,则该校高一学生的平均身高为()
A.162cmB.167cmC.164cmD.169cm
5.(24-25高二上•山东青岛•阶段练习)某校举行劳动技能大赛,统计了100名学生的比赛成绩,得到如图
所示的频率分布直方图,已知成绩均在区间[40,100]内,不低于90分的视为优秀,低于80分的视为不及格.
若同一组中数据用该组区间中间值做代表值,则下列说法中错送的是()
A.a=0.15B.优秀学生人数比不及格学生人数少15人
C.该次比赛成绩的平均分约为70.5D.这次比赛成绩的69%分位数为78
6.(24-25高三上•江苏苏州•开学考试)"绿水青山就是金山银山”的理念深入人心,人民群众的生态环境获
得感、幸福感、安全感不断提升.某校高一年级举行环保知识竞赛,共700人参加,若参赛学生成绩的第80
百分位数是80分,则关于竞赛成绩不小于80分的人数的说法正确的是()
A.至少为300人B.至少为200人
C.至多为300人D.至多为200人
7.(23-24高三上•河南•期中)某班男生人数是女生人数的两倍,某次数学考试中男生成绩(单位:分)的
平均数和方差分别为120和20,女生成绩的平均数和方差分别为123和17,则全班学生数学成绩的方差为
()
37
A.21B.19C.18D.—
2
8.(24-25高二上•河北邢台•开学考试)已知数据玉,马,无3,…,仆,满足:尤,■-尤T=1(2<?<10),若
去掉巧,心后组成一组新数据,则新数据与原数据相比,下列说法错误的是()
A.中位数不变B.第35百分位数不变C.平均数不变D,方差不变
二、多选题
9.(24-25高二上•海南省直辖县级单位•阶段练习)以下命题为真命题的是()
A.若样本数据毛,%,%,x41尤5,%的方差为2,则数据2%-1,2X2-1,2%一1,2%-1,2x5-1,
2%T的方差为8
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.数据0,1,2,4的极差与平均数之积为6
D.已知一组不完全相同的数据均,%,L,当的平均数为七,在这组数据中加入一个数七后得到一组
新数据%,4,%,L,Xn,其平均数为x,则X=X0
10.(2024•贵州黔东南•二模)某学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4000
名学生(该校男女生人数之比为3:2)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为
184,女生平均身高为180,方差为179.则下列说法正确的是参考公式:总体分为2层,各层抽取的样本量、
样本平均数和样本方差分别为:%,无,s;,n2,歹,s;.记总的样本平均数为了,样本方差为S?,则()
A.抽取的样本里男生有80人
B.每一位学生被抽中的可能性为工
40
C.估计该学校学生身高的平均值为170
D.估计该学校学生身高的方差为236
1L(24-25高三上•江苏苏州•开学考试)已知一组数据再,无2,…,%的平均数为元,另一组数据为%,…,%
的平均数为了.若数据尤1,%,...,xm,%,%,...,y“的平均数为2,贝!1()
A.当机="时,z=》吵B.当2=土土上时,m=n
22
C.当无=9时,』=七包D.当N>〒时,了>亍
2
三、填空题
12.(24-25高二上•北京平谷•阶段练习)某辆汽车每次加油都把油箱加满,下表记录了该车相邻两次加油时
情况
加油时间加油量(升)加油时的累计里程(千米)
2024年9月1日1237000
2024年9月15日80358000
注:"累计里程”指汽车从出厂开始累计行驶的路程.在这段时间内,该车每100千米平均耗油量为升.
13.(24-25高一上•四川成都•开学考试)已知一组数据5、。、2、-1、6、8的中位数是4,则。的值是
14.同学甲用公式S2=*〔(占-5)?+(尤2-5『+L+(%0G-5月计算一组样本数据的方差,那么
再+工2+…+工100=•
四、解答题
15.在党中央领导下,我国经济社会发展取得显著成效,商业模式创新发展,消费结构升级持续发展.某主
打线上零售产品的企业随机抽取了70名销售员,统计了其2023年的月均销售额(单位:万元),将数据按照
[12,14),[14,16),[16,18),[18,20),[20,22),[22,24]分成6组,制成了如图所示的频率分布直方
图.已知[14,16)组的频数比[12,14)组多4.
(1)求频率分布直方图中。和b的值;
(2)该企业为了挖掘销售员的工作潜力,对销售员实行冲刺目标管理,即给销售员确定一个具体的冲刺目标,
完成这个冲刺目标,则给予额外奖励,若公司希望恰有20%的销售人员能够获得额外奖励,求该企业应该
制定的月销售冲刺目标值.
16.某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100户居民每人的
月均用水量(单位:吨).将数据按照[005),[051),…,[4,4.5]分成9组,制成了如下图所示的频率分
(1)求直方图中a的值;
(2)用每组区间的中点作为每组用水量的平均值,这9组居民每人的月均用水量前四组的方差都为0.3,
后5组的方差都为0.4,求这100户居民月均用水量的方差.
17.(24-25高二上•安徽阜阳•开学考试)某市教育局组织全市170名校园安全员参加校园安全知识竞赛,竞
赛后对其成绩(满分1。。分)进行统计,将数据按[50,60),[60,70),[70,80),[80,90),[90,100]分为5
组,其频率分布直方图如图所示.
(1)试估计这170名安全员竞赛成绩的平均分;(同一组中的数据用该组区间的中点值作代表)
(2)教育局拟对竞赛得分不低于85分的安全员进行表彰,试估计本次竞赛受表彰的安全员有多少位;
(3)该教育局准备对本次安全知识竞赛成绩较差的15%的安全员开展校园安全知识讲座,则需要参加讲座的
安全员的分数不超过多少分(结果四舍五入成整数).
18.如下茎叶图记录了某篮球队内两大中锋在六次训练中抢得篮板球数的记录,现有一个数据被污损,在
图中以X表示,但知道乙球员抢得篮板球数的平均数为10.
甲乙
6990X898
411142
(1)求X的值和乙球员抢得篮板球数的方差;
(2)如果你是该球队的教练,在正式比赛中你会派谁上场?请说明理由(用数据说明).
19.(22-23高一下•山东临沂•期末)某市文旅局为激发夜间文旅市场的活力,共设置夜市摊点700个,为调
查这些夜市摊点的服务情况,该文旅局随机抽取了100个夜市摊点进行评分,评分越高,服务越好,满分
为100分.将分数以20为组距分为5组:[0,20)、[20,40)、[40,60)、[60,80)、[80,100],得到100个夜
市摊点得分的频率分布直方图,如图,已知[40,60)组的频数比[20,40)组多8.
⑴求直方图中。和匕的值;
(2)为进一步提升夜市经济消费品质,提高服务质量,该文旅局准备对剩下的所有夜市摊点进行评分,并制
定一个评分分数,给达到这个分数的摊位颁发“服务优秀”荣誉证书.若该文旅局希望使得恰有70%的摊位
获得荣誉证书,求应该制定的评分分数.
第03讲用样本估计总体
__________________
学习目标
课程标准学习目标
1.结合实例,能用样本估计总体的集中趋势
参数(平均数、中位数、众数),理解集中趋
势参数的统计含义.
2.结合实例,能用样本估计总体的离散程度
参数(标准差、方差、极差),理解离散程度1.能用样本的数字特征估计总体的数字特征.
参数的统计含义.2.用样本的分布估计总体的分布
3.结合实例,能用样本估计总体的取值规3.通过用样本估计总体提升数据分析素养、数学运算素
律.养和逻辑推理素养.
4.结合实例,能用样本估计百分位数,理解
百分位数的统计含义
5.结合具体实例,掌握分层抽样的样本均值
和样本方差.
02思维导图
用样本估计总体
用样本的数字特征来估计总体的数字特征1.用样本数估计总体数
4-2.样本平均数估计总体平均数
用样本估计总体一题型
用样本的分布来估计总体的分布V3.样本方差估计总体方差
4.样本分布估计总体分布
“大数据”简介
03知识清单
知识点01用样本估计总体
1.用样本估计总体
⑴前提
样本的容量恰当,抽样方法合理.
(2)必要性
①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力等.
②有时候总体的数字特征不可能获得,只能用样本估计总体.
⑶误差
估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能
性将越来越大.
【即学即练1](多选)对于用样本分布估计总体分布的过程,下列说法不正确的是()
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
【答案】ABD
【解析】样本为所研究的具体对象,样本容量越大,越能反映总体情况,估计越精确.总体容量不影
响样本估计结果.
知识点02用样本的数字特征来估计总体的数字特征
(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
(2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件假设第一层有m个数,分别为XI,X2,…,xm,平均数为礼方差为s2;第二层有n个数,
分别为yi,y2,…,yn,平均数为歹,方差为t2.
结论
如果记样本均值为a,样本方差为b?,则a-mx+ny
m+nm+n''m+n'''
【即学即练2】李大伯承包了一个果园,种植了100棵樱桃树,今年己进入收获期,收获时,从中任
选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号12345678910
质量/千克14212717182019231922
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量
与按批发价格销售樱桃所得的总收入分别约为()
A.200千克,3000元
B.1900千克,28700元
C.2000千克,30000元
D.1870千克,27770元
【答案】D
【解析】样本平均数为(14+21+27+17+18+20+19+23+19+22)+1020(千克).
由此可估计每棵樱桃树所产樱桃质量平均约为20千克,所以这100棵樱桃树所产樱桃的质量约为20X1002
000(千克).根据樱桃批发价格为每千克15元,可得总收入约为15义200030000(元).
知识点03用样本的分布来估计总体的分布
如果总体在每一个分组的频率记为兀1,兀2,…,电”样本在每一组对应的频率记为pi,P2,…,P",~
般来说,-Pi)?不等于零.当样本的容量越来越大时,上式很小的可能性将越来越大.
"Z=1
【即学即练3】(多选)下列说法中正确的为()
A.数据的极差越小,样本数据分布越集中、稳定
B.数据的平均数越小,样本数据分布越集中、稳定
C.数据的标准差越小,样本数据分布越集中、稳定
D.数据的方差越小,样本数据分布越集中、稳定
【答案】ACD
【解析】由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数
据的平均数则与之无关,故B不正确,ACD正确.
知识点04“大数据”简介
凡是可以被“数据化”的信息载体都可以看成数据.信息载体包括的数据量达到一定的规模或者达到
一定的复杂程度,都可以被认为是“大数据
E题型精讲
题型01用样本数估计总体数
【典例1】我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得
米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()
A.134石B.169石
C.338石D.1365石
【答案】C
【解析】根据样本比例关系等于总体比例关系进行计算.
【变式1】从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图,
则a的值为,该市中学生中的全体男生的平均身高的估计值为cm.
【解析】根据题意得(0.005+a+0.02+0.04+0.02+0.005)x10=1,解得。=0.01;
估计该市中学生中的全体男生的平均身高为
145x0.05+155x0.1+165x0.2+175x0.4+185x0.2+195x0.05-172.5(cm).
【变式2】为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画
出样本的频率分布直方图如图所示.根据此图,估计该校2000名高中男生中体重大于70.5公斤的人数为()
A.300B.380C.420D.470
【答案】C
【分析】由题意,根据频率分布直方图得出高中男生中体重大于70.5公斤的人数在总体中所占的比例,再
根据总人数是2000,即可求出人数得出答案.
【详解】由图可知,高中男生中体重大于70.5公斤的人数在总体中所占的比例是
2X(0.04+0.035+0.015)=0.18,故该校2000名高中男生中体重大于70.5公斤的人数为2000x0.18=
360,.
【变式3】某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如
下:
成绩1分2分3分4分5分6分7分8分9分10分
人数6002423210
(1)求样本的均值;
⑵请问估计有多少学生可达7分(包括7分)以上?
【答案】(1)4.6
(2)72
【分析】(1)根据平均数的计算公式求解即可;
(2)先求出抽样的20名学生中,可达7分(包括7分)以上的学生频率,再估计可达7分(包括7分)
以上的学生人数即可.
【详解】⑴样本的均值为:^(1x6+4x24-5x4+6x2+7x3+8x2+9x1)=4.6.
(2)抽样的20名学生中,可达7分(包括7分)以上的学生频率为*=总,
所以估计可达7分(包括7分)以上的学生有240X卷=72人.
题型02样本平均数估计总体平均数
【典例2】某校从参加高三模拟考试的学生中随机抽取80名学生,将其数学成绩(均为整数)分成六组
[90,100),[100,110),…,口40,150]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
频率
砺
0.035
0.030
0.025
0.020
0.015
0.010
0.005
O9010010120130140150分数
(1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值(如组区间[100,110)的中点值为处等竺=105)作为这组
数据的平均分,据此,估计本次考试的平均分.
【答案】(1)0.3;(2)121
【解析】(1)分数在190,100)内的频率为0.01x10=0.1;
分数在口00/10)内的频率为Q015x10=0.15;
分数在口10,120)内的频率为。015*10=0.15;
分数在[130,140)内的频率为0.025x10=0.25;
分数在[140,150]内的频率为0.005x10=0.05;
则分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1一0.7=0.3.
故分数在[120,130)内的频率为0.3.
(2)样本平均数295x0.1+105x0.15+115x0.15+125x0.3+135x0.25+145x0.05=121.
故估计本次考试的平均分为121.
【变式1】(24-25高一上,四川成都•开学考试)廖老师为了了解学生周末利用网络进行学习的时间,在所任
教班级随机调查了10名学生,其统计数据如下表:
时间(单位:小时)43210
人数34111
则这10名学生周末利用网络进行学习的平均时间是小时.
【答案】2.7
【分析】依据加权平均数的概念求解可得.
【详解】这10名学生周末利用网络进行学习的平均时间是:
4x3+3x4+2xl+lxl+0xl”
------------------------=2.7.
10
故答案为:2.7
【变式2】某公司为了了解广告投入对销售收益的影响,在若干地区各投入4万元广告费用,并将各地的销
售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从
0开始计数的.
(1)根据频率分布直方图计算图中各小长方形的宽度;
(2)估计该公司在若干地区各投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表
该组的取值).
【答案】⑴2;(2)5
【解析】(1)设各小长方形的宽度为加,
则(0.08+0.10+0.14+0.12+0.04+0.02)〃7=1,解得:m=2,
即各小长方形的宽度为2.
(2)对应销售收益的平均值为(1x0.08+3x0.10+5x0.14+7x0.12+9x0.04+11x0.02)x2=5.
【变式3】了解某医院急救中心病人的等待时间,现随机抽取20位病人,对他们的等待时间记录如下表:
等待时间/分钟[0,5)[5,10)[10,15)[15,20)[20,25]
频数48521
用上述数据估计该医院急救中心病人的平均等待时间为..分钟.
【答案】9.5
【变式4】新冠肺炎疫情期间,某地为了解本地居民对当地防疫工作的满意度,从本地居民中随机抽取若干
居民进行评分(满分为100分),根据调查数据制成如下频率分布直方图.
频率
0.035
o2
o1
OO
OO
f
分数
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图估计本次评测分数的平均数(同一组中的数据用该组区间的中点值作代表,并精
确到0.1).
【答案】(1)0.025;(2)80.7
【解析】(1)由题意可得:(0.002+0.004+0.014+0.020+0.035+a)xl0=l,解得。=0.025.
(2)估计本次评测分数的平均数
J=(45x0.002+55x0.004+65x0.014+75x0.020+85x0.035+95x0.025)x10=80.7.
题型03样本方差估计总体方差
【典例3】(2024•浙江・三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分
层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估
计样本的方差不可能为()
A.11B.13C.15D.17
【答案】A
【分析】根据题意,设男生体质健康状况的平均数为捻,女生的平均数为5,总体的平均数为方差为S2,
结合方差的公式,分析选项,即可求解.
【详解】设男生体质健康状况的平均数为最,女生的平均数为工,总体的平均数为方差为S2,
80120—2—3—
则w=---------x-\-----------y=—%+一,,
80+12080+12055
80120
[15+(x-w)2]+[10+G—而2]
80+12080+120
2o__34__A——
=—[15+—(x-y)2]+-[10+—(x-y)2]=12+—(x-3/)2>12,
J乙。J乙D乙J
结合选项,可得A项不符合.
【变式1】(2024•辽宁葫芦岛•二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分
层抽样,抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高
中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为
()
A.1.3B.1.5C.1.7D.1.9
【答案】A
【分析】根据给定条件,求出该地区中学生每天睡眠时间的平均数,再利用分层抽样方差的计算方法求得
结果.
402023
【详解】该地区中学生每天睡眠时间的平均数为:-HX8+-^X7=^(小时),
60603
40「(2320「(2351
该地区中学生每天睡眠时间的方差为:Gx2+8-彳+—x1+7--=—«1.9.
60\3160V3127
【变式2】(23-24高一下•福建福州•期末)在对某中学高一年级学生身高(单位:cm)调查中,抽取了男生
20人,其平均数和方差分别为"4和12,抽取了女生30人,其平均数和方差分别为164和30,根据这些
数据计算出总样本的平均数为,方差为.
【答案】16846.8
【分析】利用分样本平均数和方差与总样本的平均数和方差的关系,代入计算即可得出结论.
【详解】易知总样本的平均数为20家174+3&0164=168,
代入公式可得总样本的方差为部2+(174-168月+第30+(164-168月=46.8;
因此总样本的平均数为168,方差为46.8;
故答案为:168;46.8.
【变式3】(25-26高一上,全国•课后作业)2023年10月22日,2023襄阳马拉松成功举行,志愿者的服务
工作是马拉松成功举办的重要保障,某单位承办了志愿者选拔的面试工作.现随机抽取了100名候选者的
面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95上
绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数.
⑵现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成
绩的平均数和方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年结直肠外科疾病诊断与治疗方案拟定考核测试卷答案及解析
- 新质生产力全景展示
- 2025年肾内科慢性肾炎患者的饮食调理模拟考试答案及解析
- 2025年康复治疗康复计划设计评估答案及解析
- 2025年急诊医学紧急处理能力检测卷答案及解析
- 2025年外科手术技术与操作规范考试答案及解析
- 2025年内分泌科疑难病例讨论模拟考试答案及解析
- 科技赋能新质生产力发展
- 新质生产力与农业发展的融合关系
- 2025年传染病防控常识考察试卷答案及解析
- 静设备安装质量控制过程
- 学生饮用奶采购服务投标方案
- 《收购兼并和企业重组》
- 醋酯纤维及其面料的知识
- 《大学美育》第1章
- 城里来了大恐龙
- 门诊发药交待注意事项
- 中小学心理健康教育指导纲要考试试题及答案(整理)
- GA/T 115-2020道路交通拥堵度评价方法
- 食品试验设计与统计分析
- 公安民警心理压力应对Baidu课件
评论
0/150
提交评论