版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2课时用样本估计总体[考试要求]1.能用样本估计总体的取值规律,会求n个数据的第p百分位数.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.考点一总体百分位数的估计1.百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据;第2步,计算i=n×p%;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数(1)25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.[典例1](1)某校团委为弘扬民族精神,深化爱国主义教育,激发青年一代的历史使命感和时代责任感,举办2023年“一二·九”文艺汇演,高三(1)班的大合唱“保卫黄河”的12位评委的打分如下:8.4,9.3,8.9,8.8,8.6,8.2,8.5,8.4,9.2,8.8,8.7,9.4,则这组数据()A.极差为1 B.众数为8.4C.80%分位数为8.9 D.第三四分位数为9.05(2)(2023·重庆九龙坡二模)如图是根据某班学生在一次体能素质测试中的成绩画出的频率分布直方图,则由直方图得到的80%分位数为()A.75B.77.5C.78D.78.5(1)D(2)D[(1)这组数据从小到大排为8.2,8.4,8.4,8.5,8.6,8.7,8.8,8.8,8.9,9.2,9.3,9.4,则极差为9.4-8.2=1.2,故选项A错误;由于众数为8.4和8.8,故选项B错误;由于12×80%=9.6,则80%分位数为9.2,故选项C错误;由于12×75%=9,则第三四分位数为8.9+9.22(2)因为(0.016+0.03+0.04)×10=0.86>0.8,所以80%分位数位于[70,80)之间,设为x,则(0.016+0.03)×10+(x-70)×0.04=0.8,解得x=78.5,所以80%分位数为78.5,故选D.]【教师备用】(2024·天津南开中学模拟)为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了该地区1000名学生每天进行体育运动的时间,按照时长(单位:分钟)分成6组:第一组30,40,第二组40,50,第三组50,60,第四组A.42.5分钟 B.45.5分钟C.47.5分钟 D.50分钟C[由10×0.01=0.1<0.25,10×0.01+10×0.02=0.3>0.25,故第25百分位数位于40,则第25百分位数为40+0.25-0.1可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.故选C.]频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b).(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+p%-fa%fb跟进训练1(1)(2023·上海虹口三模)从2,3,4,5,6,7,8,9中随机取一个数,这个数比m大的概率为14,若m为上述数据中的第x百分位数,则xA.50B.60C.70D.80(2)(2024·河北张家口高三统考)已知a是1,3,3,5,7,8,10,11的75%分位数,在1,3,3,5,7,8,10,11中随机取两个数,这两个数都小于a的概率为()A.14B.514C.15(1)C(2)C[(1)从2,3,4,5,6,7,8,9中随机取一个数,这个数比m大的概率为14,则mm为数据2,3,4,5,6,7,8,9的第6个数,m为上述数据中的第x百分位数,70%×8=5.6,则x的取值可能为70.故选C.(2)因为8×75%=6,所以a=8+102这两个数都小于a的概率为P=C62C故选C.]考点二总体集中趋势的估计名称概念平均数如果有n个数x1,x2,…,xn,那么这组数据的平均数x=1n(x1+x2+…+xn中位数将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数众数一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数[典例2]某社区组织了垃圾分类知识竞赛活动,从所有参赛选手中随机抽取20人,将他们的得分按照[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘成频率分布直方图(如图).(1)求x的值;(2)分别求出抽取的20人中得分落在[0,20)和[20,40)内的人数;(3)估计所有参赛选手得分的平均数、中位数和众数.[解](1)由频率分布直方图的性质得:(0.0050+0.0075+x+0.0125+0.0150)×20=1,解得x=0.0100.(2)由频率分布直方图得:得分落在[0,20)内的人数为:20×0.0050×20=2,得分落在[20,40)内的人数为:20×0.0075×20=3.(3)估计所有参赛选手得分的平均数为:0.0050×20×10+0.0075×20×30+0.0150×20×50+0.0125×20×70+0.0100×20×90=56.设所有参赛选手得分的中位数为a,则0.0050×20+0.0075×20+0.0150×(a-40)=0.5,解得a=1703所有参赛选手得分的众数估计值为40+602【教师备用】(2023·四川成都一模)某地区运动会上,有甲、乙两位田径运动员进入了男子100m决赛,某同学决定运用高中所学的知识对该次决赛的情况进行预测,为此,他收集了这两位运动员近几年的大赛100m成绩(单位:秒),若比赛成绩小于10秒则称为“破十”.甲:10.54,10.49,10.31,10.37,9.97,10.25,10.11,10.04,9.97,10.03;乙:10.32,10.06,9.99,9.83,9.91.(1)求甲成绩的中位数与平均数(平均数的结果保留3位小数);(2)从乙的5次成绩中任选3次,求恰有2次成绩“破十”的概率.[解](1)甲成绩从小到大排列如下:9.97,9.97,10.03,10.04,10.11,10.25,10.31,10.37,10.49,10.54,∴甲成绩的中位数为10.11+10.252=10.18,平均数为110×(2)乙的5次成绩有3次“破十”,记为a,b,c,有2次没“破十”,记为d,e,记恰有2次成绩“破十”为事件A,则从乙的5次成绩中任选3次的结果有:abc,abd,abe,acd,ace,ade,bcd,bce,bde,cde,共10种,其中满足事件A的结果有abd,abe,acd,ace,bcd,bce,共6种,∴P(A)=610=35,即恰有2次成绩“破十”的概率为3频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟进训练2(2024·海南统考模拟)气象部门定义:根据24小时内降水在平地单位面积上的积水深度(mm)来判断降雨强度.其中小雨(<10mm),中雨(10mm~25mm),大雨(25mm~50mm),暴雨(50mm~100mm).为了了解某地的降雨情况,气象部门统计了该地20个乡镇的降雨情况,得到当日24小时内降雨量的频率分布直方图如图.(1)若以每组的中点代表该组数据值,求该日这20个乡镇的平均降雨量;(2)根据图表,估计该日24小时内降雨强度为暴雨的乡镇的个数.[解](1)这五组数据对应的频率分别为:0.05,0.2,0.3,0.35,0.1,故这20个乡镇的平均降雨量为0.05×25+352+0.2×35+452+0.3×45+552+0.35×55+652(2)24小时内降雨强度为暴雨的乡镇的频率为0.01+0.035+0.032故降雨强度为暴雨的乡镇的个数为0.6×20=12.考点三总体离散程度的估计1.方差和标准差假设一组数据是x1,x2,…,xn,用x表示这组数据的平均数,称为这组数据的方差,也可以写成的形式;称为这组数据的标准差.2.总体方差和标准差(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=1N(Yi-(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=1Nf1(Y总体标准差:S=S23.样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为y,则称s2=为样本方差,s=s2为样本标准差.4.分层随机抽样的方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w,样本方差为s2.以分两层抽样的情况为例,假设第一层有m个数,平均数为x,方差为s12;第二层有n个数,平均数为y,方差为s22,则总的样本均值w=mm+nx+nm+ny;总的样本方差5.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx+a.(2)数据x1,x2,…,xn的方差为s2.①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.分层随机抽样的均值与方差[典例3](多选)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1∶3,则关于甲、乙两队全部队员的体重的平均数和方差的说法,正确的是()A.平均数为67 B.平均数为66C.方差为296 D.方差为287BD[依题意,甲的平均数x1=60,乙的平均数x2=68,而甲、乙两队的队员人数之比为1∶3,所以甲队队员在所有队员中所占比重为14,乙队队员在所有队员中所占比重为34,故甲、乙两队全部队员的体重的平均数为:x=60×1甲、乙两队全部队员的体重的方差为:s2=14均值与方差的应用[典例4](2023·河南信阳三模)某市旅游部门为了促进该地生态特色城镇和新农村建设,将甲、乙、丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数据进行整理、描述和分析,下面给出了部分信息.a.甲、乙两家民宿“综合满意度”评分的折线图:b.丙家民宿“综合满意度”评分:2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1c.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数:甲乙丙平均数m4.54.2中位数4.54.7n根据以上信息,回答下列问题:(1)表中m的值是________,n的值是________;(2)设甲、乙、丙三家民宿“综合满意度”评分的方差分别为S甲(3)根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶推荐?说明理由(至少从两个方面说明).[解](1)甲家民宿“综合满意度”评分:3.2,4.2,5.0,4.5,5.0,4.8,4.5,4.3,5.0,4.5,∴m=110丙家民宿“综合满意度”评分从小到大排列为:2.6,3.1,3.8,4.5,4.5,4.5,4.5,4.7,4.8,5.0.∴中位数n=4.5+4.52(2)根据折线统计图可知,乙的评分数据在4分与5分之间波动,甲的数据在3.2分和5分之间波动,根据丙的数据可知在2.6分和5分之间波动,∴S(3)推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高.(答案不唯一,合理即可)【教师备用】(多选)(2023·浙江嘉兴二模)已知一组样本数据x1,x2,…,xn(x1<x2<…<xn),现有一组新的数据x1+x22A.平均数不变 B.中位数不变C.极差变小 D.方差变小ACD[对于A,新数据的总和为:x1+x22+x2+x32+…+x与原数据总和相等,且数据个数都是n,因此平均数不变,A正确;对于B,不妨设原数据为:1,2.5,3,中位数为2.5,则新数据为:1.75,2.75,2,中位数为2,B错误;对于C,原数据极差为:xn-x1,新数据极差为:xn而xn-1+xn2-x对于D,由于两组数据的平均数不变,而极差变小,说明新数据相对原数据更集中于平均数,因此方差变小,D正确.故选ACD.]标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度越大;标准差(方差)较小,数据的离散程度越小.跟进训练3(1)(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的有()A.样本x1,x2,…,xn的标准差B.样本x1,x2,…,xn的中位数C.样本x1,x2,…,xn的极差D.样本x1,x2,…,xn的平均数(2)(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差(1)AC(2)B[(1)中位数是反应数据的集中趋势,标准差是反应数据与均值之间的偏离程度,极差是反映最大值与最小值之间的差距,平均数是反应数据的平均水平,故能反应一组数据离散程度的是标准差,极差.故选AC.(2)讲座前中位数为70%+75%2讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错误.故选B.]课后习题(五十七)用样本估计总体1.(人教A版必修第二册P211问题3改编)下列说法正确的是()A.在两组数据中,平均数较大的一组极差较大B.平均数反映数据的集中趋势,方差反映数据波动的大小C.方差的求法是求出各个数据与平均数的差的平方后再求和D.在记录两个射击环数的两组数据中,方差大说明射击水平稳定B[平均数反映数据的集中趋势,平均数的大小并不能说明该组数据极差的大小,所以A错误;平均数反映数据的集中趋势,方差反映数据波动的大小,所以B正确;一组数据x1,x2,…,xn,其平均数为x,则其方差s2=,所以C错误;方差大说明射击水平不稳定,所以D错误.故选B.]2.(多选)(苏教版必修第二册P262习题14.4T7改编)某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是()78975410947A.这组数据的平均数为8B.这组数据的众数为7C.这组数据的极差为6D.这组数据的第75百分位数为9BCD[将这组数据从小到大依次排列,为4,4,5,7,7,7,8,9,9,10,则这组数据的平均数为110×(4+4+5+7+7+7+8+9+9+10)=7,选项A错误;这组数据的众数是7,选项B正确;这组数据的极差是10-4=6,选项C正确;因为10×3.(人教A版必修第二册P215练习T2改编)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.484[由平均数、方差公式的推广性质可得新数据平均数为48,方差为4.]4.(人教A版必修第二册P213例6改编)为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为________,样本方差为________.90.24.76[样本均值x=12×91+8×8912+8s2=12×3+5.(2024·河南校联考模拟预测)一组样本数据由10个互不相同的数组成,若去掉其中最小的和最大的两个数得到一组新样本数据,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本方差相同C.两组样本数据的样本中位数相同D.两组样本数据的样本极差相同C[去掉其中最小的和最大的两个数得到一组新样本数据的平均数可能与原数据的平均数不同,新数据的方差变小,数据的中位数不变,数据的极差变小,故C正确,故选C.]6.(2023·四川凉山三模)样本数据x1,x2,…,xn的平均数为4,方差为1,则样本数据2x1+1,2x2+1,…,2xn+1的平均数、方差分别为()A.9,4B.9,2C.4,1D.2,1A[因为样本数据x1,x2,…,xn的平均数为4,所以样本数据2x1+1,2x2+1,…,2xn+1的平均数为2x+1=2×4+1=9;因为样本数据x1,x2,…,xn的方差为1,所以样本数据2x1+1,2x2+1,…,2xn+1的方差为22×1=4×1=4,故选A.]7.(多选)(2024·河北唐山模拟预测)有两组样本数据,分别为x1,x2,…,x6和y1,y2,y3,y4,且平均数x=90,y=80,标准差分别为6和4,将两组数据合并为z1,z2,…,z10,重新计算平均数和标准差,则()A.平均数为85 B.平均数为86C.标准差为10 D.标准差为213BD[由分层随机抽样的均值与方差公式可得,新数据平均数z=6×906+4方差s2=16+46[62+(90-86)2]+4[42+(80-86)2∴s=52=213.故选BD.]8.(2023·广东广州二模)已知某次跳水比赛中运动员五轮的成绩互不相等,记为xi(i=1,2,3,4,5),平均数为x,若随机删去其任一轮的成绩,得到一组新数据,记为yi(i=1,2,3,4),平均数为y,下面说法错误的是()A.新数据的极差可能等于原数据的极差B.新数据的中位数可能等于原数据的中位数C.若x=y,则新数据的方差一定大于原数据方差D.若x=y,则新数据的第40百分位数一定大于原数据的第40百分位数D[对于A项,若随机删去任一轮的成绩,恰好不是最高成绩和最低成绩,此时新数据的极差可能等于原数据的极差,所以A正确;对于B项,不妨假设x1<x2<x3<x4<x5,当12(x2+x4)=x3时,若随机删去的成绩是x3,此时新数据的中位数等于原数据的中位数,所以B正确;对于C项,若x=y,即删去的数据恰为平均数,根据方差的计算公式,分子不变,分母变小,所以方差会变大,所以C正确;对于D项,若因为5×40%=2,此时原数据的40%分位数为第二个数和第三个数的平均数;删去一个数据后的4个数据,按从小到大的顺序排列,可得4×40%=1.6,此时新数据的40%分位数为第二个数,显然新数据的40%分位数小于原数据的40%分位数,所以D错误,故选D.]9.(多选)(2024·福建厦门统考模拟)为推动学校体育运动发展,引导学生积极参与体育锻炼,增强健康管理意识,某校根据性别比例采用分层随机抽样方法随机抽取了120名男生和80名女生,调查并分别绘制出男、女生每天在校平均体育活动时间的频率分布直方图(如图所示),则()A.a=0.010B.该校男生每天在校平均体育活动时间中位数的估计值为75C.估计该校至少有一半学生每天在校平均体育活动时间超过一小时D.估计该校每天在校平均体育活动时间不低于80分钟的学生中男、女生人数比例为9∶2ACD[(a+0.02+0.035+0.02+a+0.005)×10=1,解得a=0.010,故A正确;因为(0.01+0.02)×10=0.3<0.5,(0.01+0.02+0.035)×10=0.65>0.5,故设中位数为x,则x∈[60,70),故B错误;样本中男生在校平均体育活动时间超过一小时的占(0.035+0.02+0.01+0.005)×10=0.7,女生在校平均体育活动时间超过一小时的占(0.03+0.01+0.005)×10=0.45,所以该校每天在校平均体育活动时间超过一小时的频率为0.7×120+0.45×80120+80男生中每天在校平均体育活动时间不低于80分钟的频率为(0.01+0.005)×10=0.15,女生中每天在校平均体育活动时间不低于80分钟的频率为0.005×10=0.05,所以该校每天在校平均体育活动时间不低于80分钟的学生中男、女
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- JJF(石化)103-2023易燃液体持续燃烧试验仪校准规范
- 邢台应用技术职业学院《国际物流》2025-2026学年期末试卷
- 福建幼儿师范高等专科学校《中西医结合内科学》2025-2026学年期末试卷
- 长春光华学院《中国历史文选》2025-2026学年期末试卷
- 福州工商学院《中国当代文学史》2025-2026学年期末试卷
- 福建华南女子职业学院《教师职业道德》2025-2026学年期末试卷
- 福建生物工程职业技术学院《Cpa税法》2025-2026学年期末试卷
- 福建理工大学《中西医结合妇科》2025-2026学年期末试卷
- 景德镇学院《市场调查》2025-2026学年期末试卷
- 马鞍山师范高等专科学校《动画概论》2025-2026学年期末试卷
- 精神科叙事护理案例分享
- 2025版幼儿园章程幼儿园办园章程
- 《物流经济地理》课件(共十二章)-下
- 《大学英语》课程说课说课
- 2025年事业单位招聘考试职业能力倾向测验试卷(造价工程师类)
- 煤矿安全学习平台
- 推掌防御反击技术课件
- 外科ICU职业防护课件
- DB31/T 1339-2021医院多学科诊疗管理规范
- 浙江奇斌钢管科技有限公司年加工3万吨无缝钢管生产线项目环境影响报告表
- DB41T 1021-2015 衰老古树名木复壮技术规程
评论
0/150
提交评论