专题11统计原卷版 - 副本_第1页
专题11统计原卷版 - 副本_第2页
专题11统计原卷版 - 副本_第3页
专题11统计原卷版 - 副本_第4页
专题11统计原卷版 - 副本_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题11统计【清单01】分层随机抽样1、分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2、分层随机抽样的平均数计算在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数【清单02】样本的数字特征1、众数、中位数、平均数(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.(3)平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.2、标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.(3)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.【清单03】频率分布直方图1、频率、频数、样本容量的计算方法①eq\f(频率,组距)×组距=频率.②eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于.2、频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.【清单04】百分位数1、定义一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.2、计算一组个数据的的第百分位数的步骤(1)按从小到大排列原始数据.(2)计算.(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.3、四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.【考点题型一】获取数据的途径【例1】.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(

)A.该市参加升学考试的全体学生是总体B.1000名学生的数学成绩是样本C.1000名学生是样本容量D.1000名学生中的每一名学生是个体【变式1-1】.在以下调查中,适合用普查的是(

) A.调查一批小包装饼干的卫生是否达标B.调查一批袋装牛奶的质量C.调查一个班级的学生每天完成家庭作业所需要的时间D.调查一批绳索的抗拉强度是否达到要求【变式1-2】.为了了解参加中考的50000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下列四个判断中正确的是(

).A.50000名学生是总体B.1000名学生的视力是总体的一个样本C.每名学生是总体的一个个体D.上述调查是普查【变式1-3】.下列调查适合作普查的是(

).A.了解大学生的主要工作方向B.了解市民对废电池的处理情况C.日光灯管厂要检测一批灯管的使用寿命D.对与新冠检测阳性者同一车厢的乘客进行医学检查【变式1-4】.(多选)下列调查中,适宜采用抽样调查的是(

)A.调查某市小学生每天的运动时间B.某公司初步发现一位职员患有甲肝,对此公司职员进行检查C.农业科技人员调查某块地今年麦穗的单穗平均质量D.调查某快餐店中全部8位店员的生活质量情况【考点题型二】随机简单抽样【例2】.(1)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是(

)A.110 B.115 C.120 D.125(2).高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为(

)41792

71635

86089

32157

95620

92109

2914574955

82835

98378

83513

47870

20799

32122A.29 B.21 C.14 D.09【变式2-1】.①某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;②高一某班级春节聚会,要产生两位“幸运者”.上述两件事,合适的抽样方法分别为(

)A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样C.简单随机抽样,简单随机抽样 D.分层抽样,分层抽样【变式2-2】.为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查.已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为(

)A.20 B.25 C.30 D.45【变式2-3】.某校高三年级有810名学生,其中男生有450名,女生有360名,按比例分层随机抽样的方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为()A.40,32 B.42,30 C.44,28 D.46,26【变式2-4】.某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为(

)90

84

60

79

80

24

36

59

87

38

82

07

53

89

35

96

35

23

79

18

05

98

9007

35

46

40

62

98

80

54

97

20

56

95

15

74

80

08

32

16

46

70

50

80

67A.05 B.40 C.35 D.23【考点题型三】用样本估计总体分布【例3】.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图.

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【变式3-1】.小王为了了解现在人们的网购途径,随机对1000名市民进行走访调查,统计结果如图所示,下列表述错误的是(

)A.B.这1000名市民中,不在淘宝网购物的人数为545人C.这1000名市民中,通过其他方式购物的人数超过100人D.这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多165人【变式3-2】.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是(

A.成绩前名的人中,高一人数比高二人数多30人B.成绩第1-名的人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-名的50人中,高二人数比高一的多【变式3-3】.某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为(

)A.100 B.75 C.50 D.25【变式3-4】.某校名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1).求图中的值;(2).根据频率分布直方图,估计这名学生语文成绩的平均分;(3).若这名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【考点题型四】用样本估计总体数字特征【例4】.在学校举办的教师优质课评比比赛中,八位评委打出八个完全不同的分数后,去掉一个最高分,去掉一个最低分,再用剩余的六个分数计算平均数,作为讲课教师的最后得分.那么剩余的六个分数与最初的八个分数相比较,一定不变的数字特征是(

)A.平均数 B.方差 C.极差 D.中位数【变式4-1】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(

)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【变式4-2】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(

)A.该组数据的第60百分位数为7.5 B.该组数据的极差为5C.该组数据的平均数为7.5 D.该组数据的中位数为7【变式4-3】.已知样本数据为:,,,,,,,,,.去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是(

)A.平均数 B.众数 C.极差 D.中位数【变式4-4】.若样本的平均数为10,方差为20,则样本的平均数和方差分别为(

)A.20,35 B.20,40 C.15,75 D.15,80【变式4-5】.下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是(

)日期12345678910气温(℃)2101820161262612A.众数为2和6和12 B.70%分位数为16C.平均数小于中位数 D.极差为18【变式4-6】.数据1,2,3,4,5,6,7,8,9,10的第75百分位数为(

)A.7 B.7.5 C.8 D.8.5【考点题型五】频率分布直方图数字特征【例5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.

(1)求频率分布直方图中的值及样本成绩的第75百分位数;(2)求样本成绩的众数,中位数和平均数;(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.【变式5-1】.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是(

)A.成绩在上的人数最少B.成绩不低于80分的学生所占比例为C.50名学生成绩的极差为50D.50名学生成绩的平均分小于中位数【变式5-2】.为了了解某小区2000户居民月用水量使用情况,通过随机抽样获得了100户居民的月用水量.下图是调查结果的频率分布直方图.(1)根据频率直方图估计某小区2000户居民月用水量使用大于3的户数;(2)利用频率分布直方图估计该样本的众数和中位数(保留到0.01).【变式5-3】.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩..【变式5-4】.2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.(1)求a的值;(2)估计这100名候选者面试成绩的平均数和第百分位数;(3)现从以上各组中用分层随机抽样的方法选取人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)【变式5-5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本成绩的第75百分位数;(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差1.已知甲组数据由这个数据构成,记这组数据的平均数为,方差为;乙组数据由,这数据构成,记这组数据的平均数为,方差为,则(

)A., B.,C., D.,2.(多选)下列抽样实验中,不适宜用抽签法的是(

)A.从某场生产的3000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3000件产品中抽取10件进行质量检测3.(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法正确的有(

)A.54周岁以上客户人数最多 B.18-29周岁客户参保总费用最少C.丁险种更受客户青睐 D.30周岁以上的客户约占参保客户的80%4.(多选)某班有50名学生,某次数学考试的成绩经计算得到的平均分数为80分,标准差为s,后来发现记录有误,甲同学得90分误记为60分,乙同学得70分误记为100分,更正后重新计算得到的平均分数为,标准差为,则下列说法正确的是(

)A. B. C. D.5.(多选)若数据的平均数为2,方差为3,则(

)A.数据,,,的平均数为20 B.C.数据,,,的标准差为 D.6.,两班共100人,现采取分层随机抽样的方法抽取10人的样本进行问卷调查,若样本中有4人来自班,则班的人数为.7.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为.8.数据:7.2,8.3,8.5,8.5,8.7,8.8,9.0,9.2的第40百分位数是.9.一组数据:12,8,6,15,12,10,8,17,20,12的分位数是.10.某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.(1)应采用哪种抽样方法更合理?(2)中年、青年、老年职工应分别抽取多少人?11.“疫苗犹豫”,即尽管疫苗可及,却迟迟未接种或拒绝接种疫苗的现象.成人接种新冠疫苗的犹豫,主要原因是对感染新冠肺炎的风险缺乏了解,心存侥幸,认为即使不接种也未必会感染,对感染的后果也认识不足.现从某小区未接种的人群中随机选出100人,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.(1)求出样本的平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);(2)现先从第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组中抽到2人的概率.12.为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为20的样本,测量它们的尺寸(单位:),数据分为,,,,,,七组,其频率分布直方图如图所示.(1)求上图中的值;(2)根据频率分布直方图,求200件样本尺寸在内的样本数;(3)记产品尺寸在内为等品,每件可获利5元;产品尺寸在内为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.13.山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:采购数x(单位:箱)客户数51015155(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.14.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:使用寿命频数3020频率0.20.4(1)求图2中A的值;(2)补全图2频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?15.东风家具店为了解顾客购买额度(单位:元)情况,调查了10000名顾客,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示购买额度在内.

(1)为了分析顾客购买额度与年龄的关系,按购买额度从这10000人中用分层随机抽样的方法抽出100人作进一步分析,则购买额度在内的应抽取多少名?(2)根据频率分布直方图估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表).16.对某校高一学生参加志愿服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.分组频数频率150.32540.08合计1(1)请补全表格,并求出图中的值;(2)若该校高一年级学生有400人,试估计该校高一年级学生参加志愿服务的次数在区间上的人数;(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).17.某地红心猕猴桃因富含维生素C及K,等多种矿物质和18种氨基酸,被誉为“维C之王”,某收购商为了了解某种植基地的红心猕猴桃品质,从该基地随机摘下100个猕猴桃进行测重,其重量分布在区间内(单位:克),根据样本数据作出频率分布直方图如图所示.(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论