版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四节统计与统计案例
【要点归纳】
一、简单随机抽样
1.定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为样
本(〃RV),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽
样.
2.常用方法:抽签法和随机数法.
二、系统抽样
步骤:
①先将总体的N个个体编号;
②根据样本容量〃,当一是整数时,取分段间隔女=手
③在第1段用简单随机抽样确定第一个个体编号/(/必):
④按照一定的规则抽取样本.
(2)适用范围:适用于总体中的个体数较多时.
三、分层抽样
1.定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地
抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.适用范围:适用于总体由差异比较明显的几个部分组成时.
常用结论
(I)随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制.
(2)系统抽样是等距抽样,入样个体的编号相差?的整数倍.
(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
四、统计图表
1.频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
2.频率分布直方图的特点
(1)频率分布百方图中相邻两横坐标之差表示组距,纵坐标表示需,频率=组距x需.
(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距
是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直
观.
3.频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折
线图.
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率
折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
4.茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
五、样本的数字特征
1.众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
2.中位数:把〃个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数
据的平均数)叫做这组数据的中位数.
3.平均数:把…+斯称为0,。2,…,如这〃个数的平均数.
4.标准差与方差:设一组数据汨,X2,力,…,&的平均数为;,则这组数据的标准
差和方差分别是
5=yj%(X1-X)24-(X2-x)2+…+(x„-X)2]
s2=%(xi-X)2+(.V2-X)2+...4-(x„—X)2]
六、平均数、方差的公式推广
1.若数据Xl,X2,…,X”的平均数为X,那么7WXi+a,〃区+。,/心+小…,的”+。
的平均数是mx+〃.
2.数据X1,X2,…,X"的方差为$2.
①数据xi+a,也+小…,的方差也为$2;
②数据at1,axz,...»axn的方差为a2s2.
七、变量间的相关关系
常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不
同,相关关系是一种非确定性关系.
八、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,
称两个变量之间具有线性相关关系,这条直线叫回归直线.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称
为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
n---
二孙一〃xy
3.回归方程为其中〃=«7—.a=y—bx.
'工整一〃-v
4.相关系数
当—>0时,表明两个变量正相关;
当MO时,表明两个变量负相关.
,•的绝对值越接近于1,表明两个变量的线性相关性越强.,•的绝对值越接近于0,表明
两个变量之间几乎不存在线性相关关系,通常M大于0.75时,认为两个变量有很强的线性相
关性.
九、独立性检验
1.2x2列联表:假设有两个分类变量X和Y,它们的取值分别为{即,&}和{v,及},
其样本频数列联表(称2x2列联表)为:
XV)'2总计
X\aba~\~b
X2cdc+d
总aba+/?+c
ii-+c+d+d
2.心统计量:
二伍+膜鼠鼠+胪中〃=〃+b+c+d为样本容量).
常用结论
(1)求解回归方程的关键是确定回归系数2b,应充分利用回归直线过样本中心点(T,
5).
(2)根据片的值可以判断两个分类变量有关的可信程度,若片越大,则两分类变量有关
的把握越大.
(3)根据回归方程计算的《值,仅是一个预报值,不是真实发生的值.
【夯实基础练】
1.(2022•高考全国甲卷数学(文理同题))某社区通过公益讲座以普及社区居民的垃圾分
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
【解析】对于A选项,甲同学周课外体育运动时长的样本中位数为空土至=7.4,
2
A选项结论正确.
对于B选项,乙同学课外体育运动时长的样本平均数为:
6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+1().1
=8.50625>8,B选项结论正确.
对于C选项,甲同学周课外体育运动时长大于8的概率的估计值9=0.375<0.4,C
16
选项结论错误.
对于D选项,乙同学周课外体育运动时长大于8的概率的估计值1上3=0.8125>0.6,
16
D选项结论正确.故选:C
【答案】C
3.(2022•四川省成都市石室中学高三一模)某同学在只听课不做作业的情况下,数学总
不及格.后来他终于下定决心要改变这一切,他以一个月为周期,每天都作一定量的题,看
每次月考的数学成绩,得到5个月的数据如下表:
一个月内每天做
题数X
数学月考成绩y
27416
根据上表得到回归直线方程$,=1.6x+d,若该同学数学想达到90分,则估计他每天
至少要做的数学题数为()
A.8B.9C.10D.11
【解析】由题意,可得戈=--------------=6,3=--------------------------------=84,即
55
样本中心点为(6,84),代入回归直线方程$=1.6x+4,解得a=74.4,即§,=1.6x+74.4,
当9=9()时,90=1.6x4-74.4.解得XBIO,故选C.
【答案】C
4.(2022•四川省成都市第七中学高三二模)为了解某中学对新冠疫情防控知识的宣传情
况,增强学生口常防控意识,现从该校随机抽取3()名学生参加防控知识测试,得分(10分
制)如图所示,以下结论正确的是()
A.这30名学生测试得分的中位数为6
B.这3()名学生测试得分的众数与中位数相等
C.这30名学生测试得分的平均数比中位数小
D.从这30名学生的测试得分可预测该校学生对疫情防控的知识掌握不够,建议学校
加强学生疫情防控知识的学习,增强学生日常防控意识
【解析】对■于A,这3()名学生测试得分的中位数为2=5.5,故A错误;
2
对于B,这30名学生测试得分的众数为5,故B错误:
对于C,这30名学生测试得分的平均数为
---------------------------------------------=——>5.5,故C错误;
3030
对「D,因为抽取的30名学生测试得分普遍偏低,所以预测该校学生对疫情防控的知
识掌握不够,建议学校加强学生疫情防控知识的学习,增强学生日常防控意识,故D正确.故
选:D
【答案】D
5.(2022•陕西省西安中学高三四模)质检机构为检测一大型超市某商品的质量情况,利
用系统抽样的方法从编号为1〜120的该商品中抽8件进行质检,若所抽样本中含有编号67
的商品,则下列编号没有被抽到的是()
A.112B.37C.22D.9
【解析】由系统抽样的特点知抽样间隔为I2(H8=15,故所抽样本编号符合
%+152(%为第一段的抽取样本编号,&wN),由抽取样本中有编号67,则/=7,选
项中不符合7+15A(Z£N)的是9.故选:D.
【答案】D
6.(2022•西北工'业大学附属中学高三一模)为达成“碳达峰、碳中和”的目标,我们需坚持
绿色低碳可持续发展道路,可再生能源将会有一个快速发展的阶段.太阳能是一种可再生能
源,光伏是太阳能光伏发电系统的简称,主要有分布式与集中式两种方式.下面的图表是近
年来中国光伏市场发展情况表,则下列结论中正确的是()
我国光伏新增装机情况(GW)我国光伏发电量情况(亿kWh)
A.2013~2020年,年光伏新增装机规模同比(与上年相比)增幅逐年递减
B.2013~202()年,年光伏发电展与年份成负相关
C.2013~2020年,年新增装机规模中,分布式的平均值大于集中式的平均值
D.2013~2020年,每年光伏发电量占全国发电总量的比重与年份成正相关
【解析】A,2013-2020年,年光伏新增装机规模同比(与上年相比)增幅逐年递减,
前儿年递增,后面递减,故A错误;
B,2013~2020年,年光伏发电量与年份成正相关,故B错误;
C,由图表可以看出,每一年装机规模,集中式都比分布式大,
因此分布式的平均值小于集中式的平均值,故C错误;
D,根据图表可知,2013~2020年,每年光伏发电量占全国发电总量的比重,随年份逐
年增加,故每年光伏发电量占全国发电总量的比重与年份成正相关,故D正确.故选:D
【答案】D
7.(2022•辽宁省实验中学高三(下)3月模拟)某种产品的价格x(单位:元/kg)与需求量),(单
位:kg)之间的对应数据如下表所示:
05050
10
根据表中的数据可得回归直线方程为亍二八十14.4,则以下结论错误的是()
A.变量),与/呈负相关B.回归直线经过点(20,8)
C.^=-0.32D.该产品价格为35元/依时,日需求
量大约为3.4kg
【解析】x=--------------------=20,y=-----------------=8,故
5
8二2x20+14.4即B=-0.32,故ABC都止确.
此时»=-0.32x+14.4,令x=35,则j,=-0.32x35+14.4=-l1.2+14.4=3.2,
故D错误.故选:D
【答案】D
8.(2022•辽宁省名校高三第四次联考)三大产业或三次产业,其划分世界各国不完全一
致,但基本均划分为三大类:第一产业、第二产业和第三产业.第一产业主要指生产食材以及
其他一些生物材料的产业,包括种植业、林业、畜牧业、水产养殖业等直接以自然物为生产对
象的产业(泛指农业);第二产业主要指加工制造产业(或指手工制作业),利用自然界和第一
产业提供的基本材料进行加工处理;第三产业是指第一、第二产业以外的其他行业(现代服务
业或商业),范围比较广泛,主要包括交通运输业、通讯产业、商业、餐饮业、金融业、教育、公
共服务等非物质生产行业.如图是我国2015年~2019年三次产业增加值占国内生产总值比重
的柱状图,根据柱状图,
A.2015~2019年,第三产业增加值占国内生产总值比构成递增的等差数列
B.2015~2019年,第一产业增加值占国内生产总侑比重逐年降低
C.2015〜2019年,第三产业增加值占国内生产总值比重最大
D.2015~2019年,第二产业增加值占国内生产总值比重的中位数为39.9
【解析】对于A.2015-2019年,第三产业增加值占国内生产总值比依次为:
50.8,52.4,52.7,53.3,53.9,易知不满足递增的等差数列,故A错误;
对于B,2015~2019年,第一产业增加值占国内生产总值比重依次为:8.4,8.1,7.5,7.0,7.1,
最后一年2019年有所增加,故B错误;
对于C,2015~2019年中,每一年的第三产业增加值占国内生产总值比都超过50,即比
重最大,故C正确;
对于D,2015〜2019年,第二产业增加值占国内生产总值比重依次为:
40.8,39.6,39.9,39739.0,则中位数为39.7,故D错误;改选:C
【答案】C
9.(2022•东北师大附中、黑龙江省大庆实验中学高三联合模拟考试)我国冰雪健儿自
1992年实现冬奥奖牌数。的突破,到北京冬奥会结束,共获得77块奖牌.现将1992年以来
我国冬奥会获得奖牌数量统计如下表:
年份199219941998200220062010201420182022
奖牌数3388II119915
则1992年以来我国获得奖牌数的中位数为()
A.8B.9C.10D.11
【解析】将自1992年以来我国冬奥会获得奖牌数从小到大排列为:3,3,8,8,9,
9,II,11,15,
所以1992年以来我国获得奖牌数的中位数为9.故选:B
【答案】B
10.(2022•湖南师范大学附属中学高三第四次月考)(多选)下列说法正确的是()
A.必然事件与任意事件相互独立
B.若事件A、B、C两两互斥,则尸(AUBUC)=P(4)+P(B)+尸(C)
C.若事件4、B、。两两独立,则夕(A3C)=P(A)P(3)P(C)
D.线性回归方程对应的直线),=次+。至少经过其样本数据点中的一个点
【解析】对于A选项,设必然事件为S,任取•个事件E,则P(S)=1,
P(5E)=P(E)=P(E)P(5),故必然事件与任意事件相互独立,A对;
对于B选项,若事件A、B、。两两互斥,则AUB'C互斥,所以,
P(AUBUC)=P(A\JB)+P(C)=P(A)+P(B)+P(C),B对;
对于C选项,若事件A、B、。两两独立,则A3与。独立,则
P(ABC)=P(AB)P(C)=P(A)P(B)P(C),C对;
对于D选项,线性回归方程对应的直线),="Y+4必过样本的中心点G,I),并不一定
过样本数据点中的一个点,D错.故选:ABC.
【答案】ABC
11.(多选)(2022•湖南省雅礼中学高三第七次月考)如图为某省高考数学卷近三年难易程
度的对比图(图中数据为分值).根据对比图,其中正确的为()
□201812019匚]2020
A.近三年容易题分值逐年增加
B.近三年中档题分值所占比例最高的年份是2019年
C.2020年的容易题与中档题的分值之和占总分的90%以上
D.近三年难题分值逐年减少
【解析】对于A选项,由图可知,近三年容易题分值逐年增加,A选项正确:
对于B选项,由图可知,近三年中档题分值所占比例最高的年份是2018年,B选项错
误;
对TC选项,由图可知,2020年的容易题与中档题的分值之和为96+42=138,所
Iax
占比例为上一>90%,C选项正确;
150
对于D选项,由图可知,近三年难题分值先增后减,D选项错误.故选:AC.
【答案】AC
12.(2022•湖南省雅礼中学高三第七次月考)现行普通高中学生在高一时面临着选科的问
题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的()
A.样本中的女生数量多于男生数量
B.样本中有两理一义意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【解析】由条形图知女生数量多于男生数量,故A正确;
有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;
女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选:
D.
【答案】D
13.(多选)(2022•河北省名校联盟高三(卜)联考)某班班主任为了了解该班学生寒假期间
做家务劳动的情况,随机抽取该班15名学生,调查得到这15名学生寒假期间做家务劳动的
天数分别是8,18,15,20,16,20,19,18,19,10,6,20,20,23,25,则下列结论
正确的是()
A.这组数据的中位数是18
B.这组数据的众数是20
C.若在记录数据时,漏掉了•个数据,则新数据的众数是20
D.若在记录数据时,漏掠了一个数据,则新数据的中位数是19
【解析】由题意,将这组数据按从小到大的顺序排列:6,8,10,15,16,18,18,
19,19,20,20,20,20,23,25,
根据中位数和众数的定义,可得数据的中位数和众数分别是19和2(),则A错误,B正
确;
若漏掉了一个数据后,新数据中出现最多的数仍然是20,则C正确;
若漏掉的数据大于或等于19,则新数据的中位数是18.5,故D错误.故选:BC.
【答案】BC
14.(2022•北京市首都师范大学附属中学高三(下)开学检测)某电力公司在工程招标中是
根据技术、商务、报价三项评分标准进行综合评分的,按照综合得分的高低进行综合排序,
综合排序高者中标.
分值权重表如下;
总分技术商务报价
100%50%10%40%
技术标、商务标基本都是由公司的技术、资质、资信等实力来决定的.报价表则相对灵
活•,报价标的评分方法是:基准价的基准分是68分,若报价每高于基准价1%,则在基准
分的基础上扣0.8分,最低得分48分;若报价每低于基准价1%,则在基准分的基础上加
0.8分,最高得分为80分.若报价低于基准价15%以上(不含15%)每再低1%,在80分在基
础上扣0.8分.
在某次招标中,若基准价为1000(万元).甲、乙两公司综合得分如下表:
公司技术商务报价
甲80分90分A甲分
乙70分100分A乙分
甲公司报价为1100(万元),乙公司的报价为800(万元)则甲,乙公司的综合得分,分别
是()
A.73,75.4B.73,80C.74.6,76D.74.6,
75.4
【解析】甲公司报价为1100(万元),比基准价1000(万元)多100(万元),超10%,所
以得分为68-0.8x10=60.因此综合得分为80x50%+90xl0%+60x40%=73;乙公司报
价为800(万元),比基准价1000(万元)少200(万元),低20%,所以得分为
80-(20-15)'0.8=76,因此综合得分为70*50%+100、10%+76、40%=75.4,故选人.
【答案】A
15.(2022•北京师范大学附属实验中学高三(下)摸底考试)下图所示的茎叶图记录了甲、
乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,
则x和y的值分别为()
59
25617y
x478
A.5,5C.3,7D.5,7
【解析】由茎叶图得:•・•甲、乙两组各5名工人某H的产量数据(单位:件)若这两组
数据的中位数相等,A65=60+),,解得)=5,•・•平均值也相等,
.56+62+65+70+X+7459+61+67+65+78……
・•------------------------=---------------------,解得文=3.故选B.
【答案】B
16.(2022•西北工业大学附属中学高三一模)某金业加工了一批新零件,其综合质量指标
值X服从正态分布2(80,。2),且p(x«60)=().2,现从中随机抽取该零件500个,估计
综合质量指标值位于(60,100]的零件个数为.
【解析】由题设,正态分布曲线关于〃=80对称,所以
P(X<60)=^-P(60<X<80)=0.2,则P(60<X<80)=P(80<X<100)=0.3,
所以P(60<X<100)=0.6,则综合质最指标值位「(60,100]的零件个数为500x0.6=300
个.故答案为:300.
【答案】300
17.(2022•黑龙江省鹤岗市第一中学高三(上)期末)甲、乙、丙三位同学,其中一位是班
长,一位是体育委员,一位是学习委员,已知丙的年龄匕学委大,甲与体委的年龄不同,体
委比乙的年龄小.据此推新班长是.
【解析】根据“甲与体委的年龄不同,体委比乙的年龄小”可得丙是体委;根据“丙的
年龄比学委大,体委比乙的年龄小”可得乙的年龄,丙的年龄,学习委员的年龄,由此可得,
乙不是学习委员,那么乙是班长.
【答案】乙
18.(2022•陕西省西安市高新第一中学高三第八次大练习)2021年6月17FI9时22分,
我国酒泉卫星发射中心用长征2/遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨
道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国
人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应
用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造.根据
市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益),(亿元)的数据统计如下:
回归模模模
型型①型②
J7920
i=l.13,2
(1)根据表格中的数据,比较当OvxW17时模型①,②的相关指数R2的大小,并选择
拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收
益;
(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,
以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与
20亿元时公司收益(直接收益+国家补贴)的大小.
>(y;-y.)2
附:刻画回归效果的相关指数n二1-々---------,且当R2越大时,回归方程的拟
t(y^-y)2
J-1
合效果越好.如之4.1.用最小二乘法求线性回归方程$,二良+2的截距:a=y-bx.
15+22+27+40+48+54+60.
【解析】⑴对「模型①,对应的》--------------------------------------=3o,
7
故对应的X(^-7)2=Zx2-7r=1750,故对应的相美指数
1=1
79.13
R;=ib0.955,
1750
20?
对于模型②,同理对应的相关指数代二1一一—«0.988,
■1750
故模型②拟合精度更高、更可靠.
故对A型材料进行应用改造的投入为17亿元时的直接收益为
^=21.3xVr7-14.4«72.93.
(2)当x>17时,后五组的
_21+22+23+24+25_—68.5+68+67.5+66+655
x=--------------------=23,y=-----------------------=67,
55
由最小二乘法可得4=67-(-0.7)x23=83.1,
故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:
-0.7x20+83.1+5=74,1>72.93,
故投入17亿元比投入20亿元时收益小.
【答案】(DR;*,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17
亿元比投入20亿元时收益小.
19.(2022•山东省实验中学高三(上)二诊)某大学生参加社会实践活动,对某公司1月份
至6月份销售某种配件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组
数据如下表所示:
月份(
销售单
价阮).500.51
销售量
(
(件)104.2
(1)根据I至5月份的数据,求出y关于x的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.5元,则认为所
得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?
(3)预计在今后的销售中,销售量与销售单价仍然服从(I)中的关系,若该种机器配件的
成本是2.5元/件,那么该配件的销售单价应定为多少元才能获得最大利润?(注:利润;销售
收入•成本).
-V"x.y.-rixy
参考公式:回归直线方程y=b.x+a,其中人=白片_-,
一心一
小=392*=502.5,
i=i
【解析】(1)因为元=((9+9.5+10+10.5+11)=10,=g(U+10+8+6+5)=8,
392-5x10x8
所以6==-3.2,则3=8—(—3.2)x10=40,
502.5-5xlO2
于是y关于x的回归直线方程为9=-3.2工+4();
(2)当x=8时,y=-3.2x8+40=14.4,则.一4=14.4-14=0.4<0.5,
所以可以认为所得到的回归直线方程是理想的;
(3)令销售利润为W,则
VV=(x-2.5)(-3.2x+40)=-3.2x2+48100(2.5<xv125),
因为W=3.2x(-x+15)-100W3.2x——--100=80,
k2>
当且仅当x=—x+15,即x=7.5时,W取最大值.
所以该产品的销售单价定为7.5元/件时,获得的利润最大.
【答案】(1)夕=一3.2%+40.(2)可以认为所得到的回归直线方程是理想的.(3)该产品
的销售单价定为7.5元/件时,获得的利润最大.
20.(2022•宁夏银川市第二中学高三一模)随着新冠疫情防控进入常态化,人们的生产生
活逐步步入正轨.为拉动消费,某市政府分批发行2亿元政府消费券.为了解政府消费券使用
人群的年龄结构情况,在发行完第•批政府消费券后,该市政府采用随机抽样的方法在仝市
市民中随机抽取了200人,对是否使用过政府消费券的情况进行调查,部分结果如下表所示,
3
其中年龄在45岁及以下的人数占样本总数的二,没使用过政府消费券的人数占样本总数的
5
3
万
使用过政府消没使用过政府消£
费券费券U
45岁及
90
以下
45岁以
上
总计2
00
(1)请将题中表格补充完整,并判断是否有90%的把握认为该市市民是否使用政府消费
券与年龄有关?
(2)为配合政府消费券的宣传,现需该市45岁及以下的3位市民参与线上访谈.用随机抽
样的方法从该市45岁及以下市民中每次抽取1人,共抽取3次,每次抽取的结果相互独立.
记抽取的3人中“没使用过政府消费券”的人数为X,以样本频率作为概率,求随机变量X
的分布列和数学期望E(X).
n(ad-bey
其中〃=a+〃+c+4.
(a+〃)(c+d)(a+c)(〃+d)
P(K2>t)0000
.15.10.05.025
2235
k0
.072.706.841.024
3
【解析】(1)由题意得,总人数为200人,年龄在45岁及以下的人数为2()()x《=12()
人,
没使用过政府消费券的人数为200XA=60人,
10
完成表格如下:
使用过政府消没使用过政府消
费券费券计
45岁及1
9030
以下20
45岁以8
5030
上0
2
总计14060
00
—…湍黑器明3.571,
因为3.571>2.706,所以有90%的把握认为该市市民民是否使用政府消费券与什心有
关.
(2)由题意可知,从该市45岁及以下的市民中用随机抽样的方法每次抽取1人,
1(1A
没使用政府消费券的频率为一,所以X~83,一,
4
X的所有可能取值为0,1,2,3,
P(X=0)=网灯嘿,尸(X=l)=C;x/图=g
尸—2)=双外江3P(X=3)=C*J*
所以X的分布列为:
(
272791
64M6464
13
所以E(X)=3x-=—.
44
【答案】(I)表格答案见解析,有.go%的把握认为该市市民民是否使用政府消费券与
年龄有关;(2)分布列答案见解析,数学期望:
4
21.(2022•江苏省南京师范大学附属中学高三(下)开学考试)某沙漠地区经过治理,生态
系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成
面积相近的2()0个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得
到样本数据(为,》)(口1,2,…,20),其中为和v分别表示第i个样区的植物覆盖面积(单位:
202020
公顷)和这种野生动物的数量,并计算得\>,=60,Vy.=1200,工(七一无了二80,
J=1i=l/=1
2020
£(x-»=9000,£(七-X)(yi-y)=800.
I=Ij=i
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生
动物数量的平均数乘以地块数);
(2)求样本(如y/)(z=l,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该
地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数片’“,J2al.414.
Jta-元>力⑶-方
Vt=iJ=I
1201
【解析】⑴样区野生动物平均数为一£%=—x1200=60,
20&20
地块数为200,该地区这种野生动物的估计值为200x60=12000
(2)样本(%,y)gl,2,20)的相关系数为
20
」(若7)3;一刃8002&
~~^7780x90003,
、I£K(七~7)~
V1=11=1
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持r样本结构与总体结构的一致性,提高了样本的代表
性,
从而可以获得该地区这种野生动物数量更准确的估计.
【答案】(1)12000;(2)0.94;(3)详见解析
22.(2022•长春外国语学校高三(下)期初考试)2016年1月1日,我国实行全面二孩政策,
同时也对妇幼保健工作提出了更高的要求.某城市实行格化管理,该市妇联在格1与格2两
个区域内随机抽取12个刚满X个月的婴儿的休重信息,体重分布数据的茎叶图如图所示(中
位:斤,2斤I千克).体重不超过9.8依的为合格.
网格1网格2
789878
11020
13
(])从格|与格2分别随机抽取2个婴儿,求格1至少一个婴儿体重合格且格2至少一
个婴儿体重合格的概率;
(2)妇联从格1内8个婴儿中随机抽取4个进行抽检,若至少2个婴儿合格,则抽检通
过,若至少3个合格,则抽检为良好.求格1在抽检通过的条件下,获得抽检为良好的概率;
⑶若从格1与格2内12个婴儿中随机抽取2个,用X表示格2内婴儿的个数,求X的
分布列与数学期望.
【解析】(1)由茎叶图知,网格1内体重合格的婴儿数为4,网格2内体重合格的婴儿
数为2,则所求概率P=1-工55
84
(2)设事件A表示“2个合格,2个不合格”;事件8表示“3个合格,I个不合格”;事件
C表示“4个全合格”;事件。表示“抽检通过”;事件E表示“抽检良好”.
•♦.尸①卜尸⑷+尸⑻+尸⑹二普+警+号嗤,
888
P(D)17
P(E)=尸⑻+P(C)二咎+3得,则所求概率—.
XXP(E)53
⑶由题意知,X的所有可能取值为0,12
・••P(X=0)=&嗤设=1)=等=果P(X=2)咯=(
・•・X的分布列为
X
1416
p
3333
./\141612
..Er(Xv)=Ox-----Flx------1-2x——=—
v73333113
5517
【答案】(1)P=—;(2)P=一;(3)见解析.
8453
23.(2022•湖南省长郡中学高三第四次月考)中国探月工程自2004年立项以来,聚焦“自
主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17
日凌晨,嫦娥五号返回器携带“月壤”着陆地球,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社区禁毒帮扶工作制度
- 社区综合维稳工作制度
- 2026年日常巡查安全培训内容重点
- 未来五年新形势下维生素A类原药行业顺势崛起战略制定与实施分析研究报告
- 【励志教育】主题班会:《张雪机车夺冠》从山村少年到世界冠军的缔造者【课件】
- 济宁市市中区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 巴彦淖尔盟磴口县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 昆明市西山区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 湘潭市韶山市2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 忻州市五寨县2025-2026学年第二学期四年级语文第六单元测试卷(部编版含答案)
- 2026重庆酉阳自治县城区学校选聘教职工91人笔试模拟试题及答案解析
- 2025年云南省中考数学-26题二次函数降次幂题35道
- 专练06二元一次方程组的实际应用(B卷解答题)(原卷版+解析)
- 混合IC测试技术-第二章-DC参数测试
- 商务英语词汇
- 高效音频放大器设计毕业论文
- 实验诊断学第八章 心脑血管疾病实验诊断
- 幼儿园安全教育管理PPT(37P)
- XX集团公司“揭榜挂帅”实施办法
- 冲压模具设计冲孔落料级进模设计说明书
- 消化内镜切除术
评论
0/150
提交评论