强化练20 统计与成对数据的统计分析(练习及解析)-高三数学三轮冲刺复习_第1页
强化练20 统计与成对数据的统计分析(练习及解析)-高三数学三轮冲刺复习_第2页
强化练20 统计与成对数据的统计分析(练习及解析)-高三数学三轮冲刺复习_第3页
强化练20 统计与成对数据的统计分析(练习及解析)-高三数学三轮冲刺复习_第4页
强化练20 统计与成对数据的统计分析(练习及解析)-高三数学三轮冲刺复习_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主题强化练20统计与成对数据的统计分析

【核心归纳】

一、用样本估计总体

1.统计中的四个数据特征:

(I)众数:在样本数据中,出现次数最多的那个数据.

(2)中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个

数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即工=:(即+也+—+.).

(4)方差与标准差:

222

5=^[(A-|—X)+(X2—X)H----X)2],

xy+(X2-工)2-1---卜(ML1)2].

2.频率分布直方图的两个结论:

频率

(1)小长方形的面枳=组距><病=频率.

(2)各小长方形的面积之和等于1.

二、回归分析

1.经验回归直线;=£+:经过样木点的中心(嚏,7),若X取某一个值,代入经脸回归方程

AAA

y=bx+a中,可求出了的估计值.

2.样本相关系数:

当厂>0时,称成对样本数据正相关;当X。时,称成对样本数据负相关.

三、独立性检验

1.独立性检验的一般步骤

(1)根据样本数据列成2X2列联表;

⑵根据公式炉=4瑞泮/,计算/的值;

(3)查表比较z2与临界值的大小关系,作统计判断.

2./的值越大,对应假设事件Ho成立(两类变量相互独立)的概率越小,Ho不成立的概率越大.

【真题示范】

1.(2017.全国III)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年

1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

2014年2015年2016年

根据该折线图,下列结论错误的是()

A.月接待游客最逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7.8月份

D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

2.(多选)(2021・新高考全国I)有一组样本数据X2,…,Xn,由这组数据得到新样本数据

yi»加…,刖其中y=.q+c(i=l,2,…,〃),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样本数据的样本极差相同

3.(2022.全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,

随机抽取10位社区居民,让他们在讲库前和讲座后各回答一份垃圾分类知识问卷,这10位

社区居民在讲座前和讲座后问卷答题的正确率如图,

则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

4.(2()21.全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户

家庭年收入的调查数据整理得到如下频率分布直方图:

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

5.(2019・全国II)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车

次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该

站高铁列车所有车次的平均正点率的估计值为.

6.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:

cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,

有株树木的底部周长小于100cm.

7.(2021•全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标

有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:

旧设备9.810.310.010.29.99.810.010.110.29.7

新设备10.110.410.110.010.110.310.610.510.410.5

旧设备和新设备生产产品的该项指标的样本平均数分别记为-V和),,样本方差分别记为4和

52.

(1)求x,y,5T»52;

⑵判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果亍一;

22^/打著,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有

显著提高).

8.(2022.全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计•林区某

种树木的总材积最,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材

积量(单位:n?),得到如下数据:

样本号i12345678910总和

根部横截

0.040.060.040.080.080.050.050.070.070.060.6

面积为

材积量y0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得Zr?=003g,X>7=16158,L^,-=0.2474.

i-l»-!r-1

⑴估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

⑵求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横械面积,并得到所有这种树木的根部横截面积总和

为186nF.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树

木的总材积量的估计值.

z(Xi-X)(y-y)

r=l

附:样本相关系数/•=~/,“896=1.377.

\/Lli-l

【模拟演练】

9.(2022.上海模拟)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家

口市联合举行.共有3个冬奥村供运动员和代表队人员入住,其中北京冬奥村的容量约为2

250人,延庆冬奥村的容量约1440人,张家口冬奥村的容量约2610人.为了解各冬奥村服

务质量,现共准备了140份调查问卷,采用比例分配的分层随机抽样的方法,则需在延庆冬

奥村投放的问卷数量是()

A.58份B.50份

C.32份D.19份

10.(多选)(2022・济宁模拟)卜.列说法正确的是()

A.将一组数据中的每一个数据都加上同一个常数后,方差不变

B.设具有线性相关关系的两个变量x,),的相关系数为r,则仍越接近于0,x和y之间的线

性相关程度越强

C.在一个2X2列联表中,由计算得/的值,则/的值越小,判断两个变量有关的把握越大

D.若X〜Ml,/),P(X>2)=0.2,则尸(OvXvl)=0.3

11.(2022•郑州质检)如图为2022年上半年中国火锅消费频率的扇形图及地域分析的条形图,

根据所给统计图,下列结论中不正确的是()

2022年上半年中国火锅消费频率与地域分析

2022年上半年中国消费者吃火锅频率分析

49.1%

2()22年上半年中国各区域消费者吃火锅频率统计

□短周吃两次及以上

A.2022年上半年中国消费者每天都要吃火锅的占比为5.0%

B.2022年上半年中国消费者每月都要吃火锅的超过70%

C.2022年上半年西南与华东地区消费者每周吃两次及以上的超过70%

D.2022年上半年中国七个区域消费者每周吃两次及以上频率的平均数超过25%

12.(多选)(2022•荷泽模拟)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”

的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:

年份20172018201920202021

3

年份代码X1245

年借阅量万册)4.95.15.55.75.8

根据上表,可得y关于x的经验回归方程为;=0.2标+;下列结论正确的有()

A.a=4.68

B.借阅量4.9,5.1,555.7,5.8的75%分位数为5.7

C.),与式的线性相关系数力0

D.2022年的借阅量一定不少于6.12万册

13.(多选)(2022・重庆调研)某高中学校积极响应国家“阳光体育运动”的号召,为确保学生

每天一小时的体育锻炼,调杳该校2000名高中学生每周平均参加体育锻炼时间的情况,现

从高一、高二、高三三个年级学生中按照3:1:1的比例分层随机抽样,收集了200名学生

每周平均体育运动时间的样本数据(单位:小时),整理后得到如图所示的频率分布直方图,

则下列说法中,正确的是()

A.估计该校高中学生每周平均体育运动时间不足4小时的人数为500

B.估计该校高中学生每周平均体育运动时间不少于8小时的人数百分比为20%

C.估计该校高中学生每周平均体育运动时间的中位数为5小时

D.估计该校高中学生每周平均体育运动时间为5.8小时

14.(多选)(2022・沈阳模拟)在了解学校学生每年平均阅读文学经典名著的数量时,甲同学抽

取了一个样本容量为10的样本,并算得样本的平均数为5,方差为9;乙同学也抽取了一个

样本容量为10的样本,并算得样本的平均数为7,方差为16.已知甲、乙两同学抽取的样本

合在一起组成一个容量为20的新样本,则新样本数据的()

A.平均数为6.5B.平均数为6

C.方差为14.5D.方差为13.5

15.(2022・芜湖模拟)某市轻轨成为城市发展的新亮点,一号线自2021年11月3日(周三)正

式运行以来,给该市居民出行带来了极大的便捷.如图为轻轨一号线正式运行后连续若干天

的客流显折线图,根据该折线图,下列说法中错误的是()

客流量(单位:万人)

A.一周中周六客流量最大

B.一周中周一客流量最小

C.II月13日客流量再创新高

D.平均客流量大约为5万人

16.(2022.成都模拟)某位同学掷骰子五次,分别记录每次骰子出现的点数.根据这位同学的

统计结果,可以判断出一定没有出现点数6的是()

A.平均数为3,中位数为2

B.中位数为3,众数为2

C.平均数为2,方差为2.4

D.中位数为3,方差为2.8

17.(2022・咸阳模拟)某校随机抽取100名学生进行“绿色环保知识”问卷测试.测试结果发

现这100名学生的得分都在[50,100]内,按得分情况分成5组:[50,60),[60,70),[70,80),网,90),

[90,100],得到如图所示的频率分布直方图.则下列说法错误的是()

A.这100名学生得分的中位数是72.5

B.这100名学生得分的平均数是72.5

C.这100名学生得分小于70分的有50人

D.这100名学生得分不小于90分的有5人

18.(2022・长沙模拟)若某商品的广告费支出M单位:万元)与销售额),(单位:万元)之间有如

下对应数据:

X24568

y2040607080

根据上表,利用最小二乘法求得),关于x的经验回归方程为;=£+1.5,据此预测,当投入

10万元时,销售额的估计值为万元.

19.(2022.邵阳模拟)202()年东京奥运会,中国举重代表队共1()人,其中主教练、教练各I

人,参赛选手8人,赛后结果7金1银,在全世界面前展现了真正的中国力量;举重比赛根

据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:

级别54公斤级59公斤级64公斤级70公斤级76公斤级

体重W5454.01〜5959.01-6464.01〜7070.01〜76

级别83公斤级91公斤级99公斤级108公斤级108公斤级以上

体重76.01〜8383.01〜9191.01〜9999.01〜108>108

每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最

大者获胜,在该次举重比赛中,获得金牌的运动员的体直以及举重成绩如下表.

体重5459647076839199106

举重成绩291304337353363389406421430

⑴根据表中的数据,求出运动员举重成绩),与运动员的体重X的经验回归方程(保留1位,、数);

(2)某金牌运动员抓举成绩为180公斤,挺举成绩为218公斤,则该运动员最有可能是参加的

哪个级别的举重?

(3)比赛结束后,中央一台记者从中国举重代表队的10人中随机抽取3人进行访谈,用j表

示抽取到的是金牌得主的人数,求^的分布列与均值.

9_9___

参考数据:X(为―x)2=2620,X(为一x)GLy)=7076;

Z(为一x)(y—y)

A尸1A__A

参考公式:b=-----------------,a=y-bx.

Z(为-X)2

20.近年来,我国大学生毕业人数基数大而且增长不断加快,大学毕业生的就业压力也越来

越大,大学生就业已经成为社会关注的热点问题.在某大型公司的赞助下,某大学就业部从

该大学2022届已就业的A,B两个专业的大学本科毕业生中随机抽取了200人进行月薪情况

的问卷调查,经统计,发现他们的月薪收入在3000元到9000元之间,具体统计数据如下表:

月薪/百元[30,40)[40,50)[50,60)[60,70)[70,80)[80,90]

人数203644504010

将月薪不低于7()(X)元的毕业生视为“高薪收入群体”,月薪低于7(10()元的毕业生视为“非

高薪收入群体”,并将频率视为概率,已知该校2022届大学本科毕业生小明参与了本次问卷

调查,其月薪为3500元.

(1)请根据上述表格中的统计数据填写下面的2X2列联表.根据小概率值a=0.05的独立性检

验,分析“高薪收入群体”与所学专业是否有关;

单位:人

非高薪收入群体高薪收入群体合计

A专业

8专业20110

合计

⑵经统计,发现该大学2022届的大学本科毕业生月薪X(单位:百元)近似服从正态分布Ma,

190),其中"近似为样本平均数;(每组数据取区间的中点值作代表).若X落在区间口一26

4+20外的左侧,则可认为该本科毕业生属于“就业不理想”的学生,学校将联系本人,咨

询月薪过低的原因,为以后的毕业生就业提供更好的指导.

①试判断小明是否属于“就业不理想”的学生;

②该大型公司为这次参与调查的大学本科毕业生制订了赠送话费的活动,赠送方式为:月薪

低于〃的获赠两次随机话费;月薪不低于〃的获赠一次随机话费.每次赠送的话费Z及对应

的概率如下:

赠送话费Z/元60120180

11

P23

求小明获得的话费总金额的均值.

附:

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

/=3+颁卅滥)加+少其中〃=〃+"+c+d,师弋14.

21.(2022・重庆调研)5G的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先

技术的支持,5G经济收入在短期内逐月攀升,该科技创新公司在第1月份至6月份的5G经

济收入),(单位:百万元)关于月份上的数据如表:

时间(月份)123456

收入(百万元)6.68.616.121.633.041.0

根据以上数据绘制散点图,如图.

收入/百万元

参考数据:

6-6____6__

E(此一x)2)&一()•(〃,一)

XyVZ(xi-Xy)ZX/—xU

尸11=1t=1

3.5021.152.8517.50125.356.73

其中设〃=lny,w=lny,G=1,2,345,6).

参考公式和数据:对于一组具有线性相关关系的数据(为,u/)(/=1,2,3,…,〃),其经验回归直

n_____

E(为一%)®-。)

AAAA尸IAA

线0=雄+仪的斜率和截距的最小二乘估计公式分别为:£=-------------------,4=V~pX,

Z8-;)2

i=l

456458

e^95.58,e^97.51.

(1)根据散点图判断;=改+,与y=「均为常数),哪一个适宜作为5G经济收入

y关于月份x的经验回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的结果及表中数据,求出y关于x的经验回归方程,并预测该公司8月份的5G经

济收入:

⑶从前6个月的收入中抽取3个,记月收入超过16百万的个数为X,求X的分布列和均值.

参考答案

1.A2,CD3.B4.C5.0.98

6.24

解析底部周长在[80,90)的频率为0.0I5X10=0.15,

底部周长在[90,100)的频率为0.025X10=0.25,

样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)X60=24.

7.解(1)由表格中的数据易得

--0.2+0.3+0+0.2-0.1-0.2+04-0.1+0.2-0.3,

x=--------------------------------------------+10.0=10.0,

—0.1+0.4+0.1+0+()/+0.3+0.6+0.5+0.4+0.5.

y-----------------------m---------------------+10.0=10.3,

式==X[(9.7-10.0)2+2X(9.8—10.0)2+(9.9-10.0)2+2X(100—10.0)2+(10.1-10.0)2+

2X(10.2-l0.0)2+(10.3-10.0)2]=0.036,

.0==乂[(10.0—10.3)2+3X(10.1-10.3)2+(10.3-10.3)2+2X(10.4—10.3)2+2X(10.5-

10.3)2+(10.6-10.3)2]=0.04.

⑵由(1)中数据可得亍一"?=10.3—10.0=0.3,而2、1$暮=7/+5?=7。.0304,显然

有了一需成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.

8.解⑴样本中10棵这种树木的根部横截面积的平均值x=揩=0.06,

样本中10棵这种树木的材积量的平均值y=常=0.39,

据此可估计该林区这种树木平均一棵的根部横截面积为0.06nf,平均一棵的材积量为0.39n?.

io__

Z(XLX)GLy)

«-1

⑵,.二—/

/10_10_

'/斗LX)2平_y)2

10____

^XiVi—10xy

i=i

Jio_io_

(£A7—10x2)(£)7—10y2)

0.2474-10X006X0.39

叱0.038—10X0.062)(1.6158—10X0.39?)

().0134_0.004

一、0.00()1896〜001377p,,

则r^0.97.

(3)设该林区这种树木的总材积量的估计值为Km3,

又已知树木的材积量与其根部横截面积近似成正比,

「々U.U6186

可得森=T,

解得y=l209.

则该林区这种树木的总材积量估计为1209m3.

9.C10.AD11.C

12.ABC[因为7=]X(1+2+3+4+5)=3,

一1

y=-X(4.9+5.1+5.5+5.7-l-5.8)=5.4,

所以5.4=0.24X3+。,

A

解得a=4.68,所以A正确;

因为5X75%=3.75,

所以借阅量495.1,5.5,5.75.8的75%分位数为5.7,所以B正确;

因为0.24>0,

所以),与x的线性相关系数r>0,所以C正确;

由选项A可知经验回归方程为

A

y=0.24x+4.68,

A

当x=6时,>=0.24X6+4.68

=6.12,

所以2022年的借阅量约为6.12万册,所以D错误.]

13.ABD[由频率分布直方图可知,该校学生每周平均体育运动时间不足4小时的频率为

(0.025+0.1)X2=0.25,

所以估计该校高中学生每周平均体育运动时间不足4小时的人数约为2000X0.25=500,故

A选项正确;

该校学生每周平均体育运动时间不少于8小时的百分比为(0.075+0.025)X2X100%=20%,

故B选项正确;

估计该校高中学生每周平均体育运动时间的中位数为4+”二坦黑普3比5.7(小时),

故C选项不正确;

该校高中学生每周平均体育运动时间为0.025X2X1+0.1X2X3+0.15X2X5+

0125X2X7+0.075X2X9+0025X2X11=5.8(小时)故D选项正确.]

IM\z10X7

14.BD[由题意知,新样本数据的平均数为:=—亡不正—=6,

方差为,=粕[9+(5—6)2]+粘口6+(7—6)2]=13.5.]

15.D16.C17.C

18.106.5

一1

解析由题意得x=5X(2+4+5+6+8)=5,

~=1x(20+40+60+70+80)=54,

AA

所以54=56+1.5,解得〃=10.5,

A

所以),=10.5x+1.5,

当x=10时,

A

>*=10.5X10+1.5=106.5.

19.解(1)依题意,

—54+59+64+70+76+83+91+99+106

x==78,

—291+304+337+353+363+389+406+421+430

y=§=366,

〃____

Z(XLX)8-),)

:J2_______________7076

b~„__2620

£(X;-x)2

1=1

比2.70,

AA

贝必=丁-b~=366-2.7X78

=155.4,

A

故经验回归方程为y=2.7x+155.4.

(2)该运动员的抓举和挺举的总成绩为398公斤,

根据经验回归方程可知

398=2.7x+155.4,

解得大仁89.9,

即该运动员的体重应该在90公斤左右,

即参加的应该是91公斤级举重.

(3)随机变量j的可能取值为0,1,2,3.则

D/f一强__L

0匕=°)=而=两’

m_7

P(S=i)=eJo—40'

CjCj_21

尸4=2)=-CiT=40,

Gc?=_

Cfo-24

所以随机变量。的分布列为

40123

17217

P

12040而24

I7217

所以随机变量J的均值为£(^)=0X—+1X—+2X^j+3X—=2.1.

20.解(1)零假设为"o:”高薪收入群体”与所学专业之间无关联.

2X2列联表如下:

单位:人

非高薪收入群体高薪收入群体合计

A专业603090

8专业9020110

合计15050200

根据列联表中的数据,经计算得到

、200X(60X20—30X90)2

犬=-150X50X90X110

200

=~^~~6.061>3.841=.ro,o5»

根据小概率值«=0.05的独立性检脸,可以推断,。不成立,即认为“高薪收入群体”与所

学专业有关.

⑵①所调查的20()名学生的月薪频率分布表如下:

月薪/百元[30,40)[40,50)[50,60)[60,70)[70,80)[80,90)

人数203644504010

频率0.10.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论