第23练 统计与成对数据的统计分析_第1页
第23练 统计与成对数据的统计分析_第2页
第23练 统计与成对数据的统计分析_第3页
第23练 统计与成对数据的统计分析_第4页
第23练 统计与成对数据的统计分析_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第23练统计与成对数据的统计分析

「专项典题精练

高考汇编

I.(2017.冬国III)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1

月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是()

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月份

D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

答案A

解析由折线图,7月份后月接待游客量减少,A错误.

2.(多选)(2021.新高考全国I)有一组样本数据内,必,…,X”,由这组数据得到新样本数据

yi,”,…,其中y=M+c(i=1,2,…,〃),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样本数据的样本极差相同

答案CD

解析设样本数据即,X2,/的平均数、中位数、标准差、极差分别为;,,小6/,依

题意得,新样本数据V,)2,,,,»%的平均数、中位数、标准差、极差分别为X+(•,,〃1+。,

6人因为。了0,所以C,D正确.

3.(多选)(2021・新高考全国H)下列统计量中,能度量样本内,及,…,儿的离散程度的是()

A.样本X],X2,…,元”的标准差

B.样本为,X2,…,心的中位数

C.样本XI,X2,…,X”的极差

D.样本XI,X2,…,x〃的平均数

答案AC

解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位

数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数

的定义可知,平均数考查的是数据的集中趋势.

4.(2021.全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户

家庭年收入的调查数据整理得到如下频率分布直方图:

根据此频率分布直方图,下面结论中不正确的是()

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C.估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

答案C

解析对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+

0.04)X1X10()%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于

10.5万元的农户比率约为(0.04+0.02+0.02+0.02)X1X100%=10%,故B正确;对于C,根

据频率分布直方图可知,该地农户家庭年收入的平均值约为3X0.02+4X0.04+5X0.10+

6X0.14+7X0.204-8X0.2D+9X0.10+10X0.10+11X004+12X0.02+13X0.02+14X0.02

=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至

8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)义1X100%=64%>50%,故D正确.

5.(2019・全国H)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10

个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经

停该站高铁列车所有车次的平均正点率的估计值为.

答案0.98

1()X0.97+20X0.98+10义0.99

解析经停该站高铁列车所有车次的平均正点率的估计值为

10+20+10

=0.98.

6.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:

cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,

有株树木的底部周长小于100cm.

底部周长/cm

答案24

解析底部周长在[80,90)的频率为0.015X10=0.15,

底部周长在[90,100)的频率为0.025X10=0.25,

样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)X60=24.

7.(2021.全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为

了比较两台机床产品的质量,分别用两台机床各生产了20()件产品,产品的质量情况统计如

下表:

一级品二级品合计

甲机床15050200

乙机床120802(X)

合计270130400

(I)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)依据小概率值a—的独立性检脸,能否认为甲机床的产品质量与乙机床的产品质量有

差异?

n(ad-be)?

附:r=〃=a+6+c+〃.

(a+〃)(c+d)(a+c)(Z?+d)'

a0.0500.0100.001

Xa3.8416.63510.828

解(1)根据题表中数据知,甲机床生产的产品中一级品的频率是炭=0.75,乙机床生产的产

品中一级品的频率是1品20=06

⑵零假设为Ho:甲机床的产品质量与乙机床的产品质量没有差异.

gg血士上小皿gr,口->400X(150X80-I20X50)2400

根据通表中的数据可得=onnVvi7n=10,256>6.635=xo.oio-

ZUUAZlAJAZ/vA1JUoy

依据小概率值a=0.0l的独立性检验,推断,。不成立,

即认为甲机床的产品质量与乙机床的产品质量有差异.

8.(2016・全国HI)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

年份代码,

注:年份代码17分别对应年份2008-2014.

(I)由折线图看出,可用线性回归模型拟合y与/的关系,请用样本相关系数加以说明;

⑵建立y关于t的经验回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

附注:

77/7_

参考数据:*,=9.32,£^,=40.17,、y)2=055,市=2.646.

尸1尸1\1/=1

〃——__

Z(匕-f)8-y)

参考公式:样本相关系数「=­J,

、£(力-7)2£亍)2

经验回归方程;中斜率和截距的最小二乘估计公式分别为

£(A-f)GLy)

Aj=|AA

b=----------------,a=y~bt.

£(力-7)2

I=I

解(i)由折线图中数据和附注中参考数据得

—7—/7―

/=4,£(/,—t>=28,A/Z(y->,)2=0.55.

7——7—7989

I(6-t)8—y)=z砂i—t*,=40.17—4X9.32=2.89,个八一3乂-八7=〉99.

i=i尸I/=i0.55X2X2.646

因为y与/的样本相关系数近似为0.99,说明),与i的线性相关程度相当高,从而可以用线性

回归模型拟合),与/的关系.

7__

Z(4一f)(yi-y)

——939“尸1789

⑵由),=亏二七1.331及(1)得人=-----------------=后比0.103,

Z&-7了

a=y-bt^1.331-0.103X4^0.92.

所以),关于/的经验回归方程为y=0.92+0.10/.

A

将2016年对应的1=9代入经验回归方程得),=0.92+0.1()X9=1.82.

所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.

n模拟精选

9.(2021・盐城模拟)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机拍取了

200人进行调查统计得下方的2X2列联表.则根据列联表可知()

年轻人非年轻人合计

经常用流行用语12525150

不常用流行用语351550

合计16040200

参考公式:独立性检验统计量彳=通工禺篇说,其中〃~+"+c+〃.

下面的临界值表供参考:

a0.150.100.050.0250.0100.0050.001

2.0722.7063.8415.0246.6357.87910.828

xa

A.依据小概率值a=().05的独立性检验,认为“经常用流行用语”与“年轻人”有关系

B.依据小概率值a=0.05的独立性检验,认为“经常用流行用语”与“年轻人”没有关系

C.依据小概率值a=SO25的独立性检验,认为“经常用流行用语”与“年轻人”有关系

D.依据小概率值〃=0.025的独立性检验,认为“经常月流行用语”与“年轻人”没有关系

答案A

5y1200X(125X15-25X35)2

解析三=-160X40X50X150-^4.167>3,841=xo.o5,

依据小概率值。=0.05的独立性检验,认为经常用流行语与年轻人有关系.

10.(多选)(2021•日照模拟)某保险公司为客户定制了5人险种:甲,一年期短险;乙,两全

保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险,各种保险按相关约定进行参保

与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:

参保人敬比例4小总龄段人均有保费用

用该样本估计总体,以下四个选项正确的是()

A.54周岁以上参保人数最少

B.18〜29周岁人群参保总费用最少

C.丁险种更受参保人青睐

D.30周岁以上的人群约占参保人群的20%

答案AC

解析对于A,由扇形图可知,54周岁以上参保人数最少.故选项A正确:

对于B,由折线图可知,18〜29周岁人群人均参保费用最少,但是由扇形图知参保人数并不

是最少的,所以参保总费用不是最少,故选项B错误;

对于C,由柱状图可知,T险种参保比例最高,故选项C正确;

对于D,由扇形图可知,20周岁以上的人群约占参保人群的80%,故选项D错误.

11.(2021.南昌模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每

分钟鸣叫的次数)与气温义单位:。C)存在着较强的线性相关关系.某地观测人员根据下表的

观测数据,建立了y关于.v的经验回归方程;,=0.25%+上

M次数/分钟)2030405060

>CC)2527.52932.536

则当蟋蟀每分钟鸣叫52次时,该地当时的气温预报值为()

A.33℃B.34℃C.35℃D.35.5℃

答案A

—20+30+40+50+60

解析x=--------------------=40,

—25+27.5+29+32.5+36

),=7=30,

因为样本点中心(1,丁)在经验回归直线上,

所以将(40,30)代入),=0.25x+k,得30=0.25X40+2,解得2=20,

A

所以产0.25x+20,

当x=52时,y=0.25X52+20=33.

12.(多选)(2021•漳州模拟)在第一次全市高三年级统考后,某数学老师为了解本班学生的本

次数学考试情况,将全班50名学生的数学成绩绘制成频率分布直方图.已知该班级学生的数

学成绩全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),

第二组[75,85),……,第八组[135,145],按上述分组方法得到的频率分布直方图的一部分,

如图所示,则下列结论正确的是()

A.第七组的频率为0.008

B.该班级数学成绩的中位数的估计值为101

C.该班级数学成绩的平均分的估计值大于95

D.该班级数学成绩的方差的估计值大于26

答案BCD

解析A项,设第七组的频率为x,则10X(0.004+0.012+0.016+0.03+0.02+0.006+0.004)

+x=I,得(=0.08,错误;

B项,由10x(0.004+0.012+0.016+0.03)=0.62>0.5>10x(0.004+0.012+0.0l6)=0.32知,

中位数在[95,105)区间,若中位数为居则10X(0.004+0.012+0.016)+(A—95)X0.03=0.5,

解得x=101,正确;

C项,由题图知,70X0.04+80X0.12+90X0.16+1(X)X0.3+110X0.2+120X0.06+

130X0.08+140X0.04=102,正确;

8

D项,102)2=(70—102)2X0.04+(80-102『X0.12+(90—102)2X0.16+(100—

n

102)2X0.3+(110-102)2X0.2+(I20-102)2X0.06+(130-102)2X0.08+(140-102)2X0.04=

276,正确.

13.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了

如下2X2列联表:

喜爱打篮球不喜爱打篮球合计

男生20525

女生101525

合计302050

则在犯错误的概率不超过_______的前提下,认为喜爱打篮球与性别有关(请用百分数表示).

参考公式及数据:/%+,晨匐篇(…,

a0.1(X)0.05()0.010O.(X)50.001

Xa2.7063.8416.6357.87910.828

答案0.5%

50X(300—50)2

解析因为尤=25X25X30X20Axo.oos,

则在犯错误的概率不超过55%的前提下,认为喜爰打篮球与性别甫关.

14.(2021・广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行

了5次试验,这5次试验的数据如表:

零件数x(个)1020304050

加工时间y(niin)62a758189

若用最小二乘法求得经验回归方程为),=0.67x+54.9,则〃的值为

答案68

A….一•—10+20+30+40+50

解析由已知x=-------------------=30,

—62+〃+75+81+89,2+a

y=5=6i+『

所以61+-2^I=Q0.67义30+54.9,a=68.

15.(2021•兰州模拟)某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数

与温度的变化关系,他们收集了一只该种昆虫在温度x℃时相对应产卵数个数为),的8组数

据,为了对•数据进行分析,他们绘制了如下散点图:

产卵数.V(个)

300

250

200

150

1()0

50

0

51()152()25303540

温度Wt:)

(I)根据散点图,甲、乙两位同学分别用)=云+。和2=&+。(其中2=111),)两种模型进行回归

分析,试判断这两位同学得到的回归方程中,哪一个的决定系数收更接近1;(给出判断即可,

不必说明理由)

(2)根据⑴的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行何归分

析的模型,并利用下表中数据,计算该模型的经验回归方程:(方程表示为),=/(幻的形式,最

后计算结果保留两位小数)

888

7yZ

r=l1=1i=l

26723.3118717575722

(3)据测算,若此种昆虫的产卵数超过et则会发牛.虫害.研究性学习小组的同学通过查阅气

象资料得知近期当地温度维持在25℃左右,试利用(2)中的经验回归方程预测近期当地是否

会发生虫害.

附:对于•组数据(〃|,S),(〃2,。2),…,(〃,”如),其经验回归直线。=如+。的斜率和截距

n__

»(勤一〃UV

的最小二乘估计分别为少=-------------,a=v—pit.

Z〃一〃u2

r=l

解(1)乙同学模型的决定系数R2更接近I.

(2)根据(1)的结论,应选择z=dt+c作为经验回归方程,根据公式,

8_____

8xz

",尸1757-8X26X3.3八

d=~Z-=5722-8X262^0-225'

-8x2

r=l

AA

c=~z-d~x^3.3-0.225X26=-2.55,

A

/.z=O.23.v-2.55,

故),关于工的经验回归方程为;,=e°-23L2.55.

A

(3)当x=25时,y=e0-23x-255=e32<e4,

因此近期当地不会发生虫害.

16.(2021・淮南模拟)中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发

展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携

带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生

对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查样本中

有40名女生.下图是根据样本的调查结果绘制的等高堆积条形图(阴影区域表示关注“嫦娥

五号”的部分).

频率

1.00

0.70

0.50

女生男生性别

⑴完成下面的2X2列联表,并依据小概率值。=0.05的独立性检验,能否认为对“嫦娥五号”

的关注程度与性别有关?

关注没关注合计

合计

⑵若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦

娥五号”新闻关注的人数为随机变量X,求X的分布列及均值.

附:

a0.1500.1000.0500.0100.005

2.0722.7063.8416.6357.879

/2=(〃+〃)(c+J)(a+c)(i'其中〃=a+"+c+d

解⑴

关注没关注合计

男303060

女122840

合计4258100

零假设为儿:对“嫦娥五号”的关注程度与性别无关.根据列联表中数据,得

)100X(30X28—12X30〉800

工=42X58X40X60=丽23941>3.841=^o.o5,

依据小概率值。=005的独立性检验,推断〃。不成立,即认为对“嫦娥五号”的关注程度与

性别有关.

(2)因为随机选一名高三女生,对此事关注的概率2=常1?=行3,

又因为X〜43,需,,

所以随机变量X的分布列为

X0123

34344118927

P

1000100010001000

E(X)—np—^.

练后疑难精讲

[考情分析]高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的

形式出现,题目阅读量大,难度中档.

一、用样本估计总体

【核心提炼】

1.统计中的四个数据特征:

(1)众数:在样本数据中,出现次数最多的那个数据.

⑵中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个

数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即x=;(即+也+…+a).

(4)方差与标准差:

22

52=%但-X)+(X2—X)H------X)2],

222

s=q%(xi-X)+(X2—X)H------卜(X“-X)J.

2.频率分布直方图的两个结论:

频率

(I)小长方形的面积=组距乂端=频率.

(2)各小长方形的面积之和等于1.

【练后反馈】

题号1234561012

正误

错题整理:

二、回归分析

【核不提!1^1

1.经验回归直线经过样本点的中心(;,7),若x取某一个值,代入经验回归方程

AAA

y=b%+。中,可求出y的估计值.

2.样本相关系数:

(I)当厂>0时,称成对样本数据正相关;当X0时,称成对样本数据负相关.

(2)当忻>0.75时,称成对样本数据具有较强的线性相关关系.

【练后反馈】

题号8111415

正误

错题整理:

三、独立性检验

【核心提炼】

1.独立性检验的一般步骤

(1)根据样本数据列成2义2列联表;

(2)根据公式

/=再黑潦扁,计算/的值;

(3)查表比较z2与临界值的大小关系,作统计判断.

2./的值越大,对应假设事件成立(两类变量相互独立)的概率越小,Ho不成立的概率越大.

【练后反馈】

题号791316

正误

错题整理:

易错对点精补一

l.[Tl补偿](多选)(2021•福州一中模拟)刘女士的网店经营坚果类食品,2020年各月份的收入、

支出(单位:百元)情况的统计如图所示,下列说法中正确的是()

注:收入-------支出----------

A.4至5月份的收入的变化率与11至12月份的收入的变化率相同

B.支出最高值与支出最低值的比是5:1

C第三季度月平均收入为5000元

D.利润最高的月份是3月份和10月份

答案ACD

3()—5()

解析对于A选项,4至5月份的收入的变化率为==-2。,U至12月份的收入的变化

率为港洋一2。,因而两个变化率相同,所以A项正确.

对于B选项,支出最高值是2月份的60百元,支出最低值是5月份的10百元,故支出最高

值与支出最低值的比是6:1,故B项错误.

对于C选项,第三季度的7,8,9月每个月的收入分别为40百元,50百元,60百元,故第三

季度的平均收入为40+今+6°=50(百元)故C选项正确.

对于D选项,利润最高的月份是3月份和10月份都是30百元,故D项正确.

2.[T9补偿](2021•蚌埠模拟深校随机调查了110名不同的高中生是否喜欢篮球,得到如下的

列联表:

男女

喜欢篮球4020

不喜欢篮球2030

______〃(4一一______

附:r=

(a+b)(c+d)(a+c)(b+d)'

a0.0500.0100.001

3.841

Xa6.63510.828

参照附表,得到的正确结论是()

A.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别有关”

B.在犯错误的概率不超过0.1%的前提下,认为“喜欢篮球与性别无关”

C.依据小概率值a=0.01的独立性检验认为“喜欢篮球与性别有关”

D.依据小概率值a=0.01的独立性检验认为''喜欢篮球与性别无关”

答案C

110X(40X30-20X20)2

解析由题意得才=-60X50X60X5047.822>6.635=xo.oio.

6.635<7.822<10.828,

因此可以依据小概率值。=0.01的独立性检验,认为“喜欢篮球与性别有关”.

3.[T12补偿](2021•兰州模拟)“学习强国”学习平台是由中共中央宣传部主管,以习近平新

时代中国特色社会主义思想和党的十九大精神为主要内容,立足全体党员、面向全社会的优

质平台.2019年1月1日,“学习强国”学习平台在全国上线,某单位组织全体党员登录学习,

统计学习积分得到的频率分布直方图如图所示.若学习积分在[1,1.5)(单位:万分)的人数是

32人,则该单位共有名党员,若学习积分超过2万分的党员可获得“学习达人”称

号,则该单位有名党员能获得该称号.

答案808

解析由频率分布直方图可知,该单位学习积分在[1,1.5)内的党员所占的频率为0.8X0.5=

04,

所以该单位的党员总人数为盆=80,

该单位学习积分超过2万分的党员所占的频率为0.2X0.5=0.1,

因此该单位能获得“学习达人”称号的党员人数为80X0.1=8.

4.[T14补偿](2021.长沙模拟)若某商品的广告费支出M单位:万元)与销售额N单位:万元)

之间有如下对应数据:

X24568

y2040607080

根据上表,利用最小二乘法求得,关于x的经验回归方程为;,=£+1.5,据此预测,当投入

10万元时,销售额的估计值为万元.

答案106.5

解析由题意得x=±(2+4+5+6+8)=5,

■J=/20+40+60+70+80)=54,

A

所以54=56+1.5,

A

所以b=10.5,

A

所以y=10.5%+1.5,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论