统计与成对数据的分析各考点_第1页
统计与成对数据的分析各考点_第2页
统计与成对数据的分析各考点_第3页
统计与成对数据的分析各考点_第4页
统计与成对数据的分析各考点_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计与成对数据的分析

[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总

体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.

考点一统计图表

【核心提炼】

频率频率

1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示77请,频率=组距XTT蕾.

2.在频率分布直方图中各小长方形的面积之和为1.

3.利用频率分布直方图求众数、中位数与平均数.

(1)最高的小长方形底边中点的横坐标即众数.

(2)中位数左边和右边的小长方形的面积和相等.

(3)平均数是频率分布直方里的“重心”,等于频率分布直方图中每个小长方形的面积乘以小

长方形底边中点的横坐标之和.

例1(1)(多选)(2022・湖北八市联考)某中学举行党史知识竞赛,对全校参赛的100()名学生的

得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,

绘制了如图所示的频率分布直方图,根据图中信息,卜列说法正确的是()

A.图中的%值为0.020

B.这组数据的极差为50

C.得分在80分及以上的人数为400

D.这组数据的平均数的估计值为77

答案ACD

解析由(0.005+X+0.035+0.030+0.010)X10=L解得X=0.020,故选项A正确;

频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;

得分在80分及以上的人数的频率为

(0.030+0.010)X10=0.4,

故人数为1000X0.4=400,故选项C正确;

这组数据的平均数的估计值为55X0.05+65X0.2+75X0.35+85X0.3+95X0.1=77.

故选项D正确.

(2)(多选)(2022.张家口模拟)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会

期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣

言》),承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方计划建立“21

世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《直言》要

求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结

构比例,如图所示,

水、核、水、核、

20%

2020年一次能源消费结构2030年一次能源消费结构

经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()

A.2030年煤的消费量相对2020年减少了

B.2030年天然气的消费量是2020年的5倍

C.2030年石油的消费量相对2020年不变

D.2030年水、核、风能的消费量是2020年的7.5倍

答案BD

解析设2020年该地区一次能源消费总量为〃,则2020年煤的消费量为0.6”,

规划2030年煤的消费量为aX2.5X0.3=0.75〃>0.6m故A错误;

2020年天然气的消费量为0.1a,规划2030年天然气的消费量为aX2.5X0.2=0.5a=5X0.1a,

故B正确;

2。2。年石油的消费量为0.2a,规划2。3。年石油的消费量为aX2.5XU.2=U.5a>U.2a,故C错

误;

2020年水、核、风能的消费量为0.1。,规划2030年水、核、风能的消费量为”X2.5X0.3=

0.754=7.5X0.1a,故D正确.

易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义.

(2)频率分布直方图中纵坐标不要误以为是频率.

跟踪演练I(1)(多选)(2022.潍坊模拟)某市共青团委统计了甲、乙两名同学近十期“青年大学

习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是()

甲乙

78298

91345

254828

«5535

667

A.甲得分的30%分位数是31

B.乙得分的众数是48

C.甲得分的中位数小于乙得分的中位数

D.甲得分的极差等于乙得分的极差

答案BCD

解析对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而1OX3O%=3,

所以甲得分的30%分位数是35,A不正确;

对于B,乙的得分中有两448,其余分数值均只有一个,因此,乙得分的众数是48,B正确;

对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确:

对于D,甲得分的极差、乙得分的极差都是39,

D正确.

(2)(多选)(2022•广东六校联考)2021年I月II日,国家统计局发布2020年全国居民消费价格

指数(CPI)相关数据,指出2020年较好地实现了“居民消费价格涨幅3.5%左右”的物价调控

目标.2020年全国居民消费价格涨跌幅如折线图所示,则()

%n

军7.n

费6.n

通5.n-

4.

宏n

J.

至2I/

器Ln

肛n

OL.

;n

12H

定.

()年2

A.从环比看,CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%

B.2020年1月份CPI同比增长最多

C.2020年CPI环比上涨的月份数比下跌的月份数多

D.2020年全年CPI同比平均比2019年上涨约2.5%

答案ABD

解析由图中环比折线图可以看出,2020年11月份的环比为一0.6%,12月份的环比为+0.7%,

所以CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%,故选项A正确;

由同比折线图可以看出,2020年I月份的CPI同比增长5.4%,全年最高,故选项B正确;

从环比折线图可以看出,2020年CPI环比上涨的月份数为6,环比下跌的月份数也为6,

故选项C错误;

由同比折线图可知,2020年全年CPI同比平均比2019年上涨七X(5.4%+5.2%+4.3%+3.3%

+2.4%+2.5%+2.7%+2.4%+1.7%+().5%—0.5%+0.2%)22.5%,选项D正确.

考点二回归分析

【核心提炼】

求经验回归方程的步骤

(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).

AA

(2)计算出x,y,b.

(3)写出经验I可归方程.

例2(2022.湖南六校联考)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台

决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2022年7月

10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10

日至7月14日时段中的柞关数据,这5天的第x天到该电商平台专营店购物的人数N单位:

万人)的数据如下表:

日期7月10日7月11日7月12日7月13日7月14日

第X天12345

人数),(单位:万人)75849398100

(1)依据表中的统计数据,请判断该电商平台直播的第X天与到该电商平台专营店购物的人数

y(单位:万人)是否具有较高的线性相关程度?(注:若0.3<|,1<0.75,则线性相关程度一般,

若|力>0.75,则线性相关程度较高,计算,•时精确度为0.01)

(2)求购买人数),与直播的第x天的经验回归方程;用样本估计总体,请预测从2022年7月

10日起的第38天到该专营店购物的人数(单位:万人).

附:f(J7-~)2=434,-~)=64,小34(-65.879.

E(司一工)()L>')

样本相关系数r=―/

A/y)2

\j产।产i

Z(为一X)(y—y)

A1=1

经脸回归方程的斜率A=-----------------,

Z(为-X)2

1=1

AA_

极距a=y~bx.

解(1)由表中数据可得;=3,7=90,

所以之(即一x)2=10,

i=1

5_5__

又Zy月=434,£(A,—x)8—y)=64,

f=l1=1

5___

Z(为-x)GLy)

尸।64

所以,=-I---------------------=17^^0-97>0-75»

A/Ek)2Z(yi-y)2

所以该电商平台直播的第1天与到该电商平台专营店购物的人数),具有较高的线性相关程度.

(2)由(1)知可用一元线性回归模型拟合购买人数y与直播的第x天之间的关系.

5__

Z(为一x)(y-y)

_________________64_,,

b~;Z一m—6.4,

Z(XLX)2

/=>

八__A

则。=y—hx=90—6.4X3=70.8,

A

所以y=6.4x+70.8,

令x=38,可得y=6.4X38+70.8=314(万人).

预测从2022年7月10日起的第38天到该专营店购物的人数为314万人.

易错提醒(1)样本点不一定在经验回归直线上,但点(工,亍)一定在经验回归直线上.

A

(2)求人时,灵活选择公式,注意公式的推导和记忆.

(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是「的大小.

(4)区分样本相关系数,•与决定系数上.

(5)通过经验回归方程求的都是估计值,而不是真实值.

跟踪演练2(1)(多选)(2022.汕头模拟)如图所示,5个*,),)数据,去掉。(3,10)后,下歹J说法

正确的是()

y•£(10,12)

•0(3,10)

・C(4,5)

•8(2,4)

O\x

A.样本相关系数r变大

B.残差平方和变大

C.决定系数欠2变小

D.解释变量x与响应变量y的相关性变强

答案AD

解析由散点图知,去掉离群点。后,x与),的相关性变强,且为正相关,

所以样本相关系数r的值变大,决定系数A2的值变大,残差平方和变小.

(2)(多选)(2022・重庆模拟)某种产品的价格x(单位:元/kg)与需求量W单位:kg)之间的对应数

据如下表所示:

X1015202530

y1110865

根据表中的数据可得经验同归方程;=晨+14.4,则下列正确的是()

A.样本相关系数r>0

A

B为=一0.32

C.若该产品价格为35元ikg,则日需求量大约为3.2kg

D.第四个样本点对应的残差为一0.4

答案BCD

解析对A,B,由表中的数据可知,

—10+15+20+25+30

x==20,

—11+10+8+6+5

>'=5:8,

AA

将x,y代入y=Z?x+14.4,

得.=一0.32,所以A选项错误,B选项正确;

AA

对C,将x=35代入y=-o.32t+14.4得),=3.2,

所以日需求量大约为3.2kg,

所以C选项正确;

A

对D,第四个样本点对应的残差为w—户=6一(-0.32X25+14.4)=—().4,所以D选项正确.

考点三独立性检验

【核心提炼】

独立性检脸的一般步骤

(I)根据样本数据列2X2列联表.

(2)根据公式/=g+份(c1①(〃+)3出+dy计算z2的值•

(3)查表比较z2与临界值的大小关系,作统计判断.Z2越大,对应假设事件X)成立(两类变量

相互独立)的概率越小,为不成立的概率越大.

例3(2022・济宁模拟)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模

式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了10()人,其中男生

占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人

数占总人数的32%.学校为了考查学生对寄宿生活适应与否是否与性别有关,构建了如下2义2

列联表:

不适应寄宿生活适应寄宿生活合计

男生

女生

合计

(1)请将2X2列联表补充完整,并依据小概率值«=0.01()的独立性检验,是否可以推断适应

寄宿生活与否与性别有关;

⑵从男生中以“是否适应寄宿生活”为标准采用分层随机抽样的方法抽取10人,再从这10

人中随机抽取2人,若所选2名学生中的“不适应寄宿刍活”人数为X,求随机变量X的分

布列及均值.

附:)=m+〃)(;;d)m;c)(b+d),其中〃=。+力+c+”

a0.0250.0100.001

5.024

Xn6.63510.828

解(1)补充列联表如下:

不适应寄宿生活适应寄宿生活合计

男生83240

女生322860

合计4060100

零假设为Ho:适应寄宿生活与否与性别无关.

根据列联表中的数据得,

,100X(8X28—32X32)2

L-40X60X40X60-l>6.635=xo.oio,

根据小概率值。=0.010的独立性检验,推断%不成立,可以推断适应寄宿生活与否与性别

有关联.

(2)由题意知,抽取的10人中,有2人不适应寄宿生活,有8人适应寄宿生活,

故随机变量X的取值可以是0,1,2,

P(x=o)=悬嗡

P(X_1)_Go-45,

C51

尸(X=2)=C>45,

随机变量X的分布列为

X012

28161

P454545

因此,E(X)=OX^|+1X^1+2X^=1.

易错提醒(1川越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得

无关的可能性.

(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性

为0.01.

跟踪演练3(2022•河北联考)《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌

的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是

针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),

形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占据了一

定的消费者心智.如图是II月份中国某信息网发布的我国4市2021年上半年新锐品牌人群

用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分

析数据.4市从购买家电类新锐品牌人群中随机调查了10()位男性顾客和100位女性顾客,

统计出每位顾客购买家电消费金额,根据这些数据得到如图所示的频数分布表:

A市2。21年上半年新锐品牌人群用户性别分析

70.0%--------------------------

60.0%-................................

50.0%-................................

40.0%--------------------------75%

30.0%--------------------------

20.0%--------------

10.0%-------25%-------

0.0%----------------------------------

女性男性

消费金额(元)[0,100](100,1000](1000,5000:(5000,10000](10000,一8)

女性顾客人数50301064

男性顾客人数204024106

(1)若以我国A市2021年上半年新锐品牌人群用户性别分析数据作为A市抽取新锐品牌人群

性别概率,从A市新锐品牌人群中随机抽取四人,X为四人中男性的人数,求X的概率分布

列和均值;

(2)根据4市统计购买家电消费金额数据频数分布表,完成下列2X2列联表,并依据小概率

值a=0.010的独立性检验,分析购买家电类新锐品牌人群消费金额千元以上是否与性别有

关?

不超千元千元以上合计

女性顾客

男性顾客

合计

_______n(ad-be?_______

附:r=〃=a+/?+c+d.

(〃+/?)((■+")(〃+(,)(/?+d)

a0.0500.0100.001

Xa3.8416.63510.828

解(1)若以我国A市2021年上半年新锐品牌人群用户性别比例数据作为A市抽取新锐品牌

人群性别概率,则A市新锐品牌人群中随机抽取一人为男性的概率为75%,为女性的概率为

25%,且X服从二项分布,

X的所有可能取值为0,1,234,

P(x=o)=dxQ卜总

始=1)=小0”6>磊,

P(X=3)=CX*肌虚

81

256,

得X分布列为

X01234

13272781

P2566412864256

3

-

4

(2)根据所给数据,可得2X2列联表:

不超千元千元以上合计

女性顾客8020100

男性顾客6040100

合计14060200

零假设为为:购买家电类新锐品牌人群消费金额千元以上与性别无关.

33〃皿/,0,200X(80X40-20X60)2

根据列联表得/=―1nnv1nnv1anyAH-29.524>6.635=xo.oio,

1UUZX1UUA14UAOU

根据小概率值a=0.010的独立性检验,推断“o不成立,即认为购买家电类新锐品牌人群消

费金额千元以上与性别有关.

专题强化练

一、单项选择题

1.某公司2022年1月至7月空调销售完成情况如图,如7月份销售量是190台,若月份为

x,销售量为),,由统计数据(为,3',)(/=1,2,7)得到散点图,下面四个经验回归方程类型

中最适合作为销售量),和月份x的经验回归方程类型的是()

A.y=a-\rbx

C.y=a-^-beKD.y=a-\-h\x\x

答案B

解析由散点图分布可知,散点图分布在一个二次函数的图象附近,因此,最适合作为销售

量),和月份x的经验回归方程类型的是),=〃+/状2.

2.(2022.全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,

随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位

社区居民在讲座前和讲座后问卷答题的正确率如图,则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前止确率的极差

答案B

解析对于A,讲座前问卷答题的正确率的中位数是现亏22=72.5%,所以A错误:

对于B,讲座后问卷答题的正确率分别是80%.85%,85%,85%,85%,90%,90%,95%,100%,100%,

其平均数显然大于85%,所以B正确;

对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较

小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C

错误;

对于D,讲座前问卷答题的正确率的极差是95%—60%=35%,讲座后问卷答题的正确率的

极差是100%—80%=20%,所以讲座前问卷答题的正确圣的极差大于讲座后问卷答题的正确

率的极差,所以D错误.故选B.

3.(2022.济南模拟)某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐

四种树苗共计1200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为

600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数

量为()

A.34B.46C.50D.70

答案C

解析由扇形统计图知,购买的1200棵树苗中,侧柏的数量为120()X25%=300,

依题意知,高一、高二、高三分到的侧柏的棵数比为600:400:200=3:2:1,所以高三年

级应分得侧柏的数量为?300=50.

JI4I1

4.(2022・运城模拟)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生

活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量

y与温度x的关系可以用模型,,=。户公(其中e为自然对数的底数)拟合,设z=lny,其变换

后得到一组数据:

X2023252730

z22.4334.6

由上表可得经验回归方程z=()2r+m则当x=6()时,蝗虫的产卵量y的估计值为()

A.e6B.10C.6D.e10

答案D

解析由表格数据知,

—1

x=§X(20+23+25+27+30)=25,

—1

z=口2+2.4+3+3+46)=3,

V(x,z)满足z=0.2v+a,

得。=3—0.2乂25=—2,

/.z=0.1x—2,即ln>,=0.2x—2,

.・.尸必-2,

・•・当x=60时,y=e,0,

故当x=60时,蝗虫的产卯量y的估计值为。叱

5.(2022・绵阳模拟)某车间从生产的一批产品中随机抽取了1000个零件进行一项质量指标的

检测,整理检测结果得此项质量指标的频率分布直方图如图所示,则下列结论错误的是()

A.«=0.005

B.估计这批产品该项质量指标的众数为45

C.估计这批产品该项质量指标的中位数为60

D.从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5

答案C

解析(a+0.0354-0.030+0.020+0.010)X10=1,解得a=0.005,故A正确;

频率最大的一组为第二组,中间值为"詈=45,

所以众数为45,故B正确;

质量指标大于等于60的有两组,

频率之和为(0.020+0.010)X10=0.3<0.5,

所以60不是中位数,故C错误;

由于质量指标在150,70)之间的频率之和为(0.03+0.02)X10=0.5,

可以近似认为从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5,故D

正确.

6.为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班

30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均

成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为()

A.74B.128

C.138D.136

答案C

解析记甲班成绩的平均数为7,方差为金,

乙班成绩的平均数为),,方差为乐

甲、乙两班全部同学成绩的邛均数为z,方差为P

则x=77,艰=123,.V=70,#=130,

—4030

z=wX77+wX70=7^

$2=={40氐+(x—z)2]+30[6+(y—z)2]}

=*X{40X1123+(77-74)2]+30X[130+(70—74)2])=138.

二、多项选择题

7.(2022・益阳调研)据新华社报道,“十三五”以来,中国建成了全球规模最大的信息通信网

络,光纤宽带用户占比从2015年底的56%提升至94%,行政村通光纤和4G的比例均超过了

99%:中国移动网络速率在全球139个国家和地区中排名第4位;在5G网络方面,中国已

初步建成全球最大规模的5G移动网络.如图是某科研机构对我国2023-2029年5G用户规

模和年增长率发展的预测图,则下列结论正确的是()

2023-2029年中国5G用户规模和年增长率发展预测图

口5G用户规模/万人・年增长率

A.2023—2029年,我国5G用户规模逐年增加

B.2023—2028年,我国5G用户规模后3年的方差小于前3年的方差

C.2023—2026年,我国5G用户规模的年增长率逐年下降

D.2023—2029年,我国5G用户规模年增长最多的是2025年

答案ABC

解析由题图可知,2023—2029年,我国5G用户规模逐年增加,故A正确;

2023—2028年,我国5G用户规模前3年比后3年的分散,方差比后3年的大,故BE确:

2023—2026年,我国5G用户规模的年增长率逐年下降,故C正确;

2023—2029年,我国5G用户规模年增长最多的是2024年,增加了35978.6万人,而2025

年我国5G用户规模增加了27317.4万人,所以D错误.

8.(2022.荷泽模拟)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,

建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:

年份20182019202020212022

年份代码X12345

年借阅量乂万册)4.95.15.55.75.8

根据上表,可得),关于x的经验回归方程为;=0.2M+;下列结论正确的有()

A

A.a=4.68

B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7

C,),与x的样本相关系数,>0

D.2023年的借阅量一定不少于6.12万册

答案ABC

解析对于A,

一1

因为x=彳乂(1+2+3+4+5)=3,

~=卜(4.9+5.1+5.5+5.7+5.8)=5.4,

AA

所以5.4=0.24X3+m得。=4.68.所以A正确:

对于B,因为5X75%=3.75,所以借阅量4.9,5.1,5.55.7,5.8的75%分位数为5.7,所以B

正确;

对于C,因为0.24X),所以),与x的样本相关系数r>0,

所以C正确;

A

对于D,由选项A可知经验回归方程为),=0.24x+4.68,

A

当x=6时,y=0.24X6+4.68=6.12,所以2023年的借阅量约为6.12万册,而且这只是预测

值,不能确定2023年的借阅量一定是多少,所以D错误.

9.(2022・山东联考)为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随机

抽取了50名高中生,通过问卷调查,得到以下数据:

选物理不选物理

数学成绩优异207

数学成绩一般1013

由以上数据,计算得到冷.,卷猊黑7)「4.84%根据临界值表,以下说法正确的

是()

参考数据:

«0.10.050.010.0050.001

2.7063.8416.6357.87910.828

A.依据小概率值«=0.05的独立性检验认为是否选择物理与数学成绩有关

B.在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关

C.95%的数学成绩优异的同学选择物理

D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会发生变化

答案AB

解析因为4.844>3.841=x0,o5,

所以依据小概率值。=。05的独立性检验认为是否选择物理与数学成绩有关;

因为4.844<6.635=AO.OI,

所以在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关;

若表中的数据都扩大为原来的10倍,

500X(130X200—100X70)2

L-230X270X200X300~~8.44,

又48.44〉10.828,故结论发生变化.

10.(2022.连云港模拟)一组数据足,也,…,片。是公差为一1的等差数列,若去掉首末两项

X\,X|0后,则()

A.平均数变大B.中位数没变

C.方差变小D.极差没变

答案BC

解析由题意可知,对于选项A,原数据的平均数为x=古⑴+足"!----5(X5+x6)

=.(注+观),去掉r,xio后的平均数为

"=|(X24-X3H----I-X9)=|X4(X54-X6)=5(X5+X6)=X.

即平均数不变,故选项A错误;

对于选项B,原数据的中位数为猛+此),去掉内,回)后的中位数仍为猛+品),即中位数

没变,故选项B正确;

对于选项C,设公差为4则原数据的方差为

/=忠[片一|(工5+此)}+[12一|(出+入6)}H----FX1O—1('5+入6)1

=也一粉+(一孙+(-粉+(一粉+(-妹+&}+&>+

勖+勖+(初弁

去掉片,为0后的方差为

2

=部产一拉+与6)}+[%3-;(格+亦6))

4(一孙+(-汾+(-汾+(-9>+&)2+&>+(|d)2+(处]

_21

一4,

即方差变小,故选项C正确;

对于选项D,原数据的极差为

x\—x\o=-9d=9,

去掉xi,xio后的极差为刈一灼=-7d=7,

即极差变小,故选项D错误.

三、填空题

11.某工厂为研究某种产品的产量M吨)与所需某种原材料的质量M吨)的相关性,在生产过

程中收集4组对应数据/,),),如表所示.(残差=观测值一预测值)

X3456

y2.534m

根据表中数据,得出y关于x的经验回归方程为『=0.7工+4据此计算出在样本(4,3)处的残差

为-0.15,则表中m的值为.

答案4.5

解析因为样本(4,3)处的残差为一0.15,

即),一)=3—(0.7X4+a)=-0.15,所以a=0.35,

所以经脸回归方程为y=0.7x+0.35,

—3+4+5+6

因为x==4.5,

—2.5+3+4+加9.5+〃?

)'=4=—~

又样本中心点(K,y)在经验回归直线上,

所以竺产=0.7X4.5+0.35,解得机=4.5.

12.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,

将测试结果分成五组:第一组口3/4),第二组口4/5),…,第五组[17,18].如图是按上述分

组方法得到的频率分布直方图,若成绩低广〃即为优秀,如果优秀的人数为14,则。的估计

值是.

频率

组距

答案14.5

14

解析优秀人数所占的频率为含=0.14,

测试结果位于[13,14)的频率为0.06<0.14,

测试结果位于[13,15)的频率为0.06+0.16>0,14,

所以。£(14,15),

由题意可得0.06+(a—14)X0.16=0.14,

解得“=145

四、解答题

13.(2021.全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指

标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如

下:

旧设备9.810.310.010.29.99.810.010.110.29.7

新设备10.110.410.110.010.110.310.610.510.410.5

旧设备和新设备生产产品的该项指标的样本均值分别记为x和),,样本方差分别记为嘘和

(1)求工,y,5b52;

⑵判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果),-X

2H喑则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有

显著提高).

-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-03,

解(1)由表格中的数据易得x-------------------------77-------------------------+10.0=

10.0,

0.14-0.4+0.1+0+0.1+0.3-1-0.6+0.5+0.4+0.5

1-10.0=10.3,

10

戴=而X[(9.7-10.O)2+2X(9.8一10.0)2+(9.9-10.0)2+2X(10.0—10.0)2+(10.1-10.0)2+

2X(102—10.0)2+(10.3—10.0尸]=0.036,

5S=-j^X[(10.0-10.3)2+3X(10.1-10.3)2+(10.3—10.3)2+2X(10.4—10.3)2+2X(10.5-

10.3)2+(10.6-10.3)2]=0.04.

⑵由(1)中数据可得亍-G=10.3—10.0=0.3,而2寸寄=7|(9+55=1()33()4,显然

有了一;>2弋写也成立,所以认为新设备生产产品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论