备战2023年高考数学二轮专题复习专题五 概率与统计第3讲 统计、成对数据的统计分析_第1页
备战2023年高考数学二轮专题复习专题五 概率与统计第3讲 统计、成对数据的统计分析_第2页
备战2023年高考数学二轮专题复习专题五 概率与统计第3讲 统计、成对数据的统计分析_第3页
备战2023年高考数学二轮专题复习专题五 概率与统计第3讲 统计、成对数据的统计分析_第4页
备战2023年高考数学二轮专题复习专题五 概率与统计第3讲 统计、成对数据的统计分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲统计、成对数据的统计分析

明确备考方向1

⑥真题体验

1.[样本的数字特征](2022.全国甲卷,T2)某社区通过公益讲座以普及

社区居民的垃圾分类知识.为了解讲座效果随机抽取1()位社区居民,

让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区

居民在讲座前和讲座后问卷答题的正确率如图,则(B)

*讲座前•讲座后

12345678910

居民编号

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

解析:对于A,讲座前问卷答题的正确率的中位数是至产=72.5%,所

以A错误;对于B,讲座后问卷答题的正确率分别是

80%,85%,85%,85%,85%,90%,90%,95%/00%,100%,其平均数显然大

于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波

动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正

确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对

于D,讲座前问卷答邈的正确率的极差是95%-60%=35%,讲座后问卷

答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确

率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.

2」频率分布直方图](2021.全国甲卷,T2)为了解某地农村经济情况、对

该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整

理得到如下频率分布直方图:

,频率

根据此频率分布直方图,下面结论中不正确的是(C)

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元

之间

解析:对于A,该地农户家庭年收入低于4.5万元的农户比率估计为

(0.02+0.04)x1=0.06=6%,故选项A正确;

对于B,该地农户家庭年收入不低于10.5万元的农户比率估计为

(0.04+0.02x3)x1=0.1=10%,故选项B正确;

对于C,估计该地农户家庭年收入的平均值为

3x0.02+4x0.04+5x0.10+6x0.14+7x0.20+8x0.20+9x0.10+10x0.10+11x0

.04+12x0.02+13x0.02+14x0.02=7.68>6.5万元,故选项C错误;

对于D,该地农户家庭年收入介于4.5万元至8.5万元之间的比率为

(0.10+0.14+0.20+0.20)x1=0.64>0.5,故估计该地有一半以上的农户其

家庭年收入介于4.5万元至8.5万元之间,故选项D正确.故选C.

3」回归分析](2022.全国乙卷,T19)某地经过多年的环境治理,已将荒

山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了

10棵这种树木,测量每棵树的根部横截面积(单位:n?)和材积量(单

位:n?)彳导到如下数据:

样本号i根部横截面积Xi材积量y1

10.040.25

20.060.40

30.040.22

40.080.54

50.080.51

60.050.34

70.050.36

80.070.46

90.070.42

100.060.40

总和0.63.9

101010

并计算得Z蜡二0.038,Z%?=L6158,ZXiyi=0.2474.

i=li=li=l

⑴估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积

量;

⑵求该林区这种树木的根部横截面积与材积量的样本相关系数(精确

至Uo.oi);

⑶现测量了该林区所有这种树木的根部横截面积,并得到所有这种树

木的根部横截面积总和为186nf.已知树木的材积量与其根部横截面

积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计

值.

n

I(Xi-x)(yi-y)_______

附:相关系数,t=1,VT896-1.377.

t(Xi-x)2£(yi-y)

10

Zx

解:⑴估计该林区这种树木平均一棵的根部横截面积石墨"a*0.06,

10

估计该林区这种树木平均一棵的材积量歹=于=蔡=0.39.

1010

⑵E(xi-x)(yi-y)=£Xiyi-10xy=0.0134,

i=li=l

1010

Y(Xi-x)2=Xxf-10x=0.002,

i=li=l

1010.

Z(yi-y)2=Zy^-ioy=0.0948,

所以

1010___________________________________

2

Z(工「幻Z(yry)=V0.002x0.0948=V0.0001x1.896-0.01xl,3

、i=li=l

77=0.01377,

10

所以样本相关系数』々黑岩-97.

1010U.U1377

Z(Xi-x)2z(yi-y)2

《=1i=i

⑶设该林区这种树木总材积量的估计值为Ym)由题意可知该种树

木的材积量与其根部横截面积近似成正比,所以照=心,

0.6186

所以丫二竺锻=i209,即该林区这种树木的总材积量的估计值为1209

V.O

4」独立性检验](2022.全国甲卷,T17)甲、乙两城之间的长途客车均由

A和B两家公司运营为了解这两家公司长途客车的运行情况,随机调

查了甲、乙两城之间的50()个班次彳导到下面列联表:

准点班次数未准点班次数

A24020

B21030

⑴根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的

概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客

车所属公司有关?

附"----n(")2-------

•(a+b)(c+d)(a+c)(b+d)'

P(K2>k)0.1000.0500.010

2.7063.8416.635

解:(1)由题意可得A公司甲、乙两城之间的长途客车准点的概率为

240_12

240+20-13’

B公司甲、乙两城之间的长途客车准点的概率为高芸.

N1U+3Uo

500X(240X30-20X210)2

(2)K2==3.205>2.706,

(240+20)X(210+30)X(240+210)X(20+30)

所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所

属公司有关.

《考情定位

统计知识主要考查:抽样方法、样本数字特征、统计图表等.以选

择题、填空题形式命题,难度较小;回归分析与独立性检验常与概率交

汇命题,也是近年的热点,常出现在第19或2()题的位置,以中档题为主.

此类题目重在考查考生的数学抽象、逻辑推理、数学建模、数学运算、

数据分析等核心素养.

突破热心提升关键能力

热点一回归分析在实际问题中的应用

♦核心必备♦

AAA

1.方程yx+a是两个具有线性相关关系的变量的一组数据

(xi,yD,(X2,y2),…,(Xn,yn)的经验回归方程,其中a,b是待定参数,经验回归

An_A

X(Xi-x)(yi-y)A

方程的斜率和截距分别为b二口一Q*叵(元历是样本中心点,

Z(阳3)2

1=1

经验回归直线过样本中心点.

2.(1)正相关与负相关就看经验回归直线的斜率,斜率为正则为正相关,

斜率为负则为负相关.

⑵样本相关系数r具有以下性质:r>0表示两个变量正相关,r<0表示两

个变量负相关;k区1,且|r|越接近于1,线性相关程度越强,|r|越接近于0,

线性相关程度越弱.

典例1(2022.四川绵阳三模)随着科技进步,近来年,我国新能源汽车

产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我

国新能源乘用车的年销售量数据:

年份201620172018201920202021

年份代

123456

码X

新能源

乘用车

5078126121137352

年销售

Y(万辆)

⑴根据表中数据,求出Y关于x的经验回归方程;(结果保留整数)

⑵若用丫小非模型拟合Y与x的关系,可得回归方程为y=37.7le。*,

经计算该模型和第⑴问中模型的K(R2为决定系数)分别为0.87和

0.71,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量

的预测值;

⑶你认为⑵中用哪个模型得到的预测值更可靠?请说明理由.

参考数据:设u二Iny,其中Ui=lnyi.

66

I

i=li=l「3.63「5.94「6.27

yUV

(y.-y)(Ui-U)

1444.788415.7037.71380528

参考公式:对于一组具有线性相关关系的数据(Xi,yi)(i=l,2,3,...,n),其经

验回归方程尸bX+Q的斜率和截距的最小二乘估计公式分别为

.1(x^yi-y)A_

b=L^Ln-----,a=y-bx.

i(Xi-x)2

i=i

解:(1)由表中数据得冗」+2+3:+5+6=35,歹二]44,

O

6__6

Z(Xi-君(yi-歹)=841,Z(Xi-X)2=(Xl-X)2+(X2-X)2+(X3-X)2+(X4-X)2+(X5-X)2+(X

i=li=l

6-X)2

=(l-3.5)2+(2-3.5)2+(3-3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2=17.5,

人6__

所以b----

z(Xi-x)217.5

i=i

a=y-bx=144-48x3.5=-24,f^lUY关于x的经验回归方程为y=48x-24.

(2)由(1)知,Y关于x的经验回归方程为y=48x.24,

当x=7时,2022年我国新能源乘用车的年销售量的预测值

A

y=48x7-24=312(万辆);

对于回归方程尸37.7他。芈当x=7时,2022年我国新能源乘用车的年

A

销售量的预测值y=37.71e°-33x7=e3,63xe23=e594=380(万辆).

A

⑶依题意,y=37.71e。^模型和第⑴问中模型的R2(R2为决定系数)分

别为0.87和0.71,

由于决定系数越接近于1,两个变量之间的关系就越强,相应的拟合程

度也越好,

A

所以y=37.7模型得到的预测值更可靠.

♦总结提升*-----------------------

⑴对于非线性回归分析问题,应先进行变量代换,求出代换后的经验

回归直线方程,再求经验回归曲线方程.

(2)成对样本数据之间线性相关的程度,可以利用样本相关系数判断,|r|

越趋近于1,两变量的线性相关程度越强.

热点训练1某公司为确定下一年度投入某种产品的宣传费,需了解

年宣传费x(单位:千元)对年销售量Y(单位:t)和年利润z(单位:千元)的

影响,对近8年的年宣传费Xi和年销售量双1=12...,8)数据作了初步处

理彳导到散点图及一些统计量的值.

年销售量八

620

600.♦♦

580-♦♦

560-♦

540.

520

500♦

4801―1—1―1―1—1—1―1—1—1-1―1~-

343638404244464850525456

年宣传费/千元

8

8E(o)i-

i=l

88E(xi-x)-(yi-

2

£(Xi-%)X(3i■石)2i=l

Xy0)

i=li=lto)-(yi-

y)

y)

46.65636.8289.81.61469108.8

表中(l)i=fx[jjij=u)i.

yvi=l

⑴根据散点图判断*a+bx与y=c+d«哪一个适宜作为年销售量Y关

于年宣传费x的经验回归方程类型?(给出判断即可,不必说明理由)

⑵根据⑴的判断结果及表中数据建立Y关于x的经验回归方程;

⑶已知这种产品的年利润z与x,Y的关系为z=0.2Y-x根据⑵的结果

回答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(U1,V]),(U2,V2),…,(Un,Vn),其经验回归方程U=a+/?U的

AZ(Ui-U)(Vi-V)A

斜率和截距的最小二乘估计分别为:夕——丁,境行邛u.

E(Ui-U)2

i=i

解:(1)由散点图知,各点呈非线性递增趋势,所以y=c+d«作为经验回

归方程比较合适.

A3

,L,.£(3厂3)(y厂歹)

(2)由⑻=存厕-------=——=68,

"I(3同1.6

i=i

AAA

由5=6.8,歹二563,得。=歹-弓不=563-68x6.8=100.6,所以y=100.6+68\/£

⑶①当x=49时,年销售量y=100.6+68x•=576.6⑴.止匕时年利润

z=0.2x576.6-49=66.32(千元).

②由题

意,z=0.2x(100.6+68Vx)-x=20.12+13.6V%-(A/%)2=-(V^-6.8)2+66.36,

所以当y二6.8,即x=46.24时,年利润的预报值最大.

热点二独立性检验

♦核心必备♦

n(ad-bc)2

“卡方公式":口二,n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

典例2(2021.山东济南期末)为了研究某种疾病的治愈率,某医院从

过往病例中随机抽取了100名患者,其中一部分患者采用了外科疗法,

另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况绘制

了等高堆积条形图如图.

⑴根据图表完善以下关于治疗方法和治愈情况的2x2列联表:

疗效

疗法1=1VI

未治愈治愈

外科疗法

化学疗法18

合计100

⑵依据小概率值a=0.05的独立性检验,分析此种疾病治愈率是否与治

疗方法有关.

2

附:冷n(ad-bc)(如需计算片,结果精确到().()()1),

(a+b)(c+d)(a+c)(b+d)

X2独立性检验中常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

治愈率等高堆积条形图

90%

1~1冶命

70%1_1汨感

OU%

f-1去治命

3U%1__1不旧腔

qu%

onoz

ZUzo

1U/b

noz

外科疗法化学疗法

解:(1)由题意及等高堆积条形图可得,2x2列联表如表.

疗效

疗法

未治愈治愈

外科疗法202040

化学疗法421860

合计6238100

⑵零假设为H。:是否治愈与治疗方法无关联.

由列联表中的数据可得,*丹黑黑075>3.841,

根据小概率值a=0.05的独立性检验,我们能推断Ho不成立,即认为是

否治愈与治疗方法有关联,此推断犯错误的概率不大于0.05.

♦总结提升*.......--............

独立性检验的具体做法

(1)根据实际问题的需要确定容许推断、两个随机事件有关系”犯错误

概率的小概率值%然后查表确定临界值.

⑵利用公式,计算弋.

(3)如果冷Xa,就推断,X与Y有关系”,这种推断犯错误的概率不超过a;

否则,就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关

系;或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.

热点训练2为进一步做好新冠肺炎疫情防控工作,某社区以网上调

查问卷的形式对辖区内部分居民做了新冠疫苗免费接种的宣传和调

查.调查数据如下:共95份有效问卷,40名男性中有10名不愿意接种疫

苗,55名女性中有5名不愿意接种疫苗.

⑴根据所给数据,完成下面的2x2列联表,并根据列联表根据小概率

值a=0.050的子独立性检验,判断是否有95%的把握认为是否愿意接

种疫苗与性别有关?

态度

性别合计

愿意接种不愿意接种

合计

⑵从不愿意接种的15份调查问卷中得到拒绝接种新冠疫苗的原因:

有3份身体原因不能接种;有2份认为新冠肺炎已得到控制,无需接种;

有4份担心疫苗的有效性;有6份担心疫苗的安全性.求从这15份问卷

中随机选出2份,在已知至少有一份担心疫苗安全性的条件下,另一份

是担心疫苗有效性的概率.

附:小二____ma-c)_______

(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.005

Xa3.8416.6357.879

解:⑴补全2x2列联表如表.

态度

性别合计

愿意接种接种

男301()40

女50555

raid-801595

n(ad-bc)295x(30x5-50xl0)2.彳八仆re—

L(9a+b)(c+d)(a+c)(b+d「40X55X80X154408>3,841一。。5。.

根据小概率值a=0.050的片独立性检验,有95%的把握认为是否愿意

接种疫苗与性别有关.

⑵设事件A为“至少有一份担心疫苗安全性二事件B为“另一份担心疫

苗有效性”,

则P(A)=1.学①,则P(AB)二学二色,所以P(B|A)二”竺工寮色.

7

、的535、)Cf535八\।/p(A)||23

热点三概率与统计的综合问题

典例3(2022.山东济南高三期末)某机构为了解市民对交通的满意度,

随机抽取了1()()位市民进行调查,结果如下:回答“满意”的人数占总人

数的一半在回答嗨意,,的人中,,,上班族,,的人数是啡上班族认数的去

在回答“不满意”的人中,啡上班族”占不

⑴请根据以上数据填写下面2x2列联表,并依据小概率值a=0.001的

独立性检验,分析能否认为市民对于交通的满意度与是否为上班族存

在关联?

满意不满意

上班族

非上班族

合计

⑵此机构欲随机抽取部分市民进一步调查规定抽样的次数不超过

n(nGN)若随机抽取的市民属于不满意群体,则抽样结束:若随机抽取

的市民属于满意群体,则继续抽样,直到抽到不满意市民或抽样次数达

到n时,抽样结束.

①若n=5,写出X5的分布列和数学期望;

②请写出Xn的数学期望的表达式(不需证明),根据你的理解说明治的

数学期望的实际意义.

附:

丽常乐丽其中产a+b+c+d.

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

解:(1)由题意可知,2x2列联表如表,

满意不满意orb

上班族154055

非上班族351045

合计5050100

零假设为H。:市民对交通的满意度与是否上班独立.因为

2_100X(15X10-35X40)2_2500

~25.253>10.828,

'-50x50x55x45-99

根据小概率值a=0.001的独立性检验,我们推断Ho不成立,即认为市民

对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001.

⑵①当n=5时,X5的可能取值为123,4,5,由⑴可知市民的满意度和不

满意度均为右

所以P(x5=1)=iP(X5=2)=^P(X5=3)=^P(X5=4)=^P(X5=5)=^

所以X5的分布列为

X512345

11111

P

27

所以E(X5)=lx92x/3x#4x/5xa得

②E(Xn)=lx>2x*+3x#…+(n-1)•奈+n.击=2.嘉,

当n趋向于正无穷大时,E(Xn)趋向于2,此时E(XJ恰好为不满意度的

倒数,

也可以理解为平均每抽取2个人,就会有一个不满意的市民.

♦总结提升*----------------------

解决概率与统计综合问题的一般步骤

热点训练3(2021.重庆渝中区期末)某中学成功地举办了一年一度

的大型学生社团文化节,吸引了众多学生该中学目前共有社团近40

个,由高一和高二学生组成,参加社团的学生有四百人左右.已知该中

学高一和高二的所有学生中男生与女生人数比为6:4,为了解学生参

加社团活动的情况,按性别采用分层抽样的方法抽取部分学生,统计得

到如图等高堆积条形图.

⑴求该中学参加社团的学生中,任选1人是男生的概率;

⑵若抽取了100名学生,完成下列2x2列联表,并依据小概率值a=0.05

的独立性检验,能否认为该中学高一和高二学生的性别与参加学生社

团有关联?请说明理由.

参加社团未参加社团合计

男生

女生

合计

附户…黑鬟…g+b+c+d.

a0.10.050.01

Xa2.7063.8416.635

解:(1)设高一和高二的所有学生中任选一人是男生、是女生分别为事

件A,4,

设高一和高二的所有学生中任选一人参加社团为事件R,则

P(A)=60%,P(不二40%,

P(A)P(B\A)_P(4)P(B|4)_60%X10%_6_3

则P(A|B)=--

P(B)P(/l)P(B|/l)+P(^)P(B|X)60%X10%+40%x20%-6+87

(2)2x2列联表如表,

参加社团未参加社团合计

男生65460

女生83240

合计148610()

零假设为Ho:性别与参加社团独立,即性别与参加社团无关.

根据列联表中的数据,经计算得到

,100X(6X32-8X54)

Y-=--------------------------------R.993V3.841=ao.o5,

N14X86X60X40

依据小概率值-0.05的独立性检验,没有充分的证据推断Ho不成立,

因此可以认为Ho成立,即性别与参加社团无关

专题强化训练(十七)

一、单项选择题

1.(2022•山东莱西高三期末)通过随机询问某中学110名中学生是否爱

好跳绳狷到列联表:

性别

跳绳

男女

爱好402060

不爰好203050

6050110

2

已知冷丽舞篇丽/(虑3828尸。.岫根据小概率值心。.。。1

的片独立性检验,以下结论正确的为(D)

A.爱好跳绳与性别有关

B.爰好跳绳与性别有关,这个结论犯错误的概率不超过().0()1

C.爱好跳绳与性别无关

D.爰好跳绳与性别无关,这个结论犯错误的概率不超过0.001

n(ad-bc)2110X(40X30-20X20)

解析:『二-7.822<10.828,

(a+b)(c+d)(a+c)(Z?+d)60x50x60x50

则爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001.故选D.

2.某公司为了确定下一年投入某种产品的宣传费,需了解年宣传费

x(单位:万元)对年销售量Y(单位:千件)的影响.现收集了近5年的年宣

传费x(单位:万元)和年销售量Y(单位:千件)的数据,其数据如表所示,

A八

且Y关于x的经验回归方程为y=bx.8.2,则下列结论错误的是(C)

X4681012

Y1571418

A.x,Y之间呈正相关关系

A

B.b=2.15

C.该经验回归直线一定经过点(8,7)

D.当此公司该种产品的年宣传费为20万元时预测该种产品的年销售

量为3480()件

解析:由表中数据可得了=*(4+6+8+10+12)=8歹=,(1+5+7+14+18)=9,

AA

故经验回归直线一定经过点(8,9),故9=88-8.2,解得b=2.15,故A,B正

确,C错误;

AA

将x=20代入y=2.15x-8.2,解得y=34.8,故当此公司该种产品的年宣传

费为20万元时,预测该种产品的年销售量为3480()件,故D正确.故选

C.

二、多项选择题

3.(2022.江苏扬州高三期末)下列说法中正确的有(ABD)

A.将一组数据中的每个数据都乘以2后,平均数也变为原来的2倍

B.若一组数据的方差越小,则该组数据越稳定

C.由样本数据点(X1,yI),(X2,y2),…,(Xn,yn)所得到的经验回归直线

AAA

y=bx+a至少经过其中的一个点

D.在某项测量中若测量结果1~用1,/)9〉0),则P(日)=0.5

解析:对于A,设数据x1,X2,...,Xn的平均数为元则出jq?

则数据2x1,2x2,...,2xn的平均数为2"2七+...+2%=2(必+小+...+赤)=2匕A

nn

正确;

对于B,由方差的定义可知,方差越小,样本越稳定,B正确;

AAA

对于C,经验回归直线尸bx+Q一定过样本的中心点叵,歹)不一定过样

本点,C错误;

对于D,在某项测量中,若测量结果自〜N(1,o2)9>o),则P(KI)=0.5,D正

确.故选ABD.

4.(2022.湖南常德高三期末)甲、乙、丙、丁四人各掷骰子5次(骰子每

次出现的点数可能为123,4,5,6),并分别记录每次出现的点数四人根

据统计结果对各自的试验数据分别做了如下描述,可以判断一定没有

出现点数6的描述是(AD)

A.中位数为3,众数为5

B.中位数为3,极差为3

C.中位数为1,平均数为2

D.平均数为3,方差为2

解析:对于A,由于中位数为3,众数为5,所以这5个数从小到大排列后,

第3个数是3,则第4和5个数为5,所以这5个数中一定没有出现6,

所以A正确;

对于B,由于中位数为3,极差为3,所以这5个数可以是3,3,3,4,6,所以B

错误;

对于C,由于中位数为1,平均数为2,所以这5个数可以是1,1,1,1,6,所

以C错误;

对于D,由平均数为3,方差为2,可得

X|+X2+X3+X4+X5=15W(Xl-3)2+(X2-3)2+(X3-3)2+(X4-3)2+(X5-3)2]=2,若有一

个数为6,取X]=6,则X2+X3+X4+X5=9,(X2・3)2+(X3・3>+(X4・3)2+(X5・3)2=1,所

以依2・3)23,,3-3)20,(乂4・3)2口,依5・3)231,所以X2,X3,X*X5这4个数可以

是4,3,3,3或2,3,3,3,与X2+x3+x4+x5=9矛盾.所以x1,6,所以这5个数一

定没有出现6,所以D正确.故选AD.

5.(2022.湖北江岸高三期末)某电子商务平台每年都会举行“年货节”商

业促销狂欢活动,现在统计了该平台从2013年到2021年共9年“年货

节”期间的销售额(单位亿元)并作出散点图,将销售额Y看成年份序号

x(2013年作为第一年)的函数.运用图表软件,分别选择回归直线和三

次函数回归曲线进行拟合,效果如图,则下列说法正确的是(ACD)

A.销售额Y与年份序号x正相关

B.三次函数回归模型的残差平方和大于直线回归模型的残差平方和

C.三次函数回归曲线的拟合效果好于回归直线的拟合效果

Dj艮据三次函数回归曲线可以预测2022年“年货节,,期间的销售额约

为2680.54亿元

解析:根据图象可知,散点从左下到右上分布,销售额Y与年份序号x呈

正相关关系,A正确;

由散点图以及直线回归模型和三次函数回归模型的位置关系可知,三

次函数回归模型的残差平方和小于直线回归模型的残差平方和,B错

误;

根据三次函数回归曲线的决定系数0.99A0.936,决定系数越大拟合

效果越好,所以三次函数回归曲线的拟合效果好于回归直线的拟合效

果,C正确;

AA

由三次函数尸0.07x3+29.31XZ33.09X+10.44,当x=10时,尸2680.54亿

元,D正确.故选ACD.

6.(2022.湖北襄阳高三期末)下列说法正确的是(AC)

A.当总体是由差异明显的几个部分组成时,通常采用分层抽样的方法

抽样

B.频率分布直方图中每个小矩形的高就是该组的频率

C.若两个满足线性回归的变量负相关,则其回归直线的斜率为负

D.已知随机变量X服从正态分布N(2,W),P(X<3)=0.9,则P(2<X<3)=0.3

解析:对于A,根据分层抽样的定义可知,当总体是由差异明显的几个部

分组成时,通常采用分层抽样的方法抽样,A正确;

对于B,频率分布直方图中每个小矩形的高是“频率/组距",即每个小矩

形所代表的对象的频率/组距每个小矩形的面积才是该组的频率,B错

误;

对于C,根据回归方程性质,若两个满足线性回归的变量负相关,则其回

归直线的斜率为负C正确;

对于D,因为P(xv2)=0.5,P(Xv3)=0.9,所以P(2vXv3)=0.9・0.5=0.4,D错误.

故选AC.

三、填空题

7.(2022•山东青岛高三期末)由样本数据(x।,y1),(x2,y2),…,(X7,y7)得到的

A人777

经验回归方程为y=|«+a,已知如下数据:£Xi=19,£yi=35,£沃=:,

7i=li=li=l3

则实数;的值为.

解析:令t=«,则经验回归方程过样本中心点C歹),

AA

因为EW,歹=35+7=5,所以有短+a=5,即a=4.

答案:4

8.根据某市有关统计公报显示,该市对外贸易近几年持续繁荣,2017年

至2020年每年进口总额x(单位:千亿元)和出口总额Y(单位:千亿元)

之间的一组数据如表:

2017年2018年2019年2020年

X1.82.22.63.0

Y2.02.83.24.0

A

A

若每年的进出口总额x,Y满足线性相关关系y=bx-0.84,则

b=;若计划2022年出口总额达到5千亿元,预计该年进口总

额为千亿元.

解析:由题意可得还1.8+2.2+2.6+3.0=2.4,y=-2.0+2.8+3.2+4.0=3

44

AA

因为样本中心满足经验回归方程,可得3=24b-0.84,解得b=1.6,所以

y=1.6x-0.84,

2022年出口总额达到5千亿元,预计该年进口总额为x,则5=1.6x984,

解得x=3.65.

答案:1.63.65

四、解答题

9.(2022.江苏通州高三期末)当今时代,国家之间的综合国力的竞争在

很大程度上表现为科学技术水平与创新能力的竞争.特别是进入人工

智能时代后,谁掌握了核心科学技术,谁就能对竞争对手进行降维打击.

我国自主研发的某种产品,其厚度越小,则该种产品越优良为此,某科

学研发团队经过较长时间的实验研发,不断地对该产品的生产技术进

行改造提升,最终使该产品的优良厚度达到领先水平并获得了生产技

术专利.

⑴在研发过程中,对研发时间x(月)和产品的厚度Y(nm)进行统计,其

中1—7月的数据资料如表:

x(月)1234567

Y(nm)99994532302421

现用y=a+4乍为Y关于X的经验回归方程类型,请利用表中数据,求出

X

该经验回归方程,并估计该产品的“理想”优良厚度约为多少?

⑵某企业现有3条老旧的该产品的生产线,迫于竞争压力,决定关闭并

出售生产线.现有以下两种售卖方案可供选择:

①直接售卖,则每条生产线可卖5万元;

②先花20万元购买技术专利并对老旧生产线进行改造,使其达到生产

领先水平后再售卖.已知在改造过程中,每条生产线改造成功的概率均

为*若改造成功,则每条生产线可卖20万元;若改造失败,则卖价为0万

元.请判断该企业应选择哪种售卖方案更为科学.并说明理由.

77

参考数据:设z=i,Zi=-,z-0.37,y=5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论