2023年导与练总复习数学(二轮)(新教材)第3讲 统计、成对数据的统计分析_第1页
2023年导与练总复习数学(二轮)(新教材)第3讲 统计、成对数据的统计分析_第2页
2023年导与练总复习数学(二轮)(新教材)第3讲 统计、成对数据的统计分析_第3页
2023年导与练总复习数学(二轮)(新教材)第3讲 统计、成对数据的统计分析_第4页
2023年导与练总复习数学(二轮)(新教材)第3讲 统计、成对数据的统计分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲统计、成对数据的统计分析

感悟曲考*明确备考方向__)

⑥真题体验

L[样本的数字特征](2022•全国甲卷,T2)某社区通过公益讲座以

普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区

居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10

位社区居民在讲座前和讲座后问卷答题的正确率如图,则(B)

*讲座前•讲座后

12345678910

居民编号

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

解析:对于A,讲座前问卷答题的正确率的中位数是二等工72.5览所

以A错误;对于B,讲座后问卷答题的正确率分别是

80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于

85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动

较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正

确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;

对于D,讲座前问卷答题的正确率的极差是95%-609k35%,讲座后问卷

答题的正确率的极差是100%-80炉20览所以讲座前问卷答题的正确率

的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.

2.[频率分布直方医](2021•全国甲卷,T2)为了解某地农村经济情

况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查

数据整理得到如下频率分布直方图:

,频率

根据此频率分布直方图,下面结论中不正确的是(C)

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C.估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万

元之间

解析:对于A,该地农户家庭年收入低于4.5万元的农户比率估计为

(0.02+0.04)X1=0.06=6%,故选项A正确;

对于B,该地农户家庭年收入不低于10.5万元的农户比率估计为

(0.04+0.02X3)X1=0.1=10%,故选项B正确;

对于C,估计该地农户家庭年收入的平均值为

3X0.02+4X0.04+5X0.10+6X0.14+7X0.20+8X0.20+9X0.10+10

XO.1O+11XO.04+12X0.02+13X0.02+14X0.02=7.68>6.5万元,故

选项C错误;

对于D,该地农户家庭年收入介于4.5万元至8.5万元之间的比率为

(0.10+0.14+0.20+0.20)X1=0.64>0.5,故估计该地有一半以上的农

户,其家庭年收入介于4.5万元至8.5万元之间,故选项D正确.故选

C.

3.[回归分析](2022•全国乙卷,T19)某地经过多年的环境治理,已

将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机

选取了10棵这种树木,测量每棵树的根部横截面积(单位:a?)和材积

量(单位:m)得到如下数据:

样本号i根部横截面积Xi材积量Yi

10.040.25

20.060.40

30.040.22

40.080.54

50.080.51

60.050.34

70.050.36

80.070.46

90.070.42

100.060.40

总和0.63.9

101010

并计算得£婷=0.038,Ly?=l.6158,ExiyE.2474.

i=li=li=l

⑴估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积

量;

⑵求该林区这种树木的根部横截面积与材积量的样本相关系数(精

确到0.01);

⑶现测量了该林区所有这种树木的根部横截面积,并得到所有这种

树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截

面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估

计值.

附:相关系数厂二;丝=,^17896^1.377.

「的工却万产

解:(1)估计该林区这种树木平均一棵的根部横截面积

10

石馨二等。・。6,

10

估计该林区这种树木平均一棵的材积量歹二誉祟0.39.

1010

(2)£(x-x)(yj-y)=LXiYi-lOxy=0.0134,

i=li=l

1010

£(Xi-x)2=£x?-10x=0.002,

i=lt=i1

ioio

g(y「9¥-gy『T09-0.0948,

Iio?ioy(_______________

所以£(xrx)E(yry)=<0,002x0.0948=V0.000lxl.896

Ni=li=l

^0.01X1.377=0.01377,

10

所以样本相关系数之⑴一切力已器篝器0.97.

抬叱才昌⑶中2

(3)设该林区这种树木总材积量的估计值为Ym3,由题意可知,该种树

木的材积量与其根部横截面积近似成正比,所以盹二三,

0.6186

所以丫二竿F二]209,即该林区这种树木的总材枳量的估计值为1

209ml

4.[独立性检验](2022•全国甲卷,T17)甲、乙两城之间的长途客车

均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,

随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次数

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的

概率;

⑵能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客

车所属公司有关?

2

p/iiz2n(ad-bc)

(a+b)(c+d)(a+c)(b+d)'

P(K2>k)0.1000.0500.010

k2.7063.8416.635

解:(1)由题意可得A公司甲、乙两城之间的长途客车准点的概率为

24012

240+2013’

B公司甲、乙两城之间的长途客车准点的概率为三

210+30o

(2)〃二~------50°的"3。2°X21°):------勺3.205>2.706,

(240+20)X(210+30)X(240+210)X(20+30)

所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所

属公司有关.

6者情定位

统计知识主要考查:抽样方法、样本数字特征、统计图表等.以选

择题、填空题形式命题,难度较小;回归分析与独立性检验常与概率交

汇命题,也是近年的热点,常出现在第19或20题的位置,以中档题为

主.此类题目重在考查考生的数学抽象、逻辑推理、数学建模、数学

运算、数据分析等核心素养.

突破热^提升关键能力「

热点一回归分析在实际问题中的应用

♦核心必备♦

1.方程y=bx+a是两个具有线性相关关系的变量的一组数据

AA

(xby.),(x2,yj,…,(Xn,y)的经验回归方程,其中a,b是待定参数,经

人£(xrx)(yry)”

验回归方程的斜率和截距分别为----—,Q二歹一匕匕(元刃是

*2

Z(xx)

1=1r

样本中心点,经验回归直线过样本中心点.

2.(1)正相关与负相关就看经验回归直线的斜率,斜率为正则为正相

关,斜率为负则为负相关.

⑵样本相关系数r具有以下性质:r>0表示两个变量正相关,r<0表示

两个变量负相关;IrIW1,且|r|越接近于1,线性相关程度越强,Ir|越

接近于0,线性相关程度越弱.

典例1(2022•四川绵阳三模)随着科技进步,近来年,我国新能源汽

车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年

我国新能源乘用车的年销售量数据:

年份201620172018201920202021

年份代

123456

码X

新能源

乘用车

5078126121137352

年销售

Y(万辆)

⑴根据表中数据,求出Y关于x的经验回归方程;(结果保留整数)

⑵若用尸小建模型拟合Y与x的关系,可得回归方程为y=37.71e(,-33x,

经计算该模型和第(1)问中模型的R2(N为决定系数)分别为0.87和

0.71,请分别利用这两个模型,求2022年我国新能源乘用车的年销售

量的预测值;

⑶你认为(2)中用哪个模型得到的预测值更可靠?请说明理由.

参考数据:设u=lny,其中u二In

66

£(Xi-X)•£(Xi-x)•

i=li=l3.635.916.27

yUeee

(yi-y)(Ui-U)

1444.788415.7037.71380528

参考公式:对于一组具有线性相关关系的数据(Xi,yj(i=l,2,3,…,n),

其经验回归方程y=bx+a的斜率和截距的最小二乘估计公式分别为

人人

b二三\-------,a=y-bx.

2

.E(xrx)

解:⑴由表中数据得,数』+2+3:4+5+6=3.5,尸144,

6

66

£(Xi-x)(yi-y)=841,£(Xi-x)2=(xi-x)2+(x-x)2+(x-x)2+(x-x)(x

i=li=l2345

22

-%)+(x6-x)

=(1-3.5)2+(2-3.5尸+(3-3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2=17.5,

A6

二匚三(勺一三)(%一羽)841

所以------^48,

£(工厂元)2175

i=i

a=y-bx=144-48X3.5二-24,所以Y关于x的经验回归方程为

y=48x-24.

⑵由⑴知,Y关于x的经验回归方程为y=48x24,

当x=7时,2022年我国新能源乘用车的年销售量的预测值

y=48X7-24=312(万辆);

A

对于回归方程y=37.71e°*,当x=7时,2022年我国新能源乘用车的年

A

销售量的预测值丫=37.7遂°皿7=/63乂020飞59二380(万辆).

(3)依题意,y=37.71e°,疥模型和第(1)问中模型的NG为决定系数)

分别为0.87和0.71,

由于决定系数越接近于1,两个变量之间的关系就越强,相应的拟合程

度也越好,

所以y=37.71e°•物模型得到的预测值更可靠.

♦总结提升♦

⑴对于非线性归分析问题,应先进行变量代换,求出代换后的经验

回归直线方程,再求经验回归曲线方程.

⑵成对样本数据之间线性相关的程度,可以利用样本相关系数判

断,"I越趋近于1,两变量的线性相关程度越强.

热点训练1某公司为确定下一年度投入某种产品的宣传费,需了解

年宣传费x(单位:千元)对年销售量Y(单位:t)和年利润z(单位:千元)

的影响,对近8年的年宣传费Xi和年销售量2,…,8)数据作了

初步处理,得到散点图及一些统计量的值.

年销售量八

620

600

580

560

540

520

500

480

343638404244464850525456

年宣传费/干元

8

8£(o-

X(Xi-X)•(y]i=l

88

2£(3广所丁i=la>)•(y-

Xyco£(x-x)

i=li=ly)

y)

46.65636.8289.81.61469108.8

表中3i5.

(1)根据散点图判断,y=a+bx与y=c+d曰哪一个适宜作为年销售量Y

关于年宣传费x的经验回归方程类型?(给出判断即可,不必说明理

由)

(2)根据⑴的判断结果及表中数据,建立Y关于x的经验回归方程;

(3)已知这种产品的年利润z与x,Y的关系为z=0.2Y-x,根据(2)的结

果回答下列问题:

①年宣传费x:49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据Q,“),(th,V,…,(/v)其经验回归方程

八AA

u=a+£u的斜率和截距的最小二乘估计分别

.£(uf-u)(vrv)八

为邛二)----,a=v-pu.

1=1

解:⑴由散点图知,各点呈非线性递增趋势,所以y=c+dy作为经验

回归方程比较合适.

-8

zox.r-m(1,g(3厂加(y厂歹)108.8公。

(2)由a贝ijd=-----'一一一68,

.£(何国产16

1=1

人人

由万二6.8,歹二563,得c二9-daJ=563-68X6.8=100.6,所以

y=100.6168V%.

(3)①当x=49时,年销售量y=100.6+68)屈=576.6(t).此时年利润

z二。2X576.6-49=66.32(千元).

②由题

意,z=0.2X(100.6+68V%)-x=20.12+13.6G(«)'-(«-6.8)2+66.

36,

所以当«二6.8,即x=46.24时,年利润的预报值最大.

热点二独立性检验

♦核心必备♦

2

2_n(ad-bc)

“卡方公式”n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)'

典例2(2021•山东济南期末)为了研究某种疾病的治愈率,某医院

从过往病例中随机抽取了100名患者,其中一部分患者采用了外科疗

法,另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况

绘制了等高堆积条形图,如图.

⑴根据图表完善以下关于治疗方法和治愈情况的2X2列联表:

疗效

疗法合计

未治愈治愈

外科疗法

化学疗法18

合计100

⑵依据小概率值。=0.05的独立性检验,分析此种疾病治愈率是否与

治疗方法有关.

2

附:(如需计算x2,结果精确到0.001),

X2独立性检验中常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

治愈率等高堆积条形图

100%---------

90%

80%

1~I冶俞

70%1_1m感

60%

去治布

JU%1_-_1不值型

4no/

anoz

xuzo

1v/b

nqz

外彳理疗法4二学疗法

解:(1)由题意及等高堆积条形图可得,2义2列联表如表.

疗效

疗法合计

未治愈治愈

外科疗法202040

化学疗法421860

合计6238100

(2)零假设为H。:是否治愈与治疗方法无关联.

由列联表中的数据可得,X2,100X(20X182OX42)2^^Q75>3.841,

根据小概率值a=0.05的独立性检验,我们能推断H。不成立,即认为是

否治愈与治疗方法有关联,此推断犯错误的概率不大于0.05.

♦总结提升♦

独立性检验的具体做法

⑴根据实际问题的需要确定容许推断“两个随机事件有关系”犯错

误概率的小概率值a,然后查表确定临界值.

⑵利用公式,计算xI

⑶如果x2>Xa,就推断“X与Y有关系”,这种推断犯错误的概率不超

过a;否则,就认为在犯错误的概率不超过。的前提下不能推断“X与

Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有

关系”.

热点训练2为进一步做好新冠肺炎疫情防控工作,某社区以网上调

查问卷的形式对辖区内部分居民做了新冠疫苗免费接种的宣传和调

查.调查数据如下:共95份有效问卷,40名男性中有10名不愿意接种

疫苗,55名女性中有5名不愿意接种疫苗.

(1)根据所给数据,完成下面的2X2列联表,并根据列联表,根据小概

率值a=0.050的x2独立性检验,判断是否有95%的把握认为是否愿意

接种疫苗与性别有关?

态度

性另u合计

愿意接种不愿意接种

合计

⑵从不愿意接种的15份调查问卷中得到拒绝接种新冠疫苗的原因:

有3份身体原因不能接种;有2份认为新冠肺炎已得到控制,无需接种;

有4份担心疫苗的有效性;有6份担心疫苗的安全性.求从这15份问

卷中随机选出2份,在已知至少有一份担心疫苗安全性的条件下,另

一份是担心疫苗有效性的概率.

2

n(ad-bc)

•x二______________________________

(a+匕)(c+d)(a+c)(b+d)’

a0.0500.0100.005

Xa3.8416.6357.879

解:⑴补全2义2列联表如表.

态度

性另合计

愿意接种不愿意接种

男301040

女50555

合计801595

22

X-_95X(30X5-50X10)%408>3.841二X。.。眇

(a+b)(c+d)(Q+C)(b+d)40x55x80x15

根据小概率值a=0.050的x2独立性检验,有95%的把握认为是否愿意

接种疫苗与性别有关.

⑵设事件A为“至少有一份担心疫苗安全性”,事件B为“另一份担

心疫苗有效性”,

8

则P(A)=1-品则P(AB)竽白所以P(B|A)号.奇V

热点三概率与统计的综合问题

典例3(2022•山东济南高三期末)某机构为了解市民对交通的满意

度,随机抽取了100位市民进行调查,结果如下:回答“满意”的人数

占总人数的一半,在回答“满意”的人中,“上班族”的人数是“非上

班族”人数的,;在回答“不满意”的人中,“非上班族”占也

(1)请根据以上数据填写下面2X2列联表,并依据小概率值a=0.001

的独立性检验,分析能否认为市民对于交通的满意度与是否为上班族

存在关联?

满意不满意合计

上班族

非上班族

合计

(2)此机构欲随机抽取部分市民进一步调查.规定:抽样的次数不超过

n(n£N*),若随机抽取的市民属于不满意群体,则抽样结束;若随机抽

取的市民属于满意群体,则继续抽样,直到抽到不满意市民或抽样次

数达到n时,抽样结束.

①若吁5,写出Xs的分布列和数学期望;

②请写出尤的数学期望的表达式(不需证明),根据你的理解说明Xn的

数学期望的实际意义.

附:

2

X2_n(ad-bc)S+“其中『a+b+c+d.

(a+b)(c+d)(Q+C)

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

解:(1)由题意可知,2X2列联表如表,

满意不满意合计

上班族154055

非上班族351045

合计5050100

零假设为H。:市民对交通的满意度与是否上班独立.因为X

2

一「00X(15X1035X40)=咨£入?5.253>10,828.

50X50X55X4599

根据小概率值&=0.001的独立性检验,我们推断H。不成立,即认为市

民对交通的满意度与是否上班有关,此推断犯错误的概率不大于

0.001.

⑵①当"5时,X5的可能取值为1,2,3,4,5,由(1)可知市民的满意度

和不满意度均为最

所以p区刁)qpa二2)*p(x$=3)q,p供=4)q,p区二5)q,

乙乙乙乙乙

所以X,5的分布列为

x512345

11111

P

22223

所以E(X5)=lX1+2X.+3X导4X,+5X*.

②E(XJ=1X*2X/3X导・・・+(n-1)+n•奈2-看,

当n趋向于正无穷大时,E(X。趋向于2,此时E(X,恰好为不满意度

的倒数,

也可以理解为平均每抽取2个人,就会有一个不满意的市民.

♦总结提升♦------------------------

解决概率与统计综合问题的一般步骤

热点训练3(2021•重庆渝中区期末)某中学成功地举办了一年一

度的大型学生社团文化节,吸引了众多学生.该中学目前共有社团近

40个,由高一和高二学生组成,参加社团的学生有四百人左右.已知该

中学高一和高二的所有学生中男生与女生人数比为6:4,为了解学生

参加社团活动的情况,按性别采用分层抽样的方法抽取部分学生,统

计得到如图等高堆积条形图.

(1)求该中学参加社团的学生中,任选1人是男生的概率;

(2)若抽取了100名学生,完成下列2X2列联表,并依据小概率值。

=0.05的独立性检验,能否认为该中学高一和高二学生的性别与参加

学生社团有关联?请说明理由.

参加社团未参加社团合计

男生

女生

合计

附:八…窗喘"a+b+c+d.

(10.10.050.01

Xa2.7063.8416.635

解:(1)设高一和高二的所有学生中任选一人是男生、是女生分别为事

件A,4

设高一和高二的所有学生中任选一人参加社团为事件B,则

P(A)=60%,P(彳)=40%,

则P(A|B)二端产PC4)P(8|A)_60%X10%_6_3

P(4)P(8|4)+P(Z)P(BR)60%X10%+40%X20%6+87,

⑵2X2列联表如表,

参加社团未参加社团合计

男生65460

女生83240

合计1486100

零假设为H。:性别与参加社团独立,即性别与参加社团无关.

根据列联表中的数据,经计算得到X*。;:公震

1.993<3.841=ao.o5,

依据小概率值Q=0.05的独立性检验,没有充分的证据推断H。不成立,

因此可以认为H。成立,即性别与参加社团无关.

专题强化训练(十七)

一、单项选择题

1.(2022•山东莱西高三期末)通过随机询问某中学110名中学生是

否爱好跳绳,得到列联表:

性别

跳绳合计

男女

爱好402060

不爱好203050

合计6050110

已知XF黑襦丽,P(x—828)6001,根据小概率值

0=0.001的x2独立性检验,以下结论正确的为(D)

A.爱好跳绳与性别有关

B.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001

C.爱好跳绳与性别无关

D.爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001

2

)2

解析:x2=-n(ad-bc')110X(40X30-20X20-F.822<10.828,

(a+b)(c+d)(a+c)(b+d)60x50x60x50

则爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001.故选

D.

2.某公司为了确定下一年投入某种产品的宣传费,需了解年宣传费

x(单位:万元)对年销售量Y(单位:千件)的影响.现收集了近5年的年

宣传费x(单位:万元)和年销售量Y(单位:千件)的数据,其数据如表

所示,且Y关于x的经验回归方程为厂bx-8.2,则下列结论错误的是

(C)

X4681012

Y1571418

A.x,Y之间呈正相关关系

B.b=2.15

C.该经验回归直线一定经过点(8,7)

D.当此公司该种产品的年宣传费为20万元时,预测该种产品的年销

售量为34800件

解析:由表中数据可

得,土[X(4+6+8+10+12)=8,y=1x(1+5+7+14+18)=9,

故经验同归直线一定经过点⑻9),故9=86-8.2,解得15,故A,B

正确,C错误;

人人

将x=20代入y=2.15x-8.2,解得y=34.8,故当此公司该种产品的年宣

传费为20万元时,预测该种产品的年销售量为34800件,故D正确.

故选C.

二、多项选择题

3.(2022•江苏扬州高三期末)下列说法中正确的有(ABD)

A.将一组数据中的每个数据都乘以2后,平均数也变为原来的2倍

B.若一组数据的方差越小,则该组数据越稳定

c.由样本数据点(x「yj,(X2,%),…,(X”yj所得到的经验回归直线

八A

y=bx+Q至少经过其中的一个点

D.在某项测量中,若测量结果&〜N(l,。2)(。〉0),则P(10)=0.5

解析:对于A,设数据xi,xz,…,X。的平均数为元则土二/+外+…+”

n

则数据2x„2X2,…,2Xn的平均数为2巧+2必+…+2孙=26+与+…+孙;2匕A

nn

正确;

对于B,由方差的定义可知,方差越小,样本越稳定,B正确;

A

AA

对于C,经验回归直线y=bx+a一定过样本的中心点(%,歹),不一定过

样本点,C错误;

对于D,在某项测量中,若测量结果5〜N(l,。9(o〉0),则P(&<

1)=0.5,D正确.故选ABD.

4.(2022•湖南常德高三期末)甲、乙、丙、丁四人各掷骰子5次(骰

子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,

四人根据统计结果对各自的试验数据分别做了如下描述,可以判断一

定没有出现点数6的描述是(AD)

A.中位数为3,众数为5

B.中位数为3,极差为3

C.中位数为1,平均数为2

D.平均数为3,方差为2

解析:对于A,由于中位数为3,众数为5,所以这5个数从小到大排列

后,第3个数是3,则第4和5个数为5,所以这5个数中一定没有出现

6,所以A正确;

对于B,由于中位数为3,极差为3,所以这5个数可以是3,3,3,4,6,

所以B错误;

对于C,由于中位数为1,平均数为2,所以这5个数可以是1,1,1,1,6,

所以C错误;

对于D,由平均数为3,方差为2,可得

22222

xi+x2+x3+x,i+x5=15,(X-3)+(X2-3)+(X3-3)+(X-3)+(X5-3)]=2,若有

一个数为6,取Xi=6,则

2222

X2+X3+X4+X5=9,(X2-3)+(x3-3)+(X4-3)+(X5-3)=1,所以&-3)W

1,(X3-3)Wl,(X「3)2W1,(X5-3)?W1,所以X2,x3,x.bX5这4个数可以是

4,3,3,3或2,3,3,3,与x2+x3+x4+x5=9矛盾,所以xH6,所以这5个数

一定没有出现6,所以D正确.故选AD.

5.(2022•湖北江岸高三期末)某电子商务平台每年都会举行“年货节”

商业促销狂欢活动,现在统计了该平台从2013年到2021年共9年“年

货节”期间的销售额(单位:亿元)并作出散点图,将销售额Y看成年份

序号x(2013年作为第一年)的函数.运用图表软件,分别选择回归直

线和三次函数回归曲线进行拟合,效果如图,则下列说法正确的是

(ACD)

A.销售额Y与年份序号x正相关

B.三次函数回归模型的残差平方和大于直线回归模型的残差平方和

C.三次函数回归曲线的拟合效果好于回归直线的拟合效果

D.根据三次函数回归曲线可以预测2022年“年货节”期间的销售额

约为2680.54亿元

解析:根据图象可知,散点从左下到右上分布,销售额Y与年份序号x

呈正相关关系,A正确;

由散点图以及直线回归模型和三次函数回归模型的位置关系可知,三

次函数回归模型的残差平方和小于直线回归模型的残差平方和,B错

、口

识;

根据三次函数回归曲线的决定系数0.999>0.936,决定系数越大,拟合

效果越好,所以三次函数回归曲线的拟合效果好于回归直线的拟合效

果,C正确;

由三次函数y=0.07X3+29.31X2-33.09X+10.44,当x二三时,尸2

680.54亿元,D正确.故选ACD.

6.(2022•湖北襄阳高三期末)下列说法正确的是(AC)

A.当总体是由差异明显的几个部分组成时,通常采用分层抽样的方法

抽样

B.频率分布直方图中每个小矩形的高就是咳组的频率

C.若两个满足线性回归的变量负相关,则其回归直线的斜率为负

D.已知随机变量X服从正态分布N(2,。9,P(X<3)=0.9,则

P(2<X<3)=0.3

解析:对十A,根据分层抽样的定义可知,当总体是由差异明显的几个

部分组成时,通常采用分层抽样的方法抽样,A正确;

对于B,频率分布直方图中每个小矩形的高是“频率/组距”,即每个

小矩形所代表的对象的频率/组距,每个小矩形的面积才是该组的频

率,B错误;

对于C,根据回归方程性质,若两个满足线性回归的变量负相关,则其

回归直线的斜率为负,C正确;

对于D,因为P(x<2)=0.5,P(X<3)=0.9,所以P(2<X<3)=0.9-0.5=0.4,D

错误.故选AC.

三、填空题

7.(2022•山东青岛高三期末)由样本数据(x】,yj,(X2,y2),(x7,y7)

得到的经验回归方程为y弓五+a,已知如下数

777八

据:3产19,者产二35,次界卷,则实数a的值为.

人A

解析:令t=Vx,则经验回归方程y[t+Q过样本中心点(K歹),

因为+73,歹=35+7=5,所以有5X即Q=4.

答案:4

8.根据某市有关统计公报显示,该市对外贸易近几年持续繁荣,2017

年至2020年每年进口总额x(单位:千亿元)和出口总额Y(单位:千亿

元)之间的一组数据如表:

2017年2018年2019年2020年

X1.82.22.63.0

Y2.02.83.24.0

若每年的进出口总额x,Y满足线性相关关系y=bx-0.84,则

b=;若计划2022年出口总额达到5千亿元,预计该年进口总

额为千亿元.

hjj4-r"r4f日》+.—曰—1,8+2.2+2.6+3.0cA-2.0+2.8+3.2+4.0

解析:由题悬可得%二------------二2.4,y二-------------二3n.

44

因为样本中心满足经验回归方程,可得3=2.4b-0.84,解得b=1.6,所

以y=l.6x-0.84,

2022年出口总额达到5千亿元,预计该年进口总额为x,则

5=1.6x-0.84,解得x=3.65.

答案:L63.65

四、解答题

9.(2022•江苏通州高三期末)当今时代,国家之间的综合国力的竞争,

在很大程度上表现为科学技术水平与创新能力的竞争.特别是进入人

工智能时代后,谁掌握了核心科学技术,谁就能对竞争对手进行降维

打击.我国自主研发的某种产品,其厚度越小,则该种产品越优良,为

此,某科学研发团队经过较长时间的实验研发,不断地对该产品的生

产技术进行改造提升,最终使该产品的优良厚度达到领先水平并获得

了生产技术专利.

⑴在研发过程中,对研发时间x(月)和产品的厚度Y(nm)进行统计,

其中1—7月的数据资料如表:

x(月)1234567

Y(nm)99994532302421

现用y二a+夕乍为Y关于x的经验回归方程类型,请利用表中数据,求出

该经验回归方程,并估计该产品的“理想”优良厚度约为多少?

(2)某企业现有3条老旧的该产品的生产线,迫于竞争压力,决定关闭

并出售生产线.现有以下两种售卖方案可供选择:

①直接售卖,则每条生产线可卖5万元;

②先花20万元购买技术专利并对老旧生产线进行改造,使其达到生

产领先水平后再售卖.已知在改造过程中,每条生产线改造成功的概

率均为/若改造成功,则每条生产线可卖20万元;若改造失败,则卖价

为0万元.请判断该企业应选择哪种售卖方案更为科学.并说明理由.

77

参考数据:设z尸工,5七0.37,歹=50,iZiyi=184.5,Ezf-Tz2^

xxt'i=li=l

0.55.

参考公式:对于一组数据(UI,vj

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论