2024年上海市数学高考名校模拟题分类汇编-成对数据的统计分析含详解_第1页
2024年上海市数学高考名校模拟题分类汇编-成对数据的统计分析含详解_第2页
2024年上海市数学高考名校模拟题分类汇编-成对数据的统计分析含详解_第3页
2024年上海市数学高考名校模拟题分类汇编-成对数据的统计分析含详解_第4页
2024年上海市数学高考名校模拟题分类汇编-成对数据的统计分析含详解_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

备战2024高考优秀模拟题分类汇编(上海专版)一一成对数据的统计分析

一、填空题

1.(2223下•徐汇・模拟预测)假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是

y=0.85+25.82,已知父亲身高为175cm,则估计女儿的身高为cm.(结果精确到整数)

2.(2223下•青浦•阶段练习)根据变量X与y的对应关系(如表),求得y关于X的线性回归方程为y=6.5x+17.5,

则表中m的值为.

X24568

y3040m5070

3.(2223•浦东新•模拟预测)某产品的广告费投入与销售额的统计数据如下表所示:

广告费万元%/万元4235

销售额万元y/万元49263954

根据上表建立线性回归方程,预测当广告费投入6万元时,销售额约为万元.

4.(22・23上・黄浦・开学考试)已知由样本数据(4*)(,=1,2,3,.,10)组成的一个样本,得到回归直线方程为5=2-0.4,

且元=2,其中发现两个歧义点(-2,1)和(2,-1)偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回

归直线方程为.

5.(2223上•徐汇・期中)下列命题中错误的是

①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;

②在一组样本数据(人,乂),(%,%),,(%,%)。*2,占,々,1,必不全相等)的散点图中,若所有样本点

(七,%)(,=1,2,,")都在直线y=尤+1上,则这组样本数据的线性相关系数为-g;

③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患

肺病有关系.若某人吸烟,则他有99%的可能性患肺病.

6.(22・23下•杨浦•开学考试)某设备的使用年数x与所支出的维修总费用y的统计数据如下表:

使用年数X(单位:年)23456

维修总费用y(单位:万元)1.54.55.56.57.5

根据上表可得经验回归方程为V=L4x+a.则x=10处的预测值为万元.

7.(2223下•闵行•阶段练习)己知MV的对应值如下表所示:

X02468

y1m+l2m+l3m+311

若y与X线性相关,且回归直线方程为y=1.3元+0.6,则旭=.

8.(22.23下•浦东新•阶段练习)已知一组成对数据如下表所示.若该组数据的回归方程为>=-2x+61,贝1]。=

X181310-1

y243438a

9.(22-23・浦东新•三模)已知一组成对数据",24),(13,34),(10,38),的回归方程为y=-2x+59.5,则该组数据

的相关系数r=(精确到0.001).

10.(2223•虹口•模拟预测)供电公司为了分析某小区的用电量y(单位:kw-h)与气温无(单位:℃)之间的关系,随

机统计了4天的用电量与当天的气温,这两者之间的对应关系见下表:

气温X181310-1

用电y2434m64

利用最小二乘法得到的回归方程为y=-2x+60,则机=.

11.(2324上.长宁•期中)已知两个线性相关变量MV的统计数据如表所示,则其回归方程是.

Xi2345

y30-2-4-5

12.(2223下•徐汇•模拟预测)下列说法中正确的有(填正确说法的序号).

①若样本数据毛,巧,…,占。的方差为4,则数据2占+1,2%+1,…,2/+1的标准差为4;

②已知随机变量XN(1Q2),且尸(X>3)=0.2,则尸(1<XW3)=O.3;

③若线性相关系数上|越接近1,则两个变量的线性相关性越弱;

④若事件A,B满足尸(A)>0,P⑻>0,P(BIA)=P(B),则有「(A|3)=P(A).

二、单选题

13.(23・24上・黄浦.开学考试)观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点

图按顺序相对应的是().

14.(2223上•嘉定•阶段练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的

人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人

对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立()

A.甲B.乙C.丙D.丁

15.(2223•杨浦・二模)对成对数据(士,兀)、(4,%)........(%,%)用最小二乘法求回归方程是为了使()

A.B.E(X--X)=°

Z=1

16.(2223•浦东新•二模)某种产品的广告支出X与销售额y(单位:万元)之间有下表关系,y与X的线性回归方

程为y=10.5x+5.4,当广告支出6万元时,随机误差的效应即离差(真实值减去预报值)为().

X24568

y3040607080

A.1.6B.8.4C.11.6D.7.4

17.(2223下•徐汇•模拟预测)某地为响应“扶贫必扶智,扶智就扶知识、扶技术、扶方法”的号召,建立了农业科

技图书馆,供农民免费借阅.现收集了该图书馆五年的借阅数据如下表:

年份20162017201820192020

年份代码X12345

年借阅量y(万册)4.95.15.55.75.8

根据上表,可得y关于x的线性回归方程为y=0.24x+3,则下列说法中错误的是().

A.6=4.68

B.借阅量4.9,5.1,5.5,5.7,5.8的第75百分位数为5.7

C.y与x的线性相关系数厂>。

D.2021年的借阅量一定少于6.12万册

18.(2223下•崇明・模拟预测)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是()

(参考数据:P(^2>6.635)=0.01)

①若K2的观测值满足K226.635,我们有99%的把握认为吸烟与患肺病有关系;

②若Kz的观测值满足K,W6.635,那么在100个吸烟的人中约有99人患有肺病;

③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的

可能性会患肺病;

④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.

A.①B.①④C.②③D.①②③④

19.(2223下徐汇•模拟预测)下列说法正确的是()

A.若随机变量P(X>2)=0.2,则尸(0<X<l)=0.2

B.数据7,4,2,9,1,5,8,6的第50百分位数为5.5

C.将一组数据中的每一个数据加上同一个正常数后,方差变大

D.设具有线性相关关系的两个变量x,>的相关系数为小则1,1越接近于0,x和y之间的线性相关程度越强

20.(2223•黄浦・三模)实验测得六组成对数据(x,y)的值为(4,90),(5,84),(6,83),(7,80),(8,75),(9,68),由

此可得y与龙之间的回归方程为了=-4尤+6,则可预测当x=10时,y的值为()

A.67B.66C.65D.64

21.(2223•奉贤•三模)已知两组数据公见,…,/和伉也,…,4°,其中且ieZ时,%=i;1M”9且3eZ时,

瓦=%,%=a,我们研究这两组数据的相关性,在集合{8,11,12,13}中取一个元素作为。的值,使得相关性最强,

则a=()

A.8B.11C.12D.13

22.(2223・金山・模拟预测)下列说法正确的有()个

①已知一组数据司,々,了3,-,税的方差为3,则再+2,尤2+2,忍+2,,尤1。+2的方差也为3.

②对具有线性相关关系的变量x,y,其线性回归方程为5=O.3x-根,若样本点的中心为(祖,2.8),则实数小的值是4.

③已知随机变量X服从正态分布若尸(X>—1)+尸(X»5)=l,贝|〃=2.

④已知随机变量X服从二项分布若E(3X+1)=6,贝ij"=6.

A.0个B.1个C.2个D.3个

23.(2223・上海•模拟预测)下列关于统计概率知识的判断,正确的是()

A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为或、兀和s;、s;,且已知

Xj=X2,则总体方差S?=;付+S;)

B.在研究成对数据的相关关系时,相关关系越强,相关系数「越接近于1

C.若尸(叫力=0.3,P(B)=0.3,则事件A、5相互独立

D.某医院住院的8位新冠患者的潜伏天数分别为10、3、8、3、2、18、7、4,则该样本数据的第50百分

位数为4

三、解答题

24.(2223•浦东新•三模)某农科所为了验证蔬菜植株感染红叶蛾与植株对枯萎病有抗性之间是否存在关联,随机抽

取88棵植株,获得如下观察数据:33棵植株感染红叶螭,其中19株无枯萎病(即对枯萎病有抗性),14株有枯萎

病;55棵植株未感染红叶蛾,其中28株无枯萎病,27株有枯萎病.

(1)以植株“是否感染红叶蛾”和“对枯萎病是否有抗性”为分类变量,根据上述数据制作一张列联表;

(2)根据上述数据,是否有95%的把握认为“植株感染红叶螭”和“植株对枯萎病有抗性”相关?说明理由.

2n^ad-bcy

P(j2>3.841)«0.05.

附:%(a+6)(c+d)(a+c)(b+d)'

25.(2324上•浦东新•开学考试)甲、乙两地之间的长途客车均由A3两公司运营.随机抽查两地之间的500个班次

的长途客车运行情况,得到下面的列联表.

准点班次数误点班次数总计

A公司24020260

8公司21030240

总计45050500

(1)是否有95%的把握认为甲、乙两地之间的长途客车是否准点与客车所属公司有关?说明理由;

(2)根据上表,以频率作为概率的估计值,试估算从AB两公司各抽取一班甲、乙两地之间长途客车时,准点班次数

的期望.

2

附:/=;—:吗#)-n=a+b+c+d,P(Z>3.481)«0.05.

(a+Z?)(c+d){a+c)(b+d)'7

26.(2324上•黄浦•开学考试)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活,现将一周网上买

菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”,

某市/社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:

喜欢网上买菜不喜欢网上买菜合计

年龄不超过45岁的市民401050

年龄超过45岁的市民203050

合计6040100

(1)能否有99.9%的把握认为M社区的市民是否喜欢网上买菜与年龄有关?

(2)加社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜.如果周一选

4

择A平台买菜,那么周二选择A平台买菜的概率为不,如果周一选择8平台买菜,那么周二选择A平台买菜的概率

为(,求小张周二选择8平台买菜的概率;

(3)用频率估计概率,现从〃社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量X,并记随机变

量y=2X+3,求x,y的期望和方差.

n(ad-bc)2

参考公式:/=其中〃=a+b+c+d.

(a+b)(c+d)(a+c)(b+d),

2

P(K>k0)0.10.050.010.0050.001

上02.7063.8416.6357.87910.828

27.(2324上•黄浦•阶段练习)某工厂共有甲、乙两个车间,为了比较两个车间的生产水平,分别从两个车间生产

的同一种零件中各随机抽取了100件,它们的质量指标值加统计如下:

质量指标值加[0,20)[20,40)[40,60)[60,80)[80,100]

甲车间(件)152025319

乙车间(件)510153931

n(ad-be?

附:/其中〃=a+6+c+d.

(a+Z?)(c+d)(a+c)(b+d)

尸(*/)0.050.010.001

k3.8416.63510.828

(1)估计该工厂生产这种零件的质量指标值川的平均数;(同一组中的数据用该组区间的中点值作代表);

(2)根据所给数据,完成下面的2x2列联表(表中数据单位:件),并判断是否有99%的把握认为甲、乙两个车间的

生产水平有差异.

m<60m>60合计

甲车间

乙车间

合计

28.(2223下•黄浦•阶段练习)疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使

用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如下:

未感染病毒感染病毒总计

未注射疫苗40PX

注射疫苗60qy

总计100100200

3

现从未注射疫苗的小白鼠中任取1只,取至『'感染病毒”的小白鼠的概率为

⑴求2x2列联表中的数据p,分无,y的值;

(2)是否有95%的把握认为注射此种疫苗有效?说明理由;

(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取10只进行病例分析,然后从这10只小白鼠中随机

抽取4只对注射疫苗情况进行核实,记X为4只中未注射疫苗的小白鼠的只数,求X的分布与期望E(X).

2n^ad-bcy

附:%(a+6)(c+d)(a+c)(b+d)'其中n=a+b+c+d.

尸(/河0.100.050.010.0050.001

k2.7063.8416.6357.87910.828

备战2024高考优秀模拟题分类汇编(上海专版)一一成对数据的统计分析

一、填空题

1.(2223下•徐汇・模拟预测)假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是

y=0.85+25.82,已知父亲身高为175cm,则估计女儿的身高为cm.(结果精确到整数)

【答案】168

【分析】根据回归方程代入数据计算即得.

【详解】因为女儿身高为y(单位:cm)关于父亲身高尤(单位:cm)的经验回归方程是y=o.8ix+25.82,

所以当父亲的身高为175cm时,y=0.81x175+25.82=167.57«168cm.

故答案为:168.

2.(2223下•青浦•阶段练习)根据变量X与y的对应关系(如表),求得y关于X的线性回归方程为y=6.5x+17.5,

则表中m的值为.

X24568

y3040m5070

【答案】60

【分析】先求出工亍,然后代入回归方程中可求出加的值.

【详解】由题意得i=gx(2+4+5+6+8)=5,y=|x(30+40+m+50+70)=y+38,

因为y关于x的线性回归方程为y=6.5x+17.5,

所以4+38=6.5x5+17.5,解得机=60,

故答案为:60

3.(2223.浦东新.模拟预测)某产品的广告费投入与销售额的统计数据如下表所示:

广告费万元X/万元4235

销售额万元y/万元49263954

根据上表建立线性回归方程,预测当广告费投入6万元时,销售额约为万元.

【答案】65.5

【分析】首先求所给数据的平均数,得到样本中心点,利用回归系数公式求出回归系数g,再根据回归直线过样本

中心点,求出再利用回归直线方程即可求出预测销售额.

_49+26+39+54所

【详解】因为钎一^=3.5,产-----4—=42,

4

^(x;-x)(x.-y)=(4-3.5)x(49-42)+(2-3.5)x(26-42)+(3-3.5)x(39-42)+(5-3.5)x(54-42)=47,

1=1

4

2(%—元)=(4一3.5)2+(2—3.5)2+(3—3.5)2+(5—3.5)2=5,

Z=1

元)(%-9)

47

所以]J=1「4,

2(百-元)2

Z=1

因为数据的样本中心点在线性回归直线上,

所以&=42—9.4x3.5=9.1,

所以线性回归方程为夕=9.4X+9.1,当x=6时,9=9.4x6+9.1=65.5,

所以广告费投入6万元时,销售额为65.5万元.

故答案为:65.5.

4.(22.23上•黄浦•开学考试)已知由样本数据(4%)(2=1,2,3,,10)组成的一个样本,得到回归直线方程为y=2x-0.4,

且了=2,其中发现两个歧义点(-2,1)和(2,-1)偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回

归直线方程为.

【答案】—

【分析】由题可得歹=3.6,进而可得新的平均数,根据回归直线方程过样本中心结合条件即得.

【详解】因为9=2x-0.4,且元=2,

所以y=2x2—04=3.6,

去除两个歧义点(-2,1)和(2,-1)后新的平均数为:

.2x10+2-25-3.6x10-1+19

A=-----------=—,I=----------------------------二—又新的回归直线的斜率为3,

95

所以y-3x「3,

所以新的回归直线方程为夕=3丈-3.

故答案为:夕=3X-3.

5.(2223上•徐汇•期中)下列命题中错误的是

①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;

②在一组样本数据(人,乂),(%,%),…,(%,口)。后2,再,%,L,尤“不全相等)的散点图中,若所有样本点

(4%)(,=1,2,,〃)都在直线>=-;尤+1上,则这组样本数据的线性相关系数为-;;

③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患

肺病有关系.若某人吸烟,则他有99%的可能性患肺病.

【答案】①②③

【分析】根据均值和方差的性质,相关系数的特点,独立性检验的相关知识,对每个选项进行逐一分析,即可判断

和选择.

【详解】对于①,将一组数据中的每个数都加上或减去同一个常数后,均值改变,方差不变,所以①错误;

对于②,在散点图中,若所有样本点都在直线y=上,则这组样本数据的线性相关系数为-1,所以②错误;

对于③,由独立性检验得,有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误,所以

③错误.

综上,错误的命题序号是①②③.

故答案为:①②③.

6.(22・23下•杨浦・开学考试)某设备的使用年数x与所支出的维修总费用y的统计数据如下表:

使用年数X(单位:年)23456

维修总费用y(单位:万元)1.54.55.56.57.5

根据上表可得经验回归方程为y=L4x+a.则x=10处的预测值为万元.

27

【答案】13.5/y.

【分析】由表格可得心4,3=5.1,后由回归直线方程过点伍习可得is,最后代入x=10可得答案.

2+3+4+5+61.5+4.5+5.5+6.5+7.5

【详解】由表格,得尤==4,y=

55

因为回归直线方程为y=L4尤+。,所以5.1=L4x4+a=。=-0.5,即y=L4x-0.5.则x=10时,>=13.5.

故答案为:13.5

7.(2223下•闵行•阶段练习)已知的对应值如下表所示:

02468

y1m+12m+l3m+311

若,与无线性相关,且回归直线方程为>=1.3尤+0.6,则〃7=.

【答案】2

【分析】利用回归直线方程经过样本中心点伍了),即可求出结果.

【详解】由表可知,x=|x(O+2+4+6+8)=4,y=|x(l+m+l+2m+l+3/?z+3+ll)=

因为回归直线方程经过样本中心点(无》),

―…6m+17rc//

所以——-——=1.3x4+0.6,

解得m=2.

故答案为:2.

8.(22.23下•浦东新•阶段练习)已知一组成对数据如下表所示.若该组数据的回归方程为>=-2x+61,贝1]。=

X181310-1

y243438a

【答案】68

【分析】求出样本中心点的坐标,代入回归直线方程可得出实数。的值.

I_t--u/zn-t―—18+13+10—1.„—24+34+38+。.u

【详解】由表格中的数据可rZ得f=)%=-----------=10,y=--------------------=24+—,

444

将点「3)的坐标代入回归直线方程可得-2x10+61=24+(,解得a=68.

故答案为:68.

9.(2223•浦东新三模)己知一组成对数据(18,24),(13,34),(10,38),(-1,机)的回归方程为广-2»59.5,则该组数据

的相关系数厂=(精确到0.001).

【答案】-0.998

【分析】一组成对数据的平均值GJ)一定在回归方程上,可求得加,再利用相关系数r的计算公式算出即可.

【详解】由条件可得,

-18+13+10-1

x=------------=10,

4

24+34+38+利96+m

y二

44

(x,y)一定在回归方程丁=-2%+59.5上,代入解得机=62,

-96+6279

尸丁

2

4

=18x24+13x34+10x38-1x62=1192,

i=l

4

=182+132+102+(-1)2=594,

i=l

4

XX2=242+342+382+622=7020,

1=1

4____

Z%%一4抄1192-4X10X—

/.r=]4归4=I2=x-0.998

一#)((£均_疗))(594-4x100)x(7020-4x(:)2)

Vi=ii=iv,

故答案为:-0.998

10.(2223・虹口•模拟预测)供电公司为了分析某小区的用电量y(单位:kw-h)与气温无(单位:。C)之间的关系,随

机统计了4天的用电量与当天的气温,这两者之间的对应关系见下表:

气温X181310-1

用电y2434m64

利用最小二乘法得到的回归方程为y=-2x+60,则机=.

【答案】38

【分析】利用样本中心点在回归直线上即可求解.

【详解】由题意可知,-=18+13+10+(-1)=10)

4

—24+34+机+64122+机

尸-------------二'

44

所以样本中心点的坐标为110,

将代入>=一2尤+60,得^^=-2x10+60,解得加=38.

故答案为:38.

11.(2324上•长宁•期中)已知两个线性相关变量X〉的统计数据如表所示,则其回归方程是

X12345

y30-2-4-5

【答案】y=-2x+4.4

【分析】利用最小二乘法求回归直线方程即可.

1+2+3+4+53+0-2-4-5

【详解】由表可知丁==—1.6,

55

^_1X3+2X0+3X(-2)+4X(-4)+5X(-5)-5X3X(-1.6)

iKl/nD=~-

1+4+9+16+25-5x9

a=y-bx=4.4,

所以线性回归方程为:y=-2x+4.4.

故答案为:y=-2x+4.4

12.(2223下•徐汇•模拟预测)下列说法中正确的有(填正确说法的序号).

①若样本数据毛,巧,…,%的方差为4,则数据2占+1,2X2+1,2/+1的标准差为4;

②已知随机变量XN(L"),且尸(X>3)=0.2,贝|P(l<XW3)=0.3;

③若线性相关系数卜|越接近1,则两个变量的线性相关性越弱;

④若事件A,B满足尸(A)>0,P(B)>0,P(BIA)=P(B),则有尸(A|5)=尸(A).

【答案】①②④

【分析】对于①,利用方差的性质求解判断,对于②,根据正态分布的性质计算,

对于③,根据相关系数的性质判断,对于④,利用独立事件和条件概率公式求解判断.

【详解】由于。(。乂+6)=/。(乂),所以数据2占+1,2X2+1,2%()+1的方差为16,

故标准差为4,因此①正确;

根据正态分布,〃=1,故尸(X>l)=0.5,即尸(X>3)+尸(1<XW图=0.5,

故尸(1<XV3)=O.3,因此②正确;

线性相关系数⑺越接近1,则两个变量的线性相关性越强,故③错误;

由于P(B\A)=P(B)等价于“事件A与事件B相互独立,即尸(A5)=P(A)P(B),

故必有尸(A|B)=g^=P(A),因此④正确.

故答案为:①②④

二、单选题

13.(2324上•黄浦•开学考试)观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点

图按顺序相对应的是().

A.①②③B.②①③C.①③②D.③①②

【答案】C

【分析】根据散点图以及相关性定义判断.

【详解】对于图①,显然是正的线性相关,对于图②,不相关,对于图③,负的线性相关;

故选:C.

14.(2223上•嘉定•阶段练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的

人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人

对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立()

A.甲B.乙C.丙D.丁

【答案】D

【分析】正确理解相关系数,相关关系与因果关系的区别是解题的关键.

【详解】当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系是一种非

确定性关系,相关关系不等于因果关系,丁的意见最可能成立.

故选:D.

15.(2223•杨浦・二模)对成对数据(4,乙)、(4,%)........(五,%)用最小二乘法求回归方程是为了使()

A.^(.V,-.V)=OB.£(%-y)=o

i=l

c.t(y-y)最小

D.-%)最小

【答案】D

【分析】由最小二乘法的求解即可知.

【详解】根据最小二乘法的求解可知:回归方程是为了使得每个数据与估计值之间的差的平方和最小,

故选:D

16.(2223•浦东新•二模)某种产品的广告支出X与销售额y(单位:万元)之间有下表关系,y与X的线性回归方

程为y=10.5x+5.4,当广告支出6万元时,随机误差的效应即离差(真实值减去预报值)为().

X24568

y3040607080

A.1.6B.8.4C.11.6D.7.4

【答案】A

【分析】代入x=6,得到>=68.4,从而得到随机误差的效应即离差.

【详解】当尤=6时,y=10.5x6+5.4=68.4,故随机误差的效应即离差为70—68.4=1.6.

故选:A

17.(2223下•徐汇・模拟预测)某地为响应“扶贫必扶智,扶智就扶知识、扶技术、扶方法”的号召,建立了农业科

技图书馆,供农民免费借阅.现收集了该图书馆五年的借阅数据如下表:

年份20162017201820192020

年份代码X12345

年借阅量y(万册)4.95.15.55.75.8

根据上表,可得y关于x的线性回归方程为y=Q24x+b,则下列说法中错误的是().

A.6=4.68

B.借阅量4.9,5.1,5.5,5.7,5.8的第75百分位数为5.7

C.y与尤的线性相关系数厂>。

D.2021年的借阅量一定少于6.12万册

【答案】D

【分析】对于A:根据线性回归方程必过样本中心点运算求解;对于B:根据百分位的定义运算求解;对于C:根

据相关系数的定义分析判断;对于D:根据回归方程的进行预测.

【详解】对于选项A:年份代码尤的平均数x=?l+2+3+4+5)=3,

—1

年借阅量y的平均数>=二(4.9+5.1+5.5+5.7+5.8)=5.4(万册),

则5.4=0.24x3+》,解得6=4.68,故A正确;

对于选项B:因为5x0.75=3.75,所以借阅量的第75百分位数为5.7,故B正确;

对于选项C:因为Q24>0,所以y与x的线性相关系数r>0,故C正确;

对于选项D:由选项A可得:y=0.24x+4.68,

令x=6,可得y=0.24x6+4.68=6.12,

预计2021年的借阅量为6.12万册,但并不能确定具体结果,故D错误;

故选:D.

18.(2223下•崇明•模拟预测)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是()

(参考数据:P(K2>6.635)=0.01)

①若K2的观测值满足6.635,我们有99%的把握认为吸烟与患肺病有关系;

②若Kz的观测值满足K,W6.635,那么在100个吸烟的人中约有99人患有肺病;

③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的

可能性会患肺病;

④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.

A.①B.①④C.②③D.①②③④

【答案】B

【分析】由给出的数据,结合K?观测值的意义判定即可.

【详解】若K2的观测值满足R2N6.635,则我们有99%的把握认为吸烟与患肺病有关系,而得知有99%的把握认

为吸烟与患肺病有关系时,仍有1%的可能性使推断出现错误,但不能说明100个吸烟的人中约有99人患有肺病,

及每个吸烟的人有99%的可能性会患肺病.

故①④正确、②③错误.

故选:B

19.(2223下•徐汇•模拟预测)下列说法正确的是()

A.若随机变量P(X>2)=0.2,则尸(0<X<l)=0.2

B.数据7,4,2,9,1,5,8,6的第50百分位数为5.5

C.将一组数据中的每一个数据加上同一个正常数后,方差变大

D.设具有线性相关关系的两个变量x,y的相关系数为,,则⑺越接近于o,%和y之间的线性相关程度越强

【答案】B

【分析】根据随机变量X~N(l,b2)求解判断A;利用百分位数定义求解判断B;利用平均数和方差公式求解判断

C;利用相关系数的绝对值越接近于1,x和y之间的线性相关程度越强判断D.

【详解】因为随机变量X~N(1,4),所以〃=1,因为P(X>2)=0.2,

所以P(X<0)=0.2,则尸(0<X<2)=l—0.2-0.2=06,所以P(0<X<1)=0.3,故A错误;

数据7,4,2,9,1,5,8,6的第50百分位数为5.5,故B正确;

设一组数据为罚,马,…,无”,则平均数为彳=:(为+…+无”),方差为/尤了+“•+(%,

将数据中的每一个数据加上同一个常数后为占+a,x2+a,...,xn+a,则平均数为

x'=—+x2+...++a,方差为s'?=—+a-x'

所以将一组数据中的每一个数据加上同一个常数后,方差不变,故C错误;

设具有线性相关关系的两个变量x,y的相关系数为r,则卜|越接近于1,x和y之间的线性相关程度越强,故D错

误;

故选:B

20.(2223・黄浦・三模)实验测得六组成对数据(x,y)的值为(4,90),(5,84),(6,83),(7,80),(8,75),(9,68),由

此可得y与尤之间的回归方程为>=7》+6,则可预测当x=10时,y的值为()

A.67B.66C.65D.64

【答案】B

【分析】先求出样本中心点,线性回归方程>=-4尤+6恒过(工亍),代入即可求出匕,再令x=10,代入求解即可.

【详解】由表中数据可得,x=-x(4+5+6+7+8+9)=6.5,y=1x(90+84+83+80+75+68)=80,

66

线性回归方程为y=—4%+Z?,贝!J80=—4x6.5+Z?,解得人=106,

故y=-4x+106,当%=10时,)=-4x10+106=66.

故选:B.

21.(2223・奉贤•三模)已知两组数据%,%,…,阳和可也,…潮o,其中0注10且MZ时,q=i;1W9且生Z时,

包=%,bw=a,我们研究这两组数据的相关性,在集合{8,11,12,13}中取一个元素作为。的值,使得相关性最强,

贝I]a=()

A.8B.11C.12D.13

【答案】B

【分析】根据相关性与线性回归方程的关系即可得到答案.

【详解】设点坐标为(q,&),1W10且ieZ,

由题意得前9个点位于直线y=x上,面4。=10,则要使相关性更强,伉。应更接近10,

四个选项中11更接近10,

故选:B.

22.(2223・金山・模拟预测)下列说法正确的有()个

①已知一组数据尤,1々,%3,-,/的方差为3,则为+2,无2+2,&+2,,尤1。+2的方差也为3.

②对具有线性相关关系的变量x,y,其线性回归方程为9=O.3x-,〃,若样本点的中心为(如,2.8),则实数旭的值是4.

③已知随机变量X服从正态分布若P(X>—1)+P(XN5)=1,贝|〃=2.

④已知随机变量X服从二项分布若E(3X+1)=6,贝i]"=6.

A.0个B.1个C.2个D.3个

【答案】C

【分析】根据方差的定义可判断A;根据样本点中心在回归直线上求得加的值可判断B;根据

P(X>-1)+尸(X25)=l可得尸(X\5)=尸(XW-1),由对称性求出对称轴可得〃的值可判断C;根据二项分布的期

望方差的公式期望方差的性质可判断D,进而可得正确个数.

【详解】对于A:设对尤2,马…,尤K)的平均数为,方差为。(元),

贝|]噎=占+/+%。,())2()2()2

1£>%=-x+x2-x++x10-x=3,

所以%+2,%+2,%+2,,税+2的平均数为1+2,

所以方差为伍[(再+2-尤-2)+(/+2-尤-2)++(X]O+2-尤-2)]

=:[(%-司+(%-x)++(X[°-X)=D(x)=3,故选项A正确;

对于B:因为线性回归直线过样本点中心,所以2.8=0.3机-加,可得加=T,故选项B错误;

对于C:因为随机变量X服从正态分布所以对称轴为X=〃,又尸(X>-1)+P(X35)=1,

而尸(X>T)+/(XW—l)=l,所以尸(XN5)=((X4—1),

则〃=之上5=2,故选项C正确;

2

对于D:因为X服从二项分布所以E(X)=%,所以

ri

E(3X+l)=3E(X)+l=3x§+l=6,贝U〃=5,故选项D错误.

故选:C.

23.(2223・上海•模拟预测)下列关于统计概率知识的判断,正确的是()

A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为服、兀和s;、s;,且已知

X]=X2,则总体方差S?=:[;+£;)

B.在研究成对数据的相关关系时,相关关系越强,相关系数厂越接近于1

C.若尸(B|A)=0.3,尸(3)=0.3,贝U事件A、8相互独立

D.某医院住院的8位新冠患者的潜伏天数分别为10、3、8、3、2、18、7、4,则该样本数据的第50百分

位数为4

【答案】C

【分析】利用方差公式可判断A选项;利用相关系数与线性相关关系可判断B选项;利用条件概率公式以及独立

事件的定义可判断C选项;利用百分位数的定义可判断D选项.

【详解】对于A选项,设2层数据分别为四、々、L、am;伪、瓦、L、

因为(=元,所以,总体平均数为;=研+畛=兀=焉,

m+n

m+nm+n

n

1^2(1)2m—n2m—n2(加一〃乂§;一

2J1\m+n2J22(m+n)12(m+〃)22(m+n)

所以,当加="或S;=S;时,s2=/s;+s;),否则A错;

对于B选项,在研究成对数据的相关关系时,相关关系越强,相关系数「的绝对值越接近于1,B错;

对于C选项,由条件概率公式可得尸(叫人)=萼整,所以,P(AB)=P(A)P(B|A),

所以,P⑷=*,故尸⑷尸⑻叽"驾尸(皿

I,P(B|A)VV7P(B|A)0.3'

所以,事件A、8相互独立,C对;

对于D选项,将样本数据由小到大排列分别为2、3、3、4、7、8、10、18,

所以,该样本数据的第50百分位数为掾=5.5,D错.

故选:C.

三、解答题

24.(2223•浦东新•三模)某农科所为了验证蔬菜植株感染红叶螭与植株对枯萎病有抗性之间是否存在关联,随机抽

取88棵植株,获得如下观察数据:33棵植株感染红叶蛾,其中19株无枯萎病(即对枯萎病有抗性),14株有枯萎

病;55棵植株未感染红叶螭,其中28株无枯萎病,27株有枯萎病.

(1)以植株“是否感染红叶蛾”和“对枯萎病是否有抗性”为分类变量,根据上述数据制作一张列联表;

(2)根据上述数据,是否有95%的把握认为“植株感染红叶螭”和“植株对枯萎病有抗性”相关?说明理由.

2n(ad-bcy

P(力2z3.841)。0.05.

附:力(a+6)(c+d)(a+c)(b+d)'

【答案】(1)答案见解析

(2)植株感染红叶螭与植株对枯萎病有抗性无关,理由见解析

【分析】(1)数据分析填写列联表;

(2)在(1)的基础上,计算卡方,与3.841比较后得到答案.

【详解】(1)见下表.

感染红叶螭未感染红叶螭总计

对枯萎病有抗性192847

对枯萎病无抗性14

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论