新教材高中数学第八章成对数据的统计分析检测题新人教A版选择性_第1页
新教材高中数学第八章成对数据的统计分析检测题新人教A版选择性_第2页
新教材高中数学第八章成对数据的统计分析检测题新人教A版选择性_第3页
新教材高中数学第八章成对数据的统计分析检测题新人教A版选择性_第4页
新教材高中数学第八章成对数据的统计分析检测题新人教A版选择性_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章检测题

考试时间120分钟,满分150分.

一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,

只有一项是符合题目要求的)

1.下列说法中正确的是(C)

A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义

B.独立性检验对分类变量关系的研究没有100$的把握,所以独立性检验研究的结果在

实际中也没有多大的实际意义

C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的

D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的

[解析]相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发

展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,

独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故选C.

2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(B)

A.总偏差平方和B.残差平方和

C.回归平方和D.相关指数

3.相关变量筋y的样本数据如下:

X12345

y22356

经回归分析可得'与*线性相关,并由最小二乘法求得经验回归方程j,=.v+a,则a=

(C)

A.B.

C.D.

廨布由题意,l+2+”+5=3

v2+2+3+5+6

y—=,

5

•・•经验回归方程为y=x+a,

,=X3+a,

・・・a=0.3.故选C.

4.假设有两个分类变量X和Y,它们的取值分别为{知&}和{必,力,其2X2列联表

如下:

必y?总计

X\aba+b

x2cdc+d

总计a+cb+da+/?+c+d

对于同一样本,以下数据能说明¥与F有关的可能性最大的一组为(D)

A.a=5,b=10,c=6,d=l

B.5=5,〃=6,c=10.4=7

C.a=7,b=6,c=10,d=5

D.a=6,b=7,c=10,d=5

[解析]对于同一样本,|ad-A|越小,说明才与「相关性越弱,而|ad-A|越大,说

明X与V相关性越强,通过计算知,对于选项A,B,C,都有lad-6cl=|35—60|=25;对

于选项D,有|ad一力c|=40.故选D.

5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对

这种交通方式的认可%某同学从交通拥堵不严重的月城市和交通拥堵严重的〃峨市分别随

机调查了20名市民,得到如下2X2列联表:

AB总计

认可13518

不认可71522

总计202040

nad-be'

附:,〃=a+6+c+4

a+力c+da+cb-\-d

P(〈2A)

k

根据表中的数据,下列说法中正确的是(D)

A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”

B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”

C.可以在犯错误的概率不超过的前提下认为“是否认可与城市的拥堵情况有关”

D.可以在犯错误的概率不超过的前提下认为“是否认可与城市的拥堵情况有关”

[解析]由题意,根据2X2列联表中的数据,得/=例“13X15-5X7%又,

18X22X20X20

所以可以在犯错误的概率不超的前提下认为“是否认可与城市的拥堵情况有关”.故选D.

6.废品率就与每吨生铁成本y(元)之间的经验回归方程为尸234+3%表明(B)

A.废品率每增加陶,生铁成本增加3%元

R.废品率每增加1%,生铁成本每吨平均增加3元

C.废品率每增加1%,生铁成本增加234元

D.废品率不变,生铁成本为234元

[解析]经验回归方程表示废品率谒与每吨生铁成本y(元)之间的相关关系,当经验回

归方程为y=234+3x时,表明废品率每增加1%,生铁成本每吨平均增加3元,故选B.

7.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中

生,通过问卷调查,得到以下数据:

作文成绩优秀作文成绩一般总计

课外阅读量较大221032

课外阅读量一般82028

总计303060

由以上数据,计算得到丁先,根据临界值表,以下说法正确的是(D)

A.没有充足的理由认为课外阅读量大与作文成绩优秀有关

B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关

C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关

D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关

[解析]:/七,P5.27.879)",・••在犯错误的概率不超过的前提下认为作文成绩

优秀与课外阅读量大有关.故选D.

8.两个相关变量满足如下关系:

X1015202530

y10031005101010111014

两变量的经验回归方程为(A)

A.y=x+B.y=x~

C.y=x-\-D.y=x+

[解析]x」0+15+2。+25+3。=见

5

v10034-10054-1010+1011+1014

5

利用公式可得6=

10X1003+15X1005+20X1010+25X1011+30X1014-5X20X巾"

=,又》=yv-

100+225+400+625+900-5X400

bx=997.4.

,经验回归方程为y=x+997.4.故选A.

二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,

有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0

分)

9.晚上睡眠充足是提高学习效率的必要条件,高中甲的高三年级学生晚上10点10分

必须休息,高中乙的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍

晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行

问卷调查,其中高中甲有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽

到学习效率高的学生的概率是,则(AC)

a+Z?z+cdc+d

Pgk)5

A.高中甲的前50名学生中有60%的学生学习效率高

B.高中乙的前50名学生中有40$的学生学习效率高

C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”

I).认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过

30

[解析]高中甲的前50名学生中有30人学习效率高,即X100%=60%,所以A正确:

50

高中乙的前50名学生中有10人学习效率高,即l°X100舟=20乐所以B错误;这100名学

50

生中学习效率高的学生有100X=40(A),根据题意填写2X2列联表如下:

学习效率高学习效率不高合计

高中平302050

高中乙1()4050

合计4060100

计算观测值仁30X40-10X2。=5。~

40X60X50X503

所以有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”,C正确;认

为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过,所以D错误.故选

AC.

10.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据

(%,匕)(,=1,2,…,用最小二乘法建立的经验同归方程为7=-5X+150,则下列结

论正确的是(AD)

A.y与x具有负的线性相关关系

B.若r表示y与x之间的线性相关系数,则==一5

C.当销售价格为10元/件时,销售量为100件

D.当销竹价格为10元/件时,销售量为100件左右

[解析]由经验回归方程y=-5x+150可知y与x具有负的线性相关关系,故A正确:

y与x之间的线性相关系数”IW1,故B错误;当销售价格为1()元时,销售量为-5X10+

150=100(件)左右,故C错误,D正确.

11.(2022•北京•零•中学)下列说法中正确的有iADD)

A.一支田径队有男、女运动员共98人,其中男运动员有56人.按男、女比例用分层

抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是12

B.在某项测量中,测量结果*服从正态分布趴1,若X在(0,1)内取值

的概率为0.4.则X在(0,2)内取值的概率为

C.废品率姗和每吨生铁成本y(元)之间的回归直线方程为y=2x+256,这表明废品率

每增加1%,生铁成本每吨大约增加258元

D.为了检验某种血清预防感冒的作用,把500名未使用血清和使用血清的人一年中的

感冒记录作比较,提出假设&“这种血清不能起到预防作用”,利用2X2列联表计算得

犬的观测值竹,经查对临界值表知〃(/23.841)%,由此,得出以下判断:在犯错误

的概率不超过的前提下认为“这种血清能起到预防的作用”

[解析]•・,田径队有男、女运动员共98人,其中男运动员有56人,

・••这支田径队有女运动员98—56=42(人),

用分层抽样的方法从该队的全体运动员中抽取一个容量为28的样本,

•・•每个个体被抽到的概率是28=2.

987

•・•田径队有女运动员42人,

・••女运动员要抽取42X4=12(人).故A正确.

7

根据正态分布的规律,测量结果X服从正态分布

Ml,苏)(。>0),若*在(0,1)内取值的概率为,则X在(0,2)内取值的概率为2X=

0.8.故B正确.

废品率淄和每吨生铁成本y(元)之间的回归直线方程为y=2x+256,

这表明废品率每增加1%»生铁成本每吨大约增加2元.

故C不正确.

根据独立性检验的方法与结论可知,D正确.故选ABD.

12.对于表中x,y之间的一组数据:

X13678

y12345

甲、乙两位同学给出的拟合直线方程分别为①yc=iI>+l和②yI=I.若通过分析得出

322

②的拟合效果好,则下列分析理由正确的是(BCD)

A.①的残差和大于②的残差和,所以②拟合效果更好

B.①的残差平方和大于②的残差平方和,所以②抵合效果更好

C.①的川小于②的炉,所以②拟合效果更好

I).残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更

窄,所以直线②拟合效果更好

[解析]不可以根据残差和的大小来分析模型的拟合效果的好坏,故A错误;用j,=l

3

+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和即残差平方和为:S产

10n

(1-41fl-]f-l7-1

I3j-+(2-2)2+(3-3)2+l3j+l53)='.用尸1才+】作为拟合直线时,所得残差

322

9

」]1

平方和为:$=(1-1尸+(2-2/+1I2j+(4-4)2+l(5-21j=,,,•②的拟合效

2

71

果更好,故B正确;①的#=1—3=23,②的"=1—2=19,...①的#小于②的#,

10301020

②拟合效果更好,故c正确;残差图中直线②的残差点分布的水平带状区域比①的残差点分

布的水平带状区域更窄,.••直线②拟合效果更好,故DIE确.

三、填空题(本大题共4小题,每小题5分,共20分)

13.某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调杳

(其中有男生50名,女生30名),并绘制等高堆积条形图(如图所示),则这80名学生中喜

欢国画的人数为58

[解析]由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,

则这80名学生中喜欢国画的人数为50X80%+30X60%=58.

14.假设关于某设备为使用年限x和所支出的维修费用y(万元)有如卜.的统计资料:

x__2___3~_4~~5_6

y

若由资料可知y对于x呈线性相关关系,且经验回归方程为其中已知/尸,

请估计使用年限为20年时,维修费用为一万元.

[解析]由表中数据可知:

y2+3+4+5+6

4==4

5

y=错误!=5.

又•・•经验回归直线一定经过样本点中心(》,y),

.,.5=a+X4,/.a=,

,经验回归方程为y=x+O.08.

故估计使用年限为20年时,维修费用为y=X20+=24.68(万元).

15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试

销,得到如下数据:

单价*(元)456789

销量y(件)908483807568

由表中数据,求得经验回归方程为y=-4x+a若在这些样本点中任取一点,则它在经

验回归直线左下方的概率为

3

3

P,801-13。

[解析]样本点中心坐标为〔2J1所以a=80+1X[J=106,所以经验回归方程为p

2

21

=-4x+106,经验证可知有2个点位于回归直线左下方,其概率为

63

16.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调杳,

得到了如下的2X2列联表:

喜爱打篮球不喜爱打篮球合计

男生20a25

女生b15C

合计30d50

则a+b+c+d=^;在犯错误的概率不超过的前提下认为喜爱打篮球与性别有

关.

p/inad-be1

附:x2=

a+bc+da+cb+d

a

X。

[解析]由列联表数据可求得

a=5./?=10.c=25,<7=20.

x.50X20X15-5X10

所以a+6+c+d=6C;

25X25X30X20

所以在犯错误的概率不超过的前提下认为“喜爱打篮球与性别有关”.

四、解答题(本大题夫6小题,共70分.解答应写出文字说明、证明过程或演算步骤)

17.(本小题满分10分)某大型企业人力资源部为了研究企、业员工的工作积极性和对待

企业改革态度的关系,随机抽取了189名员工进行调杳,所得数据如卜.表所示.

积极支持企业改革不太赞成企业改革总计

工作积极544094

工作一般326395

总计86103189

李明和张宇都对该题进行了独立性检验的分析,李明的结论是“在犯错误的概率不超过

0.01的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”:张宇的结论是

“在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企业改革的态度有关

系”.

他们两人的结论正确吗?他们的结论为什么不•样?

[解析]正确.由列狭表中的数据,

.2189X54XC3-40X322

得'=g10A.759.

94X95X86X103

若以为临界值,则在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企

业改革的态度有关系:

若以为临界值,则在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企

业改革的态度有关系.

18.(本小题满分12分)某地区某农产品近几年的产量统计如表:

年份201720182019202020212022

年份代码X123456

年产量(万吨)7

(1)根据表中数据,建立y关于x的经验回归方程y=bx+a:

(2)根据经验回归方程预测2023年该地区该农产品的年产量.

附:对于一组数据(x,%),(如必),…,(匕,匕),其经验回归方程的斜率

-LX-x匕一y

和截距的最小二乘估计分别为8=一'a=y—。X.(参考数据:

n

X2

/E=1XL

JE-1(%一*)(匕一y)=,计算结果保留到小数点后两位)

[解析](1)由题意可知:,=错误!=7,

6

E(X—,)2=(-2.5尸+(―1.5尸+(-0.5)'++'+'=,

/=(

-EX—Xy—y

所以匕===错误!=,

£X-X2

/=1

又打=y—bX=7—X=,

故y关于x的经验回归方程为尸x+6.44.

(2)由(1)可得,当年份为2023年时,年份代码x=7,此时y=X7+=7.56.

所以可预测2023年该地区该农产品的年产量约为万吨。

19.(本小题满分12分)某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)

之间有如下对应数据:

X24568

y3040605070

(1)画出散点图;

(2)求经验回归方程;

(3)试预测广告费支出为10万元时,俏售额为多少?

附:仁错误!,a=旷一bx.

参考数据:错误£=145,错误!,匕=1380.

[解析](1)根据表格中的5组数据,绘制散点图如图所示:

⑵由表格数据可知:

x=1(2+4+5+6+8)=5,

5

/=1(30+40+60+50+70)=50,

5

1380—5X5X50

故力=错误!=

145-5X25

a=y—bx=50—X5=,

故所求经验回归方程为y=x+17.5.

⑶由⑵知,y=x+,

令矛=10,解得y=82.5.

故广告费支出为10万元时,销售额约为万元.

20.(本小题满分12分)(2021•湖南长沙市雅礼中学)某城市选用某种植物进行绿化,

设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据如下表所示:

第X/p>

高度y/cm0479111213

作出这组数的散点图如图:

(1)请根据散点图判断,y=ax+〃与y=cx+d中哪一个更适宜作为幼苗高度y关于时

间x的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程,并预测第144天

这株幼苗的高度(结果保留1位小数).

n

.x.y-nxy.

Pit:b=,a=y—bx.

北一〃x!

J-1

参考数据:

7777

X:XiYiy.Xi

/=!J=1/=1

14()2856283

[解析]⑴根据散点图可知,y=cx+d更适宜作为幼苗高度y关于时间x的回归方

程类型.

(2)令〃=x,贝ljy=cx+d构造新的成对数据,如下表所示:

/p>

〃=X1234567

y0479111213

容易计算,〃=4,y=8.

通过上表计算可得

7

八〃/y,—7〃y

K必283-7X4X859

c==

7〃2_7〃2140-7X1628,

/=11

•・•回归直线尸。〃+交:点(〃,/),

3

d=y—c

7

c5gq-

故y关于〃的经验回归直线方程为y=〃一,从而可得y关于*的经验回归方程为y=

287

593

x—.

287

,174

令x=144,则产=2,・•・预测第144天幼苗的高度大约为24.9cm.

7

21.(本小题满分12分)某调查组利用网站进行民意调查,数据调查显示,民生问题是

百姓最关心的热点,参与调查者中关注此问题的约占80%,现从参与调查者中随机选出200

人,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4

组[45,55),第5组[55,65],得到的频率分布直方图如图所示.

⑴求a;

(2)估计参与调查者的平均年龄;

(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,

若选出的200人中不关注民生问题的中老年人有10人,问是否有99$的把握认为是否关注

民生与年龄有关?

附:

k。

nad-be'

,n=a+b~\~c+d.

a-\-bc+da+c叶d

[解析](I):X10+X10+X10+aX10+X10=],

**•ci—0.035.

(2)*=X10X20+X10X30+X10X40+X10X50+X10X60=,

,估计参与调查者的平均年龄为:岁.

(3)选出的200人中,各组的人数分别为:

第1组:200XX10=20人,第2组:200X义10=30人,第3组:200义义10=70人,

第4组:200XX10=60人,第5组:200XX10=20人,

・•・青少年组有20-1-30+70=120人,中老年组有200120=80人,

•・•参与调查者中关注此问题的约占80$,

••・有200X(1-80%)=40人不关心民生问题,

・•・选出的200人中不关注民生问题的青少年有30人,

・・・2X2列联表如下:

关注民生问题不关注民生问题合计

青少年903。120

中老年701080

合计16049200

i200X90X10-70X30”,

160X40X80X120

・•・没有99%的把握认为是否关注民生与年龄有关.

22.(木小题满分12分)某人计划于2021年7月购买一辆某品牌新能源汽车,他从当地

该品牌销售网站了解到近五个月实际销量如表所示:

月份

月份编号t12345

实际销量y(万辆)1

(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编

号£之间的相关关系.请用最小二乘法求y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论