高考数学(理)一轮总复习作业77线性回归分析与统计案例_第1页
高考数学(理)一轮总复习作业77线性回归分析与统计案例_第2页
高考数学(理)一轮总复习作业77线性回归分析与统计案例_第3页
高考数学(理)一轮总复习作业77线性回归分析与统计案例_第4页
高考数学(理)一轮总复习作业77线性回归分析与统计案例_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题组层级快练(七十七)

1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法

分别求得相关系数1•如卜表:

甲乙丙T

r-0.82-0.78-0.69-0.85

则哪位同学的试验结果体现A,B两变量有更强的线性相关性()

A.甲B.乙

C.丙D.T

答案D

2.(2018・湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广

告费x和销售额y进行统计,得到统计数据如下表(单位:万元):

广告费X23456

销售额y2941505971

由上表可得回归方程为Q=10.2X+;据此模型,

预测广告费为10万元时销售额约为()

A.101.2万元B.108.8万元

C.111.2万元D.118.2万元

答案C

解析根据统计数据表,可得3=JX(2+3+4+5+6)=4,亍=?X(29+41+50+59+71)

=50,而回归直线f=10.2x+£经过样本点的中心(4,50),.\50=10.2X4+a,解得£=9.2,

,回归方程为C=10.2x+9.2,・••当x=IO时,y=10.2X10+9.2=lll.2,故选C.

3.(2018・赣州一模)以下四个命题:

①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,

这样的抽样是分层抽样;

②两个随机变量相关性越强,则相关系数的绝对值越接近于1;

③在回归直线方程:=0.2x+12中,当解释变量x每增加1个单位时,预报变量平均增加0.2

个单位;

④分类变量X与Y,对它们的随机变量K?的观测值k来说,k越小,“X与Y有关系”的

把握程度越大.

其中真命题为()

A.①④B.②©

C.①③D.②③

答案D

解析①为系统抽样;④分类变量X与丫,对它们的随机变量K?的观测值k来说,k越大,

“X与丫有关系”的把握程度越大.

4.下面是一个2X2列联表

yiY2总计

X1a2173

X2222547

合计b46120

其中a,b处填的值分别为()

A.9472B.5250

C.5274D.7452

答案C

解析由a+21=73,得a=52,a+22=b,得b=74.故选C.

5.(2018・湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试

验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:

甲乙丙T

r0.820.780.690.85

m106115124103

则哪位同学的试验结果体现A,B两变量有更强的线性相关性()

A.甲B.乙

C.丙D.T

答案D

解析r越大,m越小,线性相关性越强.故选D.

6.(2018.衡水中学调研)以下四个命题中,真命题是()

A.对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把

握程度越大

B.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0

C.若数据X1,X2,X3,…,Xn的方差为1,则2X1,2X2,2X3,…,2Xn的方差为2

D.在|口1归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果

越好

答案D

解析对于A,对分类变量x与y的随机变量K?的观测值k来说,k越大,判断“x与y

有关系”的把握程度越大,故A错误;对于B,两个随机变量的线性相关性越强,相关系

数的绝对值越接近于1,故B错误;对于C,若数据X|,X2,X3,…,Xn的方差为1,则2xi,

2X2,2X3,…,2xn的方差为4,故C错误:对于D,根据离散变量的线性相关及相关指数

的有关知识可知D正确.

7.2015年年度史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄姨传》.某记

者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄

在[10,14],[15,19],[20,24],[25,29][30,34]的爱看比例分别为10%,18%,20%,

30%,t%.现用这5个年龄段的中间值代表年龄段,如12代表[10,14],17代表[15,19],

根据前四个数据求得爱看比例y关于x的线性回归方程为y=(kx—4.68)%,由此可推测t的

值为()

A.33B.35

C.37D.39

答案B

解析依题意,x=:X(12+17+22+27)=19.5,

y=(x(IO%+18%+20%+30%)=19.5%,

又•・•回归直线必过点(x,y),A19.5%=(kX19.5-4.68)%,解得k=:/,・•.当x=32时,

(I端又32—4.68)%=35%,At^35.

8.(2018•广西南宁月考)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了

如下列联表:

偏爱蔬菜偏爱肉类合计

50岁以下4812

50岁以上16218

合计201030

则可以说其亲属的饮食习惯与年龄有关的把握为()

n(ad—be)2

附:K2=

(a+b)(c+d)(a+c)(b+d),

P(K2^ko)0.150.100.050.0250.0100.0050.001

ko2.0722.7063.8415.0246.6357.87910.828

A.90%B.95%

C.99%D.999%

答案C

解析由2X2列联表知,K?=3°:':=10.•・•K>6.635,K2<10.828,・•.有

1ZA1oAZUA1U

99%的把握认为其亲属的次食习惯与年龄有关.

9.2017世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽

的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解

“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:

赞成“自助游”不赞成“自助游”合计

男性301545

女性451055

合计7525100

参照公式,得到的正确结论是()

A.有99.5%以上的把握认为“赞成'自助游'与性别无关”

B.有99.5%以上的把握认为“赞成'自助游'与性别有关”

C.在犯错误的概率不超过0.1的前提下,认为“赞成'自助游'与性别无关”

D.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游'与性别有关”

,…八0。n(ad-be)2....

参jz、式:K=丁+/丁+这(a+c)(b+d)'其中n=a+b+c+d.

P(K2>ko)0.150.100.050.0250.0100.0050.001

ko2.0722.7063.8415.0246.6357.87910.828

答案D

解析将2X2列联表中的数据代入计算,得胡」。。“15)工3.030,•/

43AjjA/JAZD

2.706V3.030V3.841,・••在犯错误的概率不超过0.1的前提下,可以认为“赞成‘自助游’与

性别有关”.

10.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:

X681012

y2356

则y对x的线性回归直线方程为()

A.y=2.3x—0.7B.y=2.3x+0.7

C.y=0.7x-2.3D.y=0.7x+2.3

n

AX.Xiyi-nx-yAA

(相关公式:b=---------,a=y-bx)

Xxi2-nx2

1=1

答案c

3,6+8+10+122+34-54-6

解析V.S1xiyi=6X2+8X3+10X5+12X6=158,x=------------=9,y=----------=

4.

A158-4X9X4A

'b=36+64+100+144-4X81=07a=4-0.7X9=-2.3.

故线性回归直线方程为Q=0.7X-2.3.

11.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线

性相关关系)

学生的编号i12345

数学成绩X8075706560

物理成绩y7066686462

现已知其线性回归方程为;=0.36x+a,则根据此线性回归方程估计数学得90分的同学的

物理成绩为(四舍五入到整数).

答案73

_60+65+70+75+80-62+64+66+68+70

解析x=--------------------------=70,y=-------------3------------=66,

所以66=0.36X70+1,静得£=40.8.

所以0.36X90+40.8=73.2273.

12.某工厂为了对一种新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,

得到如下数据:

单价x(元)456789

销量y(件)908483807568

由表中数据,求得线性回归方程为f=-4x+i若在这此样本点中任取一点,则它在回归直

线左下方的概率为.

答案1

解析由表中数据得x=6.5,y=80,由y=—4x+a,得2=106,故线性回归方程为y=一

4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程,可知

有6个基本事件,因84〈一4X5+106=86,68<-4X9+106=70,故(5,84)和(9,68)在直

21

线的左下方,满足条件的只有2个,故所求概率为后=小

13.已知某学校的特长班有50名学生,其中有体育生20名,艺术生30名,在学校组织的

一次体检中,该班所有学生进行了心率测试,心率全部介于50次/分到75次/分之间,现将

数据分成五组,第一组[50,55),第二组[55,60),第五组[70,75],按上述分组方法得

到的频率分布直方图如图所示.因为学习专业的原因,体育生常年进行系统的身体锻炼,艺

术生则很少进行系统的身体锻炼,若前两组的学生中体育生有8名.

(I)根据频率分布直方图及题设数据完成下列2义2列联表.

心率小于60次/分心率不小于60次/分合计

体育生20

艺术生30

合计50

⑵根据(1)中表格数据计算可知,(填“有”或“没有”99.5%的把握认为“心率小

于60次/分与常年进行系统的身体锻炼有关”.

,n(ad—be)2....

附:胴==+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.

P(K2>ko)0.150.100.050.0250.0100.0050.001

ko2.0722.7063.8415.0246.6357.87910.828

答案(1)见解析(2)有关

解析(1)根据频率分布直方图可知,前两组的学生总数为(0.032+0.08)X5X50=1(),又前

两组的学生中体育生有8名,所以前两组的学生中艺术生有2名,故2X2列联表如下:

心率小于60次/分心率不小于60次/分合计

体育生81220

艺术生22830

合计104050

5()X(XX-7X17)2

2;

(2)由(1)中数据知,K=-on乂2nxm/『a-七8.333>7.879,故有99.5%的把握认为“心

率小于&)次/分与常年进行系统的身体能炼有关”.

14.(2018•山东日照一模)某学校高三年级有学生500人,其中男生300人,女生200人.为

了研究学生的数学成绩是否与性别有关,现采用分层抽样的方法,从中抽取了100名学生,

先统计了他们期中考试的数学分数,然后按性别分为男、女两组,再将两组学生的分数分成

5组:[100,110),[110,120),[120,130),[130,140),[140,150]分别加以统计,得到如

图所示的频率分布直方图.

(I)从样本中分数低于110分的学生中随机抽取两人,求这两人恰好为一男一女的概率;

(2)若规定分数不低于130分的学生为“数学尖子生”,请你根据已知条件完成2X2列联表,

并判断是否有90%的把握认为“数学尖子生与性别有关”.

n(ad-be)2

(a+b)(c+d)(a+c)(b+d)

2

P(K>k0)0.100.050.0100.0050.001

k。2.7063.8416.6357.87910,828

3

案\-Q

75

解析(1)由已知得,抽取的100名学生中,男生6。名,女生40名.

分数低于110分的学生中,男生有60X0.05=3(人),记为Ai,A2,A3;女生有40X005=

2(人),记为Bi,B2.

从中随机抽取两名学生,所有的可能结果共有10种,它们是(Ai,A2),(AI,A3),(A2,A3),

(AI,Bi),(Ai,B»,(A2,Bi),(A2,Bz),(A3,Bi),(A3,Bz)(Bi,B2);

其中两名学生恰好为一男一女的可能结果共有6种,它们是(Ai,Bi),(AHB2),(A2,B,),

(A2,B:),(A3,Bi),(As,B2).

63

---

...所求概率为p=5

10

(2)由频率分布直方图可知,在抽取的100名学生中,分数不低于130分的男生人数为60X0.25

=15,分数不低于130分的女生人数为40X0.4=16,据此可得2X2列联表如下:

数学尖子生非数学尖子生合计

男生154560

女生162440

合计3169100

,100X(15X24-16X45)2

K-=60X40X31X69=2.525<2.706,

没有90%的把握认为“数学尖子生与性别有关”.

5(2017.四川广元二诊)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间

的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天

每100颗种子中的发芽数,得到如下资料:

日期12月1日12月2日12月3日12月4日12月5日

温差x(℃)101113128

发芽数y(颗)2325302616

该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方

程,再对被选取的2组数据进行检验.

⑴求选取的2组数据恰好是不相邻两天数据的概率;

(2)若选取的是12月1日与12月5日的数据.请根据12月2日至12月4日的数据.求Hly

关于x的线性回归方程QJx+2

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗.则认为得

到的线性回归方程是可靠的.试问(2)中所得到的线性回归方程是可靠的吗?

附:回归直线的斜率和截距的最小二乘估计公式分别为:

W(弋一,)(y_y)a_

b=--------------------------,a=y-bjr.

2(若一下)2

•-I

3A5

答案(1月(2)y=,x—3(3)可靠

解析(1)设“选取的2组数据恰好是不相邻两天的数据”为事件A.

从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,

4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数.

每种情况都是等可能出现的,事件A包括的基本事件有6种.

•••P(A)d=|.

选取的2组数据恰好是不相邻两天数据的概率是会

।迎3r2一U+13+12-25+30+26

(2)由数据可得x==12,y=---------=27.

人(11—12)义(25—27)+(13—12)义(30—27)+(12—12)X(26—27)5

b=(11-12)2+(13-12)2+(12-12)2=T

A—A—S

a=y-bx=27—5义12=—3.

A5

Ay关于x的线性回归方程为y=0-3.

A5

(3)当x=10时,y=,X10—3=22,|22—231V2:

A5

同理,当x=8时,y=;X8-3=17,|17-16|<2.

・•・⑵中所得到的线性回归方程是可靠的.

16.(2018.河北唐山模拟)某市春节期间7家超市的广告究支出Xi(万元)和销色额yi(万元)数

据如下:

超市ABCDEFG

广告费支出Xi1246II1319

销售额yi19324044525354

(1)若用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;

⑵用二次函数回归模型拟合y与x的关系,可得回归方程:yA=-O.I7x2+5x+2O,经计

算二次函数同归模型和线件同归模型的R?分别约为0.92和0.75,请用R?说明选择吼个问

归模型更合适,并用此模型预测A超市广告费支出3万元时的销售额.

n___

_77■人.^Xiyi-nxyAA

参考数据及公式:x=8,y=42,.Exiyi=2794,.Exj2=708,b=—---------------,a=y—bx.

==

1IlJLSx)inx?

答案(1)Q=L7X+28.4⑵33.47

2794-7X8X42

解析-------------------------=I7a=y-bx=42-1.7X8=28.4.

(1)b=708-7X82

Ay关于x的线性回归方程是Q=1.7X+28.4.

⑵・・・0.75v0.92,・••二次函数回归模型更合适.

当x=3万元时,y=-0.17X9+5X3+20=33.47,预测A超市销售额为33.47万元.

|备选题|

1.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的

斜率是b,纵截距是a,那么必有()

A.b与r的符号相同B.a与r的符号相同

C.b与r的符号相反D.a与r的符号相反

答案A

2.下列说法:

①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;

②设有一个回归方程Q=3-5X,变量x增加一个单位时,y平均增加5个单位;

③回归直线y=bx+a必过点(x,y);

④在一个2X2列联表中,由计算得K2的观测值k=13.079,则在犯错误的概率不超过0.001

的前提下认为这两个变量间有关系.其中错误的个数是()

A.0B.1

C.2D.3

本题可以参考独立性检验隘界值表:

P(K2^k)0.50.400.250.150.100.050.0250.0100.0050.001

k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

答案B

解析只有②错误,应该是y平均减少5个单位.

3.(2018・湖南衡阳模拟)根据“2015年国民经济和社会发展统计公报”中公布的数据,从

2011年到20到年,我国的第三产业在GDP中的比重如下:

年份20112012201320142015

年份代码X12345

第三产业比重y/%44.345.546.948.150.5

⑴在所给坐标系中作出数据对应的散点图;

(2)建立第三产业在GDP口的比重y关于年份代码x的回归方程:

⑶按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重.

n

Z(Xj—x)(yj-y)

附:回归直线f=£+葭的斜率和截距的最小二乘估计分别为6二…;——:—―1a=

.E,(xj-x)2

1=1

A

y—bx.

答案⑴见解析(2)f=1.5x+42.56(3)54.56%

解析(1)数据对应的散点图如图所示.

50.7

OI2356

5

A£(Xi—x)(yi-y)15AA

(2)x=3,y=47.06,b=-----s---------------=行=1.5,a=y—bx=42,56,

X(Xi-x)21U

1=1

所以回归直线方程为S=l.5x+42.56.

(3)代入2018年的年份代码x=8,得,=1.5。8+42.56=54.56,

所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP中的比重将达到54.56%.

4.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如以下的统计数据:

x(年)23456

y(万元)2.23.85.56.57.0

已知£#=90,=110.8,t]必=112.3,779^

1212]

8.9,鼠1.4.

⑴求x,y;

(2)对x,y进行线性相关性检验;

⑶如果x与y具有线性相关关系,求出回归直线方程;

(4)估计使用年限为10年时,维修费用约是多少?

答案⑴7=4,亍=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论