新教材苏教版选择性必修第二册91线性回归分析作业(一)_第1页
新教材苏教版选择性必修第二册91线性回归分析作业(一)_第2页
新教材苏教版选择性必修第二册91线性回归分析作业(一)_第3页
新教材苏教版选择性必修第二册91线性回归分析作业(一)_第4页
新教材苏教版选择性必修第二册91线性回归分析作业(一)_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第9章统计

9.1线性回归分析

变量的相关性

线性回归方程

基础过关练

题组一变量间的相关关系

1.有以下五组变量:

①某商品的销售价格与销售量;

②学生的学籍号与学生的数学成绩;

③坚持每天吃早餐的人数与患胃病的人数;

④气温与冷饮的销售量;

⑤电瓶车的质量和行驶每千米的耗电量.

其中两个变量具有正相关关系的是()

A.①③B.②④C.②⑤D.④⑤

2.(2021湖南郴州高一期末)在下列各散点图中,两个变量具有正相关关系的是()

3.下表给出了5组数据,选出4组数据使得x与y的线性相关程度最大,且保留第1组数据(-

5,-3),则在余下的4组数据中应去掉()

第,组12345

-

X]5-4-3-24

%-3-24-16

A.第2组数据B.第3组数据

C.第4组数据D.第5组数据

题组二相关系数

4.(2021陕西咸阳高二期末)在变量y与x的回归模型中,它们对应的相关系数r的值如下表,

其中拟合效果最好的模型是()

模型1234

r0.480.150.960.90

A.模型1B.模型2C.模型3D.模型4

5.在一组样本数据(局,/),(4,卜)一..,(乙,匕)(〃22,%,%,…,天不全相等)的散点图中,若所有样本点

(招匕)(六1,2,…,力都在直线尸-9+2上,则这组样本数据的样本相关系数r为()

1

3

6.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()

图1(相关系数rj

I仙相为

A.r,<rl<O<z^<r1B.rKz/O<rK“

C.r,<r,<O<r1<r1D.r2<r1<0<z1<z^

题组三线性回归方程及其应用

y

7.两个变量的散点图如图,y关于x的回归方程可能是()

A.y=1.22+1.321nx

B.y=2.31e'+0.25

C.y=-l.23A+L21

D.y=l.25尸0.42

8.(2021江苏常州高二期末)对某同学7次考试的数学成绩x和物理成绩y进行分析,下面是该

生7次考试的成绩(单位:分).

X888311792108100112

y949110896104101106

发现他的物理成绩y与数学成绩x是线性相关的,利用最小二乘法得到线性回归方程为

y=().5x+a,若该生的数学成绩达到130分,估计他的物理成绩是()

.5分分

.5分分

9.(2021江苏南京高二期末)自2010年以来,一、二、三线的房价均呈现不同程度的上升趋势,

以房养老、以房为聘的理念深入人心,使得各地房产中介公司的交易数额日益增加.现将/房

产中介公司2010—2019年4月份的售房情况统计如图所示,根据2010—2013年,2014—2016

年,2017—2019年的数据分别建立回归直线方程y二瓦户二电户二%户。3,则()

A.瓦>/?2>坛,。3>。2>。1B.匕2>瓦>83,。3>。2>。1

C.瓦>62>匕3,。3>。1>g2D.b2>bi>b3ta3>a1>a2

10.(2020山东日照实验中学高二下阶段性考试)若根据5名儿童的年龄/(岁)和体重gkg)的数

据用最小二乘法得到体重关于年龄的线性回归方程是y二2户18,已知这5名儿童的年龄分别是

3,5,2,6,4,则这5名儿童的平均体重是kg.?

11.(2021江苏南京师大附中高二期末)近年来,国家对西部发展出台了很多优惠政策,为了更有

效地促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量M吨)对价格

M万元/吨)和年利润W万元)的影响,有关部门对近五年此种材料的年产量和价格进行统计,统

计结果如下表,若y=5.5.

X12345

y8764C

(1)求表格中。的值;

⑵求y关于x的线性回归方程y=bx+a;

⑶若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z取

得最大值.

.n.

EXiyrrixy'

参考公式力韦i1------,a=y-bx.

Lx2-nx?2

t=ii

题组四非线性回归分析

12.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用回归模

型尸21gx进行拟合.在这个条件下,要使y增加2个单位则应该使x()

A.增加1个单位B.增加2个单位

C.增加到原来的2倍D.增加到原来的10倍

13.以模型片久口去拟合一组数据时,为了求出回归方程,设好Iny,将其变换后得到线性回归方

程z=0.2x+3,贝Uc,k的值分别是()

;0.62,0.310.2\0.6

14.(2021江西景德镇一中高二期末)某大型现代化农场在种植某种大棚有机无公害的蔬菜时,

为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,选

取了20间大棚(每间一亩)进行试点,将得到的各间大棚产量数据绘制成散点图如图所示.光照

时长为式单位:小时),大棚蔬菜产量为M单位:千斤/S'),记【尸Inx.

(1)根据散点图判断尸a+bx与尸c+d-Inx,哪一个适宜作为大棚蔬菜产量y关于光照时长x的

回归方程类型(给出判断即可,不必说明理由);

⑵根据⑴的判断结果及表中数据,建立y关于x的回归方程;(结果保留小数点后两位)

⑶根据实际种植情况,发现上述回归方程在光照时长位于6小时内拟合程度良好,利用(2)

中所求方程估计当光照时长为e?小时(自然对数的底。弋2.71828)时,大棚蔬菜亩产量为多少.

参考数据:

2020202020202020

.£无%工严工呼

1=11=1i=li=lc

290102.4|521870540.28157872|272.1

参考公式:£关于。的线性回归方程即〃十九中,

n__

■当即61疝・夕■_■_

l

m~~n———,n=p-m•a.

Eaj-na

j=i।

能力提升练

题组一线性回归方程及其应用

1.(2021湖南长沙高三月考*)已知两个变量具有线性相关关系,现通过最小二乘法求回归直

*一,n

线方程y二将已知数据代入公式缶2(匕-法厂蛾,计算后得到的代数式为3^+13^125/7-

i=i

2从3,使上述代数式取值最小的劣8的值即为回归方程的系数厕回归直线方程为()

A.=-xy+2B.=-x-y2

C.二xy+2D.=x~y2

2.(多选)(2021江苏镇江高三期中已知由样本数据点集合{(x“匕)|?三1,2,3,…,处,求得回归直

线方程为y=1.5户0.5,且后3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求

得回归直线/的斜率为1.2,则)

A.变量x与y具有正相关关系

B.去除后/的估计值增加速度变快

C.去除后与去除前均值无歹不变

D.去除后的回归方程为y=1.2Hl.4

3.(2020四川成都高二期末,*)某国企进行节能降耗技术改造,下面是该国企节能降耗技术改

造后连续五年的生产利润:

年号X12345

年生产利润y

0.70.811.11.4

(单位:千万元,)

预测第8年该国企的生产利润为()

.n.

ZXiVi-nxy559

参考公式及数据力------,a=y-bx,E^y-5xy=l.7

符氏铲0E

.88千万元.21千万元

.85千万元.34千万元

4.(2021江苏淮安马坝中学高二月考,*)FEV1(第一秒用力呼气容积)是肺功能的一个重要指标.

为了研究某地区1015岁男孩群体的FEV1与身高的关系,现从该地区4B、。三个社区

1015岁男孩中随机抽取600名进行FEV1与身高数据的相关分析.

⑴若4B、C三个社区10岁男孩人数比例为1:3:2,按分层随机抽样进行抽取,请求出

三个社区应抽取的男孩人数;

⑵经过数据处理后,得到该地区1015岁男孩身高武加与FEVly(L)对应的10组数据

(8M)(闫,2,…,10),并作出如图所示的散点图:

>/L

4.0

3.5・

3.0•,

2.5•,

2.0.***

1.5,

,01301351401451501551601651701752m

1010

经计算得:E(毛-力2、1320,£(匕-刃%3*二1525二2.464,(4匕)(六1,2,…,10)的相关系数个

i=li=l

0.987.

①请你利用所给公式与数据建立y关于x的线性回归方程,并估计身高160cm的男孩的FEV1

的预报值人;

②若①中回归模型误差的标准差为s,则该地区身高160cm的男孩的FEV1的实际值落在仇-

3s,%+3s)内的概率为99.74%.现已求得s=0.1,若该地区有两个身高160cm的12岁男孩"和A;

测得FEV1值分别为2.8L和2.3L,请结合概率统计知识对这两个男孩的FEV1指标作出一个合

理的推断与建议.

E(xj-x)(yry)■■"

附:样本3,匕)(六1,2,...,〃)的相关系数「「,其回归方程y=a+如的斜率和截距

Z(Xj-x)(yry)*___

的最小二乘法估计分别为b*4-------,a=y-bx,VTT0^10.5.

自5

5.(2021江苏南京高三月考,*)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成

分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用

简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(%,匕)(片1,2,…,20),其中%和匕

分别表示第,个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得

2020202020

E元二80,X匕=4000,E(x-x)2=80,X(y-y)2=8000,E(%-%)(y-y)=700.

i=li=li=li=lzi=l

⑴请用相关系数说明该组数据中y与>之间的关系可用线性回归模型进行拟合;

⑵求y关于x的线性回归方程;

⑶某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价

80万元,下表是以往两款垃圾处理机器的使用年限(整年)统计表:

使用年限台数款式1年2年3年4年总计

甲款520151050

乙款152010550

根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器

的成本和每台机器的使用年限(使用年限均为整年).某县城环保机构若考虑购买其中一款垃圾

处理器,以使用年限的频率估计概率,该机构选择购买哪一款垃圾处理机器更划算?

参考公式湘关系数产‘:,

对于一组具有线性相关关系的数据(打匕)(六1,2,…其回归方程y二b户Q的斜率和截距的最小

£(x;-x)(y;-y)*

二乘估计分别为b士喋——ta=y-bx.

E52

题组二非线性回归分析及其应用

6.(2021江苏扬州中学高三月考,*)某企业新研发了一种产品,产品的成本由原料成本及非原

料成本组成.每批产品的非原料总成本武元)与生产该产品的数量M千件)有美,经统计得到如

下数据:

件1234567

〃元611213466101196

根据以上数据,绘制如图所示的散点图.

观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型片介况nx和指数函数模型

齐。・d分别对两个变量的关系进行拟合.

⑴根据散点图判断,尸”blnx与尸。-均为大于零的常数)哪一个适宜作为非原料总成

本y关于生产该产品的数量矛的回归方程类型;(给出判断即可,不必说明理出)

⑵根据⑴的判断结果及表中的数据,建立y关于x的回归方程;

⑶已知每件产品的原料成本为10元,若该产品的总成本不得高于元,请估计最多能生产多少千

件产品.

参考数据:

777

210"向

XVEx£Xi、£x,匕

y£=1i=l

462.141.54140253550.123.47

其中匕二IgK力弓匕.

/i=l

参考公式:对于一组数据(必,匕),(必,味…,(4,匕),其回归直线的斜率和截距的最小二乘

.n、

.£UiVrnuv"

估计分别为/?-平------,a=V-^U.

£u^-nu?2

i=l1

第9章统计

9.1线性回归分析

变量的相关性

线性回归方程

基础过关练

1.D①销售价格越高,销售量通常会越低,所以不是正相关关系;②学生的数学成绩与学籍号

无关;③医学证明不吃早餐的人容易患胃病,因此吃早餐的人数和患胃病的人数之间是负相关

关系;④气温越高,冷饮销量越高,是正相关关系;⑤电瓶车的质量越大,行驶每千米的耗电量越

大,所以是正相关关系.故选D.

2.B四个选项中只有选项B中总体上变量y随着x的增大而增大,因此只有B中具有正相关

关系,故选B.

3.B画出散点图如图所示,应去掉第3组数据(-3,4),故选B.

4.C在线性回归分析中,相关系数为r,|r|越接近于1y与x相关程度越强;|r|越接近于0,y

与x相关程度越弱.・・・10.961〉10.901>10.481>10.151,1模型3的拟合效果最好,故选C.

5.A因为回归直线方程是尸力户2,所以这两个变量是负相关,故这组样本数据的样本相关系

数为负值,又所有样本点(天,匕)(/=1,2,…㈤都在直线上,所以|川二1,所以相关系数尸-1,故选A.

6.A由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2

和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以

I"接近于1,匕I接近于-1,由此可得i;<r1<0<^<rl.故选A.

7.D因为散点图由左下方向右上方成带状分布,所以回归方程是线性的,且线性回归方程斜率

为正数,故排除A,B,C,由于散点图的带状区域经过y轴的负半轴,故线性回归方程的截距为负数,

故选D.

8.B由题意可知

--88+83+117+92+108+100+112

--94+91+108+96+104+101+106.

因为回归直线经过样本点的中心,所以100=0.5X100+%解得产50,故线性回归方程为

产。5矛+50,当产130时,片0.5X130+50=115.故选B.

9.A回归直线分布在散点图附近,b表示回归系数,a表示回归直线在y轴上的截距.由题图可

知,20102)13年,y随x的增加而迅速增加,20142)16年,y随x的增加而平缓增加,20172)19

年,/随x的增加而减少,故与泡泡

10.答案26

解析由题意得〜2±|业二4,

由于回归直线过样本点的中心(焉力,所以尸2A18=2X4+18=26,

故这5名儿童的平均体重是26kg.

11.解析(1方[(8+7+6+4+。)=5.5,解得c=2.5.

(2)7Sx,y,=S+14+18+16+12.5=68.5,

1=1

Lf=l2+22+32+42+52=55,

f=l

——142+3+4+5—Q——二二

%----5----J,yT・2

As_

Xty,5

•.-^i^_68.5-5X3X5.5__iA

5__255^9匕L

蒿x15x

a=y~bx=5.5-(-l.4)X3-9.7,

・•沙关于x的线性回归方程为尸T.4x+9.7.

(3)年利润2=(-1.4A+9.7-2)A=-1,4A7.lx,

・・・当尸-4二2.75时,年利润z取得最大值.

故当年产量为2.75吨时,年利润z取得最大值.

12.D设y的增加量为△产必-九x的增加量为△尸4-岛故可得△尸21gx2-21gX]=21g/2,解得

金10,故要使得y增加2个单位,x应增加到原来的10倍,,

v

13.C对尸ce"’两边同时取以e为底的对数可得In尸ln(ce")=Inc+lne"=Ax+lnc,因为z=lnyt

所以z=Rx+lnc,又^=0.2x+3,所以k=0.21nc=3,所以c=es.

14.信息提取①散点图的形状;②产In*和题表中的数据;③利用回归方程估计当光照时长为

蜡小时时大棚蔬菜的亩产量.

数学建模先以大型现代化农场在种植某种大棚有机无公害的蔬菜的散点图的形状确定函数

模型,然后通过呼Inx将非线性回归方程转化为线性回归方程,将与参考公式中的。进

行对应,利用公式求出c,d,最后回代求出y关于x的回归方程.

解析⑴根据题中散点图可知,开始的点在某条直线附近,但后面的点会越来越偏离这条直线,

因此片Inx更适宜作为回归方程.

2020

(2)因为jLlnx,所以片c+d・In产X%=甯二5.12,后噜写尹2.6,

,.272.120X5.12X2.6^0QZ?

d--137-20X2.6^—26,

c=5.12-3.26X2.6^-3.36,

所以7=3.26HL3.36,即尸3.261rl尸3.36.

(3)由⑵,知当年。2时尸3.261ne2-3.36=3.16.

故估计当光照时长为了小时时,大棚蔬菜亩产量为3.16千斤.

方法总结

建立非线性回归方程的步骤:(1)选取合适的函数进行拟合;⑵通过换元将非线性回归方程模型

转化为线性回归模型;(3)找好换元后的字母与参考公式中字母的对应关系,代入公式求出线性

回归方程中的参数;(4)消去新元,得到非线性回归方程.

能力提升练

1.D3才+13b2+123Zr2Z7+3=3(K2,+(Zrl)2+2,当{煞?j01即{:=丁时,上式取值最小,故丫二尸2.

2.ACD关于x的线性回归方程为产1.5x+0.5,回归系数1.5>0,;・变量x与y具有正相关

关系,故A正确;去除两个数据点后重新求得回归直线1的斜率为1.2,由1.2<1.5,可知去除后

y的估计值增加速度变慢,故B错误;去除前的均值钎3,去除的两个数据点的横坐标的平均数为

3,则去除后与去除前均值1不变,由线性回归直线恒过样本点的中心,可得去除前满足

y=L57+0.5=1.5X3+0.5=5,而去除的两个数据点的纵坐标的平均数为5,则去除后与去除前均

值歹不变,故C正确;设去除后的线性回归方程为尸1.2户瓦把去除后样本点的中心(3,5)代入

尸L2户儿得5=1.2义3+儿・••尸1.4,・••去除后的线性回归方程为尸1.2户1.4,故D正确.故选ACD.

3.C由题可得1】+2+”+5二3♦7+。-8+;+L1+L4=1,

所以b喘二0.17,a二歹-成=1-0.17X3=0.49,

所以年生产利润关于年号的线性回归方程为尸0.17/0.49,

当48时,y=0.17X8+0.49=1.85,故选C.

4.解析⑴力社区抽取600X^100(人),

夕社区抽取600><卜300(人),

。社区抽取600X,200(人).

22

⑵①对比方与厂的公式,可得一lz(xrx)lz(yry)

2t=1

£(xrx)J/=〔

刃2

*、

二恁二r-0.987=o047

旧历2E52X10.55•

a=2.464-0.047X152=-4.68,

・••所求的线性回归方程为y=0.047『4.68.

当产160时,预报值入=0.047X160-4.68=2.84.

②;5-0.1,.\y0-35-2.84—3X0.1=2.54,%+3/2.84+3X0.1=3.14.

即该地区身高160cm的男孩的FEV1的实际值落在区间(2.54,3.14)内的概率为99.74%,

即该地区身高160cm的男孩的FEV1值不在这个区间内的概率极小,仅有0.26%,"的FEV1值落

在这个区间内,我们推断他的FEV1是正常的,

N的FEV1值低于该区间的下限,我们推断他的FEV1是不正常的,建议他去找一下不正常的原

因,并进行调理.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论