2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版)_第1页
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版)_第2页
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版)_第3页
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版)_第4页
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版)_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第27讲统计案例和回归方程

【知识点总结】

一、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。

对于一组具有线性相关关系的数据3,M),(X2J2),…,(X”,y“),其回归方程丫=嬴+”的求法为

__

Z(x,.—x)(M-y)2玉»-"xy

t)_M_____________

za2"-2

-X)%:-"X

i=\

-l=反i

a=y-

_«—1«--

其中,x=-tXi,y=-tyi,(x,y)称为样本点的中心。

步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,

直线斜率Q0,称两个变量正相关;k<0,称两个变量负相关。

—、孑或立性

独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。

n(ad-be)1

步骤为列出2x2列联表(如表13-8所示),求出K2=,并判断:

+h)(c+d)(a+c)(/?+d)

4A2合计

Biaca+c

bdb+d

B2

合计a+bc+dn=a+b+c+d

若群>10828,有99.9%把握称“A取4或4”对“B取&”有关系;

若10.8282心>6.635,有99%把握称“4取4或4”对“B取囱,毛”有关系;

若6.6352K2>3.841,有95%把握称“A取4或4”对"8取S,反”有关系;

若犬43.841,没有把握称A与B相关。

【典型例题】

例1.(2022・全国•高三专题练习(文))在对两个变量x,y进行回归分析时有下列步骤:

①对所求出的回归方程作出解释:②收集数据(而”),i=l,2,…,n;

③求回归方程;④根据所收集的数据绘制散点图.

则下列操作顺序正确的是()

A.①②④③B.③②④①C.②③①@D.②④③①

例2.(2022•全国•高三专题练习)对于数据组(%,y,)(i=l,2,3,如果由线性回归方程得到的对应于自变

量x,的估计值是力,那么将称为相应于点(x,,y)的残差.某工厂为研究某种产品产量x(吨)与所需

某种原材料V吨)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示:

X3456

y2.534in

根据表中数据,得出y关于x的线性回归方程为y=0.7x+a,据此计算出样本点处的残差为一0.15,则表中

的值为()

A.3.3B.4.5C.5D.5.5

例3.(2022•全国•高三专题练习)据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm之

间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局地超

过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为50%.通过模拟实验的方法来估计

该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数x(xeN,

且0WxW9)表示是否下雨:当xw[(U](kwZ)时表示该地区下雨,当xw伙+1,9]时,表示该地区不下雨.

因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:

332714740945593468491272073445

992772951431169332435027898719

(1)求出女的值,使得该地区每一天下雨的概率均为50%;并根据上述20组随机数估计该地区这3天中

恰好有2天下雨的概率;

(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:

时间2016年2017年2018年2019年2020年

年份f12345

降雨量)’2827252322

经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量丫与年份f具有线性相关关系,求

回归直线方程y=G+a.并预测该地区2022年端午节有降雨的话,降雨量约为多少?

参考公式:b=-;------;=-4-------»g=

Z”)沙-/

1=1»=1

例4.(2022•全国•高三专题练习(理))某企业新研发了一种产品,产品的成本由原料成本及非原料成本组

成.每件产品的非原料成本)(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:

X

为§,=96.54e"、,ln),与x的相关系数4=-0.94.

(1)用反比例函数模型求y关于*的回归方程;

(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0。1),并用其估计产量为10千件时每件

产品的非原料成本.

参考数据:

Xix88

Zxzw2

Uu2,0.61x6185.5e-

i=li=lf=lZ=l

183.40.340.1151.5336022385.561.40.135

参考公式:对于一组数据(4%),鱼,%),…,(%,匕),其回归直线0=6+血的斜率和截距的最小一乘估计分

-nu-v〉2%匕一“万•V

别为:方=号---------,a=v-pu,相关系数

-nu1

i=\

例5.(2022・全国•高三专题练习)如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万

元/平方米)的散点图.(图中月份代码1〜13分别对应2020年1月〜2021年1月).根据散点图选择),=。+匕&

和丫=。+"山》两个模型进行拟合,经过数据处理得到两个回归方程分别为'=0.9369+0.0285五和

y=0.9554+0.0306In%.并得到以下一些统计量的值:

当月在售二手房均价y

1.04-

1.02-•••••・・・

1.00-•*

0.98-•*

0.96-#

09412345678910111213月份代码x

y=0.9369+0.02856y=0.9554+0.0306Inx

残差平方和O.(XX)5910.00()164

总偏差平方和欧%一习2

0.006050

/=1

(1)请利用相关指数此判断哪个模型的拟合效果更好;

(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)

参考数据:In2=0.69,ln3®1.10,lnl7«2.83,lnl9«2.94,夜641,百21.73,717»4.12,719»4.36.

-y,)'

参考公式:相关指数R2=l-「二

2(%-万

1=1

例6.(2022・全国•高三专题练习)近年来,明代著名医药学家李时珍故乡黄冈市新春县大力发展大健康产业,

新艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知新艾的株高y(单位:cm)与一定范围内的温度

x(单位:℃)有关,现收集了薪艾的13组观测数据,得到如下的散点图:

现根据散点图利用),=。+6炭或y=c+4建立y关于x的回归方程,令s=«,/=,得到如下数据:

XX

Xy5

10.15109.943.040.16

13%13产院73了

£/,.x-i3r-y13T

J=li=lk=l1=1J=1

13.94-2.111.670.2121.22

且(S,,必)与《,y,)(i=l,2,3,…,13)的相关系数分别为4,矶且4=-0.9953.

(1)用相关系数说明哪种模型建立y与x的回归方程更合适;

(2)根据(1)的结果及表中数据,建立y关于x的回归方程;

(3)已知斯艾的利润z与x、y的关系为z=20y-;x,当x为何值时,z的预报值最大.

参考数据和公式:0.21x21.22=4.4562,11.67x21.22=247.6374,参47.6374=15.7365,对于一组数据(〃,,4)(i

匕-nuv

=1,2,3,〃),其回归直线方程u",的斜率和截距的最小二乘法估计分别为夕=9-------

十。-2

2A

-nuv

a=v-13u,相关系数二i=l

例7.(2022・河北张家口•高三期末)已知某区A、8两所初级中学的初一年级在校学生人数之比为9:11,该

区教育局为了解双减政策的落实情况,用分层抽样的方法在A、8两校初一年级在校学生中共抽取了100名

学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:

(1)在抽取的100名学生中,A、8两所学校各抽取的人数是多少?

(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作

业时长超过3小时的学生比例,请根据频率分布直方图,估计这两个数值;

(3)另据调查,这100人中做作业时间超过3小时的人中的20人来自A中学,根据已知条件填写下面列联

表,并根据列联表判断是否有99%的把握认为“做作业时间超过3小时”与“学校”有关?

做作业时间超过3小时做作业时间不超过3小时合计

A校

B校

合计

附表:

P(K2>k)0.100.050.0250.0100.001

k2.7063.8415.0246.63510.828

n^ad-bcY

(〃+6)(c+d)(a+c)(b+d)

【技能提升训练】

一、单选题

i.(2022•全国•高三专题练习)某工厂的每月各项开支x与毛利润y(单位:万元)之间有如下关系,y与x

的线性回归方程y=6.5x+a,则”=()

X24568

y3040605070

A.17.5B.17C.15D.15.5

2.(2021•重庆南开中学高三阶段练习)对两个变量y和x进行回归分析,得到一组样本数据:(%,%),

(x2,y2)....则下列说法中不正确的是()

A.由样本数据得到的回归方程y=bx+a必过样本中心(x,y)

B.残差平方和越小的模型,拟合的效果越好

C.用相关指数R?来刻画回归效果,R越小,说明模型的拟合效果越好

D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系

3.(2021.黑龙江.漠河市高级中学高三阶段练习(文))某单位为了了解办公楼用电量)(度)与气温x(°C)

之间的关系,随机统计了四个工作量与当天平均气温,并制作了对照表:

气温(℃)181310-1

用电量(度)24343864

由表中数据得到线性回归方程y=-2x+“,当气温为时:预测用电量均为

A.68度B.52度C.12度D.28度

4.(2022.全国•高三专题练习)关于线性回归的描述,有下列命题:

①回归直线一定经过样本中心点;

②相关系数,•的绝对值越大,拟合效果越好;

③相关指数R2越接近1拟合效果越好:

④残差平方和越小,拟合效果越好.

其中正确的命题个数为()

A.1B.2C.3D.4

5.(2022•全国•高三专题练习)下列表述中,正确的个数是()

①将一组数据中的每一个数据都加上同一个常数后,方差不变;

②设有一个回归方程y=3-5x,变量*增加1个单位时,,平均增加5个单位;

③设具有相关关系的两个变量x,y的相关系数为,那么卜|越接近于o,x,y之间的线性相关程度越高;

④在一个2x2列联表中,根据表中数据计算得到K2的观测值3若k的值越大,则认为两个变量间有关的

把握就越大.

A.0B.1C.2D.3

6.(2022♦全国•高三专题练习(文))对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系

数,如下,其中拟合效果最好的模型是()

A.0.2B.0.8C.-0.98D.-0.7

7.(2022・全国•高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是

()

-yb

35

30

25L•••

20

15

105

5•••

o...一

05101520253035X101520253035X

相关系数为八相关系数为「2

/V

35

30

25

20

15

10

5

O

5101520253035X5101520253035rjr

相关系数为「3相关系数为7

A.4<4<0<4<4B.r4<r2<0<7;<勺

C.〃<4<0<4<4D.r2<r4<0<rt<r,

8.(2022・全国•高三专题练习(理))如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上,

则下列说法错误的是()

A.解释变量和预报变量是一次函数关系B.相关系数r=l

C.相关指数R2=lD.残差平方和为0

9.(2022♦全国•高三专题练习(理))对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比

较,正确的是()

A.4<〃<0<勺<弓B.〃<q<O<G<G

C.r4<r2<0<r3<r]D.r2<r4<0<r]<r3

10.(2022♦全国•高三专题练习(理))变量x,y的线性相关系数为耳,变量加〃的线性相关系数为0,下

列说法错误的是()

A.若㈤=0.96,则说明变量x,y之间线性相关性强

B.若4>4,则说明变量羽y之间的线性相关性比变量如“之间的线性相关性强

C.若0<弓<1,则说明变量x,y之间的相关性为正相关

D.若4=。,则说明变量x,y之间线性不相关

11.(2022・全国・高三专题练习(文))已知相关变量"”的散点图如图所示,若用》=4.11!(人力与'=5+4

拟合时的相关系数分别为《,4则比较小4的大小结果为()

A.rt>r2B.4=4C.r}<r2D.不确定

12.(2022・全国•高三专题练习(文))在一组样本数据(xi,yi),(X2,y2),…,(xn,yn)(n>2,xi,X2,...,xn

不全相等)的散点图中,若所有样本点(x“yi)(i=l,2,…,n)都在直线y=gx+l上,则这组样本数据的样本

相关系数为()

A.-1B.0C;D.1

2

13.(2022•全国•高三专题练习)如图,5个(x,y)数据,去掉。(3,10)后,下列说法错误的是()

•E(10,12)

0(3,10)

・C(4,5)

.*5(2,4)

A(l,3)

Ox

A.相关系数r变大B.残差平方和变大

C.R2变大D.解释变量尤与预报变量y的相关性变强

14.(2022・全国•高三专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数

据如下表:

第X天12345

使用人数(y)151734578421333

由表中数据可得y关于x的回归方程为m=55/+机,则据此回归模型相应于点(2,173)的残差为()

A.—5B.—6C.3D.2

15.(2022•全国•高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生

育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.

耳犬叫)0.0500.0100.001

k。3.8416.63510.828

下列结论正确的是()

A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”

B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”

C.有99%以上的把握认为“生育意愿与城市级别有关”

D.有99%以上的把握认为“生育意愿与城市级别无关”

16.(2022・全国•高三专题练习)2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市

入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”

是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:

赞成“自助游”不赞成“自助游”合计

男性301545

女性451055

合计7525100

n(ad-bc)2

参考公式:K;其中n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

网片工)0.150.100.050.0250.0100.0050.001

X02.0722.7063.8415.0246.6357.87910.828

参照公式,得到的正确结论是()

A.有99.5%以上的把握认为“赞成,自助游,与性别无关”

B.有99.5%以上的把握认为“赞成,自助游,与性别有关”

C.在犯错误的概率不超过的前提下,认为“赞成'自助游’与性别无关”

D.在犯错误的概率不超过0.1的前提下,认为“赞成'自助游’与性别有关“

17.(2022•全国•高三专题练习(文))为了了解某高中生对电视台某节目的态度,在某中学随机调查了110

名同学,得到如下列联表:

男女总计

喜欢402060

不喜欢203050

总计6050110

2

______〃(…〃)_______算得小=110(40x30-20x20)2

(a+6)(c+d)(a+c)(6+d)60x50x60x50'

P(K22k)0.050.010.001

k3.8416.63510.828

参照附表,得到的正确结论是()

A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”

B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”

C.有99%的把握认为“喜欢该节目与性别有关”

D.有99%的把握认为“喜欢该节目与性别无关”

18.(2022•全国•高三专题练习(文))为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生

作为样本,统计其喜欢的支付方式,并制作出如等高条形图:

9

8

7

6

5

4

3

2

1

根据图中的信息,下列结论中不正确的是()

A.样本中多数男生喜欢手机支付

B.样本中的女生数量少于男生数量

C.样本中多数女生喜欢现金支付

D.样本中喜欢现金支付的数量少于喜欢手机支付的数量

19.(2021•全国•高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、

女学生意愿的一份样本,制作出如下两个等高堆积条形图:

A.样本中的女生数量多于男生数量

B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量

C.样本中的男生偏爱两理一文

D.样本中的女生偏爱两文一理

二、多选题

20.(2021・山东聊城•三模)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样

本点数据a,yj(,=i,2,…则下列结论正确的是()

A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点

B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心门,亍)

C.若以模型》=四床拟合该组数据,为了求出回归方程,设z=lny,将其变换后得到线性方程z=6x+ln3,

则a,b的估计值分别是3和6.

支(%-力

D.用R2=1一•一~二来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直线

讣-司

;=|

上,则a的值为1

21.(2021•辽宁朝阳•一模)关于变量x、y的〃个样本点(x”x)、(*2,必)、…、(%,%)及其线性回归方程:

¥=米+机下列说法正确的有()

A.若相关系数「越小,则表示X、)的线性相关程度越弱

B.若线性回归方程中的则表示变量x、y正相关

C.若残差平方和越大,则表示线性回归方程拟合效果越好

—1"_]"______\

D.若彳=-2%,y=-£y,则点(x,y)一定在回归直线§=阮+%上

22.(2022♦江苏•高三专题练习)则下列说法正确的是()

A.在回归分析中,残差的平方和越小,模型的拟合效果越好;

B.在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;

C.若数据占,x2,x“的平均数为1,则2%,2々,…2x”的平均数为2;

D.对分类变量x与y的随机变量正的观测值上来说,出越小,判断“尤与》有关系”的把握越大.

23.(2022•全国•高三专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次

调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的女生喜欢抖音的人数占女生

人数|,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有()人

附表:

2

P(K>kn)0.0500.010

k3.8416.635

附:心——幽也——

(a+b)(c+d)(a+c)(i>+d)

A.25B.45C.60D.75

三、填空题

24.(2022•全国•高三专题练习)有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:

近视不近视总计

少看手机154560

多看手机15520

总计305080

则在犯错误的概率不超过的前提下认为近视与多看手机有关系.

附表:

P(K2>k)0.150.100.050.0100.0250.0050.001

k2.0722.7063.8415.0246.6357.87910.828

n\ad-hc)2

参考公式:K~=其中〃=a+b+c+d.

(a+6)(c+d)(a+c)(Z?+d)'

四、解答题

25.(2022・全国•高三专题练习(文))近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,

我市一家新能源企业近5个月的产值如下表:

月份5月6月7月8月9月

月份代码X12345

产值y亿元1620273037

(1)根据上表数据,计算V与x的线性相关系数人并说明V与x的线性相关性强弱;(Q75W6区1,则认

为y与元线性相关性很强;|r|<0.75,则认为y与X线性相关性不强)

(2)求出y关于X的线性回归方程,并预测10月该企业的产值.

//____

^x^-nxy^x^-nxy__

参考公式:'=受「二表,_25=&,H,")’-嬴;

V/-=1V,=1i=l

参考数据:Ex,.y,.=442,X-\2=55,£y,2=3654,V2740«52.3.

r=lf=li=l

26.(2021•江西•模拟预测(文))某科技公司研发了一项新产品A,经过市场调研,对公司1月份至6月份

销售量及销售单价进行统计,销售单价》(千元)和销售量y(千件)之间的一组数据如下表所示:

月份i123456

销售单价天99.51010.5118

销售量力111086515

(i)试根据i至5月份的数据,建立y关于x的回归直线方程;

(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.65千元,则认为所得到的回归直

线方程是理想的,试问(1)中所得到的回归直线方程是否理想?

Yx-Ji-n-x-y

参考公式:回归直线方程》=加+3其中刃=上匕----------

Y^-nx2

i=l

55

参考数据:2善%=392,gx:=502.5.

i=li=l

27.(2022•河南•温县第一高级中学高三阶段练习(理))身高体重指数(BMD的大小直接关系到人的健康

状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量

其身高、体重(数据如下表)并进行线性回归分析,得到线性回归方程为y=().9x-9(),因为某些原因,3

号学生的体重数据丢失.

学生编号12345

身高x/cm165170175170170

体重y/kg5862Z6563

(1)求表格中的Z值;

(2)已知公式丈=1-卷一~下可以用来刻画回归的效果,请问学生的体重差异约有百分之多少是由身

/=1

高引起的.(注:结果四舍五入取整数)

28.(2022.全国•高三专题练习)2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F遥十二运载

火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,

发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的

重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改

造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:

序号123456789101112

X2346810132122232425

y1522274048546068.56867.56665

当0<x417时,建立了y与尤的两个回归模型:模型①:》=4.1x+10.9,模型②:》=21.36-14.4;当x>17

时,确定y与x满足的线性回归方程为3=-O.7x+&.

(1)根据下列表格中的数据,比较当0<xW17时模型①,②的相关指数炉的大小,并选择拟合精度更高、

更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;

回归模型模型①模型②

回归方程y=4.1x+10.9y=2l.3^-14.4

£(%-订79.1320.2

»=1

(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预

测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收

益+国家补贴)的大小.

—y,)'

附:刻画回归效果的相关指数收=1-黑--------,且当代越大时,回归方程的拟合效果越好.J万Q4.1.

»=|

用最小二乘法求线性回归方程》=%+&的截距:a=y-bx.

29.(2021•河南•一模(文))近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植

高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的

数据,进行回归分析,得到两个回归摸型:模型①:y<l)=-1.65x+28.57,模型②:/与=变处,

对以上两个回归方程进行残差分析,得到下表:

种植面积X(亩)234579

每亩种植管理成本》

252421221614

(百元)

估计值

25.2723.6221.9717.0213.72

(1)

y

模型①

残差er-0.270.38-0.97-1.020.28

(2)

y26.8420.1718.8317.3116.46

模型②

(2)

6-1.840.833.17-1.31-2.46

(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;

(2)视残差号的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,

重新求回归方程.

附:---------,%=0.272+0.382+0.972+1.022+0.282=2.277

i=l

30.(2021•全国•模拟预测)婺源位于江西省东北部,其境内古村落遍布乡野,保存完整,生态优美,物产

丰富,拥有着油菜花之乡的美誉,被誉为一颗镶嵌在赣、浙、皖三省交界处的绿色明珠.为了调查某片实

验田3月份油菜花的生长高度,研究人员在当地随机抽取了13株油菜花进行高度测量,所得数据如下:

1=20.3,y=219.88,5=6.081i=0.32,£[-s)(y-夕)=55.76,-川y-y)=-8.4,

1=1/=1

22

£(.v;-5)=46.68,£(r,.-r)=0.84,S(y,「W=84.88.并通过绘制及观察散点图,选用两种模型进行

»=1'1=1'<=1'

拟合:

模型一:y=a+b>fx,其中令s=4;

模型二:y=c+—,其中令,=—.

xx

(1)求模型二的回归方程;

(2)试通过计算相关系数的大小,说明对于所给数据,哪一种模型更加合适.

参考数据:11.67x21.22=247.6374,0.21x21.22=4.4562,,247.6374=15.7365,>/44562«2.1110.

附:对于一组数据(4,匕),(卬匕),…,(",,#,3其回归方程;=£+/“的斜率和截距的最小二乘估计分别

_

-祖4-弓

相关系数,=-r=------;---------

31.(2021•陕西•西安中学高三阶段练习(文))我国为全面建设社会主义现代化国家,制定了从2021年到

2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该

企业为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二五”和“十

三五”规划发展期间近10年年研发资金投入额占和年盈利额%的数据.通过对比分析,建立了两个函数模型:

①y=a+网2;②丫:/,“,其中均为常数,e为自然对数的底数.令%=l”(i=1,2,…,10),经

计算得如下数据:

10.io.

之(玉-可-E(x-y)-

XyuV

i=l;=1

262156526805.36

10、1010io

2(%-江)(%一,)E(v,.-v)2

i=lf=li=l

112501302.612

(1)请从相关系数的角度,分析哪一个模型拟合程度更好;

(2)根据(1)的选择及表中数据,建立y关于x的回归方程(回归系数精确到0.01).

t(x,T5-刃

附:相关系数,=下幽-------

JSU-^E(x-y)2

V/'=1(=1

元)(y-,)

线性回归直线方程y=Kr+a,其中附:。=上―-----------,a=^-bx.

SU--^)2

i=l

32.(2021•四川•成都七中一模(文))某投资公司2012年至2021年每年的投资金额x(单位:万元)与年

利润增量y(单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,

建立了y关于X的两个回归模型;模型①:由最小二乘公式可求得y与X的线性回归方程:y=2.50x-2.50;

模型②:由图中样本点的分布,可以认为样本点集中在由线:y=的附近,对投资金额x做换元,令

10101010

t=inx,则y=b1+a,且有Z,尸22.00,Z%=230,t,y,=569.00,t;=50.92,

/=1/=11=1i=l

年利润增收?(万元)

45

4()

35

30

25

20

15:

10.•

5・

°1234567891011121314151617181920

投资金额。(万元)

(1)根据所给的统计量,求模型②中y关于犬的回归方程;

(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);

附:样本a,y・)(i=i,2,…的最小乘估计公式为方二上,----------,a=y-bT;参考数据:

2(—)2

i=l

ln2«0.6931,In5«1.6094.

33.(2021・云南师大附中高三阶段练习(文))近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.一

方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的

重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决

的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施用

量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施用

量为x(单位:公斤),粮食亩产量为y(单位:百公斤).

VI

10

8・•

6.

4..e

2;

~7)~2~4~~681012141618202224262830^

参考数据:

10101010io101010

口》Zx立ZjZz,

i=li=l1=11=1f=l1=1i=l/=!

65091.552.51478.630.5151546.5

表中4=In占,Z,=In=1,2,…,10).

(1)根据散点图判断,y=a+6与尸ex",哪一个适宜作为粮食亩产量V

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论