版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章8.2一元线性回归模型及其应用
8.2.1一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估
计
A级必备知识基础练
1.[探究点一・2023陕西汉中模拟]如图所示,已如两个线性相关的变量才,y的统计数据如下:
X61012
V6532
其经验回归方程为y=a^l0.3,则a=()
A.-0.7B.0.7C.~0.5D.-2
2.[探究点二]红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观测
数据,用4种模型分别进行拟合.由此得到相应的经验回归方程并进行残差分析,进一步得到如图4
幅残差图,根据残差图,拟合效果最好的模型是()
】00卜建彦--------------------------------
50---------------------------------------------
-50……L3…_4…工./…Z_二号
-100L...................-.................................-.....................
模型一的残差图
100+残姜--------------------------------
50-----------------------------9------r......------------
-58....^―1—3--号
-100L------------------------------------------------------
模型二的残差图
卜残差
50■
-50'-L-[…工_?一扇号
L
-100模型V的残差图
残差
100
50
0
-50
-100
模型四的残差图
A.模型一B.模型二C.模型三D.模型四
2[探究点一]关于残差图的描述错误的是()
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或响应变量
C.残差分布的带状区域的宽度越窄〃越小
D.残差分布的带状区域的宽度越窄残差平方和越小
4.[探究点三-2023山东滨州模拟]下列结论正确的是.
①对两个变量X、y进行回归分析,若所有样本点都在直线y=-2^1上,则;
②对两个变量X,y进行回归分析,以模型y=ce*r去拟合一组数据时,为了求出经验回归方程,设z=ln
y,将其变换后得到经验回归方程zR.3*4,则c,左的值分别是e‘和0.3;
③某人投篮一次命中的概率为某次练习他进行了20次投篮,每次投篮命中与否互相之间没有影响,
设本次练习他投篮命中的次数为随机变量尤则当尸(X4)JR,1,2,3,…,20)取得最大值时:百;
④已如(1-2*)x七夫••依人则/六••+7田=-14.
5.[探究点一]某工厂为了X寸新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,
得到如下数据:
单价X/7E88.28.48.68.89
销量〃(牛908483807568
(1)已知y与x线性相关,求销量y关于单价x的经验回归方程y=bx也,其中b=-20,a=y-bx;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/牛,为使工厂
获得最大利润,该产品的单价应定为多少元?(利润啕售收入-成本)
6.[探究点二]在一段时间内,某网店一种商品的销售价格x(单位:元)和口销存量y(单位:件)之间
的一组数据如下表:
价格x阮2220181614
日销售量“1牛3741435056
求出y关于x的经验回归方程,并用*说明拟合效果.
参考数据:ZXiyi=^992,Exf-1660.
,Zj(xj-x)(yry)
参考公式:b=
国M国收2
B级关犍能力提升练
7.研究表明蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:°C)存在着较强的线性相关关系.
某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程yK.27x七则下列说法不正确
的是()
〃(次数吩钟)203()405()60
“C2527.52932.536
Ak的值是19.2
B.变量x,y正相关
C.若x的值增加1,则y的值约增加0.27
D.当蟋蟀以52次/分钟的频率鸣叫时,该地当时的气温预测值为33.5℃
8.(多选题)下列说法正确的是()
A.经验回归直线一定经过点(无刃
B.若两个具有线性相关关系的变量的相关程度越强,则样本相关系数r的值越接近于1
C.在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,决定系数川越接近于1,说明回归模型的拟合效果越好
9.已知蝗虫的产卵量y与温度*的关系可以用模型片加。2》拟合,设z=Iny,其变换后得到一组数据:
X2023252730
Z22.4334.6
由上表可得经验回归方程z=0.2x七,则°尸()
A.-2B./C.3D.e3
10.某品牌服装专卖店为了解保暖衬衣的销售量y(单位:件)与平均气温x(单位:°C)之间的关系,随
机统计了连续四旬的销售量与当旬平:均气温,其数据如下表:
时间二月上旬二月中旬二月下旬三月上旬
旬平均气温x/C381217
旬销售量〃1牛55m3324
由表中数据算出经验回归方程y=b"a中的b=-2,5=10,歹=38.
(1)表中数据勿-.
(2)气象部门预测三月中旬的平均气温约为22°C,据此估计,该品牌的保暖衬衣在三月中旬的销售
量约为件.
1L某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了四次试验,得到的数据
如下:
零件的个数X1245
加工的时间“小时2356
已知零件的个数x与加工的时间y具有线性相关关系.
⑴求出乎关于,的经验回归方程;(注:b=岩某。=歹-J
(2)试预测加工10个零件需要多少时间.
12.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高
峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄X23456
患病人数,2222171410
(1)已知y与x线性相关,求p关于x的经验回归方程;
(2)计算样本相关系数N计算结果精确到().01),并回答是否可以认为该幼儿园去年春季患流感人
数与年龄负相关很强.(若/r/£[0.75,1],则否y相关性很强;若[0.3,0.75),则x,尸相关性一
般;若/r/e[0,0.25],则x,y相关性较弱)
参考数据:病P5.477.
_n__n_
E(xrx)(y«-y)£x,y,-nxyX(xrx)(yy)
参考公式:b=3一?=气二样本相关系数r
13.某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原
料成本及非原料成本组成,每件产品的非原料成本y(单位:兀)与生产该产品的数显虫单位:千件)
有关,根据已经生产的统计数据,绘制了如图所示的散点图.观察散点图,两个变量不具有线性相关
关系,现考虑用函数y=a上对两个变量的关系进行拟合.参考数据如下(其中〃,二):
XXi
6666
-2
UUEujZ匕£UiYiVO.4834x5252.44
i=l11=1i=l
0.410.16811.49230620858.44173.850.39
(1)求y关于*的非线性经验回归方程,并求y关于〃的样本相关系数(精确到0.01).
(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该
产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为
70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本
为30元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元?请说明理由.
参考公式:对于一组数据(如幻,沁,嚓),…,(&%),其经验回归方程片a的斜率和截距的最
n
E
U(Ui-7lUVEUiVi-nuv
=lE
小二乘估计分别为/?22。=万一0五,相关系数Es
疝
U.一
1
=l
C级学科素养创新练
14.[2023辽宁鞍山模拟]某IT公司在1月份至6月份的5G经济收入近单位:百万元)关于月份x
的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份x123456
收入“佰万元6.68.616.121.633.041.0
收2佰万元
40L,
35.
30b
25
201.
.・
10卜.
5:..............................
0123456月份x
⑴根据散点图判断,y=ax,b与y=c6Q*,b,c,d均为常数)哪一个更适宜作为5G经济收入y美于月
份x的经验回归方程类型;(给出判断即可,不必说明理由)
⑵根据⑴中的结果及表中的数据,求出y关于x的经验回归方程,并预测该公司7月份的3G经济
收入;(结果保留小数点后两位)
(3)从前6个月的收入中抽取2个,记收入超过2000万元的个数为%求X的分布列和数学期望.
参考数据:
6
£(%。)②E(乂心)(y.「E(必我)(心一1.522.66
Xyui=li=lee
i=ly)u)
3.5021.152.8517.5125.356.734.5714.30
其中,〃二InytUi=\n2,3,4,5,6).
参考公式:对于一组具有线性相关关系的数据(M,匕)(片1,2,3,…,〃),其经验回归直线u=Bx也的
E(xi-x)(Vj-v)■
斜率和截距的最小二乘估计分别为/?=J———,a=v-px.
£(xx)2
1=1r
参考答案
8.2一元线性回归模型及其应用
8.2.1一元线性回归模型
8.2.2一元线性回归模型
参数的最小二乘估计
1.A由表格中数据可得5=6+8+:。+『,歹二誓上N,则Q=^=野=4).7.故选A.
2.D当残差比较均匀地落在水平的带状区域时,说明选用的模型比较合适,这样的带状区域的宽度
越窄,说明拟合效果越好,对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.
3.C残差分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时"的值越
大,故描述错误的是选项C.
4.②④对于①,对两个变量x,y进行回归分析,若所有样本点都在直线片-2户1上,则片-1,故①
错误;
3
对于②,由z~C.3x*4及z-lny,得丫飞"""飞’"e0-\故。飞:kQ3,故②正确;
对于③,依题意可知,lX(20,;),夕(六4)式/°(1T)”",假设P(X=k)最大,
P(X=k)>P(X=k-1),
P(X=k)NP(X=k+l),
仲G)/1弓)2o-仁啮i(9~(16)2a
'(哈G)k(l\)2。-仁啕1©197,
20!、c20!
----------->2,-----------------,
fc!(20-k)!-(k-l)!(21-k)!
整埋得c20!、20]
2,----------->-----------------,
kl(20-k)l(k+1)!(19-fc)!'
叱清强20*解得6WE
・・・/W)(Z),1,2,3,…,20)取得最大值时14或XT,故③错误;
对于④,由(1-2x)'=a^a\x+aix-(■•••+&•、1,两边对'x求导,得7(1-2工)'・(-2)=&+2包*痔&V+…+7田x:令
x=I,得14=切,2也"如故④正确.
5.解(1)因为文=-X(8用.2对.4母6母8为)4.5,歹=(90对4用3网0+75珀8)次(),
66
所以Q=y-bx=80^-20X8.5之5().所以经验回归方程为y=-2D>+250.
(2)设工厂获得的利润为〃单位:元),依题意得£=x(-20x+250)F(-20内250)=-20/+330xT000=-
20(x-^)Z^361.25.
当且仅当x片325时,L取得最大值.
4
故当单价定为8.25元时,工厂可获得最大利润.
6.解作出散点图(图略),观察敌点图可知这些点散布在一条直线的附近,故可知》与y线性相关.
ryn—22+20+18+16+1410
因为x=-------------=18,
—37+41+43+50+56
y=-------------
所以力=自二空二号丝巴
3992-5x18x45.4nn_
----------;2-=~Z.3D,
占(X田2高收21660-5X18
a^45.4-(-2.35)X18^87.7.
所以经验回归方程为y=-2.35"87.7.
y<-yi与y>亍的值如下表:
y>-y\i0.3-2.4-0.11.2
y1-y-8.4-4.4-2.44.610.6
5g
计算得£(月1)2£3,£(九歹)2X29.2,所以下=1《嘉~0.964.
i=li=lz
因为0.964很接近于1,所以该模型的拟合效果比较好.
7.D由题意,得元=(20,33Mo巧0卅0)NO,y=1x(25+27.5+29+32.5*36)WO,
则&=歹~0.27亍-30F.27X40=19.2,故A正确;
由经验回归方程可知,变量x,y呈正相关关系,故B正确;
若x的值增加1,则y的值约增加0.27,故C正确;
当产52时,y=Q.27X52*19.2=33.24,故D错误.
8.ACD对于A,经验回归直线一定经过点(元歹),故A正确;
对于B,由样本相关系数的绝对值越趋近于1,相关程度越强可知,若两个变量负线性相关,其线性相
关程度越强,则样本相关系数r的值越接近于T,故B错误;
对于C,因为在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高,故C正确;
对于D,因为在线性回归模型中,决定系数〃越接近于1,说明线性回归模型的拟合效果越好,故D正
确.
9.B由已知可得,工=工)<(20吆3也5吆740)-25,
5
z=^X(2+2.4+3+3尚.6)=3,
则Q3Y).2X25=2.
z=ln片ln(ceC2x)=Q"lnC\,
则ln°=-2,即c\=c匚
10.(1)40(2)14(1)由歹=:(55加+33+24)W8,解得勿NO.
(2)由。=y-b匕得a=58.
故y=-2A•巧8.
当尸22时,y=14.
故三月中旬的销售量约为14件.
44*
11.解⑴由表中数据得X%匕=58,1=3,9,Lxf=16,b==1,a=y-bx=4^=1.
i=li=l4:6-,4X「3善。
:,y=x+\.
(2)将x=10代入经验回归方程y=x+l中,得y=ll,
・••预测加工10个零件需要11小时.
ic/1\<4^日方五曰一2+3+4+5+6—22+22+17+14+10
12.解(1)由题思可得%=--:----2A,y=---------------=1/,
(y「y)_(-2)x5+(-l)x5+0x0+lx(-3)+2x(-7)?
2
£(xrx)(-2产+丁+02+12+22",
i=l
a=歹一8五=17+3.2X4之9.8.
故y关于x的经验回归方程为y=-3.2*+29.8.
5
(2)L[•占”「[(").==/*3.97,由r<0,可知x、y负相关.乂因为[0.75,1],
Ig|5v1OXV1083v30
万)2j£(“/2
所以相关性很强.
因此,可以认为该幼儿园去年春季患流感人数与年龄负相关很强.
13.解(1)令〃子,先建立y关于〃的经验回归方程.
因为9=纺巧1,所以b=睾"巴=86X0.41X51=4口()0
/633-6正21.492-6x0.16810.4834
i=l:
所以a=9一bu=51-100X0.41=10.所以y=10+100a
所以y关于x的非线性经验回归方程为y=10哼.
y关于〃的样本相关系数为
Eufy/-6uy
_48.34
60.96.
VO.4834XV5252.44
(2)(方法一)(i)若产品单价为80元,记企业利润为/(单位:元).
当订单为9千件时,每件产品的成本为10喈用0140+詈)(元),
企业的利润为L80・140喈,」X9000-260000(元).
当订单为10千件时,每件产品的成本为10噌知0=50(元),企业的利润为(80T0)X10000=300
000(元).
所以企业利润*的分布列为
X260000300000
P0.70.3
E(X)=260000X0.7-^300000X0.3=272000.
(ii)若产品单价为70元,记企业利润为V(单位:元).
当订单为10千件时,每件产品的成本为10若+30行0(元),企业的利润为(70-
50)X10000=200000(元).
当订单为11千件时,每件产品的成本为1()喈+30《40+詈)(元),
企业的利润为L70-140喈/」X11000^230000(元).
所以企业利润y的分布列为
Y200000
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消防安全意识讲稿模板课件
- 国际工程师范就业前景
- Python工程师就业前景指南
- 2026秋统编版(新)小学道德与法治一年级上册《课余生活真丰富》课时练习及答案
- 宜宾职业教育发展规划
- 合阳地区就业前景展望
- APP 开发合同模板
- 中学学校教学工作计划
- 企业客户续费维护方案
- 疼痛科发展的跃迁与结构性重建总结2026
- 2026中国医用内窥镜维修保养市场潜力与服务体系报告
- 康养实训室建设方案
- 湖南初二地理生物会考真题试卷+解析及答案
- 医疗器械经营企业管理记录表格
- TCIDADS00013-2023物联网云组态应用界面设计指南
- 物业管理基础知识培训课件
- 中石油政治职称考试题库及答案
- 雨课堂学堂在线学堂云《海军常见病的人体结构基础与防治(中国人民解放军海军军医)》单元测试考核答案
- 施工现场危险化学品管理方案
- GB/Z 115-2025齿轮蜗杆副承载能力计算
- 中考语文二轮复习热点题型专项训练(辽宁专用):专题10非连续文本阅读
评论
0/150
提交评论