版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2一元线性回归模型及其应用
新版课程标准学业水平要求
:।.结合具体实例.r解•无线性mmi模
型的含义.广解模耀参数的统计意义.
1.「解•元线性刚।模型的含义.r解模型参数的统计意义.(数学抽象JE轼推理)
了解最小二乘原理,掌握一元线性网
2.常握最小二乘法•会求一-出线的方程•能根据经脸刚I方程进行预测.(数学抽象、数
以模澳参数的最小二乘估计方法•会
学运算)
使用相关的统计软件.
理解残差、决定系数的概念,会进行线性分析.(数学抽象、数据分析)
:2.针对实际问即•会用•元线性回中模3.mw।
:耀进行预测.
必备知识•素养奠基
L一元线性回归模型
一元线性回归模型的完整表达式为[厅卜之梵2其中丫称
为因变量或响应变量,X称为自变量或解释变量;a,b为模型的未知参
数,e是Y与bx+a之间的随机误差.
?思考
具有相关关系的两个变量,其样本点散布在某一条直线kbx+a的附
近,可以用一次函数y-bx+a来描述两个变量之间的关系吗?
提示:不能.
2.最小二乘法与经验回归方程
⑴最小二乘法
产欲+3称为Y关于x的经验回归方程,也称经验回归函数或经验回归公
式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二
乘法,求得的x,3叫做b,a的最小二乘估计.
⑵经验回归方程的系数计算公式
经验回归方程彳的计算公式3的计算公式
同(
广JAa——y6-
(3)经验回归方程的性质
①经验回归方程一定过点__(元边―;
②一次函数"%X+3的单调性由工的符号决定,函数递增的充要条件
是Q0;
③工的实际意义:当X增大一个单位时,J增大不个单位.
?思考
正相关、负相关与力的符号有何关系?
提示:Y与X正相关的充要条件是QO,Y与X负相关的充要条件是*0.
3.残差
⑴残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验
回归方程得到的e称为预测值,观测值减去预测值称为残差.
(2)决定系数:R2=l[“yL》越接近1,表示回归的效果越好.
一,索养小渊—
1.思维辨析(对的打“J”,错的打“X”)
⑴经验回归方程一定过样本中的某一个点.()
⑵选取一组数据中的部分点得到的经验回归方程与由整组数据得到
的经验回归方程是同一个方程.()
⑶在经验回归模型中,R2越接近于1,表示解释变量和响应变量的线性
相关性越强.()
⑷在阿两个变量的散点图时,响应变量在X轴上,解释变量在y轴
上.()
提示:(1)X.经验回归方程一定过点(元y),可能过样本中的某个或某
些点,也可能不过样本中的任意一个点.
⑵X.选取一组数据中的部分点得到的经验回归方程与由整组数据得
到的经验回归方程不一定是同一个方程.
(3)V.
(4)X.在画两个变量的散点图时,解释变量在x轴上,响应变量在v轴
上.
2.若某地财政收入x与支出Y满足经验回归方程度汰+3+巳(单位:亿
7C)(i=l,2,…),其中20.8,a=2,|ei|<0.5,如果今年该地区财政收入10
亿元,年支出预计不会超过()
A.10亿元B.9亿元
C.10.5亿元D.9.5亿元
【解析】选C.户0.8X10+2+ei=10+ei,
因为|e」<0.5,所以9.5«<10.5.
3.若施肥量x(kg)与水稻产量Y(kg)的经验回归方程为产5x+250,当施
月巴量为
80kg时,预计水稻产量约为_______kg.
【解析】把x二80代入经验回归方程可得其预测值y二5X
80+250=650(kg).
答案:650
关键能力•素养形成
类型一求经验回归方程
【典例】某种产品的广告费用支出x与销售额Y(单位:百万元)之间有
如下的对应数据:
x/白力兀24568
Y/百万元3040605070
(1)画出散点图;
⑵求经验回归方程;
⑶试预测广告费用支出为10百万元时,销售额多大?
【思维•弓I】(1)按表中的数据在平面直角坐标系中描点即得散点图;
(2)由公式求出&Z,写出经验回归方程;
(3)利用经验回归方程分析.
【解析】(1)散点图如图所示:
>'/百万兀
70
60
50
40
30
20
10
012345678x/g■万元
⑵列出下表,并用科学计算器进行有关计算:
•
112345合计
Xi2456825
V、3040605070250
XiYi601603003005601380
Xi416253664145
5_
所以/=5,歹上=50,Exf=145,Zxy=1380.于是可得H
33t=l»=1
138O-5X5X5€一一会,「、「…广
-14Ss2xs=6.5,«=y-/3t=50-6.5X5=17.5.
所以所求的经验回归方程为>=6.5x+17.5.
⑶根据上面求得的经验回归方程,当广告费用支出为10百万元
时,产6.5X10+17.5=82.5(6万元),
即广告费用支出为10百万元时,销售额大约为82.5百万元.
【内化•悟】
求经验回归方程前应注意什么问题?
提示:对于性质不明确的两组数据,要先作散点图,从图中看它们有无
线性相关关系,有相关关系的求出的经验回归方程才有实际意义.
【类题•通】
求经验回归方程的步骤
⑴画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相
关关系.
(2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出经验回归方程,并利用经验回归方程进行预测说明.
【习练•破】
某公司的生产部门调研发现,该公司第二,三季度的月用电量Y与月
份x线性相关,且数据统计如下:
但核对电费报表时发现一组数据统计有误.
(1)请指出哪组数据有误,并说明理由;
⑵在排除有误数据后,求月用电量与月份之间的经验回归方程产新+金
并预测统计有误那个月份的用电量.(结果精确到0.1)
【解析】(1)作散点图如图所示.因为用电量与月份之间线性相关,所以
散点图的样本点分布在经验回归直线附近比较窄的带状区域内,而点
(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
y(千瓦时)
65
55・•
45・
35
25.
15・
53456789X
⑵排除(7,55)这一组有误数据后,计算得启6.4,齐30.2.
s
Ex(y(Sx>
"4------g9.98,
Ex?-5^
4=11
a=y-^c^-33.67,
所以经验回归方程为产9.98x-33.67,
当x=7时尸引36.2,
即7月份的用电量大约为36.2千瓦时.
类型二线性检验回归分析
【典例】某运动员训练次数与训练成绩之间的数据关系如表:
(2)求出经验回归方程;
(3)作出残差图;
⑷计算R1并说明运动员的训练次数对成绩的影响占百分之几.
【思维•弓I】根据题意先作散点图再求经验回归方程、残差及R;
【解析】(1)作出该运动员训练次数X与成绩Y的散点图,如图所示.由
散点图可知,它们之间具有相关关系.
88
(2)x=39.25,JF40.875,E号=12656,Zx.yFlS180,
!•1("1
Ex(y(~Bxy
所以行气------^1.0415,a=y-zx=-0.003875,
£x?ta2
I1
所以经验回归方程为产1.0415x-0.003875.
⑶残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以
及相应的残差数据.
XYe
3030-1.2411
3334-0.3656
35370.5514
37390.4684
39421.3854
44460.1779
46480.0949
5051-1.0711
作残差图如图所示.
由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型
比较合适.
⑷计算R2^0.9855,说明了该运动员的训练次数对成绩的影响占
98.55%.
【类题•通】
“W、残差图”在回归分析中的作用
(1)R2是用来刻画回归效果的,由R2=l-薪不可知R2越大,意味着残差
平方和越小,也就是说模型的拟合效果就越好.
⑵残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地
分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归
方程预报精度越高.
【习练•破】
为研究质量X(单位:g)对弹簧长度Y(单位:cm)的影响,对不同质量的
6个物体进行测量,数据如表所示:
X51015202530
Y7.258.128.959.9010.911.8
(1)作出散点图并求经验回归方程;
⑵求出R2并说明回归模型拟合的程度;
⑶进行残差分析.
【解析】(1)散点图如图.
Y
14
6・
4
2
0~5101520253035-V
X=^X(5+10+15+20+25+30)=17.5,
6
y=ix(7.25+8.1218.9519.90+10.9+11.8)以9.487,计算得》仁0.183,a
6
心6.285.
故所求经验回归方程为产6.285+0.183x.
⑵列出残差表为
丫「臭0.050.005-0.08-0.0450.040.025
y-y-2.237-1.367-0.5370.4131.4132.313
66
所以£(yi-Ji)2^0.01318,£(yi-y)-14.6783.
nW1fl
所以,R2=1_----------心0.9991,回归模型的拟合效果较好.
14.6783
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认
在采集这个样本点的时候是否有人为的错误,如果有的话,需要纠正,
重新建立回归模型;由表中数据可以看出残差点比较均匀地落在狭窄
的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析
可知,弹簧长度与所挂物体的质量成线性关系.
类型三非线性经验回归问题
【典例】为了研究某种细菌随时间X的变化繁殖个数Y的变化,收集数
据如下:
时间x/天123456
繁殖个数Y612254995190
⑴将天数做解释变量,繁殖个数做响应变量,作出这些数据的散点图;
⑵描述解释变量与响应变量之间的关系.
【思维•引】先由散点图确定相应的函数模型,再通过对数变换将非线
性相关转化为线性相关的两个变量来求解.
【解析】(1)由表中数据作散点图如图所示.
个
200.
180卜
160卜
i4or
120卜
100卜.
801
60卜
401*
2。匕・•
123456x/天
(2)由散点图看出样本点分布在一条指数函数的图象的周围,
其中G和C2是待定系数.于是令Z=InY,则"欲+3(=Incbg),因此变
换后的样本点应该分布在直线”以+3的周围,因此可以用经脸回归模型
来拟合Z与X的关系,则变换后的样本数据如表:
X123456
Z1.792.483.223.894.555.25
由表中数据得到经验回归方程2=0.69x+1.115.
因此细菌繁殖个数关于时间的非线性经验回归方程为v=e°-69x+1-115.
【内化•悟】
将非线性相关问题转化为线性相关问题的依据是什么?
提示:根据散点图确定.
【类题•通】
1.非线性经验回归问题的解题步骤
2.常见转化类型
⑴反比例函数y=a+勺可作变换t=i,得y=a+bt.
XX
⑵幕函数型y二ax'(a>数可作变换Y=lny,m=lna,t=lnx,则有Y=m+bt.
(3)指数型函数y=kabx(a>0且aWl,k>0)可作变换Y=lny,m=lnk,则
有:Y=m+
(blna)x.
【习练•破】
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费
X(单位:千元)对年销售量Y(单位:t)和年利润z(单位:千元)的影响.对
近8年的年宣传费Xi和年销售量.(i=1,2,…,8)数据作了初步处理,
得到下面的散点图及一些统计量的值.
年销售量八
620
60()
580
56()
540
52()
500♦
3638404244464850525456
年宣传费/千元
占占(w「占(x「R(y占卜而(
xyW
w)2yi-y)
46566.
289.81.61469108.8
.638
表中Wi=w=-Ewi.
8i-l
(1)根据散点图判断,y=a+bx与y=c+dQ哪一个适宜作为年销售量Y关
于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
⑵根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据⑵的结果
回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据Q,vJ,(U2,V2),…,(Un,V)其回归直线加的斜率
和截距的最小二乘估计分别为
n
E(u(-u)(r(-p)_
-----------------------,&二了一阻.
昌仙旬2
【解析】(1)由散点图可以判断,尸c+dQ适宜作为年销售量Y关于年宣
传费x的回归方程类型.
⑵令W二G,先建立Y关于W的经验回归方程.
9
,十,三(w(-w)(y(-y)iQ8.c——
由于左^"S--------=----=68,加二563-68X6.8=100.6,
E^wpw)2L6
所以Y关于w的经验回归方程为产100.6+68w,
因此Y关于x的经验回归方程为产100.6+685/x.
⑶①由⑵知,当x=49时,年销售量Y的预报值2100.6+68749=576.6,
年利润z的预报值w576.6X0.2-49=66.32.
②根据⑵的结果知,年利润z的预报值
2=0.2(100.6+684)-x=-x+13.6>/x+20.12.
所以当代皇=6.8,
即x=46.24时,会取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
【力口练•固】
如表是某年美国旧轿车价格的调查资料.
观察表中的数据,试问平均价格与使用年数间存在什么样的关系?
【解析】设x表示骄车的使用年数,Y表示相应的平均价格,作出散点
图.
30
2x5x)
2o0o嚅
15
10
J5oo
oo
nI234567N9I0X
由散点图可以看出Y与x具有指数关系,
令Z=InY,变换得
X12345678910
Z7.8837.5727.3096.9916.6406.2886.1825.6705.4215.318
作出数点图:
Z
8・
7-
6-••
5....................
0123456789H)x
由图可知各点基本上处于一直线附近,由表中数据可求出经验回归方
程:”8.166-0.298x.
因为旧车的平均价格与使用年数具有指数关系,所以其非线性经验回
归方程为产e.
课堂检测•素养达标
1.关于回归分析,下列说法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学习第八次少代会精神
- 员工行为管理规范
- 造价工程师(建设部):建设工程造价管理试题及答案
- 运营中心工作标准手册内容样本人事行政样本
- 2026年4月自考00067财务管理学真题及答案
- 2026年铁路工程施工质量验收标准题库及答案
- 2025年山西省忻州市检察官逐级遴选笔试题目及答案
- 第5课 中国古代官员的选拔与管理教案
- 2025浙江温州市瓯港城建设发展有限公司第二次招聘编外项目人员拟录用人员笔试历年典型考点题库附带答案详解
- 2025浙江嘉兴市海宁市振鑫物业管理有限公司招聘4人笔试历年典型考点题库附带答案详解
- Unit4 Eat Well Section B (1a-1d) 课件 2024-2025学年人教版七年级英语下册
- 解密黄帝内经知到智慧树章节测试答案2024年秋上海中医药大学
- 绿色家电标准体系构建-深度研究
- 【MOOC】大学体育-华中科技大学 中国大学慕课MOOC答案
- 干燥综合征护理查房-2
- 职业技能竞赛互联网营销师(直播销售员)赛项考试题库500题(含答案)
- 个体户的食品安全管理制度文本
- 餐厅装修施工方案
- 土壤重金属污染修复课件
- 兰州市2023年中考:《化学》科目考试真题与参考答案
- 地震安全性评价工作程序
评论
0/150
提交评论