版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2.2一元线性回归模型参数的最小二乘估计第八章
成对数据的统计分析复习回顾Y称为因变量或响应变量;x称为自变量或解释变量e是Y与bx+a之间的随机误差;a称为截距参数,b称为斜率参数一元线性回归模型:
各个参数分别表示什么?
新知学习与函数模型不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.问题1
为了研究两个变量之间的相关关系,我们建立了一元线性回归模型表达式刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,新知学习问题2:该怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?(1)(2)(3)与直线距离和最小直线两侧点数量相等求斜率、截距平均数比较难操作,需另辟蹊径.新知学习设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,(xn,yn)由
yi=bxi+a+ei,得|yi-(bxi+a)|=|ei|.显然|ei|越小,表示点(xi,yi)与点(xi,bxi+a)的“距离”越小,即样本数据点离直线y=bx+a的竖直距离越小.特别地,当ei=0时,表示点(xi,yi)在这条直线上.y=bx+a新知学习因此,可以用来刻画各样本观测数据与直线y=bx+a的整体接近程度.残差平方和:求a,b的值,使Q(a,b)最小概念生成
这种求经验回归方程的方法叫最小二乘法.新知学习经验回归直线的性质
①
经验回归方程一定过样本的中心点.
⑤利用经验回归方程可以预测在
x取某值时,y的估计值.新知学习思考1
当x=176时,
,根据经验回归方程,如果一位父亲身高为176cm,他儿子长大后身高一定能长到177cm吗?儿子的身高不一定会是177cm.这是因为还有其他影响儿子身高的因素,回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.新知学习思考2
经验回归方程
中0.839的实际意义是什么?斜率0.839可以解释为:父亲身高每增加1cm,其儿子身高平均增加0.839cm.思考3根据方程,父亲身高为多少时,儿子的平均身高和父亲的一样?
新知学习思考4
高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?
儿子身高有向平均身高回归的趋势新知学习英国著名统计学家高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”。后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.一元线性回归模型中“回归”的含义:典例剖析
ABC变式训练练习1已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为(
)A.=1.5x+2B.=-1.5x+2C.=1.5x-2D.=-1.5x-2B典例剖析例2
某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;解析:(1)作出散点图如图所示.典例剖析x681012y2356(2)请根据右表提供的数据,用最小二乘法求出y关于x的经验回归方程;(2)由题知,
,
,
则故所求的经验回归方程为解析:典例剖析例2
某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.解析:(3)由(2)中的经验回归方程
知,当x=9时,故预测记忆力为
9的同学的判断力为
4方法归纳(1)作出散点图,从直观上分析数据间是否存在线性相关关系;(4)写出经验回归方程并对实际问题作出估计.求经验回归方程的基本步骤(2)计算:
,
,
;(3)代入公式求出
中参数
的值;变式训练练习2某单位为了了解用电量
y(单位:度)与气温x(单位:°C
)之间的关系,随机统计了4天的用电量与当天气温,并制作了如右对照表.气温x(°C
)181310-1用电量y(度)24343864由表中数据得经验回归方程中的,预测当气温为-4°C
时,用电量约为_____度.68解析:由表中数据可得,∵经验回归直线过点,∴,∴,∴令,得变式训练练习3恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了某地年人均消费总支出
x(万元)与恩格尔系数
y的五组数据如下表:x11.522.53y0.90.70.50.30.2(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩
格尔系数.
(2)0.304新知学习
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.一元线性回归模型:Y=bx+a+e经验回归方程:新知学习例如,对于下表中的第6个观测,父亲身高为172cm,其儿子身高的观测值为176(cm),预测值为173.265(cm),残差为176-173.265=2.735(cm).编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182类似地,我们还可以得到其他的残差,如下表所示.-新知学习为了使数据更加直观,用父亲身高作为横坐标,残差作为纵坐标,这样作出的图形称为残差图,如图下所示:刻画回归效果的方式(1)——残差图新知学习从残差图可以看出,残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型假定。好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内,且带状区域越窄,说明模型拟合效果越好.越窄越好新知学习(1)(2)(3)(4)思考:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?只有图(4)满足一元线性回归模型对随机误差的假设.典例剖析例3
某厂经过节能降耗技术改造后,生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对应数据如表所示.x3456y2.5344.5(1)请画出上表数据的散点图;(1)由题设所给数据可得散点图,如图.解析:典例剖析x3456y2.5344.5(2)请根据右表提供的数据,用最小二乘法求出y关于x的经验回归方程;<m>解析:(2)由题中数据计算得
,
,又
,所以所以因此所求的经验回归方程为典例剖析(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤,试根据(2)中求出的经验回归方程,预测技改后生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.解析:(3)由(2)中的经验回归方程
得,技改后生产100吨比技改前降低吨标准煤.甲产品的生产能耗为总结提升2.残差的平方和越小,拟合效果越好;3.原始数据中的可疑数据往往是残差绝对值过大的数据;4.对数据刻画效果比较好的残差图特征:残差点比较均匀的集中在
水平带状区域内.1.残差等于观测值减预测值:残差的性质变式训练10练习4某种产品的广告支出费用x(单位:万元)与销售额Y(单位:万元)的数据如表.已知Y关于x的经验回归方程为
=6.5x+17.5,则当广告支出费用为5万元时,残差为
.当x=5时,
=6.5×5+17.5=50,表格中对应y=60,解析:于是残差为60-50=10.新知学习刻画回归效果的方式(2)——
决定系数R2法R2越大,表示残差平方和越小,即模型的拟合效果越好;
R2越小,表示残差平方和越大,即模型的拟合效果越差.我们可以用决定系数R2来验证模型的拟合效果.
决定系数R2的计算公式为典例剖析例4
已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求
y
关于
x
的经验回归方程,并说明回归模型拟合效果的好坏.解析:典例剖析x1416182022
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 长春电子科技学院《社区社会工作》2026-2027学年第一学期期末试卷含解析
- 潍坊环境工程职业学院《冷链物流管理》2026-2027学年第一学期期末试卷含解析
- 张家口学院《测试与传感器技术双语》2026-2027学年第一学期期末试卷含解析
- 长沙环境保护职业技术学院《烹饪营养》2026-2027学年第一学期期末试卷含解析
- 新疆能源职业技术学院《谈判学》2026-2027学年第一学期期末试卷含解析
- 太原科技大学《组织文化研究》2026-2027学年第一学期期末试卷含解析
- 翻译服务行业的创新与突破-探索增长机遇与未来趋势
- 2026银行提职面试题目及答案
- 2026年河南省辉县市高二化学下册期末考试模拟测试卷附参考答案【完整版】
- 2026影像招聘面试题及答案解析
- 跨境传输政策分析-洞察及研究
- 2025云南文山市教育体育系统选调中学教师21人笔试备考题库及答案解析
- 矿石物流仓储管理方案(3篇)
- 北京市北方交通大学附属中学2025届物理高一第二学期期末综合测试试题含解析
- 精神科攻击风险评估及护理
- 新疆民丰县其其兰干砂金矿项目环评报告
- 临床下肢深静脉血栓形成介入治疗护理
- 消防维保合同协议书电子版模板
- 压疮分期的试题及答案
- 2025年潞安化工集团考试题
- 费用减免申请书范文
评论
0/150
提交评论