《线性回归分析》课件.ppt_第1页
《线性回归分析》课件.ppt_第2页
《线性回归分析》课件.ppt_第3页
《线性回归分析》课件.ppt_第4页
《线性回归分析》课件.ppt_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章线性回归分析,管理统计学谢祥生广东工业大学管理学院,统一直线运动粒子实例,位移可以用S= t表示。但是在实验中,受到了环境等干扰因素的作用,所以每分钟观察到的不是正确的位移,而是误差s,如果记住这个观测值为y,那么所有的观测数据都得到满足,注意到每个误差实际上无法知道,所以要确定粒子的运动规律,必须使用回归分析方法。回归分析通常用于经济管理中,分析变量之间的不准确对应关系。不确定函数关系、社会经济和管理中变量之间的关系更频繁地表现为不确定函数关系。例如,销售量和人口数、销售量和广告费、收入和教育水平。即可从workspace页面中移除物件。即可从workspace页面中移除物件。即可从workspace页面中移除物件。即可从workspace页面中移除物件。即可从workspace页面中移除物件。它们之间有明确的相互关系(称为关联),但这种关系与数学中常用的确切函数关系不同。回归分析是通过研究被解释变量(变量)和被解释的一个或多个变量(自变量)之间的统计关系来研究随机变量之间相关性的统计方法。例如:宝丽来、宝丽来是即时现象技术的先驱,并保持着技术领先地位。公司成立以来,在化学、光学和电子学领域不断进行测试和发展,生产更高的质量、更高的可靠性和更方便的摄影系统。在宝丽来的感光实验室里,科学家们将即时视频胶片放置在特定的温度和湿度下,使其与消费者购买后的保存条件相似,然后对系统进行采样和分析。他们挑选了专门的彩色照相胶片,为了研究保存时间和感光率之间的联系,分别提取了保存113个月的胶片。数据表明,感光速度随着存储时间的延长而减少。它们之间的波动关系可以近似为一条直线或线性关系。y胶片感光体比率变化,x胶片保管时间(月)显示,在此方程式中,胶片的感光体比率平均每月减少7.6个单位。通过这项分析得到的信息有助于公司结合消费者的购买和使用,调整生产,提供顾客需要的胶片。宝丽来通过回归分析,建立了反映胶片保存时间对感光率影响的方程。例如:收入和食品消费,人均收入x和人均食品消费支出y之间的发散关系,如下图所示,根据散点图,可以从“平均”角度找到反映两个变量之间关系的直线。在经济方面,人均收入可以用作解释变量(解释人均粮食支出的变化)。此时,两个变量之间的不确定性,可以用以下方式表示:其中,人均食品消费支出y是解释变量,人均收入x是解释变量,1,2是表示截距和斜率的两个估计参数(x的边际收益反映)。u是随机干涉项目,通常假定与x无关,反映y被x解释的不确定性。如果随机干涉项目u的平均值为零,则自下而上两边在x的条件下求平均值时,会反映从“平均值”角度确定的函数关系(解算关系)。例如,由100个家庭组成的虚拟社区想研究该社区每月家庭消费支出y与每月家庭可支配收入x的关系。如果知道家庭的月收入,能预测这个地区家庭的平均月消费支出水平吗?在收集了这100户收入和消费支出的相关资料后,发现,根据这100户可构成的整体可支配收入水平,分为10个组。具体数字见下表。如E(Y|X=800)=605所示,不同地区的不同子女比例和人均收入之间的散点图也可以从平均角度找到反映两个变量之间关系的曲线。人均国民收入仍然用作解释变量。此时两个变量之间的不确定关系可以用近似包含对数的函数关系来表示。其中,多子率y是解释的变量,人均国民收入x是解释变量,1,2是要估计的两个参数。但是,2不再意味着边际利润,而是指x增加1%时y的附加值。假设u是随机干涉项目,与lnX无关,且与x无关。此时,y和x的关系不是线性关系,但会转换为10.1一元线性回归、10.1.1问题等线性关系。在上例中,反映一个变量(已求解变量)的更改可以被另一个变量(已求解变量)解释的变量之间关系的表达式,即最常见的线性回归表达式。经济和经营中广泛使用线性回归式,研究变量之间的解释关系。线性回归问题是用适当的方法估计参数1,2,使估计参数具有良好的统计特性。因此,回归问题实际上是一个特殊的参数估计问题。x,y变量对于每对相应的样例值都成立,因此样例值Xi,Yi,I=1,2,对于,n的所有对,是,估计参数的目的是找到直线的估计值,称为线性回归方程。这些样例数据点最适合,参数估计具有更好的统计特性。10.1.2高斯基本假设;线性回归模型的高斯基本假设:(1)ui为随机变量;(2)E(ui)=0。也就是说,所有随机扰动项的期望值为零。(3),即所有随机扰动项的方差等于常数。(4);这相当于所有其他随机扰动项的协方差等于0。也就是说,其他随机扰动项目不相关。(5)即随机扰动遵循正态分布。(6)E(Xiuj)=0对所有I和j都成立。可以分为描述变量Xi的特性的两种情况。Xi是随机变量,但与uj无关,因此设置为(6)。Xi是决定变量,自然与uj无关,因此设置为(6)。介绍了参数估计方法后,具体说明了这些假设的应用。10.1.3常规最小二乘法(OLS:OrdinaryLeastSquare),线性回归分析操作是回归分析,它需要参数的估计值以最佳拟合所有样例数据点。、Xi、Yi表示对于所有采样点(Xi、Yi),必须尽可能小。为了使回归线最佳拟合所有样例数据,必须使所有残差绝对值尽可能小。具体方法是最小化残差的平方和。这就是最小平方标准。最小平方基准:最小平方方法是根据最小平方基准确定1、2的估计值的方法。对应的估计称为最小二乘估计(OLS估计),为此,我们求出了自变量的估计值,使残差平方和达到最小。常识可以视为二次函数,因此存在其最小值,最小值的条件是作为线性方程的结果得到的。其中,Xi,yi分别是Xi,Yi的中心化数据(也称为偏差),gauss基本假设下自下而上计算的参数的估计值是最佳线性偏差估计值(blue,bestlinearunbsedestintor)。也就是说,OLS估计是线性估计,没有偏转,在所有偏转估计中方差最小。具体地说,模型是线性的,是线性的,(6),是无偏的,假设(3),(4),最小方差,注:对于BLUE,(5)是不需要的但是,也有保证(5)如果成立,也可以服从正态分布。10.2多元线性回归,实际问题中经常解释的变量,描述变量的几个线性回归模型(见商务与经济统计),位于南加州的巴特勒承运人的管理层想估计他们的司机每天行驶的时间以制定最佳工作计划。公司管理层最初认为,驾驶员每天行驶的时间与每天运输商品的里程(x)密切相关,通过观察散点图,可以说明使用一元线性回归模型行驶的时间(y)与行驶英里(x)的关系。对于公司的实际数据,一般最小二乘估计回归方程,通过方程分析,公司的管理人员发现,这个结果不错,但方程只能解释每日运行时间可变性的66.4%。因此,为了说明剩下的可变性,要求增加第二个解释变量。管理层在研究影响驾驶时间的其他因素的同时,认为,配送次数也会影响驾驶时间。因此,交付商品的次数和相应的数据,通过回归分析得到的回归方程呈形态,管理层发现,该方程解释了运行时间可变性的90.4%。这已经是相当好的结果了。10.2.1多重线性回归模型的基本假设(高斯假设),多重线性回归模型的矩阵表示,多重线性回归模型是此n个表达式,因为它对所有样例数据都必须有效。回归分析的目的是使用从范例资料产生的这n个表示式来估算模型的参数,取得模型的参数推论以建立回归方程式,并最佳拟合所有范例资料。为了便于讨论,对于多元线性回归模型,高斯假设(1)u经常使用矩阵

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论