管理定量分析:方法与技术(第三版) 课件 第6章 变量间关系研究:相关与回归分析_第1页
管理定量分析:方法与技术(第三版) 课件 第6章 变量间关系研究:相关与回归分析_第2页
管理定量分析:方法与技术(第三版) 课件 第6章 变量间关系研究:相关与回归分析_第3页
管理定量分析:方法与技术(第三版) 课件 第6章 变量间关系研究:相关与回归分析_第4页
管理定量分析:方法与技术(第三版) 课件 第6章 变量间关系研究:相关与回归分析_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理定量分析长安大学:刘兰剑第6章变量间关系研究:相关与回归分析引例世界上的事物或多或少存在着某种联系。例如:吸烟和人的健康之间受教育程度与收入水平之间课程考核次数和学生对知识的掌握程度之间公路上汽车的平均车速是否与那段公路上巡逻车的数量之间这种联系可分为两类:函数关系与相关关系6.1相关分析㈠函数关系(二)相关关系相关关系是指现象之间确实存在依存关系,但这种关系不确定不严格。例如:身高与体重之间,存在一定的依存关系。但是体重除了与身高有关外,还受年龄、性别、区域、种族等因素影响。身高与体重并无严格的对应关系,同一身高的人,体重大多数情况下是不相等的。但即便如此,这两个变量之间仍旧存在一定的规律性,在一般条件下,身高越高,体重越大。相关关系的种类㈠按相关关系涉及的变量多少来划分,可分为单相关和复相关㈡按相关的方向分,可分为正相关和负相关㈢按相关的表现形式分,分为线性相关(直线相关)和非线性相关(曲线相关)㈣按照相关的密切程度分,分为完全相关、不完全相关和无相关变量间关系的密切程度一般用相关系数r衡量6.2回归分析相关分析可以说明变量间相关关系的方向和程度,但是却不能说明变量之间具体的数量因果关系。当自变量给出一个数值时,因变量可能取值是多少,这是相关分析不能解决的。这需要通过新的方法,即回归分析。例如,交警队队长认为,高速公路路段上汽车的平均车速与在该路段上的巡逻车数有关。于是,他专门派人进行测试,试图证实这一假设。测试连续进行了60天。随机抽取了5天的测试结果列在表6—2中。主讲人:刘兰剑公路上的巡逻车数和该路段上汽车平均车速的例子中,能绘出一条描述这两个变量之间关系的直线。直线因斜率不同而不同斜率斜率(第一个决定直线的要素):相对于点在直线上移动的水平距离,点在直线上上升或下降的距离。主讲人:刘兰剑截距截距:直线与y轴的交点(第二个决定直线的要素)。截距常用α表示因此有时候同样的散点图上可以配上多条斜率不同的直线,哪一条才是最优的呢?

根据最小二乘法则,可以确定回归方程的两个系数:回归方程的应用第一,当6辆巡逻车在执勤时,公路上汽车的平均车速是多少?第二,7量巡逻车呢?第三,一辆巡逻车也没有呢?6辆警车和7辆警车对车速的影响有多少差距?拟合优度的测度有三种拟合优度的测度方法㈠估计标准误差

剩余剩余离差利用如下公式可以进行任意一点预测值的区间估计假定交通警察想预测当3辆巡逻车在公路上时汽车的平均车速时,利用回归方程,有Y=72.2-2.55×3=72.2-7.65=64.55当有3辆巡逻车在公路上时,我们有90%的把握确定车速在60.28公里/小时——

68.82公里/小时之间。㈡判定系数㈢斜率的标准误差

巡逻车与车速关系问题的斜率t检验

巡逻车与车速关系问题回归系数的区间估计~6.3线性回归的假定上述内容并没有讨论线性回归的假定和限制条件。许多分析人员经常忽视这些假定,这样做确实冒着一定的决策风险。只要任何一个假定被违背,上面的处理结果就会变得不可信。假定1:对所有的X值,Y的预测值的误差服从均值为0的标准正态分布。假定1要求每一个Y的估计值与真实值相减而形成的一列数(误差项)服从标准正态分布。假定2无论X为何值,误差项的方差都为常数。异方差的处理异方差的检验有图示法及解析法。检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性。如果相关,则存在异方差,反之没有。异方差的修正方法有加权最小二乘法和模型对数变换法等,其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。假定3:误差相互独立。这个假定的另一种说法是,一个误差的大小不是任何从前误差的函数。如果残差相互之间是随机的,误差就是相互独立的。误差不独立就存在自相关问题。自相关不是指两个或两个以上的变量之间的相关关系,而是指一个变量前后期数值之间存在的相关关系。存在自相关的数据用以上回归方法得出的结论是不可靠的。自相关发生在时间序列分析中。自相关性产生的原因有以下几种:第一,所建模型遗漏关键变量会产生序列的自相关性。第二,经济变量的滞后性会给序列带来自相关性。第三,采用错误的回归函数形式也可能引起自相关性。第四,蛛网现象可能带来序列的自相关性。第五,因对数据加工整理而导致误差项之间产生自相关性自相关一般用图示检验法或D-W检验来检测。假定4:自变量和因变量都必须是定距变量。定类和定序变量对回归分析是个问题,但并不是不可克服的。从技术上来讲,回归需要定距层次的数据。然而,通过将数字1,2,3等简单地分派给有顺序的分类,定序数据就常常在回归分析中使用。对于定类变量,不能简单地分派数字给变量的类别,可以通过构造虚拟变量(dummyvariable)将定类变量纳入回归中。一个例子某企业的负责人想确定品牌A和品牌B的机器中哪种品牌的效率更高。他将每一品牌的3台机器在同等条件的车间中进行了测试,测试结果见表计算回归方程并检验显著性定类因变量回归的一个例子某一单位的人事处对将被录用的10个求职者的打字速度进行了测试。1年后,这些打字员中的5个被解雇。人事主管假设打字员被解雇是因打字速度太

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论