




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 相关分析与回归分析,本 章 结 构,相关分析,相关关系与函数关系 函数关系;变量之间存在着严格确定的依存关系 相关关系:变量之间存在一定的依存关系,但又不是确定的和严格依存的,相关关系的种类,1、按相关方向分为:正相关和负相关 2、按相关程度分为:完全相关、不完全相关和不相关 3、按相关形式分为:线性相关(直线相关)和非线性相关(曲线相关) 4、按所研究的变量的多少分为:单相关(A与B)、复相关(A与B、C、D)和偏相关(B、C不变A与D) 5、按相关系数分为:r=1,完全相关;0.8r1,高度相关; 0.5r0.8,显著相关;0.3r0.5,低度相关;0r0.3,微弱相关; r0,不相关;,涵义 利用一个指标来反映现象间相互依存关系的密切程度。用相关系数r来表示。 特点 可以了解现象间的相关方向和程度 相关分析中所涉及的现象间地位是平等的,不存在自变量与因变量之分。,相关分析,相关表和相关图,(一) 相关表 将某一变量的若干数值按从小到大顺序排列,再列出与其相关的另一个变量的对应数值,现从某班同学中抽取10位同学期末考试的 数学与统计学成绩资料如表6-2所示 表6-2 数学与统计学成绩 将数学成绩按从小到大的顺序排列,可编制相关表如表6-3所示 表6-3数学与统计学成绩相关表,例1,(二) 相关图,又称散点图 以直角坐标系的横轴代表自变量X,纵轴代表因变量Y 将两个变量相对应的变量值用坐标点描绘出来 用于反映两变量之间相关关系的图形,根据表6-3绘制相关图,散点图,相关系数 单相关系数的含义 单相关分析是对两个变量之间的线性相关程度进行分析 对两个变量之间线性相关强度的度量称为单相关系数 总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数,记为 若相关系数是根据样本数据计算的,则称为样本相关系数,记为 r,相关系数的计算,积差法公式: 简捷公式:,单相关系数的特点 (1) r只是对x与y的线性相关关系的度量。 (2) 0 r 1; (3) r = 0 时,x与y没有线性关系; (4) 0 r 1,x与y存在一定的线性关系; (5) r1,x与y完全线性相关;,例 万象集团公司下属公司1月份的销售总额与利润总额的资料如表6-4所示。试问该公司的销售总额与利润总额之间是否存在相关关系,相关系数计算表,单相关系数的检验,(1)建立假设。 原假设:H0:=0 对立假设:H1:0 (2)计算相关系数的t值 (3)确定临界值 (4)进行判断,根据例6-1,当0.05时,r0.9261,试问该公司的销售收入与利润总额之间是否存在显著的线性相关关系?,回归分析,回归分析 涵义 根据相关关系的具体形态,选择一个恰当的数学模型,来近似地表达现象间的变化关系。 特点 变量间地位不平等,自变量与因变量之间存在因果关系。 可以反映现象间的具体形态,并且从一个变量的变化可以推出另一个变量的变化。 在建立回归模型时,自变量必须是给定的。,相关分析与回归分析的关系,相关分析与回归分析的联系: 第一,两者都是研究现象之间相关关系的方法。 第二,相关分析依靠回归分析表明现象数量相关的具体形式;回归分析需要依靠相关分析来表明现象数量变化的相关程度,相关分析与回归分析的关系,区别: 1、相关分析中x与y对等,回归分析中x与y要确定自变量和因变量; 2、相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制; 3、相关分析中x、y均为随机变量;回归分析中只有y为随机变量,自变量作为研究时给定的非随机变量,一元线性回归模型,总体回归函数 从一个总体看,反映两个变量依存关系的线性回归模型可表示为: 其中, 和 是未知参数,又叫回归系数, 是随机误差项,又称随机干扰项,反映未列入方程的其他各种因素对Y的影响,上式表明:在X值给定的条件下,Y的期望值是X的严密的线性函数。Y的实际观测值并不一定位于该直线上,只是散布在该直线周围。各实际观测点与总体回归线垂直方向的间隔,称为随机误差项,误差项的标准假定 假定1:误差项 是一个期望值为0的随机变量,即 假定2:对于所有的X值,误差项 的方差为常数2 假定3:误差项之间不存在自相关关系,其协方差为0 假定4:误差性 是一个服从正态分布的随机变量,且独立,即 N(0,2) 假定5:自变量是给定的变量,与随机误差项线性无关 满足以上标准假定的一元线性模型,称为标准的一元线性回归模型,样本回归函数 样本一元线性回归模型可表示为: 实际观测到的因变量 值,并不完全等于 如果用i表示两者之差,即有:,样本回归函数与总体回归函数的区别与联系: 区别:第一,总体回归线是未知的,只有一条;样本回归线是根据样本数据拟合的,可以是多条 第二,总体回归函数中 和 是未知的参数,表现为常数;样本回归函数中 和 是随机变量,其具体数值由所抽取的样本观测值决定 第三,总体回归函数中的 是 与未知的总体回归线之间的距离,是不可直接观测;样本回归函数中的 是 与样本回归线之间的距离 ,可以计算出具体的数值,一元线性回归模型的估计,(一)回归参数的估计 最小二乘法通过使残差平方和为最小来估计回归系数 根据最小二乘法:,对Q分别求对应于 和 的偏导数得: 根据上述方程组可得:,例 根据例6-1的资料。拟合直线回归方程。,标准误差的估计,反映理论模型误差的大小 在一元线性回归模型中, 残差必须满足以下两个约束条件: 即 的无偏估计S2为:,估计标准误差的自由度,1.估计标准误差的自由度之所以是n-2,原因是在计算估计标准误差时,必须先求出 和 ,这两个估计值就是附加给估计标准误差的两个约束条件,因此在计算SSE时,只有n-2个独立的观测值,而不是n个 2.一般而言,在有k个自变量的多元回归中,自由度则为n-k 3.一般的规律是:自由度=n-待估参数的个数,注意:S越小表明实际观测点与所拟合的样本回归线的离差程度越小,即回归线具有较强的代表性;反之,S越大表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差 S经过简化,其计算公式为:,一元线性回归模型的检验,回归模型检验的种类 1、理论意义检验:主要涉及参数估计值的符号和取值区间 2、一级检验:又称统计学检验,是利用统计学中的抽样理论来检验样本回归方程的可靠性,具体又分为拟合程度评价和显著性检验 3、二级检验:又称经济计量学检验,对标准线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验、多重共线性检验等,回归方程的拟合优度评价,回归直线在一定程度上描述了自变量与因变量之间的数量关系,利用这一方程,可根据自变量的取值来估计或预测因变量的取值。 回归直线对数据的拟合优度:样本观测值聚集在样本回归线周围的紧密程度,通常用判定系数来度量回归模型的拟合优度,判定系数的定义 判定系数是建立在对总离差平方和进行分解的基础上。 可以分解为两部分: 一部分是因变量的理论回归值与其样本均值的离差 ,它可以看成是能够由回归直线解释的部分,称为可解释离差 另一部分是实际观测值与理论回归值的离差 ,它是不能由回归直线加以解释的残差,将总离差方程的两边平方,并对所有n个点求和,有: 即:SST=SSR-SSE SST是总离差平方和; SSR是由回归直线可以解释的那一部分离差平方和,称为回归平方和,反映自变量X的变化对因变量Y取值变化的影响; SSE是用回归直线无法解释的离差平方和,称为残差平方和,反映除X以外的其他因素对Y取值的影响,也称为不可解释平方和或剩余平方和,各个样本观测点与样本回归直线靠的越紧,SSR在SST中所占的比例就越大,并将这一比例定义为判定系数,即: 判定系数是对回归模型拟合程度的综合度量,判定系数越大,模型拟合程度越高;判定系数越小,则模型对样本的拟合程度越差,2、判定系数的特性: (1)判定系数 具有非负性 (2)判定系数的取值范围为0 1 (3)判定系数是样本观测值的函数 (4)在一元线性回归模型中,判定系数是单相关系数的平方,回归点公式 区间预测公式,一元线性回归模型的预测,非线性回归模型 抛物线型 采用差量法,如果xt接近于常数,y2t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中物理相对论时空观与牛顿力学局限性+课件+-2024-2025学年高一下学期物理人教版(2019)必修第二册
- 网络安全法的监管失效与对策研究-洞察及研究
- 北京科技职业学院《员工培训与开发》2023-2024学年第一学期期末试卷
- 泰山学院《视觉设计》2023-2024学年第一学期期末试卷
- 太原理工大学《生物药剂学进展》2023-2024学年第一学期期末试卷
- 月子营养培训课
- 西北大学现代学院《民间舞打击乐》2023-2024学年第一学期期末试卷
- 主持人培训班
- 吉林城市职业技术学院《建设工程法规》2023-2024学年第一学期期末试卷
- 贵州中医药大学时珍学院《生物制药工程原理与技术》2023-2024学年第一学期期末试卷
- 2024年 绍兴市交通控股集团公司招聘考试笔试真题试题含答案
- 超限模板及高支模安全专项施工方案(论证后)
- 日间化疗服务管理制度
- 暑假散学典礼课件小学生
- 2024年凉山州木里县选聘社区工作者真题
- 保险公司攒钱活动方案
- 3.5中华人民共和国突发事件应对法
- 2024智联招聘人社局解决就业大型招聘会活动方案
- 养牛的可行性研究报告范文
- 2025年高考英语全国二卷(解析)
- 2025年新高考1卷(新课标Ⅰ卷)英语试卷
评论
0/150
提交评论