已阅读5页,还剩73页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第六章相关与回归分析,2,一、确定现象之间有无关系存在,以及相关关系的表现形式二、确定相关关系的密切程度三、确定相关关系的数学表达式四、测定因变量估计值与实际值之间的误差程度,3,第一节相关分析,一、确定现象之间有无关系存在(一)现象之间关系的分类,4,1、函数关系,客观现象之间确实存在的、而且数量表现上是严格的确定性的依存关系。在这种关系中,某一变量的的每一个数值,都有另一个变量的确定值与之对应,并且这种关系可以用一个数学表达式反映出来。,5,是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上,6,圆的面积(S)与半径之间的函数关系S=R2里程(D)与速度(V)、时间(t)之间的关系D=Vt企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系y=x1x2x3,7,2、相关关系,客观现象之间确实存在的、但在数量表现上不严格对应的依存关系。两个要点:(1)确实存在定性分析(2)数量表现上不严格围绕它们的平均数并通过一定的规律变动,8,变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线周围,9,单位成本(y)与产量(x)的关系父亲身高(y)与子女身高(x)之间的关系社会商品零售额(y)与居民会支配收入(x)之间的关系收入(y)与文化程度(x)之间的关系商品销售量(y)与广告费支出(x1)、价格(x2)之间的关系,10,3、相关关系与函数关系的联系和区别,主要区别:随着某一变量变化的另一变量,其数值是否确定,如果确定,则是函数关系,如果不确定,则是相关关系。,主要联系:函数关系往往通过相关关系表现出来,相关关系常常要用函数关系来研究。,11,假相关没有本质联系,只是表面数字的偶然的巧合;如上证股票价格综合指数与气温的关系。因果关系原因与结果之间、影响因素与被影响因素之间的关系。相关关系比因果关系包括的范围更广泛。即,因果关系属于相关关系,但相关关系不一定是因果关系。统计只能说明现象间有无数量上的关系,不能说明谁因谁果,(其它有关概念),12,(二)相关关系的种类,13,二、相关关系的测定,进行相关分析的一般程序:,相关分析的主要内容:,测定相关关系的种类和关系的密切程度,14,(一)相关表和相关图,能源消耗量与工业总产值相关表:,15,能源消耗量与工业总产值相关图,16,17,(二)直线相关的测定,相关系数反映具有直线相关关系的两个变量之间关系密切程度的指标。判定系数相关系数的平方,相关系数与判定系数,18,19,对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为r,1、相关系数(correlationcoefficient),20,21,22,(1),.(2),.(3),23,5幢房屋的使用时间长短与月租金的资料,24,25,直线相关的特点,两个变量是对等的;只能计算出一个相关系数;低度线性相关显著线性相关高度线性相关相关系数可以为正数,也可以为负数,表示正相关或负相关;计算相关系数要求两个变量必须是随机的。,26,2、判定系数,相关系数的平方计算判定系数,用R表示。在经济计量学中又称可决系数,27,3、计算t值并查表确定临界值,比较并作结论,1、提出零假设与备择假设,2、确定检验所需的统计量,(三)相关系数的显著性检验t检验,28,拒绝原假设,说明房屋使用年限与租金之间有显著的线性关系,29,第二节一元线性回归分析,一、回归分析1、概念借助数学方程,揭示具有相关关系的变量之间数量变化规律的方法,称为回归分析法;回归分析中的数学方程称为回归方程。数量变化规律指,当自变量发生变化时,平均说来因变量会发生多大的变化。2、回归分析与相关分析的关系(1)共同点:都是分析相关关系;相关系数与回归系数符号相同。,30,(2)区别回归分析相关分析,3、揭示自变量的变化将引起因变量多大的平均变化量,并据此对因变量进行预测和估计,1、不必区分自变量和因变量;,1、必须区分自变量和因变量,原因是自变量(解释变量),结果是因变量(被解释变量);,2、两个变量是对等的,都是随机变量;,2、自变量是可控、给定的一般变量;,3、测定相关的种类和关系密切程,31,(三)回归的种类,32,二、一元线性回归方程的确定,(一)步骤,关系密切程度分析;,定性分析确定现象之间是否有相关关系;,确定自变量和因变量;,确定回归方程;,分析解释结果。,33,(二)一元线性回归方程的确定,1、总体回归方程(PRF)假设两个具有线性相关关系的现象X和Y,X表示自变量(解释变量)、Y表示因变量(被解释变量),则Y与X的关系可用下面模型表达:,34,其中部分表示X与Y的线性关系,是X对Y所作出的解释;是随机变量,表示其他因素(包括随机因素、偶然因素)对Y的变化所作出的解释。,35,理论假定:满足零均值齐方差条件,即,36,误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的x值,y的期望值为E(y)=+x对于所有的x值,的方差2都相同误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对于一个特定的x值,它所对应的与其他x值所对应的不相关对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关,一元线性回归模型(基本假定),37,38,总体线性回归方程(PRF),39,描述y的平均值或期望值如何依赖于x的方程称为回归方程一元线性回归方程的形式如下,方程的图示是一条直线,也称为直线回归方程是回归直线在y轴上的截距,是当x=0时y的期望值是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值,40,2、样本回归直线方程,对于线性相关关系的两个现象一般情况下我们得不到和,也就得不到上述总体回归方程,我们只能利用一段时间的样本数据来估计和,相应的得到样本回归方程(SRF)。,41,因变量的估计值(回归理论值)a截距,表示除x外其它因素对因变量y的平均影响b回归系数(斜率),表示自变量x每变动一个单位时,因变量y平均变动b个单位,42,样本回归方程参数ab的确定,最小二乘法(OLS),43,观察点与样本回归线(图示),44,估计参数的最小二乘法(LeastSquareMethod),最小平方法也称为最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法,即满足下列条件:,即:,45,a和b的计算公式,根据最小平方法的原则,利用微分求解极值(最优值)的原理,可得求解a和b的标准方程组如下:,X的总和?,46,47,48,房屋租金的线性回归方程为:,回归方程中参数估计值的含义:回归系数b=2.4658,表示房屋的使用年数每增加1单位(年),房屋的租金平均减少2.4658单位(元);回归系数与相关系数同号截距a=58.2743,表示新房屋时,租金平均为58.2743(元)。,49,几点说明:1样本回归直线必然通过数据散点中心2回归系数与相关系数的符号取决于的xy的协方差3回归系数与相关系数的关系,50,三、回归估计标准差回归估计精度的测定指标,(一)回归估计标准差的概念在大样本条件下,51,该指标的作用:回归估计标准差反映的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值的代表性的强弱,其值越小,估计值(或回归方程)的代表性越强,用回归方程估计或预测的结果越准确。,52,(小样本),(大样本),53,(二)回归估计标准差与相关系数的关系,54,总离差平方和SST,回归平方和SSR,剩余平方和SSE,55,离差平方和的分解(三个平方和的意义),总平方和(SST)反映因变量的n个观察值与其均值的总离差回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和,56,判定系数:,57,判定系数是相关系数的平方,58,59,回归估计标准差与相关系数的关系,60,直接说明关系密切程度直接说明回归估计的精确程度,间接说明回归估计的精确程度间接说明关系密切程度,61,第三节线性相关关系的显著性检验及回归预测,一、根据样本相关系数进行检验t检验二、根据回归分析的结果进行检验F检验t检验,62,一、根据样本相关系数进行检验t检验,H0:0;H1:0根据样本相关系数r的抽样分布构建的检验统计量(在H0成立的前提下服从自由度为(n-2)的t分布)为:,若或P值,应否定H0,表明两个变量间存在显著的线性相关性。,63,1.回归系数的显著性检验t检验H0:bi=0(x与y之间没有线性关系)H1:bi0(x与y之间存在线性关系)采用t检验法(检验统计量在H0成立的前提下服从自由度为(n-2)的t分布)。,二、根据回归分析的结果进行检验,64,回归系数的显著性检验(Excel输出的结果),回归方程参数估计值,回归系数的t检验统计值,回归系数检验的P值,65,H0:b=0(x与y之间没有线性关系)H1:b0(x与y之间存在线性关系)检验统计量F,2.回归方程的显著性检验F检验,确定显著性水平,找出临界值F(1,n-2);计算统计量的样本观察值或P值;作出决策:若FF或P值,拒绝H0,66,回归方程的检验(Excel输出的结果),67,检验与t检验的一致性,在一元线性回归中,回归方程显著,就等于回归系数显著:F=t2,对回归系数的t检验:H0:=0(X与Y的线性关系不显著);H1:0(X与Y的线性关系显著),对回归方程的F检验:H0:=0(X与Y的线性关系不显著);H1:0(X与Y的线性关系显著),68,检验与t检验的不一致性,在多元回归中,回归方程显著,不等于每个回归系数都显著.,对回归系数的t检验:H0:i=0(Xi与Y的线性关系不显著);H1:i0(Xi与Y的线性关系显著),对回归方程的F检验:H0:1=2=K=0(所有Xi与Y的线性关系都不显著);H1:i不全为0(至少有一个X与Y的线性关系显著),69,三、回归预测,回归预测是根据自变量x的取值来估计或预测因变量y的取值;估计或预测的类型点估计,给定x=xo,因变量y对应的点估计为:区间估计:,70,区间预测,对于自变量x的一定值x0,在1-置信水平下,因变量y的取值y0的预测区间为:,其中,(P.208),71,影响估计区间宽度的因素,1.置信水平(1-a)区间宽度随置信水平的增大而增大2.回归估计标准差(Se)区间宽度随离散程度的增大而增大3.样本容量n区间宽度随样本容量的增大而减小4.用于预测的xo与x的差异程度。区间宽度随xo与x的差异程度的增大而增大,72,回归预测的置信区间,73,大样本下的预测区间,n充分大时,,X=x0时,y0的置信区间为:,其中,,74,大样本条件下的预测区间,75,注意,应用回归估计(预测)时注意:内插效果优于外推效果,不宜外推太远;内插:x0(xmin,xmax)时外推:x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动物的营养需要
- 生物物种安全保护体系建设
- 皮肤科湿疹药物治疗须知
- 职场沟通的技巧与方法
- 幼师教育家精神演讲稿
- 实习员工实习报告
- 2025版前列腺癌常见症状及护理方法指南
- 手环心率测试原理
- 脑卒中宣教护理品管圈
- 脑出血患者入院宣教
- 电厂入场安全培训要求课件
- 2025年广西水利工程行业研究报告及未来行业发展趋势预测
- 2025年社区工作者招聘考试(公共基础知识)试题及答案
- 护理领域新质生产力发展
- 新质生产力核心要素-1
- 专升本时态题目及答案
- 技术方案书模板产品设计与技术实施全面描述版
- 家电清洗课件培训
- 天然药物文献汇报
- 按不同的标准分类(课件)2025-2026学年人教版二年级数学上册
- 幼儿园评估整改措施汇编
评论
0/150
提交评论