




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节 相关分析概述,第二节 简单线性回归模型,第九章 相关与回归,联系与相互影响是普遍的现象,事物相互间关系的质的解释:自然的、社会的、经济的、心理的,事物相互间关系的量的分析:两变量或多变量间的数量关系。在可以解释的质的关系基础上进行相关分析和回归分析,统计学第九章 相关与回归,第九章 相关与回归,相关分析的意义,第一节 相关分析概述,社会经济现象中,一些现象与另一些现象之间往往存在着依存关系,当我们用变量来反映这些现象的的特征时,便表现为变量之间的依存关系。,在分析变量的依存关系时,我们把变量分为两种:,自变量,因变量,引起其他变量发生变化的量。,受自变量的影响发生对应变化的量,现象之间的相互关系,可以概括为两种不同的类型:,(一)函数关系 (二)相关关系,例如:家庭收入决定消费支出,收入的变化必然引起消费支出的变化,这两个变量中收入是自变量,而消费支出则是因变量。,相关分析的意义,函数关系可以用一个确定的公式,即函数式,来表示。,或:Y=F(X),例2、根据消费理论,商品需求量Q与商品价格P、居民收入I之间具有相关关系:,相关关系可用统计模型:,或:Y=F(X)+,式中,为影响Y的除X外的其他随机因素。,相关关系的种类:,1、按相关关系涉及的影响变量多少可分为:,相关关系的种类:,2、按相关关系的表现形式可分为:,相关关系的种类:,3、按线形相关的变动方向可分为:,线性正相关,统计学第九章 相关与回归,线性负相关,非线性相关,时间,无(不)相关,相关关系的种类:,4、按相关关系的密切程度分为:,完全相关,因变量完全随自变量变动而变动,存在着严格的依存关系。即变量间的关系为函数关系。,不完全相关,变量之间存在着不严格的依存关系,即因变量的变动除了受自变量变动的影响外,还受其他因素的影响。它是相关关系的主要表现形式。,完全不相关,自变量与因变量彼此独立,互不影响,其数量变化毫无联系。,(1)确定现象之间有无相关关系,以及相关关系的表现形态。 (2)确定相关关系的密切程度。 (3)确定相关关系的数字模型,并进行参数估计和拟合优度检验。 (4)回归预测,并分析估计标准误差。,相关分析的主要内容包括:,相关关系的测定,定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度,在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示,相关系数,其基本算法是英国统计学家皮尔逊所创的乘积动差法,简称积差法。,相关关系的定量测定,相关系数r的取值范围:-1r1,0|r|1表示存在不同程度线性相关: |r| 0.3为弱相关; 0.3 |r| 0.5为低度线性相关; 0.5 |r| 0.8为显著线性相关; 0.8|r| 1.0为高度线性相关。,r0 为正相关,r 0 为负相关; |r|=0 表示不存在线性关系; |r|1 表示完全线性相关;,【例】计算工业总产值与能源消耗量之间的相关系数 资料,结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2。,相关系数的计算,相关关系不等于因果关系; 相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系; 极端值可能影响相关系数。 注意相关关系成立的数据范围。 警惕虚假相关,使用相关系数时应注意的问题:,统计学第九章 相关与回归,回归:退回regression,1877年 弗朗西斯高尔顿爵士 遗传学研究 回归线,统计学第九章 相关与回归,第二节 简单线性回归模型,回归分析法产生的历史,回归分析法。由著名的英国生物学家、统计学家高尔顿(F.Gallton)达尔文的表弟所创。 早年,高尔顿致力于化学和遗传学领域的研究。 他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法。,父亲们的身高与儿子们的身高之间 关系的研究,1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 下图是根据1078个家庭的调查所作的散点图(略图),回归分析法产生的历史,回归分析法产生的历史,从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下: 如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”见1889年F.Gallton的论文普用回归定律。 后人将此种方法普遍用于寻找变量之间的规律,回归分析法产生的历史,第二节 简单线性回归模型,回归分析,通过一个变量x或一些变量(x1,x2,x3)的变化解释另一变量y的变化.即根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法,回归:退回regression,回归方程,回归模型,反映自变量和因变量之间数学联系的表达式。,某一类回归方程的总称。,自变量(independent variable):解释变量,给定的或可以控制的、用来解释、预测应变量的变量。 因变量(dependent variable):响应变量,由自变量来解释其变化的变量。,X,Y,统计学第九章 相关与回归,回归分析的内容和步骤,1、根据理论和对问题的分析判断, 区分自变量和因变量;,2、设法找出适合的数学方程式(即 回归模型)描述变量间的关系,3、对回归模型进行统计检验;,4、统计检验通过后,利用回归模型,根据解释变量去估计,预测 因变量。,回归分析的分类,根据变量的多少分为:,简单回归,多元回归,只有一个自变量和一个因变量的回归,自变量数目在两个或两个以上,根据建立的回归模型形式分为:,线性回归,非线性回归,从所拟合的回归模型来看,一变量表现为其它变量的线性组合。,从所拟合的回归模型来看,一变量表现为其它变量的非线性组合,回归分析与相关分析,理论和方法具有一致性; 无相关就无回归,相关程度越高,回归越好; 相关系数和回归系数方向一致,可以互相推算。,联系:,相关分析中x与y对等,回归分析中x与y要确定自变量和因变量; 相关分析中x、y均为随机变量,回归分析中只有y为随机变量; 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。,回归分析与相关分析,区别:,总体一元线性回归模型:,误差项,假定: E()=0,总体一元线性回归方程:,统计学第九章 相关与回归,简单线性回归模型,指根据成对的两个变量的数值,配合直线方程式,根据自变量的变动,来推算因变量发展变动趋势的方法,其模型为:,其中:Yi表示因变量Y在总体中某一个具体的观察值;Xi表示在研究总体中自变量X的具体观察数值;A与B是参数,称为回归系数;i是一个随机变量,其平均数为0,方差为2.,总体回归模型,在实际应用中,我们对X和Y所代表的总体往往不可能全面的观察和了解,而只能从中抽取部分资料作为样本,并通过样本提供的信息来认识总体,找出总体回归模型的估计式,其估计式的方程式可写为:,简单线性回归模型,其中:a,b和ei分别为A、B及i的估计量。,由于抽样的随机性,使样本回归线不可能与总体回归完全重合,从而会出现样本回归函数高估或低估总体回归函数的情况,我们能做的就是设法使样本回归函数尽可能接近总体回归函数,也就是说要使回归方程参数的估计值a、b尽量接近总体真实参数A、B。,样本回归模型,一元线性回归方程的几何意义,回归直线的拟合,总体一元线性 回归方程:,样本一元线性回归方程:,以样本统计量估计总体参数,斜率(回归系数),截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。,一元线性回归方程 中参数a、b的确定:,最小平方法,整理得到由两个关于a、b的二元一次方程组成的方程组:,进一步整理,有:,【分析】因为工业总产值与能源消耗量之间存在高度正相关关系( ),所以可以拟合工业总产值对能源消耗量的线性回归方程。,【例】建立工业总产值对能源消耗量的线性回归方程 资料,即线性回归方程为:,计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。,回归方程的估计与预测,估计的前提:回归方程经过检验,证明 X 和 Y 的关系在统计上是显著相关的。,对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值的预测值。,对于给定的 X 值,求出 Y 的平均值的置信区间或 Y 的一个个别值的预测区间。,点估计,区间估计,点估计,若 x = 80(十万吨),则:,估计的前提:回归方程经过检验,证明 X 和 Y 的关系在统计上是显著的。,回归分析的点估计:对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值。,若 x = 169,则:,统计学第九章 相关与回归,利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的。 点估计不能提供估计量的精确度。 在样本自变量取值范围之外进行预测要特别谨慎。,统计学第九章 相关与回归,使用点估计应注意的问题:,课后练习:,1若按影响因素的多少划分,相关关系分为 相关和 相关。 2当变量x值增加,变量y 值也增加,这是 相关关系;当变量x值减少,变量y 值也减少,这是 相关关系。 3直观而形象地显示现象间的相关关系的方法有 和 。 4现象的单相关关系从形式看有 和 两种。 5. 相关系数是测定变量之间 和 的代表性指标。 6. 相关系数是在 相关条件下用来说明两个变量相关 的统计分析指标。 7. 完全相关的关系即 关系,其相关系数为 。 8.相关系数绝对值的大小反映相关的 ,相关系数的正负反映相关的 。 9. 计算相关系数的两个变量都是 变量,相关系数的取值范围是 。,10当变量x 值增加时,变量y 值随之下降,那么变量x 与变量y 之间存在着( ) A.直线相关关系 B.正相关关系 C.负相关关系 D.曲线相关关系 11. 下列哪两个变量之间的相关程度最高( ) A.商品销售额和商品销售量的相关系数是0.9 B.商品销售额与商业利润率的相关系数是0.84 C.平均流通费用率与商业利润率的相关系数是-0.94 D.商品销售价格与销售量的相关系数是-0.91 12. 在回归分析中,对于没有明显因果关系的两变量( ) A.可给定自变量数值估计因变量的可能值 B.可给定因变量值推出自变量值 C可以都是随机变量 D可以都是非随机变量 13. 配合回归直线方程对资料的要求是( ) A.因变量是给定的数值,自变量是随机的 B.自变量是给定的数值,因变量是随机的 C.自变量和因变量都是随机的 D.自变量和因变量都不是随机的,1. 单,复
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年西安工业投资集团有限公司招聘(7人)考前自测高频考点模拟试题附答案详解(突破训练)
- 公司绞盘机司机职业健康技术规程
- 玻纤及制品检验工设备技术规程
- 高压成套设备装配配线工质量体系执行考核试卷及答案
- 2025内蒙古鄂尔多斯市杭锦旗教育领域校园专场招聘专业技术人员14人模拟试卷及答案详解(必刷)
- 2025湖南中医药大学第二附属医院招聘21人(第一批)考前自测高频考点模拟试题及答案详解参考
- 2025黑龙江哈尔滨铁道职业技术学院招聘4人模拟试卷及答案详解一套
- 2025年智能共享单车租赁合同
- 2025年水路货物运单(GF-91-0406)货物搬运合同协议
- 2025江苏省人民医院宿迁医院(宿迁市第一人民医院)博士专项招聘82人模拟试卷及一套参考答案详解
- 国家事业单位招聘2025国家林业和草原局直属事业单位第二批招聘应届毕业生初试有关安排笔试历年参考题库附带答案详解
- 湖南省2025年中考物理真题含答案
- 彩虹超轻粘土课件
- 结直肠癌课件
- 盆腔包虫CT课件
- 银行趣味测试题目及答案
- 2025年综合类-农艺师考试-农艺师考试-助理农艺师历年真题摘选带答案(5卷单选题100题)
- 2025中国电建成都院勘测设计分公司社会招聘笔试历年参考题库附带答案详解
- 冲压技术员考试试卷及答案
- 安徽省水环境综合治理工程计价定额2025
- 院感知识试题及答案
评论
0/150
提交评论