版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一节第一节 相关与回归概述相关与回归概述第三节第三节 一元线性回归分析一元线性回归分析第二节第二节 相关关系的测度相关关系的测度第四节第四节 多元线性回归分析多元线性回归分析第八章第八章 相关与回归相关与回归第五节第五节 非线性回归分析非线性回归分析联系与相互影响是普遍的现象联系与相互影响是普遍的现象受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率事物相互间关系的质的解释:自然事物相互间关系的质的解释:自然的、社会的、经济的、心理的的、社会的、经济的、心理的事物相互间关系的量的分析:两变事物相互间关系的量的分析:两变量或多变量间的数量关系。在量
2、或多变量间的数量关系。在可以可以解释的质的关系基础上解释的质的关系基础上进行相关分进行相关分析和回归分析析和回归分析一、相关关系的概念一、相关关系的概念第一节第一节 相关与回归概述相关与回归概述 在分析变量的依存关系时,我们把变量分为在分析变量的依存关系时,我们把变量分为两种:两种:自变量自变量因变量因变量引起其他变量发生变化的量。引起其他变量发生变化的量。受自变量的影响发生对应变化的量受自变量的影响发生对应变化的量例如:家庭收入决定消费支出,收入的变例如:家庭收入决定消费支出,收入的变化必然引起消费支出的变化,这两个变量化必然引起消费支出的变化,这两个变量中收入是中收入是自变量自变量,而消费
3、支出则是,而消费支出则是因变量因变量。指变量之间存在着确定性依存关指变量之间存在着确定性依存关系。即当一个或一组变量每取一系。即当一个或一组变量每取一个值时,相应的另一个变量必然个值时,相应的另一个变量必然有一个确定值与之对应有一个确定值与之对应 。 函数关系可以用一个确定的公式,即函数式函数关系可以用一个确定的公式,即函数式 21rS、圆面积例来表示。来表示。 ),(21nxxxfy或:Y=F(X)指变量之间存在着非确定性依存指变量之间存在着非确定性依存关系。即当一个或一组变量每取关系。即当一个或一组变量每取一个值时,相应的另一个变量可一个值时,相应的另一个变量可能有多个不同值与之对应能有多
4、个不同值与之对应 。 例例2、根据消费理论,商品需求量、根据消费理论,商品需求量Q与商品与商品价格价格P、居民收入、居民收入I之间具有相关关系:之间具有相关关系: 21bbIaPQ),(21nxxxfy或:Y=F(X)+式中,为影响式中,为影响Y的除的除X外的其他随机因素。外的其他随机因素。 是两个变量之间存在的相关关是两个变量之间存在的相关关系,即一个因变量与一个自变量系,即一个因变量与一个自变量之间的依存关系。因此也称为之间的依存关系。因此也称为也称多元相关,是指三个或三个也称多元相关,是指三个或三个以上变量之间存在的相关关系,以上变量之间存在的相关关系,通常涉及一个因变量与两个或更通常涉
5、及一个因变量与两个或更多个自变量,也称多个自变量,也称(一)按相关关系涉及变量的多少可分为:(一)按相关关系涉及变量的多少可分为:(二)、按相关的方向可分为:(二)、按相关的方向可分为:体 重90807060504030身高180170160150线性正相关线性正相关支 出700600500400300200成绩100806040200线性负相关线性负相关非线性相关非线性相关(三)按相关关系形式可分为:(三)按相关关系形式可分为:(四)按相关关系的密切程度分为:(四)按相关关系的密切程度分为:体 重90807060504030成绩100806040200无(不)相关无(不)相关三、相关分析与回
6、归分析三、相关分析与回归分析(一)相关分析(一)相关分析对现象之间相关关系密切程度的研究,称为对现象之间相关关系密切程度的研究,称为相关分析。相关分析。相关分析的主要内容包括相关分析的主要内容包括:(1 1)确定现象之间有无相互依存关系,)确定现象之间有无相互依存关系,并确定是否是相关关系。并确定是否是相关关系。(2 2)确定相关关系的表现形式。)确定相关关系的表现形式。(3 3)判定相关关系的密切程度和方向。)判定相关关系的密切程度和方向。 (二)回归分析(二)回归分析1、回归与回归分析、回归与回归分析回归分析是对具有相关关系的变量之间的数回归分析是对具有相关关系的变量之间的数量关系形式进行
7、测定,将它们之间的关系用量关系形式进行测定,将它们之间的关系用数学表达式描述出来,并据此对因变量进行数学表达式描述出来,并据此对因变量进行估计和预测的分析方法。估计和预测的分析方法。回归:退回回归:退回regression1877年年 弗朗西斯弗朗西斯高尔顿爵士高尔顿爵士 遗传遗传学研究学研究 回归线回归线平均身高平均身高回归分析法产生的历史回归分析法产生的历史p回归分析法。由著名的英国生物学家、统计学家回归分析法。由著名的英国生物学家、统计学家高尔顿(高尔顿(F.Gallton)达尔文的表弟所创。达尔文的表弟所创。p早年,高尔顿致力于化学和遗传学领域的研究。早年,高尔顿致力于化学和遗传学领域
8、的研究。p他研究父亲们的身高与儿子们的身高之间的关系他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法。时,建立了回归分析法。父亲们的身高与儿子们的身高之间父亲们的身高与儿子们的身高之间关系的研究关系的研究 1889年年F.Gallton和他的朋友和他的朋友K.Pearson收集了收集了上千个家庭的身高、臂长和腿长的记录上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式具体表现形式 下图是根据下图是根据1078个家庭的调查所作的散点图个家庭的调查所作的散点图(略图)(略图)yx160165170175
9、180185140150160170180190200YX儿子们身高向着平均身高儿子们身高向着平均身高“回归回归”,以保持种族的稳定,以保持种族的稳定 从图上虽可看出,个子高的父亲确有生出从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到父亲确有生出个子低的儿子的倾向。得到的具体规律如下:的具体规律如下:xyubxay516. 033.84 如此以来,高的伸进了天,低的缩入了地。他如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高百思不得其解,同时又发现某人种的平均身高是
10、相当稳定的。最后得到结论:儿子们的身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即回复于全体男子的平均身高,即“回归回归”见见1889年年F.Gallton的论文的论文普用回归定律普用回归定律。 后人将此种方法普遍用于寻找变量之间的规律后人将此种方法普遍用于寻找变量之间的规律 2、回归分析的类型、回归分析的类型(1)根据变量的多少分为:)根据变量的多少分为:一元回归一元回归多元回归多元回归只有一个自变量和一个因变量的回归只有一个自变量和一个因变量的回归自变量数目在两个或两个以上自变量数目在两个或两个以上(2)按变量变化的表现形式分为:)按变量变化的表现形式分为:线性回归
11、线性回归非线性回归非线性回归3、回归分析的主要内容、回归分析的主要内容(1 1)利用样本数确定变量之间的数学表达式。)利用样本数确定变量之间的数学表达式。(2 2)对回归方程、参数估计值进行显著性检)对回归方程、参数估计值进行显著性检验。验。(3 3)根据回归方程对因变量进行估计和预测。)根据回归方程对因变量进行估计和预测。q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,无相关就无回归,相关程度越高,回归越好;回归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。q两者的任务和目的不同。两者的任务和目的不同。 相关分析只
12、测定相关程度和方向,回归分相关分析只测定相关程度和方向,回归分析则建立回归模型反映变量间相互关系的具体析则建立回归模型反映变量间相互关系的具体形式,并根据模型进行预测和控制;形式,并根据模型进行预测和控制;q两者所涉及的变量在性质上的不同。两者所涉及的变量在性质上的不同。 相关分析中相关分析中x与与y对等,均为随机变量,回对等,均为随机变量,回归分析中归分析中x与与y要确定自变量和因变量,只有要确定自变量和因变量,只有y为随机变量。为随机变量。第二节第二节 相关关系的测度相关关系的测度定性分析定性分析定量分析定量分析将两个变量伴随变动结果编成将两个变量伴随变动结果编成一张统计表,即一张统计表,
13、即相关表相关表。两个变量两个变量均不分组均不分组而形成而形成的相关表。的相关表。对变量进行对变量进行分组分组而形成的相而形成的相关表。依两个变量是否同时关表。依两个变量是否同时分组,又分为:分组,又分为:只对其中一个变量分组。只对其中一个变量分组。对两个变量同时分组。对两个变量同时分组。企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35
14、40404545505055 5560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百万元)(百万元)(吨)(吨)YfXf2020个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量将变量之间的伴随变动绘于坐标图上将变量之间的伴随变动绘于坐标图上所形成的统计图。又称所形成的统计图。又称散点图,散布散点图,散布图图。根据根据未分组资料未分组资料的原始数据直接的原始数据直接绘制的相关图。绘制的相关图。根据根据分组资料分组资料绘制的相关图。绘制的相关图。正正
15、 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy用直角坐标系的用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因轴代表因变量,将两个变量间相对应的变量值用坐标变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状点的形式描绘出来,用以表明相关点分布状况的图形。况的图形。体 重90807060504030身高180170160150XY在在的条件下,用以反映的条件下,用以反映两变量两变量 间间密切程度的相关系数称为简单相关系数。密切程度的相关系数称为简单相关系数。相关系数是测度变量之间相关关系程度的指标。相关系数是测度变量之间相关关系程度的指
16、标。2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxy其基本算法是英国统计学家皮尔逊所创的其基本算法是英国统计学家皮尔逊所创的乘积动差法,简称积差法。乘积动差法,简称积差法。若相关系数是依据总体全部数据计算的,称为若相关系数是依据总体全部数据计算的,称为总体相关系数。记为总体相关系数。记为;若是依据样本数据计若是依据样本数据计算的,则称为样本相关系数,即为算的,则称为样本相关系数,即为r 。相关系数相关系数r r的取值范围:的取值范围:r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在线性关系;表示不存在线性关系;|r|1 表示表示完全线性相关
17、完全线性相关; |r| 0,则,则F值值0。当我们设当我们设 1 = 0 时,则较大的时,则较大的F值值将推翻这一假设。将推翻这一假设。)2,1(nFMSEMSRF384RSS158ESS32. 5)8 , 1 (),(05. 021 FnnF44.198158384)21nESSRSSMSEMSRF(0:0:1110HHFF 故拒绝原假设,接受备择假设,故拒绝原假设,接受备择假设,即认为回归方程是显著的。即认为回归方程是显著的。估计的前提:估计的前提:回归方程经过检验,证明回归方程经过检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。 对于给定的对于给定的 X
18、 X 值,求出值,求出 Y Y 的一个预测的一个预测值。值。0 xbxayyxxy7961.05142.6对于若若 x = 80(十万吨),则:(十万吨),则:亿元1738.57807961. 05142. 6y1. 点预测不能提供预测的精确度。点预测不能提供预测的精确度。2. 在样本自变量取值范围之外进行预在样本自变量取值范围之外进行预测要特别谨慎。测要特别谨慎。使用点预测应注意的问题:使用点预测应注意的问题:ybxayx0 x对于给定的对于给定的 x = x0 ,Y 的的1- 置信区间为置信区间为对于给定的对于给定的 X X 值,求出值,求出 Y Y 的平均值的平均值的的置信区间置信区间或或 Y Y 的一个个别值的的一个个别值的预测预测区间。区间。yty20自由度为自由度为n-2的的 t 分布分布的的 水平双侧分位数水平双侧分位数nxxxxnStyyx222020)()(1122nxybyaySyx 对于给
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年北京城投国际物流集团有限公司天津科技分公司招聘备考题库有答案详解
- 2026年慈溪市上林人才服务有限公司公开招聘派遣制安全生产服务内勤人员备考题库参考答案详解
- 2026年华中科技大学职工队伍公开招聘25人备考题库及一套参考答案详解
- 2026年宁波科创中学第二批公开招聘事业编制教师13名备考题库完整答案详解
- 2026年北矿新材科技有限公司招聘备考题库及一套参考答案详解
- 2026年上海当代艺术博物馆公开招聘工作人员备考题库(第二批)附答案详解
- 2026年丽水市雷博劳动事务代理有限公司关于招聘派遣制消防员备考题库含答案详解
- 2026年子洲县裴家湾中心卫生院招聘备考题库及完整答案详解1套
- 2026年宿州市某医疗单位招聘工作人员备考题库及完整答案详解一套
- 2026年成都市双流区东升第一初级中学招聘教师备考题库附答案详解
- 抑郁病诊断证明书
- 历史时空观念的教学与评价
- 维克多高中英语3500词汇
- 病理生理学复习重点缩印
- 第五届全国辅导员职业能力大赛案例分析与谈心谈话试题(附答案)
- 《大数的认识》复习教学设计
- GB/T 3513-2018硫化橡胶与单根钢丝粘合力的测定抽出法
- GB/T 34590.3-2017道路车辆功能安全第3部分:概念阶段
- 部编版新人教版一年级上册生字表拼音田字格
- 统编教材部编人教版小学语文习作单元教材解读培训课件:统编小语四-六年级习作梳理解读及教学建议
- 国家开放大学电大《公共部门人力资源管理》期末考试题库及答案
评论
0/150
提交评论