建模中的相关分析_第1页
建模中的相关分析_第2页
建模中的相关分析_第3页
建模中的相关分析_第4页
建模中的相关分析_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关分析,相关分析的意义,第一节 相关分析概述,社会经济现象中,一些现象与另一些现象之间往往存在着依存关系,当我们用变量来反映这些现象的的特征时,便表现为变量之间的依存关系。,在分析变量的依存关系时,我们把变量分为两种:,自变量,因变量,解释变量-引起其他变量发生变化的量。,或响应变量-受自变量的影响发生对应变化的量,现象之间的相互关系,可以概括为两种不同的类型:,(一)函数关系 (二)相关关系,例如:家庭收入决定消费支出,收入的变化必然引起消费支出的变化,这两个变量中收入是自变量,而消费支出则是因变量。,是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全

2、依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上,y,X,函数关系,如:销售额与销售量; 圆面积和圆半径,变量间关系不能用函数关系精确表达; 一个变量的取值不能由另一个变量唯一确定; 当变量 x 取某个值时,变量 y 的取值可能有几个; 各观测点分布在 直线周围 。 5. 现象之间客观存在 的不严格、不确定的 数量依存关系。,y,X,相关关系,相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)

3、与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系,概述,相关关系的常见类型: 线性相关: 非线性相关 相关关系不象函数关系那样直接,但却普遍存在,且有强有弱.如何测度?,正线性相关、负线性相关,相关分析,(一)目的 通过样本数据,研究两变量间线性相关程度的强弱.(例如:投资与收入之间的关系、商品销售额与广告费支出之间的数量关系) (二)基本方法 绘制散点图、相关系数,绘制散点图,(一)散点图 将数据以点的形式绘制在直角平面上.比较直观,可以用来发现变量间的关系和可能的趋势.,不相关,正线性相关,负

4、线性相关,相关但非线性相关,相关分析的应用举例-散点图,例1:为研究高等院校人文社会科学研究中立项课题受哪些因素的影响,收集2005年31个省市自治区部分高校有关社科研究方面的数据。 研究立项课题与投入的具有高级职称的人数、发表的论文数之间是否具有较强的线性关系。数据见“高校科研研究”。,方法:相关分析,首先可绘制散点图 其次计算相关系数,相关系数,相关系数 (1)作用: 相关系数(r)以数值的方式精确地体现两个变量间的线性关系程度.,(2)分析步骤: 1、计算样本相关系数 r 2、相关系数检验,r:-1,+1; 1r0,为负相关; 0r1,为正相关 r=1:完全正相关; r=-1:完全负相关

5、; r=0:无线性相关; |r|0.8:强相关; |r|0.3:弱相关,计算相关系数,(一)、计算样本相关系数 r,对不同类型的变量采用不同的相关系数指标,但它们的取值范围和含以都是相同的,一般地,计算相关系数,说明: 相关系数只是较好地度量两变量间的线性相关程度,不能描述非线性关系. 数据中存在极端值时不好 如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1) r=0.33 但总体上表现出: x=y 应结合散点图分析,相关系数的种类,种类: 简单线性相关系数(Pearson): 针对定距数据.,注:该相关系数的局限性: 要求变量服从正态分布, 样本中存在的极端值对积差相关系

6、数的影响极大,因此要慎重考虑和处理,必要时可以对其进行剔出,或者加以变量变换,以避免因为一两个数值导致出现错误的结论。,计算相关系数,Spearman相关系数: 用来度量定序变量间的线性相关关系(如:不同年龄段与不同收入段,职称和受教育年份) Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。,计算相关系数,Kendall相关系数: 度量定序变量间的线性相关关系 首先计算一致对数目(U)和非一致对数目(V) 如: 对x和y求秩后为: x: 2 4 3 5 1 y: 3 4 1 5 2 x的秩按自然顺序排序

7、后: x: 1 2 3 4 5 y: 2 3 1 4 5 然后计算Kendall相关系数. 若两变量存在强相关性,则V较小,秩序相关系数较大;若两变量存在强负相关性,则V较大,秩序相关系数为负,绝对值较大,计算相关系数,相关系数检验,一般情况下,总体相关系数是未知的,通常用r作为 的近似值。但由于r 是根据样本计算出来的,它受抽样误差的影响。由于抽取的样本不同,r 的取值也不同,能否用r说明总体的相关程度呢?,这就需要考查r 的可靠性也就是进行显著检验,系数 系数 Gamma等级相关系数 萨默斯系数(d系数),相关分析的应用举例-相关系数,例1:为研究高等院校人文社会科学研究中立项课题受哪些因素的影响,收集2005年31个省市自治区部分高校有关社科研究方面的数据。 研究立项课题数与投入的具有高级职称的人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论