《数学建模相关分析》PPT课件.ppt_第1页
《数学建模相关分析》PPT课件.ppt_第2页
《数学建模相关分析》PPT课件.ppt_第3页
《数学建模相关分析》PPT课件.ppt_第4页
《数学建模相关分析》PPT课件.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关分析-偏相关分析,在多变量的情况下,变量之间的相关关系是很复杂的。因此,多元相关分析除了要利用上一讲的简单相关系数外,还要计算偏相关系数 。 在对其他变量的影响进行控制的条件下,衡量多个变量中某两个变量之间的线性相关程度的指标称为偏相关系数。,偏相关系数与简单相关系数区别,在计算简单相关系数时:只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。 在计算偏相关系数时:需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定的方法控制其他变量,专门考察两个特定变量的净相关关系。,变量1,变量2,关系,变量3,控制,例: 在现实经济生活中,由于收入和价格常常都有不断提高的趋势,如果不考虑收入对需求的影响,仅仅利用需求和价格的时间序列数据去计算简单相关系数,就有可能得出价格越高需求越大的错误结论。,偏相关分析的公式表达,在偏相关中,根据固定变量数目的多少,可分为零阶偏相关、一阶偏相关、(p-1) 阶偏相关。零阶偏相关就是简单相关。如果用下标 0 代表 Y,下标 1 代表 X1,下标 2 代表X2,则变量Y与变量X1之间的一阶偏相关系数为: r01.2是剔除 X2 的影响之后,Y 与 X1 之间的偏相关程度的度量。 r01,r02 ,r12分别是Y ,X1 ,X2两两之间的相关系数。,如果增加变量X3,则变量Y与X1的二阶偏相关系数为: 依此类推变量Y与Xi的p-1阶偏相关系数为:,第四部分 偏关分析的SPSS过程,SPSS中相关分析可以通过Analyze菜单进行(Correlate),Correlate菜单如图所示。 选择其中第二个子菜单进入到偏相关分析界面(Partial),第一步:录入数据,打开偏相关分析对话框。 第二步:将对话框中左侧的变量列表框中选择两个变量,作为相关变量,移入Variables列表框中;选择一个控制变量移入Controlling for列表框中,第三步:选择检验类型。,变量窗口,显著性检验: 双尾检验(默认) 单尾检验(相关方向明显时),显示相关系数时,显示实际的显著性概率,相关变量,控制变量,第四步:打开OPTION选项框。,均值与标准差,即显示每个变量的均值、标准差和非缺失值的例数,显示零阶相关矩阵,即Pearson相关矩阵,仅剔除当前分析的两个变量值是缺失值的个案,剔除带有缺失值的所有个案,已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。试分析温度与河水流量之间的相关关系。,相关分析的命令语句,结果分析,一、描述性统计量 表中给出了个变量的均值、标准差和变量的非缺失值例数。,相关系数,在月平均雨量作为控制变量的条件下,月平均流量和月平均气温间的偏相关为0.365,概率p值为0.270,在显著性水平为0.05的条件下,月平均流量和月平均气温呈的正相关关系,说明月平均流量和月平均气温的有线性影响但影响有限。,解释,看上去得到了两个相反的结论,为什么呢?,距离分析,一、距离分析的概念 距离分析是对观测量之间或变量之间相似或不相似程度的一种测度,是计算一对变量之间或一对观测量之间的广义的距离。这些相似性或距离测度可以用于其它分析过程,例如因子分析、聚类分析等。 在距离分析过程中,主要利用变量间的相似性测度(Similarities)和不相似性测度(Dissimilarities)度量两者之间的关系,有多像OR 有多不像?,不相似性测度,对定距型变量间距离描述的统计量,主要有: 欧式距离(Euclidean distance) 欧式距离的平方(Squared Euclidean distan-ce ) 契比雪夫距离(Chebychev) 绝对值距离(Block) 闵可夫斯基距离(Minkowski)等。,对定序型变量之间距离的描述,主要有: 卡方不相似测度(Chi-Square measure) Phi方不相似测度(Phi-Square measure),对二值变量之间的距离描述,主要有: 欧氏距离(Euclidean distance) 平方欧氏距离(Squared Euclidean distance ) Lane and Williams不相似性测度( Lane and Williams )等。,相似性测度,两变量之间可以定义相似性测度统计量,用来对两变量之间的相似性进行数量化描述。针对定距型变量,主要有: Peason相关系数 夹角余弦距离等。 对于二值变量的相似性测度主要包括: 简单匹配系数(Simple matching) Jaccard相似性指数(Jaccard) Hamann相似性测度(Hamann)等20余种。 相似性或不相似性测度还可用与其它模块,例如:因子分析、聚类分析以及多维尺度分析的进一步分析,以助于分析复合数据集。,已知有我国六城市2004年各月的日照时数数据如表所示。请分析各城市日照数是否近似。,执行【Analyze】/【Correlate】/【Distances】命令,弹出【Distances】对话框,变量列表,选择变量,个案(观测量)标识变量,计算距离选项: 个案距离,计算个案间的距离; 变量距离,计算变量之间的距离,度量方式,等距间隔数据选项,计数数据选项,二值数值选项,转换转换选项,转换测度选项,结果解读,取值越大说明近似程度越低,反之亦然,例:测得30名13岁男童的身高、体重、肺活量的数据。对身高、体重和肺活量进行变量距离分析。,距离分析命令语句,PROXIMITIES 身高 体重 肺活量 /VIEW=VARIABLE /MEASURE= CORRELATION /STANDARDIZE= NONE .,结果分析,距离分析的相似性矩阵,也就是Pearson相关系数矩阵。从表中可以看出,3个变量之间,身高和体重的相关系数最大,为0.735,体现出两者之间具有更紧密的关系。比较而言,身高和肺活量之间的Pearson相关系数最小,两者之间的相似性测度也最小,体现出两者之间关系更远一些。,实例二 对飞机叶片的个案距离分析,利用三种不同的仪器对飞机的10只叶片半径分别进行了测量,下表给出了测试结果。现对10只叶片进行距离分析。,步骤,将三次测量变量移入变量列表,选择“Bewteen cases”其余选择默认值。 命令语句为: PROXIMITIES 第一次 第二次 第三次 /VIEW=CASE /MEASURE= EUCLID /STANDARDIZE= NONE .,距离分析的相似性矩阵,上表是个案距离分析的不相似矩阵。由于操作中利用默认选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论