版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第12章典型相关分析,12.1典型相关分析概述12.2典型相关分析的数学描述12.3典型相关分析的案例分析12.4典型相关分析的应用,1。在单变量统计分析中,两个随机变量之间的线性相关可以用简单的相关系数来研究;为了研究一个随机变量和多个随机变量之间的线性相关性,可以使用复相关系数。但是如果我们想研究两组变量之间的相关性,这些统计方法是无能为力的。在现实生活中,有许多问题都与这两组变量有关,如投资变量(如工人数量、货物周转率、生产建设投资等)。)和国民收入变量(如工农业国内收入、交通运输业国内收入、建筑业国内收入等。);运动员的体能测试指标(如重复侧跳、纵跳、背力、握力等)之间存在相关性。)和
2、运动能力测试指标(如耐力跑、跳远、投球等。)。1936年,霍特林首次提出典型相关分析法来研究一组随机变量与另一组随机变量之间的相关性。它借用主成分分析的思想,根据变量之间的相关性寻找一对或几对合成变量(观测变量的线性组合)来代替原始变量,从而将两组变量之间的关系集中在几对合成变量之间的关系上。2,12.1典型相关分析概述典型相关分析是一种研究两组变量之间相关性的多元统计分析方法。如果两组变量用和表示,一种方法是分别研究和之间的相关性,然后列出相关系数表进行分析。当两组变量较多时,这种方法不仅繁琐,而且难以把握问题的现实性。另一种方法是采用类似于主成分分析的方法,在每组变量中选取几个有代表性的综
3、合指标(变量的线性组合),通过研究两组综合指标之间的关系来反映两组变量之间的相关性。典型相关分析的问题是如何找到综合指标并使它们具有最大的相关性。典型相关分析首先找出每组变量中变量的线性组合,使其具有最大相关性,然后找出每组变量中的第二对线性组合,使其与第一对线性组合无关,而第二对本身具有最大相关性,以此类推,直到两组变量之间的相关性被提取出来。这些综合变量被称为典型变量或典型变量,第一对典型变量之间的相关系数被称为第一典型相关系数。一般来说,样本信息只有通过提取典型变量才能得到充分的总结。4、使用和的线性组合之间的相关性来研究和之间的相关性。典型相关分析的目的是找出向量A和B,并使它们最大化
4、,从而找到典型变量U和V来代替原始变量。在实际问题中,样本的典型相关系数和典型变量也可以从样本的相关矩阵中计算出来。可以证明,当两个变量组只有一个变量时,典型的相关系数是简单相关系数;当一组变量只有一个变量时,典型的相关系数是复相关系数。因此,可以认为典型相关系数是简单相关系数和复杂相关系数的延伸,或者简单相关系数和复杂相关系数是典型相关系数的特例。6,7,8,9,12.3典型相关分析示例分析12.1为了研究行业观点和观众对某些电视节目的看法之间的关系,对某个地方的30个电视节目进行了问卷调查,并给出了平均得分。收视率来自三种类型:低教育(led),高教育(hed)和网络(net)调查,这形成
5、了第一组变量;里面的分数对于这个问题,如果我们直接成对地分析这六个变量之间的相关性,就很难对这两组变量之间的关系有一个清晰的印象。因此,我们希望能够把多个变量之间的相关性转化为两个变量之间的相关性,这样我们就可以用主成分分析法进行分析。打开电视后在SPSS中运行。Sav文件如下:1)选择菜单:通过文件新的语法打开一个空白文件(默认文件名为语法1.sps),然后在其中键入以下命令行:man ova led hed net with artition man/disc rim all alpha(1)/print=SIG(特征值)。可以得到典型的相关分析结果。由于有许多输出内容,下面将进行解释。图
6、12.1、12中的人和观众对电视台的评价数据,表1是判断这两组变量之间相关性的若干测试,包括皮莱跟踪测试、霍特林-劳利跟踪测试、威尔克斯测试和罗伊最大根测试;它们都是具有两个自由度的f检验。该表给出了每次试验的f值、两个自由度和p值(均为0.000)。表1相关的一些测试,表2给出了特征值,特征根的百分比(Pct)和累积百分比(Cum)。典型相关系数及其平方。科尔)。似乎前两对典型变量(V,W)的累积特征根占总数的99.427%。它们的典型相关系数都在0.95以上。表2。特征根和典型相关系数,14,对于许多计算机输出,挑选一些介绍。下表显示了对应于上述三个特征根的三个典型变量V1、V2和V3的第
7、一组变量的系数,即典型系数。注意,SPSS调用第一组因变量和第二组协变量。显然,这两组变量是完全对称的。这个名字只是为了描述方便。这些系数以两种方式给出;一个是未经标准化的原始变量线性组合的原始典型系数,另一个是标准化的典型系数。标准化典型系数直观地让人们对典型变量的构成有更清晰的印象。表3非标准化系数,表4标准化系数,表16可以看出,第一个典型变量V1对应于前面的第一个(也是最重要的)特征值,主要代表高学历变量hed;然而,与第二(二级)特征值相对应的第二典型变量V2主要代表低教育变量led和网民变量网的一部分,但高教育变量在这里起着负面作用。第一个变量的前三个典型变量V1、V2和V3中的V
8、1和V2的表达式:可以从表4中获得。类似地,也可以获得对应于被称为协变量的标准化的第二组变量的前三个特征值的三个典型变量W1、W2和W3的系数。从该表中,我们可以得到(对于标准化变量arti、com和man)描述第二祖先变量的前三个典型变量W1、W2和W3中的W1和W2的表达式:并且我们还可以得到每个典型变量v和第一组变量之间的相关系数,如表6所示,以及每个典型变量w和第二组变量之间的相关系数,如表7所示。从这两个表中可以看出,V1主要与变量hed (0.99329)有关,而V2主要与led(0.92484)和net(0.75305)有关;W1主要与变量arti(0.99696)和man(0.
9、92221)有关,而W2主要与com(0.81123)有关。这与它们的典型系数一致。20,因为V1和W1 arti最相关,这表明以V1为代表的高学历观众与以W1为主要代表的艺术家和部门经理的观点有关;然而,V2和W2也是相关的,这表明V2代表了一个低学历(领导)和以年轻人为导向的互联网用户(网络),W2主要代表了一个重视经济效益的出版商(网站),但它远不如V1和W1显著(根据特征值的贡献率)。,21,12.4典型相关分析的应用,在分析变量之间的相关强度时,如果手里有很多变量纠缠在一起而不知道如何开始,此时有必要冷静地思考。如果我们能根据定性分析来梳理变量的层次结构,并判断某个变量受其他几个变量
10、的影响,那么复相关分析和偏相关分析是很好的选择。如果你不能弄清楚变量之间的关系,你只能把它们分成两类,或者如果变量的结构太复杂,更好的选择是典型相关分析,但这只是数据分析的第一步。在发现数据中包含的基本规律后,最好使用其他更精确的多元统计分析模型进行深入分析。例如,结构方程模型是一个更好的选择,它可以进一步验证研究者基于典型相关分析结果提出的假设。22,在进行典型相关分析之前,有必要对两个变量组进行初步分析,以判断变量组之间的影响是双向相关还是单向因果关系,这对结果的解释非常重要。例如,本节中的示例是单向因果关系,因此无法使用输出结果中的某些数据。在分析所有输出结果时,我们应该注意关键点和主次关系。最重要的是典型相关系数、典型变量的表达和典型结构分析。首先,根据典型相关系数及其检验和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年土地流转转让合同(1篇)
- 高中信息技术信息系统在水果批发市场交易信息与物流配送管理中的应用课件
- 架空线下地改造工程项目可行性研究报告
- 新能源汽车基础培训【课件文档】
- 无线通讯设备生产项目可行性研究报告
- 行李箱轮子保养与拉杆顺滑处理
- 2026年及未来5年市场数据中国家电连锁行业市场发展数据监测及投资战略咨询报告
- 高中信息技术信息系统在服装干洗店业务流程与客户服务管理中的应用课件
- 2025 高中信息技术数据与计算之算法的拉格朗日插值算法课件
- 2025 高中信息技术数据与计算之数据在智能农业作物产量预测模型优化中的应用课件
- 幼儿园区域材料投放讲座
- 2024ABB PIHF谐波滤波器用户手册
- 国家职业标准 -碳排放管理员
- 销售加速公式培训课件
- 设备报废配件管理制度
- 冀教版五年级下册小学英语全册单元测试卷(含听力音频文件)
- 琉璃瓦施工合同协议书
- 《动物营养学》全套教学课件
- 车间物料流转管理制度
- 《人工智能安全导论》 课件 第五章 人工智能技术在网络入侵检测领域
- 《康复评定技术》课件-第二章 人体形态与反射评定技术
评论
0/150
提交评论