厦门大学《应用多元统计分析》第08章相应分析_第1页
厦门大学《应用多元统计分析》第08章相应分析_第2页
厦门大学《应用多元统计分析》第08章相应分析_第3页
厦门大学《应用多元统计分析》第08章相应分析_第4页
厦门大学《应用多元统计分析》第08章相应分析_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章 相应分析第一节 引 言 第二节 列联表 第三节 相应分析的基本理论 第四节 相应分析中应注意的问题 第五节 实例分析与计算机实现 第一节 引 言n 相应分析 (correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。n 在社会、经济以及其他领域中,进行数据分析时经常要处理因素与因素之间的关系,及因素内部各个水平之间的相互关系。例如,评价某一个行业所属企业的经济效益,我们不仅要研究因素 A,即企业按照经济效益好坏的分类情况,以及要研究因素 B,即经济效益指标之间的关系,还要研究哪些企业与哪些经济效益指标更密切一些。这就需要相应分析的方法,将经济效益指标和企业状况放在一起进行分类、作图,以便更好的描述两者之间的关系,在经济意义上做出切合实际的解释。 n 相应分析的思想首先由理查森( Richardson)和库德(Kuder)于 1933年提出,后来法国统计学家让 -保罗 贝内泽( Jean-Paul Benzcri)等人对该方法进行了详细的论述而使其得到了发展。为了把握相应分析方法的实质,本章将从列联资料入手,介绍一些基本概念和相应分析的基本理论,并让读者理解相应分析与独立性检验的关系,进一步明确对实际问题进行相应分析研究的必要性所在。 第二节 列联表一 列联表的概念二 有关记号 一、列联表的概念n 在实际中经常要了解两组或多组因素 (或变量 )之间的关系。设有两组因素 A和 B,其中因素 A包含 r个水平,即 A1, A2, , Ar;因素 B包含 c个水平,即 B1 , B2 , , Bc 。又设有受制于这两个因素的载体 (或客体 )的集合总体 。我们希望通过对总体 关于这两组因素的有关资料 (或抽样资料 ),来分析这两组因素的关系。n 例如,要考查在某个人群中关于吸烟或不吸烟 (因素 A)与得肺癌或不得肺癌 (因素 B)两组因素之间的关系。通常的作法是,随机地从该人群中抽样,对这两种因素进行调查,设调查了 k个人,得到一个二维列联表,见表 8.1。 n 其中, kij为调查的 k人中出现因素 A的第 i个水平和因素 B的第 j个水平的人数。这样,我们就得到一个两因素,即吸烟与是否得肺癌的 2 2列联表。 表 8.1 二维列联表 n n 表 8.2 一般的二维列联表二、有关记号n 为了叙述方便,先引进一些基本概念和记号。n 设 K=(kij)r c为一个 r c的列联表 (表 8.2),称元素 kij为原始频数。将列联表 K转化为频率矩阵,记为 F=(fij) r c ,见表 8.3。 表 8.3 一般的二维频率表 n n n n 第三节 相应分析的基本理论一 原始资料的变换 二 基于矩阵的分析过程 n 我们知道相应分析的主要目的是寻求列联表行因素 A和列因素 B的基本分析特征和它们的最优联立表示。为了实现行因素 A与列因素 B最优联立表示,进一步剖析行因素 A内部之间,列因素 B内部之间,以及因素 A和列因素 B之间的关系,这里将介绍原始的列联资料 K=(kij) r c变换成矩阵 Z=(zij) r c的具体过程,这样使得 zij对因素 A和列因素 B具有对等性,在此基础上进行相应分析。 一、原始资料的变换n n 二、基于矩阵的分析过程n ( 8.14)式表明 Zuj为相对于特征值 j的关于因素 A各水平构成的协差阵 r的特征向量。这样我们就建立了相应分析中 R型因子分析和 Q型因子分析的关系。也就是说,我们可以从R型因子分析出发而直接得到 Q型因子分析的结果。n 这里需要强调的是,由于 r和 c有相同的特征根,而这些特征根又表示各个公共因子所提供的方差。那么,在因素 B的 c维空间 Rc中的第一公共因子,第二公共因子直到第 m个公共因子与因素 A的 r维空间 Rr中相对于的各个主因子在总方差中所占的百分比就完全相同。这样就可以用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,我们取两个公共因子,这样就可以在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素 A和因素 B以及各个水平之间的相关关系。 第四节 相应分析中应注意的问题n 我们知道相应分析是分析两组或多组变量之间关系的有效方法,在离散情况下,它是从资料出发通过建立因素间的二维或多维列联表来对数据进行分析。在此我们要问,这种分析是否有意义,或者说对于所给的数据是否值得做这种相应分析。这一节我们将介绍相应分析与独立性检验的内在关系,以此说明应用相应分析方法在解决实际问题时,避免盲目性。 n n 第五节 实例分析与计算机实现一 利用 SPSS进行相应分析 实例 1 二 利用 SPSS进行相应分析 实例 2 一、利用 SPSS进行相应分析 实例 1n 数据来自 SPSS软件自带数据集 voter.sav,为 1992年美国大选的部分数据。要求对选民的最高学历水平( degree)和所支持的总统候选人( pres92)进行相应分析。(一)操作步骤1. 正确打开数据集 voter.sav后,由 AnalyzeData ReductionCorrespondence Analysis可进入相应分析的主对话框(图 8.1)。 图 8.1 相应分析主界面2. 从左侧变量列表中选择两个变量作为相应分析的两个维度。这里我们选择 pres92作为行维度,点击 Row左侧的三角箭头就可以看到在 Row项下出现了 pres92(? ?),这时用鼠标选中该变量,其下方的 Define Range子对话框激活,点击后出现变量水平设置窗口(图 8.2)。分为上下两个部分:Category range for row variable: pres92和 Category Constraints。 这里要分析所有的三位总统候选人和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论