spss学习第9章_第1页
spss学习第9章_第2页
spss学习第9章_第3页
spss学习第9章_第4页
spss学习第9章_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章spss多变量统计分析、9.1.1因子分析的基本原理是对常规变量进行因子分析,称为r型因子分析的另一种是对样品进行因子分析,称为q型因子分析,这两种分析方法有很多相似之处。 r型因子分析数学模型是原p个变量,将各变量(或标准化后)的平均值设为0,将标准偏差设为1。 这里,当用k ()个因子的线性组合表示变量中的每一个时,上式是因子分析的数学模型并且在9.1spss因子分析中的应用(其中x是可实测随机向量)可以被表示为矩阵。 f也称为因子,因为f出现在每个原始变量的线形式上,所以也称为公共因子。 a称为系数载荷矩阵,称为系数载荷。 被称为特殊因子的原变量表示不能用因子解释的部分,其平均值为

2、0因子的分析的基本思想,通过变量的相关系数矩阵内部结构的分析,找到了可以控制原变量的几个随机变量选择公共因子的原则,以尽可能多地包含原变量中的信息来建立模型。 9.1spss在因子分析中的应用,具体步骤:标准化原始数据,消除变量间的数量水平和维的差异求出标准化数据的相关矩阵求出相关矩阵的特征量和特征向量计算方差贡献率和累积方差贡献率决定因子: f1、f2、, 将fp作为p个因子,其中前m个因子中包含的数据信息的总量(即其累计贡献率)为85%以上时,最好将前m个因子反映到原来的评价指标中因子旋转:所得到的m个因子不能确定时,或其实际意义不明确时,绕过因子需要得到更明确的实际意义通过原始指标的线性

3、组合求出各因子的得分综合得分:通常以各因子的分散贡献率为权重,从各因子的线性组合中得到综合评价指标函数。9.1spss在因子分析中的应用、9.1.2因子分析的spss操作详细解step01 :打开主菜单选择主菜单的“分析”“降低维度”“因子”命令,显示“因子分析”对话框,图像形成因子分析的主操作窗口。9.1spss在因子分析中的应用,step02 :因子分析变量的选择【因子分析】对话框左侧的候补变量中选择要进行因子分析的变量,追加到【变量】列表框中。 要选择参与因子分析的样本,必须将条件变量添加到“选择变量”框中,然后单击变量值按钮输入变量值。 只有满足条件的样本数据才能进行后续因子分析。 s

4、tep03 :选择描述性统计量点击【描述】按钮,显示对话框的图。 这里,可以选择并输出描述性的统计量和相关矩阵等的内容。 9.1spss在因子分析中的应用,step04 :选择因子提取方法,点击【提取】按钮后,弹出对话框如图9-3所示。 在这里,可以选择与提取因子的方法相关的选项。 具体的选择项的意思是:可以单击“方法”框的箭头按钮,展开下拉列表,选择因子提取方法:主成分分析法:该方法假定变量是因子的单纯线性组合。 第一成分有最大的方差,后续成分可解释的方差逐渐减少无加权最小二乘法:加权最小二乘法极大似然法:主轴因子提取法:因子提取法:映射因子提取法:在因子分析中的应用,【分析】栏中分析矩阵:

5、相关系数矩阵,系统默认项:协方差矩阵这是系统的默认输出方法输出因子的碎石图:显示了按模态大小排列的因子编号。 这有助于确定要保持的系数的数量。 典型的碎石图有明显的拐点,在该点之前有与大因子相关的陡峭折线,之后有与小因子相关的缓慢折线。9.1spss在因子分析中的应用,【提取】栏输出有关提取结果的选项。 理论上,因子的数量与原始变量的数量相等,但是因子分析的目的是用少量的因子替换多个原始变量,提取哪个因子由本栏决定。 指定要提取的公开系数的数量:用鼠标点击选择的话,就指定了该数量。 指定系数分析收敛的最大迭代次数在对应的参数框中指定系数分析收敛的最大迭代次数:系统的默认最大迭代次数为25。 9

6、.1spss在因子分析中的应用,step05 :选择因子旋转方法,点击【旋转】按钮后,显示如下图所示。 您可以在这里选择与系数旋转方法相关的选项。 具体的选择项的意义如下: 9.1spss在因子分析中的应用,step06 :选择因子得分,点击【得分】按钮后,弹出对话框如下图所示。 在这里,可以选择因子得分方法和相关选项。 具体的选择项的含义如下: 9.1spss在因子分析中的应用,step07 :其他选择输出点击【选项】按钮,弹出对话框如图9-6所示。 在这里可以选择几个附加输出项目。 具体选择的含义如下: 9.1spss在因子分析中的应用,9.1.3实例分析:居民消费结构的变动1实例内容消费

7、结构是消费过程中各消费支出占居民总支出的比例。 它是反映居民生活消费水平、生活质量变化情况和内在过程合理化程度的重要标志。 消费结构的变动不仅关系到消费领域的重要问题,也关系到国民经济整体的发展。 合理的消费结构和消费结构的演化和优化不仅反映了消费水平和质量的提高,也为建立合理的产业结构和产品结构提供了重要依据。 表9-1是某市居民的生活费支出费用,具体分为食品、服装、家庭设备用品和服务、医疗、交通通信、文教娱乐和服务、居住和其他商品和服务等8个部分。 利用因子分析探讨该市居民的消费结构,为产业政策的制定和宏观经济的调控提供参考。 9.1spss在因子分析中的应用,2例操作表9-1是某市居民的

8、食品、服装、医疗等8个方面的消费数据,这些指标之间有强弱的相关。 单独分析这些指标无法分析居民消费结构的特征。 因此,我们认为,利用因子分析将这8个指标整合为少数因子,通过这些公共因子来反映居民消费结构的变动情况。 9.1spss在因子分析中的应用,3例结果和分析(1)描述性统计表9-2显示了食品、服装等8个消费支出指标的描述统计量,如平均、标准偏差等。 这为后续因子分析提供了直观的分析结果。 占食品支出消费的比例最大,平均为39.4750%,其次是文化娱乐服务支出消费和交通通信支出消费。 在所有的消费支出中,医疗消费支出所占的比例最低。 9.1spss在因子分析中的应用,9.1spss在因子

9、分析中的应用,(2)因子分析通用度表是因子分析的通用度,显示了所有变量的通用度数据。 第一列是因子分析初期解中的变量共通度。 这表示,如果对原来的8个变量采用主成分分析法将8个特征根全部提取出来的话,原来的变量的方差就会全部被解释,变量的共通度都是1 (原变量被标准化了的方差为1 )。 实际上,因为因子的个数比原变量的个数少是因子分析的目的,所以不能提取所有的特征根。 因此,第2列表示以指定的提取条件(在此特征根大于1 )提取特征根时的共通度。 所有变量的大部分信息(全部83%以上)都被解释为因子,可以看出这些变量的信息丢失很少。 因此,这次因子提取的整体效果是理想的。9.1spss在因子分析

10、中的应用,9.1spss在因子分析中的应用,(3)在因子分析的总方差解释之后,spss软件计算相关系数矩阵的特征值、方差贡献率和累积方差贡献率的结果如表9-4所示。 在表9-4中,第一列是因子编号,之后的三列构成组,组的数据项目的意思依次是特征根、分散贡献率、累计贡献率。 第一组数据项目(第二至第四列)描述了初始因子解析的情况。 可以看出,第一因子的特征根值为4.316,说明了原8个变量合计方差的53.947%。 前三个因子的累积方差贡献率为94.196%,只有这些值大于1。 因为说明的前三个雄因子基本上包含所有变量的主要信息,所以只要把前三个因子作为主因子即可。 另外,提取后的因子分散和旋转

11、后的因子分散的部分显示了因子提取后和旋转后的因子分散的解释状况。 从表中可以看出,这些都支持三个公共因子的选择。 9.1spss在因子分析中的应用,9.1spss在因子分析中的应用,(4)因子碎石图9-15是因子分析的碎石图。 横轴是系数的数量,纵轴是特征的根。 可知第一因子的特征值高,对原变量的解释最有贡献的第三个以后的因子的特征根小,取值不到1,表示它们对原来的变量没有贡献,可以忽略的被称为“高山脚下的碎石”,所以提取前三个因子是9.1spss在因子分析中的应用,(5)旋转前的因子载荷行列表9-5给出了因子载荷矩阵,它是因子分析的核心内容。 根据负荷系数的大小,可以分析反映不同公共系数的主

12、要指标的差异。 结果表明,大部分因子的说明虽然很好,但有些指标的说明能力还很差,如“食品”指标在三个因子的负荷系数上没有太大差异。 因此,其次采用因子旋转法将因子载荷系数分化为0或1两极,使大载荷更大,小载荷更小。 这样的结果更能说明。 9.1spss在因子分析中的应用,(6)旋转后的因子载荷行列表9-6显示了因子旋转后的载荷矩阵。 可以看出,第一主因子在“交通与通信”和“医疗”五个指标上有很大的负荷系数,第二主因子在“居住”和“服装”指标上有很大的系数,第三主因子在“其他商品和服务”上有最大的系数。 此时,各因子的意思更加强调。 9.1spss在因子分析中的应用说明,第一个公共因子主要对交通

13、和通信、医疗、文化娱乐服务、家庭设备用品和服务和食品反映了很大的负荷,第一个公共因子综合地反映了这些方面的变动情况,并将其与第一个基本生活消费因子,即享受性消费因子第二公共因子的居住、服装负荷系数大,表现出这两方面的变动趋势,可以将其命名为第二基本生活消费因子,即发展性消费因子。 因为第三公共因子与其他商品和服务的消费波动很大,所以第三公共因子可以命名为第三基本生活消费因子,即其他类型的消费因子。 9.1spss在因子分析中的应用,(7)因子得分系数表9-7显示了用回归法估计的因子得分系数。 从表的内容中,因子f1=-0.198 x 10.058 x2-0. 226 x 30.212 x 40

14、.221 x 50.211 x 60.079 x 70.015 x 8; 因子f2=0.123 x 10.425 x 20.200 x 30.094 x 4.008 x 50.096 x6- 0.498 x 70.015 x 8; 因子f3=0.365 x1-0.059 x2-0.174 x 30.069 x 40.119 x5- 0.077 x6-0.088 x 70.779 x 8; 9.1spss在因子分析中的应用,9.1spss在因子分析中的应用,9.2.1聚类分析的基本原理1,方法概述聚类分析也称为群分析,这是一种研究分类问题的多元统计方法,类一般指类似元素的集合。 2、聚类分析的分

15、类根据分类对象分为样本聚类和变量聚类。 (1)样品簇的样品簇在统计学上也称为q型簇。用spss术语对事件进行分组,对观测和测量进行分组。 这通过反映所观察到的对象的不同特征,即所观测到的对象的特征的各变量来进行分类。 9.2spss在聚类分析中的应用,(2)变量聚类变量聚类在统计学上也称为r型聚类。 反映同一事物特征的变量很多,我们经常根据研究的问题选择一部分变量来研究事物的某一方面。 由于人类对客观事物的认识有限,往往很难找到相互独立的代表性变量,影响人们对问题的进一步认识和研究。 例如,在回归分析中,由于自变量的共同线性,偏回归系数不能真正反映自变量对原因变量的影响等。 因此,不丢失很多信

16、息,首先进行变量聚类,找到相互独立的代表性参数。 建议将聚类分析和其他方法结合使用,具有很好的判别分析、主成分分析、回归分析等效果。 9.2spss在聚类分析中的应用、3、为了将距离和类似系数分类样本(或指标),需要研究样本之间的关系。 现在使用最多的方法有两种。 一种方法是,越是类似系数、性质接近的样本,类似系数的绝对值越接近1,越是互不相关的样本,类似系数的绝对值越接近零。 比较相似的样本被分类为一类,不太相似的样本被分类为不同类。 另一种方法将一个样本视为p维空间中的一个点,在空间中定义距离,距离越近则分类到类中,距离越远则分类到不同类中。 但是,类似系数和距离有各种各样的定义,这些定义

17、与变量的类型有很大关系。 9.2spss在聚类分析中的应用,k均值聚类法也被称为高速聚类法,可以用于聚类分析大量数据的情况。 这是一种非分层聚类方法。 该方法占用内存少,计算量、处理速度快,特别适用于大样本的聚类分析。 基本的操作步骤是1、指定集群数k、用户指定要汇总到哪个类,最终只能输出关于它的唯一的解。 这和分层聚类不同。 2 .确定k个初级班的中心。 两种方法是根据用户指定的方法和数据本身结构的中心,首先确定每个类别的原始中心点。 3 .根据最接近的原则进行分类。 计算每条记录到各中心点的距离,按照最近的原则将各记录分类为各类别,计算形成了新类别的中心点4,基于新的中心位置,针对每条记录

18、重新计算到新类别的中心点的距离,并重新分类。 5 .重复步骤4,直到达到一定的收敛标准。 该方法经常被称为步骤聚类分析,首先对被合计对象进行初始分类,然后进行步骤调整,得到最终分类。9.2spss在集群分析中的应用、9.2.2快速集群spss操作详细分析step01 :主菜单选择打开主菜单的“分析”“分类”“k平均集群”命令,显示“k平均集群分析”对话框,这如图所示9.2spss在聚类分析中的应用,step02 :选择聚类分析变量【k平均聚类分析】对话框左侧的候补变量中选择要进行聚类分析的变量追加到【变量】列表框中。 您还可以选择一个标记变量并将其移动到“案例标记根据”框中。 step03 :分类数【集群数】框中,可以输入所确定的集群分析数,用户可以根据需要修改调整。 系统的默认集群数为2.step04 :可以在选择集群方法的主对话框的“方法”栏中选择集群方法。 系统默认值为【反复和分类】项目。 选择初始班级中心:在反复的过程中继续更新集群中心。 将观测量指定给标记最接近的类中心的类。 只在初期班级中心对观测、测量进行分类,集群中心始终不变。9.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论