济南大学毕业论文-综合评价方法的优良性研究_第1页
济南大学毕业论文-综合评价方法的优良性研究_第2页
济南大学毕业论文-综合评价方法的优良性研究_第3页
济南大学毕业论文-综合评价方法的优良性研究_第4页
济南大学毕业论文-综合评价方法的优良性研究_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

济南大学毕业论文 I 摘要 综合评价是指从多个指标因素的信息中获得对某个系统的整体评价。如今,综合 评价在日常生活和科研领域中得到了广泛的实践与应用,其所涉及的领域十分广阔。 诸多实践表明,每个综合评价方法并不是适合每个系统的。 因此,要研究分析综合评价 方法的优良性以找出最适合的、 最理想的方法。由此就出现了研究综合评价方法优良 性的问题。本文在已有文献的基础上,选取了主成分分析法、因子分析法和聚类分析 法,并结合 SPSS 软件,综合解决“山东省十个地级市在 2014 年文化建设方面情况” 的问题。从每个方法的原理及解决问题的过程,给出了综合评价方法的演算过程,并 给出了十个地级市在 2014 年文化建设情况的排名。 最后,通过实例论证了这几种方法 的优良性,验证了上述思想的可行性和方法性。 关键词:主成分分析 因子分析 聚类分析 文化建设工作SPSS 统计分析软件 济南大学毕业论文 II ABSTRACT Comprehensive evaluation is aimed to obtain overall evaluation to some system from the information of multiple index factor.Now,comprehensive evaluation is being widely used in areas of daily life and science with its wild field.Numerous practices indicate that one comprehensive evaluation method cant match every system.So,in order to find the most suitable and ideal idea,we must study and analyze the superiority of comprehensive evaluation methods.Following that,the subject for analyzing comprehensive evaluation method arises.We choose on Principal component analysis and Factor analysis and Clustering methodology on existing literature with SPSS software,solving the problem about Shandong Province ten prefecture level city in 2014 cultural construction situation.The article puts out the progress of comprehensive evaluation methods along with principle and way we solve problems of every method.Meanwhile,the rank of cultural constructionsituation of the ten prefecture-level cities in 2014 is eventually given out.Finally, the paper proves the superiority of these comprehensive evaluation methods by examples and verifies the feasibility and the method of this ideas. Key words: Principal component analysis; Factor analysis; Clustering analysis; Cultural construction; SPSS statistical analysis software 济南大学毕业论文 III 目录 摘要. I ABSTRACT.II 1 前言.1 1.1 综合评价的发展背景.1 1.2 综合评价的应用方向.1 1.3 三种综合评价方法的简介.2 1.3.1 主成分分析的发展及应用.2 1.3.2 因子分析的发展及应用.2 1.3.3 聚类分析的发展及应用.2 2 主成分分析.3 2.1 主成分的数学模型.3 2.2 主成分的性质和计算步骤.4 2.2.1 主成分的性质.4 2.2.2 主成分的计算步骤.5 3 因子分析.7 3.1 因子分析的数学模型.7 3.2 因子负荷矩阵和公共因子的方差贡献率.7 3.2.1 因子负荷矩阵.7 3.2.2 因子方差贡献率.8 3.3 因子旋转与因子得分.8 3.3.1 因子旋转.8 3.3.2 因子得分.8 3.4 因子分析的计算步骤.8 4 聚类分析.10 4.1 系统聚类分析.10 4.2 样本间的距离和相似系数.10 4.2.1 样本间的距离.10 4.2.2 相似系数.11 4.3 聚类分析方法的计算步骤. 11 5 探究评价方法的优良性.13 5.1 主成分分析法的应用.13 5.2 因子分析法的应用.16 5.3 聚类分析方法应用.20 结论.22 参考文献.23 致谢.24 济南大学毕业论文 - 1 - 1 前言 1.1 综合评价的发展背景 由于我国经济的持续稳步向前发展和科学技术的提升, 评价方法应用领域急速扩 张,深入到社会发展的各行各业。我国最初利用综合评价技术是应用于 1982 年开展 的工业综合经济效益的评价,综合评价方法的发展则是在 1985 年开展的有关区域科 技活动和科技绩效等评价活动1。而在 20 世纪后期,国外研究评价方法的引入有助 于我国的综合评价方法技术的发展。随着经济与环境、资源可持续发展概念的提出, 综合评价活动开始运用到我国众多的领域以及微观、中观和宏观各个层面。另外,随 着关于国际竞争力的评价体系和评价方法的引进,吸引了更多有关专业人士对各领 域、 各地区有关竞争力评价的研究。虽然我国在综合评价方法的应用领域取得了显著 成效,但是在理论应用、方法选择、资料搜集和目标把握上综合评价方法还有很多不 足。可以说,综合评价方法有了迅猛的发展。但是,评价方法在快速发展的同时,也 遇到了一些研究性问题。因此,需要对常用评价方法的优缺点、适用性、检验性等问 题进行详细的分析研究,使人们更好的利用评价方法。 1.2 综合评价的应用方向 如今综合评价以多种多样的形式得到了普及,深入到社会生产生活中,吸引了许 多研究人员。 运用每种综合评价方法时,我们总能够得到一个关于研究对象的评价结 论, 但这时会有一个问题是采取的方法是否真的是最优的、得到的结果与常理的相符 性。 所以我们想依据设定的某种标准找到每种方法的优良性,便可很方便解决这些问 题。 综合评价是由多个样本变量到单个样本变量的转化过程,而综合评价的运用需要 评价函数理论基础。 因此,讨论综合评价方法的优良性就转化成了讨论评价方法中评 价函数的优良性。本文研究了综合评价方法的优良性,为了达到这一目的,给出了一 系列优良性的判断标准。综合评价方法的优良性问题在评价系统中占有很重要的地 位,在对某种系统测评时经常会遇到这样的问题2:如何将多个被测对象进行排序或 分类,从中选出最符合要求的对象。这类问题体现的均是与决策有关的问题。由于很 多种原因,评价人员往往在决策过程中自觉不自觉地使用了那些表面上看起来科学, 而实际上却不是科学的方法,这种方式得到的结果科学性难以保证,产生的评价结果 易出现与实际相悖。 为此,有必要对评价运用的方法和过程给以研究,给评价提供科学 的参考意见。因此,对综合评价方法的优良性的研究具有重要的科研价值。 济南大学毕业论文 - 2 - 1.3 三种综合评价方法的简介 1.3.1 主成分分析的发展及应用 1901 年,英国的生物统计学家 Karl parson 首次提出主成分,此时只对非随机变 量的研究3。30 多年后,统计学家 Hotelling 在 Karl parson 的理论基础上增添了随机 变量, 总结出主成分分析理论的理论思想。在个体属性很少的前提下用较少的几个综 合变量取代多个变量。 这些新的变量被称为主成分。每个主成分是原始成分按某种组 合的排列, 且每个主成分是相互对立的,我们可以推知使用主成分进行研究更具有科 研价值。 1.3.2 因子分析的发展及应用 因子分析法最初是出现在教育心理学上的。1904 年英国心理学家斯皮尔曼查尔 斯在发表了一篇著名的论文对智力检验得分进行统计分析,是统计分析中的因子 分析的诞生标志。 目前这种方法的应用已经非常广泛,已成为现代统计的一个重要分 支 4 。因子分析是根据各变量构造的相关系数矩阵,找出一些代表性的因素的,一般 称为这些为因子。 分类过程中依据指标变量之间固有的联系性,可以将联系性高的指 标归类,而联系性低的指标则不能归类。不同的类联系性是低的。由于各个因子是互 不影响的, 这些因子的线性组合可以表示出原始数据的所有变量信息,从而减少了运 算量。这样可以看做是用较少的、能代表所有变量信息的少数变量去分析解决问题。 1.3.3 聚类分析的发展及应用 聚类分析是多元统计分析的方法之一,被称为无监督分类,源于数值分类学、统 计学等领域,并运用多元评价方法对研究指标进行分类的方法5。由聚类很容易想 到分类,两者的不同性在于,分类的结果可以预测,聚类却是未知的。聚类要求相似 的样本可以划到同一样本, 而不同的样本则不可以划分到同一样本集。聚类分析主要 是运用数学处理的方法, 利用变量存在的已有属性,将属性相同或相近的变量归为同 一类别。 济南大学毕业论文 - 3 - 2 主成分分析 2.1 主成分的数学模型 假设研究对象是n个元素,每个元素有p项属性,且np。我们认为将这p个元 素看作p个随机变量6,设为 1 X, 2 X, P X,令 12 (,)T P XXXX,然后做一个随机变 量X。 设第i个样品的第j个变量值为 ij x,则将原始数据资料整理为以下矩阵 11121 21222 12 p p nnnp xxx xxx xxx (2.1) 每个观测到的样本可记为 12 (, T iiiip Xxxx)(2.2) 做线性替换得到新的综合指标F,得到主成分的数学模型为: 11111221 22112222 1122 pP pP PPPPpP Fa Xa Xa X Fa Xa XaX Fa XaXaX (2.3) 其中, 12 , P F FF为P个新的综合变量, 222 12 1 kkkp aaa,1,2,kp. 主成分分析实际上是把p个元素 1, , P XX用一些互不相关的成分组合表示;空间 几何就是这些新成分构造的坐标系是经旋转得到的,也就是旋转由 1,.,P XX建造的坐 标系,新的坐标系使元素能够具有更大的方差。为了方便说明,讨论2p 时,主成 分的几何意义。原变量是 12 X ,X ,设 122 (,) ( , ), T XXXN此时满足二元正态分布7。 它们有图 2.1 的相关关系: 济南大学毕业论文 - 4 - 2 F 2 X 1 F 2 F 1 X 图 2.1 椭圆图 由图可以看出,n个分散的变量(可视为点)最终会构成一个不规则的椭圆,从 图上的分析可以看出不管是在 1 X轴方向或 2 X轴方向都是离散的分布的, 可以用相应 的研究变量的方差和的方差定量地表示其离散程度。如果只单独考虑 1 X或 2 X,那么 对原始数据信息的损失较大, 不利于结果的准确度。由于原始元素在椭圆的长轴延长 线方向上具有最大的分散性, 表明在该方向上所反映的元素间的互异性属性最多。若 沿椭圆长轴延长线方向取坐标轴 1 F,沿椭圆短轴延长线方向取坐标轴 2 F 8 。从图上 看出是做了个旋转,转角为,方向是逆时针。根据旋轴转化公式可推出原来坐标与 新构造的坐标的关系,如: 112 212 cossin sincos FXX FXX (2.4) 也可写成: 11 22 cossin sincos FX PX FX (2.5) 其中p为正交矩阵。 2.2 主成分的性质和计算步骤 2.2.1 主成分的性质 (1)由原始指标的相互对立可以知道原始指标是服从正态分布的9。 济南大学毕业论文 - 5 - (2)主成分的方差和原始变量的方差,它们两个方差的和相等,经过变化后,变量间 的差异性没有改变。 (3)第k个主成分元素的方差贡献率 1 k k p i i x (2.6) 前i个主成分元素的累计方差贡献率 1 1 1 k i m i i p i i i x (2.7) 在实际实验过程中,主因子的方差贡献累积大于等于 85%,相应的主因子可以选 择考虑。 在m个原始数据中因素数目、原始数据数目及因子的方差贡献累积率保持稳 定的条件下, p m 的比越小,可知此数据分析可以采用主成分分析。 2.2.2 主成分的计算步骤 (1)指标数据的标准化 在对已知数据进行分析和评价时,存在着不同的维度和数量级别,它们不在一起 进行比较,也不能直接用于多变量统计分析。因此,对数据进行相应的处理。可以得 到合适的无量纲纯数值数据, 从而消除了数据的单位限制,便于对不同单位和不同级 别的指标进行比较和权重的计算。本文数据处理采用的是:离差标准化,也称 0-1 标 准化。为了使结果位于0,1区间上,对原始指标做恰当的变换,相应的函数如下: min maxmin ij ij x x (2.8) ij x为原始元素值, ij x 为标准化后的元素值。 (2)求X的相关矩阵R以及R的特征 1 ij p X X Rrxp n (2.9) 其中, 1 kjkj ij xx r n ,1,2,i jp(2.10) 根据特征方程0 P RI得p个特征根,此时得到R的特征根。将 j 带入 1 1 0.85() m j j p j j mj ,,1,2, j jm(2.11) 济南大学毕业论文 - 6 - 判断累计贡献率,求出合适的主成分F个数k,对每个,1,2, j jm解方程组 j Rbb得单位特征向量 o j b。根据前面的式子我们很容易知道方差累积贡献率10为 1 (01) j jjk j j uu (2.12) (3)求主成分分数 为了获得前k个指标的主成分得分分数,我们需要把这k个指标变量带入以下公 式中: 11221 (,)() TT iiiipipipi XXXxx xxxxxx(2.13) 依次得到k个指标的主成分的分数: 1 (1, ;1, ) p iijij j Fb x in jk (2.14) 从而得到了所需要的综合评价函数: 1 111 (,) pkk iipijijijij iij Zf xxu Fu b x (2.15) 济南大学毕业论文 - 7 - 3 因子分析 因子分析是主成分分析的更进一步应用和延伸, 它是将具有多种属性的变量元素 (或指标) 转化为能代替主要信息的少数几个指标,这些少数因子能充分表达原始指 标的信息, 我们还可以凭据每个因子各自的内在联系对样品进行合理的分类。同样和 主成分一样也具有降维的好处。 因子分析的应用:(1)减少评价指标的数目;(2)分析各个变量的内部关系,进行分 类,用共有的因子代替原始变量。 3.1 因子分析的数学模型 因子模型是由公共因子和唯一因子两部分组成。 公共因子是指能代表每个原始指 标所共同拥有的属性, 能够最大化的描述每个指标的相关性;特殊因子则指原始信息 中独有的属性,代表不能被共同元素所解释的信息11。 因子分析最常用的理论模型12如下: 1122iiiimmi Za Fa Fa F(1,2,3,inn,为原始指标数)(3.1) 矩阵形式可表示为ZAF ,我们用 i X表示原始指标,m表示所有指标共同因素 的数量;(1,2,) j Fjm是共同因素,可以代表每个原始指标的标准化之后的分数 i Z。 A称为因子负荷矩阵,(1,2, ;1,2,) ij a in jm称为因子负荷。 i 为指标 i Z的特殊因 子,它代表原始指标独特的属性。 3.2 因子负荷矩阵和因子的方差贡献率 3.2.1 因子负荷矩阵 ij a是相关系数, 代表第i个指标 i x与第j个共同因素 j F的相关系数, 代表 i x与 j F的 关系度。A中第i行元素说明了第i个变量 i x的对各公共因素的关联性,而A中第j列 元素说明第j个公共因子 j F与各个变量的关联性13。一般情况下, ij a的大小可以用 来说明 j F的含义。 在标准化的情况下,分析已知因素的数学模型: 济南大学毕业论文 - 8 - ( )0,( )0,Var( )1,()0,Var1 iii E FEE XX(3.2) ()r ij ijX F E X F,() ij ijF F E FFr,()r ij ijF EF (3.3) 12 12 ijjjjjmjij X FiF FiF Fij F Fim F FFij ra ra ra ra rra (3.4) 3.2.2 因子方差贡献 因子矩阵A中第j列元素平方和。记: 2 1 p jij i Sa (3.5) 它实际上是指原始指标方差贡献总的和14, j F对原始指标的方差的贡献率为: (3.6) 3.3 因子旋转与因子得分 3.3.1 因子旋转 最常见的因子旋转方法方差最大旋转因素。 此方法是在各个因子的轴的垂直条件 下对因子轴作旋转变换。正交旋转法使各个公共因子相互独立的性质得到保存,利于 旋转后的因子载荷阵能具有更好的实际意义。同时,由于因子负荷阵的元素的绝对值 按一定的顺序向两级分解, 少数的因子能够取到最大而其他因子则取值最小甚至临近 零,从而公共因子的意义得到更好的诠释,能够更方便的分析实际问题。 3.3.2 因子得分 因子得分15是指根据每个评价对象的指标值计算公因子的估计值,计算出因子 得分以后,就可以用因子得分它来代替原始变量的取值,从而达到降维的效果。m个公 共因子的线性组合为 1 122 (1,2,) jjjjpp Fxxxjm(3.7) 由于mp,据此条件可用估计的办法,Thomson 回归估计法是常用办法。 3.4 因子分析的计算步骤 2 1 1 1 () p jj jij p i j i SS aa pp Var x 济南大学毕业论文 - 9 - 步骤一、将数据做标准化处理,具体详见主成分分析中的标准化过程。记为() ij Xx; 步骤二、构造标准化的相关系数矩阵 ij R(r ); 步骤三、求R的特征根按 12p 排列,求特征向量 12 , p ; 步骤四、对A施行方差最大正交旋转; 步骤五、求指标的因子得分和总因子得分。 济南大学毕业论文 - 10 - 4 聚类分析 聚类分析有两种常用分类:Q 型聚类分析是对样本进行分类,R 型聚类分析是对 变量分类。在聚类分析的方法中,应用比较广泛的是系统聚类法和K-均值法。本次 数据分析采用系统聚类分析法。 4.1 系统聚类分析 系统聚类16方法是目前使用频率最高, 也是最受广大研究者青睐的一种聚类分析 方法,系统聚类的基本思想是:在进行分类时,可以根据一定的指标或属性,把相似 度大的n个样本聚为一类。再根据一定规则将距离最近的两个样本并为一个新样本, 之后测量新样本与其他样本间的距离,如此重复进行,直到最后归为一类。这样就能 得到多个可能正确的聚类结果, 最后再利用一些相应的条件来确定选择聚为几类是最 为合适的。显然,这些的聚类结果之间有分层,可称它们具有层次关系。 4.2 样本间的距离和相似系数 4.2.1 样本间的距离 距离是指指标间的亲疏度的, 设原始数据为(1,2, ;1,) xj xin jm构造原始数据 矩阵A。 设有n个原始元素,每个原始元素对应p个变量,构造原始元素矩阵A 11121 21222 12 p p nnnp xxx xxx A xxx (4.1) 用 ij d表示第i个元素和第j个元素距离度, ij d值越小说明两个元素距离度小,相 似的性越大。 对距离有以下界定: (1)当 ( )( ) 0 ijij dXX,0 ij d ,对一切ij,; (2) ijji dd,对一切ij,; (3) ijikkj ddd,对一切, ,i j k(三角不等式) 济南大学毕业论文 - 11 - 介绍几种常用的距离: 闵氏距离17 1 1 ( ) pn m ijikjk k dnXX (4.2) 当1n 时,又称绝对距离 1 (1)() p ijikjk k dXX (4.3) 当 1 2 n 时,称欧氏距离 12 1 1 ( )() 2 p m ijikjk k dXX (4.4) 4.2.2 相似系数 在对多元数据进行分析时, 相较于数据的大小,我们更喜欢地研究变量的变化趋 势或方向.因此, 变量间的相似性,我们可以从它们的方向趋向性和相关性进行分析, 测量变量之间的距离常用到相似系数,常见的相似系数有以下两种: (1)夹角余角 变量 i X与 j X是来自均值向量为, 协方差为 0 x的总体G在的p维空间的 两个向量,则这两个向量间的夹角余弦可表示为 1 22 11 cos ()() p ikjk k ij pp ikjk kk X X XX (4.5) (2)相关系数 相关系数18可以测试变量间的相似性.变量 i X与 j X的相关系数定义为 p k jjkiik p k jjkiik ij XXXX XXXX r 1 22 1 )()( )( (4.6) 在实际运用中,对元素分类用距离,对变量分类用系数。即Q型聚类分析常用距 离,R型聚类分析常用相似系数。 4.3 聚类分析方法的计算步骤 本次实验采用系统聚类法 计算过程如下: 步骤一、对 10 项元素采用 0-1 标准化。 济南大学毕业论文 - 12 - 步骤二、10 个地级市之间的元素距离则可选择欧氏距离。 步骤三、选用组 ward 法计算两个类的距离,并对样品进行分类。 济南大学毕业论文 - 13 - 5 探究评价方法的优良性 为了研究比较以上三个方法的优良性,我们将应用三种方法来解决山东省 10 个 地级市的文化建设排名问题, 从而找到最适合的方法。 我们根据山东省统计年鉴19选 取了山东省的 10 个地级市在文化建设方面的 8 个主要文化指标 (见表 5.1) , 令 1 X为 公共图书馆数(个)、令 2 X为图书馆藏书量(万册)、令 3 X为艺术表演团体数(个) 、 令 4 X为艺术表演场所数(个)、令 5 X为文化馆数(个)、令 6 X为文化站数(个)、 令 7 X为文物、文化事业费(万元)、令 8 X为博物馆数(个)。在 SPSS 软件中操作。 表 5.1 文化建设指标 5.1 主成分分析法的应用 原始数据标准化记为 12345678 ,XXXXXXXX,如表 5.2 所示。 地区 公共图 书馆数 (个) 图书馆藏 书量(万 册) 艺术表 演团体 数(个) 艺术表演 场所数 (个) 文化馆 数(个) 文化站 数(个) 文物、 文化事业 费(万元) 博物 馆数 (个) 济南市1137288101413136120 青岛市13583910121364304441 东营市611541540108417 临沂市1327145121611427924 德州市12143691113394586 烟台市14561108131552648718 潍坊市1236362121182260113 济宁市11176119111535200717 泰安市715234687242437 威海市415142573136889 济南大学毕业论文 - 14 - 表 5.2 标准化指标 操作主成分分析,在 SPSS 软件20中操作得以下几个表格。如表 5.3 解释总方差。 表 5.3 解释总方差 从表5.3可以看出10个地级市文化建设指标的特征值及未旋转的方差比例。 表中第二列数值显示的是各个主成分的初始特征值。 第一主成分因素的特征值为 5.458,第二主成分因素的特征值为1.013,第三个主成分因素的特征值为0.775。未旋 转的三个主成分的方差占总方差的比分别为68.219%、12.664%、9.687%。三个成分 特征值的累积贡献率为90.570%,且其特征值均大于0.5,可以推出这三个因子能够代 替原始指标, 并且保留了原始指标的主要信息。故取前3个因子作为主成分是合理的, 从得到的碎石图也能清晰的看出。 烟台市10.9530.8750.77810.9500.4000.343 潍坊市0.80.5300.3750.1110.8750.6450.3090.2 济宁市0.70.13010.8890.750.93410.314 泰安市0.30.07900.3330.1250.3880.3470.029 威海市00.0770.1250.11100.2730.0990.086 地区 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 济南市0.70.5490.6250.7780.6250.8350.5150.4 青岛市0.910.7510.8750.7930.7891 东营市0.200.1250000.0330.029 临沂市0.90.3330.1250.4440.87510.1130.514 德州市0.80.0590.3750.8890.750.76900 成份 初始特征值提取平方和载入 合计方差的 %累积 %合计方差的 %累积 % 15.45868.21968.2195.45868.21968.219 21.01312.66480.8831.01312.66480.883 30.7759.68790.5700.7759.68790.570 40.3414.26194.832 50.2533.16397.994 60.0841.05199.045 70.0670.83699.881 80.0100.119100.000 济南大学毕业论文 - 15 - 图 5.1 碎石图 根据图 5.1 碎石图显示,明显的节点是 3,可知前三个因素是可以诠释大部分信息的 表 5.4 主成分载荷表 成份 123 公共图书馆数(个)0.892-0.413-0.055 图书馆藏书量(万册)0.782-0.0620.532 艺术表演团体数(个)0.8390.355-0.211 艺术表演场所数(个)0.8330.144-0.320 文化馆数(个)0.901-0.383-0.071 文化站数(个)0.887-0.261-0.247 文物、 文化事业费(万元)0.6820.674-0.059 博物馆数(个)0.7660.1520.522 从表 5.4 可以看出,在第一主成分中,文化站、公共图书馆和文化馆的较大的载荷, 表明这三个与第一主成分的关系度高;而在第二主成分中,文物、文化事业费的值较 大, 表明与第二主成分的关系度高。由第三主成分可以看出图书馆藏书量和博物馆载 荷值大,表明这两个与第三个主成分的关系度较高。至此,可以判断出 8 个变量中占 济南大学毕业论文 - 16 - 主要地位的变量和次要地位的变量各是哪些。 表 5.5 主成分得分系数矩阵 成份 123 公共图书馆数(个)0.163-0.408-0.070 图书馆藏书量(万册)0.143-0.0610.686 艺术表演团体数(个)0.1540.350-0.273 艺术表演场所数(个)0.1530.142-0.413 文化馆数(个)0.165-0.378-0.092 文化站数(个)0.163-0.257-0.319 文物、 文化事业费(万元)0.1250.665-0.076 博物馆数(个)0.1400.1500.674 上表 5.5 给出的是主成分得分的系数信息22,它是由原始变量构成的。 标准化的第一主成分 1 F=0.163 1 X +0.143 2 X +0.154 3 X +0.153 4 X +0.165 5 X +0.163 6 X +0.125 7 X +0.140 8 X 标准化的第二主成分 2 F=(-0.408) 1 X -0.061 2 X +0.350 3 X +0.142 4 X -0.378 5 X -0.257 6 X +0.665 7 X +0.150 8 X 标准化的第三主成分 3 F=(-0.070) 1 X +0.686 2 X -0.273 3 X -0.413 4 X -0.092 5 X -0.319 6 X -0.076 7 X +0.674 8 X 5.2 因子分析法的应用 先根据表 5.6 判断系统是否适合做因子分析。结果为 KMO 抽样适度测定值统计 量为 0.772,在 0.5 以上,Bartlett 球度检验的P值(Sig=0.000)0.05,根据已知的判 断信息推知数据适合进行因子分析。 表 5.6 KMO 和 Bartlett 检验 取样足够度的 Kaiser-Meyer-Olkin 度量。0.772 Bartlett 的球形度检 验 近似卡方59.575 df28 Sig.0.000 济南大学毕业论文 - 17 - 表 5.7 相关系数矩阵 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 1 X 1.0000.6870.6160.6800.9810.8840.3540.582 2 X 0.6871.0000.5920.4730.6830.5430.4320.771 3 X 0.6160.5921.0000.7620.6570.6500.7870.505 4 X 0.6800.4730.7621.0000.6530.7610.6030.552 5 X 0.9810.6830.6570.6531.0000.9070.3920.576 6 X 0.8840.5430.6500.7610.9071.0000.4740.552 7 X 0.3540.4320.7870.6030.3920.4741.0000.587 8 X 0.5820.7710.5050.5520.5760.5520.5871.000 表 5.7 是运用 SPSS 软件对 8 个变量的原始观测值进行相关系数测度,用最大方差正 交法对因子负荷阵按逆时针旋转。把数据值标准化在了 0-1 之间 表 5.8 解释的总方差 成 份 初始特征值提取平方和载入旋转平方和载入 合计 方差 的 %累积 %合计方差的 %累积 %合计 方差 的 %累积 % 15.45868.21968.2195.45868.21968.2193.12839.10139.101 21.01312.66480.8831.01312.66480.8832.23427.92067.022 30.7759.68790.5700.7759.68790.5701.88423.54990.570 40.3414.26194.832 50.2533.16397.994 60.0841.05199.045 70.0670.83699.881 80.0100.119100.000 如表 5.8,是旋转前与旋转后的解释方差。 (1)可以看出 8 个成分的特征值发生了变化,由于限定了特征值的取值范围,只显示 了前三个比如第一个成分的特征值从 5.458 经旋转后变为 3.128。旋转前三个因子的 差距较大,而旋转后差距缩小。但可以看出总的累计方差贡献率是没有变化的。 (2)第一主因子携带原数据的信息量为 39.101%,文化站( 6 X)、公共图书馆( 1 X)、文 化馆( 5 X)占主导,体现各地级市文化场馆的建设。第二主因子则是 27.920%的信息 量,对文物、文化事业费( 8 X)占主导,主要反映了各地级市资金投入情况。第三 主因子是 23.549%,图书馆藏书量和博物馆是主体。这三个主因子的累计方差贡献率 为 90.570%,是可以对评价作出科学解释的。 济南大学毕业论文 - 18 - (3)有表知无论是旋转还是为旋转前三个因子的累积方差贡献率都是 90.570%, 能够携 带大部分原始信息。 从而可知这三个因子可以代替 8 个原始元素,从而对山东省几个 地级市文化建设情况作出评价。 表 5.9 旋转成分矩阵 上表 5.9 是利用成分矩阵时我们发现各个变量和第一个因子关系密切,但与其他两个 关联性小, 不利于命名,通过旋转后得到的矩阵分析可判断出哪些变量与这三个因子 的关系度高。命名更清晰。已知公共因子和原始元素存在联系性,据此得到三个主因 子的成分得分系数矩阵。见下表 5.10 表 5.10 成分得分系数矩阵 成份 123 公共图书馆(个)0.393-0.2090.003 图书馆藏书量(万册)-0.110-0.1970.666 艺术表演团体(个)-0.0130.445-0.150 艺术表演场所(个)0.1670.327-0.281 文化馆(个)0.383-0.178-0.014 文化站(个)0.388-0.011-0.208 文物、 文化事业费 (万元)-0.2990.6110.019 博物馆个数-0.239-0.0300.662 由此可的因子得分公式 第一主因子得分 1 V=0.393 1 X -0.110 2 X -0.013 3 X +0.167 4 X +0.383 5 X +0.388 6 X -0.299 7 X -0.239 8 X 成份 123 公共图书馆(个)0.8970.1670.371 图书馆藏书量(万册)0.3900.1910.842 艺术表演团体(个)0.4380.7910.237 艺术表演场所(个)0.6050.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论