张慧-主成分分析与多维尺度分析的降维结果比较.doc_第1页
张慧-主成分分析与多维尺度分析的降维结果比较.doc_第2页
张慧-主成分分析与多维尺度分析的降维结果比较.doc_第3页
张慧-主成分分析与多维尺度分析的降维结果比较.doc_第4页
张慧-主成分分析与多维尺度分析的降维结果比较.doc_第5页
免费预览已结束,剩余32页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析与多维尺度分析的降维结果比较以一个实证研究为例学生:张慧,教育学院心理学系指导老师:揭水平,江汉大学教育学院摘要主成分分析与多维尺度分析是两种常用的简化数据的多元分析技术,二者不仅在统计原理、数学模型方面存在差异,而且各自有着不同的适用条件。本文简单介绍了两种方法的原理、理论模型以及现在国内外运用这两种多元统计方法进行降维分析的研究,并以一个实证研究为例对主成分分析与多维尺度分析的降维结果做了具体的比较。就本文涉及的研究而言,通过两种降维方法获得的结果在表现形式上略有差异,但二者之间却有着十分接近的内容结构,具有较高的一致性。这两种方法具有各自适用的数据类型和条件,选用时需谨慎分析才能得到较为客观有效的降维结果。 关键词降维,多元统计分析,主成分分析,多维尺度分析 Comparison of the Dimensionality Reduction Results of Principal Component Analysis and Multidimensional Scaling AnalysisTake an Empirical Study for Instance Student: ZhangHui, the department of psychology in the college of education Guidance teacher: Jie Shuiping, the college of education in the Jianghan University AbstractPrincipal Component Analysis and Multidimensional Scaling Analysis are the two most commonly used techniques for simplifying the data of multivariate statistical analysis. There are differences between the two reduction techniques, not only in the statistical theory but also in mathematical model, especially in their respective conditions of application.This article briefly introduces the principles and theoretical models of the two methods and illustrates the application of the two methods in dimension reduction researches at home and abroad. Then it detailed analyses and compares with the results of the Multidimensional Scaling Analysis and Principal Component Analysis which are both applied in the same empirical study. Although the results obtained by the two methods have the slightly different forms, there are lots of similarities on the content and structure. The applications of the two methods has their respective data types and conditions. In order to obtain more objective and effective results, we should carefully analysis,select and apply the two method.Key wordsdimension reduction;multivariate statistical analysis;Principal Component Analysis(PCA);Multidimensional Scaling Analysis(MDS) 目录1问题的提出.51.1引言.51.2文综述 .51.2.1关于降维的综述.51.2.2关于多元统计分析.71.2.3关于主成分分析(PCA).81.2.4关于多维尺度分析(MDS).9 1.2.5以往研究的不足.121.3研究案例的一些情况.121.4本研究的主要思路.182对研究案例的多维尺度分析研究.182.1研究目的.182.2研究方法.182.2.1被试情况.182.2.2研究材料.182.2.3研究程序.192.3结果与分析182.3.1大学生心目中心理咨询师现实形象结果与分析.182.3.1.1心理咨询师现实形象词汇分类情况的描述.18 2.3.1.2心理咨询师现实形象的多维尺度分析结果.192.3.2大学生心目中心理咨询师理想形象结果与分析.232.3.2.1心理咨询师理想形象词汇分类情况的描述.232.3.2.2心理咨询师理想形象的多维尺度分析结果.233讨论.263.1研究实例的降维结果比较263.1.1主成分分析的降维结果.273.1.2多维尺度分析的降维结果.273.1.3研究实例的降维结果比较.283.2多维尺度分析与主成分分析的比较293.3不足.304总结.30致谢.32参考文献.33附录1心理咨询师形象词语自由分类问卷.34附录2自由分类结果转换成相异矩阵的EXCELL操作361 问题的提出1.1 引言随着科学技术的发展,人们不断接触到各种类型的海量数据,在统计处理中这些通常被称为“高维数据”。虽然随着数据维数的不断提高,数据将提供有关客观现象的更加丰富、细致的信息,但同时数据维数的大幅度提高又会给随后的数据处理工作带来前所未有的困难。为了克服“维数灾难”,降维方法这种典型数据处理技术,是现在用来解决这一问题的有效手段之一。实际处理中,由于线性方法具有简单性、易解释性、可延展性等优点,使得线性降维在高维数据处理中是一个主要研究方向。但就现实世界中获得的真实数据集合而言,线性性往往只是人们的一种理想情形,数据集合更多的是呈现出非线性的结构,甚至是高度非线性的结构,因此,为了有效的探求数据集的内在非线性结构,人们又发展了许多有效的非线性降维手段。已有的线性降维方法主要包括主成分分析(PCA)、投影寻踪(PP)。非线性降维方法主要包括多维尺度分析(MDS)、ISOMAP方法等。同时,主成分分析与多维尺度分析更因降维效果的显著而得到广泛应用。近十几年来,从国内外看,主成分分析和多维尺度分析方法已在市场营销、生物学、心理学等多领域得到应用并且逐渐被作为有效的降维方法来处理高维数据。我国对主成分分析和多维尺度分析的适用条件和具体问题中的应用效果的研究还处于起步阶段。本文将对主成分分析和多维尺度分析的统计思想、数学模型做简单介绍,并希望基于一个研究案例,即对已有的心理咨询师形象再做一个多维尺度分析研究,比较该研究所做的主成分分析与多维尺度分析的结果,从而对主成分分析与多维尺度分析的适用条件与降维结果进行进一步比较。1.2 文献综述1.2.1 关于降维的综述降维的定义:若为D维空间中的一个容量为N的数据集合,假设其来自于(或近似来自于)维数为d(D)的某一数据流形的采样。我们处理的目标是探求数据流形合适的低维坐标描述,将原数据集合投影到低维空间,获得原数据集合的低维简洁表示1。 降维的分类:国防科技大学的理学博士谭璐在其博士论文高维数据的降维理论及应用中指出:“针对降维问题的目的和待处理数据集合表象维数的多少,对其进行初步的、粗略的分类如下:(1)硬降维问题:数据维数从几千到几万甚至几十万的变化,此时需要对数据集进行“严厉”的降维,以至于达到便于处理的大小,如图像识别、分类问题以及语音识别问题等。(2)软降维问题:此时数据集合的维数不是太高,降维的需求不是非常的迫切。如社会科学、心理学以及多元统计分析领域皆属于此类。(3)可视化问题:此时数据集合的绝对维数不是很高,但为了便于利用人们的直观洞察力,即为了可视化,我们将其降到2或3维。”降维方法:降维的方法可以分为2大类:线性降维方法,包括主成分分析(PCA)、投影寻踪(PP)。非线性降维方法:多维尺度分析(MDS)、ISOMAP方法 、局部线性嵌入(LLE)、 Laplacian Eigenmap。国防科技大学的理学博士谭璐认为:“线性降维方法作为降维方法中最广泛使用的类,具有许多优良的特性,如计算简便、经常具有解析解、对具有线性结构的数据集合非常有效、便于解释等。”线性降维方法实际是在不同优化准则之下,寻求最佳线性模型的方法,这是线性降维方法的共性,也是与非线性降维方法的根本差异之所在,抓住了这一点有助于更好的理解线性降维的本质。实际处理中,由于线性方法具有简单性、易解释性、可延展性等优点,使得线性降维在高维数据处理中是一个主要研究方向。但就现实世界中获得的真实数据集合而言,线性性往往只是人们的一种理想情形,数据集合更多的是呈现出非线性的结构,甚至是高度非线性的结构,因此为了有效的探求数据集的内在非线性结构,人们发展了许多有效的非线性降维手段。降维的结果:国防科技大学的理学博士谭璐认为通过分析,我们会发现降维方法实际上具有一致的形式,都可看作是保持数据集合某种特性的变换。即“它首先探求数据集合的某种感兴趣特征,然后寻求具有这种特征的低维数据表示。所以直观上来看,降维方法的确在一定程度上抓住了数据集合的本质特性,降维结果也的确在一定程度上反映了数据集的本质特性。”1降维方法从直观上来分析,都可以看作是对数据集合进行的一种保持其内在属性的变换,包括线性变换和非线性变换。国防科技大学的理学博士谭璐指出“若我们称数据集合的内在属性为数据集结构,那么此时降维过程就可以看作是,寻求某种结构在低维空间数据体现的过程,或说探求具有此种结构的低维数据集合的过程,即降维结果是原数据集结构的低维体现。”11.2.2 关于多元统计分析统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业、农业、经济、心理和教育等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要2。随着电子计算机技术的普及,以及社会、经济和科学技术的高速发展,过去被认为是具有数学难度的多元统计分析方法,已经越来越广泛地应用于实际,并在心理学研究中显示出其魅力。多元统计分析方法多种多样,以下是英国著名统计学家M.Kendall对统计分析的分类图示: 2由此图可了解,主成分分析和多维尺度分析方法是多元统计中十分重要的处理数据方法,并且在实际降维处理中得到广泛的运用。1.2.3 关于主成分分析(PCA ) 主成分分析的概念:在多元统计分析中,所谓主成分分析,是研究如何通过原变量的少数几个线性组合来解释随机向量的方差协方差结构。通俗地讲,主成分分析是要在力保数据信息丢失最少的原则下,对高维空间进行降维处理2。主成分分析方法的统计思想:在现实生活中,我们经常遇到关于多指标的问题,而多指标问题中的不同指标之间一般有一定的相关性。主成分分析就是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组新的相互无关的综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来指标的信息。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标,这种线性组合有很多,从中选取能最多的反映原来指标信息的线性组合即综合指标记为第一主成分Fl,这里的“信息”用表示指标变异程度的“方差”来表达时,F1应该是所有的线性组合中方差最大的。如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个线性组合即第二个主成分F2。为了有效地反映原来信息,F1己有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(Fl, FZ) = 0。依此类推可以构造出第三,四,第p个主成分。这样选取的主成分之间不仅不相关,而且它们的方差依次递减2。主成分分析方法的运用:主成分分析法最早是作为多元数据的降维处理技术而提出的,在自然、生物、医学、管理、经济等领域均有广泛的应用。在社会经济问题的分析中两个最有名的例子是:Stone在1947年对美国1929-1938年17项国民经济统计指标所作的主成分分析和M.Scott在1961年对英国157个城镇的发展水平进行的主成分分析。前者发现完全可以用三个经济指标来概括原来的17项指标,从而大大简化了数据分析结构;后者将原始测量的57个指标降到了5个综合变量(主成分)。主成分分析法后来逐渐被推广应用于样品的分类与排序。英国著名统计学家M.Kendall早在1939年就对英国48个郡的10种主要农作物进行了主成分分析,用第一主成分对各地的“生产能力水平”进行排序与分类4。自二十世纪八十年代以来,随着我国经济效益综合评价理论与实践的发展,不断有人将主成分分析法应用于各类专题的综合评价,使之成为目前应用最广的一种多元统计综合评价方法。 目前对主成分综合评价模型大体上有两种观点:一是只用第一主成分进行评价,英国统计学家M.Kendall认为: “第一主成分能够最大限度地反映样本间的差异,是概括指标差异信息的最佳线性函数3”因此,只能用第一主成分对样本进行综合排序。我国也有部分学者持这种观点 6,南开大学孟生旺老师从几何投影的角度阐明:在多指标综合评价中,只用第一主成分综合原始数据时保留信息最多。因而也就只能以第一主成分值作为综合评价值才合理。另一种观点则认为:不仅要充分重视第一主成分,而且也要顾及其它主成分在综合评价中所起的作用。他们的做法是:先按累积方差贡献率不低于某一阀值(比如85%)的原则确定前几个主成分,然后取所选主成分的线性加权平均值进行评价,所用权数是各主成分的方差贡献率 (这也是国内用主成分分析进行综合评价的应用研究案例中的通用做法) 278 。由于主成分分析(PCA)方法具有概念上的简单性,计算上的方便性,以及最优线性重构误差等优良的特性1,从而使得PCA方法成为实际数据处理中应用最为广泛的降维方法之一。但是我们把主成分分析用于综合评价主要是因为它能把原来的指标转化成互不相关的新的指标,从而消除指标之间的重叠信息,可是往往我们只取第一主成分进行评价,这样其实没有利用主成分的这个优点,从而不能消除指标之间的信息重叠,反而加深了指标重叠信息的影响3。同时主成份分析法最终是用一个线性评价函数来综合各单项指标提供的信息,综合过程中未必最大限度地发掘了样本反映的质量信息,也没有努力排除评价指标间的相关重叠性,使得项目归属不清晰,同时因子命名困难。在确定各评价指标线性系数时,既没有克服主观性,也未能避免复杂的计算。1.2.4 关于多维尺度分析(MDS ) 多维尺度分析的概念:多维尺度分析,又称多维量表法,是多元分析技术的新分支,是主成分分析和因素分析的一个自然延伸,它是检验观察数据是否能反映研究者提出的结构关系的一种理想方法。这一方法将高维空间中点际之间距离压缩到低维空间,并以图形的形式直观呈现研究变量之间的相似性(或差异性)关系,达到简化数据、揭示数据潜在规律的目的9。 MDS最早由Torgerson在20世纪50年代中期提出,称为计量型多维尺度(metric MDS ),它是使用单维尺度技术将人们对事物差异的评价转换成目标距离,构建一个多维空间,使空间中点际之间的距离能最大程度地拟合目标距离。在此基础上,Shepard (1962)提出了非计量型多维尺度(non-metric MDS ),也称为相似结构分析,空间结构中的点际距离表达的是相似性数据的顺序关系,而不是具体的数值大小5。这种数据的顺序关系是评价者对各种事物偏好和感觉性的相似关系。MDS通过适当的降维方法,将人们对事物心理感受上的这种相似(不相似)程度在低维度空间中用点与点之间的距离表示,以便于识别那些影响事物间相似性的潜在因素13。Kruskal(1964)给出了具体的计算方法,即应用压力函数描述观察数据与多维尺度模型之间拟合的关系,用迭代的方法逐步减小压力值10 12。多维尺度法的数据计算原理:多维尺度法处理的一般是表示事物之间的接近性(proximity)的观察数据,既可以是实际距离,也可以是主观评判的相似性。其目的是要发现决定多个事物之间“距离”的潜在维度,用较为较少的变量对事物之间的相似性(或称“距离”)作出解释。假设有n个事物,由被试对事物进行两两比较,判断其相似性程度,就会得出一个表示事物相似性程度的矩阵。令ij表示第d个事物和第J个事物之间的接近性程度,表示由n个事物之间的接近程度构成的矩阵。以n=6为例,矩阵就可以写成如下形式。如果事物数量较多,两两比较相对困难,可以采用分类的方法将事物进行归类,要求个体自由地将物体分成几个相互排斥的类,而用被分在同一类中的次数作为事物之间的接近性指标。多维尺度法根据物体之间的观察距离,将这些物体放在一个相对低维度(R)的坐标系内。如可以将上述6个物体放在一个两维的坐标系中。用Xi表示第i个物体的所在点。而用Xir表示第i个物体在第r个维度上的坐标值。那么6个物体在两维坐标系中各点的坐标为:在坐标系中,各点之间的距离,称为模型距离,用d (xi , xi)表示从第xi和xj之间的模型距离,简写为di;。通常情况下,用欧式距离(Euclidean distance)法来计算两点之间的距离多维尺度法的计算过程是要寻求几个较少的潜在维度,将多个事物表示在由潜在维度决定的坐标系中,并比较坐标系中表示事物的各点之间的模型距离与观察距离的一致性,通常是通过多步迭代的办法,不断调整影响模型拟合度的点的坐标,直到表示模型拟合度的压力函数值不再变小,或者变化的幅度对研究的目的来说足够小。Stress的值越小,表明计算结果与观察数据的拟合越好,当dij=f(ij)时,stress=0,模型与观察数据完全拟合。不同的研究者对压力函数值的要求不同,但是一般情况下可以总结如表1-1所示。表1-1 压力指数大小与配合度关系Stress配合度0.200不好0.100还可以0.050好0.025非常好0.000完全配合也可以根据模型距离与拟合距离之间的残差的大小和分布情况说明数据的拟合情况。通过散点图(Shepard图)可以看出残差分布以及模型距离与观察距离之间的关系。如果残差较小,且是随机分布的,说明拟合程度较好10。多维尺度分析的运用:多维尺度(MDS)分析技术起源于心理测验学11,是一种传统的寻求保持数据点之间差异性(或相似性)的降维方法,它可使得在原数据集合中相近的点仍然靠在一起,远离的点仍然远离。多维尺度分析是一类统计分析方法的统称,它最早产生于心理度量分析并在许多领域中得到广泛的应用,在当今的市场研究中,多维尺度分析就是非常重要的一种分析方法18。目前MDS主要应用于市场学、生物学、物理学、社会学等研究中,并广泛应用于心理与教育科学领域14。杨继平和郑建君在运用MDs对明清晋商组织管理结构的分析中指出:“多维尺度分析(MDS)主要特点在于能够量化并描述复杂心理现象的结构,它对非度量化数据的现象研究及模型探测也是特别适合的。其使用的主要目的在于通过对数据空间维度的呈现来对模型进行主观上的判定,并对所列数据的模型形状予以探测。多维尺度分析虽较多运用于社会经济调查研究,但近几年在国内外心理与教育科学领域也被广泛的采用。例如,对作为工作分析决定因素之一的团体结构的实证研究(Mullins和Kimbrough,1988);对干预者策略选择的诱导性分析研究(Pinkley和Brit-tain,1995);采用多维尺度分析方法对异常反应模式进行的再分类尝试研究(曹亦薇,2001);利用多维尺度分析法,通过计算机联网实验对团队问题解决过程中的知识结构进行获取与分析(王重鸣、严进,2001);关于都市人智慧隐含理论的初步调查(张卫东、董海涛,2003);与Holland的职业兴趣理论相关的职业兴趣结构的评估研究(刘长江、Rounds,2003);运用自然分类和多维尺度分析方法,对纳西族亲属词概念结构的研究(张积家、秀梅,2004);创造人才关于创造性科学成就的概念结构研究(张景焕、金盛华,2005)等都在研究过程中对多维尺度分析方法进行了运用,并得到了相应的研究结果。1.2.5 以往研究的不足翻阅以往主成分分析和多维尺度分析的相关文献,总的来看,还有一些问题值得思考;1作为多元统计分析方法,我们应该分析研究主成分分析和多维尺度分析方法的适用条件要求,目前虽然国内广泛运用这两种降维数据方法可是对其适用条件的明确并不清晰,应得到重视。2主成分分析和多维尺度分析方法是重要的降维数学方法,但是运用于心理学领域,分析心理学相关数据的时间不长,因此我们更要重视对两种方法在心理学领域的运用和降维结果的评价。3国内外关于主成分分析和多维尺度分析的运用研究主要是通过数学模型和计算方法进行比较,较少运用实例来比较分析两者的运用效果,所以在研究方法的创新和实践应值得重视。1.3 研究案例的一些情况通过查阅和分析华竞芳2008年学士论文大学生心目中的心理咨询师形象研究我们发现了主成分分析方法基于该案例的降维结果不很理想,存在着一些问题。作者选取华中科技大学、江汉大学等高校270名大学生进行开放式问卷调查,要求他们用5至15个形容词或短语描述心目中现实的心理咨询师形象和理想的心理咨询师形象。然后由2名心理学专业四年级学生和1名心理学专业教师对列出的语汇进行归类,合并同义词,选出频次在3次以上的语汇。然后将预备研究中筛选出的现实形象和理想形象的语汇编制成大学生心目中的心理咨询师形象调查的初步问卷,要求被试用5点量表评定这些语汇与他们心目中心理咨询师形象的符合程度。1代表“非常不符合”,5代表“非常符合”。接着选取应用心理学专业三年级的一个班进行了试测,搜集他们对于问卷指导语、答题方法、语汇表述等方面的意见,结合专家意见对问卷进行了修改,形成正式问卷。最后通过对应用心理学二年级学生介绍问卷目的及使用方法,由他们分发给大学生。为了对形象语汇进行归类,作者采用了主成分分析方法,对536名被试的现实心理咨询师形象评定结果进行因素分析,以确定这些素质的内在结构。(KMO值为0.909,卡方值为8161.340,df值为703,p0.001,表明适合进行因素分析。)采用特征根大于1的标准提取因子,得到7个因子。然后,根据碎石图的拐点情况(见图1-1)及项目的归属情况,最终抽取了6个因子,解释总方差变异的52.458%。方差变异解释情况见表1-1,方差最大正交旋转的因子载荷矩阵如表1-2所示(仅显示0.3以上的载荷)。图1-1 现实形象的因子分析碎石图表1-1 现实形象因子分析的方差变异解释情况因子未旋转旋转后特征根解释变异%累积%特征根解释方差变异%累积%19.42124.79224.7924.94013.00013.00024.45511.72536.5174.47711.78224.78231.9505.13241.6494.22811.12635.90941.4943.93245.5802.7757.30443.21251.4463.80649.3861.8964.99148.20361.1673.07252.4581.6174.25552.458表1-2 现实形象的项目因子载荷项目因子1因子2因子3因子4因子5因子6认真0.750负责0.699乐于助人0.652和蔼0.637稳重0.563善良0.5530.351举止文雅0.5100.400温和0.476开朗0.4330.401热情0.3900.387-0.366虚伪0.778自以为是0.761敷衍0.744狡猾0.736没有可行建议0.723令人生畏0.675不够专业0.650睿智0.650专业0.6380.303学识渊博0.629洞察力强0.629善解人意0.3690.626真诚0.5030.561亲切0.4330.550耐心0.3670.517幽默风趣0.449-0.331循循善诱0.676健谈0.613经验丰富0.3510.514冷静理性0.3210.513神秘.581严肃0.304.541冷漠0.498.509外在形象好0.3610.354.389收费高0.553高薪0.3300.542保密0.3770.3110.492根据表1-2的因子载荷情况,并结合逻辑分析,将大学生心目中的现实心理咨询师形象概括为以下8个方面(见表1-3 )。表1-3 现实心理咨询师形象维度维度语汇1.道德品质负责、认真、乐于助人、善良、保密2.负性形象虚伪、自以为是、敷衍、狡猾、没有可行建议、令人生畏、不够专业3.才智睿智、专业、学识渊博、洞察力强、幽默风趣4.宜人性热情、善解人意、真诚、亲切、耐心、和蔼、温和、外在形象好5.距离感神秘、严肃、冷漠、6.成熟经验丰富、冷静理性、稳重、举止文雅、开朗7.言语循循善诱、健谈8.经济收费高、高薪同理,采用主成分分析方法,对536名被试的理想心理咨询师形象评定结果进行因素分析,以确定这些素质的内在结构。KMO值为0. 968,卡方值为13082.965,df值为630,p0.001,表明适合进行因素分析。采用特征根大于1的标准提取因子,得到4个因子,解释总方差变异59.913%。碎石图见图1-2,方差变异解释情况见表1-4,方差最大正交旋转的因子载荷矩阵如表1-5所示。图1-2 理想形象的因子分析碎石图表1-4理想形象因子分析的方差变异解释情况因子未旋转旋转后特征根解释变异%累积%特征根解释方差变异%累积%117.21047.80547.8057.74421.51121.51121.7634.89852.7035.20614.46135.97231.4674.07456.7774.94913.74649.71841.1293.13559.9133.67010.19459.913表1-5 理想形象的项目因子载荷项目因子1因子2因子3因子4平易近人0.696 认真0.692 有亲和力0.673 乐于助人0.667 0.333和蔼0.654 0.3200.329体贴0.631 0.412 温和0.625 0.381 可信赖0.5830.3610.334 善解人意0.5720.384 善良0.5600.3250.344.314真诚0.5530.439 收费合理0.5510.411 负责0.5410.3930.342 耐心0.5360.504 开朗0.534 0.4350.408善于沟通0.5250.3510.321 善于倾听0.4890.3820.486 能有效解决问题0.4740.4100.3500.314敬业0.3080.711 冷静理性 0.687 保密 0.674 洞察力强 0.639 身心健康0.3700.555 0.317循循善诱 0.531 0.315睿智0.3130.4450.332 学识渊博 0.735 稳重.341 0.686 经验丰富 0.666 讲话有条理0.4010.3680.585 专业 0.3960.579 健谈0.318 0.5290.405阅历丰富0.409 0.489 幽默风趣 0.785外在形象好 0.679热情0.404 0.670亲切 0.655注:显示0.3以上的载荷。从表1-5可见,有不少项目在多个因子上有较高载荷,项目归属关系不明确,所以不能依赖此结果。参考心理咨询师现实形象的维度,可以合理地将理想形象的语汇归为6个维度,结果见表1-6。与心理咨询师现实形象维度相比,没有负性形象和距离感两个维度。表1-6 理想心理咨询师形象维度维度语汇1.道德品质认真、乐于助人、负责、敬业、善良、保密2.才智睿智、学识渊博、洞察力强、专业、幽默风趣、能有效解决问题3.宜人性平易近人、有亲和力、和蔼、体贴、温和、可信赖、善解人意、真诚、耐心、热情、亲切、善于沟通、善于倾听、外在形象好4.成熟经验丰富、冷静理性、阅历丰富、稳重、开朗、身心健康5.言语健谈、循循善诱、讲话有条理6.经济收费合理通过分析以上的降维结果,可以发现主成分分析方法在该案例中的运用过程中未必最大限度地发掘了样本反映的信息,也没有努力排除评价指标间的相关重叠性,使得项目归属不清晰,同时因子命名困难。1.4 本研究的主要思路本文,希望基于这个研究案例,即对已有的心理咨询师形象再做一个多维标度法研究,比较该研究所做的主成分分析与多维尺度分析的结果,从而进一步对主成分分析与多维尺度分析的降维结果进行比较。2 对研究案例的多维尺度分析研究2.1 研究目的运用多维尺度分析方法来探讨大学生心目中心理咨询师的现实形象和理想形象的维度。2.2 研究方法2.21 被试情况从江汉大学教育学院抽取应用心理学的二、三、四年级本科生作为研究被试。本研究的目的在于通过多维尺度分析技术获取大学生心目中心理咨询师现实和理想形象的整体结构框架,不需要考虑研究被试的个体差异,因此在研究设计时未对被试的性别、年龄等个体特征因素进行要求。本次研究发放问卷68份,回收问卷65份,有效问卷53份,有效回收率为77.9%2.2.2 研究材料在华竞芳2008年学士论文大学生心目中的心理咨询师形象研究中,作者选取华中科技大学、江汉大学等高校270名大学生进行开放式问卷调查,要求他们用5至15个形容词或短语描述心目中现实的心理咨询师形象和理想的心理咨询师形象。然后由2名心理学专业四年级学生和1名心理学专业教师对列出的语汇进行归类,合并同义词,选出频次在3次以上的语汇。鉴于多维尺度分析是一种利用客体间的相似性(或相异性)数据去揭示它们之间的空间关系的多元统计分析方法,在具体应用时要求被试对客体的相似性(或相异性)进行空间判断。如果进行两两比较,就其相似程度按照“不相似完全相似”的标准赋予相应的数值“15”,其比较次数应为n(n-1)/2次,n为比较对象的数量。为了避免被试在进行两两比较时次数过多,从而造成被试的疲劳以至于影响赋予数值的准确性,并且本研究并不要求考察每个被试测查结果的个体差异,只需看其整体效果,因而采取了自由分类处理的方法。同时,在本研究材料的编制过程中,为了更为科学的比较多维尺度分析和主成分分析方法基于这一个研究案例的结果,本研究选取了与以上研究同样的词汇并汇编成心理咨询师形象词语自由分类问卷(见附录1)。2.2.3 研究程序研究时,首先向被试呈现心理咨询师形象的备择词汇分类表,要求被试根据自己对所列词汇的理解确定分类标准和分类数目,同时将备择词汇的编码序号填入分类框进行无序分类。在进行数据录入形成53个3737的相异矩阵时(心理咨询师现实形象词语分类)和53个3636(心理咨询师理想形象词语分类),按照下述原则予以赋值:对于分类时处在同一类别中的两个词,在这两个词的相聚处赋值“0”,否则就记作“1”。然后利用心理学研究统计软件SPSS12.0对数据进行处理分析,在本研究中,采用SPSS12.0中多维尺度分析方法(MDS)对53个相异矩阵进行统计分析,最终得出大学生心目中心理咨询师现实和理想形象不同维度的解、Stress值及各备择词汇在不同维度中的坐标值。为更为有效准确的录入数据形成53个3737(心理咨询师现实形象词语分类)和53个3636(心理咨询师理想形象词语分类),本研究运用了自由分类结果转换为相异矩阵的EXCEL操作(见附表2)2.3 结果与分析2.3.1 大学生心目中心理咨询师现实形象结果与分析2.3.1.1 心理咨询师现实形象词汇分类情况的描述统计53名被试将心理咨询师现实形象词汇分为3类和4类的最多,占75.4%,平均分类数目为3.8类,其具体分类情况见表2-1。表2-1 心理咨询师现实形象词汇的分类情况表分类数目出现频次百分比%261132343417325 246367128122.3.1.2 心理咨询师现实形象的多维尺度分析结果在采用SPSS12.0中多维尺度分析方法对相异矩阵予以处理后,其降维和聚类后的结果显示:模型的拟合劣度Stress值为0.10312小于0.20;RSQ值为0.96522,十分接近1。从模型拟合统计数值上来看,各项考核指标均达到标准,表明模型拟合良好。分类结果通过SPSS12.0中多维尺度分析方法统计处理后,对心理咨询师现实形象词汇的结构采用了二维度模型。心理咨询师现实形象的37个特征描述词汇在不同维度中的坐标值和多维尺度空间图具体见表2-2与图2-1.表2-2心理咨询师现实形象词汇在不同维度中的坐标值现实形象词汇维度一维度二现实形象词汇维度一维度二神秘0.70221.0836收费高1.98010.8303洞察力强-1.23120.2530没有可行建议2.47240.2059外在形象好-0.1609-0.9475稳重-0.58710.0236学识渊博-1.10240.5628开朗-0.4155-0.8646 严肃1.3489-0.0965举止文雅-0.5916-0.1490亲切-1.0715-0.3462虚伪1.9513-0.4056专业-0.96790.7709循循善诱-0.53910.1784高薪0.44751.4621善良-0.9158-0.4914保密-0.54441.1384自以为是2.1125-0.4847冷漠1.9064-0.4306经验丰富-1.07780.4564睿智-0.95510.1083狡猾1.9498-0.5039真诚-1.1917-0.2560和蔼-0.9497-0.3734善解人意-1.1752-0.2321认真-1.14640.0733耐心-1.0776-0.2803令人生畏1.76440.5805幽默风趣-0.4598-0.7275乐于助人-0.9990-0.3774负责-0.99540.1439敷衍2.2103-0.3545不够专业2.37460.1555冷静理性-0.7579 0.6791热情-0.8621-0.6059健谈-0.5528-0.3447温和-0.8927-0.4338(V1=神秘 V2=洞察力强V3=外在形象好 V4=学识渊博V5=严肃 V6=亲切 V7=专业V8=高薪 V9=保密 V10=冷漠 V11=睿智 V12真诚 V13=善解人意 V14=耐心V15=幽默风趣 V16=负责 V17=不够专业 V18=热情 V19=温和 V20收费高V21=没有可行建议 V22=稳重 V23=开朗 V24=举止文雅 V25=虚伪 V26=循循善诱V27=善良 V28=自以为是 V29=经验丰富 V30=狡猾 V31=和蔼 V32=认真V33=令人生畏 V34=乐于助人V35=敷衍 V36=冷静理性 V37=健谈)图2-1 心理咨询师现实形象词汇聚类结构图MDS将研究数据转换为距离数据后,生成两种相互联系的结果对象的空间分布图(如图2-1)与对象在各维度上的解即坐标值(如:表2-2)。前者以后者为基础。本研究依据空间分布图进行聚类发生困难或可能产生偏差时,因此就需要运用研究对象在各维度上的坐标值进行聚类分析了14。对表2-2的数据,选择欧式距离进行相似性(距离)度量,采用常用的组内联结法(within-groups linkage)对这些词汇进行聚类。SPSS 12.0处理得到的聚类树形图如图2-2所示,它清晰地显示了聚类全过程和类间距离。由此图可见当分类数由36至4时,联结距离缓慢增加;但是合并为3类时,联结距离则上升幅度较大.因此将心理咨询师现实形象词汇合并为4类较合理,降维结果见表2-3表2-3:心理咨询师现实形象维度维度词汇(1)中性形象1.神秘8.高薪(2)良性特质2.洞察力强 3.外在形象好4.学识渊博 6.亲切 7.专业9.保密 11.睿智12.真诚 13.善解人意 14.耐心15.幽默风趣 16.负责18.热情19.温和22.稳重23.开朗 24.举止文雅26.循循善诱27.善良29.经验丰富 31.和蔼 32.认真34.乐于助人36.冷静理性37.健谈(3)距离感20.收费高33.令人生畏(4)负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论