




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
因子分析一 因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。对于所研究的某一具体问题,原始变量分解为两部分之和。一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。从全部计算过程来看作R型因子分析与作Q型因子分析都是一样的,只不过出发点不同,R型从相关系数矩阵出发,Q型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。二因子分析的数学模型设有个指标,则因子分析数学模型为:其中,是已标准化的可观测的评价指标。出现在每个指标的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。是各个对应指标所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。是指标在公共因子上的系数,称为因子载荷,因子载荷的统计含义是指标在公共因子上的相关系数,表示与线性相关程度。用矩阵形式表示为:其中,称为因子载荷矩阵。其统计含义是:中的第行元素说明了指标依赖于各个公共因子的程度。中第列元素说明了公共因子与各个指标的联系程度。故常根据该列绝对值较大的因子载荷所对应的指标来解释这个公共因子的实际意义。中的第行元素的平方和称为指标的共同度。中第列元素的平方和表示公共因子对原始指标所提供的方差贡献的总和,衡量各个公共因子的相对重要性。称为公共因子的方差贡献率,越大,公共因子越重要。三因子分析的步骤3.3.1 将原始变量数据进行标准化处理无两钢化;3.2 计算标准化指标的相关系数矩阵;3.3 求解相关系数矩阵的特征向量和特征值;3.4 确定公共因子的个数,设为个,即选择特征值1的个数或根据累积方差贡献率85的准则所确定的个数为公共因子个数;3.5 求解初始因子载荷矩阵;常用的方法有:主成分法、主轴因子法、极大似然法等。本文用主成分法寻找公因子的方法如下:设从相关矩阵出发求解主成分,设有个变量,则可以找出个主成分,将所得的个主成分由大到小排列,记为,则主成分与原始变量之间有r11是特征根,x1是原始数据其中是随机变量的相关矩阵的特征值所对应的特征向量的分量,特征向量之间正交,从到的转换关系的可逆得到由到的转换关系只保留前个主成分,而把后面的个主成分用特殊因子代替,即后面的被替代为了把转化为合适的公因子,需要把主成分变为方差为1的变量,故令,则设样本相关系数矩阵的特征值为,其相应的标准正交特征向量为,设,则因子载荷矩阵的一个估计值为:共同度的估计为:。3.6 建立因子模型,其中为公共因子,为特殊因子。3.7 对公共因子进行重新命名,并解释公共因子的实际含义当初始因子载荷矩阵难以对公共因子的实际意义作出解释时,先要对作方差极大正交旋转,然后再根据旋转后所得的正交因子载荷矩阵作出解释,即根据指标的因子载荷绝对值的大小,值的正负符号来说明公共因子的意义。3.8 对初始因子载荷矩阵进行旋转由于因子载荷矩阵不唯一,旋转变换可以是使初始因子载荷矩阵的每列或每行的元素的平方值趋于0或1,从而使得因子载荷矩阵结构简化,关系明确。如果初始因子之间不相关,公共因子的解释能力能够用其因子载荷平方的方差来度量时,则可采用方差极大正交旋转法;如果初始因子之间相关,则需要进行斜交旋转,通过旋转后,得到比较理想的新的因子载荷矩阵。3.9 将公共因子变为变量的线性组合,得到因子得分函数,系数,均为标准化的原始变量和公共因子。因子得分函数的估计值为其中为因子载荷矩阵,为原始变量的相关矩阵,为原始变量向量。3.10 求综合评价值,即总因子得分估计值为其中时第个公共因子的归一化权重。即:3.11 根据总因子得分估计值就可以对每个被评价的对象进行排名,从而进行比较。四因子分析的评价4.1 首先在进行因子分析时,必须消除原始变量数据量纲和数量级的影响,所以需要对原始变量数据作转换。常选用标准化变换。有些参考文献中也有说这样的标准化处理仍然存在有不合理的地方,但是在实际应用中,为了简便,常选用上式进行变换。4.2 在做因子分析之前,需要对原始变量间作相关性分析。因为并不是所有的变量数据都是可以做因子分析的。4.3因子分析适宜针对大样本容量做综合分析,对于小样本容量所做的分析不够准确。一般要求样本容量大于指标个数的两倍。4.4 不能简单地将初始因子载荷矩阵认为是主成分系数矩阵(特征向量矩阵),否则会造成偏差。所建立的综合评价函数只是给出了一个排名,只是定性说明这个函数包含了原始变量信息量的程度,并没有给出一个百分比等定量的度量。五典型案例随着市场竞争的日益激烈,公司在人才选择方面更加注重人才的综合素质,并结合职位特定选择专门人才。在本文中选取一家集生产与销售于一体的大公司在人才招聘中数据,从综合素质以及招聘职位来选择优秀的员工。“华威”公司是一家集生产、销售为一体的大型国际著名公司。现公司计划录用6名的员工。经过初选,公司对48位应聘者进行面试,面试共有15项指标,这15项指标分别是:求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)、经验(EXP)、驾驶水平(DRV)、事业心(AMB)、理解能力(GSP)、潜在能力(POT)、交际能力(KJ)和适应性(SUIT)。每项指标的分数是从0分到10分,0分最低,10分最高。每位求职者的15项指标的得分在文件(应聘者得分记录.xls)中。试从综合素质选出6名优秀员工,若将这6名员工分别分配到管理、销售和生产部门各2名,指出合理的分配方案。(二)、分析过程详解1、 数据标准化由于数据均为在面试中的打分成绩,量纲相同,并且观察数据的分布,并无异常值的出现,因此数据没有必要进行标准化,可以直接进行分析。2、 建立相关系数矩阵利用SPSS软件,correlate功能计算相关系数矩阵,计算皮尔森相关系数并进行卡方双尾检验,可以看出变量间存在这很大的相关性。进行相关系数矩阵检验KMO测度和巴特利特球体检验:KMO值:0.9以上非常好;0.8以上好;0.7一般;0.6差;0.5很差;0.5以下不能接受。巴特利特球体检验原假设H0:相关矩阵为单位阵通过观察上面的计算结果,可以知道,KMO值为0.784,在较好的范围内;而巴特利球体检验的sig值为0.00,拒绝原假设,说明相关矩阵并非单位矩阵,变量的相关系数较为显著。3、 求解特征根及相应特征向量n Spss选项:AnalyzeData ReductionFactorn 用Extraction,选择提取共因子的方法(如果是主成分分析,则选Principal Components),n 用Rotation,选择因子旋转方法(如果是主成分分析就选None),n 用Scores计算因子得分,再选择Save as variables(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如Regression);要想输出Component Score Coefficient Matrix表,就要选择Display factor score coefficient matrix;输出结果如下:碎石图:通过此图可以明显看出前五个因子可以解释大部分的方差,到第六个因子以后,线逐渐平缓,解释能力不强。因此我们提取5个公因子。方差贡献率选择5个公因子,从方差贡献率可以看出,其中第一个公因子解释了总体方差的50.092%,四个公因子的累计方差贡献率为86.42%,可以较好的解释总体方差。因子载荷矩阵通过因子载荷矩阵可以看出因子的意义并不是十分明确,为了对因子进行解释与说明,进行因子旋转,选取方差最大因子旋转方法,并保留因子得分。4、 因子旋转旋转后的因子载荷矩阵:通过上表中旋转的结果,我们可以看出第一个公因子在自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上有较大的载荷,可以将其命名为基本素质;第二个因子在求职信形式,经验,适应性上有较大的载荷,可以理解为工作经验素质;第三个因子在讨人喜欢能力,诚实,交际能力上有较大的载荷,可以命名为外在能力;第四个因子在专业能力上载荷较大,但在交际能力上的载荷为负相关,也从侧面反映了专业能力较强的人在交际上有一定的欠缺,这和目前一部分高校毕业生书本专业知识较强,但日常待人接物能力较差的现象相吻合,将其命名为专业素质;第五个因子仅在外貌上有较大的载荷,可以将其命名为外表。最后,通过上面的因子选注我们的评价指标可以通过五个主要的因子来表示,分别为基本素质,工作经验素质,外在能力,专业素质和外表。接下来计算各因子得分,并按照要求筛选优秀的应试者。5、 计算因子得分各因子得分的计算公式为:分别计算各应试者的五个因子得分,按照相对方差贡献率进行加权,得到最终各应试者的综合评价。综合得分:编号综合得分编号综合得分编号综合得分10.9925 170.2369 33-0.0634 20.9315 180.1480 34-0.5107 30.7912 190.2378 35-0.4718 40.6150 200.2073 36-0.3979 50.6968 21-0.0711 37-0.1255 60.7259 220.8704 38-0.2785 70.6070 230.0993 39-0.5476 80.6007 240.0325 40-0.6171 90.4299 25-0.2851 41-0.9400 101.0461 260.2296 42-0.7864 110.4309 27-0.3275 43-1.1902 120.3623 28-0.0763 44-1.0797 130.5168 290.2112 45-0.9281 140.8424 30-0.3032 46-0.9682 150.3403 31-0.0685 47-0.9455 160.2117 32-0.3789 48-1.0527 将综合得分进行排序,前六名为我们重点考虑的对象,编号分别为:10,1,2,22,14,3。我们重点分析这六个人的各方面得分,从而指定较为合理的部门分配。编号基本素质工作经验素质外在能力专业素质外表综合得分102.04521-0.50527-1.611841.493955-0.284521.04613911.1476231.5521981.0407290.4904-1.421990.99254221.0096941.5858421.1658840.556039-1.536650.931513221.960285-0.54789-2.703561.486739-0.222070.870439141.629787-0.83238-0.908291.651657-0.365390.8424330.8334521.4421630.1683010.4294080.3637250.79118961.1213590.4013010.698105-0.61087-0.170640.725859通过对排在前六名的应试者各因子得分分析可知:10号和22号在基本素质包括自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上的得分最高,这也是他最大的优势所在,在专业素质上的得分也很高,说明此人专业水平和好,但是在外在能力也就是交际能力,讨人喜欢能力以及第五因子外表上得分均为负值,说明此人的外在条件并不是很好;另外此人的工作经验素质的得分也为负值,其中包括求职信形式,经验,适应性等,说明欠缺工作经验,此人很有可能为刚毕业的应届生,基本素质以及专业知识过硬,但是社会生活能力较差。在本次所招收的职位中,生产部门的研发职位要求专业能力强,对于经验及外在条件的要求较低,10号和22号比较适合安排在生产部门。1号和2号除了外表为负值以外,其他因子得分均为正值,此人外在能力和工作经验素质的得分较高,说明此人有一定的工作经验,社交能力较强。本次招聘中,销售部门对于员工的基本要求就是工作经验以及较强的社交能力,因此1号比较适合安排在销售部门。3号各方面的得分均为正值,说明比较全面,其中工作经验素质得分最高,说明此人工作经验丰富并且适应性较强;管理部门要求员工素质要全面均衡,工作经验比较重要,所以3号适合安排在管理部门。14号的情况与10号和22号类似,由于我们现在需要管理部门的员工,从各项得分来说,14号不太适合;所以我们后移一位,选择6号安排进管理部门,虽然6号在外表和专业素质上的得分为负值,但这对于管理部门来说并不是最重要的。6号在因子1即基本素质的得分高于3号,自信心,洞察力,推销能力,事业心,理解能力,潜在能力等对于管理阶层才是最重要的。(三)、主要结论通过上面对应试者的分析我们可以看出,作为应届的学生,在找工作时,公司重点考察的方面,以及我们所欠缺的。如前述分析中大部分的应试者专业能力较强但是待人接物的能力明显较差,这也是应届生求职中的主要障碍之一;还有应届生缺乏工作经验,适应性较差,这也是困扰大学生求职的问题之一。作为应届生可以从中找到自身的弱点加以改善;同时还要注意自身的优点,在求职中结合职位要求有的放矢,才能实现较好的就业。公司在选拔人才时不能笼统的只看评价打分的平均分或者总分,应该从公司的实际出发,从招聘职位的具体要求出发,选择最适合企业发展的人才。在多指标的评价体系中,因子分析可以将多维空间降维,实现以较少的指标来解释大部分自变量的信息,从而简化分析步骤,评价起来更清晰简便。六MATLAB程序代码clear all;DATA=load(D:0.m);DATA=double(DATA);DATA=DATA;TESTDATA=load(D:14f.m);TESTDATA=double(TESTDATA);% DATA=load(D:正常.txt);% DATA=double(DATA);% DATA=DATA(:,3:12);% TESTDATA=load(D:异常.txt);% TESTDATA=double(TESTDATA);% TESTDATA=TESTDATA(:,3:12);Kp,T2=tztq(DATA,TESTDATA);function contribution,T2,SPE,t2cl,s_cl = PCA_model(Xtrain,Xtest)X_mean = mean(Xtrain); X_std = std(Xtrain); X_row ,X_col= size(Xtrain); for i = 1:X_col Xtrain(:,i) = (Xtrain(:,i)-X_mean(i)./X_std(i); Xtest(:,i) = (Xtest(:,i)-X_mean(i)./X_std(i);endU,S,V=svd(Xtrain./sqrt(size(Xtrain,1)-1),0); D= S2;lamda=diag(D);num_pc=1;while sum(lamda(1:num_pc)/sum(lamda)sqrt(gama)% ni=ni+1;% F=F ax(ib,:);% end% % % end% AX=F%训练集基的提取结束 N=size(ax,1); for i=1:N for j=1:N K(i,j)=exp(-norm(ax(i,:)-ax(j,:)2/c);%求核矩阵 end end n1=ones(N,N); N1=1/N*n1; Kp=K-N1*K-K*N1+N1*K*N1; u,s,v=svd(Kp/N); lamda=s; P=v; lamda=diag(lamda); B=length(find(lamda1e-10); %求非零的特征值个数 %求主元个数npc=1;while sum(lamda(1:npc)/sum(lamda(1:B)0.9 npc=npc+1;endnpc%求特征空间有效维数DimFS=1;while sum(lamda(1:DimFS)/sum(lamda(1:B)=0.99 DimFS=DimFS+1;endlamda=diag(lamda);for i=1:B % P(:,i)=P(:,i)/norm(P(:,i)*s(i,i);P(:,i)=P(:,i)/(norm(P(:,i)*sqrt(N*lamda(i,i);endNy=size(ay,1);mean_X =mean(axb);std_X = std(axb);num_sample = Ny; ay = ay-mean_X(ones(num_sample,1),:); ay = ay./std_X(ones(num_sample,1),:); % mean_y = mean(ay);% std_y=std(ay);% ay = ay-mean_y(ones(Ny,1),:);% std_y(find(std_y=0)=1;%数据处理% ay = ay./std_y(ones(Ny,1),:);for i=1:Ny for j=1:N Ky(i,j)=exp(-norm(ay(i,:)-ax(j,:)2/c); en
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 明星公益活动整合方案协议
- 2025年法律职业资格考试(试卷二)综合试题及答案
- 2025年村级残疾人康复站社工招聘面试预测题及答案
- 地理小知识培训课件
- 2025年高等数学基础知识审核考试试卷及答案
- 地球运动的一般特征
- 2025年甘肃省机关事业单位工勤岗位中高级《管道工》考题库(附答案)
- 日记在游乐场500字10篇范文
- 地球自转必修一课件
- 干股盈利分配合同
- 给药错误PDCA课件
- 医美注射培训
- 白内障护理课件
- 香菇多糖生产工艺创新-洞察分析
- 箱泵一体化泵站设计图集
- 三上10《公共场所文明言行》道德法治教学设计
- 《电器火灾的防范》课件
- 路灯CJJ检验批范表
- 农村厕所改造合同书完整版
- 建筑工程安全管理提升方案
- 对新员工保密基本培训
评论
0/150
提交评论