




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子科技大学政治与公共管理学院本科教学实验报告(实验)课程名称:数据分析技术系列实验电子科技大学教务处制表电 子 科 技 大 学实 验 报 告学生姓名: 学 号: 指导教师: 一、实验室名称: 电子政务可视化实验室二、实验项目名称:因子分析 三、实验原理主成分分析: 由于多个变量之间都存在着相关性,故为了使复杂的问题更加清晰,因此就设计将原来的变量重新线性组合成若干个互不相关的综合指标来代替原来的变量,并尽可能提取原来变量的信息来解释原有变量的协方差结构,这就是主成分分析法(Principal Component Analysis)。主成分分析的数学模型: 设有n个变量,每个样品有p个变量对其作线性组合得到:这里限制性要求:第i主成分的贡献率为:表明第i个主成分综合的信息的能力累计贡献率为:表示前m个主成分包含了原变量所具有的信息量。因子分析: 因子分析是多元统计分析中处理降维的一种统计方法,它主要将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。其中X是可实测的p 个指标所构成的 p 维随机向量;F 是公共因子或潜因子,即前面所说的综合变量;称 aij 为因子载荷,是第 i 个变量在第 j 个公共因子上的负荷;矩阵 A 称为因子载荷矩阵; 是X的特殊因子。因子分析的几个重要概念:1、因子载荷 实际上,即第 i 个变量与第 j 个公共因子的相关系数, 它的统计意义就是第 i 个变量在第 j 个公共因子上的负荷, 反映了第 i 个变量在第 j 个公共因子上的 相对重要性。 2、变量共同度Communalities 3、公共因子 Fj 的方差贡献4、因子旋转 因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上载荷比较小。这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。 5、因子得分因子分析的数学模型是将变量表示成公共因子的线性组合,而在实际应用中,往往需要用公共因子去代表原始变量,即将公共因子表示为变量的线性组合,即上式是因子得分函数,用它来计算每个样品的公共因子得分。估计因子得分有很多种方法,比如加权最小二乘法,回归法等。四、实验目的理解因子分析的基本原理,掌握在SPSS软件中因子分析的主要参数设置及其含义,掌握SPSS软件分析结果的含义及其分析。五、实验内容及步骤实验内容一:以城市基础设施调查数据为基础,运用因子分析方法对数据进行分析。(1) 问题描述对我国主要城市的市政基础设施情况进行因子分析。(2) 因子分析Factor Analysis 过程调用(3) 分析变量设置及参数选择实验内容二:以主要城市日照数调查数据为基础,运用因子分析方法对数据进行分析。(1) 问题描述对主要城市日照数进行因子分析。(2) 因子分析Factor Analysis 过程调用(3) 分析变量设置及参数选择六、实验器材(设备、元器件):计算机、打印机、硒鼓、碳粉、纸张七、实验数据及结果分析实验一分析结果及讨论分析结果如下列表示。DataSet1 C:UsersaDesktop罗应婷 书配套光盘配套数据文件第12章各地区城市市政设施.savCorrelation Matrix年末实有道路长度(公里)年末实有道路面积(万平方米)城市桥梁(座)Correlation年末实有道路长度(公里)1.000.983.783年末实有道路面积(万平方米).9831.000.738城市桥梁(座).783.7381.000城市排水管道长度(公里).939.940.759城市污水日处理能力(万立方米).896.853.873城市路灯(盏).883.867.719Correlation Matrix城市排水管道长度(公里)城市污水日处理能力(万立方米)城市路灯(盏)Correlation年末实有道路长度(公里).939.896.883年末实有道路面积(万平方米).940.853.867城市桥梁(座).759.873.719城市排水管道长度(公里)1.000.845.916城市污水日处理能力(万立方米).8451.000.822城市路灯(盏).916.8221.000 表1.1 从表1.1可以看出,各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近于1,所以本例很适合使用主成分分析。KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.856Bartletts Test of SphericityApprox. Chi-Square281.248df15Sig.000 表1.2KMO检验是为了看数据是否适合进行因子分析,从表1.2可以看出KMO的值为0.856,表示可以进行因子分析。Bartlett检验是为了看数据是否来自于服从多元正态分布的总体,从表1.2可以看出,Sig.的值为0.000,说明数据来自正态分布总体,适合进一步分析。CommunalitiesInitialExtraction年末实有道路长度(公里)1.000.954年末实有道路面积(万平方米)1.000.919城市桥梁(座)1.000.742城市排水管道长度(公里)1.000.924城市污水日处理能力(万立方米)1.000.882城市路灯(盏)1.000.859Extraction Method: Principal Component Analysis. 表1.3 变量共同度表示的是各变量中所含原始信息能被提取的公因子所解释的程度。从表1.3可以看出,大多变量共同度在85%以上,所以提取的这几个公因子对变量的解释能力很强。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total15.28088.00188.0015.2802.3906.50394.5043.1622.70797.2114.1041.73898.9505.051.84999.7996.012.201100.000Total Variance ExplainedComponentExtraction Sums of Squared Loadings% of VarianceCumulative %188.00188.00123456表1.4 从表1.4可知,只有第一个的特征值大于1,所以只选择第一个成分,方差贡献率为88.001%,几乎涵盖了原变量的全部信息。Extraction Method: Principal Component Analysis.表1.5Component MatrixaComponent1年末实有道路长度(公里).977年末实有道路面积(万平方米).959城市桥梁(座).862城市排水管道长度(公里).961城市污水日处理能力(万立方米).939城市路灯(盏).927Extraction Method: Principal Component Analysis.a. 1 components extracted. 表1.6从表1.6可以看出,因子在年末实有道路长度(公里)、年末实有道路面积(万平方米)、城市桥梁(座)、城市排水管道长度(公里)、城市污水日处理能力(万立方米)及城市路灯(盏)上有较大的负荷。Component Score Coefficient MatrixComponent1年末实有道路长度(公里).185年末实有道路面积(万平方米).182城市桥梁(座).163城市排水管道长度(公里).182城市污水日处理能力(万立方米).178城市路灯(盏).176Extraction Method: Principal Component Analysis.表1.7 从表1.7可以看出,公因子的表达式为实验二结果及分析:DataSet1 C:UsersaDesktop罗应婷 书配套光盘配套数据文件第12章主要城市日照时数.savCorrelation Matrix一月日照时数二月日照时数三月日照时数四月日照时数Correlation一月日照时数1.000.897.897.714二月日照时数.8971.000.855.756三月日照时数.897.8551.000.860四月日照时数.714.756.8601.000五月日照时数.742.785.799.857六月日照时数.464.410.541.588七月日照时数.027.175.150.380八月日照时数.110.033.234.282九月日照时数.487.505.579.508十月日照时数.551.569.498.397十一月日照时数.781.827.656.515十二月日照时数.558.445.365.139Correlation Matrix五月日照时数六月日照时数七月日照时数八月日照时数Correlation一月日照时数.742.464.027.110二月日照时数.785.410.175.033三月日照时数.799.541.150.234四月日照时数.857.588.380.282五月日照时数1.000.725.335.319六月日照时数.7251.000.367.699七月日照时数.335.3671.000.624八月日照时数.319.699.6241.000九月日照时数.666.777.248.561十月日照时数.574.640.386.546十一月日照时数.645.452.190.140十二月日照时数.286.309-.016.218Correlation Matrix九月日照时数十月日照时数十一月日照时数十二月日照时数Correlation一月日照时数.487.551.781.558二月日照时数.505.569.827.445三月日照时数.579.498.656.365四月日照时数.508.397.515.139五月日照时数.666.574.645.286六月日照时数.777.640.452.309七月日照时数.248.386.190-.016八月日照时数.561.546.140.218九月日照时数1.000.798.553.445十月日照时数.7981.000.728.606十一月日照时数.553.7281.000.699十二月日照时数.445.606.6991.000表2.1 从表2.1可以看出,各个变量之间都具有一定的相关系数而且有的相关系数还比较大,接近于1,所以适合使用主成分分析。KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.798Bartletts Test of SphericityApprox. Chi-Square437.331df66Sig.000表2.2KMO检验是为了看数据是否适合进行因子分析,从表2.2可以看出KMO的值为0.798,表示可以进行因子分析。Bartlett检验是为了看数据是否来自于服从多元正态分布的总体,从表2.2可以看出,Sig.的值为0.000,说明数据来自正态分布总体,适合进一步分析。CommunalitiesInitialExtraction一月日照时数1.000.915二月日照时数1.000.918三月日照时数1.000.896四月日照时数1.000.933五月日照时数1.000.882六月日照时数1.000.778七月日照时数1.000.617八月日照时数1.000.874九月日照时数1.000.754十月日照时数1.000.863十一月日照时数1.000.847十二月日照时数1.000.854Extraction Method: Principal Component Analysis. 表2.3变量共同度表示的是各变量中所含原始信息能被提取的公因子所解释的程度。从表1.3可以看出,大多变量共同度在85%以上,只有三个在85%之下,所以提取的这几个公因子对变量的解释能力很强。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total16.84557.04157.0416.84521.96216.34773.3881.96231.32411.03484.4211.3244.7256.04590.4665.3943.28393.7496.2502.08595.8337.1711.42397.2568.104.87098.1269.080.67098.79610.065.53999.33511.047.39599.73112.032.269100.000Total Variance ExplainedComponentExtraction Sums of Squared LoadingsRotation Sums of Squared Loadings% of VarianceCumulative %Total% of VarianceCumulative %157.04157.0414.58138.17338.173216.34773.3882.88624.04762.220311.03484.4212.66422.20184.421456789101112表2.4 从表2.4可以看出,只有前三个的特征值大于1,所以只选择前三个主成分。第一个主成分的方差贡献率是57.041%,第二个主成分的方差贡献率是16.347%,第三个主成分的方差贡献率是11.034%,前三个主成分的方差所占所有成分的84.421%。由此可见,选择前三个主要成分已足够代替原来的变量。Extraction Method: Principal Component Analysis.表2.5Component MatrixaComponent123一月日照时数.852-.435-.015二月日照时数.854-.419-.115三月日照时数.869-.275-.257四月日照时数.805-.079-.528五月日照时数.888-.033-.303六月日照时数.764.439-.038七月日照时数.364.644-.265八月日照时数.465.809.066九月日照时数.794.295.192十月日照时数.800.251.400十一月日照时数.825-.275.300十二月日照时数.562-.164.715Extraction Method: Principal Component Analysis.a. 3 components extracted. 表2.6通过上面的矩阵就可以给出各变量的因子表达式,如下:Rotated Component MatrixaComponent123一月日照时数.837-.014.463二月日照时数.882.013.375三月日照时数.901.163.241四月日照时数.903.340-.049五月日照时数.834.392.179六月日照时数.405.730.285七月日照时数.128.763-.134八月日照时数-.031.917.178九月日照时数.376.588.516十月日照时数.297.528.704十一月日照时数.592.081.700十二月日照时数.140.018.913Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 4 iterations.表2.7从表中可以看出,第一主因子主要由前 5 个变量决定, 第二主因子主要由中间 4 个变量决定, 第三主因子主要由后3个变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 诺如病毒相关知识培训课件
- 2025年度(参考)房地产合作开发投资合同签订框架协议
- 语言文字规范化培训知识课件
- 红酒护肤知识培训班课程课件
- 2025某单位门卫聘用合同
- 语文教学知识培训心得课件
- 合同审批管理标准操作模板
- 技术文档撰写规范及提交模板
- 农产品跨境销售贸易合同条款
- 红楼梦第59回课件
- 第4章“免疫调节”单元教学设计 高二上学期生物人教版选择性必修1
- 动物疾病的实验室诊断-病毒病的实验室诊断基本技术(动物微生物与免疫)
- 中华人民共和国史第一章中华人民共和国的诞生和社会主义制度的确立课件
- 原发性肝癌的介入治疗
- 外国文学史第二版马工程课件 第三章 14-16世纪文学
- 《绿色建筑概论》整套教学课件
- 常用急救药品的剂量与用法课件
- 《高级计量经济学》-上课讲义课件
- 塔吊基础-专项施工方案
- 《工贸行业重大安全生产事故隐患判定标准》解读课件
- 《农产品质量安全》系列讲座(第一讲-农产品质量及安全)课件
评论
0/150
提交评论