版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
..电子科技大学政治与公共管理学院本科教学实验报告(实验)课程名称:数据分析技术系列实验.w..电子科技大学教务处制表.w..电子科技大学实验报告学生:晨飞学号:27指导教师:高天鹏一、实验室名称:电子政务可视化实验室二、实验项目名称:因子分析三、实验原理使用SPSS软件的因子分析对数据样本进行分析相关分析的原理:步骤一:将原始数据标准化。因子分析的第一步是主成分分析,将总量较多的因素通过线性组合的方式组合成几个因素,且这些因素之间相互独立。步骤二:建立变量的相关系数矩阵RAnalyse->DimentionRuduction->Fctor->Extraction->勾选Correlationmatrix可以输出相关系数矩阵,相关系数矩阵计算了变量之间两两的pearson相关系数。步骤三:适用性检验使用Bartlett球形检验或者KMO球形检验来检验样本是否适合进行因子分析。评价标准:KMO检验用于检验变量间的偏相关系数是否过小,一般情况下,当KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,则表示各个变量都是各自独立的。步骤四:根据因子贡献率选取因子,特征值和特征向量构建因子载荷矩阵A。处于简化和抽取核心的思想,一般会按照某种标准选取前几个对观测结果影响较大的因素构建因子载荷矩阵,一般的标准是选取特征根大于1的因子。并要求累积贡献率达到.w..90%以上。步骤五:对A进行因子旋转因子旋转的目的是使因子载荷矩阵的结构发生变化,使每个变量仅在一个因子上有较大载荷。是将因子矩阵在一个空间里投影,使单个向量的投影在仅在一个变量的方向有较大的值,这样做可以简化分析。步骤六:计算因子得分:计算因子得分是计算在不同样本水平下观测指标的水平的方式。计算因子得分需要用到因子得分计算函数,这个计算的结果是无量纲的,仅表示各因子在这个水平下观测指标的值,这也是因子分析的目标,将不可观测的目标观测量用一个函数与可以观测的变量联系起来。四、实验目的理解因子分析的含义,以及数学原理,掌握使用spss进行因子分析的方法,并能对spss因子分析产生的输出结果进行分析。五、实验容及步骤本次实验包含两个例子:实验步骤:(0)问题描述实验一题目要求:对我国主要城市的市政基础设施情进况行因子分析。实验二题目要求:主要城市日照数sav为例,其中的变量包括城市的名称“city”、各个月份的日照数(1)实验二步骤:执行analyze->dimentionreduction->factor->rotation如下勾选.w..(2)执行Analyse->DimentionRuduction,打开分析窗口打开参数设置窗口.w..加入变量(3)点击Descripitives,选择initialsolution(输出原始分析结果)、coefficients(输出相关系数矩阵)、勾选进行KMO和bartlett球形检验,完成之后点击continue回到参数设置窗口输出选项.w..(4)点击Extraction输出碎石图,完成之后点击continue回到参数设置窗口勾选输出碎石图(5)勾选输出因子得分,完成之后点击continue回到参数设置窗口输出因子得分.w..(6)选择缺失的值用均值代替,完成之后点击continue回到参数设置窗口均值代替缺失数据(7)点击OK,输出分析结果六、实验器材(设备、元器件):计算机、打印机、硒鼓、碳粉、纸七、实验数据及结果分析(1)实验一主要结果及分析:KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..856Bartlett'sTestofSphericityApprox.Chi-Square281.248df15Sig..000KMOandBartlett's球形检验的结果从表里的结果可以看出,KMO的检验值为0.856,一般KMO值大于0.9认为适合做因.w..子分析,这个值为0.856接近0.9,适合做因子分析。CorrelationMatrix城市污水日处理能力(万立方米)年末实有道年末实有道城市排水管道长度(公里)路长度(公路面积(万城市桥梁城市路灯(盏)里)平方米)(座)Correlati年末实有道路长度(公1.000.983.783.939.896.883on里)年末实有道路面积(万平方米).9831.000.738.940.853.867城市桥梁(座).783.939.738.9401.000.759.759.873.845.719.916城市排水管道长度(公里)1.000城市污水日处理能力(万立方米).896.883.853.873.719.845.9161.000.822.822城市路灯(盏).8671.000相关系数矩阵从这个表格中可以看出这六个变量之间有很高的相关度,需要标准化。CommunalitiesInitialExtraction年末实有道路长度(公里)年末实有道路面积(万平方米)城市桥梁(座)1.000.954.919.742.924.8821.0001.0001.0001.000城市排水管道长度(公里)城市污水日处理能力(万立方米)城市路灯(盏)1.000.859ExtractionMethod:PrincipalComponentAnalysis..w..变量共同度表这个表,表示提取公共因子之后各个变量的共同度,就是原始信息的保留度,例如第一个变量有95.4%的信息被保留下来了。TotalVarianceExplainedInitialEigenvalues%ofVarianceExtractionSumsofSquaredLoadingsComponentTotalCumulative%Total%ofVariance88.001Cumulative%125.28088.0016.50388.00194.5045.28088.001.390.162.104.051.01234562.7071.738.84997.21198.95099.799100.000.201ExtractionMethod:PrincipalComponentAnalysis.主成分表按照之前的设置,保留了一个特征值大于1的因子,这个因子的贡献率为88%.w..特征值和变量的散点图可以看出,除了第一个因子之外其他的因子特征值都很小。ComponentMatrixaComponent1年末实有道路长度(公里)年末实有道路面积(万平方米)城市桥梁(座).977.959.862.961.939城市排水管道长度(公里)城市污水日处理能力(万立方米)城市路灯(盏).927因子负荷矩阵.w..这个可以用来表示因子的线性组合。ComponentScoreCoefficientMatrixComponent1年末实有道路长度(公里)年末实有道路面积(万平方米)城市桥梁(座).185.182.163.182.178.176城市排水管道长度(公里)城市污水日处理能力(万立方米)城市路灯(盏)因子得分系数矩阵用主成分分析方法得出的因子得分系数矩阵,可以计算因子得分函数。ComponentScoreCovarianceMatrixComponent111.000因子之间关系的矩阵.这个只选择出一个因子,这个实际上没有意义(2)实验二结果及分析:CommunalitiesInitialExtraction一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数1.0001.0001.0001.0001.0001.000.915.918.896.933.882.778.w..七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数1.0001.0001.0001.0001.0001.000.617.874.754.863.847.854变量共同度表.TotalVarianceExplainedExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsInitialEigenvaluesComponent%ofCumulati%ofCumulati%ofCumulative%TotalVarianceve%TotalVarianceve%TotalVariance12346.8451.9621.324.72557.04116.34711.0346.04557.04173.38884.42190.4666.8451.9621.32457.04116.34711.03457.04173.38884.4214.5812.8862.66438.17324.04722.20138.17362.22084.4215.394.250.171.104.080.065.047.0323.2832.0851.423.87093.74995.83397.25698.12698.79699.33599.731100.0006789.670101112.539.395.269ExtractionMethod:PrincipalComponentAnalysis.主成分表.w..选取了前三个特征解大于1的值ComponentMatrixaComponent123一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数.852.854.869.805.888.764.364.465.794.800.825.562-.435-.419-.275-.079-.033.439-.015-.115-.257-.528-.303-.038-.265.066.644.809.295.192.251.400-.275-.164.300.715因子载荷矩阵显示提取出来的三个因子的线性组合RotatedComponentMatrixaComponent123一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数.837.882.901.903.834.405.128-.014.463.375.241-.049.179.285-.134.178.516.704.700.013.163.340.392.730.763.917.588.528.081-.031.376.297.592.w..十二月日照时数.140.018.913旋转之后的因子载荷矩阵使各因子的载荷不再集中,可以看出,第一个因子主要由前5个变量决定,中间的因子主要由中间三个因子决定,后面的一个因子主要由后四个因子决定ComponentTransformationMatrixComponent123123.754.437.892.491-.432-.495-.131.861-.113因子转换矩阵八、实验结论因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 厦门理工学院《细胞生物学》2025-2026学年期末试卷
- 漳州卫生职业学院《旅游学第四版》2025-2026学年期末试卷
- 南昌大学共青学院《中学生心理教育》2025-2026学年期末试卷
- 江西中医药大学《期货衍生品》2025-2026学年期末试卷
- 薄膜电阻器制造工常识模拟考核试卷含答案
- 投资与资产管理公司工作总结报告
- 生化检验员岗前操作管理考核试卷含答案
- 铸管备品工创新实践评优考核试卷含答案
- 炉外精炼工创新方法能力考核试卷含答案
- 新能源汽车维修工安全行为竞赛考核试卷含答案
- 《麻醉药品和精神药品管理条例》
- 2024年新人教版六年级数学下册《教材练习8练习八》教学课件
- 2024年煤炭采购居间合同范本
- 癌症患者生活质量量表EORTC-QLQ-C30
- QCT55-2023汽车座椅舒适性试验方法
- 玻璃纤维窗纱生产工艺流程
- 化妆品企业质量管理手册
- 少先队辅导员主题宣讲
- 劳动用工备案表
- 部编版五年级下册语文全册优质课件
- 国家级重点学科申报书
评论
0/150
提交评论