应用多元统计》综合性实验报告_第1页
应用多元统计》综合性实验报告_第2页
应用多元统计》综合性实验报告_第3页
应用多元统计》综合性实验报告_第4页
应用多元统计》综合性实验报告_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北科技学院基础部综合性实验华北科技学院基础部综合性实验 实实 验验 报报 告告 课程名称课程名称 应用多元统计应用多元统计 实验学期实验学期 20132013 至至 20142014 学年学年 第第 2 2 学期学期 学生所在系部学生所在系部 基础部基础部 年级年级 1212 专业班级专业班级 计算计算 B121B121 学生姓名学生姓名 郭春元郭春元 学号学号 201209014115201209014115 任课教师任课教师 李强丽李强丽 实验成绩实验成绩 华北科技学院综合性实验报告 第 1 页 应用多元统计应用多元统计 课程综合性实验报告课程综合性实验报告 开课实验室 开课实验室 数学应用实验室数学应用实验室 2014 年年 7 月月 2 日日 实验题目综合实训 一 实验目的一 实验目的 能够综合运用多元统计分析中统计方法 并利用 SPSS 软件实现 二 设备与环境二 设备与环境 SPSS 软件等 3 3 实验内容及要求实验内容及要求 针对全国重点水泥企业的一些经济指标 数据见 P137 进行下列求解与分析 厂家编号 固定资 产利润 率 资金利 税率 销售收 入利税 率 资金利 润率 固定资 产产值 率 流动资 金周转 天数 天 万元产 值能耗 吨 全员劳 动生产 率 万 元 人 年 1 琉璃 河 16 6826 7531 8418 4053 2555 0028 831 75 2 邯郸 19 7027 5632 9419 2059 8255 0032 922 87 3 大同 15 2023 4032 9816 2446 7865 0041 691 53 4 哈尔 滨 7 298 9721 304 7634 3962 0039 281 63 5 华新 29 4556 4940 7443 6875 3269 0026 682 14 6 湘乡 32 9342 7847 9833 8766 4650 0032 872 60 7 柳州 25 3937 8236 7627 5668 1863 0035 792 43 8 峨嵋 15 0519 4927 2114 216 1376 0035 761 75 9 耀县 19 8227 7833 4120 1759 2571 0039 131 83 10 永登 21 1335 2039 1626 5252 4762 0032 081 73 11 工源 16 7528 7229 6219 2355 7658 0030 081 52 12 抚顺 15 8328 0326 4017 4361 1961 0032 751 60 13 大连 16 5329 7332 4920 6350 4169 0037 571 31 华北科技学院综合性实验报告 第 2 页 14 江南 22 2454 5931 0537 0067 9563 0032 331 57 15 江油 12 9220 8225 1212 5451 0766 0039 181 83 1 计算相关系数矩阵 2 以 X3 为因变量 X1 X2 X4 X5 为自变量进行多元线性回归分析 并 进行线性回归关系的显著性检验 3 利用欧式距离定义样品间的距离 采用重心法进行聚类分析 将结果分为 三类 4 利用重心法得到的聚类分析的结果作为分组变量 将 15 号样品江油作为 待判别的样品 进行判别分析 并写出贝叶斯判别和费希尔判别函数 5 利用主成分分析法对这些地区进行综合评价和分类 6 检验数据是否适合做因子分析 若是适合 利用因子分析对这些企业进行 因子分析 7 只考虑 X1 X2 X3 这三个变量 应用对应分析 揭示各厂家与这三个 变量之间的关系 8 采用多维标度法对这厂家的经济情况进行分析 四 实验结果及分析四 实验结果及分析 1 计算相关系数矩阵 表表 1 Correlations 固定资产 利税率 资金利税 率 销售收入 利税率 资金利润 率 固定资产 产值率 流动资金 周转天数 万元产值 能耗 全员劳动 生产率 Pearson Correlation 1 848 923 902 651 265 511 598 Sig 2 tailed 000 000 000 009 340 051 018 固定资产 利税率 N1515151515151515 Pearson Correlation 848 1 689 988 720 110 609 265 Sig 2 tailed 000 005 000 002 697 016 340 资金利税 率 N1515151515151515 华北科技学院综合性实验报告 第 3 页 Pearson Correlation 923 689 1 774 544 317 389 531 Sig 2 tailed 000 005 001 036 250 152 042 销售收入 利税率 N1515151515151515 Pearson Correlation 902 988 774 1 688 106 607 329 Sig 2 tailed 000 000 001 005 708 016 230 资金利润 率 N1515151515151515 Pearson Correlation 651 720 544 688 1 444 424 359 Sig 2 tailed 009 002 036 005 098 115 189 固定资产 产值率 N1515151515151515 Pearson Correlation 265 110 317 106 4441 379 434 Sig 2 tailed 340 697 250 708 098 164 106 流动资金 周转天数 N1515151515151515 Pearson Correlation 511 609 389 607 424 3791 235 Sig 2 tailed 051 016 152 016 115 164 399 万元产值 能耗 N1515151515151515 Pearson Correlation 598 265 531 329 359 434 2351 Sig 2 tailed 018 340 042 230 189 106 399 全员劳动 生产率 N1515151515151515 Correlation is significant at the 0 01 level 2 tailed Correlation is significant at the 0 05 level 2 tailed 2 以 X3 为因变量 X1 X2 X4 X5 为自变量进行多元线性回归分析 并 进行线性回归关系的显著性检验 表表 2 华北科技学院综合性实验报告 第 4 页 Model Summary ModelRR Square Adjusted R Square Std Error of the Estimate 1 959a 919 8872 24837 a Predictors Constant 固定资产产值率 固定资产利税率 资金利 税率 资金利润率 由表2可知R2 0 919说明拟合度很好 表表 3 Coefficientsa Unstandardized Coefficients Standardized Coefficients ModelBStd ErrorBetatSig Constant 19 6843 3325 908 000 固定资产利税率 678 317 6582 136 058 资金利税率 1 187 486 2 244 2 442 035 资金利润率 1 522 7162 2922 126 059 1 固定资产产值率 062 060 1551 035 325 a Dependent Variable 销售收入利税率 表表 4 ANOVAb ModelSum of SquaresdfMean SquareFSig Regression576 5134144 12828 511 000a Residual50 552105 055 1 Total627 06414 a Predictors Constant 固定资产产值率 固定资产利税率 资金利税率 资金利润率 b Dependent Variable 销售收入利税率 由表 3 可知回归方程为 5 062 0 4522 1 2187 1 1678 0 684 193xxxxx 线性回归关系的显著性检验 原假设为 由表 4 可知 0 H0 521 0 05 则要拒绝原假设 说明回归模型是显著的 p 回归参数的统计推断 原假设为对立假设为为 由表 3 可知 0 H 0 k 1 H0 k 0 058 0 035 0 325 说明与之间有显著的线 1 p 2 p 3 p 4 p 3 x 2 x 性关系 与 之间没有显著的线性关系 1 x 4 x 5 x 华北科技学院综合性实验报告 第 5 页 3 利用欧式距离定义样品间的距离 采用重心法进行聚类分析 将结果分为 三类 Cluster Membership Case3 Clusters 1 1 琉璃河 1 2 2 邯郸 1 3 3 大同 1 4 4 哈尔滨 1 5 5 华新 2 6 6 湘乡 3 7 7 柳州 1 8 8 峨嵋 1 9 9 耀县 1 10 10 永登 1 11 11 工源 1 12 12 抚顺 1 13 13 大连 1 14 14 江南 1 15 15 江油 1 表表 5 由表 5 可知 第一类 琉璃河 邯郸 大同 湘乡 柳州 耀县 永登 工源 抚顺 大连 江南 江油 哈尔滨 第二类 华新 第三类 峨嵋 H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Centroid Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num 1 琉璃河 1 11 工源 11 12 抚顺 12 3 大同 3 13 大连 13 9 耀县 9 15 江油 15 10 永登 10 7 柳州 7 2 邯郸 2 华北科技学院综合性实验报告 第 6 页 14 江南 14 4 哈尔滨 4 8 峨嵋 8 5 华新 5 6 湘乡 6 图一 树状聚类图 由树状聚类图可知 若要将样本分为三类 就从距离大概为 15 的地方往下切 得到如下分类结 果 第一类 琉璃河 邯郸 大同哈尔滨 湘乡 柳州 耀县 永登 工源 抚顺 大连 江南 江油 第二类 华新 第三类 峨嵋 4 利用重心法得到的聚类分析的结果作为分组变量 将 15 号样品江油作为 待判别的样品 进行判别分析 并写出贝叶斯判别和费希尔判别函数 表 6 是对各组协方差矩阵是否相等的 Box M 检验 有表可知 各组协方差矩阵不全相等 分类 Classify 选项中的协方差矩阵选择可以考虑采用 Separate groups 进行判别分析 表表6 Box s Test of Equality of Covariance Matrices 表表 7 Casewise Statistics Highest GroupSecond Highest Group Discriminant Scores P D d G g Case Numbe r Actual Group Predicte d Groupp d f P G g D d Squared Mahalanobi s Distance to Centroid Grou p P G g D d Squared Mahalanobi s Distance to Centroid Functio n 1 Functio n 2 Origina l 1 11 947 2 1 000 1092 000120 751 043 773 Log Determinants 组别 RankLog Determinant 第一组 77 670 第二组 a b 第三组 a b Pooled within groups77 670 The ranks and natural logarithms of determinants printed are those of the group covariance matrices a Rank 1 b Too few cases to be non singular 华北科技学院综合性实验报告 第 7 页 211 595 2 1 0001 0372 000123 750 8171 785 311 071 2 1 0005 2803 000131 325 1 7022 180 411 805 2 1 000 4352 000105 155 772 561 5 22 1 00 0 2 1 000 0001 000118 9438 026 6 686 6 33 1 00 0 2 1 000 0001 000155 285 10 878 4 685 711 096 2 1 0004 6943 000108 512 1 308 571 811 942 2 1 000 1192 000126 230 0761 252 911 339 2 1 0002 1612 00090 8441 569 324 1011 315 2 1 0002 3102 00091 115 781 472 1111 688 2 1 000 7492 000124 758 512 515 1211 316 2 1 0002 3042 000143 539 2932 464 1311 309 2 1 0002 3502 000120 5401 3352 018 1411 798 2 1 000 4512 000104 858 772 541 15ungroupe d 1 017 2 1 0008 0942 000144 2191 5893 451 由表 7 可知 15 好待判样品应归为第一类 表表 8 表 9 Classification Function Coefficients 待判组 第一类第二类第三类 x1 43 962 53 034 26 350 x265 86847 89359 515 x338 15234 41531 384 x4 89 087 60 750 83 001 x52 5124 151 839 x622 12224 64814 964 x7 15 634 18 871 9 256 x8220 110242 282152 413 Constant 959 072 961 337 635 528 Fisher s linear discriminant functions Prior Probabilities for Groups Cases Used in Analysis 组别 PriorUnweightedWeighted 第一组 3331212 000 第二组 33311 000 第三组 33311 000 Total1 0001414 000 华北科技学院综合性实验报告 第 8 页 由上面的贝叶斯判别函数的系数表 表 8 和先验概率表 表 9 可以知道 1 距离判别的三个函数为 y1 959 072 43 962x1 65 868x2 38 868x3 89 087x42 512x522 122x6 15 634x7 220 110 x8 ln 1 3 ln 1 3 15 634x8 24 648x64 151x560 750 x4 34 415x3 47 893x2 53 034x1 961 337 y2 ln 1 3 152 413x8 14 964x60 839x583 001x4 31 384x3 59 515x2 26 034x1 635 528 y3 2 贝叶斯判别的三个函数为 220 110 x8 22 122x62 512x589 087x4 38 868x3 65 868x2 43 962x1 959 072 y1 15 634x8 24 648x64 151x560 750 x4 34 415x3 47 983x2 53 034x1 961 337 y2 152 413x8 14 964x60 839x583 001x4 31 384x3 59 515x2 26 034x1 635 528 y3 表表 10 Canonical Discriminant Function Coefficients Function 12 x1 1 441 282 x2 4101 937 x3 238 732 x4 879 2 815 x5 171 040 x6 535 215 x7 520 106 x84 9852 181 Constant 21 051 28 266 Unstandardized coefficients 有费歇判别函数的系数表 表 10 可以知道费歇的两个判别函数分别为 4 895x80535x6 0 171x50 579x40 238x30 410 x2 1 441x1 21 051 y1 2 181x8x6215 0 0 040 x5 2 815x4 0 732x31 937x20 282x1 28 266 y2 华北科技学院综合性实验报告 第 9 页 5 利用主成分分析法对这些地区进行综合评价和分类 表表 11 Total Variance Explained Initial EigenvaluesExtraction Sums of Squared Loadings ComponentTotal of VarianceCumulative Total of VarianceCumulative 14 86160 75860 7584 86160 75860 758 21 26915 86576 6231 26915 86576 623 3 83710 46387 085 83710 46387 085 4 5176 46493 549 5 3784 72798 276 6 1151 44399 719 7 021 26499 984 8 001 016100 000 Extraction Method Principal Component Analysis 由表 11 可以看出 前三个主成分解释了全部反差的 87 085 即包括原始数据的信息总 量达到了 87 085 这说明前三个主成分分别代表原来的 8 个指标评价企业的经济效益已经有 足够的把握 设这 3 个主成分分别用 y1 y2 y3 来表示 表表 1212 Component Matrixa Component 123 x1 957 019 239 x2 899 396 037 x3 862 081 338 x4 928 350 038 x5 787 000 182 x6 422 773 345 x7 640 078 642 x8 571 615 313 Extraction Method Principal Component Analysis a 3 components extracted 华北科技学院综合性实验报告 第 10 页 对表 12 输出的前三个特征向量的结果的第 i 列的每个元素分别除以第 i 个特征根的平方根 就得到了主成分分析的第 i 个主成分的系数 结果如下表 13 表 13 主成分 1主成分 2主成分 3 X1 0 434059 0 016866 0 261237 X2 0 407753 0 351532 0 040443 X3 0 390971 0 071904 0 369449 X4 0 420906 0 310697 0 041536 X5 0 356954 0 000000 0 198934 X6 0 191403 0 686197 0 377100 X7 0 290280 0 069241 0 701734 X8 0 258984 0 545939 0 342122 0 258984x8 0 290280 x7 x60 191403 0 356954x5 x40 420906 0 390971x3 x20 407753 x10 4340591 y x80 545939 0 069241 x60 686197 x4 0 310697 0 071904x3 x2 0 351532 x1 0 0168662 y x8 0 342122 0 701734x7 0 377100 x6 0 198934x5 x4 0 041536 x3 0 369449 x20 040443 x1 0 2612373 y 其中 x1 x2 x3 x4 x5 x6 x7 x8 表示对原始变量标准化后的变量 主成分的经济意义有各线性组合中权数较大的几个指标的综合意义来确定 综合因子 y1 中 x1 x2 x3 x4 的系数远大于其他变量的系数 所以 y1 主要是固定资产利税率 资金利 税率 销售收入利税率 资金利润率这 4 个指标的综合反映 它代表经济效益的盈利方面 刻 画了企业的盈利能力 因为由 y1 来评价企业的经济效益已有 60 76 的把握 所以这 4 项指标 是反映企业经济效益的主要指标 同时 从 y1 的线性组合中可以看到 前 4 个单项指标在综合 因子 y1 中所占的比重相当 说明这 4 项指标用于考核评价企业经济效益 每一项都是必不可少 的 y2 主要是流动资金周转天数和全员劳动生产率的综合反映 它标志着企业的资金和人力的 利用水平 以资金和个人的利用率作用于企业的经济效益 资金和人力利用得好 劳动生产率 就提高 资金周转就加快 从而提高企业经济效益 y3 主要反映万元产值能耗 从而改进生产 工艺 勤俭节约方面作用于企业经济效益 这 3 个综合因子从三个影响企业经济效益的主要方 面刻画企业经济效益 用它们考核企业经济 效益具有 87 085 的可靠性 根据第一主成分得分对各水泥企业经济效益做综合评价 将标准化后的原始数据代入第一 主成分的表达式中 计算出个样品的第一主成分得分排名 见下表 14 表 14 1 y 名次 华北科技学院综合性实验报告 第 11 页 琉璃河 0 048744 7 邯郸 0 840328 5 大同 1 569226 12 哈尔滨 3 739674 15 华新 3 957357 1 湘乡 3 889431 2 柳州 1 611477 4 峨嵋 2 804608 14 耀县 0 473758 9 永登 0 663220 6 工源 0 270064 8 抚顺 0 752365 10 大连 1 066333 11 江南 1 723578 3 江油 2 058108 13 在表 14 中经济效益得分中 有许多企业的得分是负数 但并不表明企业的经济效益就为负 这里的正负仅表示该企业与平均水平的位置关系 企业的经济效益的平均水平算作零 这是我 们在整个过程中将数据标准化的结果 由表 14 可以看到 华新水泥厂的综合经济效益做好 是第一名 湘乡水泥厂的综合经济效 益为第二名 哈尔滨水泥厂的综合经济效益最差 6 检验数据是否适合做因子分析 若是适合 利用因子分析对这些企业进行 因子分析 表表 15 Total Variance Explained Initial EigenvaluesExtraction Sums of Squared Loadings ComponentTotal of VarianceCumulative Total of VarianceCumulative 14 86760 84060 8404 86760 84060 840 21 24015 50076 3411 24015 50076 341 3 86010 74687 087 86010 74687 087 4 5516 89293 979 5 3504 37998 358 6 1091 35999 717 7 021 26499 981 8 001 019100 000 Extraction Method Principal Component Analysis 华北科技学院综合性实验报告 第 12 页 由表 15 可知 按照特征根大于 1 的原则 选入 2 个公共因子 其累计方差贡献率为 76 341 太小 不适合做因子分析 因此需选择 3 个公共因子 其累计方差贡献率达到 87 86 才适合做因子分析 表表 16 Component Matrixa Component 123 固定资产利税率 955 062 245 资金利税率 901 377 100 销售收入利税率 862 024 321 资金利润率 928 354 007 固定资产产值率 787 075 197 流动资金周转天数 405 802 337 万元产值能耗 661 005 573 全员劳动生产率 566 564 453 Extraction Method Principal Component Analysis a 3 components extracted 表 16 是因子载荷矩阵 此时得到的未旋转的公共因子的实际意义不好解释 因此 对公共 因子进行方差最大化正交旋转 在 Factor Analysis 对话框中 点击 Routation 按钮 进入 Routation 对话框 选中 Varimax 进行方差最大化正交旋转 并且使输出的载荷矩阵中各列按 照载荷系数大小排列 使在同一个公共因子上具有较高载荷的变量排在一起 结果如下表 17 华北科技学院综合性实验报告 第 13 页 表表 17 表表 18 由表 17 的输出结果可以知道 原变量 x1 可由各因子表示为 3077 02564 01807 0 1FFFx 原变量 x2 可由各因子表示为 3063 02123 0 1972 02FFFx 其他一样运算可知道 最后 计算因子得分 以表 18 中各因子的方差贡献率占三个因子总方差贡献率的比重作为 权重进行加权汇总 得出各城市的综合得分 F 和综合排名如表 19 即 087 87 3391 172318 211378 48 FFFF 表表 19 Rotated Component Matrixa Component 123 资金利税率 972 123 063 资金利润率 969 216 028 固定资产利税率 807 564 077 销售收入利税率 674 624 061 固定资产产值率 664 231 411 万元产值能耗 650 140 568 全员劳动生产率 131 868 269 流动资金周转天数 001 330 902 Extraction Method Principal Component Analysis Rotation Method Varimax with Kaiser Normalization a Rotation converged in 16 iterations 华北科技学院综合性实验报告 第 14 页 在表 19 中综合得分中 有许多企业的得分是负数 但并不表明企业的经济效益就为负 这 里的正负仅表示该企业与平均水平的位置关系 企业的经济效益的平均水平算作零 这是我们 在整个过程中将数据标准化的结果 由表 14 可以看到 华新水泥厂的综合经济效益做好 是第一名 湘乡水泥厂的综合经济效 益为第二名 哈尔滨水泥厂的综合经济效益最差 7 只考虑 X1 X2 X3 这三个变量 应用对应分析 揭示各厂家与这三个变 量之间的关系 表表 20 Summary Proportion of InertiaConfidence Singular Value Correlation DimensionSingular ValueInertiaAccounted forCumulative Standard Deviation2 1 300 090 905 905 010 260 厂家编号F1F2F3F排名 1 琉璃河 0 181435 0 730301 1 631112 0 605288 14 2 邯郸 0 732802 1 530455 1 188451 0 269772 10 3 大同 0 670744 0 212152 0 899500 0 141047 9 4 哈尔滨 1 835507 0 501664 0 275927 1 197553 15 5 华新 2 263260 0 124145 0 420066 1 310768 1 6 湘乡 0 642747 2 219989 0 788329 0 743058 2 7 柳州 0 323981 1 289980 0 310856 0 557827 3 8 峨嵋 0 756953 0 253060 1 802238 0 122543 8 9 耀县 0 065377 0 429141 1 289724 0 326285 5 10 永登 0 511981 0 080213 0 033446 0 258098 6 11 工源 0 020397 1 145371 1 231504 0 514972 13 12 抚顺 0 154428 1 001816 0 832366 0 497242 12 13 大连 0 105021 0 677404 0 957309 0 083690 7 14 江南 1 480582 1 088376 0 027321 0 550604 4 15 江油 0 950724 0 079368 0 328762 0 481915 11 华北科技学院综合性实验报告 第 15 页 2 097 009 0951 000 016 Total 0991 0001 000 表 20 给出了总惯量及每一维度 公共因子 所解释的总惯量的百分比的信息 可知总惯量 为 0 099 Singular Value 反映的是行与列各状态在二维图中分值的相关程度 实际上是对行 与列进行因子分析产生的新的综合变量的典型相关系数 其取值上等于特征根的平方根 Sig 值很小说明列联表的行与列之间有较强的相关性 Proportion of Inertia 部分是各维度 公 共因子 分别解释总惯量的比例及累计百分比 类似于公共因子分析中公共因子解释能力的说 明 表表 21 Overview Row Pointsa Score in DimensionContribution Of Point to Inertia of Dimension Of Dimension to Inertia of Point 厂家编号 Mass12Inertia1212Total 琉璃河 067 199 036 001 009 001 955 010 965 邯郸 067 066 183 000 001 023 270 661 931 大同 067 319 134 002 023 012 870 050 920 哈尔滨 067 1 060 043 022 250 001 999 0011 000 华新 0671 050 250 022 245 043 982 0181 000 湘乡 067 908 689 020 184 326 842 157 999 柳州 067 416 169 004 038 020 923 049 972 峨嵋 067 480 098 005 051 007 970 013 983 耀县 067 052 194 000 001 026 174 787 961 永登 067 234 146 002 012 015 727 092 819 工源 067 172 110 001 007 008 883 116 999 抚顺 067 254 229 002 014 036 760 200 959 大连 067 124 069 000 003 003 673 066 739 江南 067 659 827 013 097 469 663 3371 000 华北科技学院综合性实验报告 第 16 页 江油 067 541 122 006 065 010 980 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论