应用多元统计》综合性实验报告.doc_第1页
应用多元统计》综合性实验报告.doc_第2页
应用多元统计》综合性实验报告.doc_第3页
应用多元统计》综合性实验报告.doc_第4页
应用多元统计》综合性实验报告.doc_第5页
免费预览已结束,剩余16页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北科技学院综合性实验报告华北科技学院基础部综合性实验实 验 报 告 课程名称 应用多元统计 实验学期 2013 至 2014 学年 第 2 学期学生所在系部 基础部 年级 12 专业班级 计算B121 学生姓名 郭春元 学号 201209014115 任课教师 李强丽 实验成绩 应用多元统计课程综合性实验报告开课实验室: 数学应用实验室 2014 年 7月 2 日实验题目综合实训一、实验目的能够综合运用多元统计分析中统计方法,并利用SPSS软件实现。二、设备与环境SPSS软件等。3、 实验内容及要求针对全国重点水泥企业的一些经济指标,数据见P137,进行下列求解与分析:厂家编号固定资产利润率(%)资金利税率(%)销售收入利税率(%)资金利润率(%)固定资产产值率(%)流动资金周转天数(天)万元产值能耗(吨)全员劳动生产率(万元/人*年)1、琉璃河16.6826.7531.8418.4053.2555.0028.831.752、邯郸19.7027.5632.9419.2059.8255.0032.922.873、大同15.2023.4032.9816.2446.7865.0041.691.534、哈尔滨7.298.9721.304.7634.3962.0039.281.635、华新29.4556.4940.7443.6875.3269.0026.682.146、湘乡32.9342.7847.9833.8766.4650.0032.872.607、柳州25.3937.8236.7627.5668.1863.0035.792.438、峨嵋15.0519.4927.2114.216.1376.0035.761.759、耀县19.8227.7833.4120.1759.2571.0039.131.8310、永登21.1335.2039.1626.5252.4762.0032.081.7311、工源16.7528.7229.6219.2355.7658.0030.081.5212、抚顺15.8328.0326.4017.4361.1961.0032.751.6013、大连16.5329.7332.4920.6350.4169.0037.571.3114、江南22.2454.5931.0537.0067.9563.0032.331.5715、江油12.9220.8225.1212.5451.0766.0039.181.83 1、计算相关系数矩阵; 2、以X3为因变量,X1、X2、X4、X5为自变量进行多元线性回归分析,并进行线性回归关系的显著性检验; 3、利用欧式距离定义样品间的距离,采用重心法进行聚类分析,将结果分为三类; 4、利用重心法得到的聚类分析的结果作为分组变量,将15号样品江油作为待判别的样品,进行判别分析,并写出贝叶斯判别和费希尔判别函数; 5、利用主成分分析法对这些地区进行综合评价和分类; 6、检验数据是否适合做因子分析,若是适合,利用因子分析对这些企业进行因子分析; 7、只考虑X1 、X2、X3这三个变量,应用对应分析,揭示各厂家与这三个变量之间的关系;8、采用多维标度法对这厂家的经济情况进行分析。四、实验结果及分析1、计算相关系数矩阵; 表1Correlations固定资产利税率资金利税率销售收入利税率资金利润率固定资产产值率流动资金周转天数万元产值能耗全员劳动生产率固定资产利税率Pearson Correlation1.848*.923*.902*.651*-.265-.511.598*Sig. (2-tailed).000.000.000.009.340.051.018N1515151515151515资金利税率Pearson Correlation.848*1.689*.988*.720*-.110-.609*.265Sig. (2-tailed).000.005.000.002.697.016.340N1515151515151515销售收入利税率Pearson Correlation.923*.689*1.774*.544*-.317-.389.531*Sig. (2-tailed).000.005.001.036.250.152.042N1515151515151515资金利润率Pearson Correlation.902*.988*.774*1.688*-.106-.607*.329Sig. (2-tailed).000.000.001.005.708.016.230N1515151515151515固定资产产值率Pearson Correlation.651*.720*.544*.688*1-.444-.424.359Sig. (2-tailed).009.002.036.005.098.115.189N1515151515151515流动资金周转天数Pearson Correlation-.265-.110-.317-.106-.4441.379-.434Sig. (2-tailed).340.697.250.708.098.164.106N1515151515151515万元产值能耗Pearson Correlation-.511-.609*-.389-.607*-.424.3791-.235Sig. (2-tailed).051.016.152.016.115.164.399N1515151515151515全员劳动生产率Pearson Correlation.598*.265.531*.329.359-.434-.2351Sig. (2-tailed).018.340.042.230.189.106.399N1515151515151515*. Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed). 2、以X3为因变量,X1、X2、X4、X5为自变量进行多元线性回归分析,并进行线性回归关系的显著性检验; 表2Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.959a.919.8872.24837a. Predictors: (Constant), 固定资产产值率, 固定资产利税率, 资金利税率, 资金利润率 由表2可知R2=0.919说明拟合度很好。 表3CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)19.6843.3325.908.000固定资产利税率.678.317.6582.136.058资金利税率-1.187.486-2.244-2.442.035资金利润率1.522.7162.2922.126.059固定资产产值率.062.060.1551.035.325a. Dependent Variable: 销售收入利税率 表4ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression576.5134144.12828.511.000aResidual50.552105.055Total627.06414a. Predictors: (Constant), 固定资产产值率, 固定资产利税率, 资金利税率, 资金利润率b. Dependent Variable: 销售收入利税率 由表3可知回归方程为 线性回归关系的显著性检验:原假设为,由表4可知=0.05),则要拒绝原假设,说明回归模型是显著的; 回归参数的统计推断:原假设为对立假设为为,由表3可知=0.058,=0.035,=0,325,说明与之间有显著的线性关系,与、之间没有显著的线性关系。 3、利用欧式距离定义样品间的距离,采用重心法进行聚类分析,将结果分为三类; Cluster MembershipCase3 Clusters1:1、琉璃河 12:2、邯郸 13:3、大同 14:4、哈尔滨 15:5、华新 26:6、湘乡 37:7、柳州 18:8、峨嵋 19:9、耀县 110:10、永登 111:11、工源 112:12、抚顺 113:13、大连 114:14、江南 115:15、江油 1 表5由表5可知,第一类琉璃河、邯郸、大同、湘乡、柳州、耀县、永登、工源、抚顺、大连、江南、江油、哈尔滨; 第二类华新; 第三类峨嵋。*HIERARCHICALCLUSTERANALYSIS*DendrogramusingCentroidMethodRescaledDistanceClusterCombineCASE0510152025LabelNum+-+-+-+-+-+1、琉璃河111、工源1112、抚顺123、大同313、大连139、耀县915、江油1510、永登107、柳州72、邯郸214、江南144、哈尔滨48、峨嵋85、华新56、湘乡6 图一 树状聚类图由树状聚类图可知,若要将样本分为三类,就从距离大概为15的地方往下切,得到如下分类结果:第一类琉璃河、邯郸、大同哈尔滨、湘乡、柳州、耀县、永登、工源、抚顺、大连、江南、江油; 第二类华新; 第三类峨嵋。 4、利用重心法得到的聚类分析的结果作为分组变量,将15号样品江油作为待判别的样品,进行判别分析,并写出贝叶斯判别和费希尔判别函数; 表6是对各组协方差矩阵是否相等的BoxM检验,有表可知,各组协方差矩阵不全相等,分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups进行判别分析。 表6BoxsTestofEqualityofCovarianceMatricesLog Determinants组别RankLog Determinant第一组77.670第二组.a.b第三组.a.bPooled within-groups77.670The ranks and natural logarithms of determinants printed are those of the group covariance matrices.a. Rank d | G=g)P(G=g | D=d)Squared Mahalanobis Distance to CentroidGroupP(G=g | D=d)Squared Mahalanobis Distance to CentroidFunction 1Function 2pdfOriginal111.94721.000.1092.000120.751-.043.773211.59521.0001.0372.000123.750.8171.785311.07121.0005.2803.000131.325-1.7022.180411.80521.000.4352.000105.155.772.5615221.00021.000.0001.000118.9438.026-6.6866331.00021.000.0001.000155.285-10.878-4.685711.09621.0004.6943.000108.512-1.308-.571811.94221.000.1192.000126.230.0761.252911.33921.0002.1612.00090.8441.569.3241011.31521.0002.3102.00091.115.781-.4721111.68821.000.7492.000124.758-.512.5151211.31621.0002.3042.000143.539.2932.4641311.30921.0002.3502.000120.5401.3352.0181411.79821.000.4512.000104.858.772.54115ungrouped1.01721.0008.0942.000144.2191.5893.451 由表7可知,15好待判样品应归为第一类。 表8 表9Classification Function Coefficients待判组 第一类第二类第三类x1-43.962-53.034-26.350x265.86847.89359.515x338.15234.41531.384x4-89.087-60.750-83.001x52.5124.151.839x622.12224.64814.964x7-15.634-18.871-9.256x8220.110242.282152.413 (Constant)-959.072-961.337-635.528Fishers linear discriminant functionsPrior Probabilities for Groups组别PriorCases Used in AnalysisUnweightedWeighted第一组.3331212.000第二组.33311.000第三组.33311.000Total1.0001414.000 由上面的贝叶斯判别函数的系数表(表8)和先验概率表(表9)可以知道(1)距离判别的三个函数为:(2)贝叶斯判别的三个函数为: 表10Canonical Discriminant Function CoefficientsFunction12x1-1.441-.282x2-.4101.937x3.238.732x4.879-2.815x5.171-.040x6.535.215x7-.520-.106x84.9852.181(Constant)-21.051-28.266Unstandardized coefficients 有费歇判别函数的系数表(表10)可以知道费歇的两个判别函数分别为: 5、利用主成分分析法对这些地区进行综合评价和分类; 表11Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %14.86160.75860.7584.86160.75860.75821.26915.86576.6231.26915.86576.6233.83710.46387.085.83710.46387.0854.5176.46493.5495.3784.72798.2766.1151.44399.7197.021.26499.9848.001.016100.000Extraction Method: Principal Component Analysis. 由表11可以看出,前三个主成分解释了全部反差的87.085%,即包括原始数据的信息总量达到了87.085%,这说明前三个主成分分别代表原来的8个指标评价企业的经济效益已经有足够的把握。设这3个主成分分别用y1,y2,y3来表示。 表12Component MatrixaComponent123x1.957-.019-.239x2.899-.396.037x3.862.081-.338x4.928-.350-.038x5.787.000.182x6.422.773.345x7.640-.078.642x8.571.615-.313Extraction Method: Principal Component Analysis.a. 3 components extracted. 对表12输出的前三个特征向量的结果的第i列的每个元素分别除以第i个特征根的平方根,就得到了主成分分析的第i个主成分的系数,结果如下表13: 表13主成分1主成分2主成分3X10.434059 -0.016866 -0.261237 X20.407753 -0.351532 0.040443 X30.390971 0.071904 -0.369449 X40.420906 -0.310697 -0.041536 X50.356954 0.000000 0.198934 X60.191403 0.686197 0.377100 X70.290280 -0.069241 0.701734 X80.258984 0.545939 -0.342122 其中x1*,x2*,x3*,x4*,x5*,x6*,x7*,x8*表示对原始变量标准化后的变量。 主成分的经济意义有各线性组合中权数较大的几个指标的综合意义来确定,综合因子y1中,x1*,x2*,x3*,x4*的系数远大于其他变量的系数,所以,y1主要是固定资产利税率、资金利税率、销售收入利税率、资金利润率这4个指标的综合反映,它代表经济效益的盈利方面,刻画了企业的盈利能力。因为由y1来评价企业的经济效益已有60.76%的把握,所以这4项指标是反映企业经济效益的主要指标。同时,从y1的线性组合中可以看到,前4个单项指标在综合因子y1中所占的比重相当,说明这4项指标用于考核评价企业经济效益,每一项都是必不可少的。y2主要是流动资金周转天数和全员劳动生产率的综合反映,它标志着企业的资金和人力的利用水平,以资金和个人的利用率作用于企业的经济效益。资金和人力利用得好,劳动生产率就提高,资金周转就加快,从而提高企业经济效益。y3主要反映万元产值能耗,从而改进生产工艺、勤俭节约方面作用于企业经济效益。这3个综合因子从三个影响企业经济效益的主要方面刻画企业经济效益,用它们考核企业经济 效益具有87.085%的可靠性。 根据第一主成分得分对各水泥企业经济效益做综合评价,将标准化后的原始数据代入第一主成分的表达式中,计算出个样品的第一主成分得分排名,见下表14: 表14名次琉璃河0.048744 7邯郸0.840328 5大同-1.569226 12哈尔滨-3.739674 15华新3.957357 1湘乡3.889431 2柳州1.611477 4峨嵋-2.804608 14耀县-0.473758 9永登0.663220 6工源-0.270064 8抚顺-0.752365 10大连-1.066333 11江南1.723578 3江油-2.058108 13 在表14中经济效益得分中,有许多企业的得分是负数,但并不表明企业的经济效益就为负,这里的正负仅表示该企业与平均水平的位置关系,企业的经济效益的平均水平算作零,这是我们在整个过程中将数据标准化的结果, 由表14可以看到,华新水泥厂的综合经济效益做好,是第一名;湘乡水泥厂的综合经济效益为第二名;哈尔滨水泥厂的综合经济效益最差。 6、检验数据是否适合做因子分析,若是适合,利用因子分析对这些企业进行因子分析; 表15 Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %14.86760.84060.8404.86760.84060.84021.24015.50076.3411.24015.50076.3413.86010.74687.087.86010.74687.0874.5516.89293.9795.3504.37998.3586.1091.35999.7177.021.26499.9818.001.019100.000Extraction Method: Principal Component Analysis. 由表15可知,按照特征根大于1的原则,选入2个公共因子,其累计方差贡献率为76.341%太小,不适合做因子分析,因此需选择3个公共因子,其累计方差贡献率达到87.86%才适合做因子分析。 表16 Component MatrixaComponent123固定资产利税率.955.062.245资金利税率.901.377-.100销售收入利税率.862-.024.321资金利润率.928.354-.007固定资产产值率.787-.075-.197流动资金周转天数-.405.802.337万元产值能耗-.661.005.573全员劳动生产率.566-.564.453Extraction Method: Principal Component Analysis.a. 3 components extracted. 表16是因子载荷矩阵,此时得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转,在Factor Analysis对话框中,点击Routation按钮,进入Routation对话框,选中Varimax进行方差最大化正交旋转,并且使输出的载荷矩阵中各列按照载荷系数大小排列,使在同一个公共因子上具有较高载荷的变量排在一起,结果如下表17: Rotated Component MatrixaComponent123资金利税率.972.123-.063资金利润率.969.216-.028固定资产利税率.807.564-.077销售收入利税率.674.624-.061固定资产产值率.664.231-.411万元产值能耗-.650.140.568全员劳动生产率.131.868-.269流动资金周转天数.001-.330.902Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 16 iterations. 表17 表18 由表17的输出结果可以知道,原变量x1可由各因子表示为: 原变量x2可由各因子表示为: 其他一样运算可知道: 最后,计算因子得分,以表18中各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分F和综合排名如表19即: 表19厂家编号F1F2F3F排名1、琉璃河-0.181435 -0.730301 -1.631112 -0.605288 142、邯郸-0.732802 1.530455 -1.188451 -0.269772 103、大同-0.670744 0.212152 0.899500 -0.141047 94、哈尔滨-1.835507 -0.501664 -0.275927 -1.197553 155、华新2.263260 -0.124145 0.420066 1.310768 16、湘乡0.642747 2.219989 -0.788329 0.743058 27、柳州0.323981 1.289980 0.310856 0.557827 38、峨嵋-0.756953 -0.253060 1.802238 -0.122543 89、耀县-0.065377 0.429141 1.289724 0.326285 510、永登0.511981 -0.080213 -0.033446 0.258098 611、工源0.020397 -1.145371 -1.231504 -0.514972 1312、抚顺-0.154428 -1.001816 -0.832366 -0.497242 1213、大连0.105021 -0.677404 0.957309 0.083690 714、江南1.480582 -1.088376 -0.027321 0.550604 415、江油-0.950724 -0.079368 0.328762 -0.481915 11 在表19中综合得分中,有许多企业的得分是负数,但并不表明企业的经济效益就为负,这里的正负仅表示该企业与平均水平的位置关系,企业的经济效益的平均水平算作零,这是我们在整个过程中将数据标准化的结果, 由表14可以看到,华新水泥厂的综合经济效益做好,是第一名;湘乡水泥厂的综合经济效益为第二名;哈尔滨水泥厂的综合经济效益最差。7、只考虑X1 、X2、X3这三个变量,应用对应分析,揭示各厂家与这三个变量之间的关系; 表20SummaryDimensionSingular ValueInertiaProportion of InertiaConfidence Singular ValueAccounted forCumulativeStandard DeviationCorrelation21.300.090.905.905.010.2602.097.009.0951.000.016Total.0991.0001.000表20给出了总惯量及每一维度(公共因子)所解释的总惯量的百分比的信息。可知总惯量为0.099,Singular Value反映的是行与列各状态在二维图中分值的相关程度,实际上是对行与列进行因子分析产生的新的综合变量的典型相关系数,其取值上等于特征根的平方根,Sig.值很小说明列联表的行与列之间有较强的相关性,Proportion of Inertia部分是各维度(公共因子)分别解释总惯量的比例及累计百分比,类似于公共因子分析中公共因子解释能力的说明。 表21Overview Row Pointsa厂家编号MassScore in DimensionInertiaContribution12Of Point to Inertia of DimensionOf Dimension to Inertia of Point1212Total琉璃河 .067-.199-.036.001.009.001.955.010.965邯郸 .067-.066-.183.000.001.023.270.661.931大同 .067-.319-.134.002.023.012.870.050.920哈尔滨 .067-1.060.043.022.250.001.999.0011.000华新 .0671.050.250.022.245.043.982.0181.000湘乡 .067.908-.689.020.184.326.842.157.999柳州 .067.416-.169.004.038.020.923.049.972峨嵋 .067-.480-.098.005.051.007.970.013.983耀县 .067-.052-.194.000.001.026.174.787.961永登 .067.234-.146.002.012.015.727.092.819工源 .067-.172.110.001.007.008.883.116.999抚顺 .067-.254.229.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论