应用统计学课程设计报告书.doc_第1页
应用统计学课程设计报告书.doc_第2页
应用统计学课程设计报告书.doc_第3页
应用统计学课程设计报告书.doc_第4页
应用统计学课程设计报告书.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录12.2描述性分析112.2.1频数分析112.2.2描述性分析212.3 均值比较和t检验312.3.1 Means(均值)过程312.3.2 单一样本t检验412.3.3 双样本t检验512.4 方差分析712.5 相关分析812.5.1 相关分析的原理及应用812.5.2 偏相关分析912.6 回归分析1012.6.1 一元线性回归分析1012.6.2 多元线性回归分析1212.7 时间序列的曲估计12 .12.8 统计图的绘制1612.8.1 条形图1612.8.2 线图1712.8.3 散点图1812.2描述性分析12.2.1频数分析从结果中可以看出,第一产业消费均值为63.4989元、平均标准误差为2.40439、中位数为64.6800元、众数为44.00元、标准差为10.20097元、方差为104.060元、偏度为-0.403元、片度标准误差为-0.536元、峰度为-0.462元、峰度标准误差为1.038元、全距为34.55元、最小值为44.00.Statistics第一产业 NValid18Missing0Mean63.4989Std. Error of Mean2.40439Median64.6800Mode44.00(a)Std. Deviation10.20097Variance104.060Skewness-.403Std. Error of Skewness.536Kurtosis-.462Std. Error of Kurtosis1.038Range34.55Minimum44.00Maximum78.55Sum1142.98a Multiple modes exist. The smallest value is shown第一产业 FrequencyPercentValid PercentCumulative PercentValid44.0015.65.65.644.7615.65.611.153.6115.65.616.755.7015.65.622.256.9915.65.627.858.1715.65.633.358.8615.65.638.962.0015.65.644.464.1215.65.650.065.2415.65.655.665.8015.65.661.168.8315.65.666.769.3015.65.672.270.7215.65.677.873.2815.65.683.376.4115.65.688.976.6415.65.694.478.5515.65.6100.0Total18100.0100.0 12.2.2描述性分析利用SPSS求第一产业的Z分数,在数据窗口中,新变量“Z第一产业”表示“第一产业”Z分数。如图所示Descriptive Statistics NMeanStd. DeviationVariance第一产业1863.498910.20097104.060Valid N (listwise)18 12.3 均值比较和t检验12.3.1 Means(均值)过程Means过程的结果输出较简单,在结果输出窗口中包含以下输出表。CasesIncludedExcludedTotalNPercentNPercentNPercent18100.0%0.0%18100.0%Report生活消费 世纪MeanNStd. DeviationVariance20238.33001041.421021715.70121418.5950880.128796420.624Total318.447818109.7617712047.646ANOVA Table Sum of SquaresdfMean SquareFSig.生活消费 * 世纪Between Groups(Combined)144424.3121144424.31238.267.000Within Groups60385.676163774.105 Total204809.98817 Measures of Association EtaEta Squared生活消费 * 世纪.840.705(1) 处理样本数统计,如图所示。其中Ilude栏表示参加分析计算的样本数,从表中可知全部样本共有18个参考分析,占到全部样本的100%,即分析计算中没有因数据缺测或其他原因等导致的exclued。(2)变量分组统计结果,如图所示,可以看出生活消费20世纪的平均值为238.3300,标准差41.42102,21世准差纪平均值为418.5950,标准差为80.12879 。结果表明生活消费两个世纪里有很大差异,21世纪比20世纪的生活消费明显高12.3.2 单一样本t检验One-sample T Test 过程的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表。(1) 输出结果第一个表,基本描述性统计量表,从表中可知,参与分析的样品为18,平均消费量为2784.616。标准差为816.63712,均值误差为192.48321。(2) 输出结果第二个表,单一样本t检验表,从表中可知,自由度df=17,根据公式计算的t值等于4.076。对应的临界置信水平为0.001。95%的置信区间为(378.5120,1190.7202)。计算的t值对应的临界置信水平远远小于的设置的0.05,因此拒绝原假设Ho,表明生活消费与原设想水平存在明显差异。如图One-Sample Statistics NMeanStd. DeviationStd. Error Mean能源终端消费182784.6161816.63712192.48321One-Sample TestTest Value = 2000tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpperLowerUpperLowerUpper能源终端消费4.07617.001784.61611378.51201190.720212.3.3 双样本t检验Independent-Samples T Test的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表两个输出结果如图所示,(1) 描述性统计表。给出了一些基本描述性统计量。由输出结果可以看出,连个世纪生活消费的平均值分别为238.33,418.5950,标准差分别为41.42102,80.12879,均值误差分别为13.09848,28.32981。(2) T检验表,表示双样本T检验结果,F的相伴概率为3.986,大于显著性水平0.05.,接受方差相等的零假设,可疑认为两个世纪里的生活消费方差无显著性差异,然后看方差相等时的t检验结果。也就是第一行方差相等的t检验结果,t统计量的相伴概率为0.000小于0.05,不接受t检验的零假设,也就是说领个世纪的生活消费平均值存在差异。Descriptives能源终端消费量 NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximumLower BoundUpper BoundLower BoundUpper BoundLower BoundUpper BoundLower BoundUpper Bound186.8312250.8500.2250.852250.85212.3311961.5800.1961.581961.58214.5512233.0600.2233.062233.06218.7312539.4600.2539.462539.46219.0912062.3500.2062.352062.35221.6111920.6100.1920.611920.61241.4712312.7900.2312.792312.79256.5212374.0700.2374.072374.07283.8212353.7100.2353.712353.71290.1212553.6000.2553.602553.60328.3512352.2100.2352.212352.21352.6612724.3200.2724.322724.32378.0412966.5600.2966.562966.56399.8013084.4900.3084.493084.49426.4113522.1500.3522.153522.15473.9913901.2800.3901.283901.28493.7614294.9300.4294.934294.93533.9814715.0700.4715.074715.07Total182784.6161816.63712192.483212378.51203190.72021920.614715.07 DataSet1 ANOVA能源终端消费量 Sum of SquaresdfMean SquareFSig.Between Groups(Combined)11337235.10017666896.182.Linear TermContrast10139187.127110139187.127. Deviation1198047.9731674877.998. Within Groups.0000. Total11337235.10017 Correlations12.4 方差分析 结果解读:我重点解读描述性统计表.方差分析表.各族均值折线图(1) 输出结果文件中的第一个表格为描述性统计量表。从表中可知,输出的统计量表包括各组样本均值,标准差,标准误差,均值95%置信度区间,最小值和最大值,如各组参与分析的样本数都为1,总样本数为18。(2) 输出结果文件中的第二个表格方差分析表。总离差平方和为11337235.100,组间离差平方和为11337235.100,组内离差平方和为0,组间离差平方和中能被线性解释的部分为10139187.127,方差检验0,对应的相伴概率为0,小于显著性水平0.05,以此认为18组中至少有一组能与另外一组差异显著。(3) 输出结果图,各组均值折线图,可以看出91和95年的均值相对较少。Correlations 能源终端消费量第三产业能源终端消费量Pearson Correlation1.934(*)Sig. (2-tailed) .000Sum of Squares and Cross-products11337235.1002239987.573Covariance666896.182131763.975N1818第三产业Pearson Correlation.934(*)1Sig. (2-tailed).000 Sum of Squares and Cross-products2239987.573506884.345Covariance131763.97529816.726N1818* Correlation is significant at the 0.01 level (2-tailed).Descriptive Statistics MeanStd. DeviationN能源终端消费量2784.6161816.6371218第三产业547.6189172.675201812.5 相关分析12.5.1 相关分析的原理及应用 结果解读:(1) 描述性统计表。从表中看出,两个变量的样本数都为18,能源终端消费量的均值为2784.6161,标准差为816.63712,;第三产业的均值为547.6189,标准差为172.6752。相关系数极显著性统计表。能源终端消费量和第三产业的相关系数r=0.934显著性水平为0.000,因此可见能源终端消费量和第三(2) 产业的相关性十分显著。Descriptive Statistics MeanStd. DeviationN能源终端消费量2784.6161816.6371218第二产业1855.0511551.6318318第三产业547.6189172.6752018CorrelationsControl Variables 能源终端消费量第二产业第三产业-none-(a)能源终端消费量Correlation1.000.989.934Significance (2-tailed).000.000df01616第二产业Correlation.9891.000.875Significance (2-tailed).000.000df16016第三产业Correlation.934.8751.000Significance (2-tailed).000.000.df16160第三产业能源终端消费量Correlation1.000.993 Significance (2-tailed).000 df015 第二产业Correlation.9931.000 Significance (2-tailed).000. df150 (3) a Cells contain zero-order (Pearson) correlati ons 12.5.2 偏相关分析 结果解读:(1) 描述性统计表。从表中可知,参与分析的能源终端消费量和第三产业,第二产业3个变量的样本数都为18,其中能源终端消费量的均值为2784.6161,标准差为816.63712,。第三产业的均值为1855.0511,标准差为551.63283,。第二产业的均值为547.6189,标准差为172.67520。变量间的相关系数,偏相关系数和显著性检验结果。能源终端消费量和第二产业的相关系数为0.989,显著性水平为0.000,即能源终端消费量和第二产业是相关的;以第三产业为控制变量,能源终端消费量和第二产业的相关系数为0.993,显著性水平为0.000,可知在扣除第三产业的基础上能源终端消费量和第二产业仍然相关性显著。Model Summary(b)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.934(a).873.865299.83744a Predictors: (Constant), 第三产业b Dependent Variable: 能源终端消费量ANOVA(b)Model Sum of SquaresdfMean SquareFSig.1Regression9898795.21219898795.212110.106.000(a)Residual1438439.8881689902.493 Total11337235.10017 a Predictors: (Constant), 第三产业b Dependent Variable: 能源终端消费量Coefficients(a)Model Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBetaBStd. Error1(Constant)364.617241.212 1.512.150第三产业4.419.421.93410.493.000a Dependent Variable: 能源终端消费量12 12.6 回归分析12.6.1 一元线性回归分析 结果解读:(1) 常用统计量。相关系数R=0.934,决定系数R2=0.873,而调整绝对系数R2=0.865,回归估计的标准差S=299.83744,模型拟合效果很理想。(2) 方差分析表。从表中知离差平方和=11337235.100,残差平方和=1438439.888,回归平方和=9898795.212。回归的显著性检验中,统计量为F=110.106,对应的置信水平为0.000,小于0.05,因此可认为方程是极显著的。(3) 回归系数分析表。从表中可以看出,常数项为364.617,回归系数=4.419,回归系数检验统计量t=10.493,相伴概率值为0.000小于0.001。由此可知回归方程为y=364.617+4.419xDescriptive Statistics MeanStd. DeviationN能源终端消费量2784.6161816.6371218第二产业1855.0511551.6318318第三产业547.6189172.6752018Correlations 能源终端消费量第二产业第三产业Pearson Correlation能源终端消费量1.000.989.934第二产业.9891.000.875第三产业.934.8751.000Sig. (1-tailed)能源终端消费量.000.000第二产业.000.000第三产业.000.000.N能源终端消费量181818第二产业181818第三产业181818Variables Entered/Removed(b)ModelVariables EnteredVariables RemovedMethod1第三产业, 第二产业(a).Entera All requested variables entered.b Dependent Variable: 能源终端消费量Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.999(a).998.99837.00117a Predictors: (Constant), 第三产业, 第二产业ANOVA(b)Model Sum of SquaresdfMean SquareFSig.1Regression11316698.79925658349.3994132.937.000(a)Residual20536.302151369.087 Total11337235.10017 a Predictors: (Constant), 第三产业, 第二产业b Dependent Variable: 能源终端消费量12.6.2 多元线性回归分析 结果解读:(1) 描述统计表。参与分析的能源终端消费量,第二产业,第三产业的样本数均为18,其对应的均值分别为2784.6161,1855.0511,547.6189,其对应的标准差分别为816.63712,551.63183,172.67520。(2) 相关系数表。第一栏给出了三个变量两两相关的系数表,因变量能源终端消费量和自变量第二产业的相关系数最大,两个自变量之间存在一定程度的相关。第二栏给出了五个变量之间两两相关的显著性检验结果表。最后一栏给出了各个变量的样本数。(3) 第三个表依次列出了模型对自变量的筛选过程,即变量进入退出模型的情况。第一二产业都进入模型1。(4) 回归方程拟合总结表。模型1第二产业的相关系数R=0.999,决定系数R2=0.998,调整绝对系数=0.998,误差估计值=37.00117。(5) 回归方程的方差分解及检验结果。模型1的第二产业的F=4132.937,P=0.000,可见方差极其显著。12.7 时间序列的曲线估计结果解读:+1.第一部分输出相关统计量和参数的值有Model Descripion ,case procession,Summary和Model Summary and parameter Estimates2.输出的结果文件中第二部分表示新增加了四个变量FIT-1,FIT-2,FIT-3,FIT-4,分别代表线性函数,三次函数,幂函数,指数函数条件下进行回归分析是y的预测值。 3.第三部分输出的是观察值和线性函数,三次函数,幂函数和指数函数四种曲线的预测值的对比图。从对比图中可以看出,指数函数的曲线与样本的实际观察值没有拟合,所以不能采用指数函数进行回归分析。4由于在Curve Estimation 对话框中选了save项,且在save variables框中选择了Predicatedvalues选项和Predict through项,并且在Observation框中输入了27,因此在SPSS数据编辑窗口中就新增了FIT-1,FIT-2,FIT-3,FIT-等四个变量的预测值,同时窗口下方还新增了9个个案,他们分别代表20082017年的预测值。Model DescriptionModel NameMOD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论