版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
..江夏学院实验报告〔2013-2014学年第二学期〕课程名称:统计分析软件运用实训指导教师:夏婧教研室:专业:年级班级:金融学院实验报告课程名称:统计分析软件运用实训实验编号及实验名称描述性统计分析与参数检验教研室姓名学号班级实验地点实验日期实验时数指导教师同组其他成员成绩实验要求:(1)写出详细的实验操作步骤(2)对软件输出结果进展分析.(3)写出实验心得体会(4)打印上交实验容:实验一:1985年某省农村120例正常男童胸围〔cm〕测量结果如下,试进展描述性统计分析。51.6、54.0、57.7、58.3、53.8、51.3、57.3、52.1、54.8、54.1、56.9、55.5、55.4、57.7、53.8、54.8、55.3、54.7、51.3、55.5、57.5、55.9、56.0、50.5、58.1、58.3、56.2、56.6、57.7、53.5、53.3、58.6、53.8、56.5、53.5、53.7、51.2、56.0、56.3、54.1、57.6、56.8、51.3、53.1、52.4、53.6、57.4、54.0、55.9、56.0、56.0、50.2、56.8、58.1、56.0、55.2、57.5、57.2、58.1、54.5、55.5、54.5、56.6、58.3、53.6、55.4、56.1、49.1、51.7、53.6、56.1、56.7、53.4、53.1、51.4、56.1、59.3、59.8、57.1、55.9、54.6、61.8、56.8、53.9、54.4、56.6、56.1、56.7、58.1、52.6、53.7、56.4、58.0、52.7、59.0、54.6、54.1、50.4、54.2、52.4、53.1、52.7、59.0、53.3、53.8、51.4、54.2、56.4、56.2、56.7、53.5、54.0、55.5、55.7、50.8、55.9、56.6、54.7、54.4、55.3解:注意数据如何导入spss中,最简单的方法是:〔1〕选中所有数据,ctrl+F〔2〕点击替换,进展如下输入,即可将数据转换成列,复制到Excel中并保存,再导入SPSS中。选择Analyze——DescriptiveStatistics——Descriptives,对数据进展描述性统计分析。将变量"男童胸围〞选入"Variables〞对话框,在"Options〞界面中选择Means、Std.deviation、Minimum、Maximum、S.E.mean、Kurtosis和Skewness。点击"ok〞按钮。输出数据分析结果,如下表所示。表1-1正常男童胸围的根本描述统计量N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量标准误统计量统计量标准误统计量标准误男童胸围〔cm〕12049.161.855.121.21182.3197-.127.221-.122.438有效的N〔列表状态〕120从表1-1中可以看出,样本量为120,有效样本为120,没有缺失值;男童胸围的最大值为61.8cm,最小值为49.1cm;男童胸围的均值为55.121cm,均值的标准误为0.2118cm,说明男童胸围数据的样本均值是较为稳定的;男童胸围的标准差为2.3197cm,说明样本数据的离散程度较低;男童胸围的分布呈一定的左偏分布〔偏度统计量的值为-0.127〕,但偏斜程度不大;同时,男童胸围的分布呈一定的平峰分布〔峰度统计量的值为-0.122〕,与正态分布的差距不大。实验二:三代同堂的家庭中,婆婆与儿媳关系紧的现象并不少见,为了了解住房条件对婆媳关系的影响,先对600户家庭的进展调查,数据如下表,问婆媳关系与住房条件有无联系?婆媳关系住房条件差一般好紧577860一般458763和睦4845117解:在SPSS中录入数据如以下图所示。首先,利用Data——WeightCases,对数据进展加权处理,将"加权变量n〞选入"FrequencyVariable〞,点击"ok〞。其次,选择Analyze——DescriptiveStatistics——Crosstabs,对数据进展列联表分析。将"婆媳关系〞变量选入Rows行变量框,将"住房条件〞变量选入Columns列变量框。在Statistics按钮中选择输出"Chi-square〞卡方检验结果,点击"Continue〞。在Cells按钮中选择在二维穿插列联表中输出频数、行百分比、列百分比,点击"Continue〞。点击"ok〞按钮。输出数据分析结果,如以下各表所示。表2-1根本数据信息案例有效的缺失合计N百分比N百分比N百分比婆媳关系*住房条件597100.0%0.0%597100.0%表2-1为该样本的根本数据信息,其样本量为597,没有缺失值。表2-2婆媳关系*住房条件列联表住房条件合计差一般好婆媳关系紧计数574545147婆媳关系中的%38.8%30.6%30.6%100.0%住房条件中的%29.2%23.1%21.7%24.6%一般计数788745210婆媳关系中的%37.1%41.4%21.4%100.0%住房条件中的%40.0%44.6%21.7%35.2%和睦计数6063117240婆媳关系中的%25.0%26.3%48.8%100.0%住房条件中的%30.8%32.3%56.5%40.2%合计计数195195207597婆媳关系中的%32.7%32.7%34.7%100.0%住房条件中的%100.0%100.0%100.0%100.0%表2-2为婆媳关系和住房条件的列联表。从上表中可以看出:首先,在所调查的597个样本中,住房条件差、一般和好的分别为195户、195户和207户,分别占总样本的32.7%、32.7%和34.7%,可见样本中的住房条件分布较为均匀;婆媳关系紧的、一般的、和睦的分别为147户、210户和240户,分别占总样本的24.6%、35.2%和40.2%,可见婆媳关系紧的所占比例较少,婆媳之间有矛盾的家庭不到三分之一。其次,对不同婆媳关系进展分析。在婆媳关系紧的147户中,住房条件为差、一般、好的样本量分别为57、45和45,各占38.8%、30.6%和30.6%的比例,住房条件差的所占比例略高一点,且高于总体比例〔32.7%〕,住房条件一般和好的均低于总体比例〔32.7%和34.7%〕;在婆媳关系一般的210户中,住房条件为差、一般、好的样本量分别为78、87和45,各占37.1%、41.4%和21.4%的比例,住房条件一般的所占比例略高且远高于总体比例〔32.7%〕,住房条件好的所占比例最低,且明显低于总体比例〔34.7%〕;在婆媳关系和睦的240户中,住房条件为差、一般、好的样本量分别为60、63和117,各占25%、26.3%和48.8%的比例,住房条件好的占到将近一半的比例,且其明显高于总体比例〔34.7%〕。最后,对不同住房条件进展分析。在住房条件为差的195户中,婆媳关系紧、一般和和睦的分别为57户、78户和60户,分别占总样本的29.2%、40%和30.8%,婆媳关系紧和一般的比例均高于总体水平〔24.6%和35.2%〕,婆媳关系和睦的比例低于总体水平〔40.2%〕;在住房条件为一般的195户中,婆媳关系紧、一般和和睦的分别为45户、87户和63户,分别占总样本的23.1%、44.6%和32.3%,婆媳关系一般的所占比例最高,且高于总体水平〔35.2%〕,婆媳关系紧和和睦的比例均低于总体水平〔24.6%和40.2%〕;在住房条件为好的207户中,婆媳关系紧、一般和和睦的分别为45户、45户和117户,分别占总样本的21.7%、21.7%和56.5%,婆媳关系和睦的所占比例最高,且明显高于总体水平〔40.2%〕,婆媳关系紧和一般的比例均低于总体水平〔24.6%和35.2%〕。从以上分析中可以初步得到结论,住房条件与婆媳关系之间是存在相关关系的。婆媳关系紧的家庭其住房条件差的比例较高,婆媳关系和睦的家庭其住房条件好的比例较高;同样的,住房条件好的家庭其婆媳关系和睦的比例也更高一些,反之,住房条件差的家庭其婆媳关系紧的比例更高。表2-3婆媳关系和住房条件的卡方检验结果值df渐进Sig.(双侧)Pearson卡方40.4774.000似然比40.7114.000线性和线性组合17.9471.000有效案例中的N597a.0单元格(.0%)的期望计数少于5。最小期望计数为48.02。表2-3为婆媳关系和住房条件的卡方检验结果,其原假设为婆媳关系和住房条件是相互独立的。由于Pearson卡方检验统计量的p值为0.000<0.05,因此拒绝原假设,认为婆媳关系和住房条件不是相互独立的,即婆媳关系和住房条件有联系。实验三:某管道工程承包人希望减少效劳呼叫地点之间的平均距离,但仍然维持至少同样多的生意,这样他的工作效率就得到了提高。管道工1被指派给一个调度员,该调度员负责监听所来到的效劳请求并制定一个当日的效劳方案。管道工2仍同原来一样,根本按照呼叫顺序提供效劳。两个管道工18天每天所走的英里数记录如下,试进展探索性分析。管道工1:88.2、94.7、101.8、102.6、89.3、95.7、78.2、80.1、83.9、86.1、89.4、71.4、92.4、85.3、87.5、94.6、92.7、84.6管道工2:105.8、117.6、119.5、126.8、108.2、114.7、90.2、95.6、110.1、115.3、109.6、112.4、104.6、107.2、109.7、102.9、99.1、115.5解:数据导入方式同实验一,这里不再赘述。得到数据文件如以下图所示。选择Analyze——DescriptiveStatistics——Explore,对数据进展探索性分析。将每天所走的英里数添加到DependentList框,将管道工编号作为分组变量添加到FactorList框。在Statistics按钮中选择Descriptives。在Plots按钮中选择Normalityplotswithtests,进展正态性检验。点击"OK〞,结果如下所示。表3-1根本描述性统计量管道工编号统计量标准误每天所走的英里数管道工1:优化均值88.8061.8597均值的95%置信区间下限84.882上限92.7295%修整均值89.006中值88.750方差62.255标准差7.8902极小值71.4极大值102.6围31.2四分位距10.2偏度-.233.536峰度.3021.038管道工2:普通均值109.1562.0851均值的95%置信区间下限104.756上限113.5555%修整均值109.228中值109.650方差78.257标准差8.8463极小值90.2极大值126.8围36.6四分位距11.2偏度-.268.536峰度.3951.038表3-1为两管道工每天行走英里数的根本描述性统计量。从表中可以看出,管道工1每天行走英里数的均值为88.806英里,均值标准误为1.8597;管道工2每天行走英里数的均值为109.156英里,均值标准误为2.0851.可以看出,管道工1每天行走的英里数明显低于管道工2的,且其均值更加稳定,波动性更小。表3-2正态性检验管道工编号Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.每天所走的英里数管道工1:优化.10018.200*.98018.951管道工2:普通.08118.200*.98618.992a.Lilliefors显著水平修正*.这是真实显著水平的下限。表3-2为两管道工18天中每天行走英里数的正态性检验结果,其原假设为每天所走的英里数的总体服从正态分布。由于样本量n=18,是小样本,所以看Shapiro-Wilk统计量的结果。可以看出,两个管道工的每天所走英里数的Shapiro-Wilk统计量的p值均大于显著性水平0.05,因此不拒绝原假设,认为这两个总体都服从正态分布。图3-1是两管道工每天所走英里数的箱型图。从该图中可以非常直观的看出,管道工1相应的25%分位数、中位数和75%分位数均明显低于管道工2的。图3-1两管道工每天行走英里数的箱型图综上所述,通过由专门的调度员负责监听所来到的效劳请求并制定一个当日的效劳方案并交由管道工执行的方法,可以明显减少效劳呼叫地点之间的平均距离。实验四:下表为某公司生产的缆绳所承载的最大负荷量,单位为短吨〔1短吨=2000磅〕,试进展单变量频率分析。最大负荷量〔短吨〕9.3~9.79.8~10.210.3~10.710.8~11.211.3~11.711.8~12.212.3~12.712.8~13.2缆绳数25121714631解:在SPSS中录入数据如以下图所示,需要注意的是,最大负荷量变量按照题目的要求被分为8个组,分别赋值为1-8。首先,利用Data——WeightCases,对数据进展加权处理,将num缆绳数选入"FrequencyVariable〞,点击"ok〞。其次,选择Analyze——DescriptiveStatistics——Frequencies,对数据进展频数分析。将最大负荷量选入Variable框中。在Statistics按钮中选择计算四分位数、均值、中位数、众数、标准差、均值标准误、偏度和峰度。在Charts按钮中选择输出条形图。点击"OK〞,输出结果如下所示。表4-1根本描述性统计量最大负荷量〔短吨〕N有效60缺失0均值4.18均值的标准误.191中值4.00众数4标准差1.479偏度.161偏度的标准误.309峰度.042峰度的标准误.608百分位数253.00504.00755.00表4-1为缆绳最大负荷量的根本描述性统计量。从表中可以得到,其样本量〔缆绳数〕为60,缆绳的最大负荷量的平均值、中位数和众数均分布在第4组〔10.8-11.2吨〕这一区间;标准差为1.479,说明数据的离散程度较大;偏度为0.161,说明数据分布呈现略微的右偏分布;峰度为0.042,说明数据分布呈现不太明显的尖峰分布,较为接近于正态分布。样本的25%分位数、中位数和75%分位数分别分布在第3、4、5组中,说明该样本有50%以上的数据集中分布与这三组。表4-2最大负荷量的频数分布表频率百分比有效百分比累积百分比有效9.3-9.723.33.33.39.8-10.258.38.311.710.3-10.71220.020.031.710.8-11.21728.328.360.011.3-11.71423.323.383.311.8-12.2610.010.093.312.3-12.735.05.098.312.8-13.211.71.7100.0合计60100.0100.0表4-2为缆绳最大负荷量的频数分布表。可以看出,第3组〔10.3-10.7吨〕、第4组〔10.8-11.2吨〕和第5组〔11.3-11.7吨〕的样本数分别为12、17和14,分别占总样本量的20%、28.3%和23.3%,第4组所占比例最高,其次是第5组,然后是第3组,三者累计占到总样本量的70%以上。另外5组所占的比例均不超过10%,第8组〔12.8-13.2吨〕所占比例最低,其次是第1组〔9.3-9.7吨〕。说明样本数据的分布还是相对集中的。从图4-1缆绳最大负荷量的直方图中也可以得出与上面一样的结论。图4-1缆绳最大负荷量的直方图实验五:大量研究显示汉族足月顺产男性新生儿临产双顶径(BPD)均值为9.3cm。某医生记录了某山区12名汉族足月正常产男性新生儿临产双顶径(BPD)资料如下:9.35、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区男性新生儿临产双顶径(BPD)是否与一般新生儿一样?解:原假设为,此题需要进展单样本t检验。QUOTE数据导入方式同实验一,这里不再赘述。得到数据文件如以下图所示。选择Analyze——pareMeans——One-SampleTTest,对数据进展单样本t检验。将新生儿临产双顶径(BPD)变量选入TestVariable框中,在TestValue中输入检验值9.3。点击"OK〞,得到单样本t检验输出结果,如下所示。表5-1新生儿临产双顶径(BPD)的根本描述性统计量N均值标准差均值的标准误汉族足月顺产男性新生儿临产双顶径129.3475.27958.08071表5-1为新生儿临产双顶径〔BPD〕的根本描述性统计量。由表可知,其样本量为12,均值为9.3475cm;标准差为0.28,说明样本数据的离散程度较小;均值的标准误为0.081,说明均值较为稳定。表5-2新生儿临产双顶径(BPD)的单样本t检验结果检验值=9.3tdfSig.(双侧)均值差值差分的95%置信区间下限上限汉族足月顺产男性新生儿临产双顶径〔BPD〕.58911.568.04750-.1301.2251表5-2为新生儿临产双顶径〔BPD〕的单样本t检验结果。由表可知,其t统计量的值为0.589,自由度为11,t统计量的p值为0.568,大于显著性水平0.05,因此不拒绝原假设,认为该地区男性新生儿临产双顶径(BPD)与一般新生儿一样。此外,上表中还可以看出,均值差值的95%置信区间为〔-0.1301,0.2251〕,因此可以计算得该地区男性新生儿临产双顶径〔BPD〕的95%置信区间为〔9.1699,9.5251〕,该区间中包含了一般新生儿的BPD均值9.3,因此,也不拒绝原假设,认为该地区男性新生儿临产双顶径(BPD)与一般新生儿一样。实验六:保险公司的评估员认为汽车修理厂I比汽车修理厂II对汽车修理费用的评估要高。为了证实他们的猜测,将最近出现事故的15辆汽车分别在两个汽车修理厂进展维修费用评估。所得数据如下,试检验两个修理厂的评估费用有无差异。汽车123456789101112131415修理厂I17.620.219.511.313.016.315.316.212.214.821.322.116.917.618.4修理厂II17.319.118.411.512.715.814.915.312.014.221.021.016.116.717.5解:原假设为,此题需要进展两配对样本t检验。QUOTE将上表中的数据复制到Excel中,并进展转置操作,然后再导入SPSS中。得到数据文件如以下图所示。选择Analyze——pareMeans——Paired-SamplesTTest,对数据进展两配对样本t检验。将修理厂1维修费用评估和修理厂2维修费用评估两个变量分别选入Variable1和Variable2中,形成一对配对样本。点击"ok〞,得到输出结果如下所示。表6-1两修理厂维修费用评估的根本描述统计量均值N标准差均值的标准误对1修理厂1维修费用评估16.847153.2040.8273修理厂2维修费用评估16.233152.9413.7594表6-1为两修理厂维修费用评估的根本描述统计量。从表中可以看出,修理厂1对15辆车的维修费用评估的均值为16.847,标准差为3.204,均值标准误为0.8273;修理厂2对15辆车的维修费用评估的均值为16.233,标准差为2.9413,均值标准误为0.7594。修理厂1的均值略高于修理厂2的均值,且修理厂1的离散程度比拟大,均值的稳定性也略差。由此可以初步判断,认为修理厂1和修理厂2的维修费用评估是有差异的。表6-2两修理厂维修费用评估的相关系数N相关系数Sig.对1修理厂1维修费用评估&修理厂2维修费用评估15.995.000表6-2为两修理厂维修费用评估的相关系数,其原假设为两修理厂的维修费用评估不存在显著的线性相关性。由上表可知,两修理厂维修费用评估的相关系数为0.995,其相应的p值为0.000,小于显著性水平0.05,因此拒绝原假设,认为两修理厂的维修费用评估存在显著地线性相关性。表6-3两修理厂维修费用评估的两配对样本t检验结果修理厂1维修费用评估-修理厂2维修费用评估tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1修理厂1维修费用评估-修理厂2维修费用评估.6133.3944.1018.3949.83176.02314.000表6-3为两修理厂维修费用评估的两配对样本t检验结果。由上表可知,修理厂1与修理厂2的维修费用评估的差值的均值为0.6133,该差值的标准差为0.3944,说明其离散程度较大;该差值的均值标准误为0.1018,说明其均值的稳定性一般。该差分的95%的置信区间为〔0.3949,0.8317〕,并不包含检验值0,因此,可以拒绝原假设,认为两修理厂的维修费用评估是有显著差异的。由上表中修理厂1与修理厂2的维修费用评估的差值的t统计量也可以得出一样的结论。其t统计量的观测值为6.023,对应的p值为0.000,小于显著性水平0.05,因此拒绝原假设,认为两修理厂的维修费用评估是有显著差异的。实验七:一个环境控制检验员疑心一个河边的社区往河里排放半处理的污水,这会导致河水中被溶解氧气的变化。为了证实这一疑心,分别在这个城镇的上下游各随机抽取了15个水样,测量这30出水样中被溶解氧气〔单位ppm〕的数据。试问上下游河水中的氧气浓度是否相等?上游:5.2、4.8、5.1、5.0、4.9、4.8、5.0、4.7、4.7、5.0、4.7、5.1、5.0、4.9、4.9下游:4.2、4.4、4.7、4.9、4.6、4.8、4.9、4.6、5.1、4.3、5.5、4.7、4.9、4.8、4.7解:数据导入方式同实验一,这里不再赘述。得到数据文件如以下图所示。该题目需要进展两独立样本t检验,其原假设为。需要注意的是,在进展两独立样本t检验之前,需要首先对两个独立总体的是否服从正态分布进展检验,因此,首先进展正态性检验。〔1〕正态性检验首先,使用Data——SplitFile,对数据进展拆分。选择paregroups,将group作为分组变量选入GroupsBasedon框中,点击"ok〞。选择Analyze——DescriptiveStatistics——Explore,对数据进展探索性分析。将氧气浓度变量添加到DependentList框。在Plots按钮中选择Normalityplotswithtests,进展正态性检验。点击"ok〞,得到正态性检验结果如下表所示。表7-1正态性检验上游和下游分类Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.上游氧气浓度〔ppm).16215.200*.93515.329下游氧气浓度〔ppm).17515.200*.95115.547a.Lilliefors显著水平修正*.这是真实显著水平的下限。表7-1为上下游各15个样本的氧气浓度的正态性检验结果,其原假设为上下游的氧气浓度的总体均服从正态分布。由于样本量n=15,是小样本,所以看Shapiro-Wilk统计量的结果。可以看出,上下游的氧气浓度的Shapiro-Wilk统计量的p值均大于显著性水平0.05,因此不拒绝原假设,认为这两个总体都服从正态分布。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院价格科工作制度
- 医院值白班工作制度
- 医院验光部工作制度
- 单位微管理工作制度
- 卤肉店员工工作制度
- 卫生所管理工作制度
- 卫生院急诊工作制度
- 卫计局工作制度汇编
- 厨房冷晕间工作制度
- 县妇联宣传工作制度
- 高中综评项目活动设计范文
- 历史文化街区保护规划
- 2023年专利代理人专利法律知识考试试卷及参考答案
- 胆汁淤积性肝病课件
- 《电气控制与PLC》考试复习题库(含答案)
- 美军装备试验人员培养主要做法、特点及借鉴,军事技术论文
- GB/T 26559-2021机械式停车设备分类
- GB/T 19274-2003土工合成材料塑料土工格室
- 通用的决策树算法CARTClassificati课件
- 安全爬梯受力计算正文
- DB37-T 4401-2021养老机构分级护理服务规范
评论
0/150
提交评论