SPSS实验报告.doc_第1页
SPSS实验报告.doc_第2页
SPSS实验报告.doc_第3页
SPSS实验报告.doc_第4页
SPSS实验报告.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 描述性统计分析一、实验目的通过计算诸如样本均值、中位数、样本方差等重要基本统计量,并辅助于SPSS提供的图形功能,能够使分析者把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到重要作用。并且,通过例子学习描述性统计分析及其在SPSS中的实现,包括统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析和多重响应分析,能够使分析者更好的掌握基本的统计分析,即单变量频数分布的编制、基本统计量的计算以及数据的探索性分析等。二、实验内容1打开数据文件data4-8.sav,完成以下统计分析。(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;解决问题的原理:描述性分析实验步骤:通过“分析-描述统计-描述”,打开“描述性”对话框,根据题目所需要的统计量进行设置。结果及分析:描述统计量N全距极小值极大值均值标准差方差成绩4583159860.5123.048531.210有效的 N (列表状态)45表中分析变量“成绩”的个案数、所有个案中的极大值、极小值、均值、标准差及方差。(2)使用Recode命令生成一个新变量“成绩段”,其值为各科成绩的分段:90100为1,8089为2,7079为3,6069为4,60分以下为5,其值标签:1优,2良,3中,4及格,5不及格。分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。解决问题的原理:频率分析。实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。结果及分析:成绩频率百分比有效百分比累积百分比有效1512.22.22.21912.22.24.42412.22.26.72812.22.28.93012.22.211.13224.44.415.63312.22.217.83412.22.220.03612.22.222.23724.44.426.74312.22.228.94912.22.231.15012.22.233.35512.22.235.65648.98.944.46036.76.751.16212.22.253.36312.22.255.66912.22.257.87012.22.260.07336.76.766.77412.22.268.97512.22.271.17612.22.273.37812.22.275.68112.22.277.88312.22.280.08524.44.484.48612.22.286.79024.44.491.19112.22.293.39524.44.497.89812.22.2100.0合计45100.0100.0表中显示了变量“成绩段”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。表中显示了变量“成绩段”的直方图,从图上可以看出不具备明显的正态分布。 表中显示了变量“成绩段”的饼图,从图上可以更好的看出“成绩段”的分布。2打开数据文件data4-9.sav,完成以下统计分析。表4.22 吸烟人群健康状况调查表是否吸烟是否患气管炎人数是患病43是健康162否患病13否健康121(1)对身高进行考察,分析四分位数,计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;解决问题的原理:探索性分析实验步骤:通过“分析-描述统计-探索”,打开“绘制”对话框,根据题目所需要的统计量进行设置。结果及分析:身高 Stem-and-Leaf Plot Frequency Stem & Leaf 2.00 9 . 99 16.00 10 . 0000001222333344 39.00 10 . 555555556666677778888888999999999999999 18.00 11 . 000000112222233344 13.00 11 . 5556667788999 7.00 12 . 0000002000 1.00 12 . 5 Stem width: 10.0 Ea00ch leaf: 1 case(s)从上的茎叶图可以更加详细地分析身高数据。从上的箱图可以分析变量“身高”的四分位数。(2)考察身高、体重和胸围的正态性。解决问题的原理:运用频率分析、描述性分析、探索性分析。实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。3表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。(用交叉列联表分析,参见数据文件:data4-10.sav。)解决问题的原理:运用交叉表分析。实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:案例处理摘要案例有效的缺失合计N百分比N百分比N百分比是否患气管炎 * 是否吸烟4100.0%0.0%4100.0%表给出了数据基本信息,表中给出了参与分析的个案数、缺失信息等。本例中,每个变量有4个个案参与分析,无缺失值。是否患气管炎* 是否吸烟 交叉制表计数是否吸烟合计是否是否患气管炎患病112健康112合计224表给出了了数据的交叉表,与原始数据在形式上基本一致。卡方检验值df渐进 Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方.000a11.000连续校正b.00011.000似然比.00011.000Fisher 的精确检验1.000.833线性和线性组合.00011.000有效案例中的 N4a. 4 单元格(100.0%) 的期望计数少于 5。最小期望计数为 1.00。b. 仅对 2x2 表计算表是行、列变量通过卡方检验给出的独立性检验结果。从表可知,各种检验方法显著水平都远小于0.05,所以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价结果是相关的。各组状况条形图相当于交叉表的直观表示,用图形表示可直观地得出各种情况的比较。4为分析某中学学生填报志愿的倾向,设计了一道问卷调查题,每位同学可填报3个志愿,请按顺序依次选择打算报考的大学:第一志愿 第二志愿 第三志愿 北京大学 清华大学 复旦大学 中国人民大学 北京交通大学 四川大学问卷调查的结果存放在SPSS数据文件data4-11.sav中,按如下要求进行统计分析。(1)对第一、二、三志愿填报情况进行统计分析;(2)对各学校填报志愿的情况进行统计分析,包括人数、百分比等。解决问题的原理:运用频率分析、描述性分析、交叉表分析。实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:统计量志愿1志愿2志愿3N有效100100100缺失000中值3.003.003.00众数334标准差1.5781.4291.642方差2.4912.0412.695极小值111极大值666百分位数252.002.002.00503.003.003.00754.004.005.00频率表志愿1频率百分比有效百分比累积百分比有效12020.020.020.021717.017.037.032626.026.063.041414.014.077.051414.014.091.0699.09.0100.0合计100100.0100.0志愿2频率百分比有效百分比累积百分比有效12020.020.020.022424.024.044.032626.026.070.041515.015.085.051010.010.095.0655.05.0100.0合计100100.0100.0志愿3频率百分比有效百分比累积百分比有效11414.014.014.021919.019.033.031818.018.051.042121.021.072.051212.012.084.061616.016.0100.0合计100100.0100.0表中显示了变量“志愿”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。三、实验心得与体会通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态。同时加强了自己的操作能力。 第五章 参数估计与假设检验一、实验目的表5.20 某班学生数学成绩序号成绩序号成绩序号成绩163109419702991198206538112732184477138922845681498239567915772461780166725698631769267398718812760如果掌握了所研究总体的全部数据,那么只需做一些简单的统计描述,就可得到有关总体的数据特征,如方差、总体均值等,但在现实情况中,很多时候不可能或者不必对总体中的每个单位进行测定,就需要从总体抽取一部分单位进行测定,通过样本提供的信息来对总体信息进行估计和推断。而参数估计和假设检验就是通过样本分析总体,从样本的观察或试验结果的特征对总体的特征进行估计和推断。二、实验内容3表5.20是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70分之间是否有显著性差异。(参见数据文件:data5-16.sav。)解决问题的原理:单样本T检验实验步骤:通过“分析-比较均值-单样本T检验(S)”,打开“单样本T检验”对话框,根据题目所需要的统计量进行设置。结果及分析:单个样本统计量N均值标准差均值的标准误成绩2777.9312.1112.331表给出了单样本T检验的描述性统计量,包括样本数(N) 、均值、标准差、均值的标准差。单个样本检验检验值 = 70 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限成绩3.40026.0027.9263.1312.72表是单样本T检验结果表,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。4在某次测试中,随机抽取男女学生的成绩各10名,数据如下: 男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。(参见数据文件:data5-17.sav。)解决问题的原理:独立样本T检验实验步骤:通过“分析-比较均值-独立样本T检验(T)”, 打开“独立样本T检验” 对话框,根据题目所需要的统计量进行设置。结果及分析:上表中是独立样本T检验的均值检验结果。显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。5某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21所示。假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化。(参见数据文件:data5-18.sav。)表5.21 服药前后的体重变化体 重服药前198 237 233 179 219 169 222 167 199 233 179 158 157 216 257 151 服药后192 225 226 172 214 161 210 161 193 226 173 154 143 206 249 140解决问题的原理:配对样本T检验实验步骤:通过“分析-比较均值-配对样本T检验(P)”, 打开“配对样本T检验” 对话框,根据题目所需要的统计量进行设置。结果及分析:从上表一及表二中可以看出,在显著水平为0.05时,概率P值明显小于0.05,拒绝原假设,可以认为减肥药前后的体重有明显的线性关系。从上表三是配对样本T检验的最终结果,可以看出,在显著水平为0.05时,由于概率P值明显小于0.05,拒绝原假设,故可以认为服药前后,体重有显著变化。10某农民想了解两品种的小麦、产量是否有显著区别,其产量数据如表5.24所示,分别在显著性水平0.05和0.01下检验两品种产量是否有显著性差异。(数据来源:M.R.斯皮格尔,统计学(第3版),科学出版社;参见数据文件:data5-23.sav。)表5.24 两种小麦的产量数据小麦115.915.316.414.915.31614.615.314.516.616小麦216.416.817.116.9181618.117.215.4解决问题的原理:独立样本非参数检验。实验步骤:通过“分析-非参数检验-独立样本”,打开“非参数检验”对话框,根据题目所需要的统计量进行设置。结果及分析:由图可知,因为显著性水平为0.05,而相伴概率Sig.=1.0000.05,所以接受原假设,两品种产量无显著性差异。 由图可知,因为显著性水平为0.01,而相伴概率Sig.=1.0000.05,所以接受原假设,两品种产量无显著性差异。 11为研究长跑运动对增强普通高校学生心脏功能的效果,对某校15名男生进行测试,经过5个月的长跑锻炼后看其晨脉是否减少。锻炼前后的晨脉数据如表5.25所示。表5.25 长跑锻炼前后晨脉变化表锻炼前707656636356586065657566565970锻炼后485460644855544551485648645054试问锻炼前后的晨脉在显著性水平0.05下有无显著性差异。(数据来源:卢纹岱,SPSS for Windows统计分析(第3版),电子工业出版社;参见数据文件:data5-24.sav。)解决问题的原理:相关样本的非参数检验。实验步骤:通过“分析-非参数检验-相关样本”,打开“非参数检验”对话框,根据题目所需要的统计量进行设置。结果及分析:由图可知,因为显著性水平为0.05,而相伴概率Sig.=0.220.05,所以接受原假设,可以得知锻炼前后的晨脉之间差异的中位数等于0,即锻炼前后的晨脉无显著性差异。 三、实验心得与体会通过对本章的学习以及实例分析的操作,学会了如何用T检验解决两样本间均值比较的问题。对数据的分析有了进一步的认识和技能的掌握有了很大的提高。从而在以后的学习工作中,遇到此类问题,能更快的反应、理解和掌握。第七章 相关分析一、实验目的利用分析多个性质不同的SPSS变量,从而分析总体的多个特征,并分析这些特征的联系。相关分析是比较简单的多元分析,使用多元分析方法,能快速发现总体特征之间的关系,并检验这些特征的显著性。以此广泛用于生物学、经济学等各个领域。二、实验内容3K.K.Smith在烟草杂交繁殖的花上收集到如表7.21所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。(数据来源:苏金明,统计软件SPSS系列应用实践篇,电子工业出版社;参见数据文件:data7-9.sav。)表7.21 K.K.Smith所调查的长度资料花瓣长494432423253363937454148453940343735花枝长272412221329142016212225231820152013花萼长191612171019151415211422221514151516解决问题的原理:两变量相关分析实验步骤:通过“分析-相关-双变量”,打开“双变量相关”对话框,根据题目所需要的统计量进行设置。结果及分析:从上表一列出了描述性统计量均值、标准差和统计量个案数。从上表二是相关分析的主要结果,可以看出,相关系数0.9550,0.7970,说明呈正相关,相关系数的显著性为0.0020,双尾检验的相伴概率明显小于0.05,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性。从上表的下半部分可以看出,两变量的Spearman相关系数为0.9950,同时双尾检验的相伴概率显著性明显小于0.05,也说明两变量呈显著的正相关性。从表的脚注可看出双尾检测下两变量在0.01水平上具有显著的正相关性。故19621988年安徽省国民收入与城乡居民储蓄存款余额两个变量间具有显著的线性相关性。5某高校抽样10名短跑运动员,测出100米短跑的名次和跳高的名次如表7.23所示,问这两个名次是否在0.05的显著性水平下具有相关性。(数据来源:马庆国,应用统计学:数据统计方法、数据获取与SPSS应用,科学出版社;参见数据文件:data7-11.sav。)表7.23 10名运动员的100米短跑及跳高名次百米名次12345678910跳高名次43152710896解决问题的原理:偏相关分析 实验步骤:通过“分析-相关-偏相关”,打开“偏相关”对话框,比照例题根据题目所需要的统计量进行设置。结果及分析:从上表可以看出100米短跑的名次和跳高的名次的偏

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论