




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS实验报告(同名21555)髭计台布与SPSS的点用学院(系)专业名称班级姓名学号实习地点起止时间 2015年5月至2015年7月实验内容:1统计数据的收集与预处理1.1 数据文件的编辑1.1.1 数据文件的合并数据文件的合并是把外部数据与当前数据合并成一个新的数据文件,SPSS 提供两种形式的合并:一是横向合并,指从外部数据文件中增加变量到当前数 据文件中;二是纵向合并,指从外部数据文件增加观测数据到当前文件中。横 向合并即增加变量,而增加变量有两种方式:一是从外部数据文件中获取变量 数据,加入当前数据文件中;二是按关键变量合并,要求两个数据文件有一个 共同的关键变量,而且两个数据文件
2、的关键变量中还有一定数量相同值的观测 值。1.1.2 数据文件的拆分拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据 进行分组,为以后的分组统计提供便利。例2-2实验步骤:打开data2-2. sav f点击菜单栏的数据,拆分文件,弹出“分割文件”一按照产品类型拆分数据,选择“比较组”,激活“分组方式”栏。选中“产品”变量移入其中,单击 “确定”按钮结束。点击菜单“分析f描述性统计f描述”,弹出“描述性” 对话框,选择变量“金额”,“数量”进行分析,单击“选择”按钮设置要计算 的统计量,统计金额和数量的和,设置好后单击确定按钮,得到表1所示的统 计量:表1描述统计量产品N极小
3、值极大 值和均值标准差彩数4125014436. 0016. 573电量金438401600046080115200.053033.82额00006有4效的N(列表状态)空数13333. 00伊量金19600960096009600, 00额 有 效 的 N( 列 表 状 态)1热数水量211243517. 509,192器金_额22530 0552008050040250. 0021142. 493有 效 的M2N( 列 表 状 态)微数 波量21242512. 5016. 263炉金 额 有 效 的N( 列 表 状 态)222100504005250026250. 0034153. 258
4、洗数25485326. 5030.406衣量机金21100105601166058300. 0066892. 30额0002有2效的N(列表状态)从表1可以得出彩电、空调、热水器、微波炉、洗衣机的数量、金额的极 大值、极小值、和、均值标准差这四个描述性统计量是多少。1.1.3 数据的加权SPSS的观察量加权功能是在数据文件中选择一个变量,这个变量力的值是 相应的观测量出现的次数,这个变量叫做权变量,经过加权的数据文件叫做加 权文件。例2-3实验步骤:打开data2-3. sav-选择数据,加权个案一选择“加 权个案”,激活“频率变量”矩形框,把“工人数”变量移入框中。选择“分析”, 描述统计f
5、描述,进行产品数量总和的统计,统计结果如表2所示:可以看出 产品数量的极大值、极小值、和、均值、标准差这四个描述性统计量。表2描述统计量N极小 值极大 值和均值标准 差产品数量有效的N(列表状 态)1181182030285424.193. 8831.2SPSS数据加工1.2.1变置的计算例2-4实验步骤:打开data2-4sav-选择“转换”,计算变量,弹出“计算 变量”窗口一在“目标变量”框中输入目标变量名“总分”一从左边的变量列 表窗口中选择用于计算的变量并加入“数学表达式”框中,并乘以相应的系数 即可。2 *data2-4.sav徒d-IBM SPSS Statistics文件化)洛殂
6、但)视困包激由9)转拉CD 分析(2)立由圆)困形实用程序&P SO(W) 用助8 褊 实脸准备讲解示范实脱指导教可方法诸E文字到平手段课堂管理总分18559986883898279 35126640731645705052 006084616671979776 2043149436745628755 008749518261987570 76659854244663472S7 70780912994991变量计算后的结果7772 50图1是变量计算后的结果:根据计算公式:总分二实验准备*0. 15+讲解示范 *0.15+实验指导*0. 2+教学方法*0.15+语言文字*0. 05+教
7、学手段*0.1+课堂管理 *0.2.,可以得出教师的综合评价分。2图表的创建与编辑2.1使用图表构建程序创建使用图表构建程序创建图表,是SPSS现在推崇的主要操作方式,该方式使 用预览模式通过图库或基本元素设计图表,让用户所见所得,可以提高创建图 形的效率,减少一些不可预见的错误。例3-1实验步骤:打开data3-l. savf选 择菜单:“图形”,图表构建程序,弹出“图表构建程序”对话框一选择“库” 选项卡,点击“条(B)”中第二项“群集条形图”图标一把年份拖入“是否为X 轴”虚线框中作为条形图的X轴;把指标值“是否为Y轴”虚线框,作为条形 图的Y轴;把指标拖入“X轴上的分群:设置颜色”虚线
8、框中,作为复合分类变量f选择标题/脚注,点击标题1,设置标题“第一、二、三产业各年产值比较 图”一点击确定按钮。得到如图2:可以从图中得到信息:自1978年以来,这 三种产业的产值都在增加;每年第二产业的产值都是最高,第三产业次之,第 一产业的产值最少。2第一、二、三产业各年产值比较2. 2使用图形画板模板选择程序创建打开data3-l.sav选择菜单:图形,点击“图形画板模板选择程序”一在“基本”选项卡中,同时选中年份和指标值进行可视化表示,在摘要中选择“均3可视化输出图形结果3. 3使用旧对话框创建和前面两种创建图形方式相比,旧对话框方式缺少灵活性和直观性,但可 以对生成的图形进一步编辑。
9、例3-2实验步骤:打开data3-2. sav-选择“图形”, 旧对话框,线图中的多线线图一单击“定义”,在弹出的对话框中,指标值放入 “变量(V)"中,“年份”放入“类别轴(X), “指标分类”放入“定义线的方 式(D)-确定,得到图4:4结果图形从图4可以得到如下信息:从1990年开始,特快专递、移动电话业务呈逐 年上升的趋势,特别是特快专递到2006-2007年期间,业务增长迅猛。固定电 话业务在1990-2006期间呈上升趋势,但2006-2007年期间有下降趋势。3描述性统计分析描述集中趋势的统计量有均值、中位数、众数、总和、百分位数;描述离散程度的统计量有 样本方差、样本
10、标准差、均值标准误差、极差;描述总体分布形态的统计量有偏度、峰度。3.1 频率分析例4-1实验步骤:打开data4-l. sav选择菜单,“分析-描述性统计-频率 f在弹出的“频率”对话框中,把收入、教育放入“变量(V)”框中一点击统 计量,在百分位值中选择百分位数,在百分位数中添加30、60、90;集中趋势 中选择“众数”统计量,点击继续一点击图表,选中直方图,同时选中“在直 方图上显示正太曲线”,点击继续一确定得到以下图表:表3统计量众数 百分位数有效缺失3060836033. 004. 00835154. 005. 00收入教育频率百分比有效 0123456789287152157137
11、888552279.210.418.218.816.410.510.26.23.21.1有效百分比.210.418.218.816.410.510.26.23.21.1累积百分比.210.628.847.664.074.584.790.994 195.2表3统计量收入教育N有效缺失众数百分位数 306090836033. 004. 007. 00835154. 005. 005. 00表4变量“收入”的频率分布标表频率百分比有效百 分比累积百 分比有效 123456合计 缺失系统 合计8391141654565383518361.04.713.619.754.56.399.9 .1100,01
12、.04.713.719.854.66.3100.01.05.619.339.093.7100.0表5变量1081.01.096.211323.83.8100.0合计836100.0100.0频率分布表5变量“收入”的直方图rcci 一 一,, > , rrvr图6变量“教育”的直方表4变量“收入”的频率分布标表可以看出受访者家庭收入在“2000-2999” 的人最多。从图5和图6,受访者教育程度同正态分布相比左偏,受访者家庭收 入的分布右偏,都不是明显的正态分布。4. 2描述性分析描述性分析主要是用于计算并输出变量的各类描述性统计量,和频率分析 相比,没有图形功能,也不能生成频率表,但它
13、可以将原始数据标准化,以便 后续分析时应用。例4-2实验步骤:打开data4-2. sav-依次点击分析、描述统 计、描述,打开“描述性”主对话框一把身高作为变量移入候选变量框中,在 “选项”子对话框中选择均值、标准差、最大值、最小值、峰度、偏度这几个 描述性性统计量f确定得到表6表6描述统计量N极 小 值极 大 值均值标准 差偏度峰度统统统标标计计计统计统计统计准统计准量量量量量量误量误体91318.23. 001.16.241.84.48重630373698表6描述统计量N极 小 值极 大 值均值标准 差偏度峰度统统统标标计计计统计统计统计准统计准量量量量量量误量误体91318.23. 0
14、01.16.241.84.48重 有 效 的 N( 列 表 状 态)69630373698表6包括了身高的个数、极值、均值、标准差、偏度和峰度信息,输出的 统计量中,方差和标准差越小越好,说明该组数据趋于稳定。4参数估计与假设检验4.1单样本T检验单样本7检验利用来自某总体的样本数据,推断该总体的均值与指定的检 验值之间是否存在显著性差异,它是对总体均值的假设检验。例5-2的实验步骤:打开data5-l.sve-选择菜单“分析f比较均值f单样本T检验 ”,打 开“单样本?检验”对话框,将变量“weight”移入“检验变量”列表框,并 输入检验值500一打开“单样本7检验:选项”对话框,设置置信
15、区间为95%(缺 省为95%) f确定。运行结果如表7和表8所示:表7单个样本统计量Statis ticBootstrap3偏差标准 误差95%置信区间下限上限weig N10ht 均500. 80一 0811.67497.45504.1值0008433467标5. 3913一.382.9742. 99816. 951准56786500差均1.7048值9的标准误表8单个样本检验检验值=500tdfSig.( 双侧)均值 差值差分的95% 置信区间下限上限weig ht.4699.650.80000-3. 05674. 6567表7给出了单样本7检验的描述性统计量,包括样本数(N)、均值、标准
16、 差、均值的标准误。表8:当置信水平为95%,显著性水平为0.05,从上表中可 以看出,双尾检测概率产值为0. 650,大于0.05,故原假设成立,也就是说, 抽样袋装食盐的质量与500克无显著性差异,有理由相信生产线工作状态正常。 4. 2独立样本T检验单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样 本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否 存在显著差异。例5-3实验步骤:打开data5-2. sav-选择菜单“选择一比较 均值一独立样本7检验”,打开“独立样本7检验”对话框,将“产量”作为 要进行7检验的变量,将“品种”字段作为分组变量,定义分
17、组变量的两个分 组分别为“a”和“b” 一打开“独立样本7检验:选项”对话框,具体选项内 容及设置与单样本T检验相同一确定得到表9和表10:表9组统计量玉米 品种N均值标准差均值的标 准误单 位品种 A881. 250 011.804964.17368积 产 量品种 B875. 750 010. 024973. 54436表10独立样本检验方差 方程 的 Leven e检验均值方程的t检验FSigtdfSig .( 双 侧)均 值 差 值标 准 误 差 值差分的95%置信区间下限上限,1.71.14.335.55.4-6. 217.2045200200075643984398400表9组统计量
18、玉米 品种N均值标准差均值的标 准误单 位能涝 才 木 鸳品;A种81.00413.64281.250.33305011.5000804965.475604.1:一6.2 7297736817.27297根据表10 “方差方程的Levene检验”中的sig.为0.752,远大于设定的 显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本 T检验的结果应该看上表中的“假设方差相等“ 一行,第5列为相应的双尾检测 概率(Sig.(双侧)为0.332,在显著性水平为0.05的情况下,T统计量的概 率P值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例 中,不能
19、认为两种玉米品种的产量有显著性差异。5方差分析5.1单因素方差分析单因素方差分析检验由单一因素影响的一个(或几个相互独立的)因变量, 由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来 源来同一总体。例6-1实验步骤:、方差相等的齐性检验:选择菜单“分析 一均值比较一单因素AN0VA”,打开“单因素方差分析”对话框分把猪重作为因 变量,饲料品种作为控制变量一点击选项,弹出选项对话框,选择“方差同质 性检验”一确定得到表和表。多重比较分析、:单击“两两比较(H)按钮, 弹出两两比较对话框,选择LSD最小显著性差异一确定得到表表11方差齐性检验猪重Levene统计量df1df2显
20、著性.024315.995方差齐性检验的H。假设是:方差相等。从表11可看出相伴根据Sig. =0. 995> a (0. 05)说明应该接受Ho假设(即方差相等)。故下面就用方差相等的检验方 法。表12AN0VA猪重平方和df均方F显著 性组20538. 69836846. 233157. 467.000间组652.1591543.477内总21190.85818数表12是几种饲料方差分析的结果,组间平方和为20538. 698,自由度(df) 为3,均方为6846. 233;组内平方和为652.159,自由度为15,均方为43.477; F统计量为157. 467。由于组间比较的相伴
21、概率Sig. (p值)=0. 000<0. 05,故 应拒绝小假设(四种饲料喂猪效果无显著差异),说明四种饲料对养猪的效果有 显著性差异。表13多重比较猪重LSD(I (J均值差标准误屈 95%置信区间) 饲 料 品下限上限-18. 68000*-56. 36000*-87. 41500*18. 68000-37. 68000*-68. 73500*56. 3600037. 68000*4.170244.170244. 423214.170244.170244. 423214.170244.17024.00.00.00.00, 00.00.00.00-27. 5687-65. 2487-
22、96. 84289. 7913-46. 5687-78.162847.47128.791-9. 791-47. 4713-77. 987227. 568-28. 791359. 307265. 24846. 5684123-31.05500*4. 42321.00 -40.4802887. 4150068. 7350031.055004. 423214. 423214. 42321.00.00.0077. 98759. 30721.627-21.627296. 842878.162840.4828*.均值差的显著性水平为0.05-表13反映出来四种饲料相互之间均存在显著性差异,从效果来看是第4
23、种 最好,其次是第3种,第1种最差。5. 2协方差分析协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条 件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。 例6-3实验步骤:选择菜单“分析一般线性模型一单变量一数学成绩作为因 变量,分组作为固定变量,入学成绩移入协变量一打开“模型”对话框,把 entrancew、”group”和entrance*group移入模型中,在类型中选择"交互” f打开“选项”对话框,选中“方差齐性检验”复选框,点击确定按钮结果如 下表14所示:表14误差方差等同性的Levene检验'因变量:数学成绩Fdf1df2
24、Sig.2. 337215.131检验零假设,即在所有组中因变量的谩差方差均相等。a, 设计:截距 + group + entrance + group entrance表15主体间效应的检验因变量:数学成绩源III型平方和df均方FSig.校正模型3757.12215751.4246.040.005截距862.8171862.8176.935. 022group104.163252.082.419. 667entrance.4671.467.004. 952group . entrance61.932230.966.249. 784误差1492.87812124.406总计112898.00
25、018校正的总计5250.00017表16Tests of Between-Subjects EffectsDepend en t Variable:敷学SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model3695.19031231.73011.091.001Intercept1387.82411387.82412.496.003入学成绩8.85718.857.060.782组另!J3364.08321682.041IS.146.OOOError1554.81014111.OS8Total112898.00018Corre
26、cted Total5250.00017a R Squared = .704 (Adjusted R Squared = .640)表14是方差的齐性检验结果,由于其相伴概率值Sig.=0.131>0.05,因此 认为各组的方差具有齐性。表15是检验控制变量与协变量是否具有交互作用, 从其中可看出group与entrance的交互作用项Sig. =0. 784>0. 05,因此认为它 们之间没有交互作用。可以看出入学成绩的影响是不显著的,而教学方法的影 响是显著的。6相关分析6.1两变量相关分析二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或 两个以上变量之间两两相
27、关的程度进行分析。例7-1实验步骤:选择菜单“分 析一相关一双变量”,打开“双变量相关”对话框一将“father”和“son”移 入变量框中,选择双侧检验,相关系数选择"person"一在选项对话框中选择 均值和标准差、叉积偏差和协方差一确定,得到表17:表17相关性父亲身高儿子身高父亲身高Pearson相关性1.703*显著性(双侧).011平方与叉积的和协方差儿子身高Pearson相关性显著性(双侧)平方与叉积的和协方差84. 6677. 69712.703*.01140. 3333. 6671240. 3333. 66712138.9173. 53812*.在0.05
28、水平(双侧)上显著相关-从表17中可看出,相关系数为0. 703>0,说明呈正相关,而相伴概率值 Sig.=0. 005<0. 05,因此应拒绝零假设(依:两变量之间不具相关性),即说明 儿子身高是受父亲身高显著性正影响的。6. 2偏相关分析偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对 其产生影响的变量,这种相关系数称为偏相关系数。例7-3实验步骤:选择菜 单“分析-相关-双变量”,打开“偏相关”对话框分把“hgrow”和“temp” 作为分析变量,“rain”、“hsun”、“humi”设为控制变量f确定,得到表18:表18相关性控制变量生长 量月平 均气 温
29、月降雨量& 月平均日照时 数&月平均 湿度生长相关性1.000.977量显著性*.000(双侧)df07月平相关性.9771.000均气温显著性.000(双侧)df70从表18可以看出,月降雨量、月平均日照时数和月平均湿度为控制变量, 生长量与月平均气温关系密切,偏相关系数为0. 977,双尾检测的相伴概率为 0. 000 (表示趋近于。的正数),明显小于显著性水平0.05。故应拒绝原假设, 说明中山柏的生长量与气温间存在显著的相关性。7回归分析7.1 一元线性回归分析线性回归假设因变量与自变量之间为线性关系,用一定的线性回归模型来 拟合因变量和自变量的数据,并通过确定模型参数来得到回归方程。根据自变 量的多少,线性回归可有不同的划分。当自变量只有一个时,称为一元线性回 归,当自变量有多个时,称为多元线性回归。例8-1实验步骤:作散点图,观察两个变量的相关性:依次选择菜单“图 形一旧对话框一散点/点状f简单分布”,并将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南省富民县2025年上半年事业单位公开遴选试题含答案分析
- 2025年度专业物流司机个人运输合同范本
- 2025仓储运输合同-跨境电商B2C物流配送服务
- 2025版新型城镇化示范区建设项目投标保证合同书
- 2025版蔬菜种植基地与旅游开发公司合作合同范本
- 2025版绿色有机农资采购合作协议
- 2025年度医疗器械委托运输与环保回收服务合同
- 2025版净身出户离婚协议书模板编制与风险评估合同
- 2025版砌砖工程节能评估与施工合同
- 2025版牲畜养殖企业承包与养殖废弃物处理合同
- 酒店应收挂账管理办法
- 精神病患者家属健康宣教
- 检验科尿常规讲解
- 咖啡服务培训课件
- 2025年广东省中考地理试题卷(标准含答案)
- 吉林省国资委监管企业招聘笔试题库2025
- 聚合工艺作业培训课件
- 千人相亲活动方案
- 消防避火服课件教学
- 土地法学教学课件电子教案课件
- 儿童银行开业活动方案
评论
0/150
提交评论