




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一 SPSS基本操作入门运用SPSS进行数据分析的基本步骤: 1、 进入SPSS界面,界面介绍: SPSS 统计软件的主菜单及子菜单主菜单File文件Edit编辑View视图Data数据Transform转换Analyze分析Graphs统计图Utilities自定义菜单项(下拉菜单)New新文件Undo撤销Status Bar状态条Define Dates定义日期Compute通过计算建立新变量Reports数据报告Gallery图库Variables变量Open打开Redo重复Toolbars工具条Insert Variable插入变量Random Number Seed产生随机数Descriptive Statistics描述性统计Interactive交互式的File Info文件信息Open Database打开数据库Cut剪切Fonts字体Insert Case插入样品Count计数Compare Means比较均值Bar条形图Define Sets定义变量集Data Capture获取数据Copy复制Grid Lines格线Go to Case定位样品Recode再编码General Linear Model一般线性模型Line线图Use Sets使用变量集Read Text Data读取文本数据Paste粘贴Value Labels值标签Sort Cases样品排序Categorize Variables将变量类别化Correlate相关Area面积图Run Script运行脚本Save保存Paste Variable粘贴变量名Transpose行列转置Rank Cases求样品的秩Regression回归Pie饼图Menu Editor菜单编辑器Save As另存为Clear清除Merge Files合并文件Automatic Recode自动编码Loglinear对数线性High-Low高低图Display Data Info显示数据信息Find寻找Aggregate汇总Create Time Series创建时间序列Classify聚类与判别Pareto帕雷托图Apply Data Dictionary应用数据字典Option选项Split File分割文件Replace Missing Values替换缺失值Data Reduction简化数据Control控制图Print打印Select Cases选择样品Scale测量分析Box Plot箱图Print Preview打印预览Weight Cases给样品加权Nonparametric Tests 非参数检验Error Bar误差图Exit退出Survival生存分析Scatter散点图Multiple Response多选项分析Histogram直方图2、定义变量单击Variable View,进入变量编辑窗口,依次对所数据的名称、类型、宽度、小数点位数、标签等分别进行定义,做好数据输入准备工作。3、输入数据(略)4、保存数据(略)5、预分析 目的:探测数据究竟是否适合使用某种统计分析方法 (1)简单描述描述数据的基本情况,包括集中趋势和离中趋势。调用描述统计分析过程。(2)图形描述统计指标只能给出数据的精确指标,但无法直观的体现分布情况,通常通过绘制统计图形来显示数据是否基本上呈正态分布。6、统计分析 结合题目要求以及预分析结果选择合适的统计分析方法。7、保存和导出结果 一般选择保存结果文件或者是导出结果 保存结果文件:FileSave ,输出结果表现为*.SPO类型 导出结果: 右键Export二 频数分析与直方图摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和2 检验。1 主要功能调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。2 用SPSS进行统计实例操作例1 (P74)新大学毕业生工资,试作频数分析和画出直方图。2.1 数据准备激活数据管理窗口,定义工资的变量名为X,然后输入成绩的原始数据,并保存。2.2 统计分析点击Analyze菜单,选Descriptive statistics中的Frequencies.命令项,弹出Frequencies对话框。现欲对工资进行频数表分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框。同时可点击Format.钮弹出Frequencies:Format对话框,在Order by栏中有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。在Page Formal栏中可定义结果输出的格式。本例选Ascending values项后点击Continue钮返回Frequencies对话框。点击Statistics.钮,弹出Frequencies:Statistics对话框,可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击Continue钮返回Frequencies对话框。点击Charts.钮,弹出Frequencies:Charts对话框,用户可选两种图形,一是直条图(Bar chart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量x绘制直方图,故选择Histogram项,并要求绘制正态曲线(With normal curve),点击Continue钮返回Frequencies对话框,再点击OK钮即可。2.3 结果解释在输出结果窗口中将看到如下统计数据:各基本统计指标,其中均数为1151.55, 标准误为20.589, 中位数为1160.00, 众数为1160, 标准差为144.123, 方差为20771.419,全距为730, 最小值为850, 最大值为1580, 25%位数为1060.00, 50%位数为1160.00, 75%位数为1225.00,共49个观察值,缺失值51。Mean 1151.55 Std err 20.589 Median 1160.00Mode 1160 Std dev 144.123 Variance 20771.419Range 730 Minimum 850 Maximum 1580 Percentile Value Percentile Value Percentile Value 25.00 1060.00 50.00 1160.00 75.00 1225.00Valid cases 49 Missing cases 51接着输出系统对变量x的原始数据作频数分布表,Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Valid percent为各组频数占总例数的有效百分比、Cum Percent为各组频数占总例数的累积百分比。(表略)最后系统输出带有正态曲线的直方图,由图中可见,数据基本呈现正态分布形状。图4 频数分布的直方图从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在815组的要求不符。为此,在调用Frequencies过程命令之前,可先对原始数据进行算术处理:已知最小值为850,最大值为1580,全距为730,故可要求分成8组,起点为849,组距为100。选Transform菜单Recode项的Into Different Variable.命令项,在弹出的Recode Into Different Variable对话框中选x点击使之进入Numeric VariableOutput Variable框,在Output Variable栏的Name处输入x1,点击Change表示新生成的变量名为x1。点击Old and New Values弹出Recode Into Different Variable:Old and New Values对话框,在Old value栏内选Range项,输入第一个分组的数值范围:849949,在New value栏内输入新值:899,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击Continue钮返回Recode Into Different Variable对话框,再点击OK钮即完成。系统在原数据库中生成一新变量为x1,这时调用Frequencies过程命令将输出等距分组且组数为8的频数分布表。(若已有频数分布表,可用加权的方式输入数据:dataweight)3. 用EXCEL进行统计分析实例为P43页表3.8学生成绩,把学生成绩输入到EXCEL中的A列(A2:A37),并对成绩数据进行排序。31分组311按照排序结果计算全距,确定数据项数、组数、组距和组限。本例全距A37-A2=98-49=49,数据项数36,可分5组,组距=全距/组数=59/510。组限依次为:60以下,6070,7080,8090,90100。312在B1和B2输入“按成绩分组(分)”,在B3至B8依次输入“60以下,6070,7080,8090,90100,合计”。由于FREQENCY 函数要求按上限分组,其统计结果是包括上限不包括下限,并且输入n个组限会给出n+1个组。所以在B10至B13输入组限“59.5,69.5,79.5,89.5”。在C1、D1输入“次数”,在E1、F1输入“向上累计”,在G1、H1输入“向下累计”。在C2、E2、G2输入“人数(人)”,在D2、F2、H2输入“比重(%)”。选定C3至C7作为放置分组结果区域。然后,从“插入”菜单中选择“函数”,在弹出的“插入函数”对话框中点击“选择类别”栏中的下拉箭头,选择“统计”,再在“选择函数”栏中选择“FREQURNCY”函数,单击确定进入“FREQURNCY”函数参数设置对话框。313在Data_array文本栏中输入待分组的原始数据区域,本例为“A2:A37”; 地Bins_array 栏中输入组限,本例为“B10:B13”。最后按Shift+Ctrl+Enter组合键,即得各组频数结果。314计算次数比重和累计次数、累计比重。直接利用公式再加填充柄即可。32画直方图单击“插入”出现“图表导向”对话框,单击下一步出现“数据区域”对话框,在“数据区域”中输入次数数据区域,本例为C3:C7,单击下一步,便出现图形。然后右击直方体内,出现“数据系列格式”对话框,点击“选项”把“分类间距”调整为0就可以得到不留空隙的直方图。33进行描述性分析321计算平均数、标准差、方差、调和平均数、众数、中位数、最大值、最小值等统计量的方法。先输入数据,其次点击存放结果的单元格。接着点击“插入/函数/统计/要计算的统计量名称(英文)”,然后选择数据区域后点击确定即可。1计算平均数的统计方法:插入/函数/统计/AVERAGE;2标准差:插入/函数/统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国希伯胺原料药行业市场分析及投资价值评估前景预测报告
- 核电电焊工考试题及答案
- 2025年中国无线垂直鼠标行业市场分析及投资价值评估前景预测报告
- 用户行为分析-第149篇-洞察与解读
- 肿瘤免疫治疗专利布局-洞察与解读
- 2025国考常州市生态保护岗位申论必刷题及答案
- 2025国考福建金融监管局行测数量关系预测卷及答案
- 2025国考廊坊市法律事务岗位申论题库含答案
- 2025国考人社部行测数量关系易错点
- 2025国考丹东市纪检监察岗位行测题库含答案
- 创伤止血包扎培训课件
- 疥疮的预防及护理
- 高三英语人教版一轮复习复习课应用文写作信课时2教学设计
- 胎儿宫内生长发育监测-洞察分析
- 《个案工作》(第2版)笔记和课后习题详解
- 《生产者责任延伸制》课件
- 特殊教育教师聘用协议样本
- 电力技术监督管理制度汇编【全套范本】
- 人教版四年级上册数学第三单元《角的度量》测试卷附答案(能力提升)
- 肾结石的医学影像诊断与治疗
- 钻探工程考试真题单选题100道及答案解析
评论
0/150
提交评论