SPSS软件的使用之一.ppt_第1页
SPSS软件的使用之一.ppt_第2页
SPSS软件的使用之一.ppt_第3页
SPSS软件的使用之一.ppt_第4页
SPSS软件的使用之一.ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,Part:SPSS简介,2,SPSS软件的发展史,1968年:斯坦福大学三位学生创建了SPSS1968年:诞生第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时全球自SPSS11.0起,2002年,SPSS全称为“StatisticalProductandServiceSolutions”,即“统计产品和服务解决方案”,3,SPSS软件的发展史,2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(PredictiveAnalyticsSoftware)PASW,包括四部分:PASWStatistics(formerlySPSSStatistics):统计分析PASWModeler(formerlyClementine):数据挖掘DataCollectionfamily(formerlyDimensions):数据收集PASWCollaborationandDeploymentServices(formerlyPredictiveEnterpriseServices):企业应用服务2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBMSPSS字样,4,SPSS软件的特点,简便性:菜单操作兼容性:兼容中文数据、汉化、数据接口功能。功能性:具有丰富的统计分析功能,且针对性强。权威性:各领域广泛应用,结果具有权威性。,5,SPSS软件的运行方式,完全窗口菜单运行简单易用,操作方便!程序运行灵活丰富,最大程度发挥软件的效能!批处理运行在ProductionFacility中运行程序。Include命令可在系统菜单中嵌入用户自定义的命令(高级版本SPSS)。,6,SPSS软件的模块,7,SPSS操作界面,DataEditor:数据编辑器DataView:数据窗口VariableView:变量窗口OutputViewer:结果窗口,8,SPSS统计分析结果保存,Html网页文件格式:HtmWord格式:Doc文本格式:TxtExcel格式:Xls其它格式,9,SPSS帮助系统,Whatisthis?右击鼠标获取。Topics:点击帮助下拉菜单获取。对话框Help:点击对话框中的Help获取。语法帮助:点击帮助下拉菜单获取。其它帮助,10,Part:数据库的建立,11,数据资料的形式,主要有两种形式:原始资料:如调查问卷中的数据.已经录入成其它数据格式的资料:如Excel电子表格数据,需要将其内容读入SPSS中。,12,2.1:原始数据的录入,13,数据录入步骤,数据录入:将每个观察单位的每个观察指标的观察值录入SPSS数据库中。步骤:“三步曲”定义变量名指定变量属性录入数据,14,数据录入变量属性,变量名变量类型变量宽度小数位变量名标签变量值标签缺失值列宽数据对齐方式测量尺度,15,数据录入变量名的要求,首字符终须是字母或中文,不能是数字不能含有空格等非法字符不能以句点或“_”结尾不能超过64个字符同一个文件中变量名不能重复不能与SPSS保留字相同。ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH等,16,数据录入变量类型、标签,SPSS中变量有三种基本类型:数值型、字符型和日期型。数值型:标准数值、逗号数值、圆点数值、科学计数法、美元数值、用户自定义六种Label用于定义变量名标签,可以在输出结果中直接显示。Value用于定义变量值标签,输出结果中也可以显示。,17,数据录入测量尺度类型,分类尺度:仅对事物进行分类,不具运算意义。等级尺度:也对事物进行分类,但可以排序。定距尺度:用数值描述研究对象,可以进行加减运算,用于衡量不同类别之间的差距,但没能绝对“零点”,不能进行乘除运算。定比尺度:同样用数值描述研究对象,但有一固定的绝对“零点”,可以进行加减乘除运算。,18,数据类型,19,SPSS数据窗口中的行与列,每一行表示一条记录,记录一个观察单位(case)所有变量的信息。,每一列表示一个变量,记录所有观察单位某一个变量(race)的信息,20,多选题数据的录入,多选题(MultipleResponse):指对一个被调查对象,回答某一个问题时可以有多个选项。例如:请问贵校招聘人才的途径有哪些?请问您获取新闻的方式常用的有哪些?等等。多选题的数据录入方式多重二分法(multipledichotomymethod):即将多选题的每一个选项拆解成一个0-1变量,每个变量同等对待。多重分类法(multiplecategorymethod):根据所有调查对象实际具有的最多的选项数确定变量个数,每个变量的取值是多分类且为多选题所有可能的选项,每个变量同等对待。,21,多选题数据的分析,多选题录入后,在对该数据进行分析之前,必须先定义一个多选题集,然后才能把该定义该多选题数据的全部变量作为一个变量来进行分析!菜单操作:AnalyzeMultipleResponseDefineSets,22,2.1:外部数据的导入,23,导入外部数据的方法,对于SPSS格式的外部数据,只要点击FileOpenData,选择文件路径及文件名即可打开。对于非SPSS格式外部数据,导入的方式主要有三种:直接打开利用文本向导导入利用数据库ODBC接口导入,24,导入Excel数据,首先在Excel中打开数据文件,了解文件的结构:文件中包含几张数据表,想要读入哪一张;需要读入数据表中的哪些数据;第一行是否是变量名然后通过FileOpenData,选择文件类型”Excel”,直接打开文件。,25,导入Excel数据,26,导入文本(Text)数据,首先打开数据文件,查看文件结构:变量之间是固定宽度还是用某种分隔符区分;第一行是否是变量名;第一条记录从第几行开始;数据中的字符串变量是否使用了某种限定符进行分隔。SPSS可以通过两种菜单操作方式导入文本数据。1)FileOpenData,选择文件类型”Text”;2)FileReadTextData.,27,导入文本(Text)数据,28,导入文本数据Step1,29,导入文本数据Step2,分隔符分隔的文本文件:变量之间用符号(逗号,句号,空格,TAB键等)分隔。固定宽度的文本文件:每个变量在每一行中所占的列位置是固定。,30,导入文本数据Step3,31,导入文本数据Step4,32,导入文本数据Step5,33,导入文本数据Step6,34,从数据库中导入数据,SPSS可以直接导入很多类型的数据文件,对于不能直接打开的数据格式,SPSS提供了利用通用的数据库接口读取数据的方法。先配置ODBC,通过ODBC接口和数据库(以.MDB为例)进行连接:再在SPSS中打开数据库读取需要的数据:FileOpenDatabaseNewQuery,35,配置ODBCEPIInfo格式数据源,36,利用ODBC从外部读取MDB格式数据,Step1,37,Step2-3,利用ODBC从外部读取MDB格式数据,38,利用ODBC从外部读取MDB格式数据,Step4,39,利用ODBC从外部读取MDB格式数据,Step5,40,利用ODBC从外部读取MDB格式数据,Step6,41,获取外部数据的几点注意事项,变量名称原始数据文件中是否有变量名同一文件变量名称是否有重复变量名称是否符合SPSS规范变量属性建议导入外部数据后逐一修订变量属性。,42,2.3:数据保存,43,数据保存,FileSave,指定文件名和保存路径将文件保存为SPSS格式。FileSaveAS,在对话框中可选择保存变量,且可以选择数据的保存格式(xls,dbf,dat等非SPSS格式)。建议在录入和修改数据的过程中随时保存数据!,44,Part:数据库的整理,45,数据整理,数据整理是进行统计分析之前必不可少的步骤。目的有二:发现数据的错误、识别异常值及探索数据的基本特征;从变量或文件的层次对数据结构进行调整,使数据能直接应用于统计分析。在SPSS软件中,数据文件的管理功能集中于Transform和Data两个主菜单之下,但数据整理过程中通常会涉及对数据进行描述性统计分析,所以整数整理也涉及Analyze菜单中的DescriptiveStatisitcs模块。,46,数据整理数据的预处理,数据的审核发现数据中的错误查找重复记录识别异常值等数据文件的合并及新变量的产生缺失值替代数据的筛选:找出符合条件的数据数据的排序:发现数据的基本特征,47,数据审核,对于原始数据,主要从完整性和准确性两个方面进行审核。对于二手数据,除了审核其完整性和准确性外,还应着重审核数据的适用性和时效性。,48,数据审核探索性分析,49,探索性分析实例,50,探索性分析主界面,51,探索性分析对话框,52,探索性分析对话框,53,探索性分析结果,54,探索性分析结果,55,文件的合并(Merge)及新变量的产生,文件的合并分为纵向合并和横向合并两种情形。纵向合并,即追加记录(AddCases),往往要求文件的数据结构相同。横向合并,即增加变量(AddVariables),往往要求两个文件同时包含一个相同的变量(匹配变量)。利用Transform主菜单中的Compute功能产生新变量。,56,缺失值替代,在数据收集过程中,由于研究者或研究对象的原因,往往无法获得某些观察对象某些变量的取值,造成了变量取值的缺失。为保持数据的完整性,往往要求对研究对象进行重新观察来获取变量的取值并代替缺失值,但实际工作中大多数情况下无法实现这种重新观察。此时,可以借用统计学的方法来估计或替代变量的缺失值,SPSS软件的Transform菜单中提供了替代缺失值的功能模块。TransformReplaceMissingValues,57,数据的筛选,对审核过程中发现的错误应尽可能予以纠正,如果错误无法纠正,或有些数据不符合分析要求而又无法弥补,或只有部分数据符合分析要求时,就要对数据进行筛选。DataSelectCases,58,数据排序,数据排序有利于研究者通过浏览数据发现一些明显的特征或趋势,还有助于对数据检查和纠正错误,同时还为分组等提供方便。在某些场合,排序本身可能就是分析的目的之一。,59,SPSS中变量层次的数据整理菜单,计算新变量:Compute变量转换:Recode、VisualBander、Count、RankCases、AutomaticRecode专用过程CreateTimeSeriesReplaceMissingValuesRandomNumberSeed,60,SPSS中文件层次的数据整理,变量与数据属性简单命令:插入变量、记录;到达某条记录简单过程排序、拆分文件、选择和加权记录数据转置数据重构数据汇总查找重复记录产生无交互作用的正交设计表,61,文件层次的数据整理数据汇总,分类汇总:按指定的分类变量对观察值进行分组,对每组记录的各变量计算指定的描述性统计量,结果可以存入到新数据文件,也可直接替换当前数据文件。分类汇总的步骤:选择dataAggregate,指定分类变量和汇总变量选择计算汇总变量的描述性统计量将汇总结果保存到指定的文件中分类汇总产生的数据文件的记录数取决于分类变量的取值个数,分类变量可以指定多个。,62,文件层次的数据整理查找重复记录,选择DataIdentifyDuplicateCase,在Definematchingcasesby框内选入希望查找重复取值的变量。Sortwithmatchinggroupsby框内设定重复的记录按照哪个变量的取值进行排序。Indicatorofprimarycases框内设定每一组重复的记录中第一或最后一个为主记录。结果窗口中还会给出对本次操作产生的新变量的汇总信息。,63,文件层次的数据整理纵向合并文件,SPSS中纵向合并的条件待合并的两个数据文件其内容合并是有意义的;两文件的变量名全部相同两文件的变量属性全部相同先打开一个需要合并的文件作为当前文件,然后选择DataMergeFileAddCases两个文件中共有的变量名会自动对应匹配,并出现在VariablesinNewWorkingDataFiled框中。在UnpairedVariables框中是无法自动对应匹配的变量,需要手工选择变量名后点击“pair”按钮强行配对,并将其选入VariablesinNewWorkingDataFiled框中。,64,文件层次的数据整理横向合并文件,横向合并的条件:如果不是按照记录号对应的规则进行合并,则两个文件必须至少有一个变量名相同的公共变量,这个变量是两个文件合并的依据,也称为关键变量。如果是使用关键变量进行合并的对应变量,两个数据文件都必须按关键变量进行升序排列。在不同数据文件中,除关键变量外,不应出现相同的变量名。,65,文件层次的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论