




已阅读5页,还剩73页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS统计软件,主讲:刘文平,Dept.ofStatisticsHubeiUniversityofEconomics,Lecture2数据输入,1,第二章数据管理,本章主要介绍了SPSS的数据输入、数据编辑整理以及数据保存。,2,数据输入,主要内容:数据文件建立、变量定义和数据录入;数据文件直接读入;数据库查询导入;文本向导导入。,3,方法一:进入SPSS系统后,单击Ok或Cancel;方法二:选择菜单”FileNewData”.,数据文件建立、变量定义和数据录入,数据文件的建立,4,单击标签栏中的”VariableViewer”,即切换到变量定义窗口。,定义变量,5,说明:Name:变量名称,总长度不超过64个字符(32个汉字)。Type:变量类型,主要有以下几种类型:Numeric:数值型Comma:加逗号的数值型Dot:三位加点的数值型ScientificNotation:科学记数型Date:日期型String:字符型Dollar:货币型CustomCurrency:用户自定义型,6,1、Numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数(DecimalPlaces),默认为2位。2、Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型。3、Dot:3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为12.345,00(实际是12345E-4).4、Scientificnotation:科学记数型,同时定义数值宽度(Width)和小数位数(DecimalPlaces),在数据管理窗口中以指数形式显示。如定义数值宽度为9,小数位数为2,则345.678显示为3.46E+02。5、Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。6、Dollar:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有。7、Customcurrency:常用型,显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。8、String:字符型,用户可定义字符长度(Characters)以便输入字符。,7,1、Nomissingvalues:没有缺失值;2、Discretemissingvalues:表示对不连续缺失值,可定义1-3个。如测量身高(厘米)的资料,可定义999为缺失值;性别的资料(男为1、女为2),可定义1为缺失值;3、Rangeofmissingvalues:可定义缺失值的范围。如脉搏资料,可定义09为缺失值;4、Rangeplusonediscretemissingvalue:可定义缺失值的范围,同时定义另外1个不是这一范围的缺失值。如定义09为脉搏的缺失值,同时定义999也为脉搏的缺失值。,关于缺失值,8,作业,建立如下的数据文件:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者group1:0.841.051.201.201.391.531.671.801.872.072.11健康人group2:0.540.640.640.750.760.811.161.201.341.351.481.561.87,9,提示(Tips),在数据视窗的变量名栏双击即可回到变量视窗,且焦点在该变量上;在各种向导里面右击相应项,可显示相应的帮助。,10,数据输入,数据直接输入;数据直接拷贝;使用Copy和Paste命令。数据文件直接读入直接读入;数据库查询导入;文本向导导入。,11,数据文件直接读入,数据库查询读入,12,数据库查询导入,1.选择菜单”File-OpenDatabase-NewQuery”,则数据库查询向导弹出如下窗口:,13,2.单击“下一步”,弹出如下所示窗口,要求输入数据库文件,可直接输入,也可单击”Browse”按钮选择。,14,3.单击”OK”按钮,数据库弹出如下窗口,要求从输入的数据库文件中选择数据表。从数据表中选择需要检索的字段。,15,4.单击“下一步”,向导弹出如下窗口,用于设置检索条件。,16,单击”PromptforValue”弹出的对话框,17,5.单击“下一步”,向导弹出如下窗口,用于进行变量的重新定义。,18,6.单击“下一步”,向导弹出如下窗口,显示前述过程对应的查询SQL语句。可在下面的编辑框内输入该查询的保存地址。,19,7.单击“完成”,即完成了数据库的导入操作,其数据将显示在SPSS的表格内容区。,20,文本向导导入,SPSS12.0版本已经打开文本格式数据文件功能整合到菜单”File-Open-Data”中,但为了和老版本的使用上保持兼容,设置了专门的文本格式文件打开菜单”File-ReadTextData”.但二者并没有任何使用上的不同。下面简要说明其操作过程。,21,1.选择菜单”File-ReadTextData”or“File-Open-Data”,弹出如下窗口。,设置文本文件和预定义格式,22,2.单击“下一步”,弹出如下窗口。,设置变量,23,3.单击“下一步”,弹出如下窗口。,导入和存储记录,24,4.单击“下一步”,弹出如下窗口。,选择分隔符,25,5.单击“下一步”,弹出如下窗口。,更改变量名和类型,26,6.单击“下一步”,弹出如下窗口。,保存文件,27,设置完成的最终结果,7.单击“完成”按钮完成设置,得到结果如下。,28,连续多个相同值的输入如group变量有连续多个1,如果直接输入,可以在第一格内输入1并回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所有应输入1的单元格,单击右键并选择paste,所有选中的单元格就会都被刚才拷贝的1填充。将EXCEL数据直接引入SPSSExcel已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名),然后选择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。,数据录入技巧,29,EndoftheLecture2,30,SPSS统计软件,主讲:刘文平,Dept.ofStatisticsHubeiUniversityofEconomics,Lecture3数据编辑整理,31,数据的增删,增加一个新变量(列);增加一行数据;增加新的单元格;删除一个变量(列);删除一行数据;删除一个单元格。,主要有:,32,增加一个新的变量(列)例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则有如下的两种方法:方法一、先激活第2列的任一单元格,然后选Data菜单的InsertVariable命令项;方法二、右击第2栏的变量名,则会弹出一个菜单(见下页图),选择InsertVariable即可。系统自动为用户在第2列前插入一个新的变量列,其名称是缺省的如Var00001,原第2列自动向右移一列成为第3列。,33,右击变量名栏弹出的菜单,34,增加一行例如要在第6行前增加一行,使原来的第6行下移成为第7行,则有如下两种方法:方法一、先激活第6行的任一单元格,然后选Data菜单的InsertCases命令项;方法二、在第6行行头右击(见下页图),在弹出的菜单中选择InsertCases。系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。,35,右击行头弹出的菜单,36,增加一个新的单元格(观察值),例如由于输入错误,造成第7个观察单位的第4个变量值漏输,结果第8个观察单位的第4个变量值误为第7个观察单位的第4个变量值,这样的情形使得数据管理器中的第4个变量值从第7行起全部上移,而合计例数少一个。于是希望在第7行的第4列处插入1个单元格,原有数据依次下移恢复正常。可先将鼠标指向在第7行第4列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第4列从第7行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第8行第4列交叉处的单元格,选Edit菜单的Paste命令项,可将剪贴板中的原第7行起的所有数据下移自第8行开始,并空出第7行第4列的单元格以便补入漏输的数值。,37,38,删除一个行例如要删除第9行,则可先点击第9行的行头,这时整个第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,或者在右击行头后弹出的菜单中选择Clear,该行即被删除。,39,删除一个变量(列)例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中,然后按Delete键或选Edit菜单的Clear命令项,或在右击变量名栏弹出的菜单中选择Clear,该列即被删除。,40,删除一个单元格(观察值)例如由于输入错误,造成第6个观察单位的第2个变量值重复输入,结果第7个观察单位的第2个变量值误为第6个观察单位的第2个变量值,第8个观察单位的第2个变量值误为第7个观察单位的第2个变量值,这样的情形使得数据管理器中的第2个变量值从第7行起全部下移,而合计例数多一个。于是希望将第7行第2列的单元格删除,原有数据依次上移恢复正常。可先将鼠标指向在第8行第2列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第2列从第8行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第7行第2列交叉处的单元格,按Del键删除该单元格的数值,选Edit菜单的Paste命令项,可将剪贴板中的原第8行起的所有数据上移自第7行开始,既填补第7行第2列的单元格,又恢复原有下移的数值。,41,42,变量重新赋值,在数据编辑窗口中,用户可对各单元的数值重新赋值,但这种操作适用于数值型和字符型变量。同时,变量赋值需在同类型变量之间进行,不能将字符型变量数据赋值给数值型变量。选择菜单”Transform-Recode”,此时有两种选择:1.对变量自身重新赋值(IntoSameVariables);2.对其他变量或新生成的变量赋值(IntoDifferentVariables);,43,对变量自身重新赋值,1.选择菜单”Transform-Recode-IntoSameVariables”,则弹出如下的对话框。,44,2.在对话框变量名列表框中选一个或多个变量,单击按钮使之进入”NumericVariables”框;3.点击”OldandNewValues.”按钮弹出“RecodeintoSameVariables:OldandNewValue”对话框,用户根据实际情况确定旧值和新值,点击Continue钮返回,再点击OK钮即可。,45,4.在“RecodeIntoSameVariables”对话框中,单击“If”按钮,则弹出一个对变量自身赋值的条件对话框如图。单击“Continue”按钮返回。,5.单击“OK”按钮,即完成对变量自身赋值。,46,对其他变量或新生成的变量赋值,1.选择菜单”Transform-Recode-IntoDifferentVariables”,则弹出如下的对话框。在左侧变量名列表框中选择一个或多个进入“NumericVariable-OutputVariable”框。,47,2.在“OutputVariable”框确定一赋值变量(可以是数据编辑窗口已有的变量,也可以是新变量),单击“Change”按钮,本例将生成一个新变量“hello”.,48,3.点击”OldandNewValues.”按钮弹出“RecodeintoDifferentVariables:OldandNewValue”对话框,用户根据实际情况确定旧值和新值,点击Continue钮返回。,49,4.若需设置条件,点击”If”即可,则弹出如下窗口,设定后单击“Continue”返回。,50,5.点击OK钮即完成了对其他变量或新变量的赋值。,51,数据的运算与新变量的生成,当数据文件建立后,往往需要根据某种条件从原有变量计算新变量。选择菜单“Transform-Compute”,弹出如下的对话框,可对选定的变量进行运算操作,也可生成新变量,但这种操作仅仅适用于数值型和字符型。,52,在“TargetVariable”中指定一个变量(可以是已有变量,也可以是新变量),本例输入“hello2”.在”NumericExpression”中输入表达式。,53,单击“Type&Label”按钮可设置变量的标签,弹出的窗口如下。设置完毕单击“Continue”返回。,54,3.在“RecodeIntoSameVariables”对话框中,单击“If”按钮,则弹出一个对变量自身赋值的条件对话框如图。单击“Continue”按钮返回。,55,.完成所有设置后单击“OK”按钮,即完成对变量自身赋值。,56,变量的加权变换,适用范围:数值变量大于0的数值按变量的实际值加权,0、负数或缺失值的加权被排除在加权为0。,57,数据排序,选Data菜单的SortCases.命令项,弹出SortCases.对话框,在变量名列框中选1个需要按其数值大小排序的变量(用户也可选多个变量,系统将按变量选择的先后逐级依次排序),点击钮使之进入Sortby框,然后在SortOrder框中确定是按升序(Ascending)或降序(Descending),点击OK钮即可。,58,数据的行列互换,选Data菜单的Transpose.命令项,弹出Transpose.对话框,在变量名列框中选1个或多个需要转换的变量,点击钮使之进入Variable(s)框,再选择某个变量到”NameVariable”编辑框中,作为给新的列变量命名的依据。再点击OK钮即可。,59,产生的新数据会在第1列出现一个case_lbl新变量,用于放置原来数值的变量名,同时产生一个结果输出窗口,说明行列互换操作菜单的有关设置以及有关结果输出的说明。若要将数据再转换回原来的排列方式,方法与上述过程相同。,60,注意事项:1、在行列互换的对话框中,如果没有选择所有变量,则单击“ok”会弹出一个窗口,提示原数据文件会损失信息。2、“NameVariable”编辑框输入的变量,如果该变量是字符型,则其变量值作为新的变量名;若是数值型,则新变量名以开始,后面是该变量数值。,61,变量组段划分,适用范围:数值变量功能:对变量值的组段划分,即选定一个或多个变量,对每个变量的取值分别按某种方式分成一定数目的组段,最后结果是针对每一个参加组段划分的变量生成一个新变量,记录该变量每一个取值所在的组段。这是12.0版本的新功能。实现方法:1、选择菜单“TransformVisualBander”,会弹出一个选择变量参与组段划分的对话框,如下页。,62,63,2、选择变量进入“VariablestoBand”列表框,下面的复选框设定参与分析的记录数目,本例略。3、单击“continue”,探出一个新的“VisualBand”对话框。,64,4、在“ScannedVariableList:”列表框中选中变量,右侧的很多编辑框被激活,在编辑框“Banded”中输入某个新变量的名称,记录对应变量进行组段划分的结果。5、单击右下侧的“MakeCutpoints”,弹出一个组段划分方法对话框,如图。,65,6、从对话框中可以看出有三种划分方法:方法一:等间距划分(EqualWidthInter)FirstCutpoint:第一组段的上限Width:组段宽度Number:组段数目方法二:等样品数划分(EqualPercentilesBasedonScannedCases)Numberofcutpoints:断点数目Width:每一个组段样品数占总样品的百分数方法三:基于变量的均值和标准差来划分有三个复选框,全选则产生8个组段,全不选则只有两个组段,任选一个则产生4个组段,任选两个则产生6个组段。,66,67,68,数据文件的合并(MergeFiles),1.从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用AddCases对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单Data=MergeFiles=AddCases,系统首先弹出打开数据文件对话框,选中需要添加的数据文件并按OK,系统才弹出AddCases对话框,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicatecasesourceasvariable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。,69,数据文件的合并(续),2.从外部数据文件增加变量到当前数据文件,称为横向合并,用AddVariable对话框完成,相互合并的数据文件中应包含同样的记录。选择菜单Data=MergeFiles=AddVariable对话框,系统同样先弹出打开数据文件对话框,单击OK后弹出和前面相似的AddVariable对话框。按需选择即可。,70,分类汇总(Aggregate),所谓分类汇总就是按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。BreakVariables框:用于选择分组变量;AggregateVariables框:用于选择被汇总的变量;Name&Label钮:用于定义新产生的汇总变量的名称和标签;Function钮:用于定义汇总函数;SaveNumberofcasesinbreakgroupasvariable复选框:用于定义一个新变量以存储同组的记录数;Createnewdatafile单选钮:定义一个新文件以存储汇总的结果,右侧的File钮用于具体文件名的定义,默认文件名为AGGR.sav;Replaceworkingdatafile单选钮:用汇总的结果替换原来的数据。,71,SplitFile对话框,用于将数据文件分组进行处理,该对话框我们在第一章时已经使用过了,这里再介绍一下各个对话框元素的用途:Analyzeallcases单选框:和下面的两个单选框为一组,选中本框不拆分文件;Comparegroups单选框:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较;Organizeoutputbygroups单选框:按所选变量拆分文件,各组分析结果单独放置;Groupsbasedon框:用于选择拆分数据文件的变量;Sortthefilebygroupingvariables单选框:将数据按所用的拆分变量排序;Fileisalreadysorted单选框:数据保持原状,不按所用的拆分变量排序。,72,SelectCases对话框,很多时候我们不需要分析全部的数据,而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前200个数据进行分析以了解大概情况),这时使用SelectCases对话框可以大大简化工作。该对话框界面如下所示:,73,74,其中主要的对话框元素为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 骨盆矫正的题目及答案
- 技术知识培训内容课件
- 2024年湖南省长沙市中考语文真题及答案解析
- 2025年全媒体理论考试题及答案
- 2025年山东数学高考试题及答案
- 食品药品考试试题及答案
- 山西地理中考试题及答案
- 恐惧不安课件
- 施工吊装考试题目及答案
- 急诊科护士教学课件
- 建筑培训教学课件
- 2025沈阳各区县(市)工会公开招聘工会社会工作者数量考试参考试题及答案解析
- 中公协议班协议书照模板
- 学习乐理音程课件
- 2025年叉车操作证考试题库及答案
- 市妇幼保健院关于调整实验室生物安全管理委员会的通知
- 爆破安全培训课件
- 亚麻籽油在化妆品配方的应用研究
- 管线物探基本知识培训课件
- 企业负责人施工现场带班检查记录
- 财务岗招聘笔试题目及答案
评论
0/150
提交评论