SPSS试验1,文件建立_第1页
SPSS试验1,文件建立_第2页
SPSS试验1,文件建立_第3页
SPSS试验1,文件建立_第4页
SPSS试验1,文件建立_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试验1,文件建立与编辑与处理1试验内容p建立数据文件p保存数据文件p变量的定义p数据的录入与编辑1一、 建立数据文件n直接打开n使用数据库查询打开n使用文本导入向导1直接打开 File=Open=Data 或直接单击快捷工具栏上的“ ”按钮, 2 系统就会弹出Open File对话框, 单击“文件类型”列表框 3 选中需要打开的文件 SPSS能打开的常见的格式:1SPSS能打开的常见的格式:直接打开pSPSS格式文件,扩展名.savpExcel格式文件,扩展名.xlspdBase格式文件,扩展名.dbfpSAS格式文件,扩展名.sas7bdatp文本格式文件,扩展名.txt,.dat1文件类型

2、及扩展名说明SPSS(*sav)SPSS数据文件SpssPC+ (*sys)SPSS早期版本数据文件Systat(*syd),(*sys)Systat数据文件Spss Portable(*por)SpssPortable数据文件Excel (*xls)Excel文件Lotus (*W*)Lotusl23x.0(wk3)格式数据文件Sylk (*slk)SYLK(符号链接)格式文件Dbase (*dbf)dBase数据库文件SAS Long File Name (*sas 7bdat)SAS长文件名数据文件SASS hort File Name (*sd7)SAS短文件名数据文件SAS v6 f

3、or Windows (*sd2)SAS v6 for Windows数据文件SAS v6 for Unix (*ssd01)SAS v6 for Unix数据文件SAS Transport (*xpt)SAS Transport数据文件Txt (*txt)文本文件Dat (*dat)Tab分隔符数据文件1 File=Read Text Data 2 系统就会弹出Open File对话框, 单击“文件类型”列表框3 选中需要打开的文件 使用文本导入向导1二、保存数据文件 SPSS支持的数据格式p SPSS格式(.sav)p Excel格式(.xls)p dbf格式(.dbf)p 文本格式(.d

4、at)1保存数据文件2 步骤(1)File =Save或Save as(2)选择存放文件的目录途径 和数据文件的文件名,数据文件的格式pVariable: 保存为SPSS文件时可用 指定保存那些变量pWrite variables names to spreadsheet: 保存为Excel文件时可用,指定是否将 SPSS变量名写入Excel工作表第一行1File菜单中的其他条目【Disp Data File Info】该菜单项用于显示数据的基本信息【 Mark File Read Only】标记数据为只读1【Cache Data】建立数据缓冲区【Print和Print Preview】 这两

5、个菜单项用于将数据管理窗口中的数据以表格的形式打印出来【Stop Processor】用于停止执行当前的SPSS命令。File菜单中的其他条目【Switch Server】切换服务1 定义变量名定义变量名 定义变量类型与宽度定义变量类型与宽度 定义变量的变量标签定义变量的变量标签 定义变量的数值标签定义变量的数值标签 定义变量的缺失值定义变量的缺失值 定义变量的显示格式定义变量的显示格式 定义变量的测度类型定义变量的测度类型三 变量的定义( Variable View)1定义变量名 Name SPSS 变量名由不多于变量名由不多于64(32个汉字个汉字)个字符组成个字符组成 首字母是字母或汉字

6、首字母是字母或汉字 不能使用不能使用?, !和和 * 注意不能以下划线注意不能以下划线_和圆点和圆点“.”作为变量名的最作为变量名的最后一个字符后一个字符变量命名原则1定义变量名 变量名不能与变量名不能与SPSS 保留字相同保留字相同,SPSS 的保的保留字有留字有ALL, AND ,BY, EQ, GE, GT, LE, LT, x d NE, NOT, OR, TO, WITH 不区分变量名的大小写不区分变量名的大小写,如如ABC 和和abc 被认被认为是同一个变量为是同一个变量 SPSS有默认的变量名有默认的变量名,如如VAR000011变量类型变量类型 TypeType1变量类型变量类

7、型 TypeTypeo 数值型 (1)标准型(Numeric)u默认类型u默认最大宽度为8位u若默认最大宽度大于8位,按自动科学记数法显示u例: 26 38.4由阿拉伯数字(09)和其他特殊符号(如美元符号,逗号,圆点)组成1变量类型变量类型 TypeType(2)科学记数法型 Scientific Notationu表示特大或特小的数字u如1.23E18, 2.56E-161变量类型变量类型 TypeType(3)逗号型 Commau从个位开始每3位以逗号分割u如1,234.56u默认最大宽度为8,小数位21变量类型变量类型 TypeType(4)圆点型 Commau从个位开始每3位以圆点分

8、割u如1.234.56u默认最大宽度为8,小数位21变量类型变量类型 TypeType(5)美元符号型 Dollaru表示货币数据,在数据符号前加$u显示符号很多如 $ #1变量类型变量类型 TypeTypeo 字符型 Stringu默认最大宽度为8位,不能进行算术运算,区分大小写字母u字符不能超过指定的长度1变量类型变量类型 TypeTypeo 日期型 Date表示日期或时间如:25-AUG-1999 08/25/19991变量名标签变量名标签 LableLableu对变量取值含义进一步解释说明u 例如: 变量名 变量标签 W weight或体重 H Height或身高1变量值标签变量值标签

9、 Value LablesValue Lablesu对变量取值含义进一步解释说明u 例如 变量 值 值标签 Sex f Female m Male1缺失数据缺失数据 MissingMissingu说明缺失数据的基本方法指定用户缺失值u 用户缺失值可以是 字符型或数值型变量 -1至3个特定的离散值 数值型变量-一个连续的闭区间加一个区间以外的离散值 1度量尺度度量尺度 MeasureMeasureu 定距型数据定距型数据 Scale,可为数值型变量 如:身高体重u定序型数据定序型数据 Ordinal: 具有内在大小或高低顺序,可为数值型变量或字符型变量 如:年龄段变量u定类型数据定类型数据 No

10、minal:一般以数值或字符表示的分类数据, 可为数值型字符型变量 如:性别变量1其他pWidth:宽度pDecimals:小数位pColumns:变量列宽pAlign:变量的对齐方式1变量定义的浏览变量定义的浏览实用程序实用程序 变量变量1四四 数据的录入数据的录入Data ViewData View u黑框框住的单元为当前数据单元u数据录入可以逐行进行,录完后按Tab 数据录入可以逐列进行,录完后按Enteru录入带有变量值标签的数据可以通过下拉 按钮完成,但应首先打开变量值标签的显示 开关: 视图 自定义变量视图1数据编辑功能表(数据编辑功能表(Edit菜单)菜单)命令命令功能功能Und

11、o删除刚输入的数据或者恢复刚修改的数据Redo恢复刚撤消的操作Cut将选定数据剪切到剪贴板Copy将选定数据拷贝到剪贴板Paste将剪贴板的数据粘贴到指定位置Clear清除选定的变量和观测值Find查找数据五 数据的编辑 1练习1:体检资料编号姓名性别文化程度出生日期体检日期身高(cm)体重(kg)疾病1李珍女高中1966年12月8日2004年8月10日15855健康2赵小英女大学1977年4月18日2004年8月12日15545支气管炎3王清男初中1953年5月6日2004年8月14日17368心脏病建立一个数据文件1V Va ar ri ia ab bl le e I In nf fo o

12、r rm ma at ti io on n1编号Nominal8RightF2F22姓名Nominal8LeftA10A103性别Nominal8LeftA1A14文化程度Ordinal8RightF1F15出生日期Scale8RightEDATE8EDATE86体检日期Scale8RightADATE8ADATE87身高Scale8RightF8F88体重Scale8RightF8F89疾病Nominal8RightF2F2VariablebhxmxbwhcdcsrqtjrqsgtzjbPositionLabelMeasurementLevelColumn Width AlignmentPr

13、int Format Write FormatVariables in the working fileVariable ValuesVariable Values女男初中高中大学健康支气管炎心脏病Valuefmxb123whcd012jbLabel1六、数据文件的处理六、数据文件的处理(一一)Data菜单n Data菜单的各项命令n对数据的简单编辑n对数据文件的整理1命令命令功能功能对变量操作的命令对变量操作的命令Define Variables Properties 定义变量属性定义变量属性Copy Data Properties复制数据属性复制数据属性Define Dates定义日期变量

14、定义日期变量Insert Variables插入变量插入变量对个案操作的命令对个案操作的命令Insert Case插入个案插入个案Go to Case个案定位个案定位DataData菜单的各项命令菜单的各项命令1对个案操作的命令对个案操作的命令Sort Cases个案排序个案排序Select Cases选择个案选择个案Identify Duplicate Cases识别重复个案识别重复个案Weight Cases个案加权个案加权对文件操作的命令对文件操作的命令Transpose对数据文件的对数据文件的转置转置Restructure数据重组数据重组Data菜单的各项命令菜单的各项命令1对文件操作

15、的命令对文件操作的命令Merge Files合并数据文件合并数据文件Aggregate对数据进行汇总对数据进行汇总Orthogonal Design正交设计正交设计Data菜单的各项命令菜单的各项命令11、变量管理、变量管理 主要内容:主要内容:插入变量插入变量删除变量删除变量定义日期时间定义日期时间1插入变量插入变量(1)将当前单元确定在某变量上(2)右击鼠标 插入变量1删除变量删除变量(1)在欲删除的变量名上单击鼠标( 2) 右键选择Cut1定义日期时间变量定义日期时间变量 Define DatesDefine Dates步骤(1) 数据 定义日期(2)设置日期时间12 2、个案管理个案管

16、理 主要内容:主要内容:个案定位个案定位插入和删除一个个案插入和删除一个个案个案个案排序排序个案选取个案选取个案加权个案加权1个案定位个案定位u将当前数据单元定位到特定单元u两种定位方式:人工定位和自动定位u人工定位方法: 用鼠标拖动数据编辑窗口右边滚动钮 或 Page Up Page Down1个案个案定位定位u自动定位方法1 按个案号码自动定位(1)将当前单元定位在任何单元中(2)编辑 转至个案(3)输入欲定位的个案号码1个案个案定位定位u自动定位方法2 按变量值自动定位(1)将当前单元定位在任何单元中(2)Edit Find(3)输入定位变量值1插入和删除一个个案插入和删除一个个案(1)

17、将当前单元定位在任何单元中(2)编辑 Insert Case(3)输入定位变量值1、插入一个个案、插入一个个案1插入和删除一个个案插入和删除一个个案(1)在欲删除的个案号码上单击鼠标左键( 2) 右键选择Cut2 删除一个个案删除一个个案1数据块的移动 复制和删除(1)定义源数据块( 2) 右键选择Clear(全部清除)或Copy或Cut(3)指定目标单元,右键选择Paste1个案个案排序排序1 目的l 便于数据的浏览l 快速找到数据的最大值和最小值l 快速找到数据的异常值l 能对数据或字符进行排序1说明(1) 数据排序是整行数据排序(2)多重排序中指定排序次序很关键(3) 注意保留原始排列顺

18、序个案个案排序排序1(1)(1) Data=sort case,打开Sort Cases对话框。 (2) 将主排序变量从左面的列框中选到Sort by 框中,在Sort Order选择升序或降序. (3) 如果多重排序,指定第二,三排序变量和规则 (4)OK2 基本操作基本操作个案个案排序排序13 应用举例数据文件:职工基本情况数据p先按职称升序排序p再按基本工资升序排序个案个案排序排序1个案选取 1 目的根据分析的需要,从已收集的大批量数据中按一定规则抽取部分数据参与分析,也称为样本抽样.p提高数据分析效率p检验模型的需要1个案选取个案选取 2 数据选取的基本方式p按指定条件选取(If co

19、ndition is satisfied)p随机抽样(Random sample of cases)u 近似抽样(Approximately)u 精确抽样(Exactly)p选取某一区域的样本(Based on time or case range)p通过过滤变量选取样本(Use filter variable)13 基本操作(1) Data =Select cases(2)根据分析需要选择数据选取方法,All cases 表示全部选中(3)指定对未选择个案的处理方式 Filter未选择个案打上/, Deleted未选择个案从数据编辑窗口中删除个案选取个案选取1 4 实例1数据文件:居民储蓄调

20、查数据(1)浏览城镇储户的情况(2)随机抽样中的近似抽样对其中 70%的数据进行分析个案选取个案选取1 4 实例2数据文件:hong1.dbf,选取(1)婴儿体重2.01=x6Weight Cases(2)选择Weight cases by,并将某变量作为 加权变量选到Weight cases by中12 实例球迷打分数据,将分数按百分比加权1个案加权个案加权3 3、数据文件的整理、数据文件的整理主要内容:主要内容:n数据转置数据转置n数据合并数据合并n分类汇总分类汇总n数据拆分数据拆分1数据转置数据转置1 目的 利用数据的转置功能可以将原数据文件中的行、列进行互换,将观测量转变为变量,将变量

21、转变为观测量。 转置结果系统将创建一个新的数据文件,并且自动地建立新的变量名显示各新变量列。1如果不选择变量移进入Name Variable栏,则系统将自动给转置后的新变量赋予Var001、Var002、的变量名(3)以上选择确定以后,单击OK。此时,出现提示信息,提示用户“有些未被选择转置的变量,其数据会消失”。单击“确定”,随即转置后的新文件将取代原数据文件出现在数据窗口中。如果将原变量列表中的全部变量都选择进行转置,系统不给出此提示信息。 1数据转置数据转置2 步骤(1)Data =Tranpose(2) 指定数据转置后应保留哪些变量,选入 Variable框中再从源变量框中选择一个变量

22、应用它的值作为转置后新变量名,一般选择具有相异观测值的变量或者命名变量。如果选择的是数值型变量,转置后的变量名以字母V起头,后面接上原数值。需要指出,对于字符型变量不能实现转置。(3)指定转置后数据文件中各变量如何取名. Name Variable:标记变量数据转置3 实例职工基本情况数据转置1数据合并1 目的将若干小的数据文件合并p 合并的方式有两种 纵向合并Add Cases:增加个案 横向合并Add Variables:增加变量1合并数据文件2 纵向合并步骤:(1) 打开数据文件(2) Data=Merge File = Add Cases, 选择需要填加的数据文件(3) Add Cas

23、es对话框(4)OK1合并数据文件Add Cases对话框左边:不匹配变量显示栏( Unpaired Variables)右边:匹配变量显示栏Pair:将变量名不一致的变量配对选如右边 要求二者必须具有相同的变量类型。变量宽度可以不同,但是属于工作文件的变量宽度应大于或等于属于外部文件的变量的宽度。若情况相反,合并后外部文件被合并的观测量中相应的观测值可能不能显示,而在单元格里以若干*号加以标记。 Rename:对不匹配变量改名 Indicate case source as variable:定义一个新变量以区分哪些记录是后来添加的 1合并数据文件3 横向合并步骤:(1) 打开数据文件(2)

24、 Data=Merge File = Add Variables,打开选择需要填加的数据文件(3) Add Variables对话框(4)确认4 实例(1)职工基本情况数据与职工基本情况纵向数据纵向合并1合并数据文件合并数据文件 Add Variables对话框pExcluded Variable:公有变量名pNew Working Data File:所有变量名p Match cases on key variable in sorted files: 按照关键变量合并数据pKey Variables:选择关键变量1合并数据文件合并数据文件说明p两个数据文件必须至少有一个名 称相同的变量,称为关键变量p 两个数据文件必须按关键必须按关键 变量变量 排序排序p不同数据文件中数据含义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论