




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 SPSS的基本(jbn)数据管理功能SPSS Basic Data Management参考文献:SPSS Programming and Data Management, 2nd Edition: A Guide for SPSS and SAS Users. SPSS Inc. 2005.第1页/共86页第一页,共87页。一、数据获取二、变量属性三、记录排序四、文件拆分五、筛选记录 六、数据文件的合并纵向合并七、数据文件的合并横向(hn xin)合并八、通过计算产生新变量九、重新赋值十、排秩十一、重排格式十二、日期计算十三、随机抽样第2页/共86页第二页,共87页。一、数据(shj)获取
2、Getting Data into SPSS读取SPSS数据文件:*.sav , 常用的其他外部数据文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意:医学领域(ln y)常用数据库EpiData软件,先将数据文件*.rec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav 文件。第3页/共86页第三页,共87页。数据获取途径第4页/共86页第四页,共87页。二、变量(binling)属性Variable Properties:变量名。允许用中文,但习惯上采用英文变量名。:变量类型,常用数值型(Numeri
3、c)、字符型(String)、日期型(Date)。:变量宽度,默认为8。:小数位数,默认为2。5.Label:变量编码(bin m),又称为变量标签,用于注释变量名的含义。第5页/共86页第五页,共87页。6.Values:变量值编码,又称为变量值标签,用于注释变量值的含义。例如:变量sex,变量标签为“性别”;变量值为1与2,变量值编码:1为“男性”,2为“女性(nxng)”。:缺失值。默认为系统缺失值,用“.”表示。:列宽,默认为8。:对齐方式。数值型变量默认右对齐(Right),字符型变量默认左对齐(Left) 。:测度,包括三类:数值变量(Scale),名义变量或无序分类变量(Nomi
4、nal),有序分类变量或等级变量(Ordinal)。第6页/共86页第六页,共87页。数据清单变量清单数据文件(数据窗口(chungku)数据清单界面)第7页/共86页第七页,共87页。数据文件(数据窗口(chungku)变量清单界面)注意:一行对应一个“记录(Case)”;一列(y li)对应一个“变量(Variable)”。此数据窗口不是一个很好的数据录入界面。第8页/共86页第八页,共87页。删除(shnch)ex .sav文件中id为57的case,将文件另存为为以后(yhu)使用方便,将ex .sav另存为如下数据库(Save As.)第9页/共86页第九页,共87页。删除(shnc
5、h)ex .sav文件中id为14的case,将文件另存为第10页/共86页第十页,共87页。删除ex .sav文件(wnjin)中变量sbp1dbp2,删除id6的记录,将文件(wnjin)另存为第11页/共86页第十一页,共87页。只保留ex .sav文件(wnjin)中变量id、sbp1dbp2,删除id7的记录,将文件(wnjin)另存为第12页/共86页第十二页,共87页。三、记录(jl)排序Sort Cases 第13页/共86页第十三页,共87页。ex .sav文件中, 按照“height(身高(shn o))”的大小排序。升序降序第14页/共86页第十四页,共87页。四、文件(
6、wnjin)拆分 Split File 第15页/共86页第十五页,共87页。比较组分组变量根据分组变量排序ex .sav文件中, 按照(nzho)“sex(性别)”拆分文件第16页/共86页第十六页,共87页。第17页/共86页第十七页,共87页。分性别对“height(身高(shn o))”进行统计描述描述性统计第18页/共86页第十八页,共87页。第19页/共86页第十九页,共87页。不同(b tn)性别的“height(身高)”统计描述所有记录(jl)的“height(身高)”统计描述注意(zh y):SPSS的输出结果文件为*.spo第20页/共86页第二十页,共87页。 五、筛选(
7、shixun)记录 Select Cases第21页/共86页第二十一页,共87页。如果条件满足过滤删除selectunselect第22页/共86页第二十二页,共87页。筛选(shixun)条件:有高血压家族史(genic 0)第23页/共86页第二十三页,共87页。如果选用Deleted,则一定要将筛选后的文件另存一个文件名第24页/共86页第二十四页,共87页。filter_$变量,0表示未选中该记录,1表示选中该记录不符合条件的记录,被用斜线筛除第25页/共86页第二十五页,共87页。有高血压家族史的患者身高的统计(tngj)描述所有(suyu)患者身高的统计描述第26页/共86页第二
8、十六页,共87页。六、数据文件的合并(hbng)纵向合并(hbng):增加记录Merge Files.Add Cases打开(d ki)数据文件作为“工作数据文件”第27页/共86页第二十七页,共87页。打开(d ki)作为“外部数据文件”第28页/共86页第二十八页,共87页。*代表工作数据文件,代表外部数据文件。第29页/共86页第二十九页,共87页。将连接后的文件(wnjin)另存一个文件(wnjin)名:第30页/共86页第三十页,共87页。七、数据文件的合并(hbng)横向合并(hbng):增加变量Merge Files.Add Variables打开作为(zuwi)“工作数据文件”
9、第31页/共86页第三十一页,共87页。打开(d ki)作为“外部数据文件”第32页/共86页第三十二页,共87页。(1)两个文件(wnjin)均提供记录(Both files provide cases)关键变量对于排序的文件,按照关键变量进行匹配*代表工作数据文件,代表外部数据文件。第33页/共86页第三十三页,共87页。警告:如果数据未按照关键变量的升序进行排序,那么不能按照关键变量匹配第34页/共86页第三十四页,共87页。连接(linji)后的数据文件,另存为第35页/共86页第三十五页,共87页。(2)按照关键变量,将外部数据文件匹配(ppi)到工作数据文件中(External f
10、ile is keyed table)。第36页/共86页第三十六页,共87页。连接(linji)后的数据文件,另存为第37页/共86页第三十七页,共87页。(3)按照关键(gunjin)变量,将工作数据文件匹配到外部数据文件中(Working file is keyed table)。第38页/共86页第三十八页,共87页。连接(linji)后的数据文件,另存为第39页/共86页第三十九页,共87页。八、通过计算(j sun)产生新变量 compute第40页/共86页第四十页,共87页。产生一个(y )新变量:bmi体重/(身高)*2)第41页/共86页第四十一页,共87页。第42页/共8
11、6页第四十二页,共87页。九、重新(chngxn)赋值Recode. Into different variables第43页/共86页第四十三页,共87页。旧及新的变量值第44页/共86页第四十四页,共87页。根据bmi对7个记录(jl)进行分组,bmi: 正常:;超重:;肥胖:。第45页/共86页第四十五页,共87页。定义新的变量名:bmi _ gr第46页/共86页第四十六页,共87页。第47页/共86页第四十七页,共87页。问题(wnt):当bmi时,bmi_gr的取何值?根据上述recode方法(fngf), bmi_gr为缺失值!解决办法:RECODE bmi (18.0 thru
12、 =1) (24.0 thru =2) (28.0 thru Highest=3) INTO bmi_gr .EXECUTE .第48页/共86页第四十八页,共87页。十、排秩 rank cases第49页/共86页第四十九页,共87页。对sbp1(治疗(zhlio)前SBP)进行排秩第50页/共86页第五十页,共87页。排秩后产生新变量rsbp1,其中对于(duy)相等的变量值(称为结点ties)取平均秩次。本例中第2、3位的平均秩次为。第51页/共86页第五十一页,共87页。十一(ShY)、重排格式Restructure第52页/共86页第五十二页,共87页。1.将变量转换(zhunhun
13、)为记录 Restructure selected variables into cases 第53页/共86页第五十三页,共87页。将变量转换为同一组第54页/共86页第五十四页,共87页。记录标识转置后的新变量需要转置的变量需要固定的变量第55页/共86页第五十五页,共87页。创建一个索引变量第56页/共86页第五十六页,共87页。索引变量的变量名按照自然数列对索引变量取值第57页/共86页第五十七页,共87页。未选取的变量从新数据库中删除第58页/共86页第五十八页,共87页。开始重排第59页/共86页第五十九页,共87页。重排后的数据文件。 第60页/共86页第六十页,共87页。2.将
14、记录(jl)转换为变量 Restructure selected cases into variables第61页/共86页第六十一页,共87页。第62页/共86页第六十二页,共87页。记录标识索引变量第63页/共86页第六十三页,共87页。按照“记录标识”变量排序第64页/共86页第六十四页,共87页。按照原变量值顺序,排列新变量组第65页/共86页第六十五页,共87页。开始重排第66页/共86页第六十六页,共87页。重排后的数据文件。 第67页/共86页第六十七页,共87页。十二(sh r)、日期计算 Date/Time 第68页/共86页第六十八页,共87页。用日期与时间进行计算第69页
15、/共86页第六十九页,共87页。两个日期之间的计算第70页/共86页第七十页,共87页。Date1与Date2之差以“天”为单位第71页/共86页第七十一页,共87页。结果变量:day,单位为“天”变量标签第72页/共86页第七十二页,共87页。第73页/共86页第七十三页,共87页。十三、随机抽样 Random Sampling 步骤(bzhu)1 随机数种子(Random Number Seed)的设定以数据文件data.sav为例第74页/共86页第七十四页,共87页。指定种子(此处以随机抽样的日期为种子)第75页/共86页第七十五页,共87页。步骤2 随机筛选(shixun)记录(Se
16、lect Cases Randomly)第76页/共86页第七十六页,共87页。随机抽取样本单击Sample按钮第77页/共86页第七十七页,共87页。从前10个记录中随机抽取2个记录第78页/共86页第七十八页,共87页。从前10个记录中随机抽取2个记录第79页/共86页第七十九页,共87页。随机抽样的结果(ji gu): 抽取了no为3、4的两个记录。第80页/共86页第八十页,共87页。注意:1.随机抽样主要用于现场调查中,从总体中用简单随机的方法随机抽取一个样本。2.随机抽样的过程中,需要设定种子,以保证随机抽样结果是可重现的。(一般来说,如果不设定种子,那么(n me)第二次抽样很可
17、能与第一次抽样的结果不同。)第81页/共86页第八十一页,共87页。小贴士:SPSS通过菜单,可以实现大部分的数据管理及统计分析功能,软件操作简单(jindn)、易学。在学习SPSS时,要养成一个好习惯:用语法文件(*.sps)保存每一步操作(只需要在每个对话框中点击Paste,就可以将操作粘贴到语法窗口,即Syntax窗口)。这样做,至少有两个益处:1.避免重复地操作;2.很清楚地记录了统计分析的过程。第82页/共86页第八十二页,共87页。如果您偷懒(tu ln),从不保存语法文件1.您花了一整天的时间进行了复杂的数据整理(zhngl)及统计分析几天后,老板告诉您:数据库需要删除一个记录,
18、您要重新做统计!天啊!为了这一个记录(jl),难道还要再花费一整天重头开始么?!第83页/共86页第八十三页,共87页。如果您偷懒,从不保存(bocn)语法文件2.您花了一整天的时间进行(jnxng)了复杂的数据整理及统计分析。很幸运,数据很准确,方法很合适,似乎没有什么遗憾了。N年后,有人拿着您的统计结果,很崇拜地请教:当初您是怎么算出这个结果的?天啊!我怎么(zn me)可能记得N年前的事情?!第84页/共86页第八十四页,共87页。如果您养成了这个(zh ge)好习惯:用语法文件(*.sps)保存每一步操作哈哈(h ha)!只需要几秒钟我就能将统计结果重现!a piece of cake !第85页/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁六年级考试试卷及答案
- 双方合作股东协议书
- 土方分包安全协议书
- 合作代理楼盘协议书
- 医疗救援协作协议书
- 合作开厂合同协议书
- 北方树林承包协议书
- 医院承办科室协议书
- 合伙股份退股协议书
- 厦门知识产权协议书
- 配音基础知识课件
- 卡西欧手表EFA-120中文使用说明书
- 超市经营服务方案投标方案(技术标)
- 孟万金编制的中国大学生积极心理品质量表+评分方式
- JGT 486-2015 混凝土用复合掺合料
- 12J3-3蒸压加气混凝土砌块墙
- 2023年版《安宁疗护实践指南(试行)》解读课件
- 7《玩磁铁》(教学设计)-一年级上册科学青岛版
- 2024建筑工程施工承包人工费合同书
- 四川省成都市2024年七年级下学期期末数学试题附答案
- 思辨与创新智慧树知到期末考试答案章节答案2024年复旦大学
评论
0/150
提交评论