




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据文件的建立与编辑,一、相关概念,数据库是统计分析的基础,一个完善而简洁的数据库,可以提高研究和分析的效率。 数据库多为二维(行列)表结构,一般列为变量(variable),行为个体(case)。数据表中的一个格(cell)放一个数据。 建立一个数据库分为三个步骤: 定义变量 输入数据 保存文件,二、进入SPSS前的准备工作,编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题:您认为打工的外地人对北京市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,编码的步骤,确定变量 变量: 用来反映文意概念的量化形式。在统计中往
2、往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,问题:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,问题,变量1,变量2,变量1的值,变量2的值,编码的步骤,制作编码表 变量 未回答、缺失值 不适用 不知道 编码: 根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。,变量类型,数值型变量 字符型变量,变量名定义原则,唯一性 首字符不能是数字 变量名不能使用键盘上的#、¥、%等 变量名不能使用系统内部保留字,all 、and 、by 、with 、not 、eq等 变量名不能以
3、“.”结尾,四、数据录入、编辑,在完成变量定义后,单击左下方的data view标签,激活数据表。即可录入。 编辑 修改 复制和粘贴 数据删除,操作技巧,连续多个相同值的输入 可利用复制、粘贴的方法。 将EXCEL数据直接引入SPSS 先在EXCEL中选中所有的数据(不包括变量名),拷贝,然后再切换到SPSS,执行粘贴命令。再定义相应的变量即可。 将WORD中的数据直接引入SPSS 与在EXCEL相类似。 如果表中全部是数据,则全选。 如果表中有文本,则与EXCEL相同,导入外部文件数据,TXT 文件 EXCEL文件,五、数据整理(data),概念 数据整理是对原始数据中的变量或个体进行 增加
4、 删除 排序 倒置(较少使用,不做介绍。) 合并 加权,1、插入或删除(变量或个体),单击行首或变量名,即可定义一行或一列,然后即可删除一个体或一变量。,如果发现这是一种错误操作,可通过选择edit-undo 进行恢复。,插 入,删 除,2、个体排序(data - sort case),排序变量栏 可以是多个变量 以第一个变量为先。 排序类型 升序 降序,3、合并文件(data-merge files),合并文件的功能是某外部文件与当前数据合并一个新工作数据,新工作数据包括个体或变量的增加。 个体的增加是纵向合并;变量的增加是横向合并。 增加变量时,外部文件与当前文件均必须是升序排列文件。,(
5、1)、数据纵向合并(merge file-add case),Indicate case source as variable: (指示个体来源的变量选项) 数值0表示源工作数据的个体,数值“1”表示外部文件的个体。,unpaired variables:(不匹配变量) Variable in New working data file:(新工作数据变量),(2)、数据横向合并(add variable),对话框:,Excluded variables :(拒绝变量栏) New working data:(新工作数据变量栏) Match case on key variable in sort
6、ed:(排序文件中按关键变量匹配个体选项) Both files provide cases:由外部和当前文件两者提供个体。 External file is keyed table:外部文件为关键表。以当前数据为基准,外部文件匹配当前数据的关键变量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配不成功则不加入。,Working file is keyed table:当前数据为关键表。以外部文件为基准,当前数据匹配外部数据的关键变量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配不成功则舍去当前数据的该个体。 Key variables:关键变量栏。 在拒绝变量栏中选
7、择某变量作为关键变量。 Indicate case source as variable:指示个体来源的变量选项。 数值0表示源工作数据的个体,数值“1”表示外部文件的个体。,:增加变量(不选择关键变量),:增加变量(选择关键变量),4、拆分数据文件,在进行数据的处理时,经常对数据中的个体进行分组分析。 “拆分”并非将一个数据文件拆分为两个或多个独立的数据文件,而在同一个数据文件按某个条件分组。 拆分后,拆分处理一直有效,直到取消拆分处理或更改拆分变量才会有新的变化。 : Data split file对话框,取消“拆分” 结果放在一起分析 单独显示 指明当前状态,5、选择个体(Select
8、cases 抽样),选择某些符合条件的个体,All case: 所有个体,系统默认值。 If condition is satisfied:按给定条件选择个体。 If :是条件按钮,激活对话框。 Random sample of cases:随机选择个体 Sample:随机样本按钮,激活对话框。 Based on time or case range:在某范围内选择人全部个体。 Range :范围按钮,激活对话框。 Use filter variable: 过滤变量为0值或缺失值为非选择个体,其余为选择个体。,Unselected case are: 非选择个体单选项。 Filtered :
9、过滤棵选择个体,产生过滤变量filter_$。 filter_$值为0时表示个体是非选择个体,不进行统计分析,但仍在工作文件中。变量filter_$为1表示该个体是选择个体,可以对它进行统计分析。 Deleted : 删除个体。删除不符合条件的个体,产生新文件。 注意:删除的个体不可恢复。,6、加权个体,加权个体的功能是变量为频数变量。,Do not weight cases: 非加权个体变量选项 Weight cases by: 加权个体变量选项。 Frequency variable 频数变量栏。放入频数变量。 Current status: 当前工作状态。是否加权频数变量。,六、数据变换 transform,概念 在整理数据时,常常需把某些变量的数据进行变换,这些数据变换是通过一个有效的数值表达式或SPSS的内部函数(如对数、平方根、倒数、比值等)来实现。 另外,连续变量也可以变换为分类变量。 :这儿我们只介绍: 如何建立新变量。,建立新变量,新变量的数据是对每个个体求数据值表达式的结果。新变量可以是数值型或字符型的。 transform compute弹出一对话框。,Target variable 新变量栏 Type & label 类型与标签 Numeric expression 数值表达式 Funct
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆阿克苏市阿瓦提县第四中学2025届物理高二第二学期期末学业质量监测试题含解析
- 二零二五年度建筑材料采购合同
- 二零二五年度个人车辆抵押贷款简易合同
- 2025年度车辆个人抵押权登记及管理合同
- 二零二五年度安置点配套设施建设及施工一体化合同
- 2025版生物科技孵化中心入驻及研发合作合同
- 2025版厂房物业安全防范系统维护合同
- 二零二五版矿山尾矿处理居间服务合同
- 2025年度餐饮外卖配送服务合同范本
- 2025版车库购置及车位分配合同示范文本
- 2025年南京市中考数学真题试卷
- 2025年呼伦贝尔农垦集团有限公司招聘笔试参考题库含答案解析
- 2025年重庆市中考数学试卷真题(含标准答案)
- 兵团连队职工考试试题及答案解析
- 2025工厂6s考试试题及答案
- DB31/T 926-2015城镇供水管道水力冲洗技术规范
- 2025年下半年山东能源枣庄矿业集团公司定向培养井下高技能员工招生200人易考易错模拟试题(共500题)试卷后附参考答案
- 中职服装面试题及答案
- 2025-2030中国近地轨道卫星行业市场发展趋势与前景展望战略研究报告
- 饺子店餐饮行业跨境出海战略研究报告
- 2025初级会计课件
评论
0/150
提交评论