第三章SPSS数据的预处理_第1页
第三章SPSS数据的预处理_第2页
第三章SPSS数据的预处理_第3页
第三章SPSS数据的预处理_第4页
第三章SPSS数据的预处理_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 SPSS数据的预处理主要内容个案排序个案排序查找重复个案查找重复个案变量计算变量计算数据分组数据分组个案选取个案选取计数计数分类汇总分类汇总数据分组数据分组指定加权变量指定加权变量目标:排序在数据分析中的作用目标:排序在数据分析中的作用 ? 快速找到可能的离群点快速找到可能的离群点手段:将所有个案按照用户指定的某一个或多个手段:将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列变量的变量值的升序或降序重新排列菜单选项菜单选项: :数据数据 - - 排序个案排序个案注意注意: :(1)(1)排序的次序:排序的次序:升序、降序。升序、降序。(2)(2)多重排序多重排序,

2、,选择变量名的次序很关键。选择变量名的次序很关键。数据排序目的:目的:?手段:排序,保留主个案手段:排序,保留主个案菜单选项菜单选项: :数据数据 - - 标识重复个案标识重复个案注意注意: :(1)(1)重复个案的重复个案的排序变量排序变量。查找重复个案变量计算目的:产生目的:产生新变量新变量或对原变量进行必要的或对原变量进行必要的转换转换 ( (如如: :预测问题预测问题 产生比率数据产生比率数据 偏态数据的正态处理偏态数据的正态处理 时间序列的平稳处理等时间序列的平稳处理等) )(1)(1)含义含义: :根据用户给出的根据用户给出的SPSSSPSS算术表达式算术表达式,对所有,对所有或部

3、分样本数据进行加工,并保存到一个指定变或部分样本数据进行加工,并保存到一个指定变量中。量中。(2)(2)菜单选项:菜单选项: 转换转换- - 计算变量;计算变量; 如果如果 按钮按钮( (3 3) )SPSSSPSS算术表达式:算术表达式:由算术表达式、条件表达式、由算术表达式、条件表达式、SPSSSPSS函数以及函数以及SPSSSPSS变量名组成的式子。变量名组成的式子。( (5 5)SPSS)SPSS条件表达式条件表达式: :由由SPSSSPSS关系运算符、逻辑运算关系运算符、逻辑运算符、符、SPSSSPSS函数以及函数以及SPSSSPSS变量名组成的式子。变量名组成的式子。 关系运算符关

4、系运算符: (: (大于大于) )、(=(=(大于等于大于等于) )、=(32nl32、sr=700sr32) and (sr32) and (sr=700)如:如:(nl=32) | (sr700)(nl=32) | (sr700)如:如: not xb=1not xb=1变量计算算术函数算术函数统计函数统计函数分布函数分布函数逻辑函数逻辑函数字符串函数字符串函数缺失值函数缺失值函数日期时间函数日期时间函数其他函数其他函数Abs() sqrt() rnd() trunc() mod()mean() sd() sum() cfvar() max() min()normal() uniform(

5、) rv.() cdf.() idf.()range() any()index() length() lower() lpad() ltrim() substr()missing() sysmis()(4) (4) SPSSSPSS函数函数变量计算变量计算的应用举例数据选取目标:目标:个案选取个案选取的意义的意义 ?手段:从现有数据中选出部分数据手段:从现有数据中选出部分数据按条件选取;按条件选取;随机选取;随机选取;选取指定区间中的样本选取指定区间中的样本练习:对大学生职业生涯规划数据练习:对大学生职业生涯规划数据挑出仅听过相应课程的样本挑出仅听过相应课程的样本注意:以后的操作都针对选出的数

6、据进行注意:以后的操作都针对选出的数据进行计数目标:目标:计数区间计数区间手段:对所有或部分个案,计算若干个变量中有手段:对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入几个变量的值落在指定的区域内,并将结果存入新变量中新变量中例:例:学生成绩得优门次的整体状况分析学生成绩得优门次的整体状况分析分类汇总目标:分析各分组下样本的统计特征目标:分析各分组下样本的统计特征手段:手段:按指定的分组变量值对样本分组按指定的分组变量值对样本分组分别计算各组中汇总变量的基本统计量分别计算各组中汇总变量的基本统计量例:对比男女职工的平均年龄和平均工资例:对比男女职工的平均年龄和平

7、均工资性别年龄奖金男401000女35550男20200性别_1年龄_1奖金_1男30600女35550原始数据原始数据按性别变量汇总数据按性别变量汇总数据 数据分组目标目标: :更好地了解连续型变量的分布特点更好地了解连续型变量的分布特点手段:手段:组距分组组距分组指定按哪个变量分组指定按哪个变量分组; ;定义分组区间定义分组区间( (不重不漏不重不漏););指定存放分组结果的组标志变量指定存放分组结果的组标志变量SPSSSPSS的区间的区间分组数,组距分组数,组距职工工资的分组(职工工资的分组(850850以下,以下,851851至至900,901900,901至至950,951950,9

8、51至至1000,10001000,1000以上)以上)指定加权变量目标:计算加权平均数目标:计算加权平均数例:蔬菜的平均价格、男足打分例:蔬菜的平均价格、男足打分手段:指定某一变量为加权变量手段:指定某一变量为加权变量例:蔬菜的平均价格例:蔬菜的平均价格菜单选项菜单选项: :数据数据 - - 加权个案加权个案说明:说明:如果取消加权变量应重新定义如果取消加权变量应重新定义练习一1.利用数据筛选功能,将住房状况调查.sav生成两个文件,其中第一个文件存储户口为“外地户口”且家庭收入在10000-15000之间的数据;第二个文件存储按简单随机抽样抽取的10%的样本数据。2.利用 住房状况调查.sav 将其按家庭收入(升序)、现住面积(升序)、计划面积(降序)进行多重排序。3.根据 住房状况调查.sav ,利用SPSS的计数和数据筛选功能找到“住房不满意”且“未来三年不买房”的人。 4.利用P43-9的结果 学生成绩表.sav计算每个学生的平均成绩和标准差,同时计算男生和女生各科成绩的平均分。5.利用数据分组功能对数学成绩进行组距分组,设置新变量名为”sxfz”,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论