




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教案教师姓名朱兆军课程名称统计分析与SPSS的应用班级10会计与统计授课日期2012年3月16日 第4周 2课时2课型新授课章节名称第三章 SPSS数据的预处理教学目的1. 熟练掌握SPSS数据删选的基本方法和具体操作;2. 熟练掌握SPSS数据排序、计数的具体操作;3. 掌握SPSS分类汇总的含义并熟练掌握其具体操作4. 掌握各种数据分组的特点和使用场合,并熟练掌握SPSS组距分组的具体操作;教学重点1. SPSS数据的选取2. SPSS数据的计数教学难点SPSS数据的分类汇总补充、删节、更新无教具多媒体课外作业案例复习课后体会授课主要内容 第三章 SPSS数据的预处理一、数据选取1、选取数据的目的2、数据选取的方法:(1)、按指定条件选取(2)、随机选取(3)、选取某一区间内的样本(4)、通过过滤变量选取二、计数1、计数的目的2、计数区间:1.单个变量值2.系统缺失值3.系统缺失值或用户缺失值4给定最大值和最小值的区间5.大于等于某指定值的区间6.小于等于某指定值的区间三、分类汇总分类汇总是按照某分类变量进行分类计算。SPSS实现分类汇总涉及两个主要方面:、 按照哪个变量进行分类、 对哪个变量进行汇总,并指定对汇总变量计算那些统计量。教学过程组织教学检查学生出勤情况导入新课数据选取、计数、分类汇总在SPSS工作中都非常的常见,那么,这些具体的操作是什么呢?新课讲授 第三章 SPSS数据的预处理第四节SPSS数据选取、计数、分类汇总一、数据选取数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。目的:方便对符合条件的case行分析。SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取,这样后面的分析操作就只针对选出的数据,直到用户取消这种选取为止。数据选取的基本方式:(1)选取全部数据(All cases)(2)按指定条件选取( If condition is satisfied ) SPSS要求用户以条件表达式给出数据选取的条件,SPSS将自动对数据编辑窗口中的所有个案进行条件判断。那些满足条件的个案,即条件判断为真的个案将被自动选取出来,而那些条件判断为假的个案则不被选中。(3)随机抽样( Random sample of cases ),即对数据编辑窗口中的所有个案进行随机筛选,包括如下两种方式: 第一,近似抽样(Approximately) 近似抽样要求用户给出一个百分比数值,SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案。 注:由于SPSS在样本抽样方面的技术特点,抽取出的个案总数不一定恰好精确地等于用户指定的百分比数目,会有小的偏差,因而称为近似抽样。 第二,精确抽样(Exactly) 精确抽样要求用户给出两个参数。第一个参数是希望选取的个案数,第二个参数是指定在前几个个案中选取。SPSS自动在数据编辑窗口的前若干个个案中随机精确地抽出相应个数的个案来。(4)选取某一区域内的样本( Based on time or case range ),即选取数据编辑窗口中样本号在指定范围内的所有个案,要求给出这个范围的上、下界个案号码。这种抽样方法适用于时间序列数据。(5)通过过滤变量选取样本( Use filter variable ),即依据过滤变量的取值进行样本选取。要求指定一个变量作为过滤变量,变量值为非0或非系统缺失值的个案将被选中。这种方法通常用于排除包含系统缺失值的个案。说明: (1)完成数据选取后,以后的SPSS分析操作仅针对那些被选中的个案直到用户再次改变数据的选取为止。 (2)采用指定条件选取和随机抽样方法进行数据选取后,SPSS将在数据编辑窗口中自动生成一个名为filter_$的新变量,取值为1或0。1表示本个案被选中,0表示未被选中。该变量是SPSS产生的中间变量,如果删除它则自动取消样本抽样。(案例)利用住房状况调查数据,选取方案编码所在区性别年龄文化程度从业状况婚姻常住人口户口状况家庭收入现住面积人均面积房屋产权住房满意未来三年计划面积计划户型购买类型地理位置购房价位是否贷款mjfligj100091151231416000307.512802112451101064112301514118000307.512110105881148151313000030103311101065711511215120000377.4332212031231101103196631321114124000379.2512110104221240131411200040103621103207732322523160004013.3333212042857415316121800042211213032467313111131900045152212010878113713131100004515222852121152204257541422213150005016.6731112042674413322131100005016.6733212010253123822131150006020331120321403130321312000060201221002221102201048311472213125000602033112010327113921131100006421.3333213032081314522131150006521.6733213021668213022141150008020122110312341022010276115331131400008428332212032212013032311315321121112008542.52214032298315021141350009022.51221303231302304268041472514160009022.53612702123210130100931246212312000013244331140215592128311515000013827.6331131322683123232121500060601221003233220240输出内容:GET FILE=C:Documents and SettingsAdministrator桌面住房状况调查.sav. USE ALL. COMPUTE filter_$=(常住人口 = 3). VARIABLE LABEL filter_$ 常住人口 = 3 (FILTER). VALUE LABELS filter_$ 0 Not Selected 1 Selected. FORMAT filter_$ (f1.0). FILTER BY filter_$. EXECUTE. USE ALL. COMPUTE filter_$=(年龄 35 & 家庭收入 = 15000 & 现住面积 = 100). VARIABLE LABEL filter_$ 年龄 35 & 家庭收入 = 15000 & 现住面积 = 100 (FILTER). VALUE LABELS filter_$ 0 Not Selected 1 Selected. FORMAT filter_$ (f1.0). FILTER BY filter_$. EXECUTE. DATASET COPY 啦啦. DATASET ACTIVATE 啦啦. FILTER OFF. USE ALL. SELECT IF (年龄 35 & 家庭收入 = 15000 & 现住面积 = 100). DATASET ACTIVATE 数据集1. EXECUTE. DATASET COPY 呵呵. DATASET ACTIVATE 呵呵. FILTER OFF. USE ALL. SAMPLE .01. DATASET ACTIVATE 数据集1. EXECUTE. USE ALL. do if $casenum=1. compute #s_$_1=20. compute #s_$_2=30. end if. do if #s_$_2 0. compute filter_$=uniform(1)* #s_$_2 #s_$_1. compute #s_$_1=#s_$_1 - filter_$. compute #s_$_2=#s_$_2 - 1. else. compute filter_$=0. end if. VARIABLE LABEL filter_$ 从第一 30 个案中的 20 (SAMPLE). FORMAT filter_$ (f1.0). FILTER BY filter_$. EXECUTE.FILTER OFF. USE 10 thru 20. EXECUTE. DATASET ACTIVATE 数据集1. DATASET CLOSE 呵呵. DATASET CLOSE 啦啦. USE ALL. FILTER BY 计划面积. EXECUTE.二、计数3.4.1 计数目的 SPSS实现的计数是对所有个案或满足某条件的部分个案,计算若干变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新变量中的过程。例如对学生的成绩进行综合测评时,可以依次计算每个学生的若干门课程中有几门课程得了优,有几门课程得了良,有几门课程不及格。 SPSS实现计数的关键步骤是:指定哪些变量参与计数,计数的结果存入哪个新变量中指定计数区间(尤为关键) 3.4.2 计数区间SPSS中的计数区间可以有以下几种描述形式:单个变量值(Value)系统缺失值(System-missing)系统缺失值或用户缺失值( System or user-missing)给定最大值和最小值的区间(n through m)小于等于某指定值的区间(Lowest through n)大于等于某指定值的区间(n through highest)3.4.3 计数的基本操作(1)选择菜单TransformCount,出现如下窗口:(2)将参与计数的变量选到 Numeric Variables框中(3)在Target Variable框中输入存放计数结果的变量名,并在Target Label框中输入相应的变量名标签。(4)单击Define Values按钮定义计数区间,出现如下图窗口: (5)如果仅希望对满足某条件的个案进行计数,则单击If按钮并输入相应的SPSS条件表达式。否则,本步可略去。(案例)利用住房状况调查数据,分析被调查家庭中有多少比例的家庭对目前的住房满意且近几年不准备购买住房。编码所在区性别年龄文化程度从业状况婚姻常住人口户口状况家庭收入现住面积人均面积房屋产权住房满意未来三年计划面积计划户型购买类型地理位置购房价位是否贷款mjfligj100091151231416000307.512802112451101064112301514118000307.512110105881148151313000030103311101065711511215120000377.4332212031231101103196631321114124000379.2512110104221240131411200040103621103207732322523160004013.3333212042857415316121800042211213032467313111131900045152212010878113713131100004515222852121152204257541422213150005016.6731112042674413322131100005016.6733212010253123822131150006020331120321403130321312000060201221002221102201048311472213125000602033112010327113921131100006421.3333213032081314522131150006521.67332130输出内容:COUNT gs=住房满意 未来三年(1). VARIABLE LABELS gs 住房满意且不准备买房. EXECUTE. COUNT ll=现住面积(60 thru 80). EXECUTE.COUNT haha=计划面积 计划户型 购房价位 是否贷款 购买类型 地理位置(SYSMIS). VARIABLE LABELS haha 缺失值个数. EXECUTE.三、分类汇总 SPSS实现分类汇总涉及两个主要方面:按照哪个变量(如上例中的学历、职业和年龄段)进行分类对哪个变量(如上例中的基本工资、消费金额)进行汇总,并指定对汇总变量计算哪些统计量(如上例中的平均工资、平均消费金额(案例)利用住房调查数据,分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否有较大差距。分类汇总的基本操作(1) 选择菜单DataAggregate,出现如下所示的窗口:(2)将分类变量选到Break Variable(s)框中(3)将汇总变量选到Summaries of Variable(s)框中(4)单击Function按钮,指定对汇总变量计算哪些统计量。SPSS默认计算均值。 ( 5)指定将分类汇总结果保存到何处。有三种选择: 第一,Add Aggregated Variables to working data file,表示将结果存放到当前数据编辑窗口中。 第二,Create new data file,表示将结果存放到系统默认的名为aggr.sav的SPSS数据文件中,可以单击File按钮,重新指定文件名; 第三,Replace working data file,表示用分类汇总结果覆盖数据编辑窗口中的数据。 一般选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业发货退货管理制度
- 乡镇权力清单管理制度
- 进出口疫情防控管理制度
- 仓库物料采购管理制度
- 人口文化大院管理制度
- AI赋能企业人才培养与留存策略
- 企业费用开支管理制度
- 上海现代医院管理制度
- 中铁二局资金管理制度
- 美甲店基本卫生管理制度
- JT-T-1178.2-2019营运货车安全技术条件第2部分:牵引车辆与挂车
- 黄金的冶炼工艺流程
- 美术学院 本科培养方案 - 清华大学 - Tsinghua University
- AS9100D体系标准中文版
- 《中国脑卒中护理指导规范(2021年版)》课件
- 学前教育学备课课件(共54张PPT)
- 空调安装安全协议书1
- 中南大学计算机体系结构题库
- 三基训练习题集-风湿免疫科(题目及答案)
- 无损检测射线常见缺陷图集
- 中小学教育惩戒规则(试行)解读课件
评论
0/150
提交评论