




免费预览已结束,剩余78页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章SPSS数据的预处理,3.1数据的排序3.1.1数据排序的目的浏览数据,了解取值状况及缺失值发现最大最小值,把握离散程度发现异常值可分为:单值排序和多重排序,单值排序,3.1.2数据排序的基本操作,多重排序,3.2变量计算3.2.1变量计算的目的数据的转换处理对数据的原有分布状态进行转换注意事项:P51,3.2.2SPSS算术表达式常量字符型常量a+1=97+1=98=bab变量算术运算符:+、-、*、/、*,3.2.3条件表达式对条件进行判断,条件成立则为真,条件不成立则为假;可分为简单条件表达式和复合条件表达式,3.2.3.1简单条件表达式关系运算符:、,3.2.3.2复合条件表达式逻辑运算符号:、,3.2.4函数能够实现某些特定计算任务的程序。函数名(参数)、函数值参数之间用逗号隔开具体见:spss帮助主题数据转换函数,3.2.4.1算术函数,3.2.4.2统计函数,3.2.4.3分布函数,3.2.4.4逻辑函数,3.2.4.5字符函数,3.2.4.6日期函数,3.2.4.1缺失值函数,函数和简单算术表达式以不同的方式处理缺失值。在以下表达式中:(var1+var2+var3)/3如果一个个案里三个变量中的任何一个有缺失值,结果将缺失。在以下表达式中:MEAN(var1,var2,var3)只有当个案中三个变量都有缺失值的时候,结果才将缺失。对于统计函数,您可以指定必须包含非缺失值的参数的最小数目。为此,要在函数名称之后输入一个句点和最小数目,例如:MEAN.2(var1,var2,var3),3.2.5计算变量的基本操作从菜单中选择:转换计算变量.输入一个目标变量的名称(现有变量或新变量)。构建一个表达式(可以将其粘贴到“表达式”字段中或是在“表达式”字段中直接输入)。通过从“函数组”列表中选择组,然后双击“函数和特殊变量”列表中的函数或变量(或选择函数或变量,然后单击“函数组”列表相邻的箭头),可以粘贴函数或常用的系统变量。填充问号指示的任何参数(仅适用于函数)。标记为所有的函数组提供所有可用函数和系统变量的列表。对话框的保留区域中显示对当前所选函数或变量的简要描述。,字符串常数必须包含在引号或撇号中。如果值包含小数,则必须使用句号(.)作为小数指示符。对于新的字符串变量,必须选择类型和标签以指定数据类型。,If个案“If个案”对话框允许您使用条件表达式对选定的个案子集应用数据转换。条件表达式对每个个案都返回一个值:true、false或missing。如果条件表达式的结果为true,则所选子集中将包含该个案。如果条件表达式结果为false或missing,则所选子集中不包含该个案。大多数条件表达式使用计算器面板上六个关系运算符(、=、=和=)中的一个或多个。条件表达式可以包含变量名称、常数、算术运算符、数值(和其他)函数、逻辑变量以及关系运算符。,从菜单中选择:转换计算变量在“数据转换”对话框中,单击If。选中如果个案满足条件则包含。输入条件表达式。,3.2.6计算变量的应用举例P58页例题,3.3数据选取按指定条件抽样随机抽样选取某一区域内的样本通过过滤变量选取样本(定义缺失值)操作:数据选择个案,3.4计数3.4.1计数的目的与选取数据的区别3.4.2计数区间3.4.3操作(变量转移)转换对个案内的值计数,3.5分类汇总,练习:以性别和年龄为分类变量,对儿童身高、体重进行汇总求均值(数据:SPSS统计分析从入门到精通Chapter03儿童的身高和体重数据.sav),3.6变量值的分组与重新编码组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。,3.6.2单变量值分组(自动重新分组编码)转换自动重新编码,3.6.3组距分组转换重新编码为相同变量,转换重新编码为不同变量,组距分组的步骤第一步:确定组数。按Sturges提出的经验公式来确定组数第二步:确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值最小值)组数。第三步:根据分组整理成频数分布表。,例如,某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组,组距(139107)74.65,练习:将跑步测试时间以分钟为单位,组距为2分钟,重新编码。(数据:SPSS统计分析从入门到精通Chapter03跑步机的测试.sav),可视离散化(分位数分组),3.7数据预处理的其他功能3.7.1数据转置数据转置,3.7.2加权处理学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,假如某人期中开始得了84,期末92,作业分91,如果是算数平均,那么就是(84+92+91)/3=89;加权处理后就是84*30%+92*50%+91*20%=89.4想知道两个班的化学加权平均值,一班50人,平均80,二班60人,平均82,算数平均(80+82)/2=81,加权(50*80+60*82)/(50+60)=81.09满分10分的情况下,专家打8分,老师打6分,学生打7分,但你认为专家权重和老师及学生权重应为0.5:0.3:0.2,那么加权后就8*0.5+6*0.3+7*0.2=7.2,而算数平均的话就是(8+6+7)/3=7。,操作步骤:数据加权个案,练习1:输入书中表3-14数据,进行加权练习2:(数据:SPSS统计分析从入门到精通Chapter03抽烟与肺癌的关系.sav),3.7.3数据拆分“拆分文件”将数据文件分割为单独的组,以根据一个或多个分组变量的值进行分析。如果您选择了多个分组变量,个案按“分组依据”列表的前一个变量的类别中的每个变量进行分组。例如:如果您选择性别作为第一个分组变量,选择少数民族作为第二个分组变量,将按每个性别类别中的少数民族分类对个案进行分组。您最多可指定8个分组变量。比较数据拆分与分类汇总,3.7.4SPSS变量集系统变量集用户变量集,3.7.5观测量的查重步骤:数据标识重复个案,3.7.6数据文件结构重组横向格式数据,纵向格式数据,操作数据:SPSS统计分析从入门到精通Chapter03季度销售额的横向格式.sav季度销售额的纵向格式.sav,操作步骤:数据重组1.变量重组为个案,2.个案重组为变量,练习:SPSSforWindows统计分析(第3版)data02-13-1.sav;data02-13-2.savdata02-14.savdata02-15.sav比较数据的转置,统计知识补充,观测量的排秩秩的定义设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成,称的足标i为的秩,i=1,2,n。例如:某施行团人员的行李重量数据如表:重量(kg)3439412833写出重量33的秩。因为2833343941,故33的秩为2。,特殊情况:如果在排列大小时出现了相同大小的观察值,则其秩的定义为足标的平均值。例如:抽得的样本观察值按次序排成0,1,1,1,2,3,3,则3个1的秩均为,(2+3+4)/3=3两个3的秩均为?自学:秩和检验(Ranksumtest),操作步骤:转换个案排秩,分位数,(一)根据未分组的资料计算四分位数Q1的位置=n+1/4Q2的位置=2(n+1)/4Q3的位置=3(n+1)/4式中n表示资料的项数某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为?某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数的位置分别为?,(二)由组距式数列确定四分位数第一步,向上或向下累计次数。第二步,根据累计次数确定四分位数的位置。1)当采用向上累计次数的资料确定四分位数时,四分位数位置的公式是:Q1的位置=Q2的位置=Q2的位置=,第三步,根据四分位数的位置算出各四分位数。1)当累计次数是向上累计时,按下限公式计算各四分位数。L1、L2、L3表示下四分位数、中位数和上四分位数所在组下限;i1、i2、i3表示下四分位数、中位数和上四分位数所在组组距;SQ11表示下四分位数前一组的累计次数;SQ21表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能多云管理方法在边缘计算中的应用-洞察阐释
- 智能化预测与工业物联网结合-洞察阐释
- 景区票务销售设备管理制度
- 校园报警系统设备管理制度
- 氧气充填公司安全管理制度
- 注册公司会计日常管理制度
- 滴滴公司员工考勤管理制度
- 牙医规范化培训日常管理制度
- 生态广场设施设备管理制度
- 畜禽饲养培训人员管理制度
- 项目部用工管理办法
- 四川水利水电建筑工程预算定额
- 玩具订货合同范本
- 多旋翼飞行原理(改)
- 2024届湖北省鄂东南联盟数学高一下期末达标检测模拟试题含解析
- 盐城市2023-2024学年三年级语文第二学期期末调研检测模拟卷
- 如何做一个自律的人主题班会
- 2024绝经后无症状子宫内膜增厚诊疗中国专家共识(完整版)
- 《快递企业安全管理》课件
- 冷板液冷标准化及技术优化白皮书-2023.12
- 物理降温法与热疗技术试题
评论
0/150
提交评论