SPSS软件的应用 精 ppt课件_第1页
SPSS软件的应用 精 ppt课件_第2页
SPSS软件的应用 精 ppt课件_第3页
SPSS软件的应用 精 ppt课件_第4页
SPSS软件的应用 精 ppt课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS软件的应用,SPSS:,StatisticalPackageforSocialScienceStatisticalProductandServiceSolutions,SPSS主要窗口:数据编辑窗口,窗口标题:dataeditor功能:定义数据结构、录入编缉、管理待分析的数据。组成:窗口主菜单、工具栏、数据编辑区、状态显示区特点:SPSS中各统计分析功能都是针对该窗口中的数据进行窗口中的数据文件以.sav存于磁盘上两个视图:数据视图和变量视图,SPSS主要窗口:数据输出窗口,窗口标题:viewer功能:SPSS统计分析报表及图形的输出的窗口。特点:在进行第一次分析时自动打开,也可手工打开输出窗口可以关闭,窗口内容以.SPV存于磁盘两个视图:目录视图和内容视图,SPSS数据文件的建立和管理,SPSS数据文件是一种有结构的数据文件。建立SPSS数据文件应完成两项任务:第一,描述SPSS数据的结构第二,录入编缉SPSS的数据内容,一行称为一个“个案”(case)一列称为一个“变量”(var),变量视图,数据视图,在调查问卷中,有多少份问卷,意味着有多少个“个案”问卷中的每个问题对应于每一个“变量”,(一)变量名(Name),变量名的字符个数一般不多于8个;变量名可以用英文,也可以用汉字,汉字一般不超过4个。变量名不区分大小写字变量名不能与SPSS内部特有的具有特定含义的保留字相同,如ALL,BY,AND,NOT,OR等。,(二)Type、Width、Decimals,数值型(1)标准型(Numeric)默认8.2如:12345678、12345.67、-1234.56(2)科学记数法型(ScientificNotation)表示很大或很小的数据如:1.2E+05(3)逗号型(Comma)整数部分从个位开始每三位一个逗号如:1,234.56,(4)圆点型(Dot)整数部分从个位开始每三位一个圆点如:1.234,56(5)美元符号型(Dollar)主要表示货币数据如:$12.30字符型(String)默认列宽8个字符,不能进行算术运算,区分大小写字母日期型(Date)dd-mmm-yyyymm/dd/yyyy,(三)变量名标签(label):对变量名的一些解释说明,增强分析结果的可视性。可以省略。(四)变量值标签(Value)对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。一般用于品质数据如:1-男2-女、1-高2-中3-低,(五)变量列格式(ColumnFormat),列宽度(ColumnWidth)默认值为变量的总长度。对齐方式(TextAlignment)左对齐(Left):字符型默认。右对齐(Right):数值型默认。居中对齐(Center)计量尺度Scale(度量)Ordinal(有序)Nominal(名义),(六)缺失值(MissingValues)1、什么是缺失值?漏填数据明显错误的数据2、对缺失值的一般处理(1)指定某个特定值为缺失值(用户缺失值)如999999(2)系统缺失值:点(),SPSS数据的录入与编缉,录入时应注意:黑框确定当前数据单元。可以逐行录入,按Tab键;可以逐列录入,按Enter数据定位按值定位光标定位到某列变量上-Edit-Find.,SPSS数据的编辑,插入和删除一个个案插入:编缉-插入个案删除:选定待删行,鼠标右键找到Cut插入和删除一个变量插入:光标定位到某列变量上-编缉-插入变量(插到某列前)删除:选定列,鼠标右键Cut项,多项选择题的处理方法,将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。编码方式:多选项二分法(multipledichotomizemethod)将每个答案作为一个变量,每个变量只有两个取值(0或1)多选项分类法(multiplecategorymethod)首先估计多选项问题可能被选择的最多答案数,然后为每个答案建立一个变量,变量取值为多选项问题的可选答案,多选项二分法举例,多选项分类法举例,SPSS数据文件的基本加工和处理,SPSS数据文件的基本加工和处理,数据文件的整理个案排序、个案选取数据加工变量计算、计数数据分组自动分组、手工分组数据文件的其他处理功能指定加权变量,目的:将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。菜单选项:data-sortcases注意:(1)Ascending:升序、Descending:降序。(2)多重排序,选择变量名的次序很关键。,个案排序,变量计算,(1)含义:变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。,(2)SPSS算术表达式(NumericExpression):由常量、变量、算术运算符、圆括号、函数等组成的式子。注意:字符型常量应用引号引起来;算术运算符主要包括:+、-、*、/、*在同一算术表达式中的常量及变量,数据类型应该一致,(3)SPSS条件表达式:由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。关系运算符:(大于)、=(大于等于)、32、srANDOR,算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数,Abs()sqrt()rnd()trunc()mod()mean()sd()sum()cfvar()max()min()normal()uniform()RV.分布名()Probit.()range()any()index()length()lower()lpad()ltrim()substr()missing()sysmis(),(4)SPSS函数,函数是事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。,(5)菜单选项:transform-compute(转换)-(计算变量)if按钮例计算职工实发工资,计数,(1)含义:对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。(2)菜单选项:transform-count,数据文件的分类汇总,(1)含义:按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。(2)菜单选项:data-aggregate,(3)注意:按照哪个变量进行分类对哪个变量进行汇总指定对汇总变量计算哪些统计量,利用住房状况调查数据,分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否有较大差距,未来打算购买住房的平均面积是否有较大差距。,应用举例,数据分组,目的:了解数据的总体分布状况思路:指定按哪个变量分组,即:指定分组变量定义分组变量的分组区间(不重、不漏)指定一个存放分组结果的标志变量分组方法:自动分组手工分组,数据分组,(一)自动分组(单变量值分组)(1)含义:分组变量值相同的个案分在同一组,同组中的标志变量相同。标志变量依照分组变量值的大小次序给定。(单变量分组,通常只适合于离散变量且变量值较少的情况)(2)菜单选项:transform-automaticrecode,数据分组,(二)手工分组(组距分组)(1)含义:人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。菜单选项:transform-recode-intodifferentvariables,指定加权变量,(1)含义:指定某一变量为加权变量。如:平均蔬菜价格、男足打分(2)菜单选项:data-weightcase(3)说明如果取消加权变量应重新定义:data-weightcasedonotweightcases,频数分析,目的粗略把握变量值的分布状况。采用的方法计算频分布表:包括计算频数、累计频数、百分比、累计百分比绘制统计图形:条形图、饼图,频数分析,基本操作步骤(1)菜单选项:analyze-descriptivestatistics-frequencies(2)选择几个待分析的变量到variables框.(3)chart选项,选择所需要的图形,频数分析,频数分析中的其他分析计算分位数:适用于定距数据数据按升序排序后,找到若干个分位点上的变量值quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)cutpointsfornequalgroups:n等份percentile:自定义百分位点分位数的应用在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比较,计算描述统计量,目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法计算基本描述统计量,计算描述统计量,描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点:利用了全部数据,易受极端值的影响。描述离散程度的统计量标准差(standarddeviation-StdDev):表示某变量的所有变量值离散程度的统计量。SPSS中计算的是样本标准差。方差(variance):标准差的平方。SPSS中计算的是样本方差。极差(range):最大值(maximum)最小值(minimum),计算描述统计量,描述对称程度的统计量偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量.偏度为0表示对称;大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值;小于0表示负偏差大(左偏)。,计算描述统计量,描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与标准正态分布峭度相同。大于0表示比标准正态分布陡,尖峰。小于0表示比标准正态分布缓;平峰。,计算描述统计量,其他统计量标准误差(standarderrorS.E):抽样分布中的标准差,反映样本误差。均值标准误差(meansofS.E)中心极限定理认为:样本均值N(u,2/n)反映样本均值与总体真值间的平均离散程度样本数越大,样本均值的离散程度越小,对真值的估计越准确,计算描述统计量,基本操作步骤(1)菜单选项:a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论