版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章SPSS软件概述主要内容1.1SPSS简介1.2SPSS使用基础1.3SPSS的帮助系统1.4利用SPSS进行数据分析的步骤1.1统计软件简介统计软件的种类很多:EXCEL,SAS,S-plus,Eviews,SPSS等有些功能齐全有些价格便宜有些容易操作有些需要更多的实践才能掌握。还有些是专门的软件,只处理某一类统计问题。1.1统计软件简介Excel:严格说来并不是统计软件,但作为数据表格软件,有一定统计计算功能。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。1.1统计软件简介Eviews:主要处理回归和时间序列的软件。SPSS:一个很受欢迎的专业统计软件;它容易操作,输出漂亮,功能齐全,价格合理,对于统计工作者是很好的选择。SPSS(StatisticalPackageforSocialScience)称为社会科学统计包,这是20世纪60年代刚推出SPSS时的说法。如今在医学、心理学、社会学、市场学、经济学乃至自然科学领域都得到了广泛的普及和应用。现随着服务领域的扩大和服务深度的增加,现在英文已更改为“StatisticsProductandServiceSolution”,意为“统计产品与服务解决方案”。现在被IBM收购,更名为IBMSPSSStatistics。1.1统计软件简介(1)SPSS统计软件的特点Windows风格,界面友好易学易用功能全面强大的编程功能,支持二次开发支持丰富的数据源,具备强大的数据访问和管理能力灵活的配置方案支持多种操作系统1.1统计软件简介(2)SPSS23的新特性地理空间关联规则空间时间预测时间因果模型批量装入数据库可编程性增强功能更快的执行性能1.1统计软件简介(3)SPSS的模块SPSS包括一个基本模块和15个功能扩充模块,供用户进行配置购买,以节省费用:StatisticsBase模块AdvancedStatistics模块Bootstrapping模块Categories模块ComplexSamples模块Conjoint模块CustomTables模块DataPreparation模块DecisionTrees模块DirectMarketing模块ExactTests模块Forecasting模块MissingValues模块NeuralNetworks模块Regression模块ProgrammabilityExtension模块主要内容1.1统计软件简介1.2SPSS使用基础1.3SPSS的帮助系统1.4利用SPSS进行数据分析的步骤1.2SPSS使用基础SPSS23安装在安装过程中有以下几点需注意:正版SPSS需输入SN序列号,试用版不需要。安装过程中会询问许可证的不同类型,即用户的不同类型,如果是单机用户选择选项“单个用户许可证”;如果企业购买的软件是网络版,则选择选项“网络许可证”。需要接受软件使用协议。系统默认的安装路径C:\ProgramFiles\IBM\SPSS\Statistics\23\,如用户需改变安装路径,可以单击“更改”按钮来自定义安装位置。用户需要填写用户名、单位名称,如果是网络版,需设置许可证服务器名称或地址。1.2SPSS使用基础(1)数据编辑窗口——数据视图1.2SPSS使用基础(1)数据编辑窗口——变量视图1.2SPSS使用基础(2)结果浏览窗口1.2SPSS使用基础(3)结果编辑窗口1.2SPSS使用基础(4)语法编辑窗口1.2SPSS使用基础(5)脚本编辑窗口主要内容1.1统计软件简介1.2SPSS使用基础1.3SPSS的帮助系统1.4利用SPSS进行数据分析的步骤1.3SPSS的帮助系统(1)主题帮助窗口1.3SPSS的帮助系统(2)教程1.3SPSS的帮助系统(3)个案研究1.3SPSS的帮助系统(4)统计辅导主要内容1.1统计软件简介1.2SPSS使用基础1.3SPSS的帮助系统1.4利用SPSS进行数据分析的步骤1.4利用SPSS进行数据分析的步骤(1)统计学中数据分析的一般步骤明确数据分析目标正确收集数据数据的加工整理明确统计方法的含义和适用范围正确解释分析结果
1.4利用SPSS进行数据分析的步骤(2)利用SPSS进行数据分析的一般步骤SPSS数据的准备阶段定义数据的结构、录入和修改数据SPSS数据的加工整理阶段缺失值补齐、数据排序、拆分SPSS数据的分析阶段选择正确的统计分析方法,计算并给出结果SPSS分析结果的解释
合理解释、分析结果TheEnd第二章统计数据的收集与预处理主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工2.1统计数据的收集2.1.1问卷设计1.问卷的构成(1)标题(2)导语(前言)(3)正文(4)结束语2.1统计数据的收集2.1.1问卷设计2.问卷的问题类型(1)封闭型问题(是否式、选择式、评判式)(2)开放型问题2.1统计数据的收集2.1.1问卷设计3.问卷中量表的主要类型(1)连续评分量表(2)分项评分量表(Likert量表)(3)排序量表2.1统计数据的收集2.1.1问卷设计4.问卷设计的注意事项(1)目的明确(2)先易后难,先简后繁(3)提出的问题要具体,避免提一般性问题(4)单选问题的备选答案应完整划分答案空间(5)多选题的备选答案必须分布在两个以上的维度上,并且至少有一部分不是互相排斥的(6)问题的陈述及备选答案不能有多重含义(7)问题设计的用语要含义明确,不能让应答者产生不同的理解(8)在问题的陈述中,要对所询问行为的时间、方式、目的做必要的限定2.1统计数据的收集2.1.1问卷设计4.问卷设计的注意事项(9)对于得不到诚实回答而又必须了解的数据,可以通过变换问题的提法来获得相应的数据,或者通过了解相对数据来判断总体的情况(10)问卷不能太长,以20~30分钟为宜;商场拦截类的问卷,以3~5分钟为宜2.1.2问卷分析信度分析效度分析2.1统计数据的收集主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工2.2SPSS数据文件的建立2.2.1统计数据的度量尺度名义尺度(Norminal)即定类尺度,它仅仅是一种标志,用于区分变量的不同值,类别数据之间没有次序关系。例如,人口的性别、商品的名称、身份证、商店类型等。定序尺度(Ordinal)是对事物之间等级或顺序差别的一种测度。例如,考试成绩(优、良、中、差)、人的身高等级(高、中、矮)、学历等级(博士、硕士、学士)等。间隔尺度(Scale)
定距尺度(Interval),是对事物类别或次序之间间距的测度。例如,100分制考试的成绩、重量、温度等。定比尺度(Ratio),是指能够测度值之间比值的一种计量尺度。例如,员工的月收入、企业产值等。
2.2SPSS数据文件的建立统计数据的度量尺度说明:不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。名义尺度数值型、字符型定序尺度数值型、字符型间隔尺度数值型2.2SPSS数据文件的建立2.2.2、SPSS数据文件的特点
人员编号性别部门体检日期体重健康状况1女通信学院08/10/200455好2女计算机学院08/10/200446好3女外语学院08/10/200450一般4男通信学院08/10/200456差5男管理学院08/11/200451差6男光电学院08/11/200453好7女光电学院08/11/200450一般8男通信学院08/12/200450好9女计算机学院08/12/200445一般10男管理学院08/13/200456好样本
变量变量值个案2.2SPSS数据文件的建立2.2.3输入数据建立数据文件
SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。(1)数据的结构定义结构定义包括:名称、类型、宽度、小数、标签、值、缺失值、列、对齐、度量标准、角色2.2SPSS数据文件的建立(1)数据的结构定义名称
命名规则:高版本的SPSS的变量名长度可多达64位,但是由于老版本的SPSS变量名长度应在8位之内,为了避免与低版本及其他软件出现兼容问题,高版本变量名一般仍控制在8位之内且尽量避免中文,必要的中文说明可以放在Label栏中加以说明。首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。变量名必须唯一且不区分大小写字母。允许汉字作为变量名,汉字总数一般不超过4个。变量名不能与SPSS的保留字相同。SPSS的保留字包括:all、by、eq、ge、gt、leIt、ne、not、or、to、with。系统不区分变量名的大小写。2.2SPSS数据文件的建立(1)数据的结构定义变量类型2.2SPSS数据文件的建立(1)数据的结构定义变量类型具体说明如下表所示:2.2SPSS数据文件的建立(1)数据的结构定义变量宽度设置变量宽度。一般无需调整,直接采取默认值。它的大小可通过Width栏后边的微调按钮调整小数位数
若变量类型为数值型,则可设置变量的小数位数,其他类型的变量则不能设置。小数位数默认为两位变量名标签考虑到与低版本的兼容问题,变量名最好限制为8位以内,并且尽量避免中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。2.2SPSS数据文件的建立(1)数据的结构定义变量值标签(Values)变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照下表中规定的值和值标签,具体定义方法见下图。变量值变量值标签1通信学院2计算机学院3管理学院4光电学院5外语学院2.2SPSS数据文件的建立(1)数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。列宽定义变量在数据窗口中显示的宽度。对齐定义变量值显示的对齐方式,默认对齐方式为数值变量在右边,字符串变量在左边,此设置只影响数据编辑器中的显示。度量标准根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。2.2SPSS数据文件的建立(1)数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。角色
输入:变量将用作输入(例如预测变量、自变量)。目标:变量将用作输出或目标(例如因变量)。两者:变量将同时用作输入和输出。无:变量没有角色分配。分区:变量用于将数据划分为单独的训练、检验和验证样本。拆分:设定此角色是为与SPSSModeler相互兼容,具有此角色的变量不会在SPSSStatistics中用作拆分文件变量。2.2SPSS数据文件的建立(2)数据的录入录入数据的一般方法
逐行录入从Word或Excel中直接复制粘贴到数据文件中连续粘贴相同值录入带有变量值标签的数据输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图,从中选择值标签即可。2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件
(1)直接打开选择菜单“文件→打开→数据”,弹出“打开文件”对话框左键单击“文件类型”,即可看到SPSS所能打开的数据文件类型,如下表所示2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件
(1)直接打开说明:其中用的最多的是直接打开Excel的数据文件。在打开Excel格式的文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中,但也可指定仅读取工作表某个区域内的数据。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,则应选择打开对话框上的复选框“从第一行数据中读取变量名”,即以工作表第一行或指定读取区域内的第一行上的文字信息作为SPSS的变量名;如果不选此项,SPSS的变量名将自动取名为V1、V2等。2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件
(2)数据库查询方式如果数据为数据库格式的文件,可以同用数据库查询的方式导入数据到SPSS中。其操作步骤如下:第1步选择菜单“文件→打开数据库→新建查询”,弹出数据库向导窗口。这里显示了所有可以打开的数据源类型。第2步用户根据打开文件的向导选择要打开的文件类型并逐步打开文件。2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件
(3)从文本文件导入文本格式的数据文件是一种最通用格式的数据文件,SPSS提供了专门读取文本文件的功能。选择菜单“文件→打开文本数据…”,弹出“打开文件”对话框,选择要导入的文本文件名后会出现文本数据的向导,该向导是一个分为6步的打开向导,根据文本文件的格式和导入数据的需求进行每一步的设置即可。主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工2.3SPSS数据文件的编辑2.3.1数据文件的合并SPSS提供两种形式的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。横向合并V1V2+V3V4V1V2V3V4纵向合并V1V2+V1V2V1V22.3SPSS数据文件的编辑2.3.1数据文件的合并(1)横向合并单击“浏览”按钮选择要合并的SPSS数据文件的文件名从左边文本框中选择需合并的变量到此框中2.3SPSS数据文件的编辑2.3.1数据文件的合并(1)横向合并
纵向合并数据文件的操作方法同横向合并的方法类似,操作不再赘述,但需注意以下几点:两个待合并的SPSS数据文件的内容合并起来应具有实际意义;两个数据文件的结构最好一致;不同数据文件中含义相同的变量最好用相同的变量名,数据类型要相同2.3SPSS数据文件的编辑2.3.2数据文件的拆分
SPSS23版本在“数据”菜单中提供了两种方法:一是“拆分文件…”,这种拆分并不是要把一个数据文件分成几个数据文件,而是按照需求,根据变量对数据进行分组,为以后的分组统计分析提供便利;二是“拆分为文件”,这种拆分是将拆分后的数据写入新的SAV文件,按拆分变量的值或值标签生成多个SAV文件。2.3SPSS数据文件的编辑2.3.2数据文件的拆分
1.拆分文件在进行数据分析的时候,有时需要对数据文件按某个变量进行拆分,这种拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据进行分组,为以后的分组统计分析提供便利。第一步数据组织第二步打开主对话框第三步选择拆分方式第四步按产品分组统计销售总量和销售总额2.3SPSS数据文件的编辑2.3.2数据文件的拆分
2.拆分为文件拆分为文件是将数据文件按拆分变量的值或值标签,拆分为多个数据文件。第一步数据组织第二步打开“将数据集拆分为单独的文件”对话框第三步拆分文件生成设置2.3SPSS数据文件的编辑2.3.3数据的选取数据的选取即按条件选取观测量进行分析选择观测量的目的有时为了进行特定的分析,需要从所有的数据资料中选择一些数据进行统计分析。例如:有学生的成绩数据,如果只分析男同学的成绩,则要进行选择观测量为男性的数据。2.3SPSS数据文件的编辑2.3.3数据的选取第一步数据组织第二步打开“选择观测量”对话框第三步指定选择个案的方式第四步设置选中个案的输出形式第五步设置选择个案的条件2.3SPSS数据文件的编辑2.3.3数据的加权
所谓权重是指同一个观测量值在所有的观测量里出现的次数或频率。SPSS的观测量加权功能是在数据文件中选择一个变量,这个变量里的值是相应的观测量出现的次数,这个变量叫做权变量。
SPSS中指定加权变量的本质是数据复制,例如表2-5是工人每天生产产品的数量,第一行数据表示当天生产产品数量为20的工人有3个,将“工人数”作为加权变量后,实际是将数据转换成表2-6所示的数据进行分析。表2-5产品数量工人数203产品数量202020表2-62.3SPSS数据文件的编辑2.3.3数据的加权
说明:一旦指定了加权变量,在以后的分析处理中加权是一直有效的,直到取消加权为止;只有数值型的变量才能作为加权变量。主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工2.4.1变量的计算2.4SPSS数据加工输入新生成的变量的变量名输入计算的式子SPSS中提供的用于计算的函数,利用这些函数可以生成指定分布的随机数、生成给定参数的概率密度函数等。2.4SPSS数据加工2.4.2数据可视分箱
SPSS提供的数据可视分箱功能可将连续的数值型数据按由小至大的顺序加以分组(测量值由最低分至最高分分组),从而可将等距或比率变量转换为间断变量2.4SPSS数据加工2.4.2数据可视分箱
见书Page38例2-5
选择“转换→可视分箱”,弹出右图所示的变量选择对话框将需要划分组段的变量“评价结果”选择到此框中。2.4SPSS数据加工2.4.2数据可视分箱
见书Page38例2-5
单击此按钮设置组段分割点输入存储组段值的新变量的名称2.4SPSS数据加工2.4.2数据可视分箱
图中提供了三种自动划分组段的方法(2)按相等比例的观测值数目进行分组:在“分隔点数量”栏内输入断点的数目,系统自动将每组观测值数目的比例输出到“宽度”内(1)按照变量值等间距划分:在“第一个分割点的位置”输入第一个断点处的取值在“宽度”栏内输入一个组段内变量值的长度,“分割点数量”栏内自动出现断点的数目(3)基于变量的均值和标准差来产生组段划分
2.4SPSS数据加工2.4.2数据可视分箱划分组段后的结果2.4SPSS数据加工2.4.3数据重新编码
数据的重新编码是将变量重新赋值,即将数据文件中的原变量的值按照某种一一对应的关系生成新变量值,可以用这个新变量值替代原变量值,也可以生成一个新变量,分别对应菜单:①转换→重新编码为相同变量②转换→重新编码为不同变量
通常在作统计分析前需要对收集到的数据作一些变换处理,SPSS提供的变量重新赋值的功能即可做这样的处理。2.4SPSS数据加工2.4.3数据重新编码单击该按钮进行转换规则的设置设置新变量的变量名和标签重新编码为不同数据,根据原变量的值生成新变量的值2.4SPSS数据加工2.4.3数据重新编码单击“添加”按钮将设置好的新、旧变量值转换规则添加到右面的文本框中。有几条规则就应设置几次,并添加到文本框中。根据转换要求设置原来变量的值或值的范围再设置新的变量对应的值TheEnd第三章描述性统计分析主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.1基本描述性统计量简介3.1.1
描述集中趋势的统计量
1.均值(Mean)
2.众数(Mode)
3.中位数(Median)
4.总和(Sum)
5.百分位数(PercentileValue)
3.1基本描述性统计量的定义及计算
3.1.2
描述离散程度的统计量1.样本方差(Variance)
2.样本标准差(Std.deviation)
3.极差(Range)
4.均值标准误差(StandardErrorofMean)
3.1基本描述性统计量的定义及计算
3.1.3
描述总体分布形态的统计量
1.
偏度(Skewness):是描述取值分布形态对称性的统计量;偏度系数大于0,表示其数据分布形态有一条长尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数的绝对值越大,与正态分布相比越偏斜。
2.峰度(Kurtosis):是描述变量取值分布形态陡缓的统计量;峰度系数等于0,表明数据分布的陡峭程度与正态分布相同。峰度系数大于0时为尖峰分布,表明数据分布的陡峭程度比正态分布大,峰度系数小于0时为平峰分布,表明数据分布的陡峭程度比正态分布小。3.1基本描述性统计量的定义及计算
3.1.3
描述总体分布形态的统计量
来自于正态总体的偏度及峰度均近似为0,可以利用偏度和峰度的值是否接近0作为检验是否是正态分布的重要依据。主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.2频率分析
3.2.1基本概念及统计原理频率就是一个变量在各个变量值上取值的个案数,分析时不考虑其实际取值。基本统计分析往往从频率分析开始。通过频率分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。经过频率分析可以得到如下结果:(1)频率分布表:该表中包含频率、各频率占总样本数的百分比、有效百分比、累计百分比。(2)统计图:用统计图形展示变量的取值状况,频率分析中提供的统计图形可以是条形图、饼图或者直方图。3.2频率分析3.2.2
SPSS实例分析【例3-1】以下是调查问卷中针对被调查人设置的两个问题:1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人民币为单位)单选500-1000……..1 1000-1999……2 2000-2999……33000-3999……44000-4999……5 5000-5999……66000-6999……7 7000-7999……88000-8999……99000-9999……10 10000及以上…112、您的教育程度:(指您受过的最高或正在接受的教育程度)单选没有受过正式教育/小学……….1 初中……..………2 高中/中专/技校………………..3大专/大学非本科/高职高专……4
大学本科……….5 研究生及以上…..6
从问卷中收集到的数据如表3.1所示,试对收集到的数据进行频数分析
3.2频率分析第1步数据组织:根据表3.1生成SPSS数据文件,建2个变量:“收入”、“教育”,度量标准均为序号。第2步频率分析设置:选择菜单:“分析→描述统计→频率”,
打开“频率(F)”对话框,将“教育”和“收入”加入到“变量”列表框中。打开“统计量”对话框,选中“百分位数”
“众数”,并在“百分位数”中添加30.0、60.0、90.0;打开“图表”对话框,选中“直方图”及后
面的复选框家庭月收入受教育程度3515251515……6410545表3.13.2频率分析第3步主要结果及分析:统计量表变量“教育”的频率分布表教育频率百分比有效百分比累积百分比有效181.01.01.02394.74.75.6311413.613.719.3416519.719.839.0545654.554.693.76536.36.3100.0合计83599.9100.0缺失系统1.1合计836100.0表中分别显示两个分析变量“教育”及“收入”的有效个案数、缺失值个数、及两个分析变量的“众数”及对应于30%、60%及90%的百分位数。表中显示了变量“教育”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。3.2频数分析变量“收入”的频率分布表收入频率百分比有效百分比累积百分比有效02.2.2.218710.410.410.6215218.218.228.8315718.818.847.6413716.416.464.058810.510.574.568510.210.284.77526.26.290.98273.23.294.1991.11.195.21081.01.096.211323.83.8100.0合计836100.0100.0表中显示了变量“收入”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。3.2频数分析变量“教育”的直方图变量“收入”的直方图表中显示了变量“教育”的直方图,从图上可以看出受访者教育程度同正态分布相比左偏,不具备明显的正态分布。表中显示了变量“收入”的直方图,从图上可以看出受访者家庭收入同正态分布相比右偏,不具备明显的正态分布。主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.3描述性分析3.3.1基本概念及统计原理
描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频率分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频率表,但描述性分析可以将原始数据标准化为Z分数,并以变量形式存入数据文件中,以便后续分析时应用。
3.3描述性分析3.3.2实例分析
【例3-2】图3-8是5岁儿童体重、身高、胸围的部分SPSS数据,试对儿童身高作描述性统计分析。(数据文件:data3-2.sav)第1步打开数据文件data3-2.sav;第2步描述性分析设置:选择菜单“分析→描述统计→描述”,打开“描述性”主对话框,将要分析的变量“身高”加入“变量”列表框中。打开“描述:选项”对话框,选中“均值”、“标准差”、“最小值”、“最大值”、“峰度”、“偏度”及显示顺序的“变量列表”等选项。3.3描述性分析第3步运行结果及分析:描述性分析结果表表中分析变量“身高”的个案数、所有个案中的极大值、极小值、均值、标准差及偏度和峰度主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.4探索性分析3.4.1基本概念及统计原理
与前面介绍的两种分析方法相比,探索性分析更加强大,它是一种在对资料的性质、分布特点等完全不清楚的情况下,对变量进行更深入研究的描述性统计方法。在进行统计分析前,通常需要寻求和确定适合所研究的问题的统计方法,SPSS提供的探索性分析是解决此类问题的有效办法。探索性分析提供了很多关于数据的概括分析和图表直观描述的方法,不仅对个案数据有效,而且还可以针对分组个案。在输出常用描述性统计量的基础之上,探索性分析增加了有关数据详细分布特征的文字与图形表述,如茎叶图、箱图等,显得更加详细、完整,还可以以方差齐性为目的的变量交换提供线索,有助于用户制定更进一步分析的方案。
3.4探索性分析3.4.2实例分析【例3-3】下表是某班3门课程对应成绩的统计数据,试对其作探索性分析并做是否服从正态分布的检验。第1步数据组织:定义2个变量,分别为:“科目”、“成绩”,“科目”的度量标准为“名义”,“成绩”的度量标准为“度量”。第2步探索分析设置:选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“成绩”字段移入“因变量列表”,“科目”移入“因子列表”。
3.4探索性分析打开“统计量”对话框,选中“描述性”及“M-估计量”选项;打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索:选项”,选中“按列表排除个案”选项。第3步运行结果及分析:“成绩”按科目分组的案例处理摘要表案例处理摘要科目案例有效缺失合计N百分比N百分比N百分比成绩语文6100.0%0.0%6100.0%数学6100.0%0.0%6100.0%英语6100.0%0.0%6100.0%表中显示“成绩”按“科目”分组后各组的有效个案数、个案缺失数及缺失比例等。3.4探索性分析描述性统计量表描述科目统计量标准误成绩语文均值69.179.156均值的95%置信区间下限45.63上限92.705%修整均值69.91中值73.50方差502.967标准差22.427极小值30极大值95范围65四分位距34偏度-1.085.845峰度1.6171.741表中显示“成绩”按“科目”分组后各分组的描述性统计量,左表中只显示的是”语文“分组的均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/小值、偏度、峰度等。3.4探索性分析M均值估计量M-估计器科目Huber的
M-估计器aTukey的双权重bHampel的
M-估计器cAndrews波d成绩语文72.5475.7872.8876.05数学41.4241.1341.6741.13英语56.6855.6055.0055.60a.加权常量为
1.339。b.加权常量为
4.685。c.加权常量为
1.700、3.400和
8.500d.加权常量为
1.340*pi。表中提供了四种估计方法,每种估计方法的加权量在表下方给出,对于有异常值或极端值的数据,M均值估计有很好的稳定性,用M估计值代替均值或中位数,结果更准确。根据样本值的权重不同,可以得到不同的估计量3.4探索性分析正态检验表表中显示了按科目分为的3个分组的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以K-S方法的“语文”分组为例分析:其自由度sig.=0.200,明显大于0.05,故应接受原假设,认为”语文“分组中的数据服从正态分布。3.4探索性分析箱图箱图中显示成绩按科目分成的三个分组,每个分组中的数据绘制成对应的箱体。每一个箱体上方那条线的取值代表该分组中最大值,下方那条线的取值代表最小值。箱体自身的三条线从上到下分别代表3/4分位点、中位点、1/4分位点的取值。3.4探索性分析语文成绩的标准Q-Q图及趋降标准Q-Q图上图为“科目=语文”分组的成绩标准Q-Q图,Q-Q图可以用来检验数据是否服从某种分布,在Q-Q图中,检验数据是否较好地服从给定分布的标准有两个:①看标准Q-Q图上的数据点与直线的重合度;②Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。从上图中可以看出,”科目=语文“的分组中的数据与直线重合度较好,故很好地服从正态分布,这与前面的正态检验表中的结果是一致的。主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.5交叉表分析3.5.1基本概念及统计原理1.交叉表分析的概念
在实际分析中,常需要分析多个变量之间,一个变量是否对其他变量的取值存在影响,分析变量之间是否存在关系,这种分析就称为交叉表分析,用于定类型变量之间的关系分析。
交叉表是两个或多个变量交叉分组后形成的频数分布表,主要用于研究定类型变量之间有无相关性,给出了变量在不同取值下的数据分布。交叉表分析根据样本数据,产生二维或多维交叉表,并在产生交叉表的基础上,对两两变量间是否存在一定的相关性进行分析。3.5交叉表分析2.交叉表分析的相关关系的主要检验方法在分析中,难以在交叉表中直接发现行、列变量之间的关系及关系强度,需要借助非参数检验方法和度量变量间相关程度的统计量进行分析,通常采用检验和相关性检验。卡方统计检验:常用于检验行列变量之间是否相关。列联系数:用于名义变量之间的相关系数计算。
V系数(PhiandCramer’sV):常用于名义变量之间的相关系数计算。3.5交叉表分析3.5.2SPSS实例分析【例3-4】在设置学生评价实验教学的调查表中,“实验准备”是其中的一项指标,为分析“实验准备”情况与评价结果的关系,建立的SPSS数据文件中的部分数据如下图所示,变量值标签如下表所示。(参见数据文件:data3-4.sav。)变量实验准备评价结果值与值标签1差1差2一般2一般3准备充分3优3.5交叉列联表分析第1步数据组织:数据文件中建立两个变量:“实验准备”、“评价结果”,两个变量均为数值型或字符型的分类变量,其度量标准为“名义”,保存为SPSS数据文件data3-4.sav。第2步交叉表分析设置:选择菜单:“分析→描述统计→交叉表”,打开“交叉表”对话框,将“实验准备”及“评价结果”字段分别加入“行(s)”及“列(c)”列表框中。打开“统计量”对话框,选中“卡方”选项。打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。3.5交叉表分析第3步主要结果及分析:案例处理摘要案例处理摘要案例有效的缺失合计N百分比N百分比N百分比实验准备*评价结果50100.0%0.0%50100.0%案例处理摘要表给出了数据基本信息,包括参与分析的有效个案数、缺失信息等。在本例中,每个变量有50个有效个案参与分析,无缺失值。3.5交叉表分析第3步主要结果及分析:实验准备*评价结果交叉表实验准备*评价结果交叉制表计数评价结果合计差一般优实验准备差123015一般98118准备充分013417合计2124550表中给出了数据的3×3交叉表,与原始数据在形式上基本一致3.5交叉表分析第3步主要结果及分析:卡方检验结果表卡方检验值df渐进Sig.(双侧)Pearson卡方22.907a4.000似然比29.8974.000线性和线性组合20.3571.000有效案例中的N50a.3单元格(33.3%)的期望计数少于5。最小期望计数为1.50。表中显示行、列变量通过卡方检验给出的独立性检验结果。共使用了三种检验方法。上表各种检验方法显著水平sig.都远远小于0.05,所以有理由拒绝实验准备与评价结果是独立的假设,即认为实验准备这个评价指标是同评价结果是相关的。3.5交叉表分析第3步主要结果及分析:分组条形图本条形图相当于是实验准备*评价结果交叉表的直观表示,用图形表示可更直观地得出各种情况的比较。主要内容3.1基本描述性统计量简介3.2频率分析3.3描述性分析3.4探索性分析3.5交叉表分析3.6多重响应分析3.6多重响应分析3.6.1基本概念及统计原理1.基本概念
多重响应分析是对多选项问题的分析方法。多选项问题要求问题的答案都是序号变量或名义变量,并且允许选择的答案可以有多个的问题。
多选项问题在问卷调查中普遍存在,要求被调查者从问卷中给出的若干个可选答案中选择一个以上的答案。例如,调查消费者拥有的数码产品的种类,有如下的选项:(1)数码相机(2)数码摄像机(3)MP3(4)DVD机很显然,该问题可选的答案在一个以上,对于此类的多选项问题,通常,在SPSS中处理此类问题的一般步骤为以下两大步骤:(1)将多选项问题分解;(2)利用频数分析或者列联表分组下的频数分析方法进行分析。
3.6多重响应分析2.多选项问题的分解方法
(1)多选项二分法:该分解方法是将多选项问题中的每个答案视为一个SPSS变量,每个变量只取0或1两个值,分别表示选择该答案或没有选择该答案。
(2)多选项分类法:其分解的基本思想是估计多选项问题最多可能出现的答案个数,然后为每个答案定义一个SPSS变量,变量取值为多选项问题中的可选答案。3.6多重响应分析3.6.2多重响应分析Spss实例分析
【例3-5】对50个消费者进行调查,拥有的数码产品的种类,有如下的选项:(1)数码相机(2)数码摄像机(3)MP3(4)DVD机可多选,按性别统计拥有各种数码产品的数量(data3-5.sav)。第1步分解多选项问题,定义多选项变量集;分解多项式:按照二分法分解多选项问题,下表为此多选项问题的前7组数据的二分法记录表,其中性别1为男性,2为女性,其他数据中的1表示拥有该产品,0表示没有。编号性别数码相机数码摄像机MP3DVD机11111121001132000141110051011061000172111182000092001110101003.6多重响应分析定义多选项变量集:选择菜单“分析→多重响应→定义变量集”,打开“定义多重响应集”对话框,将“数码相机”、“数码摄像机”、“MP3”、“DVD机”字段加入“集合中的变量”列表框中,“将变量编码为”选择为“二分法”,“计数值”设为1,输入多响应集的名称为“dp”,单击“添加(A)”按钮,将定义好的数据集添加到“多响应集”列表中。第2步进行多重响应交叉分组下的频数分析:选择菜单“分析→多重响应→交叉表”,弹出“多响应交叉表”对话框,将第1步中建立的多响应集$dp添加到“列”列表框中作为交叉表的列,将“sex”字段添加到“行”列表框作为作为交叉表的行,确定“sex”的定义范围为最小值1、最大值2。3.6多重响应分析第3步主要结果及分析:多重响应分析个案摘要多重响应交叉分析结果左表中给出参与分析的个案数和缺失值的信息。sex*$dp交叉制表数码产品a总计数码相机数码摄像机MP3DVD机sex男计数1516221330女计数9713815总计计数2423352145百分比和总计以响应者为基础。a.值为1时制表的二分组。右表中显示的是多重响应交叉表分析的频数表。从表中可以看出,男性拥有数码产品的数量高于女性,各种数码数码产品中,拥有MP3的人数最多。
TheEnd第四章均值比较与T检验主要内容4.1假设检验4.2平均值分析
4.3
单样本T检验4.4独立样本T检验4.5配对样本T检验4.1假设检验4.1.1基本概念及统计原理1.统计假设原假设:被检验的假设,通过检验可能被接受,也可能被否定;在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。例如,如果我们要判断给定的一枚硬币是否均匀,则假设硬币是均匀的(即p=0.5,其中p是正面出现的概率);类似地,如果我们要判断一种方法是否优于其他的方法,则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为。备择假设:与原假设对应的假设,只有在原假设被否定后才可接受的假设;例如,如果零假设是,则备择假设是。备择假设记为。拒绝域、临界点:当检验统计量取某个区域中的值时,拒绝原假设,则称该取值区域为拒绝域,称拒绝域的边界点为临界点。4.1假设检验4.1.1基本概念及统计原理2.假设检验的两类错误第一类错误:在假设检验中拒绝了本来是正确的原假设。第二类错误:在假设检验中没有拒绝错误的原假设。3.显著性水平与置信水平显著性水平:在作假设检验时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。在实际问题中,显著性水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。置信水平:1-为置信度或置信水平;4.概率P值
P值是当原假设正确时,观测到的样本信息出现的概率。通常用P值与预先设定的显著性水平值比较,若P值小于显著性水平,则认为该概率值足够小,应拒绝原假设。5.单侧检验与双侧检验双侧检验:只强调差异而不强调方向性的检验叫双侧检验。单侧检验:强调某一方向的检验叫单侧检验。4.1假设检验4.1.1基本概念及统计原理4.1假设检验4.1.2小概率事件原理
在概率论中我们把发生概率小到接近于0的事件称为小概率事件(即在大量重复试验中出现的频率非常低)。在统计学上,把小概率事件看成在一次特定的抽样中不可能发生的事件,称为“小概率事件实际不可能原理”。这是统计学上进行假设检验(显著性检验)的基本依据。根据这一原理,若某事件在理论上被认为在原假设成立的情况下是个小概率事件,它不会出现,而在实际中出现了,我们就推翻原来的假设,认为原假设不成立,从而接受备择假设。4.1假设检验4.1.3假设检验的一般步骤第1步给出检验问题的原假设;根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样,都为75,由此可做出零假设,第2步选择检验统计量;在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和F分布等。
第3步规定显著性水平;4.1假设检验4.1.3假设检验的一般步骤第4步计算检验统计量的观测值及其发生的概率值;
在给定零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设H0成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。4.1假设检验4.1.3假设检验的一般步骤第5步在给定显著性水平条件下,做出统计推断结果。这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率P值小于显著性水平时,则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率P值大于显著性水平,如果拒绝零假设,犯弃真错误的概率大于预先给定的容忍水平,这时不应该拒绝零假设。主要内容4.1假设检验4.2平均值分析
4.3
单样本T检验4.4独立样本T检验4.5配对样板T检验4.2平均值分析4.2.1平均值分析的概念及统计原理
与第3章中的“描述统计”菜单中计算某一样本总体均值相比,平均值分析可以对样本进行分组计算,比较指定变量的描述性统计量包括均值、标准差、总和、观测量数、方差等一系列单变量描述性统计量,还可以给出方差分析表和线性检验结果。如果分组变量为多个,还应指定这些分组变量之间的层次关系。
均值过程中系统默认的描述统计量可按分组给出指定变量的均值、标准差、观测量数等,对话框中的选项可以给出其他更加丰富的描述统计量。平均值的计算公式:4.1假设检验4.2平均值分析
4.3
单样本T检验4.4独立样本T检验4.5配对样板T检验主要内容
4.3单样本T检验4.3.1基本概念及统计原理1.单样本T检验的概念单样本T检验利用来自某总体的样本数据,推断该总体的均值与指定的检验值之间是否存在显著性差异,它是对总体均值的假设检验。为此,给出检验均值,原假设:=,其中为总体均值,即认为总体均值与检验值之间无显著性差异。。例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。4.3
单样本T检验4.3.1基本概念及统计原理2.单样本T检验的检验统计量
单样本T检验的前提是总体服从正态分布,其中为总体均值,为总体方差。如果样本容量为n,样本均值为,则仍服从正态分布,即:。在零假设成立的条件下,均值检验使用t统计量,构造的t统计量为:其中,用代入,t统计量服从自由度为n-1的t分布,S为样本标准差。在给定原假设的前提下,SPSS将检验值代入t统计量,得到检验统计量观测值,以及根据T分布的分布函数计算出的概率P值。4.3
单样本T检验4.3.1基本概念及统计原理3.单样本T检验的步骤在给定样本来自正态总体的假设下,单样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。
4.3
单样本T检验4.3.2单样本T检验SPSS实例分析
【例4-2】某生产食盐的生产线,其生产的袋装食盐的标准质量为500g,现随机抽取10袋,其质量分别为495g,502g,510g,497g,506g,498g,503g,492g,504g,501g。假设数据呈正态分布,请检验生产线的工作情况。分析:这是一个典型的比较样本均值和总体均值的T检验问题
;第1步数据组织:首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可,建立的数据文件存入文件data4-2.sav中。
4.3
单样本T检验4.3.2单样本T检验SPSS实例分析
第2步单样本T检验分析设置选择菜单“分析→比较均值→单样本T检验(S)”,打开“单样本T检验”对话框,将变量“weight”移入”检验变量”列表框,并输入检验值500;打开“单样本T检验:选项”对话框,设置置信区间为95%(缺省为95%);
4.3
单样本T检验4.3.2单样本T检验SPSS实例分析
第3步主要结果及分析:单样本统计量表单样本T检验结果表
下表给出了单样本T检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误。检验值=500tdfSig(双侧)均值差值差分的95%置信区间下限上限weight.4699.650.80000-3.05674.6567本例置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P值为0.650,大于0.05,故原假设成立,也就是说,抽样袋装食盐的质量与500克无显著性差异,有理由相信生产线工作状态正常主要内容4.1假设检验4.2平均值分析
4.3
单样本T检验4.4独立样本T检验4.5配对样板T检验4.4
独立样本T检验4.4.1基本概念及统计原理1.独立样本T检验的概念单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。其原假设H0为,即假设两总体均值相等,备择假设为,即假设两总体均值不等。
例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。4.4
独立样本T检验4.4.1基本概念及统计原理2.独立样本T检验的检验统计量独立样本T检验的前提是两个独立的总体分别服从和和。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中n1和n2分别为两样本容量:
和分别为两样本标准差。该统计量服从自由度为的t分布。4.4
独立样本T检验4.4.1基本概念及统计原理2.独立样本T检验的检验统计量2)当样本方差不等时,t统计量定义为:可见,独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。4.4
独立样本T检验4.4.1基本概念及统计原理3.方差齐性检验方法
利用LeveneF方差齐性检验方法检验两总体方差是否存在显著差异;首先提出原假设;执行检验过程中,若概率P
值小于给定的显著性水平(一般为0.05),则拒绝原假设,认为两个总体的方差不等;否则认为两个总体的方差无显著性差异。4.独立样本T检验的一般步骤
在两样本来自正态总体且相互独立的假设下,独立样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。4.4
独立样本T检验4.4.2独立样本T检验SPSS实例分析【例4-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表4.9。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。
表4.9两品种玉米单位面积产量4.4
独立样本T检验4.4.2独立样本T检验SPSS实例分析第1步数据组织:
在SPSS数据文件中建立两个变量,分别为“品种”、“产量”,度量标准分别为“名义”、“度量”,变量“品种”的值标签为:a—品种A,b—品种B,录入数据后,保存名为data4-3.sav的SPSS数据文件;第2步独立样本T检验设置:选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“产量”作为要进行T检验的变量,将“品种”字段作为分组变量,定义分组变量的两个分组分别为“a”和“b”。打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同。4.4
独立样本T检验4.4.2独立样本T检验SPSS实例分析第3步运行结果及分析:独立样本T检验的基本描述统计量
玉米品种N均值标准差均值的标准误单位面积产量品种A881.250011.804964.17368品种B875.750010.024973.54436
上表给出了本例独立样本T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误。4.4
独立样本T检验4.4.2独立样本T检验SPSS实例分析独立样本T检验结果表
根据上表“方差方程的Levene检验”中的sig.为0.752,远大于设定的显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本T检验的结果应该看上表中的“假设方差相等”一行,第5列为相应的双尾检测概率(Sig.(双侧))为0.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。4.4
独立样本T检验4.4.3摘要独立样本T检验SPSS23中,在“分析→比较平均值”菜单下新增了一个子菜单“摘要独立样本T检验”,在该菜单中,用户可以直接填写统计样本的个案数、平均值、标准差等统计参数值,SPSS会根据摘要数据计算T检验。主要内容4.1假设检验4.2平均值分析
4.3
单样本T检验4.4独立样本T检验4.5配对样板T检验4.5配对样本T检验4.5.1基本概念及统计原理1.配对样本T检验的概念
配对样本T检验用于检验两个相关样本是否来自相同均值的正态总体,即推断两个总体的均值是否存在显著差异。其零假设为,其中和分别为第一个总体和第二个总体的均值。配对的概念是指两个样本的各样本值之间存在着对应关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本的容量相同。配对样本T检验与独立样本T检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”、“后”两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的,而是互相关联的。4.5配对样本T检验4.5.1基本概念及统计原理2.配对样本T检验的数学思想
配对样本T检验须求出每对观测值之差,所有样本值的观测值之差形成一个新的单样本,显然,如果两个样本的均值没有显著差异,则样本值之差的均值应该接近零,这实际上转换成了一个单样本的T检验。所以,配对样本T检验就是检验差值所来自的总体其均值是否为零,这就要求差值来自的总体服从正态分布。4.5配对样本T检验5.6.1基本概念及统计原理3.配对样本T检验的检验统计量在配对样本T检验中,设、分别为配对样本。其样本差值,此时检验统计量为:其中为的均值,S为的标准差,n为样本数,当时,t统计量服从自由度为n-1的t分布。4.5配对样本T检验4.5.2配对样本T检验SPSS实例分析【例4-4】以下是某大学跆拳道选手15人的平衡训练的数据,统计实验前、后平衡训练成绩是否有差异。训练前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88训练后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步数据组织:首先建立SPSS数据文件,建立两个变量:“训练前”、“训练后”,录入相应数据。第2步配对样本T检验设置:选择菜单“分析→比较均值→配对样本T检验”,弹出“配对样本T检验”对话框,同时选中“训练前”及“训练后”字段,将其加入“成对变量“列表框;打开“选项”对话框,指定置信水平和缺失值的处理方法;具体方法在前面已有讲述,可以参考前文4.5配对样本T检验4.5.2配对样本T检验SPSS实例分析第3步运行结果及分析:配对样本T检验的基本描述统计量配对样本相关性检验成对样本相关系数N相关系数Sig.对1训练前&训练后15.407.132左表是配对样本T检验的简单相关关系检验结果。表中显示训练前和训练后两样本的相关系数为0.407,相关系数的检验P值为0.132>显著性水平,接受原假设,可以认为训练前后的成绩没有明显的线性关系。。4.5配对样本T检验4.5.2配对样本T检验SPSS实例分析第3步运行结果及分析:配对样本T检验结果
上表是配对样本T检验的最终结果。sig.(双侧)为双尾检验概率p值在置信水平为95%时,显著性水平为0.05,由于概率p值为0.041,小于0.05,拒绝零假设,可以认为训练前后对成绩有显著效果。TheEnd第五章非参数检验主要内容5.1参数检验与非参数检验的比较5.2单样本的非参数检验5.3独立样本非参数检验5.4相关样本的非参数检验5.1
参数检验与非参数检验的比较1参数检验和非参数检验的区别参数检验和非参数检验最本质的区别:参数检验需要事先确定或假定总体的分布,非参数检验则不需要假定总体的分布,而是直接用样本来推断总体的分布。可以通过是否假定总体的分布来区分参数检验和非参数检验,除此之外,二者之间还可以从很多方面来区分。(1)研究的对象和目标不同。参数检验研究的是总体的参数,不涉及总体的分布检验,一旦总体的参数确定,总体的分布也就确定了;非参数检验的目标是直接从样本推导总体的分布或两个总体的分布是否相同。(2)研究的统计量有所不同。参数检验中很少用到秩来构造统计量,无论样本量大小都能对总体进行推断;非参数检验中常用秩、秩和等来构造统计量,且常要求样本量较大。5.1
参数检验与非参数检验的比较2非参数检验的优点(1)它对总体分布一般不做过多的限制性假设,任何分布都可以用非参数检验进行研究,从应用范围看,其应用范围大于参数检验。(2)由于非参数检验不依赖于总体的分布形式,因而它天
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设施黄瓜根系养护与修复方案
- 理疗效果满意度调查设计与应用
- 农产品田间质检取样制度
- 慢病营养干预实施方案
- 两条直线垂直(教学课件)2025-2026学年人教版数学七年级下册
- 筋膜松解术操作规范
- 减脂轻食配餐制作标准指引
- 工程安全试题及详解
- 中医肩颈推拿标准操作流程
- 岗位安全操作技能培训实施细则
- 《降维沟通:成为社牛的说话之道》阅读记录
- (2026版)医疗保障基金使用监督管理条例实施细则(定点医疗机构学习与解读)课件
- 2026年十大时事热点话题命题作文素材(全新版)
- 人工智能训练师三级理论知识试题及答案
- 2026抖音小游戏行业白皮书
- 【《离子速度成像技术研究文献综述》5500字】
- 离婚协议书 2026年民政局标准版
- 回款KPI考核制度
- 灌溉工程巡查培训课件
- TZ208-2007 客运专线铁路电力牵引供电工程施工技术指南
- 软件研发过程管理制度(3篇)
评论
0/150
提交评论