




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、. 统计分析的目的是研究总体的数量特征。为实现上述分析,统计分析的目的是研究总体的数量特征。为实现上述分析,往往采用两种方式实现:第一,数值计算,即计算常用的基本往往采用两种方式实现:第一,数值计算,即计算常用的基本统计量的值,通过数值来准确反映数据的基本统计特征;第二,统计量的值,通过数值来准确反映数据的基本统计特征;第二,图形绘制,即绘制常见的基本统计图形,通过图形来直观展现图形绘制,即绘制常见的基本统计图形,通过图形来直观展现数据的分布特点。通常,这两种方式都是混合使用的。数据的分布特点。通常,这两种方式都是混合使用的。 . 1.1.使用目的使用目的 频数分布表是描述性统计中最常用的方法
2、之一。它频数分布表是描述性统计中最常用的方法之一。它主要能够了解变量取值的状况,对把握数据分布特主要能够了解变量取值的状况,对把握数据分布特征非常有用。例如,了解某班学生考试的学习成绩、征非常有用。例如,了解某班学生考试的学习成绩、了解某地区居民的收入水平等都可以借助于频数分了解某地区居民的收入水平等都可以借助于频数分析。析。 3.1.1 3.1.1 频数分析的基本原理频数分析的基本原理. 频率分析频率分析 过程就是专门为产生频数表而设计的。它不过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分仅可以产生详细的频数表,还可以按要求给出某百分位点的数值以及常用的
3、条图、饼图等统计图。同时,位点的数值以及常用的条图、饼图等统计图。同时,SPSSSPSS的频数分析还可以进行分位数、描述集中趋势的的频数分析还可以进行分位数、描述集中趋势的基本统计量等计算功能。这些统计量的具体分析会在基本统计量等计算功能。这些统计量的具体分析会在以后章节中讲解。以后章节中讲解。.(1 1)采用重抽样技术从原始样本中抽取一定数量(自)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。己给定)的样本,此过程允许重复抽样。 (2 2)根据抽出的样本计算给定的统计量)根据抽出的样本计算给定的统计量T T。 (3 3)重复上述)重复上述N N次(一般大于次(
4、一般大于10001000),得到),得到N N个统计量个统计量T T。 (4 4) 计算上述计算上述N N个统计量个统计量T T的样本值,最终得到统计的样本值,最终得到统计量的估计值。量的估计值。. 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【频率频率】命令,弹出命令,弹出【频率频率】对话框,如图对话框,如图3-1所示,所示,这这是频数分析的主操作窗口。是频数分析的主操作窗口。Step 01图图3-13-1【频率频率】对话框对话框. 在左侧的候选变量列表框中,选取一个或多个在左侧的候选变量列表框中,选取一个或多个待分析变量,单击待分析变量,单击 按钮,将它们移入右侧的按钮,将
5、它们移入右侧的【变量变量】列列表框中。表框中。 勾选勾选【显示频率表格显示频率表格】复选框,输出频数分析表。复选框,输出频数分析表。 在该对话框中还可以单击在该对话框中还可以单击【统计量统计量】和和【图表图表】等按钮,进行其他基本统计分析,这些选项提供了丰富的统等按钮,进行其他基本统计分析,这些选项提供了丰富的统计输出结果。计输出结果。Step02Step03Step 04. 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-2所示的所示的【频率:频率:统计量统计量】对话框,该对话框主要用于输出各类基本统计对话框,该对话框主要用于输出各类基本统计量结果。量结果。图图3-2 3-2 【频率
6、:统计量频率:统计量】对话框对话框. 单击单击【图表图表】按钮,弹出如图按钮,弹出如图3-3所示的所示的【频率:频率:图图表表】对话框对话框,该对话框主要用于输出图形结果。该对话框主要用于输出图形结果。图图3-3 3-3 【频率:图表频率:图表】对话框对话框. 单击图单击图3-1中的中的【格式格式】按钮,弹出如图按钮,弹出如图3-4所示的所示的【频率:格式频率:格式】对话框,在此对话框中可以设对话框,在此对话框中可以设置频数表输出的格式。置频数表输出的格式。Step 05图图3-4 3-4 【频率:格式频率:格式】对话框对话框. 单击图单击图3-1中的中的【Bootstrap】按钮,弹出如图按
7、钮,弹出如图3-5所示的所示的【Bootstrap】对话框,在此对话框中可以进行下述对话框,在此对话框中可以进行下述统计量的统计量的Bootstrap估计估计。 支持均值、标准差、方差、中位数、偏度、峰度和百分支持均值、标准差、方差、中位数、偏度、峰度和百分位位数的数的Bootstrap估计。估计。 支持百分比的支持百分比的Bootstrap估计。估计。Step 06图3-5 【Bootstrap】对话框. 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSS软软件自动件自动输出结果。输出结果。Step 07. 假设某公司每周大约卖出假设某公司每周大约卖出20002000万件产品,但市场的
8、需求万件产品,但市场的需求不不稳定,该公司的生产经理想更好的掌握近期该产品的分布情稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。假设下面给出的销售数字(单位:百万)代表近期公司况。假设下面给出的销售数字(单位:百万)代表近期公司该产品每周的销售数据。利用频数分析你能得到什么有助于该产品每周的销售数据。利用频数分析你能得到什么有助于生产及销售的的信息?生产及销售的的信息? 24 18 18 26 24 23 16 18 21 20 21 24 19 24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20
9、20 19 22 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 1923 16 23 21 15 19 21 20 22 15 24 19. 打开打开SPSS软件和数据文件软件和数据文件3-1.sav,选择菜单栏,选择菜单栏中的中的【分析分析】【描述统计描述统计】【频率频率】命令,弹出命令,弹出【频率频率】对话框,如图对话框,如图3-6所示。所示。Step 01图图3-6 3-6 【频率频率】对话框对话框. 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择“sale”变量,将变量,将其添加
10、至其添加至【变量变量】列表框中,表示它是进行频数分析的变量,列表框中,表示它是进行频数分析的变量,如图如图3-7所示。所示。Step 02图图3-7 3-7 选择分析变量选择分析变量. 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-8所示的所示的【频频率:率:统计量统计量】对话框;勾选对话框;勾选【四分位数四分位数】复选框,要求输出四分复选框,要求输出四分数,然后单击数,然后单击【继续继续】按钮,返回按钮,返回【频率频率】对话框。对话框。Step 03图图3-8 3-8 选择输出统计量选择输出统计量. 单击单击【图表图表】按钮,弹出如图按钮,弹出如图3-9所示的所示的【频率:频率:图
11、图表表】对话框,由于该数据属于数值型,因此点选对话框,由于该数据属于数值型,因此点选【条形图条形图】单选钮,表示结果输出条形图;再单击单选钮,表示结果输出条形图;再单击【继续继续】按钮,返回按钮,返回【频率频率】对话框。对话框。Step 04图图3-9 3-9 选择输出图形类型选择输出图形类型. 单击单击【确定确定】按钮完成操作。按钮完成操作。(1 1)基本统计结果输出)基本统计结果输出 Step 05 频数分析基本统计结果频数分析基本统计结果N N有效有效3838缺失缺失0 0PercentilesPercentiles252518.0018.00505020.0020.00757523.0
12、023.00.(2)频数分析表输出)频数分析表输出 频数分析表频数分析表频率频率百分百百分百 有效百分比有效百分比 累积百分比累积百分比有有效效14141 12.62.62.62.62.62.615153 37.97.97.97.910.510.516162 25.35.35.35.315.815.817171 12.62.62.62.618.418.418183 37.97.97.97.926.326.319196 615.815.815.815.842.142.120204 410.510.510.510.552.652.621215 513.213.213.213.265.865.822
13、223 37.97.97.97.973.773.723233 37.97.97.97.981.681.624244 410.510.510.510.592.192.126262 25.35.35.35.397.497.427271 12.62.62.62.6100.0100.0TotTotal al3838100.0100.0100.0100.0.(3)(3)直方图直方图.3.2.1 3.2.1 描述统计分析的基本原理描述统计分析的基本原理 1.1.使用目的使用目的 2.2.刻画集中趋势的描述统计量刻画集中趋势的描述统计量 3. 3.刻画离散程度的描述统计量刻画离散程度的描述统计量 4. 4.
14、刻画分布形态的描述统计量刻画分布形态的描述统计量. 描述过程过程是连续资料统计描述应用最多的一个过程,描述过程过程是连续资料统计描述应用最多的一个过程,它可对变量进行描述性统计分析计算,并列出一系列相应的它可对变量进行描述性统计分析计算,并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能,就是可将原始数据转换成标准化值,并以变量的形殊功能,就是可将原始数据转换成标准化值,并以变量的形式保存。式保存。 . 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【描描述述】命令,弹出命令,弹出【描述性描述性】对话框
15、,如图对话框,如图3-12所示,该对所示,该对话话框是描述性统计分析的主操作窗口。框是描述性统计分析的主操作窗口。Step 01图图3-12 3-12 【描述描述】对话框对话框. 在在左侧的候选变量列表框中选取一个或多左侧的候选变量列表框中选取一个或多个待分个待分析变量,将它们移入右侧的析变量,将它们移入右侧的【变量变量】列表框中。列表框中。 单击单击【选项选项】按钮,弹出如图按钮,弹出如图3-13所示的所示的【描描述:选项述:选项】对话框,该对话框用于指定输出的描述性统计对话框,该对话框用于指定输出的描述性统计量。这些统计量的含义是:均数、总和、标准差、方差、量。这些统计量的含义是:均数、总
16、和、标准差、方差、全距、最小值)、最大值、标准误差、峰度系数和偏度系全距、最小值)、最大值、标准误差、峰度系数和偏度系数。数。Step 02Step 03图图3-133-13【描述:选项描述:选项】对话框对话框. 在在【描述性描述性】对话框中,勾选对话框中,勾选【将标准化得分另将标准化得分另存为变量存为变量】复选框,表示对所选择的每一个变量进行标准化复选框,表示对所选择的每一个变量进行标准化处理,同时产生相应的处理,同时产生相应的Z得分,并作为新变量保存到数据窗得分,并作为新变量保存到数据窗口中。口中。 单击单击【Bootstrap】按钮,弹出如图按钮,弹出如图3-5所示所示的的【Bootst
17、rap】对话框,在此对话框中可以进行均值、标准对话框,在此对话框中可以进行均值、标准差、方差、偏度和峰度的差、方差、偏度和峰度的Bootstrap估计。估计。 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSS软件自动输软件自动输出结果。出结果。Step 04Step 05Step 06.请你分析不同性别演员获得奥斯卡奖的年龄差异性。请你分析不同性别演员获得奥斯卡奖的年龄差异性。 男演员:男演员:32 37 36 32 51 53 33 61 35 32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 45 55 39 7
18、6 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 6046 31 47 45 60 女演员:女演员:50 44 35 80 26 28 41 21 61 50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 37 26 34 34 35 26
19、61 60 34 24 30 37 31 27 39 3431 27 39 34. 打开随书光盘中的数据文件打开随书光盘中的数据文件3-2.sav,其中,其中“male”和和“female”列分别表示男演员和女演员;选择列分别表示男演员和女演员;选择菜单栏中的菜单栏中的【分析分析】【描述性统计描述性统计】【描述描述】命令,弹命令,弹出出【描述性描述性】对话框,如图对话框,如图3-14所示。所示。Step 01图图3-14 3-14 【描述性描述性】对话框对话框. 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择“male”和和“female”变量,将其添加至变量,将其添加至【变量变量】
20、列表框中,表示它是列表框中,表示它是进行描述性统计分析的变量,如图进行描述性统计分析的变量,如图3-15所示。所示。Step 02图图3-15 3-15 选择分析变量选择分析变量. 单击单击【选项选项】按钮,其主要目的是选择需要输出按钮,其主要目的是选择需要输出的描述性统计量,这里除了选择系统默认的统计量外,还勾的描述性统计量,这里除了选择系统默认的统计量外,还勾选了范围、偏度系数和峰度系数复选框;再单击选了范围、偏度系数和峰度系数复选框;再单击【继续继续】按按钮,返回钮,返回【描述性描述性】对话框,如图对话框,如图3-16所示。所示。 单击单击【确定确定】按钮完成操作。按钮完成操作。Step
21、 03Step 04图图3-16 3-16 选择输出图形类型选择输出图形类型.男演员女演员Valid N (listwise)N统计量363636全距统计量4559极小值统计量3121极大值统计量7680均值统计量45.1438.94标准差统计量10.40613.546偏度统计量0.8981.503标准误0.3930.393峰度统计量0.7042.111标准误0.7680.768.3.3.1 3.3.1 探索性分析的基本原理探索性分析的基本原理 1.1.使用目的使用目的 探索性数据分析(探索性数据分析(Exploratary Data AnalysisExploratary Data Anal
22、ysis,简称简称EDAEDA)的基本思想是从数据本身出发,不拘泥于模)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,致情况,也可以为进一步结合模型的研究提供线索,为传统的统计推断提供良好的基础和减少盲目性。为传统的统计推断提供良好的基础和减少盲目性。.2.2.主要内容主要内容一般来说,进行探索性分析主要考察以下内容。一般来说,进行探索性分析主要考察以下内容。(1)(1)检查数据是否有错。过大或过小的数据均可能是异检查数据是否有错。过大或过小的数据均可能是异常值、影
23、响点或错误值。要检查这样的数据,并分析常值、影响点或错误值。要检查这样的数据,并分析原因,然后决定是否从分析中剔除这些数据。原因,然后决定是否从分析中剔除这些数据。(2)(2)获得数据分布特征。很多统计方法模型对数据的分获得数据分布特征。很多统计方法模型对数据的分布有要求,如方差分析就需要数据服从正态分布。布有要求,如方差分析就需要数据服从正态分布。(3)(3)对数据的初步观察,发现一些内在规律对数据的初步观察,发现一些内在规律。. SPSS SPSS中的探索过程用于计算指定变量的探索性统计量和中的探索过程用于计算指定变量的探索性统计量和有关的图形。它既可以对观测量整体分析,也可以进行分组有关
24、的图形。它既可以对观测量整体分析,也可以进行分组分析。从这个过程可以获得箱线图、茎叶图、直方图、各种分析。从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。分布情况。. 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【探索探索】命令,弹出命令,弹出【探索探索】对话框,如图对话框,如图3-17所示所示,该对话框是探索性分析的主操作窗口。该对话框是探索性分析的主操作窗口。S
25、tep 01图图3-17 3-17 【探索探索】对话框对话框. 在对话框左侧的候选变量列表框中选取一个或多在对话框左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的个待分析变量,将它们移入右侧的【因变量列表因变量列表】列表框中列表框中,表示要进行探索性分析的变量。,表示要进行探索性分析的变量。 在候选变量列表框中可以选取一个或多个分组变在候选变量列表框中可以选取一个或多个分组变量,将它们移入右侧的量,将它们移入右侧的【因子列表因子列表】列表框中。分组变量的列表框中。分组变量的选择可以将数据按该变量中的观测值进行分组分析。如果选选择可以将数据按该变量中的观测值进行分组分析。如果选择
26、的分组变量不止一个,那么会以分组变量的不同取值进行择的分组变量不止一个,那么会以分组变量的不同取值进行组合分组。组合分组。 从候选变量列表框中选择一个变量作为标识变量从候选变量列表框中选择一个变量作为标识变量,并将其移入,并将其移入【标注个案标注个案】列表框中。选择标识变量的作用列表框中。选择标识变量的作用在于,当系统在数据探索过程中发现异常值时,便可利用标在于,当系统在数据探索过程中发现异常值时,便可利用标识变量加以标记,以便于用户找这些异常值。如果不选择它识变量加以标记,以便于用户找这些异常值。如果不选择它,系统默认以,系统默认以ID变量作为标识变量。变量作为标识变量。Step 02Ste
27、p 03Step 04. 在在【探索探索】对话框下面的对话框下面的【输出输出】选项组中可选项组中可以选择以下输出项。以选择以下输出项。 两者都:输出图形以及描述性统计量。两者都:输出图形以及描述性统计量。 统计量:只输出描述统计量。统计量:只输出描述统计量。 图:只输出图形。图:只输出图形。 在在【探索探索】对话框中还可以点选对话框中还可以点选【统计量统计量】单单选钮,这个选项提供了各类基本描述性统计输出结果;选钮,这个选项提供了各类基本描述性统计输出结果;Step 06Step 07图图3-18 3-18 【探索:统计量)探索:统计量)】对话框对话框. 在在【探索探索】对话框中还可以点选对话
28、框中还可以点选【绘制绘制】单选钮,单选钮,它提供了图形输出类型。它提供了图形输出类型。Step 07图图3-19 3-19 【探索:图探索:图】对话框对话框. 在在【探索探索】对话框中还可以单击对话框中还可以单击【选项选项】按钮按钮,弹出如图,弹出如图3-20所示的所示的【探索:选项探索:选项】对话框,在该对话对话框,在该对话框中确定对待缺失值的方式。框中确定对待缺失值的方式。Step 08图图3-20 3-20 【探索:选项探索:选项】对话框对话框. 单击单击【Bootstrap】按钮,弹按钮,弹【Bootstrap】对话框,在该对话框中可以进行如下统计量对话框,在该对话框中可以进行如下统计
29、量Bootstrap估计。估计。 支持均值、支持均值、5% 切尾均值、标准差、方差、中位数、切尾均值、标准差、方差、中位数、偏度、峰度和内距的偏度、峰度和内距的Bootstrap估计。估计。 M估计量表支持估计量表支持Huber的的M估计量、估计量、Tukey的双权重的双权重、Hampel的的M 估计量和估计量和Andrew的的Wave的的Bootstrap 估计。估计。 百分位数表支持百分位数的百分位数表支持百分位数的Bootstrap估计。估计。 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSS软件自软件自动输出结果。动输出结果。Step 09Step 10. 打开随书光盘中的数据
30、文件打开随书光盘中的数据文件3-3.sav,其中增加变,其中增加变量量“地域地域”表示所在城市的区域位置,表示所在城市的区域位置,“1”表示南方城市,表示南方城市,“2”表示北方城市。选择菜单栏中的表示北方城市。选择菜单栏中的【分析分析】【描述统描述统计计】【探索探索】命令,弹出命令,弹出【探索探索】对话框,如图对话框,如图3-21所所示。示。Step 01图图3-21 3-21 【探索探索】对话框对话框. 在候选变量列表框中将变量在候选变量列表框中将变量“年平均温度年平均温度”添加至添加至【因变量列表因变量列表】列表框中,表示它是进行探索列表框中,表示它是进行探索性分析的变量。性分析的变量。
31、 将变量将变量“地域地域”添加至添加至【因子列表因子列表】列表列表框中,表示根据地域位置不同来进行数据分析。框中,表示根据地域位置不同来进行数据分析。Step 02Step 03. 选择变量选择变量“城市城市”移入移入【标注个案标注个案】列表列表框作为标识变量,如图框作为标识变量,如图3-22所示。所示。Step04图图3-22 3-22 选择变量选择变量. 单击单击【统计量统计量】按钮,在弹出的如图按钮,在弹出的如图3-23所示所示的的【探索:统计量探索:统计量】对话框中勾选对话框中勾选【M-估计量估计量】复选框,分复选框,分析析样本数据的稳定性,其他选项保持默认状态;单击样本数据的稳定性,
32、其他选项保持默认状态;单击【继续继续】按钮,返回按钮,返回【探索探索】对话框。对话框。Step05图图3-23 3-23 【探索:统计量探索:统计量】对话框对话框. 单击单击【确定确定】按钮完成操作。按钮完成操作。Step 06.(1)(1)基本统计信息汇总基本统计信息汇总 基本统计信息基本统计信息地地域域案例有效有效缺失缺失合计合计N N百分比百分比百百分分比比N N百分比百分比年平年平均气均气温温南南方方1616100.0100.0%0 0 0%0% 1616100.0%100.0%北北方方1717100.0100.0%0 0 0%0% 1717100.0%100.0%.(2 2)描述性统
33、计量表)描述性统计量表 地域地域统计量统计量标准误标准误年年平平均均气气温温南方南方均值均值18.700018.70000.672000.67200均值的均值的95% 95% 置置信区间信区间下限下限17.267717.2677上限上限20.132320.13235% 5% 修整均值修整均值18.577818.5778均值均值17.800017.8000方差方差7.2257.225标准差标准差2.688002.68800极小值极小值14.6014.60极大值极大值25.0025.00范围范围10.4010.40四分位距四分位距3.253.25偏度偏度1.0011.0010.5640.564峰度
34、峰度0.7820.7821.0911.091.北方北方均值均值11.035311.03530.800780.80078均值的均值的95% 95% 置置信区间信区间下限下限9.33779.3377上限上限12.732912.73295% 5% 修整均值修整均值11.105911.1059均值均值11.000011.0000方差方差10.90110.901标准差标准差3.301693.30169极小值极小值5.405.40极大值极大值15.4015.40范围范围10.0010.00四分位距四分位距5.655.65偏度偏度-0.251-0.2510.5500.550峰度峰度-1.178-1.1781
35、.0631.063.(3 3)M M估计量估计量 M M估计量结果表估计量结果表a. a. 权数取值为权数取值为 1.339.1.339.b. b. 权数取值为权数取值为4.685.4.685.c. c. 权数取值分别为权数取值分别为1.700,3.400, 1.700,3.400, and 8.500and 8.500d. d. 权数取值为权数取值为1.3401.340* *pi.pi.地域地域HubeHuber r的的M-M-估计估计器器a aTukeyTukey的双的双权重权重b bHampelHampel的的M-M-估计器估计器c cAndrewsAndrews波波d d年平均气年平均
36、气温温南方南方18.0618.06949417.7217.72080817.977617.977617.718217.7182北方北方11.2011.20757511.1711.17060611.174111.174111.169611.1696.探索性分析的茎叶探索性分析的茎叶图年平均气温年平均气温Stem-and-LeafPlotfor地域地域=南方南方FrequencyStem&Leaf1.001.411.001.667777778893.002.0121.00Extremes(=25)Stemwidth:10.0Eachleaf:1case(s)年平均气温年平均气温Stem-a
37、nd-LeafPlotfor地域地域=北方北方FrequencyStem&Leaf6.000.5668898.001.001133343.001.555Stemwidth:10.0Eachleaf:1case(s).3.4.1 3.4.1 列联表分析的基本原理列联表分析的基本原理 1.1.使用目的使用目的 列联表是指一个频率对应两个变量的表(一个列联表是指一个频率对应两个变量的表(一个变量用来对行分类,第二个变量用来对列分类)。列变量用来对行分类,第二个变量用来对列分类)。列联表非常重要,它经常被用来分析调查结果。它有两联表非常重要,它经常被用来分析调查结果。它有两个基本任务:第一,根
38、据收集到的样本数据产生二维个基本任务:第一,根据收集到的样本数据产生二维或多维交叉列联表;第二,在列联表基础上,对两两或多维交叉列联表;第二,在列联表基础上,对两两变量间是否存在一定的相关性进行分析。变量间是否存在一定的相关性进行分析。.2.2.交叉列联表交叉列联表 .3.3.行列变量间关系的分析行列变量间关系的分析 列联表的频数分布不可能用来直接确定行、列变量列联表的频数分布不可能用来直接确定行、列变量之间的关系及关系的强弱。令人感兴趣的二维列联表之间的关系及关系的强弱。令人感兴趣的二维列联表的检验问题是行、列变量的独立性检验。的检验问题是行、列变量的独立性检验。 独立性检验指的是对列联表中
39、行变量和列变量无关独立性检验指的是对列联表中行变量和列变量无关这个零假设进行的检验,即检验行、列变量之间是否这个零假设进行的检验,即检验行、列变量之间是否彼此独立。常用的衡量变量间相关程度的统计量是简彼此独立。常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行、列变单相关系数,但在交叉列联表分析中,由于行、列变量往往不是连续等距变量,不符合计算简单相关系数量往往不是连续等距变量,不符合计算简单相关系数的前提要求。的前提要求。.所以,一般采用的检验方法是卡方(所以,一般采用的检验方法是卡方(2 2)检验,)检验,它的计算公式为:它的计算公式为:202eefff其中,其中
40、,f f0 0表示实际观察频数,表示实际观察频数,f fe e表示期望频数。表示期望频数。 . 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【交交叉表叉表】命令,弹出命令,弹出【交叉表交叉表】对话框,如图对话框,如图3-25所示,这所示,这是是列联表分析的主操作窗口。列联表分析的主操作窗口。Step 01图图3-25 3-25 【交叉表交叉表】对话框对话框. 在左侧的候选变量列表框中选取一个或多个待分析在左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的变量,将它们移入右侧的【行行】列表框中,作为列联表的行列表框中,作为列联表的行变量;同理,选择若干候选变量移入右
41、侧的变量;同理,选择若干候选变量移入右侧的【列列】列表框中列表框中,作为列联表的列变量。,作为列联表的列变量。 如果要进行三维或多维列联表分析,可以根据需如果要进行三维或多维列联表分析,可以根据需要选择控制变量进入要选择控制变量进入【层层1的的1】列表另外一个控制变量,列表另外一个控制变量,首首先单击先单击【下一张)下一张)】按钮,再选入一个变量;单击按钮,再选入一个变量;单击【上一张上一张】按钮可以重新选择以前确定的变量。按钮可以重新选择以前确定的变量。 在在【交叉表交叉表】对话框下面有两个复选框,它们用对话框下面有两个复选框,它们用来选择列联表的输出格式。来选择列联表的输出格式。 显示复式
42、条形图:显示各变量交叉分组下的频数分布条形显示复式条形图:显示各变量交叉分组下的频数分布条形图。图。 取消表格:只输出统计量,而不输出列联表。取消表格:只输出统计量,而不输出列联表。Step 02Step 03Step 04. 在在【交叉表交叉表】对话框中单击对话框中单击【统计量统计量】按钮,弹按钮,弹出如图出如图3-26所示的所示的【交叉表:统计量交叉表:统计量】对话框。该对话框对话框。该对话框主主要是根据数据类型选择不同的独立性检验方法和相关度量,要是根据数据类型选择不同的独立性检验方法和相关度量,在对话框中选择输出统计量,完成后单击在对话框中选择输出统计量,完成后单击【继续继续】按钮,返
43、按钮,返回主对话框。回主对话框。Step 05图图3-26 3-26 【交叉表:统计量)交叉表:统计量)】. 在在【交叉表交叉表】对话框中单击对话框中单击【单元格单元格】按钮,弹按钮,弹出如图出如图3-27所示的所示的【交叉表:单元显示交叉表:单元显示】对话框,在该对对话框,在该对话话框中可以选择显示在列联表单元格中的统计量,包括观测数框中可以选择显示在列联表单元格中的统计量,包括观测数量、百分比和残差,在对话框中选择相应选项,完成后单击量、百分比和残差,在对话框中选择相应选项,完成后单击【继续继续】按钮,返回主对话框。按钮,返回主对话框。Step 06图图3-27 3-27 【交叉表:单元显
44、示交叉表:单元显示】对话框对话框. 在在【交叉表交叉表】对话框中单击对话框中单击【格式格式】按钮,按钮,弹出如图弹出如图3-28所示的所示的【交叉表:格式交叉表:格式】对话框,用于对话框,用于选择各单元格的输出排列顺序。选择各单元格的输出排列顺序。Step 07图图3-28 3-28 【交叉表:格式交叉表:格式】对话框对话框. 在在【交叉表交叉表】对话框中单击对话框中单击【Bootstrap】按钮,按钮,弹出弹出【Bootstrap】对话框,在该对话框中可以进行如下统对话框,在该对话框中可以进行如下统计量的计量的Bootstrap估计。估计。 单击单击【OK】按钮结束操作,按钮结束操作,SPS
45、S软件自动输出软件自动输出结果。结果。Step 08Step 09.1.1.实例内容实例内容 在一次上海大学生身体素质的实际调查中,选择了部分在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见大专院校的学生进行实际问卷调查,收集的数据见3-4.sav3-4.sav。调查内容主要包括:性别、出生日期、身高、体重、血型、调查内容主要包括:性别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容。请教育背景、学科、男女身高级别和男女体重级别等内容。请根据调查数据分析下面问题:根据调查数据分析下面问题: (1)进行)进行“性别性别”和
46、和“体重级别体重级别”双因素交叉作用下的列双因素交叉作用下的列联表分析,并研究联表分析,并研究“性别性别”对对“体重级别体重级别”有无显著性影响有无显著性影响。 (2)进行)进行“教育背景教育背景”和和“身高级别身高级别”双因素交叉作用下双因素交叉作用下的列联表分析,并研究的列联表分析,并研究“教育背景教育背景”对对“身高级别身高级别”有无显有无显著性影响。著性影响。. 打开数据文件打开数据文件3-4.sav,选择菜单栏中的,选择菜单栏中的【分析分析】【描述统计描述统计】【交叉表交叉表】命令,弹出命令,弹出【交叉表交叉表】对话对话框,如图框,如图3-29所示。所示。Step 01图图3-29
47、3-29 【交叉表交叉表】对话框对话框. 在候选变量列表框中将变量在候选变量列表框中将变量“性别(性别(sex)”添加添加至至【行行】列表框中,表示它是交叉列联表中的行变量;将变列表框中,表示它是交叉列联表中的行变量;将变量量“体重级别(体重级别(wm)”添加至添加至【列列】列表框中,表示它是列表框中,表示它是交叉列联表中的列变量,如图交叉列联表中的列变量,如图3-30所示。所示。Step 02图图3-30 3-30 选择行、列变量选择行、列变量. 单击单击【统计量统计量】按钮,弹出按钮,弹出【交叉表:统计量交叉表:统计量】对话框,如图对话框,如图3-31所示;勾选所示;勾选【卡方卡方】复选框
48、,利用复选框,利用卡卡方检验来检验方检验来检验“性别性别”和和“体重级别体重级别”的独立性;再单击的独立性;再单击【继续继续】按钮,返回按钮,返回【交叉表交叉表】对话框。对话框。Step 03图3-31 【交叉表:统计量)】对话框. 由于要进行由于要进行“性别性别”和和“体重级别体重级别”的频数分析的频数分析,因此在,因此在【交叉表交叉表】对话框中单击对话框中单击【Cells(单元)(单元)】选项选项,弹出,弹出【交叉表:单元显示交叉表:单元显示】对话框,如图对话框,如图3-32所示;所示;勾勾选选【百分比百分比】选项组中的选项组中的【行行】、【列列】和和【总数总数】复选复选框,再单击框,再单
49、击【继续继续】按钮,返回按钮,返回【交叉表交叉表】对话框。对话框。Step 04图图3-32 3-32 选择列联表输出格式选择列联表输出格式. 勾选勾选【显示复式条形图显示复式条形图】复选框,表示利用条复选框,表示利用条形图来反映不同性别之间的体重级别差异,如图形图来反映不同性别之间的体重级别差异,如图3-33所示。所示。Step 05图图3-33 3-33 勾选复选框勾选复选框. 单击单击【确定确定】按钮完成操作。按钮完成操作。Step 06. (1 1)基本统计信息汇总)基本统计信息汇总基本统计信息汇总基本统计信息汇总有效缺失合计N百分比N百分比N百分比性别 * 体重级别214 100.0
50、%00.0%214100.0%.(2 2)“性别性别”和和“体重级别体重级别”的列联表的列联表 表表3-11 “3-11 “性别性别”和和“体重级别体重级别”变量的列联表变量的列联表体重级别体重级别合计合计轻(轻(60-60-)中等中等(60607070)重重(70+70+)性别性别男男计数计数1717353517176969性别中的性别中的%24.6%24.6%50.7%50.7%24.6%24.6%100.0100.0%体重级别中体重级别中的的%11.1%11.1%85.4%85.4%85.0%85.0%32.2%32.2%总数的总数的% % 7.9%7.9%16.4%16.4%7.9%7
51、.9%32.2%32.2%女女计数计数1361366 63 3145145性别中的性别中的%93.8%93.8%4.1%4.1%2.1%2.1%100.0100.0%体重级别中体重级别中的的%88.9%88.9%14.6%14.6%15.0%15.0%67.8%67.8%总数的总数的% % 63.6%63.6%2.8%2.8%1.4%1.4%67.8%67.8%合计合计计数计数15315341412020214214性别中的性别中的%71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%体重级别中体重级别中的的%100.0%100.0%100.0%100.0%100.0
52、%100.0%100.0100.0%总数的总数的% % 71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%.(3 3)“性别性别”和和“体重级别体重级别”的独立性检验的独立性检验表表3-12 3-12 卡方检验结果卡方检验结果值值dfdf渐进渐进 Sig. Sig. (双侧)(双侧)Pearson Pearson 卡方卡方2 20.0000.000似然比似然比111.290111.2902 20.0000.000线性和线性组合线性和线性组合92.73992.7391 10.0000.000有效案例中的有效案例中的N N214214.(4 4)体重级别条形图)体重级别
53、条形图.3.5.1 3.5.1 比率分析的基本原理比率分析的基本原理 比率分析生成比率变量,并对该比率变量计算基本描比率分析生成比率变量,并对该比率变量计算基本描述性统计量(如均值、中位数、标准差、全距等),进述性统计量(如均值、中位数、标准差、全距等),进而刻画出比率变量的集中趋势和离散程度。除此之外,而刻画出比率变量的集中趋势和离散程度。除此之外,SPSS 21.0SPSS 21.0还提供了其他对比描述指标,大致也属于集中还提供了其他对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴。趋势描述指标和离散程度描述指标的范畴。. 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计
54、描述统计】【比率比率】命令,弹出命令,弹出【比值统计量)比值统计量)】对话框,如图对话框,如图3-35所示,这所示,这是是比率分析的主操作窗口。比率分析的主操作窗口。Step 01图图3-35 3-35 【比值统计量比值统计量】对话框对话框. 在对话框左侧的候选变量列表框中选取一个分在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分子,将它移入右侧的析变量作为比率分析的分子,将它移入右侧的【分子分子】列表列表框中。框中。 在对话框左侧的候选变量列表框中选取一个分析在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分母,将它移入右侧的变量作为比率分析的分母,将它移入右侧的【分母分母】列表框列表框中。中。 在对话框左侧的候选变量列表框中选取一个变在对话框左侧的候选变量列表框中选取一个变量作为分组变量,将它移入右侧的量作为分组变量,将它移入右侧的【组变量组变量】列表框中。列表框中。 在主对话框中,用户可以选择如下比率分析的结在主对话框中,用户可以选择如下比率分析的结果输出类型。果输出类型。 显示结果:系统默认项,选择是否显示结果显示结果:系统默认项,选择是否
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年食品与饮料行业食品行业食品安全风险沟通策略报告
- 2025年物联网技术在智能电网领域的应用与发展报告
- 2025年互联网金融平台资金存管业务合规性检查与安全保障体系优化报告
- 2025年食品冷链物流温控技术与冷链物流企业物流信息化系统建设与成本控制报告
- 2025年3D打印个性化牙科种植体医疗器械可行性研究报告
- 2025年城市生活垃圾分类处理公众参与意识培养与长效机制研究报告
- 工业互联网领域2025年区块链智能合约安全漏洞检测与修复技术报告
- 2025年新能源汽车废旧电池回收利用产业链关键技术突破与应用前景报告
- 2025年高校创新创业教育课程体系优化与实践教学策略研究报告
- 2025年中药配方颗粒质量标准与市场品牌培育及市场拓展策略研究报告
- 部编版二年级下册语文课件语文园地七-小动物
- 融合终端微应用开发设计规范-版本
- 电力市场交易模式
- 妇科门诊护理质量控制管理考核标准
- 秋收起义-完整版课件
- 朝阳区编制外岗位应聘人员报名表
- 自动喷水灭火系统质量验收项目缺陷判定记录
- 人教版一年级起点小学二年级英语下册全套教案
- T-CCIAT 0043-2022 建筑工程渗漏治理技术规程
- 供货、安装、调试、验收方案
- 电气设备-开篇绪论汇编
评论
0/150
提交评论