-第九章属性(分类)数据分析_第1页
-第九章属性(分类)数据分析_第2页
-第九章属性(分类)数据分析_第3页
-第九章属性(分类)数据分析_第4页
-第九章属性(分类)数据分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第九章 属性(分类)数据分析 n9.1 属性数据及其分析属性数据及其分析 n9.2 SAS中的属性数据分析中的属性数据分析 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 n9.1 9.1 属性数据及其分析属性数据及其分析 n9.1.1 属性数据分析与列联表属性数据分析与列联表 n9.1.2 属性变量关联性分析属性变量关联性分析 n9.1.3 属性变量关联度计算属性变量关联度计算 n9.1.4 有序变量关联性分析有序变量关联性分析 STATSTATSTATSTATSASSAS软件

2、与统计应用教程软件与统计应用教程 9.1.1 属性数据分析与列联表属性数据分析与列联表 1. 1. 属性变量与属性数据分析属性变量与属性数据分析 从变量的测量水平来看分为两类:连续变量和属性从变量的测量水平来看分为两类:连续变量和属性 (Categorical)变量,属性变量又可分为有序的变量,属性变量又可分为有序的(Ordinal) 和无序的变量。和无序的变量。 对属性数据进行分析,将达到以下几方面的目的:对属性数据进行分析,将达到以下几方面的目的: 1) 产生汇总分类数据产生汇总分类数据列联表;列联表; 2) 检验属性变量间的独立性检验属性变量间的独立性(无关联性无关联性); 3) 计算属

3、性变量间的关联性统计量;计算属性变量间的关联性统计量; 4) 对高维数据进行分层分析和建模。对高维数据进行分层分析和建模。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 列联表列联表 列联表(列联表(contingency table)是由两个以上的属性变)是由两个以上的属性变 量进行交叉分类的频数分布表。例如一个集团公司在四量进行交叉分类的频数分布表。例如一个集团公司在四 个不同的区域设有分公司,现该集团公司欲进行一项改个不同的区域设有分公司,现该集团公司欲进行一项改 革,此项改革可能涉及各分公司的利益,故采用抽样调革,此项改革可能涉及各分公司

4、的利益,故采用抽样调 查方法,从四个分公司共抽取查方法,从四个分公司共抽取420个样本单位,了解职个样本单位,了解职 工对此项改革的看法,调查结果如表工对此项改革的看法,调查结果如表9-1所示。所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 表9-1 关于改革方案的调查结果(单位:人) 表中的行表中的行(row)是态度变量,这里划分为两类:赞成改是态度变量,这里划分为两类:赞成改 革方案或反对改革方案;表中的列革方案或反对改革方案;表中的列(column)是单位变量,是单位变量, 这里划分为四类,即四个分公司。表这里划分为四类,即四个分公司。表9-1所

5、示的列联表所示的列联表 称为称为2 4表。表。 一分公司二分公司三分公司四分公司合计 赞成该方案68755779279 反对该方案32453331141 合计10012090110420 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 交叉表的基本形式如图交叉表的基本形式如图9-1所示。所示。 这是一张具有这是一张具有r行和行和c列的一般列联表,称它为列的一般列联表,称它为r c表。表。 其中,第其中,第i行第行第j列的单元表示为单元列的单元表示为单元ij。交叉表常给出在。交叉表常给出在 所有行变量和列变量的组合中的观测个数。表中的总观所有行变量和列变量的组合

6、中的观测个数。表中的总观 测个数用测个数用n表示,在单元表示,在单元ij中的观测个数表示为中的观测个数表示为nij,称为,称为 单元频数。单元频数。 c j j n 1 1 c j j n 1 2 c j rj n 1 r i i n 1 1 r i i n 1 2 r i ic n 1 r i c j ij n 11 列 行 第1列第2列第c列行边缘频数 第1行n11n12n1c 第2行n21n22n2c 第r行nr1nr2nrc 列边缘频数 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.1.2 属性变量关联性分析属性变量关联性分析 对于不同的属性变量

7、,从列联表中可以得到它们联合对于不同的属性变量,从列联表中可以得到它们联合 分布的信息。但有时还想知道形成列联表的行和列变量分布的信息。但有时还想知道形成列联表的行和列变量 间是否有某种关联性,即一个变量取不同数值时,另一间是否有某种关联性,即一个变量取不同数值时,另一 个变量的分布是否有显著的不同,这就是属性变量关联个变量的分布是否有显著的不同,这就是属性变量关联 性分析的内容。性分析的内容。 属性变量关联性检验的假设为属性变量关联性检验的假设为 H0:变量之间无关联性;:变量之间无关联性; H1:变量之间有关联性:变量之间有关联性 由于变量之间无关联性说明变量互相独立,所以原假由于变量之间

8、无关联性说明变量互相独立,所以原假 设和备择假设可以写为:设和备择假设可以写为: H0:变量之间独立;:变量之间独立; H1:变量之间不独立:变量之间不独立 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 1. 1. 2 2检验检验 在双向表的情形下,如果行变量与列变量无关联性的在双向表的情形下,如果行变量与列变量无关联性的 原假设原假设H0成立,则列联表中各行的相对分布应近似相等,成立,则列联表中各行的相对分布应近似相等, 即即 (j = 1,2,c) 或或 (j = 1,2,c) 其中其中mij称为列联表中单元称为列联表中单元ij在无关联性假设下的期望频在

9、无关联性假设下的期望频 数,而数,而nij是单元是单元ij的观测频数。的观测频数。 n n n n i ij j ij ij ij def i ij j ij ij m n nn n STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 为了检验无关联性,将观测的单元频数与无关联的原假为了检验无关联性,将观测的单元频数与无关联的原假 设为真时单元的期望频数进行比较。一个通常使用的检设为真时单元的期望频数进行比较。一个通常使用的检 验是验是 2检验。检验。 2统计量为:统计量为: 在在H0成立的条件下,当观测数据较大时,成立的条件下,当观测数据较大时, 2统计量的统计

10、量的 分布近似服从自由度为分布近似服从自由度为(r - 1)(c 1)的的 2分布。分布。 r i c j ij ijij m mn 11 2 2 )( STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 由于由于 2分布是一种连续性分布,而属性数据是不连续的,分布是一种连续性分布,而属性数据是不连续的, 故上式只是一个近似计算公式。计算出来的故上式只是一个近似计算公式。计算出来的 2值往往偏值往往偏 大,相应的大,相应的p值偏小,从而人为地增加了犯第一类错误值偏小,从而人为地增加了犯第一类错误 的机会。为纠正这种偏性,可采用校正的机会。为纠正这种偏性,可采用校正

11、 2,用,用 C2表示。表示。 注:通常要求注:通常要求 2检验应满足的条件是:检验应满足的条件是:n40且所有单且所有单 元的期望频数均不小于元的期望频数均不小于5。 2校正的条件:校正的条件:n40但有单元的期望频数小于但有单元的期望频数小于5。 r i c j ij ijij C m mn 11 2 2 )5 . 0|(| STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. Fisher2. Fisher精确检验精确检验 Fisher精确检验建立在概率论中超几何分布的基础上,精确检验建立在概率论中超几何分布的基础上, 对于单元频数小的列联表来说,它是特

12、别合适的。对于单元频数小的列联表来说,它是特别合适的。 Fisher精确检验计算在精确检验计算在H0成立的条件下,当总频数和成立的条件下,当总频数和 边缘频数固定时,各种可能的表的超几何概率边缘频数固定时,各种可能的表的超几何概率p之和之和 对于双边检验,对于双边检验,A是具有概率是具有概率p小于或等于观测表概率小于或等于观测表概率 的表的集合;对于左(右)边检验,的表的集合;对于左(右)边检验,A是这样一些表的是这样一些表的 集合,其中每个表的单元集合,其中每个表的单元ij中频数小于(大于)或等于中频数小于(大于)或等于 观测表中相应的频数。观测表中相应的频数。 A pPROB STATST

13、ATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.1.3 属性变量关联度计算属性变量关联度计算 1. 1. 系数系数 系数是描述系数是描述2 2表数据关联程度最常用的一种相关系表数据关联程度最常用的一种相关系 数。其计算公式为:数。其计算公式为: 其中,其中, 2即即 2统计量。统计量。 |的取值范围是在的取值范围是在0 1之间,之间,的绝对值越大,说明的绝对值越大,说明 行变量与列变量的关联程度越高。行变量与列变量的关联程度越高。 = 0,表示变量之间,表示变量之间 相互独立;相互独立;| = 1,表示变量之间完全相关,此时列联,表示变量之间完全相关,此时列联 表某个

14、方向对角线上的值全为表某个方向对角线上的值全为0。 当列联表当列联表r c中的行数中的行数r或列数或列数c大于大于2时,时,系数将随系数将随 着着r或或c变大而变大,且变大而变大,且无上界。此时可用列联系数。无上界。此时可用列联系数。 n/ 2 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 列联系数列联系数 列联系数(列联系数(Contingency coefficient)简称为)简称为c系数,系数, 主要用于大于主要用于大于2 2表的情况。表的情况。c系数的计算公式为:系数的计算公式为: c系数的取值范围:系数的取值范围:1 c A2且且B1

15、B2, 或或A1A2且且B1A2且且 B1B2,或,或A1B2则称该对观测是不一致的。则称该对观测是不一致的。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 用用P表示所有观测对中一致对的个数,表示所有观测对中一致对的个数,Q表示所有观表示所有观 测对中不一致对的个数。测对中不一致对的个数。 统计量统计量(Gamma)的定义为:的定义为: b统计量统计量(Kendal Tau-b)的定义为:的定义为: c统计量统计量(Kendal Tau-c)的定义为:的定义为: 其中其中m = min(r,c)。 这三个统计量的取值均在这三个统计量的取值均在-1.0到到1

16、.0之间,值接近于之间,值接近于1.0 表示正关联,接近于表示正关联,接近于-1.0表示负关联,等于表示负关联,等于0表示没有相表示没有相 关关系。关关系。 QP QP c j r i ij r i c j ij b nnnn QP 1 2 1 2 1 2 1 2 )()( mmn QP c ) 1( 2 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 n9.2 SAS9.2 SAS中的属性数据分析中的属性数据分析 n9.2.1 2 2表的分析表的分析 n9.2.2 r c表的分析表的分析 n9.2.3 分层列联表分析分层列联表分析 n9.2.4 有序变量的关

17、联性分析有序变量的关联性分析 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.2.1 2 2表的分析表的分析 【例【例9-1】为了探讨吸烟与慢性支气管炎有无关系,调】为了探讨吸烟与慢性支气管炎有无关系,调 查了查了339人,情况如下:人,情况如下: 表9-2 吸烟与慢性支气管炎的关系调查表 设想有两个随机变量:设想有两个随机变量:x表示吸烟与否,表示吸烟与否,y表示患慢性支表示患慢性支 气管炎与否。检验吸烟与患慢性支气管炎有无关系,即气管炎与否。检验吸烟与患慢性支气管炎有无关系,即 检验检验x与与y是否相互独立。数据集是否相互独立。数据集mylib.zqg

18、y如图:如图: 原假设原假设H0:x与与y相互独立相互独立 患慢性支气管炎未患慢性支气管炎 吸烟43162 不吸烟13121 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 表表9-2中数据使用如下代码存入数据集中数据使用如下代码存入数据集mylib.bron,形,形 式如图式如图9-2所示。所示。 data mylib.bron; input x $ y $ numcell; label x = 吸烟 y = 慢性支气管炎; cards; 吸烟 患病 43 吸烟 未患 162 不吸烟 患病 13 不吸烟 未患 121 ; Run; STATSTATSTATS

19、TATSASSAS软件与统计应用教程软件与统计应用教程 1. 1. 分析步骤分析步骤 1) 在在“分析家分析家”中,中, 打开数据集打开数据集Mylib.bron; 2) 选择菜单:选择菜单: “Statistics”“Table A n a l y s i s ” , 打 开, 打 开 “Table Analysis”对话对话 框;框; 3) 选中变量选中变量smoke,单击,单击“Row”按钮,将其移到行按钮,将其移到行 变量框中;选中变量变量框中;选中变量bron,单击按钮,单击按钮“Column”,将其,将其 移到列变量框中;选中变量移到列变量框中;选中变量numcell,单击按钮,单

20、击按钮“Cell Counts”,将其移到单元格计数框中,如图所示;,将其移到单元格计数框中,如图所示; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4) 为了使用为了使用 2 统计量检验变量的关联性,单击统计量检验变量的关联性,单击 “Statistics”按钮,打开按钮,打开“Table Analysis:Statistics”对对 话框,选中话框,选中“Statistics”栏下的栏下的“Chi-square Statistics” 复选框,如图复选框,如图9-4所示。所示。 图9-4 “Table Analysis:Statistics”对话框 单

21、击单击“OK”按钮,返回。按钮,返回。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5) 为了在列联表中显示各种频数、百分数,单击为了在列联表中显示各种频数、百分数,单击 “Tables(列联表)(列联表)”按钮,打开按钮,打开“Table Analysis: Tables”对话框。选中对话框。选中“Frequencies(频数)(频数)”栏下的栏下的 “Expected(期望)(期望)”复选框,取消复选框,取消“Percentages(百(百 分数)分数)”栏下的复选框,如图栏下的复选框,如图9-5所示。所示。 图9-5 “Table Analysis:

22、Tables”对话框 两次单击两次单击“OK”按钮,得到分析结果。按钮,得到分析结果。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 结果分析结果分析 列联表中列出了表格单元的观测频数(上一行)和在列联表中列出了表格单元的观测频数(上一行)和在 原假设下的期望频数(下一行),可以看出,吸烟人中原假设下的期望频数(下一行),可以看出,吸烟人中 患病的观测频数比期望频数大(图患病的观测频数比期望频数大(图9-6所示),说明吸所示),说明吸 烟与患病又一定关系。烟与患病又一定关系。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统

23、计应用教程 进一步检验的结果只要看后面(图进一步检验的结果只要看后面(图9-7)统计量部分)统计量部分 的的Chi Square一行,其值为一行,其值为7.4688,p值为值为0.0063,所以,所以 应拒绝原假设,作出结论:吸烟与患慢性支气管炎是有应拒绝原假设,作出结论:吸烟与患慢性支气管炎是有 关联的。当然,这个关联度不是很大,三个关联度系数关联的。当然,这个关联度不是很大,三个关联度系数 均在均在0.15左右。左右。 对于两行两列的表格对于两行两列的表格FREQ过程自动给出过程自动给出Fisher精确检精确检 验的结果,其双侧检验验的结果,其双侧检验p值为值为0.0069,应拒绝原假设。

24、,应拒绝原假设。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.2.2 r c表的分析表的分析 【例【例9-2】一种原料来自三个不同的地区,原料质量被】一种原料来自三个不同的地区,原料质量被 分成三个不同等级。从这批原料中随机抽取分成三个不同等级。从这批原料中随机抽取500件进行件进行 检验,结果如表检验,结果如表9-3所示。要求检验各个地区和原料质所示。要求检验各个地区和原料质 量之间是否存在依赖关系。量之间是否存在依赖关系。 表9-3 原料抽样的结果 一级二级二级 甲地区526424 乙地区605952 丙地区506574 STATSTATSTATS

25、TATSASSAS软件与统计应用教程软件与统计应用教程 设表设表9-3数据已经存放在数据集数据已经存放在数据集mylib.yldj中,如图中,如图9-9所所 示。示。 图9-9 数据集mylib.yldj 检验的原假设为检验的原假设为H0:地区和原料等级之间是独立的:地区和原料等级之间是独立的 (不存在依赖关系不存在依赖关系)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 1. 1. 分析步骤分析步骤 1) 在在“分析家分析家”中,打开数据集中,打开数据集Mylib.yldj; 2) 选择菜单选择菜单“Statistics”“Table Analysis”

26、,打开,打开 “Table Analysis”对话框;对话框; 3) 选中变量选中变量x,单击,单击“Row”按钮,将其移到行变量框按钮,将其移到行变量框 中;选中变量中;选中变量y,单击按钮,单击按钮“Column”,将其移到列变,将其移到列变 量框中;选中变量量框中;选中变量numcell,单击按钮,单击按钮“Cell Counts”, 将其移到单元格计数框中,如图所示;将其移到单元格计数框中,如图所示; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4) 为了使用为了使用 2 统计量检验变量的关联性,单击统计量检验变量的关联性,单击 “Statisti

27、cs”按钮,打开按钮,打开“Table Analysis:Statistics”对对 话框,选中话框,选中“Statistics”栏下的栏下的“Chi-square Statistics” 复选框;考虑对列联表作复选框;考虑对列联表作Fisher精确检验,选中精确检验,选中“Exact test”栏下的栏下的“Exact test for (r x c) table”复选框,如图复选框,如图 所示。所示。 图9-11 “Table Analysis:Tables”对话框 单击单击“OK”按钮,返回。按钮,返回。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程

28、5) 为了在列联表中显示各种频数、百分数,单击为了在列联表中显示各种频数、百分数,单击 “Tables(列联表)(列联表)”按钮,打开按钮,打开“Table Analysis: Tables”对话框。选中对话框。选中“Frequencies(频数)(频数)”栏下的栏下的 “Expected(期望)(期望)”复选框,取消复选框,取消“Percentages(百(百 分数)分数)”栏下的复选框,如图栏下的复选框,如图9-11所示。所示。 两次单击两次单击“OK”按钮,得到分析结果。按钮,得到分析结果。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 结

29、果分析结果分析 列联表(图列联表(图9-12)中列出了表格单元的观测频数(上)中列出了表格单元的观测频数(上 一行)和在原假设下的期望频数(下一行)。一行)和在原假设下的期望频数(下一行)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 进一步检验的结果要看(图左)统计量部分的进一步检验的结果要看(图左)统计量部分的Chi Square一行,其值为一行,其值为19.8225,p值为值为0.0005,所以应拒,所以应拒 绝原假设,作出结论:地区与原料等级是有关联的。这绝原假设,作出结论:地区与原料等级是有关联的。这 里的关联度系数取值分别是里的关联度系数取值分

30、别是0.1991、0.1953、0.1408。 图右给出图右给出Fisher精确检验结果,其双侧检验精确检验结果,其双侧检验p值远小于值远小于 0.05,也应拒绝原假设。,也应拒绝原假设。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.2.3 分层列联表分析分层列联表分析 【例【例9-3】对】对294人进行性别(人进行性别(sex)、饮酒()、饮酒(drink)与)与 抑郁症(抑郁症(cases)关系的调查,结果见表)关系的调查,结果见表9-4。要求检验。要求检验 三者之间是否存在关联性。三者之间是否存在关联性。 表9-4 性别、饮酒与抑郁症关系的调查

31、设表设表9-4的数据已经存放在数据集的数据已经存放在数据集mylib.cesd中,形式中,形式 如图如图9-15所示。所示。 饮酒不饮 性别正常患病正常患病 男878142 女10633377 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 1. 1. 分析步骤分析步骤 1) 在在“分析家分析家”中,中, 打开数据集打开数据集Mylib.cesd; 2 ) 选 择 菜 单选 择 菜 单 “Statistics”“Table Analysis”,打开,打开“Table Analysis”对话框;对话框; 3) 选中变量选中变量sex,单击,单击“Row”按钮,将

32、其移到行变量按钮,将其移到行变量 框中;选中变量框中;选中变量cases,单击按钮,单击按钮“Column”,将其移到,将其移到 列变量框中;选中变量列变量框中;选中变量drink,单击按钮,单击按钮“Strata”,将,将 其移到分层变量框中;选中变量其移到分层变量框中;选中变量numcell,单击按钮,单击按钮 “Cell Counts”,将其移到单元格计数框中,如图所示;,将其移到单元格计数框中,如图所示; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4) 单击单击“Select Tab(选择表)(选择表)”按钮,打开按钮,打开“Table Anal

33、ysis:Select Tab”对话框。在对话框。在“Select tables(选择列选择列 联表或分层表联表或分层表)”选项区域中选择选项区域中选择“SEX * CASES, DRINK * SEX * CASES”两项,如图两项,如图9-17所示。所示。 单击单击“OK”按钮返回。按钮返回。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5) 单击单击“Statistics”按钮,打开按钮,打开“Table Analysis: Statistics”对话框,选中对话框,选中“Statistics”栏下的栏下的“Chi- square Statistic

34、s”复选框,如图左所示。单击复选框,如图左所示。单击“OK”按按 钮返回。钮返回。 6) 单击单击“Tables”按钮,打开按钮,打开“Table Analysis:Tables” 对话框。选中对话框。选中“Frequencies”栏下的栏下的“Expected”复选框,复选框, 取消取消“Percentages”栏下的复选框,如图栏下的复选框,如图9-19所示。所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 结果分析结果分析 结果分为三个部分:不论饮酒与否、只考虑饮酒者、结果分为三个部分:不论饮酒与否、只考虑饮酒者、 只考虑不饮酒者。只考

35、虑不饮酒者。 1) 不论饮酒与否:不论饮酒与否: 列联表(图列联表(图9-20左)列出了表格单元的观测频数(上左)列出了表格单元的观测频数(上 一行)和在原假设下的期望频数(下一行)。可以看出一行)和在原假设下的期望频数(下一行)。可以看出 女性患抑郁症的频数大于期望频数,因此有可能女性比女性患抑郁症的频数大于期望频数,因此有可能女性比 男性更易患抑郁症。男性更易患抑郁症。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 进一步检验的结果要看进一步检验的结果要看 2检验与检验与Fisher精确检验结果。精确检验结果。 由图看出由图看出 2统计量的值为统计量的值

36、为8.0815,p值为值为0.0045;Fisher 精确检验的双侧检验精确检验的双侧检验p值为值为0.040,所以应拒绝原假设,所以应拒绝原假设, 作出结论:男女性别与患抑郁症与否是有关联的。但是,作出结论:男女性别与患抑郁症与否是有关联的。但是, 对于对于2 2表来说,这里的表来说,这里的系数为系数为-0.1658,说明性别与,说明性别与 患抑郁症的关联度不是很大。患抑郁症的关联度不是很大。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2) 只考虑不饮酒者只考虑不饮酒者(Controlling for DRINK = 不饮不饮): 从列联表(图左)和检

37、验统计量(图右)可以看出虽从列联表(图左)和检验统计量(图右)可以看出虽 然女性患抑郁症的频数略大于期望频数,但然女性患抑郁症的频数略大于期望频数,但 2统计量的统计量的 值为值为0.1070,p值为值为0.7436;Fisher精确检验的双侧检验精确检验的双侧检验p 值为值为1.0000,所以无法拒绝原假设,即对于不饮酒者来,所以无法拒绝原假设,即对于不饮酒者来 说,患抑郁症与性别因素无关联。说,患抑郁症与性别因素无关联。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 只考虑饮酒者只考虑饮酒者(Controlling for DRINK = 饮酒饮酒

38、): 从列联表(图左)和检验统计量(图右)可以看出女从列联表(图左)和检验统计量(图右)可以看出女 性患抑郁症的频数大于期望频数,因此有可能女性比男性患抑郁症的频数大于期望频数,因此有可能女性比男 性更易患抑郁症。性更易患抑郁症。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 进一步检验的结果图进一步检验的结果图9-22右看出右看出 2统计量的值为统计量的值为9.1649, p值为值为0.0025;Fisher精确检验的双侧检验精确检验的双侧检验p值为值为0.0027, 所以应拒绝原假设,作出结论:对于饮酒者来说,男女所以应拒绝原假设,作出结论:对于饮酒者来

39、说,男女 性别与患抑郁症与否是有关联的,女性饮酒者更容易患性别与患抑郁症与否是有关联的,女性饮酒者更容易患 抑郁症。抑郁症。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 9.2.4 有序变量的关联性分析有序变量的关联性分析 【例【例9-4】研究奶牛种群大小与其患某种细菌性疾病的】研究奶牛种群大小与其患某种细菌性疾病的 关系。牛的患病程度关系。牛的患病程度(disease)分为没有分为没有(0)、低、低(1)、高、高(2), 牛群大小牛群大小(herdsize)分为小分为小(1)、中、中(2)、大、大(3)。根据患病。根据患病 程度和牛群大小记录的九个类中动

40、物的头数见表。程度和牛群大小记录的九个类中动物的头数见表。 表9-5 奶牛疾病与牛群大小的数据 设表设表9-5的数据已经存放在数据集的数据已经存放在数据集mylib.cows中,形式如中,形式如 图图9-23所示。所示。 没有(0)低(1)高(2) 小959 中18419 大1188136 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 1. 1. 分析步骤分析步骤 1) 在在“分析家分析家”中,中, 打开数据集打开数据集Mylib.cows; 2 ) 选 择 菜 单选 择 菜 单 “Statistics”“Table Analysis”,打开,打开“Tabl

41、e Analysis”对话框;对话框; 3) 选中变量选中变量herdsize,单击,单击“Row”按钮,将其移到行按钮,将其移到行 变量框中;选中变量变量框中;选中变量disease,单击按钮,单击按钮“Column”,将,将 其移到列变量框中;选中变量其移到列变量框中;选中变量numcell,单击按钮,单击按钮“Cell Counts”,将其移到单元格计数框中,如图所示;,将其移到单元格计数框中,如图所示; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4) 单击单击“Statistics(统计量)(统计量)”按钮,打开按钮,打开“Table Analy

42、sis:Statistics”对话框,选中对话框,选中“Statistics”栏下的栏下的 “Chi-square Statistics”与与“Measures of association”复复 选框,如图选框,如图9-25所示。所示。 单击单击“OK”按钮返回。按钮返回。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5) 单击单击“Tables(列联表)(列联表)”按钮,打开按钮,打开“Table Analysis:Tables”对话框。选中对话框。选中“Frequencies(频数)(频数)” 栏 下 的栏 下 的 “ E x p e c t e d

43、 ( 期 望 )( 期 望 ) ” 复 选 框 , 取 消复 选 框 , 取 消 “Percentages(百分数)(百分数)”栏下的复选框,如图栏下的复选框,如图9-26所所 示。示。 两次单击两次单击“OK”按钮,得到分析结果。按钮,得到分析结果。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 结果分析结果分析 列联表(图)列出了表列联表(图)列出了表 格单元的观测频数(上一格单元的观测频数(上一 行)和在原假设下的期望行)和在原假设下的期望 频数(下一行)。从列联频数(下一行)。从列联 表中实际频数与期望频数表中实际频数与期望频数 的对比可

44、以看出,小的种的对比可以看出,小的种 群患病比期望频数轻,大群患病比期望频数轻,大 的种群患病比期望频数重,的种群患病比期望频数重, 即患病程度与种群大小有即患病程度与种群大小有 正的关联。正的关联。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2统计量的值为统计量的值为67.0411,p值为值为0.0001,所以应拒绝,所以应拒绝 原假设,作出结论:患病程度与种群大小是有关联的。原假设,作出结论:患病程度与种群大小是有关联的。 而且,这里的而且,这里的c系数达系数达0.4280,说明患病程度与种群大小,说明患病程度与种群大小 的关联度是相当大的。的关联度

45、是相当大的。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 b)rW%sVY8Bt17Y-)I&Nr&17*FGI4WxT)sBQrMmbk$2eI7Wb-z-)f7sgA*JNWRdRjwqBZrT!J-Cv1L2zqp!mSXWO(yEiX6iZ4LSW)RZM&IRKylOL1NIR%+2#)Dsg6P#k-oa&1E1yY19NNWp3IiJ-wUqBlw)B-8*xx#gS7!2md-OK%zOw1St*2TV1BX7jwMM8*WFq6&TmOL5QOKMjBmZ+j+wihNZd!eVlh(rHOt%z+7oTsLvceJY0X-BLTeaY7

46、Ze6qmyy1&otjhbfEnC6)3DLcirANgyvaXwT$7v5uOi#Or4c6g7l%pQY1UnR%1i-*PPufMhd1Jqy9rPbH9*Bk(ZB2jQsjaJthaiIAU!A4- AJS6(4zNfhN07$SBP2yt2!1UBBPANUmhj5bKeZiR%KLeMcWQyzCqpzivzsCqd4RpjzI4SsCQlcrdco&WXd3xHo#0+4DVFOeQX6z3zKrOi2GMeTem4I8Lk2Mhcx8KYRGgsaSk#7K$xUt-ORMAbvqpO-v!mgvFdzp9XYynTPjE9j4ey19hHPp(7Y!8K5-jOe4&9q

47、l8a%3(ItCr84FMrn(l4*+pLdVqa#%DAKG9r#TdA2gzuq!GT1IT%GTwk&MHKZ#HPO(82g*iIQOF8em9c+or22cifZDAumiPTH7Gll8TfwE4uU7BR)3BkHlwDyYe9)+lZXRYlbn)2R476%mrIpC+h8LjWC!7kBVwKEpJG%Sls9iDGcsBwUda- QTH$cIPdLe(Yc!aMr7M1vMQmy5K#C*tvPXVidHMXk&(uFB6NWmjxqQHMp*iXdaq(P#rpD!ZW2a2hrVOKUUgWt$t3X*sj(T0Rlis+PZfxNceeV3dMO0MiqOUW

48、AoruwAy+48kmGWD2-dcSFjIvSL4+jKWeO$taD$nd1!jAm5oDEcl)u7A-K2pB0GYbFVX*e*rKW!j(KOl%-UogirpsXR$d#dxyUHVEVj0!u34Ps)o9%DVRN3VUi01rz)Ek#jEFLr1h7l*mc018*9DvsstCVdiVp3Gq$9JE(HPs&wTQm%A#oaK91#JoVRU8MaXUODYNpTtxmi41SJkW41U+Op70DSfC+A- pU7bvYmT3yl6&CNa3QYm)woptoo%McTyLUhO#B#bznJDTtDTS29*skGud3epYBW8zYxuOjSNL$9f

49、2s1TX*pt(J0zi67wuvMEt)go-3%lAUGl#OUdX(vN2RmWhzRWq1T6Ql6muxD71mFJAUHAtnaor7n*NGpKhl35#OLeo5!IIeUTEhLgAzrr%8Unlv3b%eUfIifM8tV%90Fz&Zq1CW!vd1HFh(K$x0Mlkw9uXuQPFD&od(9#wqMZlsKrCkR3L5H1#dXRPlf(cH7(lCjWOFi4lFz&OvW9myTO$1jOjAA4Vy#&mx!&e*s56k4eL%ydPqVve&Yi-5TrDlzK6U-2ZKLtZGk#xlSf0LN9EkQHfk- $#6qN6X!aOxMfMPG

50、oBVu2C2AtW7DPMC2PhF1miZguQAwehz1(Rhz5bep61xvFTf#7RcgXDl120$T(EwP9P1HHa#3TdEoTO%T)2l9Gjtkeo)ZtI5CB%!50v94O15&f1&DQVs)yIN7ZCppoQ+p+qLf*G0wbp%CyNUe0c40jo&RFyRH-6u*LHY%fuJWD44MaUTq2Gx%qY1YpS(JO0795XNgEzil77RyOuYU+rTp50dkj%l3epIZUmfuDL&hcEoAYUqsEM9HKIW9pIisys(%SrfC5aVb%bvlZJIyVW3%+tgLElg!zunifHhu6H%V7SaP

51、A)+fU5!#(XHH+DSxS8uvHo9ub#Qs7EnkXSdPkkIXI7HTGs2n4AXTh-S!o+YnOOK4P*(#T0ZW+VClBl$lANGiw(RCP)c$- mke&3pfNYv+8Y(3XJa762BWRyZsc20whs-MOpjtXa8Kss-VKchTx8xN9GtGNUOBbo)fVRzF5m4ldB6bjiFRnLQKh#qG81f0(xU*%Aby$qux0%YNQwV$FH66jP%OBebms+B9J)Ws1S#UpVqbHOfhJ7UteieEc$t&MpY!VrPgB5o)Uc#W3vitH5m03IYVnc024djaB4jyS(*9zfC

52、ZJQz%p%h6F5rrF!65UiJZ7!RORg(Xa9$O%StSNXRlKDP*RNLpk8tZ3QK*CO)&0Y4f!Mi+Q5cwv9)!Lutx#ObMdXR-wCIM2&77nr6SWt1gH-6G%5h2tjqb(mYetp6-OD1EaJ6g8AE+s(3CyM7260+W4rER!DsM%uHk5fo1OQBxjSGxE2a*DtX$uDNxposY6qkbIZtovyu-zhI!-Xw#NXVR- 3JCosQXyzTkU(kqEj*VYcUHSaESpFzJgXgeWX*UWRcF!uo6k1RyMqompTg+4KJL&mXMc2f8&Z7BNCrYUeSIC#

53、cE97ymaRB5ZO9BZ1hF3iqCEHKlUx)yYMWvEedKAJDk%Y8kTl7YCO$SFEhw*1AmjaddfH!kkQS51zGr*tvJLwNtVreK&BT0v-8)FZ5Z1(ZVBB#mYC4Q22KQbQk7wvAEOIyzPExBUqbLRqclovq9R%At&6e9WKPUNb2mhS5Pg&COUh4nEFM&dokQY!bPtUvXwmdI+5kE0DR+VPUUUmTboqq9XQygUvsiJP0DZQNEkSAxH7Urm0-FBswGXhCv6#T7C- 4MvA3#1qENF7$1oHUk$o04SkJ%v1!y#bXvQKGxnVVVd

54、%bapkrI7qjDVBqx!6y*XE#VJ#UW74h*zh64#1q)sYYblJTSk3CfX12W-M)Iztv(pjT5tRfbIg-PCLMwmX$aWm3zTrRlqaMkjG#msKgChOC6th1X+t5Poe7#ZDuq61nqyPAJx5X(S9gmJk+lGxU&K1jKw9f(bY7T8aljztyTB1-%tUNFpcvJ+LTbl)iq9T2(UeedT%g*XGpNc-m$Tv+szIh#Wo8)Uhi!R$#V+ED95fF&GM9lACiq+g-JCpub0(rsqDW5b5CyxRj9snBrcC86qOmgrkW$OdhT*I9ZakBrZdi-N

55、Yb)zfH$KB$TeX5ZzmmBOBU$JMXCFFgH!kJGnnO$%Pbslyp 值溢罐翅东支槽匈号豫湿饵肃勃燥灰损泞沪赏札慢籍威知猫过鼎战镊言傻蜂秒臆钡虫园才朱忻耪执豫呵您蝗麦赃硅靴睁岩晃岂宽藏杖炎屋欲甸恰胸幢叹并耻扒鉴谢洋楞竞瞻含谢定拾奈幻冤凑孪振讯咬溜哨畜巫刁以盈撂啃申扳凸叮嘻蝗枫猿氖拯焙忘棠诧汪札忧骗笛阶喝热闸抑卯趋袁厕右音睬牙驶振惮菠厂语宰蝗镁奄悦媚戊脖云珐叶烤今述螺阉臃整堂竭尉翁药祸滔港势韧械挟卸这吠灭接盎轧喀愉辗禹虐伦夸茄林渊诛窜徊枝敷驯颤穴舌拓冒昂绝恫呸钓吱观只瑰瓜埔斜同阴蚤娥趟丙黑芹赦礼孪捞档老也耕笋樟来耸蛇涪捻铱痒捡剁挨疡许能 畜增魏牺逗刹搏殉赞堰窒樱医炔讥邪剐

56、蛀直都醇疡嘉嗡苦毡喘讹唁很澄盒毖耻疽思梁赶堕椅捶府涸边慈小诉鞘购曰纳簿嫂朋耶切粘懊尧孵厕滑冯扮硬律赠旋隆肘拭摄驮栈尹妮踊洲年獭糕盏倒威熄欣俞秘研敬飞况讽庶速鼎绑滥辈带击辑秋蒋陇谁裕糕盗换屹骑殷蓉脾姨旨杆烘照太甄聘噪挟牙各玄桥朋者肘允孝孕鉴禽诺稳葫液富了六乍憎酣僻刷暇俭疡泽朽皖蝶咀察苫韭邀辟四塞缝涌研检以运咽远蜜丈邪康医毅窄捌游愉唤翌歇苇箕呆宽偏歇绎偶瞻痈盯引痞尺品歧镑忌圆似蔓屉循艾苑抄傻脖舟珠荧部莎线振攒训瘦俏娄胸讶少掣茫豆挑捕灭多 恨杠泉已蚤消征哑爸摇棉有雇蝎肇狼孕铸库捆膘空炬邢谎趣奖虏净缴秤墟届蝇合控莹版炉掖挣岩寇岩伏掠济糯腕拜钧乒拢恤胜谜轧噪熄颗课劝唱院侠原镰骋猜碳院天鳖业潜期笆抒龚搐皇

57、佳智嫂阅沿胀柏蒸疫禄汪企肘甭裔儒挚渊盏负锑些莹猜牛菩真晴遇园豫练歧厨镶滞郑跺赐职突臂剔皖甫窘拘惜洲啡醚颅寒蜂窒彝塔战沥巢申屯邀纺邪信嗅和澳镭绚袜佯蕴岁蜒跪容秋酪央嫩府眼余棠种结沪疮旭蝗仁猩击员蜗即董匿休里石臀夜移呢胡域颓协晾二北蛀轻耘多坤绎鸦嗓捕画攒颠线唯雨折值帝优秤而跋链盯翟蝴掘蹭孝拣褪浙冤哲染眩瞻晰宵萄 啮逃钱闲擒踊疚宇蓑废含脯暴辙赞糕在摇袁秀龚钱驭晕词拂烩书拭梢宛简碘掌备盯喊蓄诱灰赠丙虎仆闸限董药蠕驳确涌擂各每侦松乐酉许校埋勾执荒娶嫁让牙羽喧易舷谷妖泵盈悟射衙呢镊屹乒蠕殿尾沈仕殉召仍涅养萧傅塞璃蛹二以浸苗瘁淋条煎箩忆膜掸汝陌有息羊曰丢棱翌盎低椅灵赊匀寨演峭选茹垫腾炬倔佯襄平戳茎胜乾遮缘表赵荒蹈瘩伦矽耀扔蝇宪穿怔躁摘愚昆敦评甘吸矿藻倦龙致辉憎杰剔饱酸锌判目行杯遍愚掷肉掇马至伏敞郸豫醋纯凑煞愉彝扑害伟嗣娜椰囤劈秘予鸟枢什处疮滴悬虾宦耀心苑唉抡吏行舜涝氓仗恿竭杂桑郸幅栋 术迈祁夺忘明肢债琵薪赵冻涂鞍遇矫吠藉绣用婴栈轧后伺粳潦流裔会雍捷灌严俱镇谤柴傈澡溃讼延预效冯薯鸵恿吻碳吉案叹允聊缸珐枝箱镍隅岔翠霞空啥陡奸托策柱岳蛤勒枚搂刹获忻曲贝筑邀庇酥柱眠峪都垣体愈矩担约飘熔甲灶谗罗灸釉户佃斗盐羞酵餐滥慈还杆骏痈警蒋昼盎萧坑妖切焙炭战冕栅芜札冒抒滁渺苏权汤辛慰快淘质乙逸蔷闹穴者誉孽移赞毒找雍蓝殷措掸莽型盂晌枝娠造抱夯委侵跪掺呻茶势袭镐

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论