次数资料分析_第1页
次数资料分析_第2页
次数资料分析_第3页
次数资料分析_第4页
次数资料分析_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于适合性、独立性检验等等。 Karl Pearson卡尔皮尔森 (1857-1936):英国生物学家和统计学家,旧数理学派和描述统计学派的代表人物,现代统计科学的创立者,被公认为统计学之父。他是个社会主义者。出于对马克思的敬仰,他在二十三岁那年,把名字从英文的习惯写法Carl改为与马克思相同的Karl 。K. Pearson 22岁毕业于剑桥大学数学系;曾参与激进的政治活动。出版几本文学作品,并且作了三年的律师实习。27岁进入伦

2、敦大学学院 (University College, London),教授数学与力学,从此待在该校一直到1933年。 K. Pearson是活跃在19世纪末叶和20世纪初叶的罕见的百科全书式的学者。他是应用数学家、生物统计学家和优生学家,也是天文学、弹性和工程问题专家,又是名副其实的科学哲学家、历史学家、民俗学家、宗教学家、人类学家、语言学家、伦理学家,还是律师、教育改革者、社会主义者、人道主义者、妇女解放的鼓吹者,同时还是受欢迎的教师、编辑、文学作品和人物传记的作者。 K. Pearson 最重要的学术成就,是为现代统计学打下基础。许多熟悉的统计名词如标准差,成分分析,卡方检验都是他提出的。

3、 K. Pearson、Galton 与 Weldon 为了推广统计在生物上的应用,于1901年创立统计的元老期刊Biometrika, 由 K. Pearson 主编至死,但是 K. Pearson 的主观强,经常对他本人认为有“争议”的文章, 删改或退稿,并因此与英国二十世纪最有才华的统计学家 Fisher 结下梁子。 K. Pearson在统计学方面的主要贡献:1.推导出 分布,提出 检验(1900年)。2.发展了回归和相关理论。 22概念:概念:通过计算通过计算2统计量进统计量进行差异显著性检验的方法称行差异显著性检验的方法称为为2检验检验。 介绍对次数资料、等级资料进行统计分析介绍对

4、次数资料、等级资料进行统计分析的方法。的方法。在医学资料中,特别是临床医学资料中,常常遇到在医学资料中,特别是临床医学资料中,常常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、一些定性指标,如临床疗效的评价、疾病的临床分期、症状严重程度的临床分级、中医诊断的一些临床症状症状严重程度的临床分级、中医诊断的一些临床症状等,等,对这些指标常采用分成若干等级然后分类计数的对这些指标常采用分成若干等级然后分类计数的办法来解决它的量化问题办法来解决它的量化问题,这样的资料我们在统计学,这样的资料我们在统计学上称为有序变量(上称为有序变量(ordered variableordered variabl

5、e)或半定量资料,)或半定量资料,也称为等级资料(也称为等级资料(ranked dataranked data)。)。 等级资料定义:等级资料定义: 等级资料划分的两种情况:等级资料划分的两种情况:特点:特点:观察结果具有等级差别观察结果具有等级差别v按性质划分:按性质划分:如药物疗效分为痊愈、显效、好转如药物疗效分为痊愈、显效、好转、无效;麻醉效果分为、无效;麻醉效果分为、级等。级等。v按数量分组:按数量分组:数据两端不能确切测定的计量资料数据两端不能确切测定的计量资料。如抗体滴度分为。如抗体滴度分为1:20,1:20,1:40,1:80,1:20,1:20,1:40,1:80,1:80;年

6、龄分为年龄分为10,1010,10, 20, 20,40,40,60,60等。等。?等级资料的分析方法是否和等级资料的分析方法是否和一般计数资料的检验方法相同呢?一般计数资料的检验方法相同呢? 等级资料的分析应该选用什么方法?等级资料的分析应该选用什么方法?等级资料正确的统计分析方法:等级资料正确的统计分析方法: CMH CMH卡方检验卡方检验 非参数统计的秩和检验非参数统计的秩和检验 Kendall Kendall 、spearmanspearman等级相关等级相关 RiditRidit分析分析 线性趋势卡方检验线性趋势卡方检验 有序变量的有序变量的LogisticLogistic回归分析回

7、归分析 一、一、 2 2统计量的意义统计量的意义 为了便于理解,现结合一实例说明为了便于理解,现结合一实例说明 2 2统计统计量的意义。根据遗传学理论,动物的性别比量的意义。根据遗传学理论,动物的性别比例是例是1:11:1。统计某羊场一年所产的。统计某羊场一年所产的876876只羔羊只羔羊中,有公羔中,有公羔428428只,母羔只,母羔448448只。按只。按1:11:1的性别的性别比例计算,公、母羔均应为比例计算,公、母羔均应为438438只。以只。以A A表示表示实际观察次数,实际观察次数,T T 表表 示示 理理 论次数,可将上论次数,可将上述情况列成表述情况列成表6-16-1。 表表6

8、-1 羔羊性别实际观察次数与理论次数羔羊性别实际观察次数与理论次数 原理原理:判断样本观察频数(判断样本观察频数(Observed frequency)与理论)与理论(期期望望)频数(频数(Expected frequency )之差是否由抽样误差所引起。)之差是否由抽样误差所引起。 从表从表6-16-1看到看到 ,实际观察次数与理论次数,实际观察次数与理论次数存在一定的差异,这里公、母各相差存在一定的差异,这里公、母各相差1010只。只。 这个差异是属于抽样误差这个差异是属于抽样误差( (把对该羊场一年所把对该羊场一年所生羔羊的性别统计当作是一次抽样调查生羔羊的性别统计当作是一次抽样调查)

9、)、还、还是羔羊性别比例发生了实质性的变化是羔羊性别比例发生了实质性的变化? ? 要回答这个问题,首先需要确定一个统计要回答这个问题,首先需要确定一个统计量,用以表示实际观察次数与理论次数偏离的量,用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。差,即进行显著性检验。 为了度量实际观察次数与理论次数偏离的程度,最简单为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。从表的办法是求出实际观察次数与理论次数的差数。从表7-17-1看出:看出:A A1 1- -T T1

10、1 =-10 =-10,A A2 2- -T T2 2=10=10,由于这两个差数之和为,由于这两个差数之和为0 0,显然不能,显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将两个差数度。为了避免正、负抵消,可将两个差数A A1 1- -T T1 1、A A2 2- -T T2 2 平平 方方后再相加,即计算后再相加,即计算(A A- -T T) )2 2,其值越大,其值越大 ,实际观察次数与理,实际观察次数与理论次数相差亦越大,反之则越小论次数相差亦越大,反之则越小 。但利用。但利用(A A- -T

11、T) )2 2表示实际表示实际观察次数与理论次数的偏离程度尚有不足观察次数与理论次数的偏离程度尚有不足 。例如,某一组实际观察次数为例如,某一组实际观察次数为505505、理论次数为、理论次数为500500,相差相差5 5;而另一组实际观察次数为;而另一组实际观察次数为2626、 理论次数为理论次数为2121,相差亦为相差亦为5 5。显然这两组实际观察次数与理论次数的。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数偏离程度是不同的。因为前者是相对于理论次数500500相差相差5 5,后者是相对于理论次数,后者是相对于理论次数2121相差相差5 5。为了弥补这。为了

12、弥补这一不足,可先将各差数平方除以相应的理论次数后再一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为相加,并记之为 2 2 ,即,即 (6-1) TTA22)( 也就是说也就是说 2是度量实际观察次数与理论次数是度量实际观察次数与理论次数偏离程度的一个统计量偏离程度的一个统计量, 2越小越小,表明实际观表明实际观察次数与理论次数越接近察次数与理论次数越接近; 2 =0,表示两者完表示两者完全吻合全吻合; 2越大越大,表示两者相差越大表示两者相差越大。 对于表对于表7-1的资料的资料,可计算得可计算得 我们就是要确定这个我们就是要确定这个 2是否显著是否显著4566. 0438104

13、38)10()(2222TTAx(6-2)计算步骤计算步骤二、二、 2分布分布(P43) 上面在属于离散型随机变量的次数资料的基上面在属于离散型随机变量的次数资料的基础上引入了统计量础上引入了统计量 2, 它近似地服从统计学中一它近似地服从统计学中一种连续型随机变量的概率分布种连续型随机变量的概率分布 2分布。下面分布。下面对统计学中的对统计学中的 2分布作一简略分布作一简略回顾回顾。 设有一平均数为设有一平均数为,方差为方差为 的正态总体。现的正态总体。现从此总体中独立随机抽取从此总体中独立随机抽取n个随机变量个随机变量:x1,x2,xn,并求出其标准正态离差并求出其标准正态离差:2 记这记

14、这n个相互独立的标准正态离差的平方和个相互独立的标准正态离差的平方和为为 2:(6-3)(6-2)三、三、 2 2的连续性矫正的连续性矫正 由由(6-1)(6-1)式计算的式计算的 2 2只是近似地服从连续型只是近似地服从连续型随机变量随机变量 2 2分布。在对次数资料进行分布。在对次数资料进行 2 2检验利检验利用连续型随机变量用连续型随机变量 2 2分布计算概率时,常常偏分布计算概率时,常常偏低,特别是当自由度为低,特别是当自由度为1 1时偏差较大。时偏差较大。 Yates(1934)Yates(1934)提出了一个矫正公式,矫正后提出了一个矫正公式,矫正后的的 2 2值记为:值记为:2c

15、(6-4) 当自由度大于当自由度大于1 1时,时,(6-1)(6-1)式的式的 2 2分布与连续分布与连续型随机变量型随机变量 2 2分布相近似分布相近似 ,这时,可不作连续,这时,可不作连续性矫正,但要求各组内的理论次数不小于性矫正,但要求各组内的理论次数不小于5 5。若。若某组的理论次数小于某组的理论次数小于5 5,则应把它与其相邻的一,则应把它与其相邻的一组或几组合并,直到理论次数大于组或几组合并,直到理论次数大于5 5为止。为止。 一、适合性检验的意义一、适合性检验的意义 判断实际观察的属性类别分配是否符合判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验称已知属性

16、类别分配理论或学说的假设检验称为适合性检验。为适合性检验。无效假设为无效假设为H H0 0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设为备择假设为H HA A:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。具体计算步骤具体计算步骤作出假设作出假设在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类别的理论次数。别的理论次数。适合性检验的自由度等于属性类别分类数减适合

17、性检验的自由度等于属性类别分类数减 1 ;若属性类别分类数为;若属性类别分类数为k ,则,则适合性检验的自由度为适合性检验的自由度为 k-1 。实际次数与理论次数实际次数与理论次数根据根据(6-1)或或(6-4)式计算出式计算出 2或或 2c。计算卡方统计量计算卡方统计量 将所计算得的将所计算得的 2或或 2c值与根据自由度值与根据自由度k-1查查 2值表所得的临界值表所得的临界 2值:值: 20.05、 20.01比较:比较: 若若 2 (或或 2c) 20.05,P0.05,表明实际观察次数与理论次数,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性差异不显

18、著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;类别分配的理论或学说; 若若 20.05 2 (或或 2c) 20.01,0.01P0.05,表明实际观察次数,表明实际观察次数与理论次数差异显著,实际观察的属性类别分配显著不符合已与理论次数差异显著,实际观察的属性类别分配显著不符合已知属性类别分配的理论或学说;知属性类别分配的理论或学说; 若若 2 ( 或或 2c) 20.01,P0.01,表明实际观察次数与理论次数,表明实际观察次数与理论次数差异极显著差异极显著 ,实际观察的属性类别分配极显著不符合已知,实际观察的属性类别分配极显著不符合已知 属属性类别分配的理论或学说。

19、性类别分配的理论或学说。 作出统计推断作出统计推断二、适合性检验的方法二、适合性检验的方法 下面结合实例说明适合性检验方法。下面结合实例说明适合性检验方法。 【例【例6.1】 在进行山羊群体遗传检测时,在进行山羊群体遗传检测时,观察了观察了 260只白色羊与黑色羊杂交的子二代毛只白色羊与黑色羊杂交的子二代毛色,其中色,其中181只为白色,只为白色,79只为黑色,问此毛只为黑色,问此毛色的比率是否符合孟德尔遗传分离定律的色的比率是否符合孟德尔遗传分离定律的3 1比例比例? 检验步骤如下:检验步骤如下: (一)提出无效假设与备择假设(一)提出无效假设与备择假设 H0:子二代分离现象符合:子二代分离

20、现象符合3 1的理论比例。的理论比例。 HA:子二代分离现象不符合:子二代分离现象不符合3 1的理论比例。的理论比例。 (二)选择计算公式(二)选择计算公式 由于本例是涉及到两组毛色(白色与黑色),属由于本例是涉及到两组毛色(白色与黑色),属性类别分类数性类别分类数k=2,自由度,自由度df=k-1=2-1=1,须使用,须使用(6-4)式来计算)式来计算 。2c (三)计算理论次数(三)计算理论次数 根据理论比率根据理论比率3 1求理论次数:求理论次数: 白色理论次数:白色理论次数:T1=260 3/4=195 黑色理论次数:黑色理论次数:T2=260 1/4=65 或或 T2=260-T1=

21、260-195=65 (四)计算(四)计算 2c表表6-2 2c计算表计算表 739. 365)5 . 0|6579(|195)5 . 0|195181(|)5 . 0|(|2222TTAC (五五)查临界查临界 2值,作出统计推断值,作出统计推断 当自由度当自由度 df=1 时,时, 查查 得得 20.05(1) =3.84,计算的计算的 2c0.05,不能否定,不能否定H0,表,表明实际观察次数与理论次数差异不显著,可以明实际观察次数与理论次数差异不显著,可以认为白色羊与黑色羊的比率符合孟德尔遗传分认为白色羊与黑色羊的比率符合孟德尔遗传分离定律离定律3 1的理论比例。的理论比例。 【例【例

22、6.26.2】 在研究牛的毛色和角的有无两在研究牛的毛色和角的有无两对相对性状分离现象时,用黑色无角牛和红色对相对性状分离现象时,用黑色无角牛和红色有角牛杂交有角牛杂交 ,子二代出现黑色无角牛,子二代出现黑色无角牛192192头,头,黑色有角牛黑色有角牛7878头,红色无角牛头,红色无角牛7272头,红色有角头,红色有角牛牛1818头,共头,共360360头。试头。试 问这两对性状是否符合问这两对性状是否符合孟德尔遗传规律中孟德尔遗传规律中93319331的遗传比例?的遗传比例? 检验步骤:检验步骤: (一)提出无效假设与备择假设(一)提出无效假设与备择假设 H0:实际观察次数之比符合:实际观

23、察次数之比符合9 3 3 1的理的理论比例。论比例。 HA:实际观察次数之比不符合:实际观察次数之比不符合9 3 3 1的的理论比例。理论比例。 (二)选择计算公式(二)选择计算公式 由于本例的属性类别分类数由于本例的属性类别分类数 k=4:自由:自由 度度df=k-1=4-1=31,故利用(,故利用(6-1)式计算)式计算 2。 (三)计算理论次数(三)计算理论次数 依据各理论比例依据各理论比例9:3:3:1计算理论次数:计算理论次数: 黑色无角牛的理论次数黑色无角牛的理论次数T1:3609/16=202.5; 黑色有角牛的理论次数黑色有角牛的理论次数T2:3603/16=67.5; 红色无

24、角牛的理论次数红色无角牛的理论次数T3:3603/16=67.5; 红色有角牛的理论次数红色有角牛的理论次数T4:3601/16=22.5。 或或 T4=360-202.5-67.5-67.5=22.5 表表6-3 2计算表计算表 (四)列表计算(四)列表计算 2 =0.5444+1.6333+1.6333+0.9 =4.711 (五)查临界(五)查临界 2值,作出统计推断值,作出统计推断 当当df=3时,时, 20.05(3)=7.81,因,因 20.05,不,不能否定能否定H0 ,表明实际观察次数与理论次数差异不显,表明实际观察次数与理论次数差异不显著,可以认为毛色与角的有无两对性状杂交二

25、代的分著,可以认为毛色与角的有无两对性状杂交二代的分离现象符合孟德尔遗传规律中离现象符合孟德尔遗传规律中9 3 3 1的遗传比例。的遗传比例。 TTAx22)( 一、独立性检验的意义一、独立性检验的意义 对次数资料,除进行适合性检验外,有对次数资料,除进行适合性检验外,有时需要分析两类因子是相互独立还是彼此相时需要分析两类因子是相互独立还是彼此相关。如研究两类药物对家畜某种疾病治疗效关。如研究两类药物对家畜某种疾病治疗效果的好坏,先将病畜分为两组,一组用第一果的好坏,先将病畜分为两组,一组用第一种药物治疗,另一组用第二种药物治疗,然种药物治疗,另一组用第二种药物治疗,然后统计每种药物的治愈头数

26、和未治愈头数。后统计每种药物的治愈头数和未治愈头数。 这时需要分析药物种类与疗效是否相关,若两者彼这时需要分析药物种类与疗效是否相关,若两者彼此相关,表明疗效因药物不同而异,即两种药物疗此相关,表明疗效因药物不同而异,即两种药物疗效不相同;若两者相互独立,表明两种药物疗效相效不相同;若两者相互独立,表明两种药物疗效相同。这种同。这种根据次数资料判断两类因子彼此相关或相根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验互独立的假设检验就是独立性检验。独立性检验实。独立性检验实际上是基于次数资料对际上是基于次数资料对2因子间相关性的研究。因子间相关性的研究。 (一)(一) 独立性检

27、验的次数资料是按两因子独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数属性类别进行归组。根据两因子属性类别数的不同而构成的不同而构成22、2c、rc列联表(列联表(r 为为行因子的属性类别数,行因子的属性类别数, c 为为 列列 因子的属性类因子的属性类别数)。而适合性检验只按某一因子的属性别数)。而适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。类别将如性别、表现型等次数资料归组。二、独立性检验与适合性检验区别二、独立性检验与适合性检验区别 (二)(二)适合性检验按已知的属性分类理论或学说计适合性检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算

28、理论次数时没有现成算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。立的假设下进行计算。 (三)(三)自由度问题:在适合性检验中确定自由度时,自由度问题:在适合性检验中确定自由度时,只有一个约束条件,自由度为属性类别数减只有一个约束条件,自由度为属性类别数减1。而在。而在rc列联表的独立性检验中,自由度为列联表的独立性检验中,自由度为rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数,即等于(横行属性类别数-1)(直列(直列属性类别数属性类别数-1)。)。 用

29、于两个因素多项分类的计数资料分析,即研究变量之间的关联性和依存性问题。 往往将两个变量的各项统计数据排列成R行(Row)、C列(Column)的表格形式,称之为列联表。因素B水平1水平2水平c行的和因素A水平1f1,1f1,2f1,cm1水平2f2,1f2,2f2,cm2水平rfr,1fr,2fr,cmr列的和n1n2ncN(1)(1)dfRC (一)(一)22列联表列联表资料资料的独立性检验的独立性检验 22列联表的一般形式如表列联表的一般形式如表6-10所示,其所示,其自由度自由度 df=( c -1) (r-1)=(2-1) (2-1)=1,在进行,在进行 2检验时,需作连续性矫正,应计

30、算检验时,需作连续性矫正,应计算 值。值。 2c四、独立性检验的方法四、独立性检验的方法表表6-10 2 2列联表的一般形式列联表的一般形式 【例【例6.76.7】 某猪场用某猪场用8080头猪检验某种疫苗是否有头猪检验某种疫苗是否有预防效果。结果是注射疫苗的预防效果。结果是注射疫苗的4444头中有头中有 12 12 头发病,头发病,3232头未发病;未注射的头未发病;未注射的3636头中有头中有2222头发病,头发病,1414头未发头未发病,问该疫苗是否有预防效果?病,问该疫苗是否有预防效果? 表表6-11 2 2列联表列联表 1 1、先将资料整理成列联表、先将资料整理成列联表表中这四个表中

31、这四个格子的数据是整个表的基本数据,其余数据都是从这四个基本格子的数据是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,数据推算出来的,故上表称为四格表。故上表称为四格表。12 32 22 14 H H0 0:发病与否和注射疫苗无关,即二因子相互独立。:发病与否和注射疫苗无关,即二因子相互独立。 H HA A:发病与否和注射疫苗有关,即二因子彼此相关。:发病与否和注射疫苗有关,即二因子彼此相关。 根据二因子相互独立的假设,由样本数据计根据二因子相互独立的假设,由样本数据计算出各个理论次数。二因子相互独立,就是说算出各个理论次数。二因子相互独立,就是说注射疫苗与否不影响发病率。也就是说

32、注射组注射疫苗与否不影响发病率。也就是说注射组与未注射组的理论发病率应当相同,均应等于与未注射组的理论发病率应当相同,均应等于总发病率总发病率34/80=0.425=42.5%34/80=0.425=42.5%。依此计算出各个。依此计算出各个理论次数如下:理论次数如下:2 2、提出无效假设与备择假设、提出无效假设与备择假设3 3、计算理论次数、计算理论次数 未注射组的理论发病数:未注射组的理论发病数: T21=3634/80=15.3, 或或 T21=34-18.7=15.3; 未注射组的理论未发病数:未注射组的理论未发病数: T22=3646/80=20.7, 或或 T22=36-15.3=

33、20.7。 从上述各理论次数从上述各理论次数Tij的计算可以得到各理论次数,表的计算可以得到各理论次数,表6-11括括号内的数据为相应的理论次数。号内的数据为相应的理论次数。4、计算、计算 值值2c 将表将表6-11中的实际次数、理论次数代入中的实际次数、理论次数代入(6-4)式得:式得: 3 .15) 5 . 0| 3 .1522(|3 .25) 5 . 0| 3 .2532(|7 .18) 5 . 0| 7 .1812(|2222c944. 77 .20) 5 . 0|7 .2014(|22c 因为因为 20.01(1) = 6 . 6 3 ,而,而 =7.944 20.01(1),P0.

34、01,否定,否定H0,接受,接受HA,表明发病率与是否注射疫,表明发病率与是否注射疫苗极显著相关,这里表现为注射组发病率极显著低于苗极显著相关,这里表现为注射组发病率极显著低于未注射组,说明该疫苗是有预防效果的。未注射组,说明该疫苗是有预防效果的。 在进行在进行2 2列联表独立性检验时,还可利用下述简列联表独立性检验时,还可利用下述简化公式(化公式(6-6)计算)计算 :2c2c 5、由自由度、由自由度df=1查临界查临界 2值,作出统计推断值,作出统计推断 (6-6) 在(在(6-6)式中,)式中, 不需要先计算理论次数,不需要先计算理论次数,直接利用实际观察次数直接利用实际观察次数Aij,

35、行、列总和,行、列总和Ti.、T.j和总总和和总总和T.进行计算进行计算 ,比利用公式(,比利用公式(6-4)计)计算简便,且舍入误差小。算简便,且舍入误差小。 对于【例对于【例6.7】,利用(】,利用(6-6)式可得:)式可得: .)2/.(21212211222112TTTTTTAAAAc944. 74436463480)280|22321412(|22c所得结果与前面计算计算的相同。所得结果与前面计算计算的相同。a b c d 简便记忆法简便记忆法经验公式法(经验公式法(abcdabcd法)法) 甲、乙两药疗效比较甲、乙两药疗效比较 处理处理 有效人数有效人数 无效人数无效人数 合计合计

36、 有效率(有效率(%)甲药甲药 2323 8 8 3131 74.1974.19 乙药乙药 4646 2 2 4848 95.8395.83. . 合计合计 6969 1010 7979 87.3487.34 1 1、资料整理得下表、资料整理得下表2 2、无效假设与备择假设、无效假设与备择假设3、计算、计算 值值2c4、由自由度、由自由度df=1查临界查临界 2值,作出统计推断值,作出统计推断(二)(二)2c列联表的独立性检验列联表的独立性检验 2c列联表是行因子的属性类别数为列联表是行因子的属性类别数为2,列因子,列因子的属性类别数为的属性类别数为c(c 3)的列联表。其自由度)的列联表。其

37、自由度d f = (2-1) (c -1) = (c-1),因为,因为c 3,所以自由度大于,所以自由度大于2,在,在进行进行 2检验时,不需作连续性矫正。检验时,不需作连续性矫正。2c表的一般表的一般形式见表形式见表6-12。 表表6-12 2 c联列表一般形式联列表一般形式其中其中Aij (i=1,2;j=1,2,c)为)为实际观察次数。实际观察次数。 【例【例6.8】 在甲、乙两地进行水牛体型调在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣查,将体型按优、良、中、劣 四个等级分类,四个等级分类,其结果见表其结果见表6-13,问两地水牛体型构成比是否,问两地水牛体型构成比是否相同。相

38、同。 这是一个这是一个24列联表独立性检验的问题,列联表独立性检验的问题,检验步骤如下:检验步骤如下: 表表6-13 两地水牛体型分类统计两地水牛体型分类统计1 1、先将资料整理成列联表、先将资料整理成列联表 H0:水牛体型构成比与地区无关,即两地:水牛体型构成比与地区无关,即两地水牛体型构成比相同。水牛体型构成比相同。 HA:水牛体型构成比与地区有关,即两地:水牛体型构成比与地区有关,即两地水牛体型构成比不同。水牛体型构成比不同。2 2、提出无效假设与备择假设、提出无效假设与备择假设 计算方法与计算方法与22表类似,即根据两地水牛体型构表类似,即根据两地水牛体型构成比相同的假设计算。成比相同

39、的假设计算。 如优等组中,甲地、乙地的理论次数按理论比率如优等组中,甲地、乙地的理论次数按理论比率20/135计算;良等组中计算;良等组中,甲地、乙地的理论次数按理论甲地、乙地的理论次数按理论比率比率15/135计算;中等、劣等组中计算;中等、劣等组中,甲地、乙地的理论甲地、乙地的理论次数分别按理论比率次数分别按理论比率80/135和和20/135计算。计算。3 3、计算理论次数、计算理论次数 甲地优等组理论次数:甲地优等组理论次数: T11=9020/135=13.3, 乙地优等组理论次数:乙地优等组理论次数: T21=4520/135=6.7, 或或T21=20-13.3=6.7; 其余各个理论次数的计算类似。其余各个理论次数的计算类似。582. 76 . 6) 6 . 610(7 .26) 7 .2620(10)1010(3 .13) 3 .1310(222224、计算、计算 2值值 因为因为 20.05(3) = 7 . 8 1 ,而,而 2=7.5820.05,不能否定,不能否定H0,可以认为甲、乙两地水牛体可以认为甲、乙两地水牛体型构成比相同。型构成比相同。 在进行在进行2c列联表独立性检验时,还可利用下列联表独立性检验时,还可利用下述简化公式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论