R语言列联表检验和相关性检验_第1页
R语言列联表检验和相关性检验_第2页
R语言列联表检验和相关性检验_第3页
R语言列联表检验和相关性检验_第4页
R语言列联表检验和相关性检验_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 假设检验假设检验简介5.5 列联表检验 5.6 相关性检验总结假设检验简介1. 概念2. 方法3. 基本思想4. 两类错误5. P值假设检验简介概念:概念:假设检验是统计推断中的一个重要内容,它是利用样样 本数据本数据对某个事先做出的统计假设按照某种设计好的 方法进行检验,判断此假设是否正确。方法方法参数性假设检验:总体分布已知,通过样本检验 关于未知参数的某个检验。非参数性假设检验:总体分布未知时的检验问题。1.2.原假设原假设/零假设(记为零假设(记为H0):):作为检验的对象的假设。 备择假设(记为备择假设(记为H1):):与原假设对立的假设。用t.test()函数作 t 检验用

2、var.test()函数作 F 检验用prop.text()函数作二项分布的近似检验假设检验简介基本思想:基本思想:反证法思想为了检验一个“假设”是否成立,就先假定这个“假设”是成立的,而看由此会产生的效果。如果导致一个不合理现象出现,就表明原先的“假设”不成立,就拒绝这个“假设”;如果由此没有导致不合理现象的发生,则不能拒绝原“假设”。该方法又区别于纯数学中的反证法。这里所谓的“不合理”,并不是形式逻辑中的绝对矛盾,而是基于人们实践中广泛采用的一个原则:小概率事件在一次小概率事件在一次观察中可以认为基本上不会发生。观察中可以认为基本上不会发生。3.假设检验简介两类错误:两类错误:第一类错误:

3、否定了真实的原假设。 犯第一类错误的概率为:P 否定H0|H0为真|第二类错误:接受了错误的原假设。 犯第二类错误的概率为:P 接受H0|H0为假|4.P值:值:5.犯第一类错误的概率,即:P 值值=P 否定否定H0|H0为真为真当当P值值(如(如=0.05),则拒绝原假设;否则,接受原假设。),则拒绝原假设;否则,接受原假设。使用P值的方法与使用拒绝域的方法是等价的。5.5 列联表检验 1. 概念2. Pearson2独立性检验3. Fisher精确独立性检验4. McNemar检验5. 三维列联表的条件独立性检验5.5 列联表检验 设两个随机变量X,Y均为离散型的,X取值于a1, a2,

4、,aI, Y取值于b1, b2, ,bJ。设(X1,Y1),(X2,Y2), ,(Xn,Yn)为简单样本,记nij为(X1,Y1),(X2,Y2), ,(Xn,Yn)中等于( ai, aj )的个数。在求解问题时,常把数据列为形如表5.9的形式,称为列联表;根据列联表数据做的检验称为列联表检验。概念:概念:1.b1b2bJ合计合计a1n11n12n1Jn1a2n21n22n2Jn2.aInI1n2JnIJnI合计N1N1N1表表5.9 列联表列联表5.5 列联表检验 Pearson2 2独立性检验:独立性检验:2.H0:X与Y独立,H1:X与Y不独立(相关).用chisq.test()函数可完

5、成列联表数据的Pearson2独立性检验,需将列联表写成矩阵形式。P198,使用该函数计算Pearson拟合优度2检验5.5 列联表检验 例例5.26 在一次社会调查中,以问卷方式共调查了901人的月收入及对工作的满意程度,其中有收入A分为:小于3000元、30007500元、750012000元及超过12000元4档。对工作的满意程度B分为:很不满意、较不满意、基本满意和很满意4档。调查表用4x4列联表表示,如表5.10所示。试分析工资收入与对工作的满意度是否有关。工资收入很不满意较不满意基本满意很满意合计120007185492171合计62108319412901表表5.10 列联表列联

6、表5.5 列联表检验 例例5.27 为了研究吸烟是否与患肺癌有关,对63位肺癌患者及43名非肺癌患者(对照组)调查了其中的吸烟人数,得到2x2列联表,如表5.11所示。患肺癌未患肺癌合计吸烟603292不吸烟31114合计6343106表表5.11 列联表列联表Chisq.test(x,correct=FALSE) 与与 Chisq.test(x)采用连续修正的情况下,参数orrect默认为TRUE5.5 列联表检验 Fisher精确独立性检验:精确独立性检验:3.在样本数较小时,需要用Fisher精确检验来完成独立性实验。使用函数fisher.test()作精确独力检验。例例5.28 某医师

7、为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和对照组,结果如表5.12所示。问两组新生儿的HBV总体感染率有无差别。组别阳性阴性合计预防注射组41822对照组5611合计92433表表5.12 两组新生儿两组新生儿HBV感染情况的比较感染情况的比较用Fisher精确检验对吸烟数(据例5.27)作检验。5.5 列联表检验 McNemar检验:检验:4.McNemar是用来比较两种检验,比如A和B,来看A和B是否有差异。例例5.29 某胸科医院同时用甲、乙两种方法测定202份痰标本中的抗酸杆菌,结果如表5.14所示。问甲、乙两法的检出率有无显著差异

8、?甲法甲法乙乙 法法合计合计+49257421107128合计70132202表表5.12 两组新生儿两组新生儿HBV感染情况的比较感染情况的比较5.5 列联表检验 三维列联表的条件独立性检验:三维列联表的条件独立性检验:5.用chisq.test()函数作2 2检验,再用prop.test()函数作比例检验。例例5.30 表5.15是19761977年美国佛罗里达州的凶杀案件中,326名被告的肤色与死刑判决情况表。试用这组数据分析,被判死刑是否与被告的肤色有关。被告死刑合计是否白种人19141160黑种人17149166合计36290326表表5.15 被告肤色与死刑判决情况被告肤色与死刑判

9、决情况5.5 列联表检验 用mantelhaen.test()函数完成Mantel-Haenszel检验。例例5.31 (继5.30)表5.16给出了带有被害人的数据。再分析被判死刑是否与被告的肤色有关。被告被害人死刑是否白种人白种人19132黑种人09黑种人白种人1152黑种人697表表5.16 被告人与被害人肤色以及死刑判决情况被告人与被害人肤色以及死刑判决情况5.6 相关性检验H0:XY0,H0:XY0函数功能:函数功能:对成对数据进行相关性检验,有3中方法可供使用,分别是Pearson检验、Kendall检验和Spearman检验。 函数的使用格式为:函数的使用格式为:cor.test

10、(x, y, alternative = c(“two.sided”, “less”, “greater”), method = c(pearson, kendall, spearman),conf.level = 0.95) 其中x,y是供检验的样本;alternative指定是双侧检验还是单侧检验;method为检验的方法;conf.level为检验的置信水平。cor.test()函数进行相关性系数的计算和检验:函数进行相关性系数的计算和检验:5.6 相关性检验例例5.32 对于20个随机选取的黄麻个体植株,记录青植株重量Y与它们的干植株重量X。设二元总体(X,Y)服从二维正态分布,其观测

11、数据如表5.17所示。试分析青植株重量与干植株重量是否有相关性。XYXYXY1689718123211514229263892920315162733237011251030375171718546821133462185370356593112273521962872691121321305206574071016214584表表5.17 青植株与干植株的重量青植株与干植株的重量5.6 相关性检验例例5.33 一项有6个人参加表演的竞赛,有两人进行评定,评定结果如表5.18所示。试检验这两个评定员对等级评定有无相关关系。甲的打分123456乙的打分654321表表5.18 两位评判者的评判成

12、绩两位评判者的评判成绩例例5.34 某幼儿园对9对双胞胎的智力进行检验,并按百分制打分。现有资料如5.19所示,使用Kendall相关检验方法检验双胞胎的智力是否相关。先出生的儿童867768917071858763后出生的儿童887664966580817260表表5.19 9对双胞胎的得分情况对双胞胎的得分情况总结列联表检验 相关性检验1.Pearson2独立性检验2.Fisher精确独立性检验3.McNemar检验4.三维列联表的条件独立性检验cor.test()函数进行相关性系数的计算和检验假设检验简介概念:概念:假设检验是统计推断中的一个重要内容,它是利用样样 本数据本数据对某个事先

13、做出的统计假设按照某种设计好的 方法进行检验,判断此假设是否正确。方法方法参数性假设检验:总体分布已知,通过样本检验 关于未知参数的某个检验。非参数性假设检验:总体分布未知时的检验问题。1.2.原假设原假设/零假设(记为零假设(记为H0):):作为检验的对象的假设。 备择假设(记为备择假设(记为H1):):与原假设对立的假设。用t.test()函数作 t 检验用var.test()函数作 F 检验用prop.text()函数作二项分布的近似检验5.5 列联表检验 设两个随机变量X,Y均为离散型的,X取值于a1, a2, ,aI, Y取值于b1, b2, ,bJ。设(X1,Y1),(X2,Y2), ,(Xn,Yn)为简单样本,记nij为(X1,Y1),(X2,Y2), ,(Xn,Yn)中等于( ai, aj )的个数。在求解问题时,常把数据列为形如表5.9的形式,称为列联表;根据列联表数据做的检验称为列联表检验。概念:概念:1.b1b2bJ合计合计a1n11n12n1Jn1a2n21n22n2Jn2.a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论