第十四讲统计1105班孙铭远翻译.docx

上传人：q*** IP属地：河南上传时间：2020-04-10 格式：DOCX 页数：10 大小：95.18KB 积分：14 举报 版权申诉

已阅读5页，还剩5页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第十四讲平移参数的Wilcoxon的置信区间针对两组总体，我们已经讨论了两组基于秩的检验。1，配对数据的Wilcoxon符号秩检验2，独立数据的Wilcoxon秩和检验本章中内容是估计两组数据位置差的置信区间，在两组总体中，可能会出现中位数差异（正如符号秩检验）或仅出现一般的“位置平移”，在任意一个情况下，我们使用符号“”表示平移参数。14.1回顾两组不同总体均值差的置信区间让我们简单回顾参数分析中，比较两组样本均值1 2时使用的t检验。若我们拒绝原假设H0: 1 2 = 0，我们的结论就是一个样本与另外一个样本的区别明显（高于或低于），那我们自然就会提出一个问题，它们究竟相差多少？我们通常求得1 2的置信区间来回答这个问题，置信区间给定了一个范围，在这个范围中我们可以确保存在组间均值差。（想了解更多细节实例，请翻阅3.8）顺着这种思路，我们思考在非参数条件的情况。如你所望，处理方式多种多样（包括一个更为先进的技术，我们将在之后的学习中涉及到）但现在我将介绍一个经常使用的传统方法14.2独立样本时的置信区间接下来我们将研究独立样本中Wilcoxon秩和检验的置信区间，先介绍它的原因是我们对Wilcoxon秩和检验更熟悉。让我们已饮食习惯数据为例（我保证最后一次）再上一章中运行Wilcoxon秩和检验，我们有充分理由认定A习惯下实际增长速度大于B，下面我们来复习一下操作步骤 wilcox.exact(A, B, paired=FALSE, alternative=greater)Exact Wilcoxon rank sum testdata: A and BW = 56, p-value = 0.02154alternative hypothesis: true mu is greater than 0现在的问题是：A饮食习惯增加的生长速度究竟有多高？首先，我们不要在意均值差（因为Wilcoxon秩和检验不比较均值），而是关注位置的差异，两组饮食习惯AB数据分布的差异记为平移参数，我们记做，有些人认为是两组数据分布中位数的差异，但从技术上考虑这并不是的定义，我们的目的是为了估计并求得的其置信区间Hodges-Lehmann估计，Hodges-Lehmann估计是的非参数点估计量，作为检验均值差的备选估计量。对于独立样本，Hodges-Lehmann式所有可能的Xi-Yi形式差值的中位数，其中Xi是首个样本的任意值，其中Yi是第二个个样本的任意值。下面是计算的例子。例：研究以下来自两个不同群组的相互独立样本这个例子中，m=4，n=3，为估计，我们建立一个43的直线坐标系，其包含所有可能组合，如下所示，括号内即为样本值：是12组差的中位数，R中点估计的过程可以使用以下代码表示 x y diffs diffs1 -9 -1 8 -7 -5 3 12 -3 -5 3 12 -3 median(diffs)1 -2经计算，从X到Y的总体平移为-2的置信区间首先，将上例中的差值进行排列 sort(diffs)1 -9 -7 -5 -5 -3 -3 -1 3 3 8 12 12将排列值记为 D(1)，D(2)，,D(12)，同第7章表示中位数置信区间的方式类似，的置信区间表示形式如下（D（k），D（mn+1-k）M为第一个样本的长度，n为第二个样本的长度，k记为kth，我们所做的（与前文类似）从每个排列好的差值两端计算K值，以求得置信区间，置信登机并非由二项分布决定的，我们无须考虑繁杂的数据来源。以下给出R中计算的运行代码conf.level - 0.95m - length(x)n - length(y)diffs - sort(as.vector(outer(x, y, -)mn - length(diffs)alpha - 1 - conf.levelk - qwilcox(alpha/2, m, n)if (k = 0) k A B conf.level m n diffs mn HL HL1 25 alpha k if (k = 0) k k1 15 cat(Achieved confidence level:, 1 - 2*pwilcox(k-1, m, n), n)Achieved confidence level: 0.9569107 c(diffsk, diffsmn+1-k)1 1 47计算可得Hodges-Lehmann点估计量为25,95%置信水平下置信区间为（1,47），我们有95%的可能性认为A中处在1到47顺序的数据高于这一位置上的B数据（为什么高于呢？）注意：1，由于置信区间端点的的离散型，可能无法取得准切的置信等级，比方说，假定你取得两组m=10，n=7的数据，这便存在70个可能差值，因此我们理论上可以取得35个具体区间，通过这样的操作你可以得到从1到35所有与K值相关的置信等级k - 1:35conf 0.52在exactRankTests拓展包里，wilcox.exact()有置信区间的选项，可尽管wilcox.exact()在处理打结数据的假设检验时很有效，但却无法正确计算其置信区间（同志仍需努力！）所以，计算置信区间请不要使用这个功能，而应当使用以上代码。14.3配对样本的置信区间以下为配对样本中，使用Wilcoxon符号秩检验（第9讲）的置信区间Hodges-Lehmann 点估计：对于配对数据，Hodges-Lehmann 点估计有不同的意义，在这里，它是“Walsh平均数”即差值组合的（2n）+n平均数，以下列形式表示： iIj以下是计算的简单说明课堂练习，以下为三个组合数据的样本：计算这些数据的Walsh平均值的置信区间，同第7讲中求中位数置信区间非常类似，的置信区间有如下形式（W（k），W（mWA+1-k）nWA是Walsh平均数，k记为kth，我们所做的（与前文类似）从每个排列好的Walsh平均数两端计算K值，以求得置信区间，以下给出求配对数据置信区间的R程序代码conf.level - 0.95d - sort(x-y)n - length(d)walsh - outer(d, d, +)/2walsh - sort(walshlower.tri(walsh, diag = TRUE)nW - length(walsh)alpha - 1 - conf.levelk - qsignrank(alpha/2, n)if (k = 0) k x y conf.level d n walsh walsh nW alpha k if (k = 0) k k1 22 cat(achieved confidence level:, 1 - 2*psignrank(k-1, n), n)achieved confidence level: 0.9505615 c(walshk, walshnW+1-k)1 -15 -4我们有95%的信心认为按1的次数在4

人人文库> 全部分类> 教育资料 > 英语等级

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第十四讲统计1105班孙铭远翻译.docx

文档简介

温馨提示

最新文档

评论

第十四讲 统计1105班孙铭远 翻译.docx

文档简介

温馨提示

最新文档

评论

相关文档

第十四讲统计1105班孙铭远翻译.docx