经典非参数假设检验方法全.ppt_第1页
经典非参数假设检验方法全.ppt_第2页
经典非参数假设检验方法全.ppt_第3页
经典非参数假设检验方法全.ppt_第4页
经典非参数假设检验方法全.ppt_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数假设检验 在前面的课程中 我们已经了解了假设检验的基本思想 并讨论了当总体分布为正态时 关于其中未知参数的假设检验问题 然而可能遇到这样的情形 总体服从何种理论分布并不知道 要求我们直接对总体分布形式提出种种假设 然后利用样本信息对假设进行检验 在统计学中把不依赖于分布形式的统计方法称为非参数统计 对总体的分布形式的检验就是非参数检验 例如 从1500到1931年的432年间 每年爆发战争的次数可以看作一个随机变量 椐统计 这432年间共爆发了299次战争 具体数据如下 在概率论中 大家对泊松分布产生的一般条件已有所了解 容易想到 每年爆发战争的次数 可以用一个泊松随机变量来近似描述 也就是说 我们可以假设每年爆发战争次数分布X近似泊松分布 现在的问题是 上面的数据能否证实X具有泊松分布的假设是正确的 又如 某钟表厂对生产的钟进行精确性检查 抽取100个钟作试验 拨准后隔24小时以后进行检查 将每个钟的误差 快或慢 按秒记录下来 问该厂生产的钟的误差是否服从正态分布 再如 某工厂制造一批骰子 声称它是均匀的 为检验骰子是否均匀 要把骰子实地投掷若干次 统计各点出现的频率与1 6的差距 也就是说 在投掷中 出现1点 2点 6点的概率都应是1 6 问题是 得到的数据能否说明 骰子均匀 的假设是可信的 本章只介绍 2拟合优度检验 柯尔莫哥洛夫以及斯米尔诺夫检验 独立性检验方法 除此还有 符号检验 游程检验 秩和检验等等 K 皮尔逊 这是一项很重要的工作 不少人把它视为近代统计学的开端 解决这类问题的工具是英国统计学家K 皮尔逊在1900年发表的一篇文章中引进的所谓 2检验法 2检验法是在总体X的分布未知时 根据来自总体的样本 检验关于总体分布的假设的一种检验方法 经典统计的多数检验都假定了总体的背景分布 在那里 总体的分布形式或分布族往往是给定的或者是假定了的 所不知道的仅仅是一些参数得知或它们的范围 于是 人们的主要任务就是对一些参数 比如均值和方差 或标准差 进行估计或检验 如检验正态分布的均值是否相等或等于零等等 最常见的检验是和正态总体有关的t 检验 F 检验 X2检验和最大似然比检验等 为什么用非参数方法 为什么用非参数方法 非参数检验是针对参数检验而言的 从检验步骤上讲 二者是一致的 它们都是对总体的某种数量特征建立相应的原假设和备择假设 都是在给定的显著性水平下 根据实际统计量来判断对原假设的取舍 二者的不同之处在于 参数检验需要对总体分布作限制性的假定 这种假定实际就是要求总体的分布类型已知 所不知道的只是其中的某个参数 如均值或方差 而非参数检验并不要求已知总体的分布信息 而是根据数据本身来推断总体参数 为什么用非参数方法 在实际生活中 总体的分布信息并不是容易得到的 有时 数据并不是来自所假定的总体 或者 数据根本不是来自同一个总体 还有可能 数据因为种种原因被严重 污染 这样 在假定总体分布的情况下进行推断的做法就可能产生错误的或者甚至灾难性的结论 于是 人们希望在不假定总体分布的情况下 尽量从数据本身来获得所需要的信息 这就是非参数统计的宗旨 为什么用非参数方法 正是由于非参数检验要求的信息少 检验条件比较宽松 因此它具有很强的适应性 应用的范围比起参数检验更宽广 非参数检验不仅可以应用于定距 定比数据的检验而且也适用于定类 定序数据的假设检验 对于那些不能直接进行加减乘除四则运算的数据 运用符号检验 秩和检验都能起到比较好的效果 为什么用非参数方法 非参数检验同样也有其缺点 由于它对总体的分布没有严格的要求 因此在检验过程中会失去许多有用的信息 在方法上就缺乏针对性 而且非参数检验是通过处理样本数据的秩或等级来检验假设的 而不是利用原始数据 这又会失去一些信息 因而检验的有效性有时会比较差 当然 如果我们事先对总体的分布信息一无所知或难下定论 那么建立在数据本身基础上的非参数检验结果要比建立在一个可疑的总体分布基础上得到的参数检验结果要可靠的多 为什么用非参数方法 但是在总体分布形式已知时 非参数检验就不如传统方法效率高 这是因为非参数方法利用的信息要少些 往往在传统方法可以拒绝零假设的情况 非参数检验无法拒绝 但非参数统计在总体未知时效率要比传统方法要高 有时要高很多 是否用非参数统计方法 要根据对总体分布的了解程度来确定 为什么用非参数方法 那么 如何在不知道总体分布的情况下利用数据本身的信息来进行假设检验呢 我们知道 一组数据最基本的信息就是次序 我们把样本中各个数据按从小到大的顺序排列起来 则每个数据都会在这个顺序数列中有它的位置或次序 这个位置或次序就叫做秩 数据有多少个观察值 就有多少个秩 在一定的假设下 这些秩和它们的统计量的分布是可以求出来的 而且和原来的总体分布无关 这样就可以进行所需要的统计推断了 这就是本节所讲的非参数假设检验的基本思想 为什么用非参数方法 根据样本又分成 单样本检验两独立样本检验非参数检验多个独立样本检验多个相关样本检验列联表某一变量各水平比例检验在本节我们将介绍几种最常用的非参数检验方法 符号检验 秩和检验和游程检验 非参数检验的方法有很多种 如下几种检验 正态慨率纸检验 皮尔逊 Pearson 2拟合检验 柯尔莫哥洛夫与斯米尔诺夫检验 Shapiro WilkW检验 D Agostion sD检验 Wilcoxon秩和检验 符号检验秩和检验游程检验 非参数检验 非参数假设检验方法 一 2拟合优度检验二 柯尔莫哥洛夫三 斯米尔诺夫检验四 独立性检验 一 2拟合优度检验 适用范围广 一个离散 连续 正态总体都适用 1 多项分布的 2检法 离散总体 对一次抽样来说 现在对总体X进行假设 即对X的分布律进行假设 由于频率是概率的近似表现 那么当容量n较大时 类似于以前的检验方法 取一个标准化的度量 为此在1900年 英国统计学家KarlPearson首先提出 从该统计量直观上判断有 另外 用该统计量对总体分布律进行检验 还必须知道其分布 Pearson给出了其渐近分布 定理1 由此可以建立H0的拒绝域 只要给定一组样本观察值 代入检验统计量计算后 就能得出结论 例1某商场为了研究顾客对一类商品的某三种品牌商品的喜好比例 以便为下次进货提供较科学的依据 现随机观察购买此商品的150名顾客 并记录下其所买的品牌 统计人数如下 依据这些数据 是否可以断定顾客对此三种品牌的商品喜好确实存在着显著的差异 0 05 解 若对此三种品牌的商品喜好确实不存在着显著的差异 就意味着 对三种品牌的商品喜好比例p1 p2 p3相等 此是m 3 n1 61 n2 53 n3 36 n 150 由于6 52 5 991 故有理由拒绝H0 认为顾客对此三种品牌的商品喜好确实存在着显著的差异 例264只某种杂交的几内亚猪的后代 其中34只红色 10只黑色 20只白色 根据遗传模型 它们之间的比例应为9 3 4 问以上数据在0 05的水平下体现的与遗传模型是否吻合 解 若基本吻合 则p1 9 16 p2 3 16 p3 4 16 此是m 3 n1 34 n2 10 n3 20 n 64 认为基本吻合 若X的分布函数F x 的具有明确表达式F0 x 不含未知参数 根据样本信息推断X的分布函数是否为F0 x 第一步 第二步 采用分组离散化方法 计算 例3验证一枚骰子是否均匀 电话号码的数字出现的概率等等问题 第三步 记数 第四步 检验 其中m为分组数 H0的拒绝域为 一般有n 50 npi 5最好npi 10 否则应重新分组 使得npi 5最好npi 10 例4在一个暗盒中存放有白色与黑色两色乒乓球 问该盒中的白 黑球的个数是否相等 为此作以下试验 用不返回抽取发式从此盒中取球 直到取出的球是白色球为止 并记录下抽取的次数 共重复独立试验了100次 结果如下 解 若两色球个数相等 则每次取到白球的概率为1 2 以抽取次数X为考查对象 则X服从几何分布 即 计算得 此是m 5 n1 43 n2 31 n3 15 n4 6 n5 5 n 100 计算有 结论 接受H0 3 若X的分布函数F x 的具有明确表达式F0 x 但含r个未知参数 根据样本信息推断X的分布函数是否为F0 x 第一步 由样本进行参数的点估计后 将参数估计值代入分布函数中 使得分布函数成为已知函数F0 x 第二步 仿造情形 2 分组离散 令 第三步 其中m为分组数 r为分布函数中待估参数数 一般有n 50 npi 5最好npi 10 否则应重新分组 使得npi 5最好npi 10 让我们回到检验每年爆发战争次数分布是否服从泊松分布 按参数为 0 69的泊松分布 计算事件X i的概率pi 将有关计算结果列表如下 pi的估计是 根据观察结果 得参数 的极大似然估计为 假设H0 X P 0 69 i 0 1 2 3 4 定理2 R A Fisher 第四步 检验 H0的拒绝域为 因H0所假设的理论分布中有一个未知参数 0 1830 3760 2511 623 战争次数 实测频数 x01234fi22314248154pi0 580 310 180 010 02npi216 7149 551 612 02 16 14 16 2 43 5的要合并 即将发生3次及4次战争的组归并为一组 按 0 05 自由度为4 1 1 2查 2分布表得 故认为每年发生战争的次数X服从参数为0 69的泊松分布 2 2 43 5 991 由于统计量的实测值 未落入否定域 奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验 并根据试验结果 运用他的数理知识 发现了遗传的基本规律 在此 我们以遗传学上的一项伟大发现为例 说明统计方法在研究自然界和人类社会的规律性时 是起着积极的 主动的作用 孟德尔 由于随机性 观察结果与3 1总有些差距 因此有必要去考察某一大小的差异是否已构成否定3 1理论的充分根据 这就是如下的检验问题 这里 n 70 27 97 k 2 检验孟德尔的3 1理论 假设H0 p1 3 4 p2 1 4 H1 p1 3 4 p2 1 4至少一不成立 理论频数为 np1 72 75 np2 24 25 实测频数为70 27 他的一组观察结果为 黄70 绿27 近似为2 59 1 与理论值相近 根据他的理论 子二代中 黄 绿之比近似为3 1 由于统计量 2的实测值 统计量 自由度为m 1 1 2 0 4158 3 841 按 0 05 自由度为1 查 2分布表得 20 05 1 3 841 未落入否定域 故认为试验结果符合孟德尔的3 1理论 这些试验及其它一些试验 都显示孟德尔的3 1理论与实际是符合的 这本身就是统计方法在科学中的一项重要应用 用于客观地评价理论上的某个结论是否与观察结果相符 以作为该理论是否站得住脚的印证 例5某种动物的后代按体格的属性分为三类 据观察某一群此类动物其中各类的数目分别为10 53 46 按照遗传模型其各类的频率应为p2 2p 1 p 1 p 2 问这些数据是否与此模型相吻合 在 0 05的显著性水平 解 1 用最大似然估计法估计参数p 例5某种动物的后代按体格的属性分为三类 据观察某一群此类动物其中各类的数目分别为10 53 46 按照遗传模型其各类的频率应为p2 2p 1 p 1 p 2 问这些数据是否与此模型相吻合 在 0 05的显著性水平 解 1 用最大似然估计法估计参数p 2 计算 3 假设 4 计算 2 例5某种动物的后代按体格的属性分为三类 据观察某一群此类动物其中各类的数目分别为10 53 46 按照遗传模型其各类的频率应为p2 2p 1 p 1 p 2 问这些数据是否与此模型相吻合 在 0 05的显著性水平 解 1 用最大似然估计法估计参数p 2 计算 3 假设 4 计算 2 5 H0的拒绝域 6 结论 接受H0 认为此数据基本符合模型的 4 2拟合优度检验法的特点 1 适用面广 离散和连续总体均可以使用 是考察实测频率与理论频率的差异 2 此法从本质上看 只是检验了理论分布函数的 而未真正检验 然而虽然样本与分组情况都具有随机性 但是当分布函数较为光滑时 即使F x 与F0 x 有差异 也不应该太大 故此法虽有误差 但是常用的方法之一 3 2拟合优度检验法依赖于区间的划分 即依赖与分组情况 即使 但若恰好在分组点处的两函数值相差不大 即便H0是不真 但 2的检验统计值不改变 从而 2拟合优度检验法的精度不高 容易范取伪错误 二 柯尔莫哥洛夫检验 为了进一步提高精度 柯尔莫哥洛夫针对一个总体的分布函数 在采用分组离散化后利用经验分布函数的性质的方法 较完整的考察了经验分布函数Fn x 与理论分布函数F x 的差异 提高了检验的精度 但假定分布函数是连续的 设总体X的分布函数F x 连续 故可以选用 定理3设分布函数F x 连续 则 定理4设分布函数F x 连续 则 1 选用Dn为检验统计量 假设H0的拒绝域为 2 当n 40或100时 可得一近似求Dn 值方法 假设H0的拒绝域仍为 即 此种方法虽较精确 但计算量较大 例6某林区中 随机抽取340株树木组成的样本 测其胸径 经整理后数据统计如下 试用柯尔莫哥洛夫检验法检验该林区的树木胸径是否服从正态分布 0 05 解 1 解 4 求 5 检验 接受H0 柯尔莫哥洛夫检验法 除了分布检验外 还可以用来未知分布函数F x 进行区域估计 实际有 x y 一 符号检验法 在许多实际应用场合 我们关心的不是总体的分布是什么形状 而是关心 多个 总体是否相同或者 单个 总体的位置 如均值 中位数 有没有发生变化 这时就可采用最为简单的检验方法 符号检验法 在单样本检验中 符号检验法可以有效地检验总体的中位数是否等于某一个特定数值 而在配对样本的检验中 符号检验法可以检验两个总体是否相同 或者两个样本是否来自于同一总体 1 单样本的符号检验 我们知道 反映一个总体分布位置的参数主要有平均数和中位数 平均数反映的是总体分布的重心位置 而中位数则是反映分布数据上下两半观察值次数相等的中央位置 当总体呈对称分布时 二者的位置是一致的 当分布为不对称时 而这就有差别了 当偏斜度较大时 由于中位数对极端值不敏感 往往比平均数更有实际意义 因此 中位数相对于平均数来讲适应性更强 在总体分布形态未知的时候 使用中位数作为总体的未知参数进行检验很有意义 1 单样本的符号检验 1 单样本的符号检验 1 单样本的符号检验 下面通过例题来说明单样本符号检验的具体步骤 1 单样本的符号检验 1 单样本的符号检验 1 单样本的符号检验 1 单样本的符号检验 2 配对样本的符号检验 在许多实际工作和科学研究中 往往要检验两个独立的样本是否来自同一总体或者是否存在显著性差异 在不知总体分布信息的情况下 就需要利用配对样本的符号检验法来检验假设 基本思路是 将两样本的数据按某一规则配对 然后将各组配对值相减得到一系列差值 如果两组样本来自同一总体或者不存在显著性差异 则所得的为正的差值个数n 应该与为负的差值个数n 相差不多 如果二者相差较远的话 则有理由拒绝原假设 下面通过例题来介绍配对样本符号检验法的具体步骤 2 配对样本的符号检验 例13某工厂为比较日班生产与夜班生产的效率是否有显著差异 随机抽取两星期进行观察 各日产量比较如下表5 5所示 试在显著性水平下 判断日 夜班生产是否存在显著性的差异 2 配对样本的符号检验 2 配对样本的符号检验 2 配对样本的符号检验 2 配对样本的符号检验 2 配对样本的符号检验 2 配对样本的符号检验 2 配对样本的符号检验 符号检验法的最大优点是简单 直观 并且不要求知道被检验量所服从的分布 缺点就是精确程度较差 没有充分利用样本所提供的信息 而且要求数据搭配成对 下面介绍的秩和检验法在一定程度上弥补了上述缺陷 2 配对样本的符号检验 二 秩和检验法 在运用符号检验法检验两总体分布是否相同时 其基本条件之一就是两总体的样本是可以根据某一规则配对的 而在实际问题中 两总体样本是独立调查的 并不总是可以配对 在这种情况下 符号检验法就不能使用了 而秩和检验法可以用于两总体非配对样本是否有显著差异的检验 秩和检验法不仅考虑样本差值的符号信息 而且同时考虑了样本差值的出现顺序 因此他在利用样本的信息方面比符号检验更充分 所以效力也更强 秩 rank 非参数检验中秩是最常使用的概念 什么是一个数据的秩呢 一般来说 秩就是该数据按照升幂排列之后 每个观测值的位置 例如我们有下面数据 这下面一行 记为Ri 就是上面一行数据Xi的秩 秩 rank 利用秩的大小进行推断就避免了不知道背景分布的困难 这也是大多数非参数检验的优点 多数非参数检验明显地或隐含地利用了秩的性质 但也有一些非参数方法没有涉及秩的性质 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 二 秩和检验法 三 关于随机性的游程检验 runtest 游程检验方法是检验一个取两个值的变量的 这两个值的出现是否是随机的 假定下面是由0和1组成的一个这种变量的样本 数据run1 sav 0000111111001011100000000其中相同的0 或相同的1 在一起称为一个游程 单独的0或1也算 这个数据中有4个0组成的游程和3个1组成的游程 一共是R 7个游程 其中0的个数为m 15 而1的个数为n 10 关于随机性的游程检验 出现0和1的这样一个过程可以看成是参数为某未知p的Bernoulli试验 但在给定了m和n之后 在0和1的出现是随机的零假设之下 R的条件分布就和这个参数无关了 根据初等概率论 R的分布可以写成 令N m n 关于随机性的游程检验 关于随机性的游程检验 于是就可以算出在零假设下有关R的概率 以及进行有关的检验了 利用上面公式可进行精确检验 也可以利用大样本的渐近分布和利用MonteCarlo方法进行检验 利用上面数据的结果是 三 游程检验 runtest 关于随机性的游程检验 当然 游程检验并不仅仅用于只取两个值的变量 它还可以用于某个连续变量的取值小于某个值及大于该值的个数 类似于0和1的个数 是否随机的问题 看下面例子 例 run2 s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论