15非参数检验_第1页
15非参数检验_第2页
15非参数检验_第3页
15非参数检验_第4页
15非参数检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数检验 nonparametrictest 参数检验parametrictest 1 总体分布类型已知 如率服从二项分布 样本均数服从正态分布 2 由样本统计量推断未知总体参数 这时 对总体参数m p的假设检验称为参数检验 如t检验 F检验 非参数检验 nonparametrictest 对数据的总体分布类型不作严格假定 又称任意分布检验 distribution freetest 它直接对总体分布的位置作假设检验 已知总体分布类型 对未知参数进行统计推断 依赖于特定分布类型 比较的是参数 参数检验 parametrictest 非参数检验 nonparametrictest 对总体的分布类型不作严格要求 不受分布类型的影响 比较的是总体分布位置 优点 方法简便 易学易用 易于推广使用 应用范围广 可用于参数检验难以处理的资料 如等级资料 或含数值 50mg 等 缺点 方法比较粗糙 对于符合参数检验条件者 采用非参数检验会损失部分信息 其检验效能较低 样本含量较大时 两者结论常相同 应用非参数检验的情况 1 不满足正态和方差齐性条件的小样本资料 2 总体分布类型不明的小样本资料 3 一端或二端是不确定数值 如 0 002 65等 的资料 必选 4 单向有序列联表资料 5 各种资料的初步分析 秩次 rank 将数值变量值从小到大 或等级变量值从弱到强所排列的序号 例111只大鼠存活天数 存活天数4 10 7 50 3 15 2 9 13 60 60秩次364928157101110 510 5例27名肺炎病人的治疗结果 危险程度治愈治愈死亡无效治愈有效治愈秩次1276354平均秩次2 52 5762 552 5 本章介绍的非参数统计方法均基于秩次 秩次相同 tie 取平均秩次 第二节两个独立样本检验 Wilcoxon秩和检验Wilcoxonranksumtest 1 区间 计量 数据的两样本比较2 有序 等级 数据的两样本比较 1 区间 计量 数据的两样本比较 符合参数条件时 采用两样本均数的t检验 表11 1不同作业的两组工人的血铅值 例11 1 例数较小者为n1 T1 检验步骤 求检验统计量T值 同一组可直接写秩号 H0 两组总体分布位置相同 H1 分布位置不相同 0 05 确定P值 作出推断下结论 1 查表法 样本含量较小 根据T查P值 本书为附表112 较大作正态近似性检验 2 有序 等级 数据的两样本比较 名义数据的两样本比较 采用率或构成比的卡方检验 常错误采用卡方检验 表吸烟与不吸烟工人的HbCO 含量的比较 先确定各等级的合计人数 秩范围和平均秩 见表8 6的 4 栏 5 栏和 6 栏 再计算两样本各等级的秩和 见 7 栏和 8 栏 本例T 1917 计算Z值 第三节K个独立样本检验 完全随机设计多个样本比较的Kruskal WallisH检验 1 区间 计量 数据的多个样本比较2 有序 等级 数据的多个样本比较 1 区间 计量 数据的多个样本比较Kruskal WallisH检验 H0 多个总体分布位置相同 H1 多个总体分布位置不全相同 如果满足参数条件 这类资料一般作完全随机设计ANOVA 2 有序 等级 数据的多个样本比较 这种数据常被错误采用卡方检验 多个独立样本作两两比较的Nemenyi法检验 第四节两个相关样本检验 配对样本比较的Wilcoxon符号秩检验 Wilcoxonsigned ranktest 1 配对样本差值的中位数与0的比较2 单个样本中位数和总体中位数比较 表12份血清两法测血清谷 丙转氨酶 nmol S 1 L 的比较 1 配对样本差值的中位数与0的比较 1 建立检验假设 确定检验水平 2 求检验统计量T值 省略所有差值为0的对子数 检验步骤 按差值的绝对值从小到大编秩 相同秩 ties 则取平均秩 任取正秩和或负秩和为T 本例取T 11 5 3 确定P值 作出推断结论 1 当n 50时 查T界值表 附表10 判断原则 T在范围之外 P T范围越小 P越大 n 11 0 10 13 53 0 05 10 56 T 11 5 2 若当n 50 超出附表9范围 可用正态近似法作z检验 2 单个样本中位数和总体中位数比较 第五节K个相关样本检验 随机区组设计多个样本比较的FriedmanM检验 在每个配伍组内编秩次 两两比较的q检验 表11 12不同时间产妇羊水中前列腺素含量 ng 编号用药前用药后1小时产程开始分娩时 10 032 1 0 040 2 4 90 3 22 2 4 20 040 1 0 074 2 4 80 3 21 1 4 30 070 1 0 093 2 1 70 3 17 7 4 40 011 1 0 099 2 1 04 3 3 93 4 50 078 2 0 074 1 2 12 3 14 58 4 60 289 1 0 300 2 7 04 3 13 93 4 mi7111824 mi E 8 439 mi E 26416981 1 建立检验假设 确定检验水准 H0 不同时间羊水中前列腺素含量相同 H1 不同时间羊水中前列腺素含量不同或不全相同 0 05 2 计算统计量M 1 在各区组 b 内编秩 相同数据取平均秩次 2 求各处理组 k 秩和mi 3 求平均秩E b 区组数 k 处理数 本例b 6 k 4 则 4 计算M 3 确定概率 判断结果 查附表12 当b 6 k 4时 M0 05 76 因M 170 M0 05 P 0 05 故可认为不同时间羊水中前列腺素含量差异有统计学意义 20 05 3 7 81 20 01 3 11 34 2 17 20 01 3 P 0 01 第六节等级相关 应用 两个样本的相关分析 当两个变量不服从正态分布时 可以采用等级相关分析 Pearson相关系数的估计和检验 1 估计相关系数 估计公式 其中 xi 和 yi 是服从正态分布的两个随机变量 分别是这两个随机变量的均值 yx803077525990341702377525410541670267853208837478316 回忆 2 计算估计值r的标准误 3 的假设检验 H0 0vsH1 0 4 统计推断结论 查 n 2的t 分布表 的估计公式 当两个随机变量 xi 和 yi 不服从正态分布或分布未知时 用下面公式估计相关系数 这就是Spearman相关系数 Spearman相关系数的估计和检验 与计算Pearson相关系数的区别 采用秩次代替原变量 Spearman相关系数 的另一计算公式 其中 d s t 相同秩次较多时 TX 或TY t3 t 12 t为X 或Y 中相同秩次的个数 例11 6 某地作肝癌病因研究 调查了10个不同地区肝癌死亡率 1 10万 与某种食物中黄曲霉素相对含量 见表15 16第 2 4 栏 试作等级相关分析 1 建立检验假设 确定检验水准 H0 不同地区肝癌死亡率与黄曲霉素相对含量不相关 H1 不同地区肝癌死亡率与黄曲霉素相对含量相关 0 05 2 计算统计量rs 1 编等级 2 求等级差d及d2 3 计算rs rs 1 3 确定概率 判断结果 查表得rs0 05 10 0 648 rs0 01 10 0 794 P 0 05 拒绝H0 可认为黄曲霉素与肝癌死亡率间存在正相关 SUMMARY W

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论