




已阅读5页,还剩150页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学 7 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 非参数检验又称为任意分布检验 这类方法并不依赖总体分布的具体形式 应用时可以不考虑研究变量为何种分布以及分布是否已知 进行的不是参数之间的检验 故称非参数检验 基本特点 与分布无关基本方法 2检验基于秩 等级 rank 的方法基于特定参照点 如中位数 的方法 非参数检验的优点 适用范围广 受限条件少 参数检验对总体分布等有特别限定 而非参数检验的假定条件少 也不受总体分布的限制 更适合一般的情况 具有稳健性 参数检验是建立在严格的假设条件基础之上的 一旦不符合假设条件 其推断的正确性将受到怀疑 而非参数检验都是带有最弱的假定 所受的限制很少 稳健性好 对符合用参数检验的资料 如用非参数检验 会丢失部分信息 虽然非参数检验计算简便 但有些问题的计算仍显繁冗 非参数检验的缺点 已知总体分布类型 对未知参数进行统计推断 依赖于特定分布类型 比较的是参数 参数检验 parametrictest 非参数检验 nonparametrictest 对总体的分布类型不作严格要求 不受分布类型的影响 比较的是总体分布位置 优点 方法简便 易学易用 易于推广使用 应用范围广 可用于参数检验难以处理的资料 如等级资料 或含数值 50mg 等 缺点 方法比较粗糙 对于符合参数检验条件者 采用非参数检验会损失部分信息 其检验效能较低 样本含量较大时 两者结论常相同 应用非参数检验的情况 1 不满足正态和方差齐性条件的小样本资料 2 总体分布类型不明的小样本资料 3 一端或两端是不确定数值 如 0 002 65等 的资料 必选 4 单向 双向 有序列联表资料 5 各种资料的初步分析 方法的起点 排队与秩次 统计描述中排秩思想的成功应用百分位数 中位数排队的优点广泛适用于多种分布排队的结果将原始数据的比较转化为秩次的比较 秩次 rank 将数值变量值从小到大 或等级变量值从弱到强所排列的序号 例111只大鼠存活天数 存活天数4 10 7 50 3 15 2 9 13 60 60例29名肺炎病人的治疗结果 疗效治愈治愈死亡无效治愈有效治愈有效无效 秩次364928157101110 510 5 平均秩次2 52 597 52 55 52 55 57 5 秩次129735468 SPSS中的菜单位置 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 1 建立检验假设 确定检验水准 H0 两总体分布相同H1 两总体分布不同 0 05 2 编秩按数值由小到大排列 若有相同数据 取平均秩 分析步骤 基本思想 两样本来自同一总体 任一组秩和不应太大或太小 假定 两组样本的总体分布形状相同 T与平均秩和应相差不大 3 计算秩和 确定检验统计量秩和T值 当n1 10或 n2 n1 10时 则可采用正态近似法求u Z 值来确定P值 其公式如下 4 确定P值和作出推断结论当n1 10或 n2 n1 10时 查表P值 若相同秩次较多 应作校正计算 例1 某实验室观察缺氧条件下大鼠与小鼠的生存 以生存日数作为观察指标 试检验两组生存日数有无差别 T 170 146 P 0 05 T在界值范围内P T在界值范围外P T与界值相等P SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 非参数检验 1 第三步 非参数检验 2 第四步 结果解读 1 结果解读 例数 均数 标准差 中位数 四分位间距等 标准差较大 第四步 结果解读 2 结果解读 Z 3 630 P 0 000 例2 20名正常人和32名铅作业工人尿铅定性检查结果如表 问铅作业工人尿铅是否高于正常人 U检验 Zc U 与1 96 2 58比较 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 加权个案 第四步 非参数检验 第五步 结果解读 结果解读 Z 4 503 P 0 000 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 完全随机设计多个样本比较的秩和检验由Kraskal和Wallis在Wilcoxon秩和检验基础上扩展而来 又称K W检验或H检验 1 建立检验假设 确定检验水准 H0 k个总体分布相同 H1 k个总体分布不同或不全相同 0 05 2 混合编秩将各组数据混合 由小到大编秩 遇有原始数据相同时 若相同数据在同一组内 则仍按顺序编秩 若相同数据在不同组 则取它们的平均秩次 分析步骤 3 求秩和并计算检验统计量H将各组秩次分别相加 求出各组的秩和Ri 检验统计量值H可按下式计算 式中 Ri为各组的秩和 ni为各组样本含量 N为总样本含量 分析步骤 当各组相同秩次较多时 可对H值进行校正 按下式求值 分析步骤 tj相同秩次的数量 4 确定P值和作出推断结论当组数K 3 每组样本含量ni 5时 可查附表 H界值表 得到P值 若k 3或ni 5时 H值的分布近似于自由度为k 1的 2分布 此时可查 2界值表得到P值 最后按P值作出推断结论 分析步骤 例3 比较小白鼠接种三种不同菌型伤寒杆菌9D 11C和DSC1后存活日数 结果见表 问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别 P 1 CDF CHISQ 9 97 2 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 非参数检验 第四步 结果解读 结果解读 x2 9 940 P 0 007 例4 四种疾病患者痰液内嗜酸性白细胞的检查结果见表 问四种疾病患者痰液内的嗜酸性白细胞有无差别 P 1 CDF CHISQ 15 52 3 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 加权个案 第四步 非参数检验 第五步 结果解读 结果解读 x2 15 506 P 0 001 例5 某临床药理基地观察5组接受不同治疗的妇科病人 结果见表 问5组疗效有无差别 P 1 CDF CHISQ 195 50 4 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 加权个案 第四步 非参数检验 第五步 结果解读 结果解读 x2 195 504 P 0 000 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 配对设计差值比较的符号秩和检验由Wilcoxon1945年提出 又称Wilcoxon符号秩和检验 常用于检验差值的总体中位数是否等于零 1 建立检验假设 确定检验水准Ho 差值总体中位数Md 0H1 差值总体中位数Md 0 0 05 分析步骤 2 编秩 求差值编秩方法 依差值的绝对值从小到大编秩 编秩时注意两点 遇差值为0者 舍去不计 n相应减少差值的绝对值相等 符号不同者应取平均秩次编秩后 按差值的正负给秩次冠上符号 3 求差值为正或负的秩和差值为正的秩和以T 表示差值为负的秩和以T 表示 T T n n 1 2T min T T 4 确定P值和作出推断结论 当n 50时 查T界值表T在界值范围内P T在界值范围外P T与界值相等P 分析步骤 当n 50 可采用正态近似法 计算u值 正态近似法 若相同秩次较多 应作校正计算 Z或式中 tj为第j j 1 2 个相同差值的个数 正态近似法 例6 对10名患者分别用甲法与乙法 测得血汞值 问两种方法的结果有无差别 n 10 1 9 T min 26 5 18 5 18 5n 9p 0 05 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 非参数检验 1 第三步 非参数检验 2 第四步 结果解读 1 结果解读 例数 均数 标准差 中位数 四分位间距等 标准差较大 第四步 结果解读 2 结果解读 Z 0 474 P 0 635 例7 对12份血清分别用原方法 检测时间20分钟 和新方法 检测时间10分钟 测谷 丙转氨酶 结果见表 问两法所得结果有无差别 T MIN 54 5 11 5 11 5n 11P 0 05 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 非参数检验 1 第三步 非参数检验 2 第四步 结果解读 1 结果解读 例数 均数 标准差 中位数 四分位间距等 标准差较大 第四步 结果解读 2 结果解读 Z 1 913 P 0 056 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 随机区组设计资料比较 如果观察结果不满足方差分析条件 可用Friedman检验 Friedmantest 1 建立检验假设和确定检验水准2 编秩 先在每一配伍组内将数据从小到大编秩 如有相同数据 取平均秩次 再求各处理组秩和Ri i 1 2 g 分析步骤 3 计算检验统计量M值 1 查表法 n 15 g 15 M Rj R 2 R Rj g M界值表基于 2分布近似法得到 2值查有关的 2界值表 2 2分布近似法 分析步骤 自由度为 g 1 当各区组间出现相同秩次时 需进行校正 校正公式为 b为区组个数 k为处理组个数 4 确定P值和作出推断结论 例8 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激 他们的反应率 资料见表 问4种频率声音刺激的反应率是否有差别 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 非参数检验 1 第三步 非参数检验 2 第四步 结果解读 1 结果解读 例数 均数 标准差 中位数 四分位间距等 第四步 结果解读 2 结果解读 x2 15 152 P 0 002 一个讨论案例 例9 某中医医院采用中西医结合方法治疗228例不同病情的脑卒中患者 疗效情况如下表 SPSS软件操作 第一步 建立变量 第二步 输入原始数据 第三步 加权个案 1 不同病情的脑卒中患者 疗效有无差别 第三步 秩和检验 第四步 结果解读 结果解读 x2 24 319 P 0 000 2 脑卒中患者病情与疗效有无相关 第三步 等级相关分析 第四步 结果解读 结果解读 rs 0 311 P 0 000 3 脑卒中患者病情与疗效变化趋势如何 第三步 线性趋势检验 1 第三步 线性趋势检验 2 输出4种卡方检验结果 1 pearson卡方2 卡方值的校正值3 似然比卡方 一般用于对数线性模型 4 fisher的精确检验 线性趋势检验 第四步 结果解读 结果解读 x2 21 797 P 0 000 线性趋势检验 计量资料 线性回归等级有序资料 线性趋势检验基本原则 将x2值进行分解 将总变异分为线性回归分量和偏离线性回归分量 总变异 线性回归分量 两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验 诊断试验ROC曲线分析 基于秩次的非参数检验 诊断试验的概念 评价某种疾病诊断方法的临床试验 诊断试验的用途诊断疾病筛选无症状的病人判断疾病的严重程度估计疾病临床过程及预后估计对治疗的反应判断治疗效果 金标准 目标人群 病人 非病人 待评价诊断方法 评价指标 诊断试验原理 确定金标准 当前医学界公认的诊断某疾病最可靠 准确度最高的诊断方法 常用的金标准包括病理学诊断 活检 尸检 外科手术或诊断性操作特殊的影像学诊断权威机构颁布的综合诊断标准 选择研究对象 要求 代表性好 盲法试验组经金标准确诊为某疾病的患者 具有反应该疾病的全部特征 如病情 病程 症状体征 并发症 治疗或未治疗等 对照组经金标准证实未患该疾病的患者 可患其它疾病 或正常人 诊断试验结果表 诊断试验的评价指标 基本指标灵敏度 特异度 误诊率 漏诊率预测值阳性预测值 阴性预测值综合评价指标正确率 约登指数 优势比 似然比阳性似然比 阴性似然比 灵敏度 Sensitivity Se 计算公式 Se a a c 又称真阳性率将实际有病的人正确判断为患者的能力漏诊率 omissiondiagnostic 计算公式 c a c 又称假阴性率将实际有病的人错误判断为非患者的比例 高灵敏度试验的适用范围漏诊可能造成严重后果排除某病的其他诊断筛检无症状病人而且该病发病率较低 特异度 Specificity Sp 计算公式 Sp d b d 又称真阴性率将实际无病的人正确判断为非患者的能力误诊率 mistakediagnosticrate 计算公式 b b d 又称假阳性率将实际无病的人错误判断为患者的比例 高特异度试验的适用范围假阳性会使病人受到严重危害确诊某病 灵敏度和特异度的关系 都是反映诊断试验准确性的最基本指标提高一方面水平 会降低另一方面水平一般选择敏感度和特异度都较高的试验作为诊断依据根据研究目的 调整灵敏度和特异度来确定临界值以产生漏诊和误诊之和最小时的数据确定临界值 ROC曲线评价方法 受试者工作特征曲线 ReceiverOperatorCharacteristiccurve 简称ROC曲线 表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测性能 表示不同诊断水平的真阳性率对假阳性率的函数关系 受试者工作特征曲线receiveroperatingcharacteristiccurve ROC 10 80 60 40 200 20 40 60 81 完全无价值的诊断试验其ROC曲线与机会线重合 而ROC曲线越偏离机会线 ROC曲线下面积就越大 则诊断试验的真实性也就越好 ROC曲线评价方法 以灵敏度和假阳性率为两个轴的取值作的图性 通常用于测定值为连续或等级数据 常用于确定最佳临界值 也可用于比较两种和两种以上诊断试验的诊断价值 以试验灵敏度为y轴 以假阳性率为x轴 由不同决策界值产生图中各个点 采用线段连接图中所有的点 绘制而成的线图 图中反映了随着灵敏度的增加 假阳性率也随之增加 ROC曲线的特点 综合了灵敏度和特异度两个指标 不受患病率的影响 考虑了所有可能的诊断临界值的影响 全面客观地评价诊断试验的准确性 描述了诊断试验区分事件发生与不发生的固有能力 ROC曲线下的面积 AreaUnderCurve 简称AUC以点 0 0 1 0 0 1 和 1 1 围成的面积做为1或100 ROC曲线和X轴围成的面积占总面积的百分比作为曲线面积的估计值 ROC曲线下面积的取值在0 1之间 曲线越接近左上角 面积越接近1 说明试验的准确度越高 越接近对角线 越接近0 5 则说明试验的准确度越差 一般认为 面积在0 5 0 7之间时诊断价值较低 在0 7 0 9之间时诊断价值中等 在0 9以上时诊断价值较高 ROC曲线下的面积 最佳诊断界值的确定 ROC曲线上最靠近左上角的点所对应的灵敏度和特异度都是较大的 该点为ROC曲线的正切线与曲线相交的点 常以此点所对应的诊断界值作为最佳诊断界值 灵敏度 特异度最大的点就是最佳诊断界值 通过解拟合ROC曲线的方程寻找该点 理想的正常人群与糖尿病病人血糖水平分布 现实的正常人群与糖尿病病人血糖水平分布 采用不同血糖阳性界值所致假阳性和假阴性 病人与非病人某项诊断指标数值分布示意图 ROC分析 ROC分析主要做三件事 计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届广西桂林市高三第一次跨市联合模拟检测(一模)语文试题(解析版)
- 2025年秋三年级上册语文同步教案 11 宝葫芦的秘密(节选)
- 房屋加层申请书范文
- 佛山超市保安管理制度
- 供应医疗冷库管理制度
- 供水单位台账管理制度
- 供水设备清洗管理制度
- 供热公司夜查管理制度
- 供电设备维修管理制度
- 保安停车开放管理制度
- 学习解读《水利水电建设工程验收规程》SLT223-2025课件
- 神经生物物理学课件
- 盒子支付-地推销售技巧培训教育课件
- 现代机械强度理论及应用课件汇总全套ppt完整版课件最全教学教程整套课件全书电子教案
- 五年级下册数学 第一单元知识点梳理与练习(1)课件(16张)苏教版
- 病例对照研究设计和实施步骤
- FMEA第五版(实例2)
- 智障儿童的家庭教育(课堂PPT)
- 《电路分析基础》试题及答案
- 生物多样性影响评价规范
- 日本文学概论1
评论
0/150
提交评论