06 t检验2013_第1页
06 t检验2013_第2页
06 t检验2013_第3页
06 t检验2013_第4页
06 t检验2013_第5页
已阅读5页,还剩157页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 假设检验基础 海南医学院卫生统计学教研室 2 2020 4 6 假设检验 HypothesisTesting 海南医学院卫生统计学教研室 3 2020 4 6 统计推断 statisticalinference 参数估计 parameterestimation Whereistheparameter 假设检验 hypothesistest Arethesesamplescomefromonepopulation 定义 由样本信息对相应总体的特征进行推断 海南医学院卫生统计学教研室 4 2020 4 6 一 假设检验的概念与原理二 t检验三 二项分布与poisson分布资料的z检验四 假设检验与区间估计的关系五 假设检验的功效六 正态性检验 主要内容 海南医学院卫生统计学教研室 5 2020 4 6 为什么要进行假设检验 例题 欲考察某药物A预防孕妇早产的效果 某医院的妇科进行一项临床试验 随机抽取两个样本各15例孕妇 处理组 药物A 婴儿出生体重 均数为7 1kg对照组 安慰剂 婴儿出生体重 均数为6 3kg7 1kg 6 3kg 海南医学院卫生统计学教研室 6 2020 4 6 处理组婴儿出生体重 对照组婴儿出生体重 总体A 总体B 样本b 样本均数6 3kg 样本a 样本均数7 1kg 海南医学院卫生统计学教研室 7 2020 4 6 统计量不同的两种可能 其一 本质上的差异 系统误差 如药物的作用 必然的 大于随机误差 其二 抽样误差 偶然的 随机的 较小的 两种情况只有一个是正确的 且二者必居其一 需要我们作出推断 海南医学院卫生统计学教研室 8 2020 4 6 假设检验处理问题的特点 1 需要从全局的范围 即从总体上对问题作出判断 2 不可能或者不允许对研究总体的每一个个体均做观察 如抽检合格率 新药疗效评价 抽样统计推断 海南医学院卫生统计学教研室 9 2020 4 6 一 假设检验的思维逻辑 海南医学院卫生统计学教研室 10 2020 4 6 下面我们用一例说明这个原则 两个盒子 各装有100个球 小概率事件在一次试验中不会发生 海南医学院卫生统计学教研室 11 2020 4 6 将盒子密封 现从两盒中随机取出一个盒子 问这个盒子里是白球99个还是红球99个 海南医学院卫生统计学教研室 12 2020 4 6 我们不妨先假设 这个盒子里有99个白球 现在我们从中随机摸出一个球 发现是 此时你如何判断这个假设是否成立呢 海南医学院卫生统计学教研室 13 2020 4 6 假设其中真有99个白球 摸出红球的概率只有1 100 这是小概率事件 小概率事件在一次试验中竟然发生了 不能不使人怀疑所作的假设 小概率反证法 海南医学院卫生统计学教研室 14 2020 4 6 假设检验的概念 HypothesisTesting对所估计的总体首先提出一个假设 然后通过样本数据去推断是否拒绝这一假设 称为假设检验 海南医学院卫生统计学教研室 15 2020 4 6 二 假设检验的基本步骤 例6 1在某市城区6所小学按概率抽样方法抽取了400名小学生进行视力干预研究 基线调查时 干预组200人 屈光度的均数为 0 34D 标准差为0 21D 对照组200人 屈光度的均数为 0 57D 标准差为0 36D 试问 干预组和对照组小学生屈光度在基线时总体均数有无差别 海南医学院卫生统计学教研室 16 2020 4 6 问题 干预组对照组 海南医学院卫生统计学教研室 17 2020 4 6 二 假设检验的基本步骤 1 建立检验假设 确定检验水准 2 选定检验方法 计算检验统计量 3 确定P值 作出推断 海南医学院卫生统计学教研室 18 2020 4 6 一对关于总体特征的假设 零假设 nullhypothesis 记为H0 又称原假设 表示目前的差异是由于抽样误差引起的 对立假设 alternativehypothesis 记为H1 又称备择假设 表示目前的差异是主要由于本质上的差别引起 两个假设既有联系又互相独立 应该包括两种 也是所有 可能的判断 要做出抉择 1 建立检验假设 确定检验水准 海南医学院卫生统计学教研室 19 2020 4 6 例6 1分析步骤 1 建立检验假设 确定检验水准H0 1 2 干预组小学生和对照组小学生屈光度的总体均数相等 H1 1 2 干预组小学生和对照组小学生屈光度的总体均数不等 0 05 海南医学院卫生统计学教研室 20 2020 4 6 称检验水准 sizeofatest 是预先规定的概率值 它确定了小概率事件标准 通常取值为0 05或0 01 确定采用双侧检验还是单侧检验 海南医学院卫生统计学教研室 21 2020 4 6 统计量 是随机样本的函数 其计算公式中不应包含任何未知参数 选择Z检验 2 计算统计量 statistic 海南医学院卫生统计学教研室 22 2020 4 6 3 确定P值 作出统计推断 P值的定义 在零假设成立的条件下 出现统计量目前值及更不利于零假设数值的概率 累积概率 P 为小概率事件 不大可能 犯假阳性错误 拒绝H0 接受H1 P 不是小概率事件 颇有可能 犯假阳性错误 没有足够的理由拒绝H0 海南医学院卫生统计学教研室 23 2020 4 6 查附表1 或t界值表 时 得P 0 001 按 0 05水准 拒绝H0 接受H1 差异有统计学意义 可认为干预组小学生和对照组小学生屈光度的总体均数不等 例6 1 3 确定P值 作出统计推断 海南医学院卫生统计学教研室 24 2020 4 6 第I类错误 typeIerror 和第II类错误 typeIIerror 海南医学院卫生统计学教研室 25 2020 4 6 法官的审判 无罪假设 海南医学院卫生统计学教研室 26 2020 4 6 1 I II型错误示意 以单侧t检验为例 t 海南医学院卫生统计学教研室 27 2020 4 6 定义 第I类错误 如果实际情况与H0一致 仅仅由于抽样的原因 使得统计量的观察值落到拒绝域 拒绝原本正确的H0 这样的错误称为 第II类错误 如果实际情况与H0不一致 仅仅由于抽样的原因 使得统计量的观察值落到接受域 不能拒绝原本错误的H0 这样的错误称为 海南医学院卫生统计学教研室 28 2020 4 6 第二节t检验 t分布的发现使得小样本统计推断成为可能 被认为是统计学发展历史中的里程碑之一 以t分布为基础的检验称为t检验 医学统计学中应用较多 海南医学院卫生统计学教研室 29 2020 4 6 t检验的应用条件 随机样本 正态性 Normality 来自正态分布总体 方差齐性 Homoscedasticity 两个均数比较时 要求两总体方差相等 以上条件的考察方法后续介绍 海南医学院卫生统计学教研室 30 2020 4 6 一 单样本资料的t检验 onesamplet test 检验的目的 推断该样本来自的总体均数 是否与已知的某一总体均数 0相等 已知总体均数 0一般指已知的理论值 标准值或大量观察得到的稳定值 认为这是一个确定的总体特征 海南医学院卫生统计学教研室 31 2020 4 6 例已知北方地区一般儿童前囟门闭合月龄为14 1个月 某研究人员从东北某县 缺钙地区 抽取36名儿童 得囟门闭合月龄均值为14 3个月 标准差为5 08个月 问该县儿童前囟门闭合月龄的均数是否大于一般儿童 海南医学院卫生统计学教研室 32 2020 4 6 1 建立检验假设 确定检验水准H0 0该县儿童前囟门闭合月龄与一般儿童相等 意为就总体而言 该县儿童前囟门闭合月龄与一般儿童的均数相等 H1 0该县儿童前囟门闭合月龄高于一般儿童 单侧 0 05 检验步骤 海南医学院卫生统计学教研室 33 2020 4 6 2 选定检验方法 计算检验统计量样本均数与总体均数 0间的差别可以用统计量t来表示 统计量t表示 在标准误的尺度下 样本均数与总体均数 0的偏离 海南医学院卫生统计学教研室 34 2020 4 6 t分布 P t 2 t t 2 1 理论基础 t分布 海南医学院卫生统计学教研室 35 2020 4 6 2 计算统计量 海南医学院卫生统计学教研室 36 2020 4 6 海南医学院卫生统计学教研室 37 2020 4 6 3 确定P值 做出推断 如果H0成立 是否有可能得到现有结果 查附表2 t界值表 t0 05 35 1 690 t0 25 35 0 682 由于本例t 0 236 t0 05 且P 0 25 注意 查单侧t界值 海南医学院卫生统计学教研室 38 2020 4 6 统计学结论 本例P 0 05 按 0 05的水准 不拒绝H0 差别没有统计学意义 专业的结论 尚不能认为该县儿童前囟门闭合月龄高于一般儿童 作结论 海南医学院卫生统计学教研室 39 2020 4 6 二 配对设计资料的t检验 paireddesign 定义 P288页 是采用配对随机化 将研究对象分配到不同的处理组的实验设计方法 优点 控制非实验因素对结果的影响特点 资料成对 每对数据不可拆分 海南医学院卫生统计学教研室 40 2020 4 6 配对形式 异体配对 分为同源配对设计 条件相近者配对设计 为消除混杂因素的影响 将某些重要特征相似的每两个受试对象配成一对 配对的两个受试对象分别接受两种不同的处理 自身配对 同一受试对象的两部位分别接受两种处理 如 处理前后 服药前后 注意 受试对象不随时间变化 给予两种检验方法或诊断方法 海南医学院卫生统计学教研室 41 2020 4 6 例6 2为了研究孪生兄弟的体重是否与其出生顺序有关 共收集了15对孪生兄弟的出生顺序和出生体重 见表 问 孪生兄弟中先出生者的体重与后出生者的体重是否相同 海南医学院卫生统计学教研室 42 2020 4 6 海南医学院卫生统计学教研室 43 2020 4 6 比较方法 1 首先求出各对差值 d 的均数 在理论上 若两种处理无差别 差值d的总体均数 d应为0 2 将配对设计的两样本均数比较 转化成为平均差值与总体均数 d 0的比较 配对t检验的实质 检验样本差值的总体均数是否为0 海南医学院卫生统计学教研室 44 2020 4 6 假定差值服从正态分布 进行检验 海南医学院卫生统计学教研室 45 2020 4 6 分析策略 差值均数与0比较 1 建立检验假设 确定检验水准H0 d 0 先出生者与后出生者体重的差值 kg 的总体均数为0 H1 d 0 先出生者与后出生者体重的差值 kg 的总体均数不为0 0 05 海南医学院卫生统计学教研室 46 2020 4 6 2 计算检验统计量t 海南医学院卫生统计学教研室 47 2020 4 6 3 确定P值 作出推断 查表得 t0 05 2 14 2 145 t0 02 2 14 2 624 本例t0 02 2 14 t 2 33 t0 05 2 11 故0 02 P 0 05 作结论 在a 0 05的水准上 拒绝H0 接受H1 差别有统计学意义 可以认为孪生兄弟的出生体重与出生顺序有关 且先出生者的出生体重大于后出生者的出生体重 海南医学院卫生统计学教研室 48 2020 4 6 例6 3用两种方法测定12份血清样品中镁离子的含量 问两种方法测定结果有无差异 海南医学院卫生统计学教研室 49 2020 4 6 假定血清镁离子测定结果的差值服从正态分布 1 建立检验假设 确定检验水准H0 d 0 即两种方法测定结果之差的总体均数为0 H1 d 0 即两种方法测定结果之差的总体均数不为0 0 05 2 计算检验统计量t 海南医学院卫生统计学教研室 50 2020 4 6 3 确定P值 作出推断 查表得 t0 05 2 11 2 201 t0 40 2 11 0 876 t0 50 2 11 0 697本例t0 50 2 11 t 0 764 t0 40 2 11 故0 40 P 0 50作结论 按 0 05的检验水准 不拒绝H0 差别无统计学意义 尚不能认为两法测定结果不同 海南医学院卫生统计学教研室 51 2020 4 6 三 两独立样本资料的t检验 完全随机设计 成组设计 1 将受试对象完全随机分入两组 接受两种不同的处理 视为代表两不同总体的独立样本 试验组与对照组 新药组与传统药组2 从两个总体中完全随机地抽取一定数量观察对象 对测量指标进行比较 男性与女性 中国人和美国人 不同职业类型等 海南医学院卫生统计学教研室 52 2020 4 6 目的 推断两样本各自代表的总体均数 1与 2是否相等 特点 样本含量 较小 两种情况 一 两样本所属总体方差相等 二 两样本所属总体方差不等 海南医学院卫生统计学教研室 53 2020 4 6 t检验的应用条件独立性 Independence 随机样本 正态性 Normality 两总体均服从正态分布 方差齐性 Homogeneityofvariance 两个总体均数比较时 要求两总体方差相等 海南医学院卫生统计学教研室 54 2020 4 6 例6 4 某医师要观察两种药物对原发性高血压的疗效 将诊断为 期高血压的20名患者随机分为两组 两组基线时血压之间的差别无统计学意义 卡托普利组 1217138410912107尼莫地平组 1181213910807163个月后观察舒张压下降的幅度 mmHg 试比较两药的降压效果有无差异 海南医学院卫生统计学教研室 55 2020 4 6 t检验条件 经检验 两组患者舒张压的下降值均服从正态分布 具有方差齐性 海南医学院卫生统计学教研室 56 2020 4 6 分析步骤 1 建立检验假设 确定检验水准H0 1 2 两组患者舒张压下降值的总体均数相等 H1 1 2 两组患者舒张压下降值的总体均数不等 0 05 2 计算检验统计量t t 自由度 n1 n2 2 海南医学院卫生统计学教研室 57 2020 4 6 均数之差的标准误 联合方差 方差的加权平均 均数之差的标准误 海南医学院卫生统计学教研室 58 2020 4 6 海南医学院卫生统计学教研室 59 2020 4 6 2 计算统计量 海南医学院卫生统计学教研室 60 2020 4 6 3 确定P值 作出推断 查表得 v 10 10 2 18 t0 05 2 18 2 101 t0 05 按 0 05水准 不拒绝H0 差别有没统计学意义 尚不能认为两种药物的降压效果有差别 海南医学院卫生统计学教研室 61 2020 4 6 海南医学院卫生统计学教研室 62 2020 4 6 海南医学院卫生统计学教研室 63 2020 4 6 海南医学院卫生统计学教研室 64 2020 4 6 海南医学院卫生统计学教研室 65 2020 4 6 海南医学院卫生统计学教研室 66 2020 4 6 海南医学院卫生统计学教研室 67 2020 4 6 Spss运行结果 海南医学院卫生统计学教研室 68 2020 4 6 Spss运行结果 海南医学院卫生统计学教研室 69 2020 4 6 用近似t检验 检验常用方法 Cochran Cox法 1950 对临界值进行校正Satterthwaite法 1946 Welch法 1947 对自由度进行校正 2 两样本所属总体方差不等 海南医学院卫生统计学教研室 70 2020 4 6 检验假设为H0 1 2 H1 1 2统计量的计算 自由度 Satterthwaite近似t检验 海南医学院卫生统计学教研室 71 2020 4 6 例7 5为了比较特殊饮食与药物治疗改善血清胆固醇 mmol L 的效果 将24名志愿者随机分成两组 每组12人 甲组为特殊饮食 乙组为药物治疗组 受试者试验前后各测量一次血清胆固醇 mmol L 差值结果见表 请比较两种措施的效果是否相同 表7 4两种降血清胆固醇措施差值的结果 海南医学院卫生统计学教研室 72 2020 4 6 分析过程 1 经正态性检验 两组差值总体上均服从正态分布2 经方差齐性检验 方差不齐 3 为随机样本选用近似t检验方法 海南医学院卫生统计学教研室 73 2020 4 6 分析步骤 1 建立检验假设 确定检验水准H0 1 2 两种降血清胆固醇措施的效果相同 H1 1 2 0 05 2 计算检验统计量校正自由度 海南医学院卫生统计学教研室 74 2020 4 6 3 确定P值 作出推断 查表得 t0 05 2 12 2 179 本例t 2 733 t0 05 2 12 P 0 05 按 0 05水准 拒绝H0 接受H1 差别有统计学意义 可以认为两种降血清胆固醇措施改变值的总体均数有差异 即两种措施的效果有差异 海南医学院卫生统计学教研室 75 2020 4 6 图6 1 P111 海南医学院卫生统计学教研室 76 2020 4 6 说明 对于大样本 两个均数的比较可以用Z检验 也可以用t检验 二者结果接近 对于小样本 两个均数的比较应该用t检验 而不能用Z检验 因其将P值估计过小 更易得到拒绝H0的结论 容易犯一类错误 海南医学院卫生统计学教研室 77 2020 4 6 四 两独立样本资料的方差齐性检验 homogeneityofvariance 设 两个随机样本分别独立地来自两个正态总体 1 建立检验假设 确定检验水准H0 12 22 即两总体的方差相等H1 12 22 即两总体的方差不等 0 05 海南医学院卫生统计学教研室 78 2020 4 6 样本方差比的分布 Levene法 从同一总体随机抽取的两样本的方差 H0成立时 方差比 大方差 小方差 的分布服从F分布判断标准 若F F 1 2 则有P 差别有统计学意义 若F 差别无统计学意义 海南医学院卫生统计学教研室 79 2020 4 6 F 附表3 2 465页 F值越大 P值越小 海南医学院卫生统计学教研室 80 2020 4 6 例6 6某口腔医院选择所在市40 50岁慢性牙周炎患者36例 测得吸烟组 18人 菌斑指数 PLI 均值为84 71 标准差为8 14 非吸烟组 18人 菌斑指数的均值为82 20 标准差为6 18 试检验两总体方差是否相等 海南医学院卫生统计学教研室 81 2020 4 6 方差齐性检验 吸烟组非吸烟组 海南医学院卫生统计学教研室 82 2020 4 6 两组方差的比较 1 建立检验假设 确定检验水准H0 12 22H1 12 22 0 05 2 计算统计量 3 确定p值 作出推断查表得 F0 05 2 17 17 2 67 P 0 05 0 05水准 不拒绝H0 尚不能认为两组的总体方差不相等 海南医学院卫生统计学教研室 83 2020 4 6 海南医学院卫生统计学教研室 84 2020 4 6 例6 5的方差齐性检验 1 建立检验假设 确定检验水准H0 12 22H1 12 22 0 05 2 计算统计量 3 确定p值 作出推断查表得 F0 05 2 11 11 3 47 P 0 05 0 05水准 拒绝H0 接受H1 可以认为两组的总体方差不相等 海南医学院卫生统计学教研室 85 2020 4 6 说明 对于大样本 两个均数的比较 可以用Z检验 也可以用t检验 结果很接近 对于小样本 两个均数的比较应该用t检验而不应该用Z检验 因相同尾部面积时 Z检验界值小与t界值 更容易拒绝H0 即P值较小 会把原本可能无统计学意义的资料解释为有统计学意义 海南医学院卫生统计学教研室 86 2020 4 6 第三节二项分布与Poisson分布资料的Z检验 海南医学院卫生统计学教研室 87 2020 4 6 1 单样本资料的Z检验 样本率与总体率的比较 如果二项分布的 或1 不太小 当n足够大时 一般n 和n 1 均大于5时 在n次随机试验中某事件发生次数X及发生频率P的分布近似正态分布 因此 样本率和总体率之间 两个样本率之间差异的判断可用Z检验 一 二项分布频率资料的Z检验 海南医学院卫生统计学教研室 88 2020 4 6 对于假设H0 0 H1 0H0成立时 检验统计量如果根据样本算得的Z值偏大 有理由拒绝H0 海南医学院卫生统计学教研室 89 2020 4 6 样本不太大时 需要做连续性校正 海南医学院卫生统计学教研室 90 2020 4 6 例6 7 新生儿染色体异常率为0 01 2010年某医院出生的400名新生儿 发现1名染色体异常 请问当地新生儿染色体异常率是否低于一般水平 本例题n 4 5 例题不好 检验步骤 1 建立检验假设 确定检验水准H0 0 01H1 0 01 0 05 海南医学院卫生统计学教研室 91 2020 4 6 2 计算检验统计量 3 确定P值 作出统计推断 Z0 05 1 64 P 0 05 按照 0 05水准 不拒绝H0 差别无统计学意义 还不能认为当地新生儿染色体异常率低于一般水平 海南医学院卫生统计学教研室 92 2020 4 6 2 两组独立样本频率的Z检验 海南医学院卫生统计学教研室 93 2020 4 6 例6 8 例6 8为了解某校本科生体质合格率的性别差异 随机抽查了本科男生110人和女生130人 其中男生有100人合格 女生有70人合格 问 该校本科男女生体制合格率是否不同 检验步骤 1 建立检验假设 确定检验水准H0 0 01H1 0 01 0 05 海南医学院卫生统计学教研室 94 2020 4 6 2 计算检验统计量 海南医学院卫生统计学教研室 95 2020 4 6 3 确定P值 作出统计推断 Z0 05 2 1 96 P 0 001 按照 0 05水准 拒绝H0 接受H1 差别有统计学意义 可以认为该校本科男生的体制合格率与女生不同 男生高于女生 海南医学院卫生统计学教研室 96 2020 4 6 Poisson分布 是一种离散型分布 用以描述单位时间 空间 面积等的罕见时间发生次数的概率分布 可能发生这类事件的观察例数n往往很大 但这类事件的实际发生例数却很小 0 001 Poisson分布记为X P X为观察单位内某稀有事件发生的次数 为Poisson分布的唯一参数 二 Poisson分布资料的Z检验 海南医学院卫生统计学教研室 97 2020 4 6 二 Poisson分布资料的Z检验 当总体均数 20时 Poisson分布近似正态分布 实际应用时 总体均数一般未知 可通过观察样本计数是否大于20来判断 海南医学院卫生统计学教研室 98 2020 4 6 当总体均数 20时 Poisson分布近似正态分布 则其概率计算可以用正态分布概率来近似 一 单样本资料的Z检验1 建立检验假设 确定检验水准 H0 0 H1 0 0为一定值 如总体均数 0 052 选定检验方法 计算检验统计量3 确定P值 作出推断结论 海南医学院卫生统计学教研室 99 2020 4 6 例6 9某市计划2005年接种吸附百白破联合疫苗后无菌化脓发生率控制在25 10万人次以内 该市随机抽查2005年接种吸附百白破联合疫苗125538人次 其中发生无菌化脓例数为38例 试问2005年该市无菌化脓发生率能否达到要求 海南医学院卫生统计学教研室 100 2020 4 6 分析 1 接种疫苗后无菌化脓发生人数很少 可看成服从poisson分布2 按10万人次 2005年计划发生无菌化脓人数控制在25 20 实际发生无菌化脓次数38 125538 30 27 10万人次 30 27 20 故采用poisson分布单样本资料的z检验 海南医学院卫生统计学教研室 101 2020 4 6 检验步骤 1 建立检验假设 确定检验水准 H0 25 H1 25 0 05 单侧检验2 选定检验方法 计算检验统计量3 确定p值 作出推断结论查表得z 1 054 相对应的单侧p 0 1446 0 05 按 0 05水准 尚不能拒绝H0 可以认为2005年该市无菌化脓发生率能达到要求 在控制范围内 海南医学院卫生统计学教研室 102 2020 4 6 2 两独立样本资料的Z检验 条件 当两总体均数都大于20时 依据poisson分布此时近似正态分布的原理 可以应用z检验对其总体均数进行推断 H0 1 2 H1 1 2当两样本观测单位数相等时 X1与X2为两样本计数当两样本观测单位数不等时 为两样本多次观察平均数 n为观测单位数 海南医学院卫生统计学教研室 103 2020 4 6 例6 10 某市在对不同性别成年人 18岁以上 意外伤害死亡情况有无差异的研究中 随机抽取了该市2002年男女疾病监测数据各10万人 因意外伤害死亡的人数男女分别为51人和23人 试问 2002年不同性别每10万人口意外伤害死亡平均人数是否相等 海南医学院卫生统计学教研室 104 2020 4 6 分析 1 10万成年人中意外伤害死亡人数很少 因而可以看成是服从poisson分布2 随机抽取的监测数据中 意外伤害死亡的男女人数分别为51 23 都大于20 故可采用poisson分布两独立样本资料的z检验 海南医学院卫生统计学教研室 105 2020 4 6 检验步骤 1 建立检验假设 确定检验水准 H0 1 2 H1 1 2 0 05 双侧检验2 选定检验方法 计算检验统计量以10万人口作为一个观察单位 两组观察单位相等 于是有 海南医学院卫生统计学教研室 106 2020 4 6 检验步骤 3 确定p值 作出推断结论Z 3 2549 3 25 相对应的双侧p 0 0024 0 05 按 0 05水准 拒绝H0 可以认为该市不同性别意外伤害死亡平均人数有差异 且男性较高 海南医学院卫生统计学教研室 107 2020 4 6 例6 11 某车间改革生产工艺前 测得三次粉尘浓度 每升空气中分别有38 29 36颗粉尘 改进工艺后 测取两次 分别为25 18颗粉尘 问 工艺改革前后平均粉尘浓度有无差别 海南医学院卫生统计学教研室 108 2020 4 6 分析 1 每升空气中粉尘颗粒数很少 因而可以看成是服从poisson分布 2 随机抽取的监测数据中 改革生产工艺前粉尘浓度 改进工艺后粉尘浓度 都大于20故可采用poisson分布两独立样本资料的Z检验 3 工艺改革前后观测单位数不等 故应用式6 16 海南医学院卫生统计学教研室 109 2020 4 6 检验步骤 1 建立检验假设 确定检验水准 H0 1 2 H1 1 2 0 05 双侧检验2 选定检验方法 计算检验统计量两组观察单位数不等 于是有 海南医学院卫生统计学教研室 110 2020 4 6 检验步骤 3 确定p值 作出推断结论Z 2 723 2 72 相对应的双侧p 0 007 0 05 按 0 05水准 拒绝H0 可以认为工艺改革前后粉尘浓度不同 由于 可以认为改革工艺后粉尘浓度较低 海南医学院卫生统计学教研室 111 2020 4 6 第四节假设检验与区间估计之间的关系 统计推断 参数估计 假设检验如配对设计资料差值的的双侧95 置信区间为 两独立样本资料的总体均数差值的双侧1 可信区间为每一种区间估计都可以对应一种假设检验方法 海南医学院卫生统计学教研室 112 2020 4 6 1 置信区间具有假设检验的主要功能 如例6 2对15对孪生兄弟出生体重差值的总体均数做区间估计 得其95 可信区间为显然 H0 不在此区间之内 因而拒绝H0经假设检验 得0 005 p 0 01 拒绝H0 可见 两者的结论是等价的 置信区间也具有假设检验的主要功能 海南医学院卫生统计学教研室 113 2020 4 6 再如例6 4 两个总体均数差值的置信区间为差值0在此区间内 则两总体均数相等 与假设检验结论一致 海南医学院卫生统计学教研室 114 2020 4 6 2 置信区间可提供假设检验没有提供的信息如降血压药至少要使血压平均降低10mmHg以上才认为具有临床治疗意义 10mmHg是具有实际意义的值 置信区间 海南医学院卫生统计学教研室 115 2020 4 6 1 由于假设检验可以提供确切的概率值 从而能够为统计学判断提供精确的概率保证 置信区间只能在预先给定的置信度100 1 水平上进行推断是否拒绝H0 在不拒绝H0的场合 假设检验可以对检验的功效 power 效能 做出估计 从而可以评价是否差异能力较强的情形下不拒绝H0 置信区间则不能提供此信息 3 假设检验比置信区间多提供的信息 海南医学院卫生统计学教研室 116 2020 4 6 联系 置信区间与相应的假设检验既能提供相互等价的信息 又有各自不同的功能 结合起来 可以提供更为全面 完整的信息 因此 国际上规定 在报告假设检验结论的同时 必须报告相应区间估计的结果 海南医学院卫生统计学教研室 117 2020 4 6 第五节假设检验的功效一 假设检验的两类错误 第 类错误 如果实际情况与H0一致 由于抽样的原因 使得统计量的观察值落到拒绝域 拒绝原本正确的H0 导致推断结论错误 这样的错误叫做 第 类错误 如果实际情况与H0不一致 由于抽样的原因 使得统计量的观察值落到接受域 不能拒绝原本错误的H0 导致推断结论错误 这样的错误叫做 海南医学院卫生统计学教研室 118 2020 4 6 取为0 05的含义 如果原假设H0成立 按照同样的方法在原假设H0规定的总体中重复抽样 那么在每100次检验结论中平均可以有5次拒绝H0 假阳性 犯第一类错误 的意义 如果H0并不成立 即所研究的总体与H0有实质差异 例如 1 2 按照同样的方法在总体中重复抽样 那么在每100次检验结论中平均可以有100 次不拒绝H0 假阴性 犯第二类错误 H0并不成立时 检验统计量的精确分布往往难以确定 难以估计 海南医学院卫生统计学教研室 119 2020 4 6 型错误与 型错误示意图 以单侧Z检验为例 当样本含量一定时 概率越小 概率越大 概率越大 概率越小 实际应用中 往往通过 控制 例如 样本量确定时 如要减小 就把 取大一些 海南医学院卫生统计学教研室 120 2020 4 6 二 假设检验的功效 poweroftest 检验效能 定义为 1 意义 即当所研究的总体与H0确有差别时 按检验水准 能发现它 拒绝H0 的概率 1 0 90的含义 当H0不成立时 理论上在每100次抽样中 在 的检验水准上平均有90次能正确的拒绝H0 一般情况下 对同一检验水准 功效大的检验方法更可取 一般要求检验效能要在0 80以上 海南医学院卫生统计学教研室 121 2020 4 6 功效的应用 应用 1 用于在设计阶段估计样本含量 2 在假设检验结果的解释和评价中 当不拒绝H0时 可以事后估计检验效能的值 有助于判断是总体参数确实没有差别 还是由于样本量太小导致的检验效能不足 如1 0 75 结果不可靠 海南医学院卫生统计学教研室 122 2020 4 6 1 单样本设计资料t检验的功效 n 样本含量 总体标准差 欲发现的最小差异或容许误差 即样本统计量与总体参数之差 Z 在 水平上的标准正态界值 根据检验设定取单侧或双侧Z 在 水平上的标准正态界值 总是单侧邻界值 算得Z 后 根据Z 的数值反查标准正态分布表来确定 进而得到1 1 计算Z 海南医学院卫生统计学教研室 123 2020 4 6 Z 是正值时 可以肯定检验效能一定大于0 50 此时应使用 Z 的值查标准正态分布曲线下面积 得到 值 从而计算1 Z 是负值时 可以肯定检验效能一定小于0 50 此时直接使用Z 的值查标准正态分布曲线下面积 得到1 海南医学院卫生统计学教研室 124 2020 4 6 6 12已知北方地区一般儿童前囟门闭合月龄为14 1个月 某研究人员从东北某县 缺钙地区 抽取36名儿童 得囟门闭合月龄均值为14 3个月 标准差为5 08个月 问该县儿童前囟门闭合月龄的均数是否大于一般儿童 海南医学院卫生统计学教研室 125 2020 4 6 例6 12经t检验得t 0 236 P 0 05 不拒绝H0 还不能认为该县儿童囟门闭合月龄大于一般儿童 计算该t检验的检验功效 假定根据现有知识 可取 5 0个月 实际差别d 14 3 14 1 0 20 设定容许误差 0 50个月 Z 0 05 1 645 2 计算1 1 045 0 1469 海南医学院卫生统计学教研室 126 2020 4 6 二 两独立样本资料t检验的功效 n 样本含量 总体标准差 有意义的最小检出差 或容许误差 Z 在 水平上的标准正态差值 1 计算Z 海南医学院卫生统计学教研室 127 2020 4 6 例6 13 计算例6 5检验的功效 假定 根据现有知识取容许误差 0 1mmol L 0 35mmol L Z 2 1 96查标准正态分布表 1 261对应的上侧尾部面积 得到 0 8962 1 0 1038 说明 检验功效太小 即发现 0 1mmol L的差别的机会还有10 38 海南医学院卫生统计学教研室 128 2020 4 6 3 影响检验效能的主要因素 主要因素有4个 1 总体参数2 个体差异 标准差 3 样本量4 检验水准总体参数的差异越大 个体差异 标准差 越小 样本量越大 检验水准越小 则检验效能越大 海南医学院卫生统计学教研室 129 2020 4 6 在假设检验结果的解释和评价中 特别是未能拒绝H0时 事后估计1 有助于判断是总体参数确实没有差别 还是样本量太小导致的检验效能不足 如 1 80 海南医学院卫生统计学教研室 130 2020 4 6 应用检验方法必须符合其适用条件 应根据设计类型 变量类型 样本大小等因素选择相应的检验方法 并注意不同检验方法的适用条件 如t检验要求样本来自正态分布总体 方差齐同 配对设计的资料不宜用两独立样本的t检验 三 应用假设检验的注意事项 海南医学院卫生统计学教研室 131 2020 4 6 双侧检验与单侧检验 选择要结合专业实际 选择要在计算检验统计量之前 在相同的检验水准下 正确地选择单侧检验将比双侧检验得到更多的检验效能 海南医学院卫生统计学教研室 132 2020 4 6 2 权衡两类错误的危害以确定 的大小 当样本量一定时 第一类错误的概率 变小时 第二类错误的概率 就变大 反之亦然 在可能出现的两类错误之中 往往会有一种错误危害较大 要权衡两类错误的危害来确定 的大小 例如 在一种新药与常规药间疗效比较的假设检验中 如果犯第一类错误 意味着可能过高评价疗效一般的新药 淘汰比较成熟的常规药物 为了不轻易淘汰比较成熟的常规药物 应控制第一类错误的概率 减小 再如 方差齐性检验 拟合优度检验中 为减小犯第二类错误的概率 可适当增加 海南医学院卫生统计学教研室 133 2020 4 6 3 正确理解P值的意义 P值很小时 拒绝H0 接受H1 但是不要把很小的P值误解为总体参数间差异很大 拒绝H0只是说差异不为零 P值小只是说犯一类错误的机会远小于 要求 在报告检验结论时 如果P 应说差异 有统计学意义 statisticallysignificance 同时写明P的数值或范围 将P 0 05说成 差异显著 或将P 0 01说成 差异非常显著 都是不对的 当P接近 时 不能简单地拒绝或不拒绝H0 应该继续观察研究 海南医学院卫生统计学教研室 134 2020 4 6 附 第六节正态性检验 资料是否来自正态分布总体 对统计方法的确定具有重要意义 两类方法 一 图示法1 P P图法2 Q Q图法二 统计检验法1 w检验2 D检验3 矩法 海南医学院卫生统计学教研室 135 2020 4 6 一 图示法 1 P P图法 proportion proportionplots 横坐标 样本的累计频率 百分比 纵坐标 按正态分布计算的相应累计概率 散点 样本值判断方法 若资料服从正态分布 样本点应围绕第一象限的对角线散布 海南医学院卫生统计学教研室 136 2020 4 6 海南医学院卫生统计学教研室 137 2020 4 6 一 图示法 2 Q Q图法 quantile quantileplots 横坐标 样本的百分位数 纵坐标 按正态分布计算的相应百分位数 散点 样本值判断方法 若资料服从正态分布 样本点应围绕第一象限的对角线散布 海南医学院卫生统计学教研室 138 2020 4 6 海南医学院卫生统计学教研室 139 2020 4 6 二 统计检验法 1 W检验 S S ShapiroandM B Wilk 检验假设为 H0 样本来自正态分布H1 样本不来自正态分布首先 将取自同一总体的样本值X1 Xn 按升序排列为X 1 X n 统计量为 海南医学院卫生统计学教研室 140 2020 4 6 二 统计检验法 2 D检验 D Agostino stest 适用条件 大样本资料 首先 将取自同一总体的样本值X1 Xn 按升序排列为X 1 X n 统计量为 海南医学院卫生统计学教研室 141 2020 4 6 正态性检验结果 海南医学院卫生统计学教研室 142 2020 4 6 二 统计检验法 3 矩法特点 分别对分布偏度与峰度做检验检验偏度的统计量为 海南医学院卫生统计学教研室 143 2020 4 6 二 统计检验法 检验峰度的统计量为如果结论不拒绝H0 可认为分布为正态 其他方法 拟合优度卡方检验 海南医学院卫生统计学教研室 144 2020 4 6 海南医学院卫生统计学教研室 145 2020 4 6 案例讨论 案例6 1 错误 两独立样本t检验案例6 2 方差不齐 用近似t检验案例6 3 配对设计t检验 海南医学院卫生统计学教研室 146 2020 4 6 计算机实验 实验6 1配对设计的t检验实验6 2两独立样本资料的t检验实验6 3正态性检验 W检验 实验6 4假设检验两类错误的模拟实验 海南医学院卫生统计学教研室 147 2020 4 6 思考与练习 1 单样本t检验 t 1 064 不拒绝H02 配对设计t检验 t 0 80 不拒绝H03 两独立样本t检验4 两独立样本t检验 F 17 36 方差不齐 t 14 14 拒绝H05 两独立样本t检验 F 6 24 方差不齐 t 5 54 拒绝H06 两独立样本t检验 镁 t 6 978 拒绝H0 铁 t 3 355 拒绝H0 卫生统计学教研室 ThankYou 海南医学院卫生统计学教研室 149 2020 4 6 Theend 海南医学院卫生统计学教研室 150 2020 4 6 三 二项分布两组独立样本资料Z检验的功效 1 计算Z 例6 15例6 9硝苯吡啶治疗组有效率 P1 57 75 0 76 硝苯吡啶 卡托普利治疗组有效率 p2 66 69 0 95652 两组合计有效率 p 57 66 75 69 0 85417 Z 3 34代入 6 20 式得到 2 计算检验效能 1 海南医学院卫生统计学教研室 151 2020 4 6 五 大样本资料比较的Z u 检验 Z检验 u检验 的应用条件1 单样本Z检验 正态总体 或非正态总体 抽取大样本 n 100 样本均数的分布服从 或近似地服从 正态分布 海南医学院卫生统计学教研室 152 2020 4 6 两样本z检验统计量计算 2 两独立样本Z检验 抽取大样本 n 100 样本均数的和与差的分布服从 或近似地服从 正态分布 海南医学院卫生统计学教研室 153 2020 4 6 例7 7某地抽样调查了部分健康成人的红细胞数 其中男性360人 均数为4 66 标准差为0 57 女性255人 均数为4 18 标准差为0 29 试问该地男女红细胞数的总体均数有无差别 分析 因为男女样本例数大于100 不需要假定方差相等和联合估计方差 采用Z检验 海南医学院卫生统计学教研室 154 2020 4 6 1 建立检验假设 确定检验水准H0 1 2 即该地男 女红细胞数总体均数相等 H1 1 2双侧 0 05 2 计算统计量 3 确定P值 作出统计推断查附表1 或t界值表 时 或标准正态分布表 得P 0 001 按 0 05水准拒绝H0 接受H1 差异有统计学意义 可认为该地男 女红细胞数总体均数不等 男性高于女性 例6 8某医院声称治疗声带白班的有效率为80 求医者60例 45例有效 试问该医院声称的有效率是否客观 理论有效率 0 0 80 样本有效率p 45 60 0 75 E p 1 建立检验假设 确定检验水准 H0 0 80H1 0 80 0 05 单侧检验 2 选定检验方法 计算检验统计量 Z检验法 3 确定P值 作出统计推断 Z0 05 1 64 P 0 05 不拒绝H0无效假设 差别在 0 05水平上无统计学意义 4 专业结论 医院声称的有效率80 为真 P Z 0 80 0 2119 2 两组独立样本频率的Z检验 两个样本频率的比较 例6 9用硝苯吡啶治疗高血压急症患者75例 有效者5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论