




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数值变量资料的假设检验 公共卫生学院王淑康 2 主要内容 1假设检验的基本思想和步骤 2t检验 3u检验 4正态性检验 自学 5两个方差的齐性检验 6 型错误和 型错误 7假设检验时应注意的事项 3 1假设检验的基本思想 假设检验的目的假设检验的原理假设检验的基本步骤 4 一 假设检验的目的据大量调查得知 健康成年男子脉搏的均数为72次 分 某医生在山区随机调查了25名健康成年男子 其脉搏均数为74 2次 分 标准差为6 5次 分 能否认为该山区成年男子的脉搏高于一般健康成年男子 判断均数差别引起的原因 一种可能是 样本是从该总体中随机抽取的 其差异仅仅是由抽样误差造成的 另一种可能是 样本不是从该总体中随机抽取的 而是有本质上的不同 单纯用抽样误差解释不了 5 前已述及 由于个体变异的普遍存在 抽样研究时 不可避免地存在着抽样误差 从cm cm的正态分布总体中 以固定随机抽取100个样本时 各样本均数基本不等 也不等于155 4 这些差别是由抽样误差造成的 因此 在医学研究中 由样本资料得出样本统计量 后 首先要考虑抽样误差的存在 6 假设检验的目的 也就是说 当遇到样本统计量与某一总体参数不等时 应想到两种可能性 一种可能是 样本是从该总体中随机抽取的 其差异仅仅是由抽样误差造成的 另一种可能是 样本不是从该总体中随机抽取的 而是有本质上的不同 单纯用抽样误差解释不了 那么 如何判断这两种可能呢 需要进行假设检验 7 假设检验的目的 判断均数差别引起的原因 一种可能是 样本是从该总体中随机抽取的 其差异仅仅是由抽样误差造成的 另一种可能是 样本不是从该总体中随机抽取的 而是有本质上的不同 单纯用抽样误差解释不了 8 二 假设检验的基本思想 9 当以固定n从均数为 的正态分布总体中随机抽样时 对于u分布 理论上 有95 的 有5 的 若进行一次抽样 则有95 的可能 而的可能只有5 10 对于t分布 理论上有95 的 有5 的 若进行一次抽样时 有95 的可能 而的可能只有5 11 总之 当以固定n从均数为的正态分布总体中进行一次随机抽样时 抽到或的机会 概率 很小 假设 在一次抽样研究中 就得到了或 即 为小概率事件 依据小概率事件在一次试验不可能发生的定理 可认为此样本不是来自均数为 的正态分布总体 而是来自均数不等于 的另一个正态分布总体 假设检验的原理 12 三 假设检验的基本步骤 适用于任何类型的变量 通过实例说明 据大量调查知 健康成年男子脉搏的均数为72次 分 某医生在山区随机调查了25名健康成年男子 其脉搏均数为74 2次 分 标准差为6 5次 分 能否认为该山区成年男子的脉搏高于一般健康成年男子 13 分析思路 两个均数不等的可能原因有二 一是抽样误差 即山区健康成年男子的脉搏均数与一般健康成年男子的脉搏均数相同 其不同是由抽样误差造成的 二是本质上的不同 即因山区的影响 人体的生理代偿所致 可通过假设检验来判断 基本步骤 1 建立假设和确定检验水准2 选定检验方法和计算统计量3 确定P值 做出推断结论 假设检验的基本步骤 14 一 建立假设和确定检验水准 1 建立假设 检验假设 常称无效假设或零假设 nullhypothesis hypothesisundertest 用表示 假设样本所代表的总体参数与已知总体参数相等 备择假设 alternativehypothesis 用表示 与是对立且相互联系的假设 假设样本所代表的总体参数与已知的总体参数不等 或 或 假设检验的基本步骤 15 一 建立假设和确定检验水准 1 建立假设 本例 检验假设 假设山区健康成年男子的总体脉搏均数 与一般人群健康成年男子脉搏的均数 0相等 即山区成年男子的脉搏均数 72次 分 次 分 备择假设 从专业角度考虑 山区成年男子的总体脉搏均数只会高于一般人群 不会低于一般人群 即 72次 分 假设检验的基本步骤 16 一 建立假设和确定检验水准 2 确定单 双侧检验建立假设前 先要根据专业知识和研究目的来确定是单侧检验还是双侧检验 若从专业知识和研究目的上考虑 未知的总体参数只能大于 或只能小于 已知总体参数时 用单侧检验 若从专业知识和研究目的上认为 未知的总体参数大于或小于已知总体参数的两种情况都可能存在时 用双侧检验 通常用双侧检验 单 双侧检验的区别可从备择假设反映出来 双侧检验时 单侧检验时 假设检验的基本步骤 17 一 建立假设和确定检验水准 3 确定检验水准是判断拒绝或不拒绝无效假设的水准 假设检验的基本步骤 18 二 选定检验方法和计算统计量 假设检验的方法很多 如t检验 u检验 方差分析 检验 秩和检验 各检验方法都有其应用条件 选择时 须根据研究目的 设计类型 资料类型及其分布特征等选用适当的统计检验方法 并计算出相应的检验统计量 如本例 是样本与总体均数的比较 样本是按完全随机设计抽取的 是数值变量资料 且样本含量较小 总体标准差未知 须选用样本均数与总体均数比较的t检验 假设检验的基本步骤 19 求出检验统计量后 查相应的统计用表 得出概率P值 P值是指从所规定的总体中随机抽样时 获得等于及大于 负值时为等于及小于 现有样本统计量的概率 三 确定P值 做出推断结论 假设检验的基本步骤 20 三 确定P值 做出推断结论 若所得的概率时 认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的 不拒绝 若时 认为从该总体抽到现有样本的可能性很小 其差别并非是由单纯的抽样误差造成的 根据小概率事件一次不可能发生的定理 拒绝 接受 以上为统计推断 还要结合专业做出专业结论 本例 按检验水准 不拒绝 尚不能认为山区成年男子的总体脉搏均数高于一般人群 假设检验的基本步骤 21 第二节t检验 t检验 t test 其理论基础为1908年W S Gosset以笔名 student 发表的t分布 故t检验亦称student st test t检验适用于 样本均数与总体均数比较 未知且或 成组设计的两小样本均数比较 均小于30或50 配对设计的两样本均数比较 22 t检验 t检验的应用条件 当样本含量较小 或 时 要求样本来自正态分布总体 用于成组设计的两样本均数比较时 要求两样本来自总体方差相等的总体 用于配对设计的两样本均数比较时 要求差值来自正态分布总体 主要包括 单样本t检验配对t检验两样本t检验 23 1 单样本t检验 onesamplet test 用于样本均数与已知总体均数 一般为理论值 标准值或经过大量观察所得的稳定值等 比较 研究目的 推断样本所代表的未知总体均数与已知总体均数有无差别 计算公式 24 对例4 1进行t检验 1 建立假设 确定检验水准单侧 2 计算统计量本例 次 min 次 min 次 min 单样本t检验 25 3 确定P值 做出推断结论以 查附表2t界值表 得单侧 按检验水准不拒绝 根据本资料尚不能认为男性汽车司机的脉搏平均数高于一般男性脉搏平均数 对例4 1进行t检验 单样本t检验 26 2 配对t检验 pairedt testfordependentsamples 用于配对设计资料的两均数的比较 配对设计类型 先将受试对象按配比条件配对 然后用随机分组方法将各对中的2个受试对象分别分配到不同处理组 同一对象分别接受2种不同处理 同一标本 不同部位 同一对象处理前后 研究目的 推断2种处理的效果有无差别 或 推断某种处理有无作用 27 配对t检验 计算公式 式中 为差值d的样本均数 为所代表的未知总体均数 当2种处理的效应相同或某种处理无作用时 为差值的标准差 为差值样本均数的标准误 n为对子数 为自由度 28 例4 3 例4 3将20只按体重 月龄及性别配对的大白鼠随机分入甲 乙2组 甲组给正常饲料 乙组饲料缺乏维生素E 10天后测定大白鼠肝脏的维生素A含量 IU g 结果如下 问2组大白鼠肝脏维生素A含量是否有差别 配对t检验 29 配对t检验 30 例4 3 1 建立假设 确定检验水准 2 计算统计量本例 配对t检验 31 3 确定P值 做出推断结论以 查附表2t界值表 得双侧 按检验水准拒绝 接受 可认为2组大白鼠肝脏维生素A含量的差别有统计学意义 维生素E缺乏组的大白鼠肝脏维生素A含量低于正常饲料组 例4 3 配对t检验 32 例4 4有12名志愿受试者服用某减肥药 服药前和服药一个疗程后各测量一次体重 kg 数据如表4 2所示 试判断此减肥药是否有效 配对t检验 33 例4 4 1 建立假设 确定检验水准单侧 2 计算统计量本例 配对t检验 34 3 确定P值 做出推断结论以 查附表2t界值表 得单侧 按检验水准不拒绝 根据本资料尚不能认为该减肥药有效 例4 3 配对t检验 35 3 两样本t检验 two sample groupt testforindependentsamples 用于完全随机设计的两样本均数的比较 两样本来自于两个总体 如不同的处理方法 不同职业 性别等 研究目的 推断两样本所分别代表的总体均数是否相等 36 两样本t检验 计算公式 式中 为两样本均数差值的标准误 为两样本的合并方差 分别为两样本的方差 37 例4 5 例4 5将19只雌性大白鼠随机分为2组 分别饲以高蛋白和低蛋白饲料8周 各鼠体重的增加克数如下 问不同饲料组大白鼠的增重有无差别 高蛋白组 1341461041191241611078311312997123低蛋白组 701181018510713294 两样本t检验 38 1 建立假设 确定检验水准 两样本t检验 例4 5 39 2 计算统计量本例 例4 5 两样本t检验 40 3 确定P值 做出推断结论以 查附表2t界值表 得双侧 按检验水准不拒绝 可认为两组雌性大白鼠增重的差别无统计学意义 尚不能认为两种饲料对雌鼠的增重不同 例4 5 两样本t检验 41 成组设计的两样本几何均数比较 在医学研究中 有些资料为对数正态分布资料和倍数资料 其平均水平宜用几何均数表示 当成组设计的两样本几何均数比较时 其检验统计量值计算公式为 42 例4 6 例4 6将20份钩端螺旋体患者的血清随机分为2组 分别用标准株和水生株做凝溶试验 结果见表4 3 试比较两法测得的血清抗体平均效价有无差别 成组设计的两样本几何均数比较 43 成组设计的两样本几何均数比较 44 例4 6 1 建立假设 确定检验水准 两总体几何均数相等 两总体几何均数不等 2 计算统计量本例 成组设计的两样本几何均数比较 45 例4 6 成组设计的两样本几何均数比较 46 3 确定P值 做出推断结论以 查附表2t界值表 得双侧 按检验水准拒绝 接受 认为两组抗体平均效价的差别有统计学意义 标准株组高于水生株组 例4 6 成组设计的两样本几何均数比较 47 第三节u检验 u检验 u test 亦称Z test 适用于 样本均数与总体均数的比较 成组设计两样本均数的比较 应用条件 样本含量n足够大 n 50 或n虽小但已知时 包括 单样本u检验两样本u检验 48 1 单样本u检验 onesampleu test 用于样本均数与已知总体均数 一般为理论值 标准值或经过大量观察所得的稳定值等 比较 研究目的 推断样本所代表的未知总体均数与已知总体均数有无差别 计算公式 49 例4 7 例4 7一般男性血色素含量的医学参考值为14 0g 某研究者从某高原地区人群中随机抽取120名健康男性 测得其血色素均数g 标准差g 问该高原地区健康男性血色素含量是否高于一般男性 单样本u检验 50 例4 7 1 建立假设 确定检验水准单侧 2 计算统计量本例 单样本u检验 51 例4 7 3 确定P值 做出推断结论 按检验水准拒绝 接受 该地健康男性与一般男性血色素含量的差别有统计学意义 可认为该高原地区健康男性血色素含量高于一般男性 单样本u检验 52 2 两样本u检验 two sampleu testforindependentsamples 用于完全随机设计的两样本均数的比较 两样本来自于两个总体 研究目的 推断两样本所分别代表的总体均数是否相等 计算公式 53 例4 8 例4 8某医师欲比较某地工人和农民全血胆碱脂酶活力 检测工人143名 均数为3 52 mol L 标准差为0 49 mol L 检测农民156名 均数为3 36 mol L 标准差为0 53 mol L 问该地工人与农民全血胆碱脂酶活力有无差别 两样本u检验 54 例4 8 1 建立假设 确定检验水准 2 计算统计量本例 两样本u检验 55 例4 8 3 确定P值 做出推断结论 按检验水准拒绝 接受 可认为该地工人与农民的全血胆碱脂酶活力不同 工人高于农民 两样本u检验 56 第四节正态性检验 医学统计学中 许多统计方法仅适用于正态分布或近似正态分布资料 例如 用均数和标准差描述数值变量资料的分布特征 以及t u检验和方差分析时 均要求样本资料服从正态分布 因此 选定统计方法时 首先要检验资料是否服从正态分布 正态性检验 testofnormality 是推断资料是否服从正态分布 或样本是否来自正态分布总体的方法 57 正态分布有2个特征 即对称性 symmetry 和正态峰 mesokurtosis 当频数分布不对称时为偏态 skewness 依据高峰所处的位置 又可分为正偏态和负偏态 高峰偏左 长尾向右侧延伸的为正偏态 高峰偏右 长尾向左侧延伸的为负偏态 在医学研究中 偏态资料以正偏态居多 58 59 非正态峰又有尖峭峰 leptokurtosis 和平阔峰 platykurtosis 之分 峰态尖峭而尾部伸展 两尾部曲线在正态曲线之上的为尖峭峰 峰态平阔而尾部短促 两尾部曲线在正态曲线之下的为平阔峰 60 正态性检验方法 正态性检验的方法有2类 本节仅介绍矩法 对偏度和峰度分别用一个指标评定 其中矩法 methodofmoment 效率较高 仅用一个指标综合评定 其中W检验和D检验效率较高 矩法亦称动差法 它是应用数学上矩的原理检验偏度和峰度 为偏度系数 coefficientofskewness 为峰度系数 coefficientofkurtosis 61 矩法计算公式 式中 为变量值 为相同的个数 n为样本含量 对于频数表资料 为组中值 为各组段的频数 62 理论上 总体偏度系数为对称 为正偏态 为负偏态 总体峰度系数为正态峰 为尖峭峰 为平阔峰 和为统计量 其抽样分布为近似正态分布 故在计算其标准误 和 后 可通过u检验推断资料的正态性 63 64 第五节两个方差的齐性检验 两个方差的齐性检验用于推断两样本方差和所分别代表的总体方差和是否相等 当和分别代表的总体方差相等时称两样本方差齐 反之 当和分别代表的总体方差不等时称两样本方差不齐 两样本的t检验要求两样本来自方差相等的总体 即方差齐 因此 在两样本t检验时 需先进行两个方差的齐性检验 65 两样本方差齐性检验方法 F检验 式中 为较大的样本方差 为较小的样本方差 为分子的自由度 为分母的自由度 n1和n2分别为相应的样本含量 66 例4 9 例4 9来自正态分布总体的2个随机样本的血清IgA u ml 测定结果如下 试检验两个方差的齐性 肺气肿组 健康组 67 例4 9 1 建立假设 确定检验水准 2 计算统计量 3 确定P值 做出推断结论以 查附表3F界值表得 按检验水准不拒绝 可认为两总体方差相等 即两样本方差齐 68 第六节 型错误和 型错误 假设检验利用小概率反证法的思想 根据样本统计量做出的推断结论具有概率性 因此其结论有可能出现判断错误 通常可能发生以下两类错误 以单样本t检验为例说明 69 70 型错误 type error 型错误拒绝了实际上成立的 即样本来自的总体 由于抽样的偶然性 检验统计量 按检验水准拒绝 接受 这类在假设检验中拒绝了原本正确的的错误为 型错误 理论上犯 型错误的概率为 值的大小视研究目的确定 通常设 即允许犯 型错误的概率为0 05 71 型错误 type error 型错误不拒绝实际上不成立的 即样本来自的总体 由于抽样的偶然性 检验统计量 按检验水准不拒绝 这类在假设检验中不拒绝原本不正确的的错误为 型错误 犯 型错误的概率为 它只有与特定的结合起来才有意义 72 73 型错误的概率只取单尾 通常在假设检验时其大小是未知的 需在已知两总体差值 总体标准差 检验水准和样本含量n时尚能算出 详见第10章实验设计概述 通常 当样本含量不变时 越小 越大 反之 越大 越小 同时减少和的方法是增加样本含量 74 称为检验效能或把握度 powerofatest 即两总体确有差别时 按水准能识别该差别的能力 如表示 若两总体确有差别 理论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 前列腺增生围术期护理
- 骨科手术的一般术后护理
- 江苏省南京市秦淮区2026届九年级化学第一学期期中监测模拟试题含解析
- 家庭医生分级政策解读
- 非煤矿山机电安全培训
- 浙江省绍兴市越城区袍江中学2026届九上化学期中学业水平测试模拟试题含解析
- 2026届北京六十六中学九年级英语第一学期期末监测模拟试题含解析
- 化疗中药应用指南解读
- 2026届河北省石家庄市正定县英语九上期末经典试题含解析
- 2026届4月山东省莒县英语九年级第一学期期末学业质量监测模拟试题含解析
- GB 23466-2025听力防护装备的选择、使用和维护
- 人教PEP版(2024)四年级上册英语-Unit 3 Places we live in 单元整体教学设计(共6课时)
- 华为信息安全管理培训课件
- 贵阳市殡仪服务中心招聘考试真题2024
- 重庆市危险化学品企业变更管理实施指南(试行)解读2025.7.25
- 煤改电工程施工质量监控方案和措施
- 布病的护理教学课件
- (2025年标准)预售小麦协议书
- 2025年院感测试题及答案
- 公司培训防诈骗知识宣传课件
- 2025年全国《质量知识竞赛》题库及答案
评论
0/150
提交评论