已阅读5页,还剩125页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第三章总体均数的估计与假设检验EstimationofPopulationMeanandHypothesisTest 2 Content1 Samplingerrorandstandarderrorofmean2 t distribution3 EstimationofPopulationMean4 t test5 Noticeofhypothesistest6 Normalitytestandhomogeneityofvariancetest 3 第一节均数的抽样误差与标准误 4 统计推断 由样本信息推断总体特征 正态 分布 总体 推断 说明 为说明抽样误差规律 先用一个实例 后引出理论 5 图3 11999年某市18岁男生身高N 167 7 5 32 的抽样示意图 6 见P34 36表3 1 7 将此100个样本均数看成新变量值 则这100个样本均数构成一新分布 绘制直方图 图3 2从正态分布总体N 167 7 5 32 随机抽样所得样本均数分布 8 各样本均数未必等于总体均数 各样本均数间存在差异 样本均数的分布为中间多 两边少 左右基本对称 样本均数的变异范围较之原变量的变异范围大大缩小 可算得这100个样本均数的均数为167 69cm 标准差为1 69cm 样本均数的抽样分布具有如下特点 9 1 抽样误差 由个体变异产生的 抽样造成的样本统计量与总体参数的差别均数的抽样误差 由于抽样造成的样本均数与总体均数的差别原因 1 抽样2 个体差异 10 本书以n 60为界限 11 表示样本统计量抽样误差大小的统计指标 均数标准误 说明均数抽样误差的大小 总体计算公式 3 1 2 标准误 standarderror SE 实质 样本均数的标准差 12 数理统计证明 13 若用样本标准差S来估计 3 2 降低抽样误差的途径有 通过增加样本含量n 通过设计减少S 14 第二节t分布 t distribution 15 t分布概述抽样误差的分布规律 样本 总体 t分布理论 手段 桥梁 目的 16 一 t分布的概念 17 18 式中为自由度 degreeoffreedom df 3 实际工作中 由于未知 用代替 则不再服从标准正态分布 而服从t分布 19 二 t分布的图形与特征 分布只有一个参数 即自由度 20 图3 3不同自由度下的t分布图 21 1 特征 22 2t界值表 详见附表2 可反映t分布曲线下的面积 单侧概率或单尾概率 用表示 双侧概率或双尾概率 用表示 23 24 举例 25 第三节总体均数的估计 26 一 参数估计用样本统计量推断总体参数 总体均数估计 用样本均数 和标准差 推断总体均数 27 28 按预先给定的概率 1 所确定的包含未知总体参数的一个范围 总体均数的区间估计 按预先给定的概率 1 所确定的包含未知总体均数的一个范围 如给定 0 05 该范围称为参数的95 可信区间或置信区间 如给定 0 01 该范围称为参数的99 可信区间或置信区间 2 区间估计 intervalestimation 29 二 总体均数可信区间的计算 30 总体均数可信区间的计算需考虑 1 总体标准差 是否已知 2 样本含量n的大小通常有两类方法 1 t分布法 2 u分布法 31 1 单一总体均数的可信区间 32 33 P25 15号样本 34 35 36 例3 3某地抽取正常成年人200名 测得其血清胆固醇的均数为3 64mmol L 标准差为1 20mmol L 估计该地正常成年人血清胆固醇均数的95 可信区间 37 故该地正常成年人血清胆固醇均数的双侧95 可信区间为 3 47 3 81 mmol L 38 39 40 41 例3 4为了解氨甲喋呤 MTX 对外周血IL 2水平的影响 某医生将61名哮喘患者随机分为两组 其中对照组29例 采用安慰剂 实验组32例 采用小剂量氨甲喋呤 MTX 进行治疗 测得对照组治疗前IL 2的均数为20 10IU ml 标准差为7 02IU ml 试验组治疗前IL 2的均数为16 89IU ml 标准差为8 46IU ml 问两组治疗前基线的IL 2总体均数相差有多大 42 第一步 43 能否下 两组IL 2的总体均数 不同 或 有差别 的结论 44 三 可信区间的确切涵义 45 1 95 的可信区间的理解 1 所要估计的总体参数有95 的可能在我们所估计的可信区间内 2 从正态总体中随机抽取100个样本 可算得100个样本均数和标准差 也可算得100个均数的可信区间 平均约有95个可信区间包含了总体均数 3 但在实际工作中 只能根据一次试验结果估计可信区间 我们就认为该区间包含了总体均数 46 2 可信区间的两个要素 1 准确度 用可信度 1 表示 即区间包含总体均数 的理论概率大小 当然它愈接近1愈好 如99 的可信区间比95 的可信区间要好 2 精确度 即区间的宽度区间愈窄愈好 如95 的可信区间比99 的可信区间要好 47 当n确定时 上述两者互相矛盾 提高准确度 可信度 则精确度降低 可信区间会变宽 势必降低可信区间的实际应用价值 故不能笼统认为99 可信区间比95 可信区间要好 相反 在实际应用中 95 可信区间更为常用 48 在可信度确定的情况下 增加样本含量可减小区间宽度 提高精确度 49 四 总体均数可信区间与参考值范围的区别 50 也可用对应于双尾概率时 也可用对应于双尾概率时 表3 2总体均数的可信区间与参考值范围的区别 51 第四节t检验 52 1 样本均数与已知某总体均数比较的t检验目的 推断一个未知总体均数与已知总体均数是否有差别 用单样本设计 2 两个样本均数与比较的t检验目的 推断两个未知总体均数与是否有差别 用成组设计 3 配对设计资料均数比较的t检验目的 推断两个未知总体均数与是否有差别用配对设计 t检验 亦称studentt检验 有下述情况 53 对于大样本 也可以近似用u检验 54 t检验和u检验的应用条件 1 t检验应用条件 样本含量n较小时 如n 60 1 正态分布 2 方差齐性 homogeneityofvariance 2 u检验应用条件 样本含量n较大 或n虽小但总体标准差已知 1 正态分布 2 方差齐性 homogeneityofvariance 55 假设检验过去称显著性检验 它是利用小概率反证法思想 从问题的对立面 H0 出发间接判断要解决的问题 H1 是否成立 然后在H0成立的条件下计算检验统计量 最后获得P值来判断 假设检验基本思想及步骤 56 例3 5某医生测量了36名从事铅作业男性工人的血红蛋白含量 算得其均数为130 83g L 标准差为25 74g L 问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g L 130 83g L 140g L原因 1 可能是总体均数不同2 是抽样造成的 57 58 H1的内容直接反映了检验单双侧 若H1中只是 0或 0 则此检验为单侧检验 它不仅考虑有无差异 而且还考虑差异的方向 单双侧检验的确定 首先根据专业知识 其次根据所要解决的问题来确定 若从专业上看一种方法结果不可能低于或高于另一种方法结果 此时应该用单侧检验 一般认为双侧检验较保守和稳妥 59 3 检验水准 过去称显著性水准 是预先规定的概率值 它确定了小概率事件的标准 在实际工作中常取 0 05 可根据不同研究目的给予不同设置 60 61 62 图3 5例3 5中P值示意图 63 64 若 是否也能下 无差别 或 相等 的结论 65 一 单样本t检验 onesample groupt test 即样本均数 代表未知总体均数 与已知总体均数 0 一般为理论值 标准值或经过大量观察所得稳定值等 的比较 其检验统计量按下式计算 66 例3 5某医生测量了36名从事铅作业男性工人的血红蛋白含量 算得其均数为130 83g L 标准差为25 74g L 问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g L 1 建立检验假设 确定检验水准H0 0 140g L 即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等H1 0 140g L 即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等 0 05 67 2 计算检验统计量 68 3 确定P值 作出推断结论 69 配对t检验适用于配对设计的计量资料 配对设计类型 两同质受试对象分别接受两种不同的处理 同一受试对象分别接受两种不同处理 同一受试对象 一种 处理前后 二 配对t检验 paired matchedt test 70 例3 6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同 某人随机抽取了10份乳酸饮料制品 分别用脂肪酸水解法和哥特里 罗紫法测定其结果如表3 3第 1 3 栏 问两法测定结果是否不同 71 表3 3两种方法对乳酸饮料中脂肪含量的测定结果 72 1 建立检验假设 确定检验水准H0 d 0 即两种方法的测定结果相同H1 d 0 即两种方法的测定结果不同 0 05 2 计算检验统计量本例n 10 d 2 724 d2 0 8483 73 按公式 3 16 3 确定P值 作出推断结论查附表2的t界值表得P 0 001 按 0 05水准 拒绝H0 接受H1 有统计学意义 可认为两种方法对脂肪含量的测定结果不同 哥特里 罗紫法测定结果较高 74 三 两样本t检验 two sample groupt test 又称成组t检验 适用于完全随机设计两样本均数的比较 此时人们关心的是两样本均数所代表的两总体均数是否不等 两组完全随机设计是将受试对象完全随机分配到两个不同处理组 75 适用范围 完全随机设计两样本均数的比较检验方法 依两总体方差是否齐性而定 76 77 例3 7为研究国产四类新药阿卡波糖胶囊的降血糖效果 某医院用40名II型糖尿病病人进行同期随机对照试验 试验者将这些病人随机等分到试验组 用阿卡波糖胶囊 和对照组 用拜唐苹胶囊 分别测得试验开始前和8周后的空腹血糖 算得空腹血糖下降值见表3 4 能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同 78 79 2 计算检验统计量 80 3 确定P值 作出推断结论 81 若变量变换后总体方差齐性 可采用t检验 如两样本几何均数的t检验 就是将原始数据取对数后进行t检验 若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验 若两总体方差不等 82 2 Cochran Cox近似t检验 t 检验 调整t界值 83 84 例3 8在上述例3 7国产四类新药阿卡波糖胶囊的降血糖效果研究中 测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人 其8周时糖化血红蛋白HbA1c 下降值如表3 5 问用两种不同药物的病人其HbA1c下降值是否不同 85 表3 5对照组和试验组HbA1c下降值 对照组方差是试验组方差的3 77倍 经方差齐性检验 认为两组的总体方差不等 故采用近似t检验 86 1 建立检验假设 确定检验水准 略 2 计算检验统计量 87 3 确定P值 作出推断结论 查t界值表t0 05 2 19 2 093 由t 0 9650 05 按 0 05水准 不拒绝H0 无统计学意义 还不能认为用两种不同药物的病人其HbA1c下降值不同 88 3 Satterthwaite近似t检验 Cochran Cox法是对临界值校正而Satterthwaite法则是对自由度校正 89 以 28 4 28 t 0 965查附表2的t界值表得0 20 P 0 40 结论同前 按Satterthwaite法对例3 8做检验 得 90 3 Welch法近似t检验Welch法也是对自由度进行校正 校正公式为 91 对例3 8 如按Welch法 则 以 29 4 29 t 0 965查附表2的t界值表得0 20 P 0 40 结论同前 92 第五节假设检验注意事项 93 一 I型错误和II型错误 假设检验是利用小概率反证法思想 根据P值判断结果 此推断结论具有概率性 因而无论拒绝还是不拒绝H0 都可能犯错误 见表3 8 94 表3 8可能发生的两类错误 95 I型错误 实际无差别 但下了有差别的结论 假阳性错误 犯这种错误的概率是 其值等于检验水准 II型错误 实际有差别 但下了不拒绝H0的结论 假阴性错误 犯这种错误的概率是 其值未知 但n一定时 增大 则减少 1 检验效能 power 当两总体确有差别 按检验水准 所能发现这种差别的能力 96 图3 6I型错误与II型错误示意图 以单侧u检验为例 97 减少I型错误的主要方法 假设检验时设定 值 减少II型错误的主要方法 提高检验效能 提高检验效能的最有效方法 增加样本量 如何选择合适的样本量 实验设计 98 二 假设检验应注意的问题1 要有严密的研究设计这是假设检验的前提 组间应均衡 具有可比性 也就是除对比的主要因素 如临床试验用新药和对照药 外 其它可能影响结果的因素 如年龄 性别 病程 病情轻重等 在对比组间应相同或相近 保证均衡性的方法主要是从同质总体中随机抽取样本 或随机分配样本 99 2 不同的资料应选用不同检验方法应根据分析目的 资料类型以及分布 设计方案的种类 样本含量大小等选用适当的检验方法 如 配对设计的计量资料采用配对t检验 而完全随机设计的两样本计量资料 若为小样本 即任一ni60 且方差齐 则选用两样本t检验 若方差不齐 则选用近似t 检验 Cochran Cox法或Satterthwaite法 若为大样本 所有ni 60 则可选用大样本u检验 100 3 正确理解 显著性 一词的含义差别有或无统计学意义 过去称差别有或无 显著性 是对样本统计量与总体参数或样本统计量之间的比较而言 相应推断为 可以认为或还不能认为两个或多个总体参数有差别 101 4 结论不能绝对化因统计结论具有概率性质 故 肯定 一定 必定 等词不要使用 在报告结论时 最好列出检验统计量的值 尽量写出具体的P值或P值的确切范围 如写成P 0 040或0 02 P 0 05 而不简单写成P 0 05 以便读者与同类研究进行比较或进行循证医学时采用Meta分析 102 5 假设检验是为专业服务的 统计结论必须和专业结论有机地相结合 才能得出恰如其分 符合客观实际的最终结论 若统计结论和专业结论一致 则最终结论就和这两者均一致 即均有或均无意义 若统计结论和专业结论不一致 则最终结论需根据实际情况加以考虑 若统计结论有意义 而专业结论无意义 则可能由于样本含量过大或设计存在问题 那么最终结论就没有意义 103 6 可信区间与假设检验各自不同的作用 要结合使用 一方面 可信区间亦可回答假设检验的问题 算得的可信区间若包含了H0 则按 水准 不拒绝H0 若不包含H0 则按 水准 拒绝H0 接受H1 104 另一方面 可信区间不但能回答差别有无统计学意义 而且还能比假设检验提供更多的信息 即提示差别有无实际的专业意义 105 图3 7可信区间在统计推断上提供的信息 106 虽然可信区间亦可回答假设检验的问题 并能提供更多的信息 但并不意味着可信区间能够完全代替假设检验 可信区间只能在预先规定的概率 检验水准 的前提下进行计算 而假设检验能够获得一较为确切的概率P值 107 第六节 正态性检验和两样本方差比较的F检验 108 t检验的应用条件是正态总体且方差齐性 配对t检验则要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年数字化智慧农业精准种植方案实施方案
- 油漆合作协议合同范本
- 电器包年服务合同范本
- 环境应急预案合同范本
- 小学班级安全教育活动方案
- 比亚迪验货合同范本
- 苗木后期维护合同范本
- 花店签订订花合同范本
- 自愿快餐加盟合同范本
- 生活物资订购合同范本
- 健身房开业投资预算方案
- 2025城发环保能源(汝南)有限公司招聘4人笔试历年备考题库附带答案详解试卷3套
- 河北省沧衡名校联盟2025-2026学年高三上学期11月期中考试语文试题(含答案)
- 2025年酉阳土家族苗族自治县辅警招聘考试真题附答案详解(满分必刷)
- 世界艾滋病日健康讲座
- 2025-2026学年河南省天一大联考高一上学期9月月考历史试题
- 省级总代理合同协议范本2024
- 物业公司服务标准手册
- 爱情合同协议电子合同
- 有趣的汽车越野教案
- 城市商业综合体管理运营策略分析
评论
0/150
提交评论