(医学PPT课件)医学科研设计与统计学思维_第1页
(医学PPT课件)医学科研设计与统计学思维_第2页
(医学PPT课件)医学科研设计与统计学思维_第3页
(医学PPT课件)医学科研设计与统计学思维_第4页
(医学PPT课件)医学科研设计与统计学思维_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学科研设计与统计学思维 1 没有设计的临床干预试验1685年抢救英国国王查理二世 CharlesII 1630 1685 一品脱 0 568L 血从右臂放出 半品脱血从左肩放出 服下催吐剂 两付汤药和一种由15成份的灌肠剂 刮国王的头部 直到起一个大泡 再服打喷嚏的药粉和更多的催吐剂 继续放血 加服止痛剂 把沥青和鸽子粪混合后敷于脚上 服一种含有10种成份的草药 最后服人头盖骨粉制成的40滴糖浆 外敷牛黄 然后 国王陛下死了 2 有设计的临床干预试验1747年5月20日 英国的J Lind医生将12名病情相同似的患者带到一艘船上 患者的主要症状是牙龈溃烂 皮肤有出血点 双膝无力 Lind将12名患者分为6组 分别给予下列主要干预 A组 每天饮1夸脱 1 136L 苹果汁 B组 服25滴硫酸丹剂 elixirvitriol 每天3次 C组 服2匙醋 每天3次 D组 每天饮约半品脱海水 服缓和的泻药 E组 每天食2个桔子 一个柠檬 F组 每天服由大蒜 芥子等成份组成的干药 当6月16日船返回英国Plymouth港时 所有患者的病情都有好转 其中E组恢复的最快 最好 其中一人到第6天就可以工作了 B组也有一人比登船时健康 Lind医生的试验并没有得出明确的结论 直到160年后 通过动物实验才真正从科学意义上解释了E组疗效最好的真正原因 3 J Lind医生的研究有二点符合统计学的设计 1 设立了对照 相互对照 2 质量控制 消除了一些混杂 如果我们今天重复J Lind的研究 在统计设计的上还需要做到以下几点 1 研究对象的定义与纳入标准和排除标准2 足够多的观察对象3 效应指标的选择4 结论是否能外推 4 非常痛心地看到 因为数据分析的缺陷和错误 那么多好的生物研究工作面临着被葬送的危险 F Yates M J R Healy 医学论文中的统计问题统计知识的运用撰写论文 报告自己观察或实验的研究结果阅读论文 吸收新知识 了解学术进展1996年 对申报科技成果的4586篇科研论文分析 统计方法使用率为76 医学论文中统计运用错误 除了影响论文的科学性 还可能导致严重的伦理学问题 5 统计学方法用于干预试验1835年 法国医生P C A Louis对当时流行的 放血 疗法治疗肺炎的效果进行了比较 发现 放血 的疗效不象预期的那么好 而且早期 放血 和晚期 放血 组比较 患者的诊断 病情 病程 年龄等方面的差异很大 比较平均治愈时间意义不大 因为晚期 放血 组的平均治愈时间长 但该组患者病情重 病程长 年龄大 Louis对医学研究的方法学作出了很大贡献 1 用数字的方法表示不同疾病患者的特征和预后 2 提出了临床疗效对比的前瞻性原则 3 提出抽样误差和混杂 confounding 概念 其中前瞻性研究和减少混杂 分别成为当今临床试验和流行病学研究的基本研究方法 4 在J Gavarret的协助下 Louis的数字方法发展为 概率框架 Gavarret也于1840年在巴黎出版了世界第一部医学统计学教科书 6 非常痛心地看到 因为数据分析的缺陷和错误 那么多好的生物研究工作面临着被葬送的危险 F Yates M J R Healy 医学论文中的统计问题统计知识的运用撰写论文 报告自己观察或实验的研究结果阅读论文 吸收新知识 了解学术进展1996年 对申报科技成果的4586篇科研论文分析 统计方法使用率为76 医学论文中统计运用错误 除了影响论文的科学性 还可能导致严重的伦理学问题 7 调查结果反映了医学论文作者统计知识和统计水平的低下 也再次强调了生物统计学者不是令人生畏的检查官 恰恰相反 生物统计学者是我们的可贵盟友 生物统计学不是远离我们的数学 而是现代医学的一门基本学科 就像大厦中的一个支柱 JAMA的编辑部 60年代到80年代 国外医学杂志调查结果 有统计错误的论文20 72 1984年对 中华医学杂志 中华内科杂志 中华外科杂志 中华妇产科杂志 中华儿科杂志 595篇论文的调查结果 相对数误用为11 2 抽样方法误用15 9 统计图表误用11 7 1996年对4586篇论文统计 中华医学会系列杂志占6 9 数据分析方法误用达55 7 8 科学容不得半点虚假 造假者一旦被揭露就背上了永远洗脱不掉的耻辱 伪造统计数据违反科学道德据1976年NewScience杂志关于科研舞弊行为的调查74 的调查表反映有不正当修改数据的情况 其中 17 拼凑实验结果 7 凭空捏造数据 2 故意曲解结果 就统计学本身来说 正确实验设计得出的统计结果 是用P值作为 重现性 的概率保证 P 0 05 就是说实验结果显示的差别是机遇所致的可能性不足5 或者说 别人在同样的条件下重复同样的试验 得出相反结论的可能性不足5 9 1 采用统计学方法 发现不确定现象背后隐藏的规律 变异 variation 是社会和生物医学中的普遍现象 变异使得实验或观察的结果具有不确定性 如每个人的身高 体重 血压等各有不同 一 为什么要学统计学 10 最大值 6 18 最小值 3 29 极差 2 89 算术均数 4 72 标准差 0 57 11 2 用统计学思维方式考虑有关医学研究中的问题 阳性 结果是否是虚假联系 某感冒药治疗1周后 治愈率为90 能否说该感冒药十分有效 阴性 结果是否是样本含量不足 有人曾对发表在Lancet NEnglJMed JAMA等著名医学杂志上的71篇阴性结果的论文作过分析 发现其中有62篇 93 可能是由于样本含量不足造成的假阴性 12 如 当专业上有一定联系的两个变量之间的变化呈 S型 或 倒S型 曲线趋势时 若错误地用直线方程去描述 从统计学角度看效果也很好 但在专业上是解释不通的 再比如 某两个统计量 如均值 率等 之间的差别在统计学上有显著性意义 有时在专业上并无实用价值 如某种新的降压药 平均降低血压2mmHg 若样本含量较大 误差又较小 统计检验可能会得到 P 0 05 的结果 但在临床上却认为此新药的疗效没有多大提高 另外 在运用统计学中 稍有不慎都可能犯这样或那样的错误 因此 统计结论的可靠性仍需通过实践去检验 所以 应当牢记 运用统计学时必须结合医学实际 才能真正发挥统计学应有的作用 13 例 某医生用一种新的治疗某病的疗法 简称治疗组 用现在公认的疗法作为对照 简称对照组 经临床试验 对照组和治疗组的疗效分别为P1 75 与P2 95 问 能认为这两个有效率之间的差别有显著性意义吗 答 这两个有效率之间的差别可能有统计学意义 也可能没有统计学意义 因为其结论不仅取决于二者之差的绝对值大小 更主要的是取决于随机误差的大小和样本大小 千万不可轻率地作出统计推断 现假定这两个有效率分别来自下列甲 乙 丙三批实验的结果 则具有下列3种不同的统计检验结果 表1 1 14 表1 两个有效率的比较 甲实验中 P1与P2之间的差别无统计学意义 校正 2 1 765 P 0 05 乙实验中 P1与P2之间的差别有统计学意义 2 6 275 0 01 P 0 05 丙实验中 P1与P2之间的差别也有统计学意义 2 9 412 P 0 01 15 16 3 保证你的研究论文能通过统计学审查据国外60 80年代对不同医学杂志发表论文的调查 有统计错误的论文的百分比最高达72 最低也有20 国内1984年对 中华医学杂志 中华内科杂志 中华外科杂志 中华妇产科杂志 中华儿科杂志 595篇论文的调查结果 相对数误用为11 2 抽样方法误用15 9 统计图表误用11 7 某研究者1996年对4586篇论文统计 中华医学会系列杂志仅占6 9 数据分析方法误用达55 7 17 2020 4 24 JAMA 新英格兰医学杂志 NEJM 英国医学杂志 中华医学会杂志对来稿都有统计学要求或统计学指导 国际生物医学杂志编辑协会在其 生物医学期刊投稿的统一要求 中也包含了统计学要求 UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournalshttp www acponline org 18 中华医学杂志 对来稿中统计学处理的有关要求1 统计研究设计 应交代统计研究设计的名称和主要做法 如调查设计 分为前瞻性 回顾性或横断面调查研究 实验设计 应交代具体的设计类型 如自身配对设计 成组设计 交叉设计 析因设计 正交设计等 临床试验设计 应交代属于第几期临床试验 采用了何种盲法措施等 主要做法应围绕4个基本原则 随机 对照 重复 均衡 概要说明 尤其要交代如何控制重要非试验因素的干扰和影响 2 资料的表达与描述 用x和s表达近似服从正态分布的定量资料 用M Q 表达呈偏态分布的定量资料 用统计表时 要合理安排纵横标目 并将数据的含义表达清楚 用统计图时 所用统计图的类型应与资料性质相匹配 并使数轴上刻度值的标法符合数学原则 用相对数时 分母不宜小于2O 要注意区分百分率与百分比 3 统计分析方法的选择 对于定量资料 应根据所采用的设计类型 资料所具备的条件和分析目的 选用合适的统计分析方法 不应盲目套用t检验和单因素方差分析 对于定性资料 应根据所采用的设计类型 定性变量的性质和频数所具备的条件以及分析目的 选用合适的统计分析方法 不应盲目套用 2检验 对于回归分析 应结合专业知识和散布图 选用合适的回归类型 不应盲目套用简单直线回归分析 对具有重复实验数据的回归分析资料 不应简单化处理 对于多因素 多指标资料 要在一元分析的基础上 尽可能运用多元统计分析方法 以便对因素之间的交互作用和多指标之间的内在联系进行全面 合理的解释和评价 4 统计结果的解释和表达 当P 0 05 或P 0 01 时 应说明对比组之间的差异有统计学意义 而不应说对比组之间具有显著性 或非常显著性 的差别 应写明所用统计分析方法的具体名称 如 成组设计资料的t检验 两因素析因设计资料的方差分析 多个均数之间两两比较的q检验等 统计量的具体值 如t 3 45 X2 4 68 F 6 79等 应尽可能给出具体的P值 如P 0 0238 当涉及到总体参数 如总体均数总体率等 时 在给出显著性检验结果的同时 再给出95 置信区间 19 4 获得循证医学证据的主要手段 良好愿望的医学 well meaningmedicine 转入 以证据为基础的医学 evidence basedmedicine EBM 需要有统计学方法的支持 全世界的医学期刊每年大约刊登600万学术论文 但能作为可靠 证据 的论文并不多 20 二 医学科研的基本要素 医学科研由三个基本部分组成 即处理因素 studyfactor 受试对象 studyobject 和实验效应 experimentaleffect 例如 观察流甲丙脯酸对肾性高血压患者的疗效 其中 疏甲丙脯酸为处理因素 肾性高血压患者为受试对象 动脉压变化为试验效应 通常将这三个组成部分称为医学科研的基本要素 如何正确选择三个要素 是科研设计的关键问题 Studyfactor Studyobject Experimentaleffect 21 1 医学研究设计的基本原理 降压药 高血压病人 血压值 T s e T S e 基本模式 T s1 e1 20mmHg O s2 e2 5mmHg T O e1 e2 20 5 T e 15mmHg 处理因素的作用被单独的显示 统计分析的思维 在排除或控制了一些可能影响实验效应的因素后 以概率为基础计算其差异是否为随机误差 偶然性结果 从而推断处理因素 或暴露 的效应是否不为零 处理效应 暴露 目标人群 发病风险 研究假说 处理效应不为零统计假设 处理效应为零 22 医学科研类型由于不同的科研目的 有多种不同的分类方法 如 按科技活动类型分为基础研究 应用研究和开发研究 发展研究 按照医学中各专业的属性 可分为 基础医学科研 临床医学科研 预防医学科研 社会医学科研 包括卫生事业管理学研究和医学心理学科 一般来说 医学科研的分类 常按设计类型的不同 分为以下几种基本类型 图1 1 23 24 2 医学研究设计的4个基本原则 重复 随机 对照 均衡是实验设计的4个基本原则 在实验设计中务必要严格遵守 否则 实验研究结果的可靠性将大受影响 所谓重复 就是实验因素各水平组合下要有足够的样本含量 因为统计学研究的是随机现象的变化规律性 重复次数少 内在规律表现不出来 在统计学上可根据设计类型选用相应的样本含量估算公式进行计算 所谓随机 就是每一个实验单位都有同等的机会被分配到任何一个组中去 分组的结果不受人为因素的干扰和影响 在统计学上有许多实现随机化的具体方法 应当严格实施 千万不可用 随便 取代随机 25 所谓对照 就是要设立参照物 因为没有对比 就无法鉴别优劣 例如 要考察一种新的抗癌药的疗效如何 必须设立一个对照组 在对照组里的癌症患者 可以什么抗癌药都不用 称为空白对照 在临床上应当慎用这种对照 亦可以用现在公认的最好抗癌药作为对照药 称为标准对照 在研究干预措施的效果时 直接观察到的往往是多种因素的效应交织在一起的综合作用 而合理的对照能成功地将措施的真实效应客观 充分地识别出来 使研究者得以做出正确评价 一般来说 设立对照可以最大可能地避免下列因素或现象对临床试验研究结果的影响 不能预知的结局 unpredictableoutcome 由于人类认识的局限性 干预效应受一些目前未被认识的潜在未知因素的影响 向均数回归 regressiontothemean 在临床实践中 有些极端的临床症状或体征有向均数回归的现象 所谓均衡 就是要设法使各条件 即实验因素的各水平组合 下的受试对象受到非实验因素的干扰和影响的机会和数量基本相等 这样一来 由各组受试对象反映出来的实验效应才能较为客观地体现出实验因素取不同水平时所产生的效果 26 3 1 1选用的样本含量不当 实例3 1 用一个健康人作为受试对象 1 原作者的设计 结果与结论 某研究者为了证明A HP 1000型超声诊断仪 B 研究者自制的成像系统 两台仪器测定的结果无差别 作了如下的实验设计 选一个健康人作为受试对象 用A B两台仪器前后两次 间隔为1个月 对此人分别重复测定4次 观测的定量指标分别是 二尖瓣前叶EC幅度 左室后壁运动幅度 R R间期 数据处理方法是 每个指标下有4组数据 既作了方差齐性检验 又作了配对比较的t检验 P值均大于0 1 结论 两台仪器的测定结果无差别 可用自制的成像系统取代费用很高的同类进口仪器 3 实例与释疑 27 2 对差错的分析 要得出两台仪器的测定结果的差别无显著性意义的结论 仅凭对1个健康受试者4次重复测定数据进行比较 证据不足 因为在实际操作中 每台仪器每天要测定多个受试者 由于不同受试者之间存在很大的个体差异 两台仪器对某1个人的测定结果之间无差别 并不能推出在多数人身上测定的结果之间的差别也一定无显著性 3 释疑 本研究涉及3个因素 其中1个是实验因素 即仪器 另外两个是区组因素 即测定时间和受试对象 故应选用交叉设计安排实验 若重复测定的结果之间变异度较小 样本含量n 6或8即可 反之 n应取10例或更多一些为宜 若从文献上查到交叉设计样本含量估计公式 按公式计算出n值 则更为妥当 28 3 1 2随机化观念淡漠 实例3 2 根据病情和就诊先后顺序分组 1 原作者的分组方法 某研究者在已发表的论文 120例肩周炎不同疗法的对比研究 中明确交代病人分组的方法 即 根据病情和就诊先后顺序分组 每组40人 2 对差错的分析 这显然是忽视了受试对象的分组应遵守 随机化原则 的要求 因为随机化是削弱或消除非试验因素对试验结果干扰和影响的重要措施之一 病人就诊的先后顺序 往往暗示其病情不同 尤其是当病人的病情轻重难以判断时 若将先来就诊者分在一组 后来就诊者分在另一组 就不可避免地引入顺序误差 即一组病人的病情较另一组病人的病情重 从而得出错误结论 29 3 释疑 影响肩周炎治疗效果的因素除了治疗方法以外 与病情 患病时间的长短 日常运动情况 年龄等因素也都有关 在制定实验设计方案时 应将这些重要的非实验因素一并考虑在内 用随机化法使分入各治疗组的病人在上述重要非处理因素上尽量达到均衡一致 以便提高组间的可比性 下面介绍一个简便的方法 用于尽可能排除若干个重要非处理因素干扰的条件下 对依次前来就诊的患者进行动态分组 此法称为 不平衡指数最小的分配原则 设患者陆续入院 多个患者同时入院时 可随机地给每位患者编个序号 新患者的分组是根据其情况和已分组患者的状况来确定的 目标是使每次分配的结果均为各组间达到当时情况下的最好平衡程度 其平衡指标是 不平衡指数 现举例说明如下 30 假定对肩周炎患者分两组时考虑病情 轻 中 重 患病时间 短 长 和日常运动量 少 多 三个重要的非处理因素 再假定治疗组和对照组各有了一个患者 他们的基本情况如表3一7a 所示 第3位来的是一位新患者 病情重 患病时间短 日常运动量多 问将此新患者分入哪个组中为好 试着将新患者分别分入治疗组和对照组 取不平衡指数较小者所对应的分配方案 分别参见 表3 7 b 和 表3 7 c 因4 7 故本例应取表3 7 b 作为分配结果 若再有新患者 分配方法相同 假如有多个 k 2 治疗组 可分别与对照组比较 求 k 1 个 不平衡指数 之和 取和最小的分配方案 31 表3 7 a 两例患者的基本增况及分组后的平衡程度 32 表2一7 c 将此名新患者分人对照组后的平衡情况 返回 33 表2 7 b 将此名新患者分人治疗组后的平衡情况 返回 34 3 1 3设立对照组方面存在的问题 实例3 3 缺乏适当的对照组 1 原作者的做法 某医生为说明本医院在食管癌手术方面取得了很大的成功 将本医院与其他国家和地区个同年份的食管癌手术切除率及手术死亡率资料用一览表显示出来 并用统计分析方法对这些率进行比较 得出结论 2 对差错的分析 没有合理的实验设计 做手术的年代 条件等情况差距很大 又缺乏适当的对照组 因而组间缺乏可比性 3 释疑 在用统计方法对数据进行分析之前 一定要考察组间是否具有可比性 有无适当的对照组 本例实际上选用的是 历史和中外对照 其数据仅供参考 不适合进行统计分析 更不应作出本医院食管癌手术切除率及手术死亡率显著地低于某某国家和地区的相应指标的结论 35 实例3 4 假对照 1 原作者的设计 结果及结论 某人在研究某药物治疗铅中毒后的驱铅效果时 设计了如下的实验 见表3 8 结论 此药有明显的驱铅作用 2 对差错的分析 本研究试图利用前后对照来说明此药的驱铅效果 统计分析的结果清楚地显示两组之间的差别具有非常显著性 但这不能说明此药具有驱铅作用 因为患者脱离现场后即使不治疗亦有尿铅排出 实际上此研究成了具有 假对照 的研究 3 释疑 如果仅有一种治疗方法需考察其疗效 就必须有不给予任何治疗的空白对照组 但在这个具体问题中显然是行不通的 如果患者都必须接受某种治疗 那么 就必须具有两种或两种以上的不同治疗方法 现设有k种不同的治疗方法 可将全部中毒患者随机地分成k组 各组例数最好相等 分别用k种不同的方法治疗 比较其疗效之间的差别是否有显著性意义 36 表3 830名铅中毒工人脱离现场后住院治疗的结果 返回 37 实例3 5 对照不全 1 对照组的设立 有人研究某杀虫药对粮食污染的严重程度 用某种动物作为受试对象 实验分组如下 用污染米作饲料 用污染带糠皮米作饲料 用未污染米作饲料 将全部受试对象完全随机地分入3个实验组中去 每组均有足够多的受试对象 实验一段时间后 测定动物体内某些定量指标 以反映本地区粮食污染程度 2 对差错的分析 本实验设计虽然比较全面地按照实验设计的4项原则实施了 但在对照组的设立上存在 对照不全 的问题 因为实验结果经统计学处理后有多种可能的结局 若结局是 与 之间的差别无显著性意义 而 与 之间的差别有显著或非常显著性的意义 就判断不出是因污染引起的 还是因食用了带糠皮米造成营养不良所引起的 38 3 释疑 在设立对照组时 不要以为只要有了对照组 其结果就一定有说服力 还必须使对照组具有完备性 即无论统计分析的结果如何 只要其他条件均符合统计学的要求 就一定能作出比较明确的判断 不会因某些因素的水平组合不全 而使结论含糊不清 从实验因素及其水平的角度来看 本例实际上涉及两个实验因素 它们各取两个水平 即因素A为 饲料污染与否 它的两个水平分别是污染和未污染 因素B为 饲料类型 它的两个水平分别是米和带糠皮米 它们共有4种水平组合 而原作者只用了其中的3种 也就是说 还应设立一个组 即 用未污染带糠皮米作饲料 这样 对照组的设立才比较完善 39 2 1 4组间均衡性较差 实例3 6 组间基础状况缺乏可比性 1 原作者的设计 结果及结论 有人在研究耐力训练与提高战士体质的关系时 设计了如下的实验 以血乳酸为主要观察指标 用20名连队的战士按训练方案进行耐力训练 以机关同龄的20名战士为对照 对照组进行日常活动 观察经4周训练后 两组战士进行一定量的运动时血乳酸的变化 结果见表2 9 2 对差错的分析 对照组选择不合理 对照组除训练因素外 其他应尽可能与试验组一致 而机关兵和连队的战士由于工作性质不同 体能的基础可能存在较大的差别 一开始两组之间就不具备可比性 3 释疑 此研究回答了一个问题 即耐力训练提高了战士的耐力 这种结论毫无意义 因人们早就认识到了训练和不训练不一样 应研究不同训练方案对提高战士体质之间的差别有无显著性意义 以探索最大限度地提高战士体质的最佳方案 另外 分组时 连队战士和机关战士都应随机抽取 然后将各自的总样本含量的一半随即分入试验组和对照组 40 表2 9两组战士训练前后血乳酸的观测结果 返回 41 2 2忽视混杂因素的干扰 实例2 7 未排除混杂因素的干扰 1 历史的教训 以前的许多研究表明 血清甘油三酯的含量与冠心病危险性有关 即甘油三酯的含量越高 患冠心病的危险性就越大 有的医生以此筛选危险人群 2 对差错的分析 甘油三酯的含量与冠心病的危险性之间并非直接有关 没有良好的试验设计 仅凭事物之间现象上的联系 就作出推断 得出肯定结论 往往是很谎谬的 3 释疑 后来的研究表明 冠心病还与其他因素有关 特别是血清中高含量胆固醇和低含量的高密度脂蛋白 它们 就是混杂因素 常与冠心病同时发生联系 当这种混杂因素的水平在对比的两个组 指甘油三酯的含量高与低两个组 之间差别较大时 将起着支配作用 而表现形式可能是 甘油三酯的含量高 这一假象 采用严格的试验设计平衡了其他因素的作用后 发现甘油三酯的含量与冠心病发病的危险性之间的联系就不复存在了 冠心病 甘油三酯 胆固醇 高密度脂蛋白 虚假联系 42 实例2 8 处理因素的水平定义不准确 1 原作者的设计 结果及结论 某人在研究适应对高原冻伤的影响时设计了如下的实验 足够的受试动物被随机分成两组 一组进行低氧适应 另一组为对照组 动物对低氧适应后 两组动物同时暴露于模拟的高原寒冷环境 观察冻伤面积 血液流变学及病理学的变化 结果见表2 10 2 对差错的分析 原研究者得出的结论似乎与专业知识相反 引起争议 问题在于将处理因素的两个水平简单地定义为 适应与未适应 即对照 而适应组应当包括 低氧和寒冷 两个方面 它是一种复合因素 从专业上分析 由于低氧适应后 血液中红细胞增加 血粘度提高 影响了微循环的血流 加重了冻伤程度 3 释疑 要想研究适应对高原冻伤的影响 适应组动物应对低氧和寒冷复合因素进行适应 或许能得到符合专业知识的结论 43 表2 10两组4项指标的观测结果 返回 44 实例2 9 张冠李戴 1 对照组的设立 有人希望通过临床试验回答 松球对慢性气管炎有无疗效 设立了如下两个组 空白对照组 松球十麻黄十地龙 组 2 对差错的分析 即使实验结果经统计学处理得出两组疗效之间的差别有非常显著性的意义 也无法推断是松球的功劳 因为由医学知识得知 麻黄十地龙 对慢性气管炎有一定的疗效 很可能真正起作用的成分是 麻黄十地龙 而不是 松球 这实际上是张冠李戴 即佐药可能有一定的疗效 而松球反倒无效 3 释疑 要想回答原作者提出的问题 最好设立4个组 即 空白对照组 单用松球组 麻黄十地龙 组 松球十麻黄十地龙 组 这样不仅可以看出单用松球的疗效 又可看出 麻黄十地龙 的效果 还可看出松球与 麻黄十地龙 合用有无协同作用 45 三 统计分析的意义 有些论文中的资料十分丰富 既有多因素又有多指标 遗憾的是有些作者未对资料作统计分析就作出了结论 有些虽然作了统计分析 但一般仅作单因素分析 并且 所选用的分析方法还不完全得当 由于统计软件日趋普及 人们可以利用科学的统计分析方法 对同一份资料进行更深入的的分析 这有助于更好地发掘资料中所蕴藏的信息 揭示资料间的相互关系和内在规律性 对于同一份实际资料 由于研究的目的 观察的角度不同 所选用的统计处理方法也会不尽相同 用多种统计分析方法对资料进行多层次 多侧面的综合处理 尽量挖掘各方面的信息是十分必要的 也是完全可能的 46 对资料作统计分析时 可从以下几个方面考虑如何合理选择各种统计分析方法 其一 资料类型与描述统计量的选择 资料一般可分为定量与定性两大类 定量资料可细分为计量和计数两种 定性资料可细分为有序和无序 名义 两种 描述定量资料常用的统计指标有 平均指标 变异指标 分位数等 描述定性资料常用的统计指标有绝对数和相对数等 按变量测量的精确程度由低到高 将数据分类为 名义数据 如性别 婚姻状况 有序变量 如疗效 类别间差别大小难以度量 区间变量 如摄氏体温 类别间差别有实际意义 比变量 如身高 除具有区间变量的特征外 还具有真实意义的零点 摄氏温度的零点为水结冰时温度 并非绝对意义的零点 所以它不属于比变量 47 其二 资料类型与区间估计的选择 常用于定量资料的区间估计方法有个体值的容许区间 医学上亦称 正常值范围 及总体均值 或其他特定参数 的可信区间 常用于定性资料的区间估计方法是总体率的可信区间 其三 资料类型与统计分析方法的选择 一般来说 当分组变量为定性变量 指标 或结果 变量为定量变量时 常用的统计分析方法有t检验 Z检验 方差分析 亦称F检验 和秩和检验等 当分组变量和指标 或结果 变量均为定性变量 包括由定量变量转化而产生的 时 常用的统计分析方法有卡方检验 秩和检验 Ridit分析 线性趋势检验等 其四 处理多因素多元资料的常见统计分析方法有多元回归分析 多元方差和协方差分析 聚类分析 主成分分析 因子分析 典型相关分析等 48 四 资料统计分析中常见的错误 在对实际资料进行分析时 从统计分析的角度看 常见的错误是 对资料未作统计处理就下结论 多元 或多因素 的资料用一元 或单因素 统计分析方法处理 导致资料的利用率低 不能反映资料的整体情况 不能很好地揭示变量之间的交互作用和内在联系 49 实例一误用t检验 1 原先的设计 资料 统计分析方法 结果和结论 某研究者试图研究献血者与对照者骨矿含量之间的差别 测定了101名献血者和2041名对照者 即非献血者 的骨矿含量 并记录了他们的性别和年龄 最后 将年龄分为 20 29 30 39 40岁 3个组 进而按 性别 年龄分组 献血与否 3个定性因素编制统计表 见表8 1 性别和年龄分组进行组合 共有6种情况 然后 用t检验比较每种情况下的献血者与对照者骨矿含量均值之间的差别是否有显著性意义 50 表8 1按性别和年龄分组后献血者对照者骨矿含量的均值和标准差 51 2 差错的分析 年龄本是一个定量的观测指标 最好直接利用 可提供更多的信息 原作者将年龄分为3组 有人为因素的作用 因为分组方式不同 结果就可能不一样 从合理编制统计表的角度看 表的标目安排欠妥 因为受试对象的属性分组 即献血者与对照者 是本研究中的主要定性因素 未将它置于表的醒目位置上 修改后的表见8 2 52 表8 2献血者与对照者的性别 年龄及骨矿含量的均值和标准差 53 统计分析方法选用得很不合理 因为根据表中所列的项目看 骨矿含量的高低至少受到3个因素 即是否献血 性别 年龄 的影响 在由性别与年龄组合而形成的6个组中分别进行t检验 似乎消除了性别和年龄的影响 很合理 但无法考察因素之间的交互作用 况且 进行多次t检验 会明显增大犯假阳性错误的概率 从实验设计的角度看 也存在问题 鲜血者年龄大的人数较少 而对照者中年龄大的人数较多 受试对象在年龄组间的人数构成上均衡性较差 54 3 释疑 本资料若按上表形式选用统计分析方法 应选用三因素析因设计资料的方差分析 资料需满足正态性和方差齐性 否则 应设法进行变量转换 以便考察因素之间的交互作用 若在专业上有理由认为三因素对骨矿含量的影响有主次之分 就应将其看作是三因素系统分组 或嵌套 设计 并运用相应的方差分析方法处理资料 若原始资料未丢失 最好按表8 3的格式整理资料 55 对于像表8 3这样的原始资料 最适合运用计算机处理数据 若分析的目的是为了比较鲜血者 符号为 y 与对照者 符号为 n 骨矿含量均值之间的差别是否有显著性意义 同时希望排除性别 定性因素 和年龄 定量因素 的干扰和影响 就应当选用成组设计资料的多元协方差分析 若分析的目的是为了根据 献血与否 性别 年龄 的不同取值 去预测骨矿含量 并进一步考察这3个变量在预测骨矿含量上是否有显著性意义 就需要选用多元线性回归分析 若通过前述方法分析后得知献血者与对照者的骨矿含量之间的差别具有显著性意义 其数量在专业上也是不可忽视的 此时 还可运用判别分析建立判别函数式 用以判别一个新的个体属于鲜血者还是对照者 其方法是将此新个体的性别 年龄和骨矿含量 假定它们都是具有显著性判别能力的指标 数据代入已求得的判别函数 根据其计算结果便可作出判别 56 表8 3献血者与对照者的性别 年龄和骨矿含量的测定结果 57 实例二忽视t检验的前提条件 1 原先的设计 资料 统计分析方法 结果和结论 原作者将直肠癌根治术后会阴伤口感染的42例 按随机法分喷氧组 A组 21例 常规换药组 B组 21例 经治疗后观察伤口愈合时间 结果见表8 4 原作者采用t检验 结论是 A组伤口愈合时间平均9 48d B组伤口愈合时间平均22 57d A组与B组伤口愈合时间平均缩短13d 经统计学t检验p 0 001 有显著性差异 58 表8 4A组与B组治疗结果 59 2 对差错的分析 资料不符合作t检验所要求的两个前提条件 即 正态性及方差齐性 3 释疑 将原计量资料转化有序列联表资料 表8 5 因B组内有9例患者 伤口愈合时间 不够具体 无法按定量资料来作统计分析 又因为两组的例数都较少 故采用秩和检验较合适 得 HC 15 9495 P 0 0001 可以认为两组的伤口愈合时间之间的差别有非常显著性意义 具体地说 B组伤口愈合天数较长 60 表8 5A组与B组伤口愈合情况比较 61 五 多变量分析与单变量分析多变量分析是对m个反应变量进行一次假设检验 HotellingT2检验或MANOVA 对组间差别作出推断 在大多数情况下 多变量假设检验结论与对m个反应变量进行m次单变量假设检验 t检验或ANOVA 的结论是一致的 即多变量假设检验拒绝H0 m次单变量假设检验至少有一次拒绝H0 SPSS SAS等统计软件也是先给出多变量假设检验结果 再给出单变量假设检验结果 作为多变量分析的补充 62 例 某妇幼保健院将孕妇随机分两组 一组接受孕期保健教育 另一组作为对照 表14 3是同一日出生的13名顺产婴儿的体重和身长 问孕期保健教育对婴儿生长发育有无促进作用 表中用两个指标反映婴儿的生长发育状况 通过孕期保健教育组和对照组婴儿样本均数比较 推论两组总体均数 1和 2是否相等 进而得出孕期保健教育对婴儿体格发育有无影响的结论 63 体重 t 2 35 p 0 038身高 t 1 99 p 0 071 64 理论上单变量假设检验不能代替多变量假设检验 主要理由 m次单变量假设检验增加假阳性错误的概率 设每次单变量假设检验的检验水准定为a 做完m次检验I类错误的概率增加为am 1 1 a m 单变量假设检验只说明某一变量在数轴分布上的组间差别 不能反映多个变量在平面或空间上的差别 两者的意义不同 各自说明各自的问题 不能相互代替 如表14 8的两组数据 分别对两组新生儿出生时的体重与身长做单变量t检验 体重t 2 35 p 0 038 身长t 1 99 p 0 071 结论不明确 但多变量的HotellingT2检验 T2 9 87 F 4 58 P 0 03 拒绝H0 1 2 两组在平面分布上差别如图14 1所示 65 二组的平面分布 66 二组的空间分布 67 六 充分利用现有的监测或体检数据 信息量大 范围广 指标多 时间跨度长缺乏系统设计无质量控制缺省值多不能满足特定的研究 68 体检数据实例 69 高血压监测数据 70 一 分析的计划和步骤1 资料的整理原始数据往往是不能直接进行分析的 根据资料的类型和目的 将资料整理成所需要的形式 整理过程包括 1 原始体检表格的整理 核对 2 资料数据库的建立和资料输入根据样本大小可选择合适的软件建立数据库 资料输入时最好设计能自我纠错的功能 资料输入需要恰当的编码 2 统计描述描述体检对象的一般特征 如计算不同年龄 性别 职业 疾病类型的构成比 计算疾病发病频率指标 患病频率指标 死亡频率指标等等 3 统计推断统计推断主要是计算相关的指标 如比值比 患病率等 并进行假设检验 假设检验的方法既有单因素分析方法 也有多因素分析方法 如 2检验 回归分析等 根据资料的类型 还可选择分层分析 71 二 充分利用丰富的监测或体检资料 1 一组体检资料的背景介绍 某体检中心收集了一批体检者的多项体检指标 其中是否有冠心病 G 性别 X1 年龄 X2 是否有高血压 X3 是否吸烟 X4 胆固醇含量 X5 甘油三酯含量 X6 低密度脂蛋白含量 X7 高密度脂蛋白含量 X8 脂蛋白 含量 X9 载脂蛋白A1含量 X10 载脂蛋白B含量 X11 基因型XbaI X12 基因型EcorI X13 用药情况 X14 资料的格式如表1所示 72 表1多项指标的体检结果 73 2 如何充分利用丰富的体检资料 有些人仅运用简单的统计分析方法处理多因素多指标的体检资料 例如 求一组定量指标的均值和标准差 用t检验分析某定性分组变量的某两个水平对定量观测结果的影响是否显著 用简单的直线相关和回归分析方法研究某两个定量指标之间的直线相关关系和直线回归关系等 这样一来 将会牺牲大量有用的信息 得到一些支离破碎 有时甚至是错误的结论 体检资料往往都是非常丰富的 它不仅包含有定性指标 也包含有定量指标 如何充分利用丰富的体检资料 发掘资料中所蕴藏的各种有用信息 尤其要注意揭示变量之间的内在联系 是一个值得重视的问题 74 3 根据研究目的合理选用统计分析方法 下面先给出研究者希望达到的一系列目的 并逐一选择相应的统计分析方法 1 对冠心病人而言 直接分析某种基因型取不同水平时7项血脂指标的均值和均值向量之间的差别有无显著性意义 2 对冠心病人而言 同时分析 性别 吸烟史 高血压史 某种基因型 对7项血脂指标的均值和均值向量的影响有无显著性意义 75 3 对冠心病人而言 在设法排除 年龄 性别 吸烟史 高血压史和用药情况 等因素影响的前提下 分析某种基因型取不同水平时7项血脂指标均值之间的差别有无显著性意义 4 对冠心病人而言 试对7项血脂指标间的内部从属性作客观评价 5 对冠心病人而言 试对7项血脂指标间的亲疏关系作客观评价 6 对冠心病人而言 假定病情轻重可通过7项血脂指标来很好地反映出来 试根据7项血脂指标的数据 将它们划为3组 以便作出关于病情 轻 中 重 的评判 可有的放矢地采取不同方案对不同病情的患者进行治疗 76 7 利用正常人与冠心病人的7项血脂指标数据 建立一种方法 用来对一个怀疑患有冠心病的就诊者进行辅助诊断 8 利用正常人与冠心病人的全部资料 建立一种方法 筛选出冠心病的危险因素 并且 当各危险因素在其取值范围内分别取某确定值时 预报某人患冠心病的概率有多大 77 4 分析 为回答上面的第1个问题 需要明白 基因型是一个定性的分组变量 而7项血脂指标都是定量的观测指标 通常把定性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论