医学论文中定量资料统计分析方面的错误辨析与释疑_第1页
医学论文中定量资料统计分析方面的错误辨析与释疑_第2页
医学论文中定量资料统计分析方面的错误辨析与释疑_第3页
医学论文中定量资料统计分析方面的错误辨析与释疑_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中西医结合学报2007年7月第5卷第4期Journal ofChinese Integrative Medicine,July 2007;Vol5,No4 医学论文中定量资料统计分析方面的错误辨析与释疑 胡良平 ,刘惠刚。 1军事医学科学院生物医学统计学咨询中心,北京100850 2首都医科大学基础医学院,北京100069 关键词:统计学;医学;论文;统计分析;非参数统计 中图分类号:O212;文献标识码:A;文章编号:16721977(2007)04048104 Discrimination and interpretati0n of errors in statistical analysis of quanti- tative data in medical papers Liangping HU ,Hui-gang LIU 1Consulting Center of Biomedical Statistics,Academy of Military Medical Sciences,Beijing 100850,China 2College of Basic Medicinal Sciences,Capital University of Medical Sciences,Beijing 100069,China Keywords:statistics;medicine;dissertation;statistical analysis;statistics,nonparametric 1问题的提出 在医学论文或稿件中,若观测结果是定量资料, 常需要在不同实验条件下比较其平均值之间的差别 是否具有统计学意义,此时,称为定量资料的统计分 析。如何才能正确地实现定量资料的统计分析呢? 关键是两点:其一,检查定量资料是否满足参数检验 的前提条件;其二,正确辨析定量资料所对应的实验 设计类型。第一点常可通过统计软件来实现,而第二 点则需要分析资料的人具有这方面知识,才有可能合 理选择统计分析方法。然而,只要科研课题涉及到两 个或两个以上因素时,实际工作者能正确判定其实验 设计类型的场合少得可怜,因此,在医学论文或稿件 中,这方面的错误不计其数。概括起来说,不外乎有 以下两类错误:(1)当定量资料不满足参数检验的前 提条件(独立性、正态性和方差齐性)时,盲目套用参 数检验方法(通常为特定设计下定量资料的t检验或 方差分析);(2)不管定量资料对应的实验设计类型是 什么,一律套用单因素两水平(或叫成组)设计定量资 料的检验方法(如t检验或秩和检验)或单因素多水 平设计定量资料的分析方法(如单因素多水平设计定 量资料的方差分析或秩和检验)。其结果是所得出的 结论可信度低,甚至是错误的 。 2 中西医结合治疗实例 例1 某lI缶床医生收集了如下的资料(表1),在 各组内进行配对设计定量资料的t检验,在任何两 组之间,用差量进行成组设计定量资料的t检验。 请问:错在哪?正确的做法是什么? 对差错的辨析与释疑 原作者的做法是错误 的!因为这样做割裂了整体设计,每次分析时,仅用 了部分数据,数据的利用低,自由度小,结论的可信 度低;无法分析药物种类与测定时间之间的交互作 用。正确的做法是:先检查资料是否具备参数检验 的前提条件,然后正确判定资料所对应的实验设计 类型。假定本例中的定量资料满足参数检验的前提 条件,而实验设计类型表面上看是“4个自身配对设 计”同时存在,应叫做“具有一个重复测量的两因素 Correspondence;ProfLiang-ping HU;TelE-mail:lphu812sinacorn 维普资讯 中西医结合学报2007年7月第5卷第4期Journa1 of Chinese Integrative Medieine,July 2007;Vol5,N。4 设计(其中,测定时间因素与重复测量有关,除此因 素之外,还有一个药物种类因素)”。正确的统计 分析方法为“具有一个重复测量的两因素设计定量 资料的方差分析”。对本例而言,更合适的分析策略 是:将“治疗前”视为“协变量”,即设法使各药物组治 疗前尽可能取相等的平均水平,从而推算出治疗后 的平均测定结果(称为校正的平均值),提高各药物 组之间的可比性,其统计分析方法叫做“单因素4水 平设计定量资料的一元协方差分析”(每次只分析一 个定量指标);若每次需要同时分析3个定量观测指 标,其统计分析方法可叫做“带有一个协变量的单因 素4水平设计定量资料3元方差分析”。 表1各组治疗前后肝功能检测结果比较 (js) 例2很多人用成组设计定量资料的t检验和 单因素多水平设计定量资料的方差分析处理表2资 料。请辨析:这样做错在哪里?为什么?正确的统 计分析方法是什么? 表2两组不同组织类型的NscLC肺部ROI的 Max SUV和Mean SUV比较 (js) 组刷 癌细胞类型例数 Max SUV Mean SUV 对差错的辨析与释疑 表2中最后两列为两个 定量的观测指标,原则上,当实验中涉及两个或两个 以上定量指标时,看专业上是否需要同时考察它们 的变化,若不需要,就视为两个一元定量资料;若需 要,就视为一个二元定量资料。关键是检查资料的 前提条件(此处从略)和正确判定定量资料所对应的 实验设计类型,以下就不再赘述了。 原作者所用的两种统计分析方法都属于分析单 因素设计定量资料的统计分析方法,是不正确的。 属于未正确辨析实验设计类型,就盲目套用统计分 析方法的一种坏习惯,其结论是不可信的。该定量 资料中涉及两个实验因素,一个是中医上的分型(非 血瘀证与血瘀证),另一个是癌细胞类型。两个因素 共有6种水平组合,各组合下都有一组独立的患者, 两个因素同时出现在实验中,尚无专业知识保证它 们对观测指标的影响谁是主要或次要,故这个定量 资料所对应的实验设计类型应叫做两因素析因设计 或叫23析因设计,当定量资料满足参数检验的前 提条件时,以选用相应设计定量资料的方差分析处 理为宜。 例3很多人用成组设计定量资料的t检验和 单因素多水平设计定量资料的方差分析处理表3资 料。请辨析:这样做错在哪里?为什么?正确的统 计分析方法是什么? 表3两组不同分期的NscLc肺部ROI的 Max SUV和Mean SUV比较 (js) 对差错的辨析与释疑 原作者所用的两种统计 分析方法都属于分析单因素设计定量资料的统计分 析方法,是不正确的。属于未正确辨析实验设计类 型,就盲目套用统计分析方法的一种坏习惯,其结论 是不可信的。该定量资料中涉及两个实验因素,一 个是中医上的分型(非血瘀证与血瘀证),另一个是 维普资讯 中西医结合学报2007年7月第5卷第4期Journal of Chinese Integrative Medicine,July 2007;Vo15,No4 疾病分期。两个因素共有8种水平组合,各组合下 都有一组独立的患者,两个因素同时出现在实验中, 尚无专业知识保证它们对观测指标的影响谁是主要 或次要,故这个定量资料所对应的实验设计类型应 叫做两因素析因设计或叫24析因设计,当定量资 料满足参数检验的前提条件时,以选用相应设计定 量资料的方差分析处理为宜。 例4很多人用成组设计定量资料的t检验和 单因素多水平设计定量资料的方差分析处理表4资 料。请辨析:这样做错在哪里?为什么?正确的统 计分析方法是什么? 表4各组肺组织病理图像分析结果比较 (js,“m ) 对差错的辨析与释疑 原作者所用的两种统计 分析方法都属于分析单因素设计定量资料的统计分 析方法,是不正确的。属于未正确辨析实验设计类 型,就盲目套用统计分析方法的一种坏习惯,其结论 是不可信的。 该实验共有8个实验组,每组中的1O只动物都 在三个区被检测某定量指标的结果,故“三个区”是 与重复测量有关的因素。要判断该定量资料所对应 的实验设计类型,关键是要弄清“组别”是一个实验 因素还是一个复合因素。显然,“组别”中涉及到很 多因素,如“是否建模”、“是否用药”、“用何种药”、 “用药种数”,这4个因素每个至少有2个水平,全面 组合至少应有16个小组,现在只有8个组,说明这 些因素的水平未全面组合,属于“多因素非平衡组合 实验”,而不是一个标准的多因素实验设计。 对于这种定量资料,应对“组别”进行合理拆分。 可能的拆分结果如下。 组合1:正常对照组与模型组; 组合2:模型组、丹参组、黄芪组、雷公藤组、氢 化考的松组、硫唑嘌呤组; 组合3:模型组、雷公藤组、硫唑嘌呤组、硫唑嘌 呤+雷公藤组。 将上述三种组合分别与三个区同时考虑,构成 不同的实验设计类型,具体地是,组合1叫做“具有 一个重复测量的两因素设计”,其设计格式见表5。 组合2也叫做“具有一个重复测量的两因素设计”, 其设计格式见表6。 表5两组肺组织病理图像分析结果比较 (j土s,“m。) 表6各组肺组织病理图像分析结果比较 (j土s,“m。) 药物种类 深染区 浅染区 无染区 模型 丹参 黄芪 雷公藤 氢化考的松 硫唑嘌呤 63 569土7 573 28 574土9 438 27 829土9 438 29 563土8 413 28 882士7 868 29 634土8 744 41 296土8 165 46 263土12 289 45 842土10 818 44 239士9 620 46 140士10 814 43 984士9 462 8 2 5 5 2 3 3 0 O O 6 7 3 6 O 4 5 5 士士士士士士 9 7 3 1 1 5 5 8 5 2 O O 3 3 5 4 2 6 7 6 7 7 6 7 维普资讯 中西医结合学报2007年7月第5卷第4期 Journal of Chinese Integrative Medicine,July 2007;Vol5,No4 组合3应叫做“具有一个重复测量的三因素设 计”,因为该组合中的4个实验分组本身形成了一个 22析因设计结构,再加上与重复测量有关的因素 “三个区”,其结构用统计表表达出来(表7),便可一 览无余,层次清晰,易于辨析其真正的实验设计类 型。 表7 4组肺组织病理图像分析结果比较 例5很多人用配对设计定量资料的t检验和 单因素多水平设计定量资料的方差分析(两两比较 用LSD法)处理多因素影响下的定量资料,如本刊 2006年第4卷第3期第287页上的表1资料(为节 省篇幅,详细资料此处从略)。请辨析:这样做错在 哪里?为什么?正确的统计分析方法是什么? 对差错的辨析与释疑 在此资料中,第1列 “Group”之下的5个组不是单因素5水平之间的关 系,它是多因素非平衡组合实验,因此,需要对 “Group”进行合理地“拆分”:如组合,前4组可同 时比较;组合,“第1组,第2、3、4三组中取一组, 第5组”可同时比较。还应考虑放置在表中纵向上 的“时间”因素,第1个时间点为“处理前”,应将其视 为“协变量”,而且,“时间”是与重复测量有关的因 素,简称重复测量因素。 同时考虑某种组合和时间,则分别与组合、组 合对应的统计分析方法都叫做“具有一个重复测 量的两因素设计定量资料的一元协方差分析”。 REFERENCES 1 HU LP,Li ZJFundamental of medical statistics and dis crimination of typical misuseBeij ing:Press of Military Medical Sciences2003:149153C

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论