




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
常见试验设计定量资料统计分析错误辨析【关键词】 统计学 医学 统计分析 交互作用 定量资料 Keywords: statistics; medicine; statistical analysis; interaction; quantitative data 1 引 言 对于同一个资料或同一个分析目的,由于所采用的统计分析方法不同,有时会得出不完全相同的结论,甚至有时会得出相反的结论。因此,正确、合理地选用统计分析方法至关重要1。那么,如何才能正确地实现定量资料的统计分析呢?关键是两点:其一,检查定量资料是否满足参数检验的前提条件;其二,正确辨析定量资料所对应的试验(实验)设计类型2。通过中西医结合学报前几期“医学统计学”栏目系列文章的介绍,我们共同学习了很多试验(实验)设计,了解了它们的特点、适用场合及如何正确分析这些试验(实验)设计定量资料。当然,统计学水平的提高不能只依赖于理论知识的学习,还需要理论联系实际,通过大量的“实战”练习来巩固和提高,以加深对理论知识的理解。本文就部分常见试验(实验)设计定量资料的统计学误用问题通过实例展示出来,并进行错误辨析,给出正确做法,帮助广大科研工作者更好地提高统计学实际应用水平。 2 实例辨析 2.1 检查参数检验条件 参数检验的前提条件一般指独立性、正态性和方差齐性,当然对配对设计、重复测量设计定量资料不要求受试(实验)对象间满足独立性要求。正态性要求各组定量资料分别取自正态分布的总体,方差齐性要求各试验(实验)因素的各水平组的总体方差相等;而对于具有重复测量设计的定量资料,还要检查其是否满足HuynhFeldt(HF)条件,需做球性检验或用混合模型处理3。 例1 某研究者为研究发生股骨头坏死的危险因素,从而为该病的预防提供依据。采用病例对照研究方法,以临床确诊的100例股骨头坏死患者作为病例组,按13比例配对选取与病例同性别、同一年龄阶段和同一居住地区的非股骨头坏死者(排除严重的心、肝、肺、肾疾病)作为对照组,对劳动时间和吸烟饮酒史等因素进行调查研究。结果见表1。研究者采用成组设计定量资料的t检验分析此资料,妥否? 表1 体质量指数、饮酒等因素与股骨头坏死的关系 (xs) 因素病例组例数计量值对照组例数计量值tP体质量指数 9921.293.3829721.713.701.0430.05每天重体力劳动时间(h)1002.173.222961.862.810.8600.05吸烟量(支/d) 984.358.44293 4.6110.840.2480.05白酒(次/周) 801.653.892381.934.330.5380.05黄酒(次/周) 831.573.472361.844.170.5830.05啤酒(次/周) 800.982.612421.833.992.2100.028 体质量指数=体质量(kg)/身高2(m2) 辨析 此表中的横标目“因素”实际上就是观测指标,研究者采用成组设计定量资料的t检验来分析病例组与对照组在这些指标上的取值的差异是否存在统计学意义。若这些指标相互之间没有专业上的联系,就可对每个指标进行单独分析,那么对每个指标来说,此资料确为成组设计定量资料,但采用成组设计定量资料的t检验来分析是否合适呢?仔细观察表1中的数据,发现除体质量指数外,病例组与对照组在其他指标上的取值均出现标准差大于均数的现象,因此该资料很可能不符合正态分布,故对所有指标一律采用成组设计定量资料的t检验来分析是不妥的。 正确做法 对资料的分布进行正态性检验,若病例组与对照组在某个或某些指标上的取值不符合正态分布,应进行合适的变量变换或采用Wilcoxon秩和检验进行处理;若病例组与对照组在某个或某些指标上的取值符合正态分布,则还应进行两组间方差齐性检验,满足方差齐性的条件可对这个或这些指标采用成组设计定量资料的t检验来分析,否则须采用成组设计定量资料的t检验来分析。 若希望由所考察的多项指标来预测股骨头坏死发生的概率,则可采用非条件多重logistic回归分析;若病例与对照严格按某重要非试验因素(年龄或体质量)进行11配对或mn匹配,则可采用条件多重logistic回归分析。就这一具体问题而言,与多次采用单因素分析相比,多重logistic回归分析的结论更具有可信性,也更有实用价值。 2.2 认清试验设计类型 在生物医学实验中,应用比较多的实验设计是单因素(3)水平设计、析因设计和重复测量设计等。此外,由于试验(实验)条件所限或研究者统计知识的缺乏,多因素非平衡组合试验(实验)应用也较多。读者可结合中西医结合学报前几期“医学统计学”文章中对这些试验(实验)设计的论述及下面给出的部分实例,提高定量资料试验(实验)设计类型的辨析能力。 例2 某研究者欲研究儿茶素对造血生长因子生物活性的刺激效应,选用24只大鼠,随机等分成两组:对照组和儿茶素组,每组12只。对照组大鼠每天腹腔内注射0.5 ml生理盐水,儿茶素组每天腹腔内注射2 mg/ml规格的儿茶素溶液0.5 ml。在给药后第1、3、5、7天分别处死3只大鼠,测量粒细胞巨噬细胞集落刺激因子活性(granulocytemacrophage colonystimulating activity, GMCSA)。实验结果见表2。采用t检验分析第1、3、5、7天测得的两组大鼠GMCSA的差异是否有统计学意义。请问:这样分析合适吗? 表2 儿茶素对GMCSA的影响 (xs, n=3) 分组GMCSA(1105骨髓细胞生成的粒单系造血祖细胞集落数)时间:第1天第3天第5天第7天对照组9.803.2716.006.1617.001.0024.806.69儿茶素组33.809.0461.409.5062.606.5069.406.11 辨析 本资料涉及2个因素:“是否注射儿茶素”和“处死时间”。前者有2个水平,后者有4个水平。由于研究者在每个时间点上都处死3只动物,所以“处死时间”不是重复测量因素。所有实验条件由2个因素各水平全面组合而成,且每个实验条件下都进行了3次独立重复实验,也无专业依据可认为2个实验因素对观测结果的影响存在主次之分,故此资料应为两因素析因设计定量资料。采用多次t检验分析此资料不但会增大犯假阳性错误的概率,且在两因素间存在交互作用时可能会得出错误的结论。 正确做法 若资料满足参数检验的前提条件,可选用两因素析因设计定量资料的方差分析处理;若不能同时满足参数检验的前提条件,则应进行相应的变量变换,对变换后能满足此前提条件的数据再进行两因素析因设计定量资料的方差分析。 例3 某研究者为观察奥美拉唑治疗消化性溃疡并上消化道出血的酸性环境改善效果,选取80例因消化性溃疡并上消化道出血的患者,将其随机分为两组:治疗组和对照组,各40例。治疗组用奥美拉唑,对照组用法莫替丁。测定用药前及用药后24、48、72 h空腹胃液pH值。结果见表3。统计分析方法采用t检验。请问:采用t检验分析此资料对吗? 辨析 根据研究者的试验过程可知,在治疗前和治疗后24、48、72 h等4个时间点上重复测量了同一受试者空腹胃液的pH值,因而“观察时间”属于重复测量因素。其实,表3是此资料表达的表现型,读者可能会误以为4个时间点各不相干,而将其看成毫不相关的4个“指标”,所以对每个“指标”采用成组设计定量资料的t检验来分析,这么做的原因是因为没有弄清楚资料的本质。事实上,这4个时间点是一个因素的4个水平,这个因素就是“观察时间”。所以,我们可对表3进行改进,给出该资料表达的标准型,从而清晰地呈现出资料的设计类型及其本质。见表4。可以看出,资料应为具有一个重复测量的两因素设计定量资料。 表3 两组患者空腹胃液pH值变化 表4 两组患者空腹胃液pH值变化(标准型) 正确做法 根据资料的设计类型,可采用具有一个重复测量的两因素设计定量资料的方差分析处理此资料。当然,在进行方差分析前,应先检查资料是否满足参数检验的前提条件及HF条件。若这些前提条件不能全部同时满足,需进行适当的变量变换或采用混合模型来分析。当资料满足参数检验的前提条件时,最好以患者治疗前空腹胃液的pH值作为“基础值”,采用具有一个重复测量的两因素设计定量资料的一元协方差分析处理此资料。 例4 某研究者选取10只家兔来研究某药物A对皮肤的损伤情况。A有2个水平:A1(高浓度),A2(低浓度)。为排除实验部位对观测结果的影响,药物涂在兔的4个对称部位上,即部位因素B有4个水平:B1(左前腿)、B2(右前腿)、B3(左后腿)、B4(右后腿)。10只家兔被完全随机地均分到A1、A2两组中去,将药物涂在任何一只兔4条腿的对称部位,且涂的面积相等。资料见表54。请问:若要分析两因素对观测结果的影响是否有统计学意义,采用析因设计定量资料的方差分析是否合理?表5 家兔皮肤损伤直径 辨析 试验中涉及2个实验因素:药物浓度和涂擦部位。前者有2个水平,后者有4个水平。但由于对每只家兔来说,涂擦药物的4个部位是对称的,具有可比性,且从这4个部位获得的实验数据具有一定的内在关联性,因此“涂擦部位”在这里是一个重复测量因素,此资料应为具有一个重复测量的两因素设计定量资料。采用析因设计定量资料的方差分析,不能有效地排除个体差异和对称部位上观测值之间的高度相关性对结果的干扰和影响,因而不能合理、有效地揭示因素及其交互作用的效应大小。 正确做法 若资料满足参数检验的前提条件及HF条件,可选用具有一个重复测量的两因素设计定量资料的方差分析处理此资料;如不能同时满足以上条件,则需进行适当的变量变换或采用混合模型来分析。 例5 某研究者为研究刺五加皂苷对血管内皮生长因子蛋白及mRNA表达的影响,以人肝癌细胞株为研究对象,分别用酶联免疫吸附法检测刺五加皂苷对人肝癌HepG2细胞内皮生长因子蛋白表达的影响。实验分组:刺五加皂苷125、250、500 g/ml组,丝裂霉素20 g/ml组,刺五加皂苷250 g/ml丝裂霉素20 g/ml组,刺五加皂苷500 g/ml丝裂霉素20 g/ml组,阴性对照组(不加处理因素)。实验结果见表6。研究者采用单因素七水平设计定量资料的方差分析进行统计处理,合适吗? 表6 各组内皮生长因子蛋白表达结果 辨析 表6中“组别”下共有7个组,表面上看应为单因素七水平设计定量资料。但仔细研究发现,“组别”下的7种实验条件实际上是2个因素组合而成,即“刺五加皂苷药物浓度”和“丝裂霉素药物用否”。其中“刺五加皂苷药物浓度”有4个水平,分别为0、125、250、500 g/ml;“丝裂霉素药物用否”有2个水平,即用与不用。这2个因素的全面组合应有8种实验条件,而研究者只在其中的7种实验条件下做了6次独立重复实验,在“刺五加皂苷125 g/ml+丝裂霉素”条件下没有做实验。因此这个资料的设计类型不是一个标准的实验设计,该资料应属于多因素非平衡组合实验定量资料。而将“组别”看成唯一的实验因素,对资料采用单因素七水平设计定量资料的方差分析是不妥的,与实际设计类型不符,也无法研究多个因素间可能存在的交互作用。 正确做法 根据专业知识和统计学知识对此资料进行合理的拆分组合,然后对各种拆分组合根据其试验(实验)设计类型和资料是否符合参数检验的前提条件选用合适的统计分析方法。就本资料而言,可进行如下拆分。 组合1:阴性对照组、刺五加皂苷125 g/ml组或刺五加皂苷250 g/ml组或刺五加皂苷500 g/ml组以及丝裂霉素组。 组合2:阴性对照组、刺五加皂苷125 g/ml组、刺五加皂苷250 g/ml组和刺五加皂苷500 g/ml组。 组合3:阴性对照组、刺五加皂苷250 g/ml组、刺五加皂苷500 g/ml组、丝裂霉素组、刺五加皂苷250 g/ml+丝裂霉素组和刺五加皂苷500 g/ml+丝裂霉素组。 其中,组合1为单因素三水平设计定量资料,组合2为单因素四水平设计定量资料,组合3可视为实验因素“刺五加皂苷药物浓度”(包含0、250、500 g/ml 3个水平)和“丝裂霉素药物用否”(包含用与不用2个水平)的全面组合,故为两因素析因设计定量资料。在满足参数检验的前提条件下,组合1、组合2、组合3可分别采用单因素三水平设计定量资料的方差分析、单因素四水平设计定量资料的方差分析和两因素析因设计定量资料的方差分析来处理资料;如资料不满足参数检验的前提条件,则需对资料进行适当的转换或采用非参数检验法处理上述3种组合下的定量资料。【参考文献】 1 Hu LP. Common statistics problems in laboratory medicine and countermeasures. Zhonghua Jian Yan Yi Xue Za Zhi. 2000; 23(5): 299302. Chinese.胡良平. 检验医学中常见的统计学问题及其对策. 中华检验医学杂志. 2000; 23(5): 299302.2 Hu LP, Liu HG. Discrimination and interpretation of errors in statistical analysis of quantitative data in medical papers. Zhong Xi Yi Jie He Xue Bao. 2007; 5(4): 481484. Chinese.胡良平, 刘惠刚. 医学论文中定量资料统计分析方面的错误辨析与释疑. 中西医结合学报. 2007; 5(4): 481484.3 Hu LP, Liu HG. Discrimination of design types in the research of rehabi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 锻造生产工艺员考试试卷及答案
- 2025年南平事业单位真题
- 高原环境下低空空域的研究与挑战
- 2024年丽水云和县招聘事业编制教师真题
- 昌吉吉盛新型建材二期工业硅项目综合循环水泵站水泵技术协议
- 教育变革背景下的在线教育平台政策分析
- 教育行业的数据泄露预防与应对措施
- 数字时代的教育变革传统教学与数字教材的结合
- 企业园区安全防范的智能化升级方案
- 中职文案写作课件
- 肾癌的护理课件教学
- (零诊)成都市2023级(2026届)高三高中毕业班摸底测试语文试卷(含答案)
- 国家职业技能标准-半导体分立器件和集成电路装调工
- 2024新版(外研版三起孙有中)三年级英语上册单词带音标
- 马克思主义原著选读课程
- 保障性租赁住房申请表
- 2023年中智总部及直属单位个高管职位公开招聘笔试参考题库附带答案详解
- iqc培训教材基础课件
- 中等职业学校艺术课程标准(2020年版)(word精排版)
- GB/T 15435-1995环境空气二氧化氮的测定Saltzman法
- GB/T 1355-2021小麦粉
评论
0/150
提交评论