




免费预览已结束,剩余93页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学论文中常用统计分析方法误用辨析主讲人:黄品贤Email:hpx8388电话:51322156,坐席安排,星期四上课学生,星期五上课学生,讲座内容,现代统计学的新观念面对现实中复杂的问题怎样处理?医学统计学的地位医学文章中统计分析的应用现状中国医学杂志的调查结果中华系列医学期刊的调查结果国外权威医学期刊调查结果国内外调查结果显示误用统计分析方法的原因医学论文中常用的统计分析方法误用辨析减少医学论文中统计学错误的对策,现代统计学的观念,“科学试验做完后再找统计学家分析数据,如同病人死了找医生进行尸体解剖,医生会告诉你病人死的原因。同样,统计学家会告诉你试验失败的原因。”-英国RonaldFisher(18901962),统计学是“对令人困惑费解的问题做出数字设想的艺术。”-DavidFreedman,“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。”统计与真理怎样运用偶然性C.R.劳先生,统计学是处理复杂问题的工具,FrancisGalton(1822.2.161911.1.17),“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。-英国著名遗传学家Galton,面对现实中复杂的问题怎样处理?,医学统计学如今是热门科学。美国食物和药品管理局(FoodandDrugAdministration,FDA)和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制定有关政策的民意调查、数据分析、决策预测等都需要统计学家的直接参与。由统计学家指导研究设计、数据分析乃至准备呈递给FDA的报告。在我国,医学统计学也越来越受到学术界和有识之士的重视。,医学统计学的地位,医学统计学的地位,据调查,柳叶刀(TheLancet)、新英格兰医学杂志(NewEnglandJ.Medical)、美国医学杂志(JAMA)、英国医学杂志(BritishJ.Medical)等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。“统计学是现代医学大厦的一个重要支柱”。-美国医学会杂志(JAMA)主编统计学能使数据变成信息。,医学论文中统计分析的应用现状,在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。但医学论文中尚存在各种统计分析方法应用上的问题,统计学缺陷涉及面:国外约50%,国内80%以上。主要有:研究设计不合理(设计水平低下);分析方法选用不得当(方法使用错误);应用条件不遵循;样本含量不满足统计学要求;结果解释不合理(推断过于肯定);统计报告(报告项目不全)。,由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机统计软件现象。不管统计分析方法的前提条件是否満足,将数据直接代入计算机软件中,使得出的结果与实际相差甚远。现有的统计软件使用不太方便,造成用户的误用。作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。,医学论文中统计分析的应用现状,中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种。据统计:中华系列医学杂志发表的论文中有统计问题或错误的达到70。国际著名医学杂志有统计问题或错误也达50%。-(胡良平主编军事医科院出版2003年),中国医学杂志的调查结果,国外权威医学期刊调查结果,Glantz调查了1977年CirculationResearch和Circulation杂志中发表的文章,在使用统计学方法的文章中具有统计学问题或错误的分别有61%和44%。Kanter等调查了1992年至1993年Transfusion杂志发表的文章,发现75%的文章至少存在一处统计问题或错误。,国内外调查结果显示,30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下”。近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高。,统计学中特别强调,有缺陷的数据得不出明确的结论!皮尔逊(英国统计学家,1895-1980),误用统计分析方法的原因,1.对统计学的作用重视不够、统计教育的普及不够。,我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。-中科院张永光教授,要提高统计信息的科学和真实性,必须在人力、资金财力、法律上对统计切实加以重视,不只是口头上,以统计P值来做装饰。,2.统计学教学观念和方法落后,教学与实际应用结合少;教学中结合软件授课少;教学人员较少参与医学研究设计、质控、数据管理和分析等;教学难以紧跟上统计分析方法与统计软件的发展速度。,误用统计分析方法的原因,3.计算机统计软件应用问题,“计算机软件给统计学带来了革命性的变化”,但对于同一份数据资料,统计学可提供多种不同的分析方法,应用各种分析方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。对于研究者来说,重要的是明确研究设计的类型、判别数据资料的分类、选择恰当的统计分析方法、遵循统计分析方法的应用条件、应用软件实现统计分析、对分析结果的正确解释和表达,则完全依赖于应用者所掌握的统计知识。,误用统计分析方法的原因,不少研究者曾多次学习医学统计学课程,但仍然对统计学知识理解很模糊。有的学生医学统计学成绩很好,但是遇到很简单的实际问题也不会解决。,误用统计分析方法的原因,4.医学统计学的学习和应用能力有待提高,医学论文中常用的统计分析方法误用辨析,一、实验设计存在的典型错误二、计量资料分析常见的统计问题三、计数资料分析常见的统计问题四、直线相关与回归分析常见统计错误五、统计分析方法表述问题六、统计表与统计图方面的问题七、多元回归分析,1.1没有遵循随机原则1.2缺乏对照组1.3对照不全1.4实验分组不合理1.5没有按设计类型进行实验和收集数据1.6组间基线资料的均衡性检验1.7用“重复取样”替代“独立重复实验”1.8样本含量过少,一、实验设计存在的典型错误,1.1没有遵循随机原则,问题:某研究者人为地选择发病在5d以内的病人进入治疗组,而对照组则没此限制。,辨析:根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率。治疗组和对照组由于人为因素的干扰和影响,在“病程”这一重要的非实验因素上并没有达到均衡,不具有可比性。在制定实验设计方案时,应将重要的非实验因素考虑在内,用随机化法使各组病人在重要的非处理因素方面尽量达到均衡一致,以便提高组间的可比性。正确的做法:对病程不做限制或均选择发病在5d之内的病人,在实验分组时遵循随机的原则,减少人为因素的影响,使入选的任何一个病人有相同的机会进人治疗组和对照组。,1.2缺乏对照组,问题:某作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没有进行统计分析,仅凭数字大小,认为银屑病的发病与血型有明显的关系,同时也证实了遗传致病的决定意义。,辨析:正常人群中的血型构成存在较大差异,AB型的比例为最少,作者没有对正常人群的血型分布情况进行调查,仅根据自己调查的银屑病人血型构成相差悬殊的情况,并不能说明银屑病人与正常人群在血型构成上存在差异,作出结论也是没有说服力的。正确的做法:应设正常对照组,调查正常人群的血型分布情况,并与银屑病人的血型分布情况对照不全进行比较,如果存在差异,则为银屑病的发病因素提供了某种线索,如果没有差异,则可以认为银屑病发病与血型构成没有关系。,1.3对照不全,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。设计:3个实验分组:1.模型组加入50gL重组人表皮生长因子(rhEGF);2.姜黄素(Cur)组加入终浓度为10gL的Cur和50gLrhEGF;3.空白对照组加入等体积硝酸盐缓冲液。请问:此设计正确吗?,辨析:本实验实际上涉及了“rhEGF用否”、“Cur用否”两个实验因素。正确的实验设计应是这两个实验因素的全面组合,所以应设4个组(22析因设计)。作者仅设立3个组,缺了1个单用10gLCur的实验组,犯了“对照不全”的错误。,1.4实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。问题:作者选取2002年12月2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄2669岁,平均53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例患者随机等分成A、B两组。请问:此设计正确吗?,辨析:作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个总体。把他们随机分入试验组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低。正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。,1.4实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。请问:这样做正确吗?,1.5没有按设计类型进行实验和收集数据,辨析:作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而是简单地将试验组第1周期的数据和对照组第2周期的数据合并成试验周期(A为:参芪扶正注射液联合化疗所得的数据),将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所得的数据),并按照化疗后的5个时间点将数据列表。这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体间可能存在的差异,也就达不到交叉设计的目的。事实上,该文中的试验设计类型更像重复测量设计。,1.5没有按设计类型进行实验和收集数据,1.6组间基线资料的均衡性检验,文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两组基线特征均衡性好,具有可比性,见表2。请问:下表是否有不妥之处?,辨析:1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级资料,这个转化过程损失样本信息。可直接根据资料是否满足参数检验的条件,可用参数检验,如不满足则用非参数检验。2.没有提供假设检验的统计量和P值。3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。4.当样本较少的成组设计资料比较时,若检验结果为P0.05时,可能是由于样本量不满足统计学的要求,而导致检验效能低下。最好的办法是增加样本量。,1.6组间基线资料的均衡性检验,1.7用“重复取样”替代“独立重复实验”,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:此设计正确吗?,辨析:文章中没有描述实验采集了多少只健康小牛。如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用“重复取样”替代“独立重复实验”的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,亦属重复取样。只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随机分配至3组中,进行有关实验处理,才是正确运用了重复原则。,1.7用“重复取样”替代“独立重复实验”,1.8样本含量过少,文题:芪众颗粒预防老年人上呼吸道感染临床研究问题:三组之间证型分布比较,经RC卡方检验,无统计学意义,具有可比性(20.809,P0.05),排前三位的证型依次为:脾肺气虚(62.42%),脾肾阳虚(17.45%),心脾两虚(6.71%),见表3。,表3三组证型之间比较,辨析:本资料中有一个格子的理论数小于1,说明本资料不可以做RC卡方检验,而应该做RC的fishers确切概率法。本资料很多格子的实际数小于5,应增加样本量。作者设空白对照组(即观察期间忌服任何预防药物或采用任何预防方法),这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求,临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。设置空白对照组只有在动物研究中。,1.8样本含量过少,二、计量资料分析常见的统计问题,2.1忽视t检验的前提条件2.2误用成组设计资料的t检验分析配对设计资料2.3忽视方差分析的前提条件2.4误用t检验分析等级资料2.5误用t检验处理重复测量的两因素试验设计2.6误用配对设计资料的t检验处理单因素k(k3)水平设计的资料2.7多因素非平衡组合设计的统计错误2.8正确处理析因设计或嵌套设计定量资料,2.1忽视t检验的前提条件,文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?,辨析:1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。2.给出确切的统计量和P值。,2.2误用成组设计资料的t检验分析配对设计资料,辩析:1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。,2.2误用成组设计资料的t检验分析配对设计资料,2.3忽视方差分析的前提条件,确切的统计量和P值,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:采用方差分析正确吗?,均数标准差?,辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P0.05,组间差异无统计学意义;:与治疗前比较,P3)设计的资料,辨析:没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnettt检验或LSD检验。如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。,2.6误用配对设计资料的t检验处理单因素k(k3)水平设计的资料,2.7多因素非平衡组合设计的统计错误1,文题:某研究者研究A药对高脂血症性脂肪肝大鼠的作用设计:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠血脂的影响。结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P0.05)。结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。,表1各组大鼠血清脂质比较(均数标准差)mmolL-1,与自然恢复组比较,P0.01,P0.05,与甲硫氨酸片组比较,P0.01,P0.05;n=10,本设计方案,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复组按多因素一水平的统计方法进行方差分析。其各处理组间关系的实质是两个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3个水平,而不是与甲硫氨酸片平等的3个因素。,2.7多因素非平衡组合设计的统计错误1,辨析1:统计学上所讲的“因素”是指“同质的实验条件”,“水平”则是在“量”上有一些差异。将水平与因素混合进行分析是完全错误的。注意:在进行多重比较时,由于比较的组数不同,SNK-q检验的q值、卡方检验的2值、秩和检验的u值会得到不同的结果。尤其是2检验和秩和检验,其多重比较的检验水准的取值为=K(K为比较的次数),将水平与因素混合进行分析必然会增多比较的次数,取值过小,导致本来有统计学意义的两组比较则可能会没有统计学意义。本实验设计是一个不标准的设计类型。但是,不标准的设计类型并不是不科学的设计方案,经过梳理,可以进行适当的重新组合,进行统计分析。当然,按照统计学的要求,这种组合设计应该确立在实验的设计阶段,而不是在实验数据得出之后。,2.7多因素非平衡组合设计的统计错误1,辨析2:如果研究者的目的是为了考察A药高、中、低3个剂量组是否有效,及确定最佳治疗剂量。实验设计仍按上述方案分为5组,而统计设计可按如下组合进行分析:组合1:A药低剂量组、甲硫氨酸片组、自然恢复组组合2:A药中剂量组、甲硫氨酸片组、自然恢复组组合3:A药高剂量组、甲硫氨酸片组、自然恢复组组合4:A药低剂量组、A药中剂量组、A药高剂量组组合1、2、3的目的是观察A药高、中、低3个剂量组是否有效,及其与甲硫氨酸片组阳性对照组的相对疗效。组合4的目的是通过A药高、中、低3个剂量组之间的疗效差异比较,考察是否可以筛选出最佳治疗剂量。,2.7多因素非平衡组合设计的统计错误1,某研究者欲研究乳宁方及其拆方药物血清对体外细胞侵袭能力的影响,选用SD大鼠24只,等分成6组:正常对照组、乳宁方治疗组(可拆解为温肾方+疏肝活血方)、温肾方治疗组、疏肝活血方治疗组、三苯氧胺治疗组、环磷酰胺治疗组,分别接受相应药物的灌胃或注射,然后在末次给药后进行主动脉采血,制成相应药物的血清。进行体外MDA-MB-435细胞侵袭能力试验,见表6。若采用单因素六水平定量资料方差分析处理此资料正确吗?,2.7多因素非平衡组合设计的统计错误2,辨析1:表6中“组别”看上去像一个试验因素,共有6个水平,其实是错误的。因为乳宁方可拆解为温肾方+疏肝活血方,所以试验涉及到“温肾方用否”、“疏肝活血方用否”、“三苯氧胺用否”、“环磷酰胺用否”这样4个试验因素,而表6中的6个组并非是这4个试验因素的全面组合。本资料应为多因素非平衡组合试验下的定量资料,直接使用单因素多水平设计定量资料方差分析对其进行处理是错误的,应根据专业知识和统计知识对“组别”进行合理拆分。,2.7多因素非平衡组合设计的统计错误2,辨析2:本资料可拆分为:组合1:正常对照组、乳宁方治疗组、温肾方治疗组、疏肝活血方治疗组;组合2:正常对照组、乳宁方治疗组、三苯氧胺治疗组、环磷酰胺治疗组。组合1为22析因设计,可根据资料是否满足方差分析的前提条件选用两因素析因设计定量资料方差分析或对原始定量资料进行变量变换或直接采用两因素析因设计定量资料秩和检验。组合2为单因素同水平设计,可根据资料是否满足方差分析的前提条件,选用单因素同水平设计定量资料方差分析处理或对原始定量资料进行变量变换或直接采用单因素同水平设计定量资料秩和检验。,2.7多因素非平衡组合设计的统计错误2,文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第35组给含10%炭末的不同剂量的开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭末的儿康宁。给药30min后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。,2.7多因素非平衡组合设计的统计错误3,辨析:(1)实验设计各对比组间混乱。各剂量组、儿康宁组与空白组是否具有可比性?不同剂量的口服液、丸剂和儿康宁之间是否具有可比性?(2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。(3)确切的统计量和P值。,原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。,2.7多因素非平衡组合设计的统计错误3,改进措施:(1)在分析时将实验拆分为:组合1:空白组与模型组说明造模成功组合2:模型组+低剂量组+中剂量组+高剂量组各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁在相同剂量的情况下,口服液比丸剂和儿康宁都好(2)第一组采用成组t检验分析。其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。,2.7多因素非平衡组合设计的统计错误3,2.8正确处理析因设计或嵌套设计定量资料,文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90min5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。,n=30,各时点ni=6,辨析:对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。,2.8正确处理析因设计或嵌套设计定量资料,3.1计算相对数时分母太小3.2误用2检验分析结果变量为有序变量的资料3.3误用2检验回答相关性问题3.4多值有序变量的高维列联表资料3.5不满足连续性2检验条件时未做校正3.6十一种形式的列联表3.7误用2检验取代Fisher精确检验(未举例说明)3.8对RC表直接分割进行两两比较(未举例说明),三、计数资料分析方法的常见问题,文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?,3.1计算相对数时分母太小,辨析:计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。,确切的统计量和P值。,3.2误用2检验分析结果变量为有序变量的资料,某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经RC表2检验,2=53.33,P0.01,认为两组疗效之间的差异有统计学意义。,辨析:本资料属于单项有序的RC表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用RC的2检验,RC表2检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,2值仍为53.33,不会有改变。,确切的统计量P值。,3.3误用2检验回答相关性问题,上述资料用2检验得:2=163.01,P0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?,表不同年龄冠状动脉粥样硬化程度的分布,辨析1:本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察“两个有序变量之间是否呈相关关系”,而2检验结果是P0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2检验的统计量数值是不会变化的,说明2检验用于处理有序变量形成的二维列联表资料是不合适的。,3.3误用2检验回答相关性问题,辨析2:欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。本例采用Spearman秩相关分析,得:rs=0.53215,P0.05或P0.05、P0.01便称结果无显著差异,或结果非常显著。,五、统计分析方法表述问题5,假设检验结果正确的表达方法是:应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如2、t、u、F值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。,五、统计分析方法表述问题6,北京血液中心XXX主任介绍:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。-摘自2003.5.28用康复病人血浆治疗非典病人真有效吗?,五、统计分析方法表述问题7,六、统计表与统计图方面的问题,6.1统计表存在的问题6.2统计图存在的问题,文题:电针对大鼠不稳定膀胱逼尿肌及膀胱颈氮能神经递质的影响。实验数据见表2。这张统计表编制得正确吗?,统计表纵横标目设置不正确,6.1统计表存在的问题1,确切的统计量和P值。,文题:原发性肝癌患者和健康人“正常舌象”的对比研究。原作者对原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞进行比较,研究结果见表3。这张统计表编制正确吗?,6.1统计表存在的问题2,确切的统计量和P值。,辨析:,表中角化前细胞、角化细胞和超角化细胞的含义似乎应为其各自的细胞数占每个个体脱落细胞染片中细胞总数的百分比,原表题目应改为:原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞的构成及成熟指数的比较,这样才能使表中数据的具体含义看起来清晰明了。原表在3种细胞后加上%,似乎想告诉读者下面的数据含义是个比,实际上不但没有起到辅助说明数据含义的目的,反而“画蛇添足”,让人更加不理解。因为各细胞所占的百分比合计应为100%,而原表中原发性肝癌组和健康人组中各细胞的均数之和确实为1,但原作者在3个细胞变量之后加上%,反而使各细胞所占的百分比都成了实际的1%,可去掉上面变量之后的%或将表中3个细胞变量下的数据同乘100。,6.1统计表存在的问题2,6.2统计图存在的问题,辨析:1.两幅统计图的纵轴刻度值并不是从“0”开始标刻度的,这违反了绘制统计图的数学原则。应改成图域或将纵轴从“0”开始标注。2.原图中横轴的数字没有标注在刻度线正下方。3.两图中纵横坐标轴上也有“用不等长的间隔表示相同的数据长度”的问题,不符合数学要求,曲线的变化趋势不正确。,七、多元回归分析,在疾病预后因素的研究中,往往涉及到多个因素。结局的产生不是孤立的,各因素之间往往相互影响,可以相互协同或拮抗。通常需要进行单因素的分析,从许多的临床指标中筛选出若干个真正与预后相关的因素。预后因素的研究,如果只用单因素分析,往往会产生混杂偏倚。所以应该采用多因素分析的方法,以校正各因素之间的相互混杂。不少发表的论文,只用2检验进行单因素分析,虽然没有犯原则性的错误,但如果能用多因素分析的方法进行筛选,校正混杂因素的影响,结果将会可靠得多。由于多因素之间的相互混杂,在单因素分析中,一些有意义的因素可能无统计学意义,而另一些没有意义的因素却有统计学意义。,Logistic回归与COX比例回归模型,如果时间因素不重要时,可以建立Logistic回归模型。COX回归与Logistic回归的主要区别:COX回归与时间有关,Logistic回归与时间无关COX回归计算RR值,Logistic回归计算OR值,七、多元回归分析,在建立回归模型时:,要先对各个研究因素进行单因素分析。初步筛选出可能与预后有关的因素;去除那些根本不可能相关的因素,以减少建立多元回归模型时自变量的个数。对于连续性的数值变量和有明确等级关系的有序分类变量,可以直接进行回归分析;无序分类变量和等级关系不太明确的有序分类变量,则须采用分层回归分析的方法。在建立多元回归方程时,结合专业知识将可能有关的因素,均可作为自变量引入回归方程中筛选。待选变量的标准应该放宽一些,以免遗漏那些由于混杂的影响,导致在单因素分析中无统计学意义的有意义因素。,七、多元回归分析,分析协同时:,分析某两个或多个因素对结局的影响有无协同。可以将两个变量相乘合并为一个变量,与原来的两个变量一起放入回归方程中去筛选,如果方程能接受这个新的变量,则提示这两个变量具有协同作用。,七、多元回归分析,回归系数、标准偏回归系数、RR值和95%可信区间,建立COX
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度出租车租赁与智能调度合同范本
- 二零二五年度电子合同在新能源领域的应用与环保法规
- 2025版建筑电气设计合同范本
- 二零二五年度高品质红砖建筑工程承包合同
- 2025版企业数字化转型战略规划与实施商务咨询合同范本
- 2025房屋修缮与室内空气质量检测服务协议
- 2025版房雅与张伟双方自愿离婚协议
- 二零二五版医疗器械销售合同
- 二零二五年度房产租赁代理合同模板
- 二零二五年度股东合作投资旅游度假区协议书
- 《成为格式塔咨询师:心理咨询师的完形之路》记录
- 胰管结石术后护理
- 第二十三届华罗庚金杯少年数学邀请赛初赛试卷(初中一年级组)(图片版含答案)
- 循环经济与再制造行业风险投资态势及投融资策略指引报告
- 高中政治必修三思维导图
- 安全知识竞赛题及答案(400道)
- 先学后教与有效教学课件市公开课一等奖百校联赛特等奖课件
- 部编版语文五年级上期第一单元教案(大单元整体教学设计含作业设计)
- 装修合同标准范本合集
- 深圳实验学校新初一分班语文试卷
- 青灵与量子物理学的关联研究
评论
0/150
提交评论