版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学方法常见错误分析医学统计学方法常见错误分析统计分析思路统计分析思路先统计描述后统计学推断先统计描述后统计学推断先单因素分析后多因素分析先单因素分析后多因素分析先计量资料后计数、等级资料先计量资料后计数、等级资料一、统计描述中的常见错误:一、统计描述中的常见错误:1. 频数表频数表分类变量与有序分类变量直接列表分类变量与有序分类变量直接列表比较各类别频数分布的均匀性比较各类别频数分布的均匀性比较各组间分布形态的一致性比较各组间分布形态的一致性数值变量数值变量 最小值、最大值、分组数、组距、频数表最小值、最大值、分组数、组距、频数表观察频数分布的对称性观察频数分布的对称性比较两组分布的一
2、致性比较两组分布的一致性2. 统计量统计量分类变量与有序分类变量分类变量与有序分类变量构成比、率、比构成比、率、比数值变量数值变量均数、标准差、最小值、最大值、中位数均数、标准差、最小值、最大值、中位数 在资料的表达和描述中,常见的错误有:在资料的表达和描述中,常见的错误有:1.编制编制统计表统计表时,分组标志(横标目)与观测指标时,分组标志(横标目)与观测指标(纵标目)位置颠倒、线条过多或过少、数字的(纵标目)位置颠倒、线条过多或过少、数字的小数点位数不一致或单位重复出现在数字之后,小数点位数不一致或单位重复出现在数字之后,最严重的问题是表中数据的含义未表达清楚,令最严重的问题是表中数据的含
3、义未表达清楚,令人费解。人费解。2.绘制绘制统计图统计图时,坐标轴上的刻度值标得不符合数时,坐标轴上的刻度值标得不符合数学原则、资料与所选用的统计图类型不匹配。学原则、资料与所选用的统计图类型不匹配。3.选用选用统计指标统计指标来描述平均水平和离散趋势时,使来描述平均水平和离散趋势时,使用正态分布方法表达呈偏态分布的资料;运用相用正态分布方法表达呈偏态分布的资料;运用相对数来描述计数资料时,比与率混淆。对数来描述计数资料时,比与率混淆。 表表1 两组褥疮愈合时间指数对比(两组褥疮愈合时间指数对比( )SX 资料描述有无问题?资料描述有无问题?应用相对数应注意的问题应用相对数应注意的问题 1.
4、计算相对数的分母一般不宜过小:观察单位计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,一般要足够多时,计算出的相对数比较稳定,一般要求观察单位数不小于求观察单位数不小于 30。 2. 分析时不能以构成比代替率。分析时不能以构成比代替率。 3. 在比较相对数时应注意可比性。影响率与构在比较相对数时应注意可比性。影响率与构成比变化的因素很多,除了研究因素外,其余成比变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。的影响因素应尽可能相同或相近。 4. 两个样本率比较时应该进行假设检验。两个样本率比较时应该进行假设检验。率与比的区别率与比的区别率是指某种事物发
5、生的频率或强度,是事物实际发率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。生的例数与可能发生某事物总人口数之比。比(构成比):说明某一事物内部组成部分所占的比(构成比):说明某一事物内部组成部分所占的比重。比重。将构成比错误地当作率来使用,这是临床科研中最将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。由于医院中资料的局限性,所得常见的错误之一。由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能的数据一般只能计算构成比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大说明事物发生的强度,而且某一类别的构成比的大
6、小受到其他类别数量变化的影响,因而其应用有较小受到其他类别数量变化的影响,因而其应用有较大的局限性。大的局限性。 表表2是某医院统计门诊沙眼病人年龄构成的数据。是某医院统计门诊沙眼病人年龄构成的数据。作者由此得出了作者由此得出了20岁组人口最易患沙眼的结论。岁组人口最易患沙眼的结论。 表表2 某医院门诊沙眼病人的年龄构成某医院门诊沙眼病人的年龄构成 表表3 两种方法治愈率的比较两种方法治愈率的比较 需要标准化需要标准化二、统计学推断常见错误二、统计学推断常见错误单因素分析(处理因素为分类变量)单因素分析(处理因素为分类变量) (1)结果变量为数值变量)结果变量为数值变量:注意应用条件:注意应用
7、条件 t检验或方差分析、秩和检验检验或方差分析、秩和检验 (2)结果变量为有序分类变量)结果变量为有序分类变量:秩和检验:秩和检验 (3)结果变量为分类变量)结果变量为分类变量:卡方检验:卡方检验 两个定性变量资料的统计分析两个定性变量资料的统计分析 RC表资料表资料 2检验检验 单向有序单向有序RC表资料表资料 秩和检验秩和检验 双向有序且属性不同双向有序且属性不同 等级相关分析等级相关分析 双相有序且属性相同双相有序且属性相同 Kappa检验检验 1.t检验应用时常见的错误检验应用时常见的错误t检验是目前医学研究中使用频率最高,医学论文检验是目前医学研究中使用频率最高,医学论文中最常见到的
8、处理定量资料的假设检验方法。中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因:检验得到如此广泛的应用,究其原因:现有的医学期刊多在统计学方面作出了要求,现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持。研究结论需要统计学支持。传统的医学统计教学都把传统的医学统计教学都把t检验作为假设检验的检验作为假设检验的入门方法进行介绍。入门方法进行介绍。t检验方法简单,其结果便于解释。检验方法简单,其结果便于解释。由于有些人对该方法理解不全面,导致在应由于有些人对该方法理解不全面,导致在应用过程中出现不少问题,有些甚至是非常严用过程中出现不少问题,有些甚至是非常严重
9、的错误,直接影响到结论的可靠性。重的错误,直接影响到结论的可靠性。可大致概括为以下可大致概括为以下两种情况两种情况:1)不考虑)不考虑t检验的应用前提,对两组的比较一律检验的应用前提,对两组的比较一律用用t检验;检验;2)对多组的资料的比较,多次用)对多组的资料的比较,多次用t检验进行均值检验进行均值之间的两两比较。之间的两两比较。 实例实例 : 为确定老年人围手术期头孢唑啉钠为确定老年人围手术期头孢唑啉钠的合理用法和用量,某研究小组对的合理用法和用量,某研究小组对60岁以岁以上与上与60岁以下者的头孢唑啉钠药物动力学岁以下者的头孢唑啉钠药物动力学特征分别进行了测量,并进行了比较,部特征分别进
10、行了测量,并进行了比较,部分结果见表分结果见表4。 表表4 两组患者头孢唑啉钠药物动力学参数比较两组患者头孢唑啉钠药物动力学参数比较忽视忽视t检验的前提条件。检验的前提条件。研究者依据研究者依据P值认为两组在值认为两组在,k10两项指两项指标上差异无统计学意义。标上差异无统计学意义。 实例实例 研究单味中药对小鼠细胞免疫机能的影响,把研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为只小鼠随机均分为4组,每组组,每组10只,雌雄各半,用药只,雌雄各半,用药15d后测定后测定E-玫瑰结形成率(玫瑰结形成率(%),结果如下,试比较),结果如下,试比较各组总体均值之间的差别有无统计学意义?
11、各组总体均值之间的差别有无统计学意义?对 照 组 : 14 10 12 16 13 14 12 10 13 9 党 参 组 : 21 24 18 17 22 19 18 23 20 18 黄 芪 组 : 24 20 22 18 17 21 18 22 19 23 淫 羊 藿 组 : 35 27 23 29 31 40 35 30 28 36 常见的错误做法是:重复运用成组设计资常见的错误做法是:重复运用成组设计资料的料的t检验对检验对4个组的均值进行个组的均值进行6次两两比较。次两两比较。而正确的做法是,先进行单因素而正确的做法是,先进行单因素4水平设水平设计资料的方差分析,若计资料的方差分析
12、,若4个总体均值之间个总体均值之间的差别有统计学意义,再用的差别有统计学意义,再用q检验等方法检验等方法进行多个均值之间的两两比较。进行多个均值之间的两两比较。 实例:研究大豆黄酮对实例:研究大豆黄酮对sp2/0肿瘤细胞肿瘤细胞DNA合成影响,在大合成影响,在大豆黄酮组中,加入豆黄酮组中,加入3HTdR后后0.5h,1h,2h,4h分别测分别测Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设值。每次试验均设空白对照,每个大豆黄酮剂量均设一式一式3份,结果取平均值。数据均以平均值标准差表示。份,结果取平均值。数据均以平均值标准差表示。 表表5 大豆黄酮大豆黄酮sp2/0肿瘤细胞肿瘤细胞DNA
13、合成影响的时间合成影响的时间-效应关系效应关系 注:注: *P0.05, *P0.01结论:用结论:用t检验,检验,P0.05为差异有统计为差异有统计学意义。大豆黄酮作用于肿瘤细胞后,学意义。大豆黄酮作用于肿瘤细胞后,其其3HTdR掺入量随时间的延长而逐掺入量随时间的延长而逐渐增加,但抑制率呈下降趋势。渐增加,但抑制率呈下降趋势。误用误用t检验分析重复测量设计资料检验分析重复测量设计资料对差错的分析对差错的分析 随着时间的变化,肿瘤细胞数目的变化随着时间的变化,肿瘤细胞数目的变化有较强的有较强的自相关性自相关性,而且又涉及两个影响因素,资料,而且又涉及两个影响因素,资料和设计类型都不满足和设计
14、类型都不满足t检验的要求,因此统计学处理结检验的要求,因此统计学处理结果不可信。果不可信。释疑释疑 此例是一个具有重复测量的两因素设计资料,应此例是一个具有重复测量的两因素设计资料,应采用相应的方差分析进行统计学处理。采用相应的方差分析进行统计学处理。 对重复测量数据进行方差分析常采用轮廓分析(对重复测量数据进行方差分析常采用轮廓分析(profile analysis),),它可从总体特征上较快地得到反应变量随它可从总体特征上较快地得到反应变量随重复观测资料的组间轮廓性比较结果。重复观测资料的组间轮廓性比较结果。 2. RC表资料表资料 2检验应用时注意的问题。检验应用时注意的问题。 表表6
15、某地某地6094人按两种血型系统划分的结果人按两种血型系统划分的结果 RC表资料:表资料: 2检验检验表表7 三种药物疗效的观察结果三种药物疗效的观察结果单向有序单向有序RC表资料:应该用秩和检验,表资料:应该用秩和检验,常见的错误:对本资料进行了常见的错误:对本资料进行了 2检验。检验。 表表8 眼晶状体混浊度与年龄之关系眼晶状体混浊度与年龄之关系 双向有序且属性不同:等级相关分析双向有序且属性不同:等级相关分析表表9 两法检查室壁收缩运动的符合情况两法检查室壁收缩运动的符合情况双向有序且属性相同:双向有序且属性相同:Kappa检验检验2k表中表中“0”频数过多,结果可靠性频数过多,结果可靠
16、性差。差。 实例实例 :A组组20例经末梢静脉输注榄香稀乳均出现程度例经末梢静脉输注榄香稀乳均出现程度不同的局部刺激症状及静脉炎,而不同的局部刺激症状及静脉炎,而B组组20例经锁骨下例经锁骨下静脉穿刺置管输注均未出现任何局部刺激症状及静脉静脉穿刺置管输注均未出现任何局部刺激症状及静脉炎。见表炎。见表10。表表10 两种处理下不同程度的局部刺激症状的频数分布情况两种处理下不同程度的局部刺激症状的频数分布情况不不同同分分度度的的例例数数及及百百分分比比(%) 组组 别别 00 0 0 0 0 合合计计 P 末末梢梢静静脉脉 A 组组 0 4(20) 9(45) 6(25) 1(5) 20 5,故可
17、用一般故可用一般 2检验。得:检验。得: 2=40.000 组组 别别 00例例 数数 非非 00例例 数数 合合 计计 末末 梢梢 静静 脉脉 组组 0 20 20 锁锁 骨骨 下下 静静 脉脉 组组 20 0 20 合合 计计 20 20 40 原作者未作任何统计处理,只是从其痊愈率上看原作者未作任何统计处理,只是从其痊愈率上看治疗组大于对照组(治疗组大于对照组(73%55%),从而得出),从而得出“治疗组的痊愈率明显高于对照组治疗组的痊愈率明显高于对照组”的结论来。的结论来。 表表12 针灸偏历治疗网球肘针灸偏历治疗网球肘116例与对照组比较例与对照组比较 表表13 产次与新生儿低体重率
18、产次与新生儿低体重率 原作者采用一般的原作者采用一般的 2检验方法,得检验方法,得 2=6.99, P0.05,结论为结论为“不同产次的低体重发生率差异不同产次的低体重发生率差异有统计学意义,第二产低体重率最低体重率最低,有统计学意义,第二产低体重率最低体重率最低,大于等于第三产低体重率及相对危险度上升大于等于第三产低体重率及相对危险度上升” 。差错分析差错分析 该资料的该资料的2值仅仅说明总体上不同的产次值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有统计学意义,间低体重发生率至少有两组间的差别有统计学意义,并不意味每两组间的差异都有统计学意义,要比较任并不意味每两组间的差异都有
19、统计学意义,要比较任何两种产次间的差别,应进行何两种产次间的差别,应进行两两比较两两比较。解决方法解决方法 需降低每次检验的检验水平数值,若需降低每次检验的检验水平数值,若=0.05,可令可令=0.05/C,其中其中C等于比较的次数,本例等于比较的次数,本例C=3采用采用 2分割法(要求分表的自由度等于总表的自由度、分割法(要求分表的自由度等于总表的自由度、分表的分表的 2值之和等于总表的值之和等于总表的 2值)进一步分析。值)进一步分析。3.四格表资料分析方法的选用标准。四格表资料分析方法的选用标准。 当总样本含量当总样本含量n40,且理论频数且理论频数T均大于均大于5时,一般的时,一般的
20、2检验检验 。当总样本含量当总样本含量n40,但有理论频数满足但有理论频数满足1T5时,连续性校正的时,连续性校正的 2检验检验 。当总样本含量当总样本含量n40或有理论频数小于或有理论频数小于1时,时,Fisher的精确检验。的精确检验。 表表14 不同分娩方式与重症肝炎孕妇的结局不同分娩方式与重症肝炎孕妇的结局 误用一般误用一般2检验取代检验取代Fisher精确检验,精确检验,本例:本例:P=0.011。 007. 0,249. 72 P 1.区分统计区分统计“有统计学意义有统计学意义”与医学与医学/临临床床/生物学生物学“有实际意义有实际意义”。统计统计“有统计学意义有统计学意义”对应于
21、统计结论,医学对应于统计结论,医学/临床临床/生物学生物学“有实际意义有实际意义”对应于专业结论。对应于专业结论。假设检验是为各专业服务的,统计的结论必须假设检验是为各专业服务的,统计的结论必须和专业结论有机的相结合,才能得出恰如其分、和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。符合客观实际的最终结论。三、统计学结论注意事项:三、统计学结论注意事项:2. 误解了误解了“P0.01”与与“P0.05”的真正含义。的真正含义。 解释解释“P0.01”与与“P0.05”含义时常犯的错误含义时常犯的错误有些人在解释具有统计学意义的统计结果时,常有些人在解释具有统计学意义的统计结果
22、时,常根据根据P值是值是“0.05”还是还是“0.01”作出肯定程度作出肯定程度不同的专业结论。不同的专业结论。 例如例如,当比较甲、乙两种药物的疗效时(假定当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到甲药优于乙药),若得到“P0.001”,则认为甲则认为甲药极显著地优于乙药;若得到药极显著地优于乙药;若得到“P0.01”,则认为则认为甲药非常显著地优于乙药;若得到甲药非常显著地优于乙药;若得到“P0.05”,则则认为甲药显著地优于乙药。认为甲药显著地优于乙药。差错分析差错分析 统计学上根据假设检验原理推统计学上根据假设检验原理推算出来的算出来的P值,表示拒绝特定的零假设可值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的能犯假阳性错误的概率的理论值,它的大小不反映对比的两者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 警院警务硕士试题及答案
- 腰痛中医护理:理论与实践
- 北大口腔护理技巧提升
- 脾切除术后伤口护理
- 创新护理课件大赛
- 自考儿科护理学实践指导
- 2026年婚礼策划公司服务协议
- 预防护理差错事故:策略与实践
- 大口径穿刺技术操作指南
- 脑病针灸护理的团队协作模式
- 2025年铁路电务信号工考试题库及答案
- 钢管合作协议合同范本
- 塑料注射成型多段射胶技术资料
- 2025年公安机关人民警察基本级执法资格考试试题(初级)附答案
- 超星尔雅学习通《通识写作怎样进行学术表达(复旦大学)》章节测试答案
- 邮政寄递事业部课件
- 四川省凉山州2025年中考物理真题附同步解析
- 心理健康课题中期报告范文
- DB32T 5124.3-2025 临床护理技术规范 第3部分:成人危重症患者有创动脉血压监测
- T-FDSCX 002-2024 福鼎白茶标准
- 中外航海文化知到课后答案智慧树章节测试答案2025年春中国人民解放军海军大连舰艇学院
评论
0/150
提交评论