




已阅读5页,还剩77页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学研究中统计学方法的抉择,提纲,一、统计学方法应用的常见错误二、统计学方法的正确选择,一、统计学方法应用的常见错误,(一)资料表达和描述中常见错误(二)计量资料分析中常见错误(三)计数资料分析中常见错误(四)相关与回归分析中常见的错误(五)统计结果的解释与表达中常见的错误,(一)资料表达和描述中常见错误,1编制统计表时存在的主要问题2绘制统计图时存在的主要问题3选用平均指标和变异指标时存在的主要问题4运用相对数时存在的主要问题,1编制统计表时存在的主要问题,例1统计表纵、横标目颠倒1)原先表格设计形式表1(Y),2)差错分析原表主要错误是主、谓语位置颠倒;线条太多,并有竖线;百分比中有效数字位数不一;数字位数没对齐;误用“百分比”代替“感染率”;试验组与对照组可在文中说明,不必列入表中。,表1(Y)不同溶液冲洗伤口效果比较,3)修正表1(X),2绘制统计图时存在的主要问题例2统计图与资料类型不匹配1)原统计图式样图1(Y),图1(Y)两种方法扫床前后空气培养结果,2)差错分析原表主要错误是用分段条图表达2个分组因素的资料。图1(Y)中阴影部分的高度实际上表示的是刷子法与毛巾法所对应的菌落数之差,读者很难看出,因而极易产生误解。,3)修正复式条图用于表达具有2个或2个以上分组因素,每个因素又有若干水平的计量资料。本例有2个分组因素,即“扫床方法”与“观测时间”,前者有2水平(毛巾法和刷子法),后者有4水平(扫床前、扫床后即刻、扫床后15min和扫床后30min)。用复式条图表达本资料的图形见图1(X)。,图1(X)两种方法扫床前后空气培养结果,3选用平均指标和变异指标时存在的主要问题,例3误用正态分布法描述呈偏态分布的资料1)原先资料表达形式表3(Y),2)差错分析由表3(Y)可以看出“愈合时间指数”的标准差大约是均数的2倍,据此基本上可以认为该资料呈偏态分布,而“平均数标准差”是表达正态分布资料的方法,说明其数据分布的集中趋势和离散趋势,它不能用于表达偏态分布资料的集中趋势和离散趋势。,3)修正表达偏态分布资料的集中趋势应选用中位数,表达其离散趋势应选用第1和第3四分位数的间距,其形式为“M(QR)”,其中M为中位数,QR=Q3-Q1,Q1和Q3分别为第1和第3四分位数。,4运用相对数时存在的主要问题,2)差错分析原表主要错误在于计算相对数的分母太小。相对数通常以100为基数,分母太小就显得过分夸张而失真,不但不能正确反映事实真相,还会造成错觉。,3)修正一般地说,观察单位数足够多时,计算相对数比较稳定,能够正确反映实际情况。实际应用中,观察单位数小于20时,都不宜计算相对数,而直接给出个组观察的可能发生某事件的总例数和实际发生该事件的例数。,例5误以“百分比”代替“百分率”1)原先资料表达形式表5(Y),2)差错分析原表主要错误是“百分比”代替“百分率”。,3)修正百分比是反映某事物内部各组成部分在总量中所占的比重,而百分率是反映某现象(事件)的发生强度或频率。从资料的性质来看,作者企图描述的是“病人手术前后各种心理问题”的发生强度,因此,表5(Y)中的“百分比”应改为“百分率”。,例6误以“百分率”代替“构成比”1)原先资料表达形式表6(Y),2)差错分析原表主要错误是“感染率(百分率)”代替“构成比(百分比)”。,3)修正从资料的性质来看,作者企图描述的是“各病房医院感染情况”的比重(分量),因此,表6(Y)中的“感染率”应改为“构成比”。,(二)计量资料中分析常见错误,1t检验和方差分析的前提条件及误用若是单组设计,必须给出一个标准值或总体均值,同时提供一组定量的观测结果,应用t检验的前提条件是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。方差分析(F检验)与成组设计t检验的前提条件是相同的,即分布的正态性和方差齐性。分析计量资料中常见的错误是:忽视t检验和方差分析的前提条件、误用t检验代替F检验、误用参数检验代替非参数检验、各种方差分析混用。,2误用t检验分析单因素多水平资料,例7误用t检验进行多个均数间的两两比较1)原先的设计、资料、统计分析方法、结果与结论:某医院为了了解昏迷时血清甲状腺素的变化,分别测定病人和普通病人的血清的T3、T4、rT3,结果见表7(Y1)、表7(Y2)。,作者采用t检验对表7(Y1)每两组的均数进行比较,经检验认为昏迷病人较普通病人的血清的T3、T4降低,rT3升高,其差异有非常显著性意义(P0.01);浅昏迷与中昏迷比较、中昏迷与深昏迷比较,血清的T3、T4降低,rT3升高,其差异有显著性意义(P0.05);浅昏迷与与深昏迷比较,血清的T3、T4降低,rT3升高,其差异有非常显著性意义(P0.05)。这说明昏迷程度越深,血清的T3、T4降低与rT3升高越明显。,2)差错分析这是个单因素(昏迷)4水平(无、浅、中、高)的设计。t检验对每两组的均数进行比较,割裂了整体设计,无法说明整体差异是否有显著性意义。3)修正若要得出“昏迷程度越深,血清的T3、T4降低与rT3升高越明显”的结论,必须选用多元方差分析。,例8误用t检验分析析因设计资料1)原先的设计、资料、统计分析方法、结果与结论:某学者为了提高住院精神病病人生活质量,对于住院精神分裂症病人给予生活技能训练。以某病63例病人为实验组,给予生活技能训练、社会技能训练、疾病知识教育及家庭干预等;另一病区49例病人为对照组,采用药物治疗和传统的护理。住院期间定期对两组病人进行NOSIE30、SAPS、SANS及总体幸福感量表评定,部分结果见表8(Y)。,3误用t检验分析析因设计资料,作者采用t检验,总积极因素和总评估增分值及总消极因素减分值实验组均明显高于对照组,差别有极显著性意义(P0.05”等价于“某因素是无用因素”吗?某研究者在研究多个实验因素对某产物的影响时,运用正交设计安排了全部实验因素。运用方差分析处理资料后发现“温度”这个实验因素所对应的P值是“P0.05”,便认为“温度”这个实验因素对产物的影响无显著性意义,于是,得出结论:“温度这个实验因素在本实验中是无关紧要的,可忽略不予考虑”。2)差错分析假定在上述问题中没犯型错误的前提下,来讨论所提出的问题。此时,“P0.05”与“某因素是无用因素“之间并非等价关系!即使某个实验因素在实验中是不可缺少的,如果该因素在实验中所取的水平过于接近,它们对实验结果的影响自然也就相差无几了。此时的不显著,仅表明该因素的各水平对观测结果的影响几乎相同,而不代表该因素对观测结果无影响。,3)释疑当发现某因素所对应的显著性水平为“P0.05”时,不要轻率地作出类似原作者的结论,一定要仔细检查一下该因素所取的水平是否过于接近。如果因素的水平已取到可能取值范围内的最小值、中等值和最大值,而且,设计符合实验设计的基本原则,并且所选取的试验点具有统计学上的依据,则可认为该因素在其取值范围内可取任何值,但此时仍得不出“该因素是无用因素,可忽略不予考虑“的结论。像“温度”这样的实验因素,在某些实验中是必不可少的。如果问题中所涉及的不是像“温度”那样的实验因素,而是像“某种物质含量”那样的实验因素,无论它取多大含量(甚至含量为零),观测结果始终不受其影响。此时,才可认为该因素是无用因素,今后做类似实验时可不予考虑。,4解释有显著性意义的结果时存在的问题,例27误解了“P0.01”与“P0.05”的真正含义1)在解释“P0.01”与“P0.05”含义时常犯的错误:有些人在解释具有显著性意义的统计结果时,常根据P值是“0.05”还是“0.01”作出肯定程度不同的专业结论。例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P0.001”,则认为甲药极显著地优于乙药;若得到“P0.01”,则认为甲药非常显著地优于乙药;若得到“P0.05”,则认为甲药显著地优于乙药。,2)差错分析统计学上根据假设检验原理推算出来的P值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间差别的程度的大小。3)释疑如果事先规定拒绝零假设的显著性水平=0.05,当计算的结果为P时,可以作出的结论应当是相同的,即拒绝零假设,可以认为对比的两者之间的差别具有显著性意义。但下此结论时犯假阳性错误的概率在不同的场合下可能不等,视P值的大小而定。,5解释相关分析结果时存在的问题,例28误认为“r0“就是零相关1)有一些人认为,“样本直线相关系数r0就代表两变量之间呈零相关”。2)差错分析这些人将“零相关”理解成所研究的两个变量之间无任何关系。在实际问题中,有时并非如此。例如,当某个变量呈曲线关系时,用直线相关系数r去描述两变量之间的关系时,也会得到近似等于零的r值。所以,当发现样本直线相关系数r0的资料时,不能简单地推断所研究的两个变量之间呈“零相关”。,3)释疑判断两个变量之间是否存在直线相关关系,应从两个方面入手:其一,依据专业知识。如果专业上有理由认为某两个变量之间存在一定的关系,才有进一步探讨的基础。其二,依据假设检验理论。由样本资料算得的相关系数存在抽样误差,根据假设检验原理进行统计推断,看样本所代表的总体相关系数存在抽样误差,根据假设检验原理进行统计推断,看样本所代表的总体相关系数是否为零。若推断的结果是总体相关系数为零,此时,只能认为所研究的两个变量之间不呈“直线关系”,但不能认为他们之间没有任何关系(因为它们之间可能呈非常好的曲线关系)。,例29误认为“r0.7”就代表两变量之间呈高度相关关系1)“r=0.945”就表明两变量之间呈高度相关吗?某研究者依据专业知识认为变量X与Y之间有一定的关系。通过抽样研究,获得了4个样品,测出4个样品的(X,Y)值,代入计算直线相关系数r的公式,得到样本直线相关系数r=0.945,发现此r值明显大于某些人给定的界限值0.7,故很有把握地断言所研究的两个变量之间存在显著地直线相关关系。,2)差错分析前面讲过,对于两个变量之间是否呈直线相关关系,应从专业和假设检验两个方面去考虑。上面的错误就在于没有进行假设检验,仅凭一个没有根据的界限值作出推断,往往都会得出错误的结论来。3)释疑由样本信息推论总体的情况,必须排除抽样误差的影响,而误差的大小与许多因素有关,其中样本含量n的大小是必须考虑的。在本例中,n=4,自由度v=2,查直线相关系数临界值表可知,其临界值r0.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国大唐印尼公司职业发展面试预测题集
- 拇外翻的护理课件
- 2025年超多道数字地震仪合作协议书
- 2025年新能源环卫装备项目建议书
- 2025年电梯、自动扶梯及升降机项目建议书
- 2025年植物原药项目发展计划
- 2025年消雾塔项目发展计划
- 抚顺公务员专业知识培训课件
- 抗震防灾减灾课件
- 抗生素知识培训课件
- 2024宅基地房屋租赁合同范本
- 常见血液病科普
- JJF1030-2023温度校准用恒温槽技术性能测试规范
- 矿山压力与岩层控制(第二章)
- 冶金传输原理课件
- 中学生心理健康影响因素
- 急性左心衰抢救流程图片
- 2024年中邮保险公司招聘笔试参考题库含答案解析
- 第3章 Word 2016文字处理软件
- 工业机器人的发展现状和未来趋势
- 2023台球厅灭火和疏散应急预案
评论
0/150
提交评论