




已阅读5页,还剩80页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,统计分析,陈锡明,2,什么是统计学?,统计学是一门关于如何收集、分析、解释和表达数据的科学 Websters International Dictionary 统计学是研究随机现象规律性的方法学,3,三类现象,自然界和人类社会活动中,普遍存在三类现象 确定性现象 在相同的条件下出现相同的结果 或称必然现象 如自由落体 随机性现象 在相同的条件下出现不同的结果 但结果是确定的 如掷硬币 模糊性现象 在相同的条件下出现不确定的结果 如美人与丑人,4,不同现象与研究方法,5,医学统计学 是统计学与医学结合形成的一门学科 是统计学在医学中的应用 生物统计学是统计与生物医学结合形成的一门学科.,6,统计学的重要性,7,据调查,新英格兰医学杂志(New England J. Medical)、美国医学杂志(JAMA) 、英国医学杂志(British J.Medical)和Lancet等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。 “统计学是现代医学大厦的一个重要支柱”。 -美国医学会杂志(JAMA)主编,8,医学工作者在从事科研工作时经常要进行统计咨询和统计分析工作 一些著名医科大学和医院中,要求硕士和博士毕业论文的开题报告有统计方面的思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅,9,国外研究项目中,统计的工作量和资金的投入占总科研的比例为20%至30%。 “统计学的地位不仅仅做配角,做装饰,而是顾问、参谋,甚至是决策者。” -胡良平,10,统计学的基本内容,试验设计 数据管理和质量控制 数据分析,11,总体、个体与样本,总体(population) 是根据研究目的性质相同的所有观察单位集合 . 个体(individual) 是总体中的基本观察单位(observation unit),可以是一个人、一个动物、一个家庭、一个地区、一份样品等, 样本(sample)是从总体中随机抽取的部分观察单位的集合。,12,同质和变异,同质(homogeneity)就是性质相同,它是进行统计分析的前提 . 变异 研究对象之间的差异.,13,统计量和参数,统计量 (statistic)是反映样本特征的数量 参数(parameter)是反映总体特征的数量.,14,样本均数的变异,性质 较大样本的均数的变异小于较小样本的均数的变异 样本均数的变异小于观测值的变异 样本均数的变异随观测值变异的增大而增大,15,I型错误与II型错误 Type I and Type II errors,尽管是小概率事件,它还是有可能发生的。 I型错误:虽然无效假设为真,但由于抽到了较大(检验统计量)的样本,使得P值小于检验水准而导致被拒绝。 是否为小概率事件是由检验水准而定,所以犯错误的概率也由检验水准而定。 II型错误:虽然无效假设为假,但由于抽到了较小(检验统计量)的样本,使得P值大于检验水准而导致不被拒绝。 犯II型错误的概率由另一水准而定。,16,单侧检验还是双侧检验? One-sided or two-sided test?,双侧检验永远是正确的 单侧检验只有在少数情况下才是合适的 即使要做单侧检验,也必须事先确定,17,误用统计学案例,18,“非典”中典型统计错误,2003年有人撰文并在网上报道: 第一阶段医护人员感染率为33%,并解释说:就是在感染“非典”的100人中,有33人是医护人员。,是否有错误? 其后果是什么?,19,非典中的统计问题,报道:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。 -摘自2003.5.28 用康复病人血浆治疗非典病人真有效吗?,20,用软件进行卡方检验,得出结论: Fishers P =0.23080.05 经过统计分析,两组差别无统计意义 现在实事也不支持原研究者的用康复病人血浆治疗非典病人结论,21,统计学的误用问题,中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种 据统计 中华系列医学杂志发表的论文中有统计问题和错误的达到70 国际著名医学杂志有统计问题和错误也达50%。 (胡良平 主编 军事医科院出版2003年),22,国内对中华系列医学期刊的调查结果,凌瑞珠发现中华医学检验杂志发表论文中存在统计误用高达70% 王倩 调查了1995年5种具有较高水平的中华系列杂志,发现发表的论文不能正确应用统计分析方法占54%,23,程萍 评阅了19931995年中华内科杂志论著栏内发表的论文,发现存在统计学方法上的问题或错误占68% 。 毛宗福等报告了5种中华核心期刊论著中统计推断应用缺陷率为62%。,24,中华麻醉学杂志论文中 t检验的误用分析,本人查阅2004年在中华麻醉学杂志上发表的全部论文 对其中在方法中明确注明采用t检验作为统计分析方法的167篇论文作为研究对象,观察误用t检验的情况 由于论文不提供原始资料,故对资料是否满足正态性或方差齐性等t检验的前提不做分析,25,t检验的使用概况,采用t检验的论文167篇 占全部论文47.2% 成组t检验106篇 配对t检验81篇 共计187篇次(其中部分论文同时采用两种t检验方法),26,t检验的使用概况,27,t检验的误用情况,28,成组t检验的误用,用成组t检验处理单因素K(K3)水平设计的定量资料13篇 其中处理3、4、5、9水平 分别为4、5、3、1篇 用成组t检验处理重复测量设计的定量资料(3水平)1篇。,29,配对t检验的误用,处理具有重复测量设计K(K=3)水平的定量资料50篇 用于处理3、4、 5、 6、7、8、9、13、18水平 分别为13、6、11、10、1、4、2、 2、1 篇 处理单因素设计的定量资料1篇 处理具有两个重复测量因素设计的定量资料1篇,30,t检验的误用情况,31,典型案例分析,用t检验处理单因素K(K3)水平设计的定量资料 用t检验处理具有重复测量设计的定量资料,32,t检验误用于3组或3组以上定量资料,逐对的两两比较,多次套用t检验 分裂了原先的整体设计,失去了总变异和总剩余误差,与原设计思想不符,结论片面 多次使用t检验 ,使犯第1类错误(假阳性错误)的概率增大 损失部分信息,资料的利用率低,降低了检验效率 因此,结论不可靠,33,34,35,多组间计量资料的仍用t检验对每两个对比组作比较,会使犯第一类错误的概率a增大 如有3个组对比,若每次比较时检验水准a=0.05,这时每次比较所犯第一类错误的概率为0. 1 4,比0.05大了许多 因此,多重比较不应采用t检验分别作两两比较 应在方差分析的基础上进行q检验,36,多组间计量资料 应在方差分析的基础上进行两两比较q检验 如SNK法、Dunnett法等 当各组均数进行排序后,间隔组数越多的比较,其检验效率越高,37,误用t检验分析具有一个重复测量的单因素设计资料,38,地氟醚对老年病人血液动力学的影响,研究地氟醚对老年病人血液动力学的影响,选择腹部手术老年病人(年龄6074岁)30例,所有病人术前肝肾功能检查均正常。在吸入地氟醚前,监测心输出量(CO)、峰流速(PV)、心率(HR)、校正的血流时间(FTC)、中心静脉压(CVP)、心脏指数(CI)、平均动脉压(MAP)、外周血管阻力(SVR)作为基础值,然后分别调整地氟醚浓度至0.5MAC、1.0 MAC、1.5 MAC、2.0 MAC,稳定5min后,同时一次测定以上各参数。结果见表 。统计学处理:采用t检验来测定差异显著性,P0.05为有显著性差异。,39,与吸入前相比,*P0.05 *P0.01;与0.5MAC相比,P0.05 P0.01 与1.0MAC相比,P0.05 P0.01;与1.5MAC相比,P0.05 P0.01,40,分析,同一个病人在吸入地氟醚前、调整地氟醚浓度至0.5MAC、1.0 MAC、1.5 MAC、2.0 MAC5个不同条件下,重复测量了若干血液动力学指标,地氟醚浓度是与“重复测量”有关的因素,因而此资料属于具有一个重复测量的单因素设计资料,原作者采用t检验进行两两比较,因t检验仅适合分析单因素设计且因素的水平数最多为2的定量资料,并不适合分析此类资料。,41,释疑,具有一个重复测量的单因素设计资料可以采用配伍组设计资料的方差分析近似处理,如果分析出在不同浓度地氟醚的条件下,血液动力学指标之间的差异存在显著性意义,可采用q检验等方法作两两比较。此外,由于这些指标都属于血液动力学指标,还可进一步作配伍组设计资料的多元方差分析,得出更概括性的结论。值得一提的是:吸入前各指标的测定值是基础值,将其视为协变量的观测值,采用相应设计资料的协方差分析更合理。,42,点评我科在二医学报麻醉学专刊论文的统计方法的误用案例,43,点评1,张剑蔚,等.不同剂量乌司他丁在婴幼儿体外循环中的肺保护.上海第二医科大学 ,2004, 24(11):933 C 对照组 不用乌司他丁 U1 小剂量处理组 乌司他丁5000U/kg U2 大剂量处理组 乌司他丁10000U/kg 在麻醉诱导后、体外循环结束、术后测循环指标和多种细胞因子的变化 统计学处理 应用SPSS软件,以xs表示 测定结果,组间比较采用配对t检验,P0.05作为显著性差异 。,44,Compared with control group: *P0.05,*P0.01; Compared with T1: P0.05, P0.01.,原表,45,修改后,46,点评1,误用配对t检验处理具有一个重复测量因素的设计的定量资料 3组 3时间,47,本资料分了对照组、小剂量处理组 、大剂量处理组 相当于一个因素的3个不同水平 每个受试者在麻醉诱导后、体外循环结束、术后的三个时间点上被重复测量了同一个指标的数值,即三个时间点上的数据并不是相互独立的,这种设计类型属于具有重复测量的实验设计,时间是与“重复测量”有关的一个试验因素。而采用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论 因为t检验仅适合分析单组、配对及成组设计的资料,并不适合分析单因素K(K3)水平设计资料和多因素设计资料,点评1,48,点评1,表中标准差最小为3.73, 最大为26.22,有7倍之差, 基本上可以认为此资料服从偏态分布 不同组间标准差也相差悬殊,并不满足方差齐性的要求。 作为参数检验方法,t检验和方差分析有其应用前提条件 只有经过正态性和方差齐性检验,满足条件后才能应用 实验控制问题 可试行数据转换或采用非参数的统计方法,49,吴韬,等. 丙泊酚复合硝普钠控制性降压对机体应激反应的影响,上海第二医科大学 ,2004, 24(11):936 I 组 硝普钠不用丙泊酚 II 组 硝普钠复合丙泊酚 在降压前、降压后10min 、 40min 、及停降压后10min测多种应激激素等的变化 统计学处理 数据以xs表示, Statpal软件包进行统计分析。不同时间点、组间、的比较采用方差分析, P0.05作为显著性差异 。,点评2,50,Compared with control group: *P0.05,*P0.01; Compared with T1:# P0.05, # #P0.01.,Statpal软件包进行统计分析。 不同时间点、组间、的比较采用方差分析,51,点评2,Statpal软件包进行了方差分析后能做两两比较吗? 既然不能两两比较吗,随后用了何处理? t检验? 4个不同时间点! 组间比较有必要用方差分析吗? 2组! I组不用丙泊酚了,用何方法补充麻醉的不足的? 如果两组的处理差别仅仅是不用丙泊酚,那么结论就是:用丙泊酚加深麻醉可以减少控制性降压时硝普钠用量! 文章还有新意吗?,52,陈绮,等.胆囊切除术中PHC对血流动力学、肺內分流和氧合的影响。上海第二医科大学 ,2004, 24(11):936 20例无分1组 麻醉前、插管后气腹前 、PHC5min 、10min、30min 测血流动力学、肺內分流和氧合的变化 统计学处理 应用Statpal软件包进行统计分析。数据以xs表示。各时间点参数采用t检验。,点评3,53,点评3,Compared with Baseline: *P0.05, Compared with PHC: #P0.05,54,点评3,t检验! 5个不同时间点! 比几次? 主要研究PHC因素的作用 但无任何对照组(非PHC因素,其他处理完全相同) 能说明各种变化就是PHC因素引起的吗? 能排除时间和手术刺激等其他因素引起的吗?,55,点评3,Compared with Baseline: *P0.05, Compared with PHC: #P0.05,56,点评3,想研究PHC肺內分流影响 采用Qs/Qt作为指标 这些正常人麻醉前的Qs/Qt=30.5% 而麻醉后Qs/Qt=18%,+ PHC等处理后Qs/Qt=18%(P0.05) ! 文章结论:PHC对肺內分流无明显影响。 结论与结果不一致! Qs/Qt的正常值是多少?符合常理吗? 从表中结果看麻醉使肺內分流明显减少!符合常理吗? 不符合常理!是新发现吗?,57,点评3,原因 采用的简化计算公式 该简化计算公式假定许多变量为常数(FiO2,PaCO2 ,Ca-vO2) 本实验中这些变量是恆定不变的吗? 这个简化计算公式适合本实验吗?,58,国外对英文权威医学期刊调查结果,统计学误用率为50%的不在少数,有的甚至高达70%或100%。 Glantz调查了1977年Circulation Research和Circulation杂志中发表的文章,在考虑使用统计学方法的文章中,分别有61%和44%具有统计学错误。,59,Kanter等调查了1992年至1993年Transfusion杂志发表的文章 发现75%的文章至少存在一处统计问题和错误,60,30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下” 近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高,61,误用统计问题产生的原因,62,对统计学的作用重视不够 统计教育普及不够,我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。 -中科院张永光教授,63,统计学教学观念和方法落后,教学中比较多的在统计推理和计算 科研设计、质量控制和统计分析分离 教学与实际应用脱离,64,计算机统计软件应用问题,面对大量数据的统计分析,无法用手工方式完成。只能采用计算机来实现。以前手工一个月的工作,计算机几分钟就能完成。计算机软件给统计学带来革命性的变化。,65,乱用计算机统计软件现象很普遍,对于同一份数据资料,统计学可提供多种不同的分析方法,各种方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。,66,软件与统计的关系,一方面,很多人不管统计方法的前提条件是否満足,将数据直接代入计算机软件中,得出的结果与实际相差堪远。 另一方面,现有的统计软件使用不太方便,造成用户的误用。,67,统计数据造假的问题,68,统计是支持研究结论的证据之一 一些想在研究中走捷径的人不惜抛开科学道德伪造统计数据,69,据1976年New Science 杂志关于科研舞弊行为的调查 74%的调查表反映有不正当修改数据的情况 17%拼凑实验结果 7%凭空捏造数据 2%故意曲解结果。,70,年月,美国劳伦斯伯克利国家实验室名研究人员在学术刊物物理评论通讯上联合发表论文称 通过铅原子核和氪原子核的撞击,他们发现了元素周期表上空缺的号元素,以及由号元素衰变产生的号元素 这一成果曾被视为年最重要的科技突破之一,71,美国劳伦斯伯克利国家实验室 公开承认数据造假,新华网华盛顿2002年月日 美国劳伦斯伯克利国家实验室最近公开承认,该实验室一个研究小组年发现的两种超重元素的实验数据是“捏造”的,有关研究人员从事了“不正当科学行为”。,72,其他科学家随后进行的重复研究,却无法获得类似结果 尼诺夫是人研究小组成员之一,在最初的研究中主要负责数据的分析,目前已被该实验室开除,73,中国“学术腐败”,2004年初,南京中医院、南京中医大学学术带头人博士导师王刚造假事件,74,北京大学教授和博士生导师王铭铭剽窃,美国人类学家哈维兰的当代人类学(中译本)和王铭铭的近作想象的异邦,这两本书大约有10万字的内容几乎是一模一样,75,北大一副教授剽窃被解聘,黄宗英,男,1993年攻读北大美国文学博士学位,1996年7月留校任教,1997年8月晋升为副教授,事发前是系工会主席。 北京大学英语系核查组关于黄宗英学术剽窃行为的评价报告称,根据美国语文学会研究论文写作指南对剽窃行为的定义,黄宗英的艾书剽窃部分占到全书的74%.,76,历史上许多事实说明 科学容不得半点虚假 造假者一旦被揭露就背上了永远洗脱不掉的耻辱 最终精神错乱或自杀身亡的也不乏其人,77,“科学诚实”,“在一篇论文发表之前,所有作者都有责任核实数据。” “对一个实验室来说,没有比科学诚实更重要的东西了。只有拥有了这种诚实,资助研究的公众才会对我们有信心。” -尚克 美国劳伦斯伯克利国家实验室主任,78,赞贝尔实验室“揭丑”精神 光明日报 2002年10月9日,贝尔实验室是全世界科学工作者敬仰和向往的地方。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年肾脏病学诊断与治疗知识综合测试答案及解析
- 2025年内科学的疾病诊断模拟考试卷答案及解析
- 2025年产科常见病例分析模拟试卷答案及解析
- 奉贤区2024-2025学年第一学期五年级语文期末学业评价试卷及答案
- 2025年肝胆外科手术后护理操作规范考试答案及解析
- 2025年泌尿外科尿路结石治疗操作演练考察试卷答案及解析
- 2025年康复护理脑卒中康复训练方案考试题答案及解析
- 2025建筑材料采购与销售合同协议书范本
- 2025年职业技能鉴定线上平台设计与用户体验可行性研究
- 2025年算法工程师推理加速面试题(含答案与解析)
- 协会工资薪酬管理制度
- 办公烟酒领用管理制度
- 淀粉大型设备管理制度
- 职业技术学院运动健康指导专业人才培养方案
- 离婚后小孩学费协议书
- 初中学校学科竞赛策划工作计划
- 近代中国体育思想的嬗变轨迹与时代特征探寻
- DB31T 1373-2022 海三棱藨草种群生态修复技术规程
- 高危儿规范化健康管理专家共识
- 消防专职招聘笔试题及答案
- 第一单元 第二课 传感之古今未来 教学设计2024-2025学年人教版(2024)初中信息科技八年级上册
评论
0/150
提交评论