2015年医学研究中统计设计的重要性_第1页
2015年医学研究中统计设计的重要性_第2页
2015年医学研究中统计设计的重要性_第3页
2015年医学研究中统计设计的重要性_第4页
2015年医学研究中统计设计的重要性_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主 讲 人:黄品贤所在部门:上海中医药大学基础医学院预防医学教研室联系方式:联系电话:51322156网 址:,医学研究中统计设计的重要性,医学研究是以人(病人或健康人)为研究对象,探索疾病的病因,认识疾病演变规律,寻找疾病新的有效诊断方法和防治措施,最终以提高人群健康水平为目的的活动。,医学科学研究的特点,讲座内容,一、医学论文中的统计学问题二、医学研究中的统计设计三、参考书籍,一、医学论文中的统计问题,统计学是一门培养医学生统计学思维与科研能力的理论性和实践性很强的方法学课程。已被广泛应用于实验研究、临床研究和调查研究中,而且统计学也是评价医学论文质量优劣的重要依据。,THE LANCET(柳叶刀)杂志2011年SCI影响因子从2010年的33.63飙升到了38.28,影响因子:51.658 (2013),在主要医学期刊中保持首位,新英格兰医学杂志,美国医学协会杂志,英国医学杂志,影响因子:2011年的影响因子为30。,影响因子:英国医学杂志 16.378 。,医学论文中的统计问题,高水平科研单位博士学位论文的统计审核,2006年,李长平、胡良平对部分高水平科研单位的博士学位论文220余篇进行统计审核,其中使用统计学分析方法的150篇论文中,有92篇论文存在统计学方面的问题,占61.3%。存在问题:实验设计及数据分析方面的错误。 博士学位论文中统计学方法误用的现象比较严重,应引起有关单位研究生、研究生导师及单位领导的高度重视。,课题缺乏统计研究设计方案或设计方案经不起推敲;实验研究缺乏必要的预实验;收集数据不当,不可避免地导致误用统计分析方法;用单因素设计取代多因素设计,无法考察因素之间的交互作用误用检验分析一切定量资料;误用检验分析一切定性资料;误用直线回归方程表示有明显曲线变化趋势的资料;用一元统计分析方法取代多元统计分析方法;.,我国80的医学杂志论著有统计学错误 胡良平,更为严重的错误是: 错误统计设计指导下收集的错误数据,又用错误的方法得出错误的结论常被写进论文,“证明”了新发现或新发明,然后这些充斥错误统计数据和结论的论文堂而皇之地刊登在我国优秀期刊上。,我国80的医学杂志论著有统计学错误 胡良平,本人总结的中医药研究中的统计问题,研究设计类型不明确、不合理、设计水平低下,或设计很优秀却被误认为是完全随机设计随机分配方案不详细或没有随机分配方案分析方法选用不得当或方法使用错误样本含量不满足统计学要求应用的统计分析方法表述不规范技术路线不够细化数据管理、数据库建立存在问题缺乏统计分析计划和统计分析报告统计学结果解释不合理或推断过于肯定医学科研工作的时间分配不合理,前松后紧现象普遍存在,研究者的苦恼.,照葫芦画瓢,照猫画虎,实话实说.,统计学是一门应用性很强的学科,内容丰富,灵活性很强,即使老师传授给您的全是“点金术”,还需要您有一定的基础,并在研究中领悟和反复实践。,医学研究中所用的统计学分析方法,中医药研究数据库,大数据时代,统计分析要求具备的能力,统计分析要求学生应具备的能力,统计分析报告如同给每一个医学研究进行量体裁衣,医学研究统计分析报告,统计分析是一门很高超的艺术。费心、费脑、费时、费力,统计分析,临床医学研究的过程,医学研究的基本程序,好的研究首先必须有一好的设计。,医学统计工作的基本步骤,专业设计:选题、查阅文献、假说、预试验统计设计:设计、对象、分组、数量、指标、分析方法设计好: (1)既节省又可靠 (2)可估计误差 (3)获取多方面知识设计不好:(1)杂乱无章、虽多犹无 (2)只能罗列现象、无规律可言,(一) (二) (三) (四) (五) (六) (七) (八)(设计类型、随机抽样、样本量估计、随机分组、技术路线、数据管理、统计分析计划、统计分析报告),(一)设计类型,(一)观察性研究设计类型,1.现况调查,特定时间内、特定范围内的人群中疾病、健康状况、危险因素的分布研究有关变量与疾病或健康状况的关系。也叫做:横断面研究 (cross-sectional study)或患病率研究 (prevalence study),过去 现在,病例对照研究的特点1.属于观察性研究方法2.设立对照3.观察方向由“果”至“因”4.难以证实因果关系,2.病例对照研究,现在 将来,队列研究的特点属于观察性研究方法设立对照观察方向由“因”至“果”能确切证实暴露与疾病的因果关系,3.队列研究,(二)实验研究设计类型,完全随机设计(常用)配对(配伍)设计(常用)交叉设计(常用)拉丁方设计裂区设计嵌套设计析因设计(常用)正交设计(常用)重复测量设计(常用),(二)实验研究设计类型,完全随机设计(常用),(二)实验研究设计类型,配对(配伍)设计(常用),应用SPSS 21软件实现配对随机分组:将260例2型糖尿病居民,考虑性别、病情和病程组间均衡,随机分2组,每组130例。,SPSS软件实现过程: 1.编制序号(NO):打开excel工作表,输入序号1-260,Copy“1-260”Paste于SPSS软件的Data View中作为第一列,点击左下角Variable View,将VR00001改为“NO”,小数位改0。2.编制配对号(paired):在excel中输入1-130CopyPaste 2次,点击“升序排列”Copy Paste在SPSS软件Data View的第二列,将VR00002改为Block,小数位为0。3.播种随机数:点击TransformRandom Number GeneratorsSet Starting Point Fixed Value为98765。4.产生随机数(r):点击TransformCompute Variable,在Target Variable对话框中输入“r”,在Function group中选择:Random Numbers,在Nuneric Expression框中选择 Rv.Uniform,点击向上箭头,在Functions and Special :Rv.Uniform(?,?)中输入0和1。此时,在Data View中产生第三列“r”。点击左下角Variable View,将r列的小数位改为4。5.排序随机数(Rr):点击Transformrank cases,在Data View中产生第四列Rr,Rr的小数位改为0。6.配对随机分组(group):点击Transformrank cases,将r放入variable框中,将block放入by(rank r by block),此时在Variable View中产生第五列新变量,然后将新变量名称改为group,小数位为0.7.随机安排处理因素:随机确定group 1为对照组,group 2为治疗组。8.编写配对随机分组方案:将SPSS文件另存为excel文档,复制粘贴于word文档,结合研究题目、研究中心、控制的混杂因素,编制随机分组方案。,阶梯式学习,逐步提高统计分析能力,,知识的知识就是力量知识的传递速度是2n,(二)实验研究设计类型,交叉设计(常用),方法2 用配对设计方法来安排受试对象,(二)实验研究设计类型,析因设计(常用):各因素各水平的全面组合,223析因试验设计模型,(二)实验研究设计类型,正交设计(常用),(二)实验研究设计类型,重复测量设计(常用),表7-1 不同处理组受试者的各次测量值,临床试验(clinical trial):指任何在人体(病人或健康志愿者)进行药物的系统性研究,以证实或揭示试验药物的作用、不良反应及/或试验药物的吸收、分布、代谢和排泄,目的是确定试验药物的疗效与安全性。临床试验一般分为I、II、III和IV期临床试验。临床治疗:是根据每一位患者的具体情况对症施治,无需统一的方案,目的是将患者治好。 所以,临床试验必须有一个共同遵循的试验方案,对所有参与试验的受试者均按同一方案进行治疗或处理,不得因人而异。,(三)临床试验设计,1.临床试验设计类型,(1)平行组设计 (parallel group design) (2)交叉设计(cross-over design) (3)析因设计(factorial design) (4)成组序贯设计(group sequential design)(5)其它可用的研究方法,医学研究中存在的主要统计问题,研究设计类型不明确、不合理;设计很优秀却被误认为是完全随机设计样本含量估计缺乏依据技术路线不够细化统计分析方法表述不规范,局限于基本统计分析应用随机分配方案缺乏,缺乏考虑主要影响因素的组间均衡,题目:XXXX颗粒对何瘤小鼠骨髓抑制期EGFR信号通路的调控机制研究研究设计类型:22的析因设计因素1为阻断,2个水平为“阻断”与“未阻断”因素2为双黄升白:2个水平为“用”与“不用” 统计分析宜用析因设计的方差分析,(二)随机抽样,抽样(sampling),抽样应遵循的原则,代表性:样本中每个个体符合总体的规定即同质的要求。随机性:随机性:总体中个体有相同的机会被抽取到样本中。可靠性:结果可重复性。“足够”的样本量可比性:比较的组别之间,除处理因素不同外,其他可能影响结果的因素要求基本齐同,也称作齐同对比原则 。,随机抽样的方法单纯随机抽样机械抽样法:又称等间隔抽样,按比例分配分层抽样法:先分层,每层内按比例抽样整群抽样:随机数字:随机数字表、软件产生随机数字,从48人中抽取10人,N=100,需抽取n=20 N/n=100/20=5 从1-5中随机抽取一个号 选中4 从第4号开始,每隔4个,抽选一个样本,系统抽样Systemic sampling,可按年龄、性别、经济收入、教育水平等分层,分层抽样Stratified sampling,将总体分成若干群组,抽取其中部分群组作为观察单位组成样本,被抽到的群组中的全部个体均作为调查对象。(例如,按地理区域、行政区域、组织单位等划分群组)。,整群抽样 Cluster sampling,(三)样本量估计,过去临床研究“潜规则”中的30例,没有依据!“中医药三年行动计划”至少60例,不是不用计算,也是需要有依据在计算的基础上考虑20%的脱落病例规定的和计算的样本量,就高不就低,样本含量估计缺乏依据,样本量的估计,样本含量估计是指为确保研究结论在一定检验效能基础上的最少观察单位数。医学研究没有绝对的样本量标准。 样本含量的大小应根据研究目的、研究设计的类型、研究资料的性质、接受的处理因素、研究对象的种类、研究阶段等因素而决定。 样本含量太大一是浪费二是难以做好质量控制;样本含量太小容易犯第二类错误。,样本含量的估计,一、影响样本含量大小的条件 1.第一类错误的概率(检验水准)。:常取0.05 2.检验效能(把握度1-)0.75。检验效能即在特定的水准下若总体间确实存在着差异,此时该次实验能发现此差异的概率。1-常取0.80、0.85、0.90。 3.所比较的两个总体参数的差值:可根据专业上有意义的差值代替 4.总体标准差:由样本标准差代替、查阅文献,样本量的估计,(1)估计总体均数时样本量估计(2)估计总体率时样本量估计(3)样本均数与总体均数比较的样本量估计(4)完全随机设计两样本含量相等时均数比较的样本含量估计(5)完全随机设计两样本含量不等时均数比较的样本含量估计 (6)配对设计两样本均数比较的样本量估计(7)完全随机设计多样本均数比较的样本量估计(8)完全随机设计两样本率比较的样本含量估计(9)完全随机设计多个样本率比较的样本含量估计(10)两样本相关系数比较的样本量估计(11)不配对病例-对照研究设计病例数与对照数相等时的样本含量(12)不配对病例-对照研究设计病例数与对照数不相等时的样本含量(13)病例-对照研究设计时样本含量(配对对照研究的样本含量)(14)队列研究设计四格表资料统计分析时样本含量(已知RR)(15)队列研究设计四格表资料统计分析时样本含量(已知p1、p2),药品注册管理办法中样本含量的最低要求,期:试验组2030例期:试验组100例期:试验组300例期:试验组2000例。生物利用度试验:1925例;等效性试验:100对。,书名:医学统计学主编:史周华出版社:人民卫生出版社出版日期:2012.8ISBN:978-7-117-15886-2/R15887参编:黄品贤,随机分配方案缺乏,缺乏考虑主要影响因素的组间均衡。,(四)随机分组,(五)技术路线,技术路线不够细化,技术路线应含有设计类型、纳入标准、排除标准、随机分组、样本量、一般资料的组间均衡性检验、治疗方案、疗程、疗效评价指标及观察时间、数据处理等信息。,技术路线的书写,技术路线是指根据研究目标将研究具体的实施流程采用框图制作成树形图。要阐述清楚可操作性的每一步骤的关键点,应尽可能详尽,以达到一目了然的效果。一般包括研究对象、采取的技术手段、具体步骤及解决关键性问题的方法等。合理的技术路线可保证既定目标的顺利实现。技术路线的合理性并不是技术路线的复杂性。,标明各时间点重要的观察指标,疗程1,2,T,统计分析方法表述不规范,局限于基本统计分析方法应用,(七)统计分析计划,统计分析是医学研究中的关键环节,统计分析方法应事先在统计分析计划中规定,而不是进行统计分析时才决定。恰当的统计分析方法,规范的统计分析流程以及正确的统计分析结果解释是统计分析必须遵循的原则,也是保证临床研究结论科学性、可靠性的基础之一。,(七)统计分析计划,统计分析计划(Statistical Analysis Plan,SAP)是指导统计分析的纲领性文件,根据研究方案中的研究目的、设计类型、资料类型、CRF等,对不同资料类型给予更加专业性和逻辑性的统计分析设想,并列出统计分析方法及规范的统计表。统计分析计划内容:临床研究概况;设计类型;病例退出及缺失值的处理方法;统计分析数据集;主要指标、次要指标、综合指标、替代指标、安全评价指标等拟采用的统计分析方法;分析时点;统计软件及其版本等。,(七)统计分析计划,计量资料统计描述:若数据服从正态分布或近似正态分布,用均数标准差( )表达;若数据不服从正态分布,用中位数(M)最小值和最大值(min,max)表达,以及误差条图、直方图、线图等。统计推断:若数据服从正态分布或近似正态分布且方差齐,两独立样本组间比较宜用t检验;三组及以上组别独立样本间比较宜用方差分析及SNK检验或LSD检验或Dunnett-t检验;多个时间点连续观察指标组间比较宜用重复测量数据资料的方差分析;配对设计宜用配对t检验等。,统计学分析方法的选择,计数资料统计描述:采用频数、构成比、率、相对比表示,以及采用直条图、百分构成图、线图等。注意分母不宜小于30

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论