研究生实验设计_第1页
研究生实验设计_第2页
研究生实验设计_第3页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第四章研究设计基础,DesignofExperiment流行病与卫生统计学系刘沛,2,1.实验设计的意义2.实验研究基本要素3.实验设计的基本原则4.常用的实验设计方案5.调查设计,3,医学研究基本过程,制定研究目的,建立专业假设查阅文献资料制定实验设计进行实验,分析实验结果发表研究成果,评价假设,4,一、实验设计意义,实验设计:在实验前对实验所作出的计划和安排专业设计:选题,建立实验方法等先进性,实用性统计设计:数据的收集整理和分析方法科学性,经济性,可重复性意义:用经济的人力、物力和时间得到可靠的结果减少实验误差,对误差大小作出估计,5,实验性研究与观察性研究,实验(Experiment)在特定条件下施于人为干预观察(Observation):在自然状态下不施加人为干预试验(Trial):以人为对象的实验,go2,6,二、三个基本要素,1.受试对象:动物、人。同质性、代表性。两个基本条件(敏感,稳定)2.处理因素:外部施加,内部固有抓住主要因素分清非处理因素(混杂因素,Confunding)必须标准化3.实验效应:指标选择客观性、精确性、特异性和灵敏性,go2,7,三、三项基本原则,对照原则随机原则重复原则,8,(一)、对照原则,实验组和对照组除了实验因素外,其它影响实验效应的非处理因素均应基本相同Best的对照研究:X线照射脑垂体治疗高血压照射组:25人17例下降占68%对照组:25人19例下降占76%(双盲法)对照的关键在于保持“均衡性”甲(100)ADI()乙(100)ADI(-),ADI50()甲ADI50()ADI50()乙ADI50(),9,对照的种类,处理:空白对照(安慰剂),相互对照对象:自身对照,实验对照时间:历史对照,同期对照数目:单个对照,双重对照,10,双重对照,某降压冲剂的双重对照组别n用药前用药后差值配对t降压冲剂25160191331527216.43安慰剂20168241542214282.24两组t1.253.801.78,go7,11,(二)、随机化原则,概念:采用随机的方式,使每个观察单位有同等的概率被抽取作用:避免主观因素的参与打破实验对象排列的系统性,控制系统误差对意想不到的因素起平衡作用统计推断的基础,12,随机化应贯穿于实验设计和实施的全过程,抽样的随机分组的随机实验顺序的随机方法:随机数字表随机排列表随机发生函数,13,常用的随机化方法,完全随机化:直接对受试对象进行随机分组编号,取随机数,确定组别2.分层随机化:先将研究对象按某一特征分层,然后按每层内进行完全随机化分层,编号,取随机数,确定组别,go7,14,(三)、重复原则,1.整个实验的重复:重现性,可靠性2.多个受试对象的重复:样本含量3.同一受试对象的重复观察:提高观察精度,分析变化趋势作用:估计实验误差,降低实验误差,go2,15,一、完全随机化设计,概念:将实验对象用随机的方法分配到处理组和对照组中,进行实验观察。方法:随机数字表,随机排列表优点:简单灵活易理解缺点:实验误差大,精确度低,只能研究一个因素,16,方法:1)编号2)查表3)按随机数分组,Sjtable,17,二、配对设计,将实验对象按一定条件配成对子,随机分配入实验组、对照组自身配对、非自身配对方法:配对,编号,查表,归组优点:抽样误差小,样本例数少,结果可靠缺点:资料难以获得,自愈性疾病不适用,18,三、随机区组设计(配伍组设计),概念:配对的扩大优缺点:同配对设计方法:区组,编号,查表,归组,19,四、交叉设计,将、两种处理因素先后施于同一批试验对象,随机地使半数对象先接受处理,后接受处理;另一半对象先接受处理,后接受处理。优点:实验误差能得到有效控制,实验效率高缺点:半衰期较长的药物不能使用,两种处理间不能有交互作用,20,例:以、两种药物治疗支气管哮喘病人16例,用交叉设计比较其疗效)编号)查随机排列表,随机指定第行,抄录0-15的随机数)任意规定:单数到甲组试验顺序为;双数到乙组顺序为,四、交叉设计举例,21,患者编号12345678910111213141516随机数9103150112158136124714组别甲乙甲甲乙甲乙甲甲乙甲乙乙乙甲乙用药顺序ABBAABABBAABBAABABBAABBABABAABBA结果:甲组:1346891115先后乙组:2571012131416先后,附表,22,五、析因设计,析因设计是一种多因素交叉分组设计,它不仅可以作每个因素各水平的比较,还可以进行交互作用的分析。交互作用:协同、拮抗交叉分组:每个因素的所有水平都互相交叉最常用的为:2析因设计,a(吸烟因素)b(接尘因素)a1(吸烟)a2(不吸烟)b1(接尘)a1b1a2b1b2(不接尘)a1b2a2b2,23,吸烟与接尘对FEF25-75%的影响,对照组接尘组吸烟不吸烟吸烟不吸烟X3.123.422.413.52S0.390.370.340.32n16141812,方差分析SSnMSFP总变异19.259接尘2.512.519.40.01吸烟7.717.760.20.01交互作用1.911.914.50.01,24,四个均数间关系吸烟不吸烟接尘2.410.05).接尘可加重吸烟对FEF25-75%的影响(P0.01),25,析因设计优缺点,优点:可进行多因素研究,可分析交互作用缺点:水平数多时,分组数太大22=424=1644=256组,go2,26,样本含量估计,在保证研究结论具有一定可靠性的条件下,确定最少的样本例数。样本含量过小:抽样误差大,结果不稳定,检验功效低,应有的差别不能显示。样本含量过多:费时、费力,非抽样误差增大。,27,误差来源,抽样误差:由抽样引起的样本统计量和总体参数间的差别客观存在,不可避免,但可以控制并可估计大小非抽样误差:由各种人为因素和偶然因素所造成过失误差:resultfromthemistakesduringtherecording,calculation,gatheringandunderstandingprocess.偏倚/系统误差:duetotheimprecisedesignplanandinaccuratemeasurement.Selectionbias;measurementbias;confoundingbias,28,误差控制方法,Qualitycontrolforthreestages:1.Design:严密设计研究的总体方案;明确定义研究对象,正确划分观察范围;正确选择观察指标;选择恰当的观察方式;预研究;2.Datacollection:研究人员的选择与培训;盲法观察结果;定期检查研究记录;检查研究对象的依从性情况。单盲和双盲:结果更可靠。3.Dataanalysis:分层分析以及多因素分析,29,案例讨论DiscussionofCases,案例13-1某市教育局2010年对小学生体质进行了一次抽样调查,以了解学生身体发育状况,为加强学校体育与健康教育提供基线资料。城市有30个学校,在校生约50000人,农村有18个学校,学生约10000人。在48个学校中,随机抽取10个班,以抽中班级的所有学生为调查对象,每班约50名学生,共调查500名学生。请讨论:(1)该调查是否随机抽样?样本的代表性如何?(2)你认为应当如何抽样?,30,案例13-2某学者研究某制剂对某基因突变影响的随机化临床试验,作者按照就诊对象的先后顺序分别将研究对象分为试验组(50例)和对照组(10例)研究结果显示试验组的基因突变率为9.8%6.70%;对照组的基因突变率为74.88%12.12%,通过卡方检验,发现两组的基因突变率差异有统计学意义,结论为试验组的制剂能够抑制该基因突变。(1)该研究实质应为何种研究方法?作者在设计方面有无问题?(2)统计分析方法是否正确,结论是否恰当?(3)你认为该课题应该如何设计和分析?,31,案例13-3某研究者研究某药物治疗铅中毒疗效时,采用治疗前后血铅和尿铅值为观察指标,共治疗铅中毒患者50名,测得结果为:治疗前血铅、尿铅分别为(0.190.028)mg/L、(0.120.009)mg/L,治疗后血铅、尿铅分别为(0.080.014)mg/L、(0.070.008)mg/L,血铅、尿铅治疗前后比较P值均小于0.05,差异具有统计学意义,结论为该药对铅中毒具有良好的治疗作用。(1)该研究设计存在哪些问题?(2)统计表达是否正确?(3)你认为该研应该如何设计?资料应如何表达?,32,案例13-4某医师观察某新药治疗急性支气管炎的疗效,用氨苄西林作为对照。按照患者入院时的体温进行分组,即体温39以下者分入实验组,体温39及以上者分入对照组,结论是新药疗效优于氨苄西林。(1)该医师结论是否正确?(2)研究设计存在什么问题?(3)应该如何正确设计?,GO,33,调查设计及电子化调查表制作,流行病与卫生统计学系刘沛,调查设计及电子化调查表,1.调查研究概念2.调查设计方法3.调查表结构4.电子化调查表制作,35,调查研究,概念:对研究对象进行客观真实的观察,并对观察结果进行描述和对比分析。特点:被动观察,往往不能施加处理因素常常不能完全随机分组应用:了解现状,探讨关系,36,调查研究分类,调查对象全面调查,抽样调查,典型调查调查时间横断面:现况调查纵向调查:病例对照研究,队列研究样本抽取方式概率抽样:简单,系统,分层,整群非概率抽样:偶遇,判断、定额、雪球,GO2,37,常用的随机抽样方法,1)单纯随机抽样(simplerandomsampling)2)系统抽样(systematicsampling)3)分层抽样(stratifiedsampling)4)整群抽样(clustersampling)5)多阶段抽样(multi-stagesampling),38,单纯随机抽样,抽样方法:将总体内的全部观察单位编号,再用随机化工具无放回地选出进入样本的号码,直至达到预定的样本例数为止。(等概率)优缺点:当总体内观察单位数不大时比较容易实施在总体含量过大而不易得到总体的完全列表时,可行性差。当个体变异大而样本量小时,样本的代表性差。适用范围:适用于总体内个体差异较小的小型调查和实验室研究。,39,系统抽样,抽样方法:将总体内的观察单位依次编号,确定抽样比,即确定从每多少个单元中抽一个单元进入样本。至于究竟抽其中第几个,则必须用随机化的方法决定。优缺点:简单,快速,方便,容易得到一个按比例分配的样本。当总体内观察单位按顺序有周期性或单调递增(或递减)趋势时,系统抽样可导致偏倚。适用范围:事先对总体内的个体分布有所了解,能识别可能存在的周期性。,40,分层抽样,抽样方法:在抽样过程中,将总体按某种特征划分为若干个组别、层次,从每层内独立抽取随机样本。每层具体抽样方法可用单纯随机抽样或系统抽样法。分层的原则是分层后层内变异尽可能小,而层间变异尽可能大。,41,分层抽样,比例分配最优分配,42,整群抽样,方法以自然存在的集体单位或人为划分的群体(例如家庭、街道、乡、村等)作为抽样单元。从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体全部加以调查。优缺点简单,快捷,易于得到样本,节省抽样费用。抽样误差较大,获得样本的代表性较差。适用范围适用于群内变异大而群间变异小的总体。,43,多阶段抽样,方法从总体中先抽取范围较大的单元,称为一级单元(例如县、区),再从每个抽中的一级单元中抽取范围较小的单元,称为二级单元(例如乡、街道),还可以从抽中二级单元中再抽取范围更小的三级单元(如村、居委会),甚至更小的单元,最后一级抽样单元可以是个体或者是群。各级抽样可结合使用不同的抽样方法,最简单的情形是二阶段抽样(two-stagesampling)。优缺点可以结合不同抽样方法方便地得到样本,以保证样本的代表性和控制抽样误差。统计分析较为复杂。适用范围大规模调查常采用多阶段抽样。,44,调查表结构,调查表的基本结构包括调查表的名称、编号、一般项目如姓名、性别、出生日期、出生地、民族等。调查研究项目如疾病史、职业暴露史、家族遗传史等。结束部分如调查员签字、调查日期等。,45,调查表结构,调查表的格式可分为一览表和一人一表式,一览表每张可填写多个观察单位,适用于项目较少的调查。一人一表式每张只填一个观察单位,适用于调查项目较多时。调查表的填写应力求简单清楚,多用选择、填空以及简单的符号或数字,少用文字回答。必要时应编制填写说明。,46,调查表结构,调查项目项目要精选,需要的项目一个也不可少,不需要的项目不应出现。问题的类型:封闭式,即针对某一问题同时列出两个或多个固定的答案供调查时选择填写。开放式,适用于较复杂的情况。它不限制答案的范围,让调查对象尽情应答。,47,小学生营养改进行动调查表,学校、班级编号、入组序号性别(1-男2-女)、家庭人口父亲职业(1-工人2-干部3-农民4-无业5-商人6-其他)母亲职业(1-工人2-干部3-农民4-无业5-商人6-其他)父亲文化(1-小学2-初中3-高中4-大学及以上)母亲文化(1-小学2-初中3-高中4-大学及以上),48,你知道吗,1、钙是我国居民膳食缺乏最明显的营养素,青少年尤为严重2、缺钙,会影响青少年骨骼、牙齿的发育3、奶类是膳食中钙的最好来源,而且吸收率高4、经常饮用牛奶,将有利于儿童的生长发育,使人终生受益5、豆类及其制品、虾皮等食物含钙也很多6、户外活动,晒太阳,有利于钙的吸收7、酸牛奶的营养价值比鲜牛奶的营养价值高8、喝牛奶肚子不舒服,是因为乳糖不耐受,可以喝酸牛奶9、您知道中国居民膳食指南的内容吗,49,调查表设计中应注意的问题,调查问题的多少应根据具体的研究目的,设置适当的问题数量。设计的问题过少,可能不足以得到所需信息,而设计问题过多,可能会导致研究对象反感,导致在最初几个问题之后,出现漏答和不准确答案。,50,调查表设计中应注意的问题,调查问题的顺序许多调查表往往以比较轻松的问题开始询问,可能的话,以研究对象感兴趣的问题开头。敏感的问题一般跟在相关的但不太敏感的问题之后。这样一方面可以通过比较轻松的问题在调查员与调查对象之间建立一种互信关系,另一方面避免因问题敏感而使调查对象不能很好合作。,51,调查表设计中应注意的问题,调查问题的用语调查表的类型确定后,调查员在拟定调查问题时,调查用语问题特别重要,应使用调查对象熟悉和容易理解的词语,在一些特殊人群中对某些现象常有特定的惯用语,需要通过深入访谈或预调查获得。,52,调查表设计中应注意的问题,4调查持续时间每份调查所需的时间与调查表设计的问题是密切相关的。一般情况下,面访30-90分钟;电话访问10-30分钟;信访10-20分钟,在实践中是可以被调查员和研究对象接受的。时间太长,研究对象难以坚持到访问结束,且随着访问时间的延长,调查员和调查对象的注意力难以集中,应答的质量会有明显下降。一份理想的调查表往往要经过预调查和在正式调查过程中反复予以修改完善而得到。,53,电子化调查表的制作,EpiData基本情况调查表生成与数据管理EpiData使用流程,54,EpiData基本情况,建立快捷的电子调查表和选择合适的数据管理软件是保证研究质量的重要措施参照EpiInfo6.0免费软件,丹麦学者LauritsenJM等人发起,BruusM编写程序而完成,目前为3.2版。安装时不受计算机设置的影响。无需安装或替换任何的DLL文件或系统文件,55,EpiData基本情况,能快速建立调查表,方便地进行数据录入,可校验录入、双份比较建立的数据库可转变成dBase、Excel文件以及SAS、SPSS和Stata统计分析软件的数据格式为数据管理软件,基本不具有统计分析功能。,56,EpiData基本情况,局限性1:是单用户程序,无网络版局限性2:记录数限制20万条左右局限性3:字段数限制999行内写完,57,EpiData的三种文件类型,QES文件(调查表文件):定义调查表(问卷)的结构;REC文件(数据文件):存放数据以及已经定义好的编码;CHK文件(核查文件):定义了数据输入时字段的有效性规则。,GO22,58,EpiData使用流程图,进入,59,建立调查表,建立数据定义是一基础性工作,也是关键性的工作在EpiData表现为建成QES文件,60,QES文件字段定义,字符型:用下划线数字型:用#号,每位一#,#.#逻辑型:用Y或N,、日期型:字段名框在之中,61,id(automaticidnumber)V1Sex#V2Heighy(meter)#.#V3Weight(kilo)#.#bmiBodyMassIndex#.#V4DateofbirthV5Agetoday#V6CountryofResidnece_,QES文件字段定义举例,62,生成字段名设置选项,63,生成字段名-几条规则,文本中优先选择用花括号括进的文本通用常见单词不作为字段名组成部分字段前为空,字段名就取前一个字段名再加上一个数字。如果不存在前一个字段名则使用隐含字段名FIELD1首字符为数字,则在首字符前插N大小写取决于“文件”菜单中“选项”,64,-问题产生的字段名使用规则-StateyournationalityNATIONRule1AllyoulikeisicecreamLICERule1WhatisyournameISYOURNARule23.question:N3QUESTIRule4-,经验:实际工作中,对以中文为语言的调查表,最好用花括号直接指定英文字段名。,65,变量标记,又称变量标签(variablelabel)是对字段内容的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论