研究生实验设计ppt课件.ppt_第1页
研究生实验设计ppt课件.ppt_第2页
研究生实验设计ppt课件.ppt_第3页
研究生实验设计ppt课件.ppt_第4页
研究生实验设计ppt课件.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第四章 研究设计基础,Design of Experiment 流行病与卫生统计学系 刘 沛,1,2,1. 实验设计的意义 2. 实验研究基本要素 3. 实验设计的基本原则 4. 常用的实验设计方案 5. 调查设计,2,3,医学研究基本过程,制定研究目的,建立专业假设 查阅文献资料 制定实验设计 进行实验,分析实验结果 发表研究成果,评价假设,3,4,一、实验设计意义,实验设计: 在实验前对实验所作出的计划和安排 专业设计:选题,建立实验方法等 先进性,实用性 统计设计:数据的收集整理和分析方法 科学性, 经济性,可重复性 意义: 用经济的人力、物力和时间得到可靠的结果 减少实验误差,对误

2、差大小作出估计,4,5,实验性研究与观察性研究,实验(Experiment)在特定条件下施于人为干预 观察(Observation): 在自然状态下不施加人为干预 试验(Trial): 以人为对象的实验,go2,5,6,二、 三个基本要素,1. 受试对象: 动物、人。同质性、代表性。 两个基本条件 (敏感,稳定) 2. 处理因素: 外部施加,内部固有 抓住主要因素 分清非处理因素(混杂因素,Confunding) 必须标准化 3. 实验效应: 指标选择 客观性、精确性、特异性和灵敏性,go2,6,7,三、 三项基本原则,对照原则 随机原则 重复原则,7,8,(一)、 对照原则,实验组和对照组除

3、了实验因素外,其它影响实验效应的非处理因素均应基本相同 Best的对照研究:X线照射脑垂体治疗高血压 照射组: 25人 17例下降 占68% 对照组:25人 19例下降占76% (双盲法) 对照的关键在于保持“均衡性” 甲(100)ADI() 乙(100)ADI(-),ADI 50()甲 ADI 50 () ADI 50() 乙 ADI 50 (),8,9,对照的种类,处理: 空白对照(安慰剂),相互对照 对象: 自身对照,实验对照 时间: 历史对照,同期对照 数目: 单个对照,双重对照,9,10,双 重 对 照,某降压冲剂的双重对照 组别 n 用药前 用药后 差值 配对 t 降压冲剂 25

4、160 19 133 15 27 21 6.43 安慰剂 20 168 24 154 22 14 28 2.24 两组 t 1.25 3.80 1.78,go7,10,11,(二)、随机化原则,概念: 采用随机的方式,使每个观察单位有同等 的概率被抽取 作用: 避免主观因素的参与 打破实验对象排列的系统性,控制系统误差 对意想不到的因素起平衡作用 统计推断的基础,11,12,随机化应贯穿于实验设计和实施的全过程,抽样的随机 分组的随机 实验顺序的随机 方法: 随机数字表 随机排列表 随机发生函数,12,13,常用的随机化方法,完全随机化:直接对受试对象进行随机分组 编号 ,取随机数, 确定组别

5、 2. 分层随机化:先将研究对象按某一特征分层,然后按每层内进行完全随机化 分层, 编号, 取随机数, 确定组别,go7,13,14,(三)、重复原则,1. 整个实验的重复:重现性,可靠性 2. 多个受试对象的重复:样本含量 3. 同一受试对象的重复观察:提高观察精度,分析变化趋势 作用: 估计实验误差,降低实验误差,go2,14,15,一、 完全随机化设计,概念: 将实验对象用随机的方法分配到处 理组和 对照组中,进行实验观察。 方法: 随机数字表,随机排列表 优点: 简单灵活易理解 缺点: 实验误差大,精确度低,只能研究一 个因素,15,16,方法:1)编号 2)查表 3)按随机数分组,S

6、j table,16,17,二、 配对设计,将实验对象按一定条件配成对子,随机分配入实验组、对照组 自身配对、非自身配对 方法:配对,编号,查表,归组 优点:抽样误差小,样本例数少,结果可靠 缺点:资料难以获得,自愈性疾病不适用,17,18,三、随机区组设计(配伍组设计),概念:配对的扩大 优缺点:同配对设计 方法:区组,编号,查表,归组,18,19,四、 交叉设计,将、两种处理因素先后施于同一批试验对象,随机地使半数对象先接受处理,后接受处理;另一半对象先接受处理,后接受处理。 优点:实验误差能得到有效控制,实验效率高 缺点: 半衰期较长的药物不能使用,两种处理间不能有交互作用,19,20,

7、例: 以、两种药物治疗支气管哮喘病人16例,用交叉设计比较其疗效 )编号 ) 查随机排列表,随机指定第行,抄录 0 - 15的随机数 )任意规定:单数到甲组试验顺序为 ;双数到乙组顺序为,四、 交叉设计 举例,20,21,患者编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 随机数 9 10 3 15 0 11 2 1 5 8 13 6 12 4 7 14 组别 甲 乙 甲 甲 乙 甲 乙 甲 甲 乙 甲 乙 乙 乙 甲 乙 用药顺序 AB BA AB AB BA AB BA AB AB BA AB BA BA BA AB BA 结果:甲组:1 3 4 6 8

8、 9 11 15 先后 乙组:2 5 7 1 0 12 13 14 16 先后,附表,21,22,五、析因设计,析因设计是一种多因素交叉分组设计,它不仅可以作每个因素各水平的比较,还可以进行交互作用的分析。 交互作用:协同、拮抗 交叉分组:每个因素的所有水平都互相交叉 最常用的为: 2析因设计,a (吸烟因素) b(接尘因素) a1(吸烟) a2(不吸烟) b1 (接尘) a1b1 a2b1 b2 (不接尘) a1b2 a2b2,22,23,吸烟与接尘对 FEF25-75%的影响,对照组 接尘组 吸烟 不吸烟 吸烟 不吸烟 X 3.12 3.42 2.41 3.52 S 0.39 0.37 0

9、.34 0.32 n 16 14 18 12,方 差 分 析 SS n MS F P 总 变 异 19.2 59 接 尘 2.5 1 2.5 19.4 0.01 吸 烟 7.7 1 7.7 60.2 0.01 交互作用 1.9 1 1.9 14.5 0.01,23,24,四个均数间关系 吸烟 不吸烟 接 尘 2.41 0.05 ) .接尘可加重吸烟对FEF25-75%的影响 (P 0.01 ),24,25,析因设计优缺点,优点:可进行多因素研究,可分析交互作用 缺点: 水平数多时,分组数太大 22=4 24=16 44=256组,go2,25,26,样本含量估计,在保证研究结论具有一定可靠性的

10、条件下,确定最少的样本例数。 样本含量过小:抽样误差大,结果不稳定,检验功效低,应有的差别不能显示。 样本含量过多:费时、费力,非抽样误差增大。,26,27,误差来源,抽样误差: 由抽样引起的样本统计量和总体参数间的差别 客观存在,不可避免,但可以控制并可估计大小 非抽样误差: 由各种人为因素和偶然因素所造成 过失误差:result from the mistakes during the recording, calculation, gathering and understanding process. 偏倚/系统误差:due to the imprecise design plan a

11、nd inaccurate measurement. Selection bias; measurement bias; confounding bias,27,28,误差控制方法,Quality control for three stages: 1.Design: 严密设计研究的总体方案;明确定义研究对象,正确划分观察范围;正确选择观察指标; 选择恰当的观察方式;预研究; 2.Data collection:研究人员的选择与培训;盲法观察结果;定期检查研究记录;检查研究对象的依从性情况。 单盲和双盲:结果更可靠。 3.Data analysis:分层分析以及多因素分析,28,29,案例讨论

12、 Discussion of Cases,案例13-1 某市教育局2010年对小学生体质进行了一次抽样 调查,以了解学生身体发育状况,为加强学校体育与健康教 育提供基线资料。城市有30个学校,在校生约50000人,农 村有18个学校,学生约10000人。在48个学校中,随机抽取 10个班,以抽中班级的所有学生为调查对象,每班约50名学 生,共调查500名学生。请讨论: (1)该调查是否随机抽样?样本的代表性如何? (2)你认为应当如何抽样?,29,30,案例13-2 某学者研究某制剂对某基因突变影响的随机化临 床试验,作者按照就诊对象的先后顺序分别将研究对象分为 试验组(50例)和对照组(10

13、例)研究结果显示试验组的基 因突变率为9.8%6.70%;对照组的基因突变率为 74.88%12.12%,通过卡方检验,发现两组的基因突变率 差异有统计学意义,结论为试验组的制剂能够抑制该基因突 变。 (1)该研究实质应为何种研究方法?作者在设计方面有无问题? (2)统计分析方法是否正确,结论是否恰当? (3)你认为该课题应该如何设计和分析?,30,31,案例13-3 某研究者研究某药物治疗铅中毒疗效时,采用治 疗前后血铅和尿铅值为观察指标,共治疗铅中毒患者50名, 测得结果为:治疗前血铅、尿铅分别为(0.190.028) mg/L、(0.120.009)mg/L,治疗后血铅、尿铅分别为 (0

14、.080.014)mg/L、(0.070.008)mg/L,血铅、尿铅 治疗前后比较P值均小于0.05,差异具有统计学意义,结论 为该药对铅中毒具有良好的治疗作用。 (1)该研究设计存在哪些问题? (2)统计表达是否正确? (3)你认为该研应该如何设计?资料应如何表达?,31,32,案例13-4 某医师观察某新药治疗急性支气管炎的疗效,用 氨苄西林作为对照。按照患者入院时的体温进行分组,即体 温39以下者分入实验组,体温39及以上者分入对照组, 结论是新药疗效优于氨苄西林。 (1)该医师结论是否正确? (2)研究设计存在什么问题? (3)应该如何正确设计?,GO,32,33,调查设计及电子化调

15、查表制作,流行病与卫生统计学系 刘 沛,33,调查设计及电子化调查表,1. 调查研究概念 2. 调查设计方法 3. 调查表结构 4. 电子化调查表制作,34,35,调查研究,概念: 对研究对象进行客观真实的观察,并对观察结果进行描述和对比分析。 特点: 被动观察,往往不能施加处理因素 常常不能完全随机分组 应用: 了解现状,探讨关系,35,36,调查研究分类,调查对象 全面调查, 抽样调查, 典型调查 调查时间 横断面:现况调查 纵向调查:病例对照研究,队列研究 样本抽取方式 概率抽样:简单,系统,分层,整群 非概率抽样:偶遇,判断、定额、雪球,GO2,36,37,常用的随机抽样方法,1) 单

16、纯随机抽样(simple random sampling) 2) 系统抽样(systematic sampling) 3) 分层抽样(stratified sampling) 4) 整群抽样(cluster sampling) 5) 多阶段抽样(multi-stage sampling),37,38,单纯随机抽样,抽样方法: 将总体内的全部观察单位编号,再用随机化工具无放回地选出进入样本的号码,直至达到预定的样本例数为止。(等概率) 优缺点: 当总体内观察单位数不大时比较容易实施 在总体含量过大而不易得到总体的完全列表时,可行性差。当个体变异大而样本量小时,样本的代表性差。 适用范围: 适用于

17、总体内个体差异较小的小型调查和实验室研究。,38,39,系统抽样,抽样方法: 将总体内的观察单位依次编号,确定抽样比,即确定从每多少个单元中抽一个单元进入样本。至于究竟抽其中第几个,则必须用随机化的方法决定。 优缺点: 简单,快速,方便,容易得到一个按比例分配的样本。 当总体内观察单位按顺序有周期性或单调递增(或递减)趋势时,系统抽样可导致偏倚。 适用范围: 事先对总体内的个体分布有所了解,能识别可能存在的周期性。,39,40,分层抽样,抽样方法: 在抽样过程中,将总体按某种特征划分为若干个组别、层次,从每层内独立抽取随机样本。每层具体抽样方法可用单纯随机抽样或系统抽样法。分层的原则是分层后层

18、内变异尽可能小,而层间变异尽可能大。,40,41,分层抽样,比例分配 最优分配,41,42,整群抽样,方法 以自然存在的集体单位或人为划分的群体(例如家庭、街道、乡、村等)作为抽样单元。从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体全部加以调查。 优缺点 简单,快捷,易于得到样本,节省抽样费用。 抽样误差较大,获得样本的代表性较差。 适用范围 适用于群内变异大而群间变异小的总体。,42,43,多阶段抽样,方法 从总体中先抽取范围较大的单元,称为一级单元(例如县、区),再从每个抽中的一级单元中抽取范围较小的单元,称为二级单元(例如乡、街道),还可以从抽中二级单元中再抽取范围更小的三级单

19、元(如村、居委会),甚至更小的单元,最后一级抽样单元可以是个体或者是群。各级抽样可结合使用不同的抽样方法,最简单的情形是二阶段抽样(two-stage sampling)。 优缺点 可以结合不同抽样方法方便地得到样本,以保证样本的代表性和控制抽样误差。统计分析较为复杂。 适用范围 大规模调查常采用多阶段抽样。,43,44,调查表结构,调查表的基本结构包括调查表的名称、编号、一般项目如姓名、性别、出生日期、出生地、民族等。 调查研究项目如疾病史、职业暴露史、家族遗传史等。 结束部分如调查员签字、调查日期等。,44,45,调查表结构,调查表的格式可分为一览表和一人一表式,一览表每张可填写多个观察单

20、位, 适用于项目较少的调查。一人一表式每张只填一个观察单位,适用于调查项目较多时。调查表的填写应力求简单清楚,多用选择、填空以及简单的符号或数字,少用文字回答。必要时应编制填写说明。,45,46,调查表结构,调查项目 项目要精选,需要的项目一个也不可少,不需要的项目不应出现。 问题的类型: 封闭式,即针对某一问题同时列出两个或多个固定的答案供调查时选择填写。 开放式,适用于较复杂的情况。它不限制答案的范围,让调查对象尽情应答。,46,47,小学生营养改进行动调查表,学校、班级编号、 入组序号 性别 (1-男 2-女)、家庭人口 父亲职业 (1-工人 2-干部 3-农民 4-无业 5-商人 6-

21、其他) 母亲职业 (1-工人 2-干部 3-农民 4-无业 5-商人 6-其他) 父亲文化 (1-小学 2-初中 3-高中 4-大学及以上) 母亲文化 (1-小学 2-初中 3-高中 4-大学及以上),47,48,你知道吗,1、钙是我国居民膳食缺乏最明显的营养素,青少年尤为严重 2、缺钙,会影响青少年骨骼、牙齿的发育 3、奶类是膳食中钙的最好来源,而且吸收率高 4、经常饮用牛奶,将有利于儿童的生长发育,使人终生受益 5、豆类及其制品、虾皮等食物含钙也很多 6、户外活动,晒太阳,有利于钙的吸收 7、酸牛奶的营养价值比鲜牛奶的营养价值高 8、喝牛奶肚子不舒服,是因为乳糖不耐受,可以喝酸牛奶 9、您

22、知道中国居民膳食指南的内容吗,48,49,调查表设计中应注意的问题,调查问题的多少 应根据具体的研究目的,设置适当的问题数量。设计的问题过少,可能不足以得到所需信息, 而设计问题过多,可能会导致研究对象反感,导致在最初几个问题之后,出现漏答和不准确答案。,49,50,调查表设计中应注意的问题,调查问题的顺序 许多调查表往往以比较轻松的问题开始询问,可能的话,以研究对象感兴趣的问题开头。敏感的问题一般跟在相关的但不太敏感的问题之后。这样一方面可以通过比较轻松的问题在调查员与调查对象之间建立一种互信关系,另一方面避免因问题敏感而使调查对象不能很好合作。,50,51,调查表设计中应注意的问题,调查问

23、题的用语 调查表的类型确定后, 调查员在拟定调查问题时, 调查用语问题特别重要, 应使用调查对象熟悉和容易理解的词语,在一些特殊人群中对某些现象常有特定的惯用语,需要通过深入访谈或预调查获得。,51,52,调查表设计中应注意的问题,4调查持续时间 每份调查所需的时间与调查表设计的问题是密切相关的。一般情况下,面访30-90分钟;电话访问10-30分钟;信访10-20分钟,在实践中是可以被调查员和研究对象接受的。时间太长, 研究对象难以坚持到访问结束,且随着访问时间的延长,调查员和调查对象的注意力难以集中,应答的质量会有明显下降。 一份理想的调查表往往要经过预调查和在正式调查过程中反复予以修改完

24、善而得到。,52,53,电子化调查表的制作,EpiData基本情况 调查表生成与数据管理 EpiData使用流程,53,54,EpiData基本情况,建立快捷的电子调查表和选择合适的数据管理软件是保证研究质量的重要措施 参照EpiInfo 6.0免费软件,丹麦学者Lauritsen JM等人发起, Bruus M编写程序而完成,目前为3.2版。 安装时不受计算机设置的影响。无需安装或替换任何的DLL文件或系统文件,54,55,EpiData基本情况,能快速建立调查表,方便地进行数据录入,可校验录入、双份比较 建立的数据库可转变成dBase、Excel文件以及SAS、SPSS和Stata统计分析

25、软件的数据格式 为数据管理软件,基本不具有统计分析功能。,55,56,EpiData基本情况,局限性1:是单用户程序,无网络版 局限性2:记录数限制20万条左右 局限性3:字段数限制999行内写完 ,56,57,EpiData的三种文件类型,QES文件(调查表文件):定义调查表(问卷)的结构 ; REC文件(数据文件):存放数据以及已经定义好的编码; CHK文件(核查文件):定义了数据输入时字段的有效性规则。,GO22,57,58,EpiData使用流程图,进入,58,59,建立调查表,建立数据定义是一基础性工作,也是关键性的工作 在EpiData表现为建成QES文件,59,60,QES文件字

26、段定义,字符型:用下划线 数字型:用#号,每位一#,#.# 逻辑型:用Y或N,、 日期型: 字段名框在 之中,60,61,id (automatic id number) V1 Sex # V2 Heighy (meter) #.# V3 Weight (kilo) #.# bmi Body Mass Index #.# V4 Date of birth V5 Age today # V6 Country of Residnece _,QES文件字段定义举例,61,62,生成字段名设置选项,62,63,生成字段名-几条规则,文本中优先选择用花括号括进的文本 通用常见单词不作为字段名组成部分 字

27、段前为空,字段名就取前一个字段名再加上一个数字。如果不存在前一个字段名则使用隐含字段名FIELD1 首字符为数字,则在首字符前插N 大小写取决于“文件”菜单中“选项”,63,64,- 问题 产生的字段名 使用规则 - State your nationality NATION Rule 1 All you like is icecream LICE Rule 1 What is your name ISYOURNA Rule 2 3.question: N3QUESTI Rule 4 -,经验:实际工作中,对以中文为语言的调查表,最好用花括号直接指定英文字段名。,64,65,变量标记,又称变量标签(variab

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论