实验设计与分析-第一讲_第1页
实验设计与分析-第一讲_第2页
实验设计与分析-第一讲_第3页
实验设计与分析-第一讲_第4页
实验设计与分析-第一讲_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验设计与分析 方向文 主要内容o 实验设计基本原理o 实验设计方法及分析o 通过阅读相关文献对实验的设计和分析进一步认识实验设计(DOE) Design of Experiment 为什么要进行试验设计?实例这里有27个球, 其中有且只有一个球质量为9克, 其它26个都为10克。给你一架天平,请找出重为9克的那个球。请问,你至少要称几次?实验设计基本原理1.1 1.1 实验设计的意义和发展实验设计的意义和发展历程历程 。1.2 1.2 实验设计的三要素实验设计的三要素1.31.3 实验设计的四原则实验设计的四原则1.4 1.4 实验设计的类型实验设计的类型 。 实验设计的意义: 应用数理统计

2、学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。1.1:实验设计的意义及其发展过程1.1:进行实验设计的意义及其发展过程实验设计的发展过程:试验设计始于20世纪20年代,其发展过程大致可分为三个阶段:1. 早期的方差分析法: 20世纪20年代由英国生物统计学 家、数学家费歇(R.A.Fisher)提出的,开始主要应用于农业、生物学、遗传学方面,取得了丰硕成果。二战期间,英、美采用这种方法在工业生产中取得显著效果;2. 传统的正交试验设计法:以日本的田口玄一为代表;3. 三阶段设计:1957年,田口玄一提出信噪比设计法和产品的三阶段设计法。他把信噪

3、比设计和正交表设计、方差分析相结合,开辟了更为重要、更为广泛的应用领域。1.2 实验设计的三要素实验设计的三要素:实验设计的三要素:受试对象受试对象(object)实验效应实验效应(Experimental effect)实验处理实验处理(Treatment)受试对象受试对象处理因素处理因素实验效应实验效应其它因素其它因素其它效应其它效应举例:研究某肥料小麦的增产效应1.1.受试对象受试对象(Object): 可是生物体和非生物体,前者可是人、动物、植物、微可是生物体和非生物体,前者可是人、动物、植物、微生物。生物。保证其同质性和代表性明确其纳入标准和排除标准 抓住主要处理因素;抓住主要处理因

4、素; 区分处理因素与非处理因素;区分处理因素与非处理因素; 处理因素标准化,且实施中恒定不变。处理因素标准化,且实施中恒定不变。2.实验处理实验处理(Treatment): 研究者希望着重考察的某些实验条件,能引起受试对研究者希望着重考察的某些实验条件,能引起受试对象直接或间接反应的因素。象直接或间接反应的因素。 非实验处理非实验处理:与处理因素同时存在,能使受试对象:与处理因素同时存在,能使受试对象产生效应的因素,叫产生效应的因素,叫,因其常常干扰效应与所研究因,因其常常干扰效应与所研究因素间的观察与分析,又常叫素间的观察与分析,又常叫混杂因素混杂因素(Confounder)。研究中注意:研

5、究中注意:肺肺癌癌?年龄举例:考察吸烟与肺癌的关系3.实验效应实验效应( Experimental effect ): 是实验因素作用于受试对象的作用(是实验因素作用于受试对象的作用(response)和结)和结局(局(outcome),通过观察指标来体现的。),通过观察指标来体现的。指标选择:包括客观、主观指标;关键是选择好的指标。 准确性(准确性(accuracy) 精密性(精密性(precision) 特异性(特异性(specificity) 灵敏性(灵敏性(sensitivity)指标的选择:指标的选择:n 客观性客观性四四性性1.3 实验设计的四原则四原则:四原则:对照原则对照原则重

6、复原则重复原则随机原则随机原则英国统计学家英国统计学家 R.A.Fisher 提出实验设计四原则:提出实验设计四原则:均衡原则均衡原则1.3.1 对照原则对照原则(Control) 对照是比较的对象;设置的目的是控制混杂因素和偏对照是比较的对象;设置的目的是控制混杂因素和偏倚,以减少实验误差和系统误差。倚,以减少实验误差和系统误差。同期对照(concurrent control):在整个实验过程中,实验组与对照组始终处于同时同地。基线比较(baseline):对照组设置后,应检验两组开始时的状态是否均衡。 (1)空白对照空白对照(Blank control)对象对象 I处理效应处理效应其它因素

7、其它因素其它效应其它效应处理因素处理因素对象对象 II效应效应其它因素其它因素其它效应其它效应不处理不处理实验组:实验组:对照组:对照组: 空白对照空白对照(Blank control) 对照组不施加任何措施,反映研究对象在实验过程中对照组不施加任何措施,反映研究对象在实验过程中的自身变化。的自身变化。(2)标准对照)标准对照(Standard control):实用现有的标准实用现有的标准方法或常规方法,或现有的标准值或参考值作对照。方法或常规方法,或现有的标准值或参考值作对照。对象对象 I新效应新效应其它因素其它因素其它效应其它效应新处理新处理对象对象 II标准效应标准效应其它因素其它因素

8、其它效应其它效应实验组:实验组:对照组:对照组: 标准处理标准处理注意:注意:用现有的标准值或参考值作对照用现有的标准值或参考值作对照-不好!不好!(3)自身对照)自身对照(Self control):实验和对照在同一受试实验和对照在同一受试对象身上进行,如身体对称部分或前后接受两不同处理。对象身上进行,如身体对称部分或前后接受两不同处理。对象对象 IA效应效应其它因素其它因素其它效应其它效应A对象对象 IIB 效应效应其它因素其它因素其它效应其它效应B实验组:实验组:对照组:对照组:举例:举例:研究某治疗烧伤新药的疗效。研究某治疗烧伤新药的疗效。同个体某部位同个体某部位同个体对称的部位同个体

9、对称的部位 注意注意:单一的前后对照是不提倡的;要设对照组。:单一的前后对照是不提倡的;要设对照组。 前后对照不是同期对照;前后对照不是同期对照; 在实验中同样需要另设一个对照组,用处理前后效在实验中同样需要另设一个对照组,用处理前后效应的差值来比较实验组和对照组。应的差值来比较实验组和对照组。 农药农药患病植物患病植物(喷药前)(喷药前)患病植物患病植物(喷药喷药后)后)自身对照自身对照(Self control) 相互对照相互对照(Mutual control)对象对象 IA 效应效应其它因素其它因素其它效应其它效应处理处理A对象对象 IIB 效应效应其它因素其它因素其它效应其它效应处理处

10、理B实验组:实验组:对照组:对照组: 实验对照实验对照(Experimental control):对照组不施加对照组不施加处理因素,但施加与处理因素有关的实验因素。处理因素,但施加与处理因素有关的实验因素。对象对象 IA+B 效应效应其它因素其它因素其它效应其它效应A+B对象对象 IIB 效应效应其它因素其它因素其它效应其它效应B实验组:实验组:对照组:对照组:举例:举例:激素添加实验,考察补充赖氨酸对植物发育的影响激素添加实验,考察补充赖氨酸对植物发育的影响激素激素 + + 肥料肥料肥料肥料肥料肥料激素激素 + + 肥料肥料 历史对照历史对照(Experimental control):)

11、: 拿当前的实验结果与历史上的同类实验结果拿当前的实验结果与历史上的同类实验结果相比较,即为相比较,即为 ,一般不宜采用。,一般不宜采用。n 空白对照空白对照n 标准对照标准对照 n 自身对照自身对照n 相互对照相互对照n 实验对照实验对照n 历史对照历史对照对 照对 照 1.3.2 重复原则重复原则 在相同的实验条件下,进行多次研究或多次观察,在相同的实验条件下,进行多次研究或多次观察,以提高实验的可靠性和科学性。以提高实验的可靠性和科学性。重复实验:相同条件下,独立重复观测多个样品,或受试对象,目的是降低以个体差异为主的各种实验误差。关键:要有足够的样本含量。重复取样:同一时间点从同一受试

12、对象或样品中取多个样本,目的是看受试对象身上某定量观测指标含量的分布情况。重复测量:保证了观察结果的精度包括:包括:目的:目的:估计实验误差、降低实验误差。估计实验误差、降低实验误差。1.3.3 随机原则随机原则(Randomization )(一)目的:使实验组与对照组之间在非实验因素的分(一)目的:使实验组与对照组之间在非实验因素的分布尽量保持均衡一致,统计学上常采用随机化的方法。布尽量保持均衡一致,统计学上常采用随机化的方法。抽样的随机:每个附合条件的受试对象被抽取的机会均等。分组的随机:每个受试对象被分到各组的机会均等。实验顺序的随机:每个受试对象先后接受处理的机会均等。随机化应贯穿研

13、究设计和实施的全过程,包括:随机化应贯穿研究设计和实施的全过程,包括:抽样方法抽样方法概率抽样概率抽样非概率抽样非概率抽样单单纯纯随随机机抽抽样样整整群群抽抽样样分分层层随随机机抽抽样样系系统统抽抽样样(等距)(等距)雪雪球球抽抽样样定定额额抽抽样样立立意意抽抽样样偶偶遇遇抽抽样样随机抽样随机抽样抽样的随机:【例1】 某班有学生100名,采用单纯随机抽样的方法抽取15人参加英语口语考试。 单纯随机抽样(单纯随机抽样(simple random sampling) 【例2】如要在1000名新生中抽取50人作样本,其抽样间隔为100050=20;若随机抽取的第一号为8,则抽取的个体号依次为8,28

14、,48,68,882. 系统抽样系统抽样 (systematic sampling) 【例3】如调查某地区森林植被情况,可按植被长势(如好、中、差),在各个长势再随机抽样。 分层抽样(分层抽样(stratified sampling):先将总体全部个体按某种特征分成若干层,再从每:先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。一层内随机抽取一定数量的个体合起来组成样本。 【例4】如调查某县农村儿童贫血状况,可按乡镇分群体,再随机抽取几个乡镇,对其中的全部儿童进行调查。 整群抽样(整群抽样(cluster sampling):先将总体分成若干群,形成一个

15、抽样框;从中随:先将总体分成若干群,形成一个抽样框;从中随机抽取几个群体组成样本;对抽中群体的全部个体机抽取几个群体组成样本;对抽中群体的全部个体进行调查,称为整群抽样。进行调查,称为整群抽样。4. 整群抽样 Cluster samplingSection 4Section 5Section 3Section 2Section 11. 抽签或掷硬币2. 随机数字表 (Table of random number)3. 计算机的伪随机数发生器(Pseudo random number,PRN) 或:专业化软件RandA1.0(二)随机化的方法软件软件种子数种子数 表表5-1 随机数字表(随机数字

16、表的一部分)随机数字表(随机数字表的一部分) (三)常用的两种随机化方法1.完全随机化完全随机化(Complete randomization): 直接将受试对象进行随机化分组。直接将受试对象进行随机化分组。步骤:步骤: 编号:动物按体重大小、患者按就诊次序编号:动物按体重大小、患者按就诊次序 取随机数(与取随机数(与n的位数相同)的位数相同) 确定组别确定组别 举例:试将同性别、体重相近的 30只动物分到A、B、C三组。 编号编号 取随机数取随机数 定组别定组别 采用完全随机化进行分组,通常得到不同组的观察单位数不同。在实验设计时若希望各组的单位数相同,可采用对随机数排秩的办法,此时检验效能

17、最高。配对随机化配对随机化(Paired randomization):以:以“对子对子”为为层层区组随机化区组随机化(Block randomization): 以以“区组区组”为为层层步骤:步骤: 编号;编号; 取随机数;取随机数; 确定组别确定组别2.分层随机化分层随机化(Stratified randomization): 先对可能影响实验过程和结果的混杂因素分层,然先对可能影响实验过程和结果的混杂因素分层,然后在每一层内进行完全随机化,即是分层随机化。后在每一层内进行完全随机化,即是分层随机化。常用的有常用的有: 举例:为比较四种抗癌新药的疗效,将小白鼠体重作分层或区组因素,试分配处

18、理。 分层编号分层编号 取随机数取随机数 定组别定组别分层随机数随机数序号随机排列结果鼠1鼠2鼠3鼠4鼠1鼠2鼠3鼠4鼠1鼠2鼠3鼠41814677610132DACB2083974002301BCDA3992472480132DACBb337215992310BCAD表表8-2 小白鼠区组随机化的结果小白鼠区组随机化的结果 1.3.4 均衡原则均衡原则 所谓均衡就是指实验组与对照组之间在非实所谓均衡就是指实验组与对照组之间在非实验因素方面应力求均衡一致。验因素方面应力求均衡一致。 主要作用:是确保实验因素各水平组间不受主要作用:是确保实验因素各水平组间不受其他实验因素或重要的非实验因素的不平

19、衡的影其他实验因素或重要的非实验因素的不平衡的影响。响。 1.4 实验设计类型方法常用的实验设计方法:常用的实验设计方法:单因素设计单因素设计两两/ /多因素设计多因素设计单组设计单组设计配对设计配对设计成组设计成组设计单因素多水平设计单因素多水平设计分类分类随机区组设计随机区组设计交叉设计交叉设计析因设计析因设计重复测量设计重复测量设计总体总体1总体总体2样本样本1样本样本2随机抽样随机抽样随机抽样随机抽样研究对象研究对象总体总体样本样本随机抽样随机抽样随机分组随机分组样本样本1样本样本2方案方案 1 方案方案 2 1. 成组设计:成组设计:2. 配对设计配对设计(Paired design

20、) 将受试对象按一定条件配成对子,再随机分配将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组。每对中的两个受试对象到不同的处理组。 配对因素配对因素:可能影响实验结果的主要混杂因素:可能影响实验结果的主要混杂因素u 同源配对设计同源配对设计u 条件相似者配对设计条件相似者配对设计u 自身配对设计自身配对设计 包括:包括:A B配对设计配对设计:配对设计配对设计的主要形式有:的主要形式有:将两条件相同或相近的受试对象配成对子,分别接受将两条件相同或相近的受试对象配成对子,分别接受两种不同的处理。如:植物杂交配对实验。两种不同的处理。如:植物杂交配对实验。同一受试对象(植

21、物或标本)分别接受两种不同处理。同一受试对象(植物或标本)分别接受两种不同处理。前后配对:同一受试对象接受一种处理前后。前后配对:同一受试对象接受一种处理前后。优点优点:抽样误差小;抽样误差小; 实验效率较高;实验效率较高; 所需样本含量较小。所需样本含量较小。缺点缺点:配成对子比较困难;配成对子比较困难; 丢失对子丢失对子 配对欠佳或配对失败时,反而降低效率。配对欠佳或配对失败时,反而降低效率。3. 随机区组设计随机区组设计(Randomized block design) 又称随机单位组设计,随机配伍组设计。又称随机单位组设计,随机配伍组设计。n b 个区组:个区组:A 和和 Bn 每个区

22、组内:每个区组内:k 个受试对象个受试对象n k 个处理:有待比较个处理:有待比较特点:特点:将受试对象按性质(如动物按窝别、性别、体重;病将受试对象按性质(如动物按窝别、性别、体重;病人按病情、性别、年龄等非处理因素)相同或相近者人按病情、性别、年龄等非处理因素)相同或相近者组成组成b个区组(或称单位组、配伍组);个区组(或称单位组、配伍组);每个区组中每个区组中k个受试对象随机分配到每个区组个受试对象随机分配到每个区组k个处理个处理组中去。组中去。随机区组设计随机区组设计(配伍组设计)配伍组设计) A B C D 举例举例: 30只实验用大白兔,按窝别同,体重近划分为只实验用大白兔,按窝别

23、同,体重近划分为10个区组,每区组个区组,每区组3只大白兔随机采用只大白兔随机采用A、B、C三种处理方三种处理方案,问三方案处理后血白蛋白减少量有无不同?案,问三方案处理后血白蛋白减少量有无不同?随机区组设计:随机区组设计:优点优点:每个每个区组中区组中k个受试对象有较好的同质性个受试对象有较好的同质性 均衡性较好均衡性较好 易查出各处理间的差别易查出各处理间的差别缺点缺点:要求区组间受试对象数与处理数相等;要求区组间受试对象数与处理数相等; 若每区组试验过程中有一对象丢失,则若每区组试验过程中有一对象丢失,则整个区组就不能用了。整个区组就不能用了。 数据的丢失数据的丢失,统计麻烦,统计麻烦4

24、.4.交叉设计交叉设计(Cross-over design) 是一种特殊的自身对照设计,按事先设计好的试验是一种特殊的自身对照设计,按事先设计好的试验次序,在各个时期对研究对象实施各种处理,比较各处次序,在各个时期对研究对象实施各种处理,比较各处理组间的差异。理组间的差异。 两种处理:两种处理:A 和和 B 两个水平:两个水平:I 和和 II 随机分为两组:随机分为两组: 组组1 A 水平水平1、2 组组2 B水平水平1、222 交叉:交叉:能够分析:处理因素之间的差别能够分析:处理因素之间的差别 时间先后顺序的差别时间先后顺序的差别双因素设计双因素设计两阶段两阶段两处理两处理组别受试对象阶段

25、I清除阶段(wash out)阶段II组11处理A无处理处理B2n1组21处理B无处理处理A2n1表8-3 二阶段交叉设计模式 某医生为研究某新药某医生为研究某新药A治疗哮喘的疗效,以旧药舒喘宁治疗哮喘的疗效,以旧药舒喘宁B为对为对照。将照。将40名哮喘者随机分为名哮喘者随机分为2组,按组,按22交叉设计模式给药,测服交叉设计模式给药,测服药药8小时的小时的PEF值。值。优点优点:不受个体差异的影响。不受个体差异的影响。 所需样本例数可少一些;所需样本例数可少一些;缺点缺点:处理时间不能太长;处理时间不能太长; 受试对象在某一阶段退出实验,就会造成该阶段受试对象在某一阶段退出实验,就会造成该阶

26、段及以会数据的丢失。及以会数据的丢失。交叉试验:交叉试验:注意事项注意事项: 清除阶段旨在消除前一处理的剩余效应,其长短取决于清除阶段旨在消除前一处理的剩余效应,其长短取决于 药物在血清中衰减程度,一般大于药物在血清中衰减程度,一般大于68个半衰期。个半衰期。 盲法:以提高受试对象的依从性,避免偏倚。盲法:以提高受试对象的依从性,避免偏倚。 不宜用于有自愈倾向或病程较短的疾病研究。不宜用于有自愈倾向或病程较短的疾病研究。5. 析因设计析因设计(Factorial design) 又称又称完全完全交叉分组设计,是将两个或多个实验因素的各交叉分组设计,是将两个或多个实验因素的各水平进行组合,对各种

27、可能组合都进行实验,从而探讨:水平进行组合,对各种可能组合都进行实验,从而探讨: 各实验因素的主效应(各实验因素的主效应(main effect) 各因素间的交互作用(各因素间的交互作用(interaction):当某一因素在):当某一因素在各水平间变化时,另一个或多个因素各水平的效应也相应各水平间变化时,另一个或多个因素各水平的效应也相应地发生变化。地发生变化。表示方法:表示方法:1.等水平析因设计:等水平析因设计: m个因素、个因素、k个水平,记作:个水平,记作:mk2.不等水平析因设计:不等水平析因设计: 如如 3253表示:表示:3个因素个因素2个水平,个水平, 5个因素个因素3个水平个水平如如 32析因分析表示:析因分析表示:3个因素有个因素有2个水平个水平 举例举例: 某研究人员要了解某升白细胞(某研究人员要了解某升白细胞(A)和纯苯)和纯苯(B)对大鼠吞噬指数的影响,以及两者同时使用时)对大鼠吞噬指数的影响,以及两者同时使用时的效应,测得吞噬指数结果如下:的效应,测得吞噬指数结果如下:用升白药物(a1, i=1)不用升白药物(a2, i=2)用纯苯 ( b1, j=1 )不用纯苯( b2, j=1 )用纯苯 b1, j=1 )不用纯苯 ( b2, j=1 )Xijm1.943.801.853.882.503.902.013.842.034.06

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论