医学研究的数据管理与分析-第四章常用研究设计的数据统计分析课件

上传人：嘻*** IP属地：江苏上传时间：2022-10-06 格式：PPT 页数：147 大小：3.33MB 积分：40 举报 版权申诉

已阅读5页，还剩142页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第四章常用研究设计的数据统计分析第四章常用研究设计的数据统计分析描述性研究分析性研究临床试验筛检与诊断试验常用试验设计及统计分析方法描述性研究(descriptive epidemiologic study)是指通过详细而正确的观察记录，查明人群中疾病或健康状态及其影响因素的分布特征。通过这类研究可以把所研究问题在特定时间的频率及其分布特点展示出来。 1.为当地疾病控制或健康促进工作提供基础资料； 2.提供疾病病因或危险因素的线索，为分析性研究假设的形成提供依据。第一节描述性研究（一）概念横断面调查是描述疾病或健康状况在特定时间内在某一地区人群中的分布状况。从时间上说，调查是在某一时点

2、或短时间内完成的，反映这一时点的疾病分布以及人群的某些特征与疾病的关系，好似时间上的一个横断面，故称横断面调查。第一节描述性研究一、横断面调查（二）分类普查和抽样调查是横断面调查的两种常见设计类型普查是指特定时间内，对一定范围的人群中每一成员进行调查。抽样调查是指从研究对象的总体中随机抽取部分有代表性的样本进行调查，根据调查结果估计出总体人群某病的患病率或某些特征的情况。第一节描述性研究一、横断面调查（三）横断面调查的特性与优缺点缺点:一般不适用于调查罕见病或急性病。对于前者调查所需样本量太大，对于后者查处的病例多为较长病程病例，选择偏倚大；调查人群或样本规模较大时，花费就大，而比较分析时

3、非病例数过多，统计学效率低；长病程病例经常有相对恶化和缓解期，可能把缓解期病例错划为无病；暴露疾病发生时间关系难以确定，致使在病因学研究上存在明显局限性。第一节描述性研究一、横断面调查（四）横断面调查的用途1描述疾病或健康状况的三间分布。2描述某些因素与疾病或健康状况之间的关系，为建立病因假设提供线索。3早期发现病人，以便早诊断、早治疗。4监测疾病，研究其发展趋势。5评价疾病防制措施的效果。第一节描述性研究一、横断面调查（一）概念追踪调查（follow-up survey)又称追踪观察，是对一批固定观察对象较长时期的追踪观察，以获得动态变化资料，并通过分析，找出规律，得出结论。第一节描

4、述性研究二、追踪调查（二）分类及应用追踪调查包括病因追踪、临床治疗效果随访、各种内外环境因素对人体影响的动态调查等。多用于需长期观察的研究课题，如追踪儿童少年生长发育或某群休健康状况、某种遗传病家系调查、危险因素对人体健康的影响、疾病自然史、疾病预后和远期防治效果等。第一节描述性研究二、追踪调查（三）统计分析方法病例随访资料，可比较不同样本生存期或缓解期长短。当观察例数较少时可作生存率曲线分析、时序检验或游程检验;观察例数较多时，可用寿命表法分析。若比较两样本的某时点生存率用u检验。比较样本间不同时点的生存率用生存率曲线图，比较样本间生存期的差别用时序检验、Mentel检验。调查危险因素时，

5、可进行危险度分析、分层分析、剂量反应关系的分析。调查儿童少年生长发育时，除应用一般形态指标、机能指标以及评价方法外，还可用曲线拟合的方法建立回归模型。同一群体内部可按年龄、性别等分组进行分层分析，但各组要有足够的样本例数。第一节描述性研究二、追踪调查（一）概念生态学研究是指以群体为单位收集和分析资料，研究某种因素或特征与疾病之间的关系，通过描述不同人群中某因素的暴露情况与疾病发生的频率，分析该因素与疾病的关系。第一节描述性研究三、生态学研究（二）分类与资料收集方法生态学研究分为生态比较研究和生态趋势研究两种。资料收集方法：收集疾病或健康状况的频数或频率资料;收集研究因素暴露的频数或频

6、率的资料。第一节描述性研究三、生态学研究（四）应用时注意事项生态学研究是一种粗线条的描述性研究，容易出现生态学谬误或偏倚，故下结论时应慎重。生态学研究缺乏控制潜在混杂因素的能力。应尽可能采用生态学同归分析，分析模型中应尽可能多地纳入一些混杂变量第一节描述性研究三、生态学研究分析性研究（analytical study）是检验病因假设的一种流行病学研究方法，它包括病例对照研究和队列研究。分析性研究与描述性研究同属观察性研究，但分析性研究设立了可供对比分析的对照组，而描述性研究无须设立对照。第二节分析性研究（一）定义、特点及类型定义：病例对照研究（case-control study）是选择

7、患有所研究疾病的人群作为病例组，选择未患所研究疾病的人群作为对照组，分别调查两组人群过去暴露于某个（些）暴露因素的比例，以判断暴露因素与该研究疾病有无关联。这种方法在时间上是回顾性的，故又称回顾性研究（retrospective study）。第二节分析性研究一、病例对照研究图1 病例对照研究示意特点：1属于观察法2设置对照组（有对照）3观察方向，由“果”及“因”（回顾性）4难以证实因果联系，仅示统计学关联。果因，回顾性研究。第二节分析性研究一、病例对照研究（二）统计分析方法为了考核病例组与对照组之间的可比性，还要进行均衡性检验。该检验是比较病例组与对照组之间除研究因素以外的基本特征是否

8、近似或齐同，以分析两组的可比性。若两组资料不均衡，分析时应考虑它可能对研究因素的影响。第二节分析性研究一、病例对照研究1成组病例对照研究资料分析资料整理成组病例对照研究资料可按表2，整理成四格表形式。计算比值比某暴露因素与疾病存在统计学联系，则应进一步估计暴露与疾病的联系强度。联系强度的指标是相对危险度（RR），RR是暴露组与非暴露组发病率之比，由于病例对照研究不能计算发病率，所以在病例对照研究中不能求得RR，而只能计算比值比（odds ratio，缩写为OR）来估计。比值比是指某事件发生的概率与不发生的概率之比。在病例对照研究中：比值比的含义是指暴露组的疾病危险性为非暴露组的多少倍。

9、当OR1时，说明病例组的暴露概率大于对照组，即暴露有较高的发病危险性；反之，当OR1说明暴露因素与疾病为正联系，暴露因素可能是危险因素；RR1说明暴露因素与疾病为负联系，暴露因素可能具有保护意义。不论是RR大于或小于1，距1越远，意义越大。下表提供了一种联系强度的判断标准。归因危险度（attributive risk，AR）：也称特异危险度，简称AR，或称RD（rate difference），是暴露组与非暴露组发病危险相差的绝对值，即危险特异地归因于暴露因素的程度。AR计算式如下：归因危险度百分比（attributive risk percent, ARP）：又称病因分值（etiologic

10、 fraction, EF），指暴露人群中归于暴露的发病或死亡占全部发病或死亡的百分比。人群归因危险度（population attributive risk，PAR）：它说明某一人群的某病发病率可归因于该暴露的部分。RR和AR都说明暴露的生物学效应，但不能说明其对一个人群的危害或消除这种因素后可能致发病率或死亡率下降的程度，即暴露的社会效应。PAR公式为：式中It为全人群的发病率，I0为非暴露组的发病率。人群归因危险度百分比（population attributive risk percent，PARP或PAR%）：它表示人群中暴露于某因素所致发病（死亡）率占全人群发病率（死亡）率的百分比

11、。PAR%不仅考虑了暴露的RR，而且与某因素在人群中的暴露率有关。（三）优点与局限性1）优点信息偏倚较小；能计算发病率及RR、AR；可进行剂量-反应关系的评价；可调查暴露与多种疾病的关系；暴露与疾病的时间先后顺序明确，可验证因果关系。第二节分析性研究二、队列研究（三）优点与局限性2）局限性需大量样本，费用高；不适应于罕见病；随访时间长；可能有失访。第二节分析性研究二、队列研究临床试验是指以患者为研究对象，以临床干预措施为研究内容，对比观察一干预措施效应的前瞻性实验研究。主要用于临床干预措施(药物、器械或治疗方法)效果和对预后影响的评价。第三节临床试验 (一)组间均衡性评价评价试验组和对

12、照组非处理因素是否一致，需作均衡性检验。计数资料(如比较受试者性别构成)比较通常采用丫检验;计量资料比较常用X2检验、ANOVA或秩和检验，对于等级资料通常用秩和检验。第三节临床试验一、临床试验结果的判定与评价 (二)疗效评价1.主要效应指标评定比较干预效应差异，可以将受试者治疗前后或试验组和对照组的观察结果，视资料类型按计量、计数、等级资料进行比较。2.综合疗效评定除了对受试者的症状、体征和理化指标需进行逐个分析外，还需将它们综合起来分析总的疗效，称为综合疗效评定。通常采用四级标准，即痊愈、显效、好转和无效。第三节临床试验一、临床试验结果的判定与评价 (三)安全性评价1.主要指标异常

13、改变分析比较试验药和对照药对患者某些理化指标有哪些影响，通常记录用药前后理化指标的“正常” 和“异常”例数情况2.不良事件及不良反应分析主要是对试验组和对照组的不良事件、不良反应及发生率进行描述和比较。第三节临床试验一、临床试验结果的判定与评价 (四)等效性检验等效性检验是指将试验药和临床已证实有效的药物进行比较检验两种药物的疗效是否具有等效性。等效性检验根据资料类型不同，选择不同的假设检验方法。第三节临床试验一、临床试验结果的判定与评价1.在临床试验的整个过程中，要注意研究对象的依从性。2.临床上同一疾病的不同患者其疾病类型、病情轻重、对各种治疗措施的反应等可能存在明显的差异

14、。3.由于临床试验是以人作为研究对象，所以应充分考虑受试者的安全及伦理学问题。由于心理的作用，可使结果产生偏倚。样本含量小，患者之间变异大，而样本的获得往往受多方面的限制，若变异太大就不能轻易作出结论。4.注意失访对研究结果的影响。第三节临床试验二、应用时注意事项（一）筛检的定义筛检指应用快速的试验、检查或其他方法，从表面上无病的人群中查出某病的可疑患者。第四节筛检与诊断试验一、筛检（二）分类（1）人群筛检：指用一定的筛检方法对一个人群进行筛检，查出其中患某病可能性较大的人，对其进一步诊断与治疗。（2）多级筛检：指应用多种筛检方法同时筛检多种疾病。（3）目标筛检：指对某种暴露人群、高危

15、人群、某单位、某职业人群定期进行健康检查，以早期发现病人，及时予以治疗.（4）机会筛检：指医务人员对来诊者加用其他筛检方法，以发现与主诉无关的疾病。第四节筛检与诊断试验一、筛检（三）筛检的目的与用途1早期发现和早期确诊；2研究疾病的自然史，或开展流行病学监测；3发现某病的高危人群，以减缓发病。第四节筛检与诊断试验一、筛检（四）疾病筛检与诊断的区别1对象是表面上无病的人群；2使用的方法必须是简便、快速、易行的；3筛检工作是医务工作者主动去发现病人；4筛检结果是初步的，需经诊断予以确认或排除。第四节筛检与诊断试验一、筛检（五）筛检的实施原则1被筛检疾病是该地区当前重大的公共卫生问题；2

16、所筛检疾病的自然史已了解较清楚；3被筛检的疾病，应有可识别的早期客观指征；4对被筛检出的疾病应提供进一步确诊的条件；5被筛检的疾病有恰当的治疗方法；6对确诊的病例提供治疗，有统一治疗方案和疗效判定标准；7筛检试验安全、经济、快速、真实性和可靠性好、预测值高；8筛检方法易为群众接受；9必须考虑筛检、诊断与治疗等的成本与效益问题；10筛检工作是按计划定期进行的连续过程。第四节筛检与诊断试验一、筛检（六）筛检试验（方法）的评价1简便快速、安全经济；2真实性好；3可靠性强；4预测值高；5易为群众接受。第四节筛检与诊断试验一、筛检（七）筛检工作的评价可以收获量、检出病人的预后和卫生经济学分析3方

17、面进行评价:1.收获量:是指经筛检后能发现多少原来未发现的病人得到相应的诊断和治疗。收获量影响因素:人群某病的患病率；筛检试验的敏感度；参加筛检的人数；筛检的类别；筛检的次数。第四节筛检与诊断试验一、筛检（七）筛检工作的评价2 检出病人的预后:1）病死率：比较筛检发现的患者死于该病的病死率是否低于未经筛检的患者；2）生存率：比较筛检发现的患者生存率是否高于未经筛检的患者；3）死亡率：比较筛检人群某病死亡率是否低于未经筛检的患者。第四节筛检与诊断试验一、筛检（七）筛检工作的评价3卫生经济学分析:1）成本效果分析：指实施筛检计划投入的费用及其获得的生物学效果，如每延长1年生存期所消

18、耗之成本。2）成本效益分析：指实施筛检计划投入的费用及其获得的经济效果比值。3）成本效用分析：指实施筛检计划投入的费用与取得的生命质量改善情况。第四节筛检与诊断试验一、筛检（一）定义诊断试验是指评价某种疾病诊断方法的临床试验。（二）分类按有无标准对照可分为标准对照诊断试验和参照诊断试验。可分为单项诊断试验和多项诊断试验，多项诊断试验包括联合诊断试验和序贯诊断试验两种形式。第四节筛检与诊断试验二、诊断试验（三）诊断试验的评价通常用待评价的诊断试验和金标准试验检测相同的受试对象，然后进行对比。临床常用的金标准包括病理学检查、外科一手术探查以及长期随访临床观察所获得的结论等。通过金标准的诊断

19、结果将被检验对象分为实际患某病(病例组)与未患某病(无病组)两组，同待评价的诊断试验检验得出的阳性或阴性结果整理成四格表形式,然后进行评价。第四节筛检与诊断试验二、诊断试验（三）诊断试验的评价第四节筛检与诊断试验二、诊断试验诊断试验的评价指标：诊断试验的评价指标可分为先验概率指标和后验概率指标两类。先验概率指标表示在已知受试者为患者或非患者的条件下，推测诊断结果是阳性或阴性、符合或不符合的概率；后验概率指标则是在已知诊断结果为阳性或阴性的条件下，推测受试者为患者或非患者的概率。属于先验概率指标的主要有灵敏度、特异度、诊断符合率、 Youden指数等。属于后验概率指标的主要有阳性预测值、

20、阴性预测值等。第四节筛检与诊断试验诊断试验有效性评价指标：敏感度=a / (a+c) 检出真有病的人能力特异度=d / (b+d) 检出真阴性的人能力假阴性率=c / (a+c)=1- 敏感度漏诊率假阳性率=b /(b+d)=1- 特异度误诊率第四节筛检与诊断试验敏感度、特异度、误诊率与漏诊率关系示意图诊断试验实用性评价指标：阳性预测值=a / (a+b) 阴性预测值=c / (c+d) 预测值的高低与疾病发（患）病率高低有关诊断试验评价的综合指标准确性=(a+d) /N 受抽样比和特异性影响阳性似然比=敏感性 / ( 1- 特异性）1有效阴性似然比=(1- 敏感性）/

21、特异性越小越好尤登指数(Youdens Index) J=1- (误诊率+漏诊率）=敏感性+特异性 1 （-11，J0时，无任何临床价值例为了评价CT诊断胰腺癌的价值，以病理学检查为金标准，选择胆管系统肿瘤、慢性胰腺疾患用为对照组。附表 CT诊断胰腺癌的评价 CT诊断胰腺癌合计有无阳性 44 35 79 阴性 11 23 34 合计 55 58 113实例分析结果敏感度=44/55=80%特异度=23/58=37.9%准确性=（44+23）/113=59.3%阳性预测值=44/79=55.7%阴性预测值=23/34=67.6%阳性似然比=0.8 / (1- 0.379)=1

22、.33阴性似然比=(1- 0.8) / 0.379=0.504J=0.8+0.379 1=0.179受试者工作特性曲线（ROC曲线）问题提出定量指标敏感度与特异度关系表4.5 诊断糖尿病时敏感度与特异度的关系口服葡萄糖2小时后敏感度特异度血糖水平(mg/100ml) （%）（%） 70 98.6 8.8 80 97.1 25.0 90 94.3 47.5 100 88.6 69.6 110 85.7 84.8 120 71.4 92.1 130 64.3 96.9 140 57.1 99.4 150 50.0 99.6 160 47.1 99.8 170 42.9 100.0

23、100 A 敏 75 感 50 度 25 % 20 40 60 80 100 1- 特异度% 图4.1 血糖测定诊断糖尿病的ROC曲线ROC曲线作用与统计分析分析与评价诊断试验的临床诊断价值；选择与确定用于临床诊断的界值；综合比较不同诊断试验（指标）优劣。绘制ROC曲线进行定性的分析、评价和比较；计算ROC曲线下的面积和可信区间，并作不同曲线间的假设检验；考虑其他影响因素时利用回归方法进行ROC曲线的分析、评价和比较。因素和水平：因素：研究者关心的实验条件；水平：因素的具体表现形式。例：温度（30、60、90）；药物种类（A、B、C）药；药物剂量（1、5、10）mg。第五节常用实验设计及

24、统计分析方法准备知识资料类型：定量（计量、计数）；定性（名义、有序）。计量资料（如成人血液中钾含量： 4.6mmol/L）；计数资料（如脉搏：72次/min）;名义资料（如血型：A、B、O、AB）；有序资料（如疗效：痊愈、好转、无效、死亡）。交互作用：假定某药对某病患者的疗效如下:药物剂量：小中大 A 优中差 B 中优差 C 差中优三种药对某病的疗效将随着剂量的改变而改变。 1、概念：完全随机设计：又称单因素设计，是将研究对象随机分到各组，或从不同的总体中随机抽取样本进行比较，它适用于两个或两个以上样本的比较。第五节常用实验设计及统计分析方法一、完全随机设计2、随

25、机化分组3、优缺点： (1)设计与分析简单,易于实施； (2)只能安排单因素； (3)随机误差相对较大； (4)个体变异较大，有些混杂因素难以控制或需要探索时，可采用分层随机设计方法：（1）编号：按动物体重依次编号为1,2,3,12号。（2）产生随机数字：对于每一个编号，依次由计算器（计算机）产生随机数（共12次）。（3）归组：事先规定将较小随机数的6只动物分入甲组，其他6只动物分入乙组。【例】设有同性别的动物12头，要求用随机方法将其分为甲、乙两组。随机化分组例2：试将18个病人随机分成3组编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

26、抄随机数 8 6 13 5 12 1 4 3 9 2 17 14 11 7 16 15 10 0 所属组别 B B C A C A A A B A C C B B C C B A A组 4 6 7 8 10 18 B组 1 2 9 13 14 17 C组 3 5 11 12 15 16 预选对象实验组对照组随机化受试者按纳入标准实验组对照组实验组实验组第一层第二层受试者预选对象按纳入标准按特征分层随机化随机化实验中仅涉及到一个具有两水平的因素；单因素K水平设计（K=2）在原本可以用配对设计的场合下，若配对条件无法满足，则可改用成组设计。成组设计：【例】今测得12名正常人和15名病毒性肝

27、炎患者血清转铁蛋白含量，结果如下：正常人 265.4 271.5 284.6 291.3 254.8 275.9 281.7 268.6 264.1 273.2 270.8 260.5 病毒性肝炎患者 235.9 215.4 251.8 224.7 228.3 231.1 253.0 218.8 233.8 230.9 240.7 221.7 256.9 260.7 224.4 问：患者和健康人的转铁蛋白之间的差别是否有显著性意义?成组设计（K=2）【例】有两组小儿肝炎患者，其一为甲、乙肝炎病毒混合感染，其二为重叠感染，治愈者的治愈天数如下：混合感染(n1=9)：55 25 14 26

28、 42 23 40 27 56 重叠感染(n2=9)：20 34 173 27 88 16 57 77 25 试比较两组疗效之间的差别有无显著性意义?【例】某医院妇产科为考察几种卵巢功能异常患者血清中促黄体素的水平，测定结果如下：卵巢发育不良 42.50 38.31 35.76 33.60 31.38 丘脑性闭经 6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.86 8.26 2.63 2.20 垂体性闭经 4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03 问：它们之间的差别是否有显著性意义?单因素K水平设计（K3）【例】研究

29、单味中药对小白鼠细胞免疫机能的影响，把40只小白鼠随机分为四组，每组10只，雌雄各半，用药15d后，进行E-玫瑰结形成率测定，结果如下：对照组 14 10 12 16 13 14 12 10 13 9 党参组 21 24 18 17 22 19 18 23 20 18 黄芪组 24 20 22 18 17 21 18 22 19 23 淫羊藿组 35 27 33 29 31 40 35 30 28 36 单因素四水平设计1、概念配对设计：是将受试对象按某些特征或条件配成对子(非随机)，然后分别把每对中的两个受试对象随机分配到试验组和对照组，再给予每对中的个体以不同处理，观察两组间的差别。二

30、、配对设计第五节常用实验设计及统计分析方法配对实验设计的两种情况：同源配对：同一受试对象用两种不同的实验方法；受试对象自身实验前后的对比。非同源配对：将具有相同条件的实验对象配成对子配对设计变型：治疗前后的比较，同一批标本分别用两种方法检测，同一批病人分别用两种方法诊断，局部试验中人体左右侧的对比； 2、随机分组 3、优缺点 (1) 组间可比性好，节省样本大小，试验效率高； (2) 对研究对象有一定的要求，临床上有一定难度【例】将已按近似条件配好的10对小白鼠，用随机方法分配到实验组和对照组。方法（1）编号：对小白鼠进行对子编号，同时每个对子内的二只小白鼠也分别编号。（2）产生随机数字

31、：对于每一组合编号，依次由计算器（计算机）产生随机数（共20个）。（3）归组（对子内两只小白鼠的随机）：事先规定每个对子内随机数字较小者分配到对照组；随机数字较大者分配到实验组。非同源配对随机化分组【例】某医院用中药治疗9例再生障碍性贫血患者，现将血红蛋白(g/L)变化的数据列在下面，问：治疗前后的差别是否具有显著性意义? 患者编号 1 2 3 4 5 6 7 8 9 治疗前血红蛋白 68 65 55 75 50 70 76 65 72 治疗后血红蛋白 128 82 80 112 125 110 85 80 105 【例】从八窝大白鼠中分别选出同性别、体重相近的两只，喂以水解蛋白和酪

32、蛋白的饲料，四周后测定其体重增加情况，结果如下：窝编号 1 2 3 4 5 6 7 8 含酪蛋白组 82 66 74 78 82 76 73 90 含水解蛋白组 15 28 29 28 24 38 21 37 问：两种饲料对大白鼠体重增加量之间的差别的影响有无显著性意义?【例】为研究三棱莪术液的抑瘤效果，将20只小白鼠按体重相近程度配成10对，然后把每对中的两只动物随机分到实验组和对照组中，两组动物都接种肿瘤，实验组在接种肿瘤三天后注射30的三棱莪术液0.5ml，对照组则不加任何处理，瘤体改变量资料如下：小白鼠对子号 1 2 3 4 5 6 7 8 9 10 对照组 3.6 4.5

33、 4.2 4.4 3.7 5.6 7.0 4.1 5.0 4.6 注射药液组 3.0 2.3 2.4 1.1 4.0 3.7 2.7 1.9 2.6 1.3 问：两组瘤体大小的均值之间的差别是否有显著性意义? 1、概念（1）随机区组设计：亦称配伍组设计。首先将条件相近的受试对象配成一个区组，如同种属、同性别、体重相近的动物，然后在各区组内按随机原则分组，每组分别子以不同的处理。配对设计的扩展，故又称配伍组设计第五节常用实验设计及统计分析方法三、随机区组（配伍组）设计 (2) 区组的定义：实验条件相同，实验对象性质相近的组称为区组（配伍组）。 (3) 随机区组设计的三个条件： a

34、一个试验由若干个区组组成 b 区组内研究对象的个数等于处理组数 c 区组内对象随机分到各处理组 (4) 随机区组设计的变型：治疗前后不同时间的比较，同一批样品不同方法或不同实验室检测进行比较。 3、优缺点 (1) 可安排一个因素，也可安排两个因素； (2) 误差小、均衡性好、节省样本含量，统计效率高； (3) 不能分析交互作用 (4) 区组内的对象在试验中易发生意外，影响整个试验。【例4】将【例1】中的12头动物设计分为三个区组，进行四种处理的比较。方法（1）编号：对12头动物进行区组编号，同时每个区组内的四头动物也分别编号。（2）产生随机数字：对于每一组合编号，依次由计算器（计算机）产生

35、随机数（共12个）。（3）归组（区组内四头动物的随机）：事先规定每一个区组内随机数字由小到大对应动物分别分配到甲、乙、丙、丁处理组。 1、概念交叉设计：是将受试对象随机分为两组，一组先给予A处理，后给予B处理(即A-B顺序);另一组先B后A(即B-A顺序)。或者一组先A后B再A(即A-B-A顺序)，另一组B-A-B顺序。两种处理方式在全部试验过程中交叉进行，前者交叉一次，叫一次交叉设计，又称二阶段交叉设计，后者交叉两次，叫二次交叉设计，又称三阶段交叉设计。为了避免前一阶段的处理效应对后一阶段的影响，在交叉设计的两个阶段之间有一个“洗脱期”;二次交叉设计，在第一、第二和第三阶段之间各有一个“洗

36、脱期”，“洗脱期”的长短需根据试验药物的半衰期、药物效应或血中药物浓度监测来决定。第五节常用实验设计及统计分析方法四、交叉设计优缺点：消除了试验顺序的影响；节省样本，控制条件，实验效率高；对两种处理的效应作出精细估计与比较；可以分析比较处理间（组间比较和病人内的比较）、病人间和先后顺序间的差异；（方差分析）两次观察时间不能过长，处理不能有持久效应；不能分析因素间的交互作用；同源配对设计的扩展随机化分组1组2组1组2组【例5】某研究者拟采用交叉设计观察A、B两种药物治疗18例高血压病患者的疗效。 1. 随机数字法（1）编号：将受试者分别编号为1、2、3、4、17、18号。（2）产生随机数字

37、：由计算器（计算机）产生18个随机数。（3）归组：随机数字较小的一半患者先用A药后用B药；较大的一半患者先用B药后用A药。 1、概念拉丁方设计：是用r个拉丁字母排成r行r列的方阵，使每行每列中每个字母都只出现一次，这样的方阵叫r阶拉丁方或rXr拉丁方。用拉丁字母安排处理因素，行和列安排控制因素，这样的试验称为拉丁方试验。拉丁方设计是从行和列两个方面来控制非处理因素对试验结果的影响。因此，拉丁方设计是配伍组设计思想的进一步扩展。拉丁方设计要求：必须是三因素同水平的试验。设计时根据拉丁字母安排处理因素。行和列安排控制因素，并使行数、列数与处理数都相等。任两因素间均无交互作用。各行、列、处理的方差齐

38、。第五节常用实验设计及统计分析方法五、拉丁方设计 2、设计方法与步骤根据处理因素的水平数选择一个基本型的拉丁方。一般情况下，处理水平数以5一8个为宜。对基本型拉丁方的随机化。随机化时必须整行(或列)进行交换，不能将行或列拆散。随机决定各字母所代表的处理。第五节常用实验设计及统计分析方法五、拉丁方设计 1、交互作用若一个试验中有两个因素（A和B），当A因素取不同水平时可使B因素的效应发生改变，反之，B因素取不同水平时也可使A因素的效应发生改变，则称A因素和B因素间有交互作用。两因素间的交互作用称为一阶交互作用，三因素及以上因素间的交互作用称为二阶或高阶交互作用。第五节常用实验设计及统计

39、分析方法六、析因设计 2、析因试验设计的概念(1) 析因试验设计方法是将每个因素的所有水平互相交叉组合在一起形成总的处理组(比较组)。因素B 因素A A1水平 A2水平 B1水平 a1b1 a2b1 B2水平 a1b2 a2b2 (2) 处理组数=水平数因素数例1. 2个因素,每个因素3个水平 32 =9析因试验设计（设计步骤） 1、确立试验的因素与水平例：某医院研究A、B两种物药对子宫的收缩作用，以大白鼠为研究对象，并考滤鼠内激素水平对收缩作用的影响，试作析因试验设计。考察因素为A药、B药和激素水平（C因素）3个，每个因素假设均为两个水平，试作析因试验设计。 2、确定试验总处理组数

40、23=8 3因素2水平交叉形成处理组处理组别试验条件 A药 B药激素水平 1 A1 B1 C1 2 A2 B1 C1 3 A1 B2 C1 4 A2 B2 C1 5 A1 B1 C2 6 A2 B1 C2 7 A1 B2 C2 8 A2 B2 C2 上例C因素为内在因素，处理组设置时通过选取不同水平的对象来实现3、确立各处理组的样本含量与研究对象的分配方法完全随机设计与配伍组设计的分配方法或其他方法 4、试验 5、统计分析方法方差分析析因设计的优缺点：可分析与比较多个因素的效应及相互间的交互作用；从各因素的全搭配中挑选出最佳试验条件（治疗方案）或最优试验条件的方向；每个因素的效应是在

41、其他因素变动条件下进行试验，结论较为可靠；对因素间交互作用分析较为完全，但当因素与水平过多,组数相当大,分析困难，故一般多用简单的析因试验。【例5】某医科大学病理生理学教研室研究三种因素“小鼠种别A、体重B和性别C”对皮下移植SRS瘤细胞生长特性影响的结果，A、B、C三因素各有两个水平。A分为A1：昆明种、A2：沪白1号；B分为B1：2425克，B2：1315克；C分为C1：雄性、C2：雌性。共选了24只小鼠，在接种后第8天测得肿瘤体积见表1，请问：这是一种什么设计类型?应当对此资料作怎样的分析?表1 三因素影响下小鼠第8天肿瘤体积因素肿瘤体积 (cm3) | C 因素A与B：A1(B1

42、B2) A2(B1 B2) C1 0.7069 1.0838 0.0628 0.4712 0.7854 0.9425 0.0942 0.0880 0.3581 0.3335 0.0471 0.1759 C2 0.0785 0.5027 0.0126 0.2246 0.1885 0.9550 0.0126 0.2513 0.3403 0.9215 0.0094 0.3676 0.2503 0.8514 0.0125 0.1327三因素析因设计第五节常用实验设计及统计分析方法七、正交设计问题提出因素与水平较多时 44=256 可否利用一部分因素水平的搭配试验，忽略高阶交互作用，又不降低试验

43、效率正交设计的概念：正交试验设计是利用已经设计好的正交表对多因素进行设计、试验和分析，其原理是根据各因素间的相互关系，从各因素各水平的全搭配中挑选若干必不可少的搭配进行试验，从而大大减少处理组数与试验次数。正交表是一种特别的表格，是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。正交表的记号及含义记号及含义正交表的列数（最多能安排的因素个数，包括交互作用、误差等）正交表的行数（需要做的试验次数）各因素的水平数（各因素的水平数相等）q正交表的代号如表示？表示各因素的水平数为2，做8次试验，最多考虑7个因素（含交互作用）的正交表。正交表的特点1、正交表中任意一列中，不同的数字出

44、现的次数相等；表示：在试验安排中，所挑选出来的水平组合是均匀分布的（每个因素的各水平出现的次数相同）均衡分散性2、正交表中任意两列，把同行的两个数字看成有序数对时，所有可能的数对出现的次数相同。表示：任意两因素的各种水平的搭配在所选试验中出现的次数相等整齐可比性这是设计正交试验表的基本准则正交试验设计的基本步骤确定目标、选定因素（包括交互作用）、确定水平；2. 选用合适的正交表；3. 按选定的正交表设计表头，确定试验方案；4. 组织实施试验；5. 试验结果分析。例1 为了解决花菜留种问题，以进一步提高花菜种子的产量和质量，科技人员考察了浇水、施肥、病害防治和移入温室时间对花菜留

45、种的影响，进行了四个因素各两个水平的正交试验，各因素及其水平如下表：因素水平1水平2A：浇水次数不干死为原则，整个生长期只浇水12次根据生长需水量和自然条件浇水，但不过湿B：喷药次数发现病害即喷药每半月喷一次C：施肥次数开花期施硫酸铵进室发根期、抽薹期、开花期和结果期各施肥一次D：进室时间11月初11月15日解第一步：选择适当的正交表这是一个四因素两水平的正交试验及分析问题，因此要选择型的表，且不考虑交互作用时，，仍然是满足条件的最小的正交表，所以选用正交表注：也可由试验次数应满足的条件来选择正交表。若考虑A与B、A与C的交互作用，则，而是满足条件的最小的正交表，所以还可选用正

46、交表其中：由确定。是可求出的，而是未知的，当不考虑交互作用时：可取故 N 不是唯一的。试验次数N的确定原则所以一般地，由确定 N，如三因素四水平 43 的正交试验至少应安排次以上的试验。如三因素四水平 43 并包括第一、二个因素的交互作用的正交试验至少应安排的试验次数为若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为次以上的试验。又如安排的混合水平的正交试验至少应安排所以一般地，有第二步表头设计查交互作用表表示位于第二、第四列的两因素的交互作用要放于第六列。如 L8（27）的交互作用表列号 1 2 3 4 5 6 7 1 （1） 3 2 5 4

47、7 6 2 （2） 1 6 7 4 5 3 （3） 7 6 5 4 4 （4） 1 2 3 5 （5） 3 2 6 （6） 1 注意：主效应因素尽量不放交互列。如A、B因素已放C1、C2列，则C 因素就不放C3列。花菜留种的表头设计列号 1 2 3 4 5 6 7因子考虑交互作用AB和AC，则例1的表头可设计为注：第6列为空白列，当随机误差列；也可把第7列作空白列。一般要求至少有一个空白列。按正交表得试验方案：只需将各列中的数字“1”、“2”分别理解为所填因素在试验中的水平数，每一行就是一个试验方案。第三步按所选定的正交试验方案组织试验，记录试验结果；水列平号试验号ABAXBC

48、AXCD产量12345671111111135021112222325312211224254122221142552121212200621221212507221122127582212112375 第四步分析正交试验结果方法1 直观分析（极差分析）（1）计算极差，确定因素的主次顺序第j列的极差或极差越大，说明这个因素的水平改变对试验结果的影响越大，极差最大的那个因素，就是最主要的因素。对例1来说，各因素的主次顺序为（2）确定最优方案如果不考虑交互作用，则根据各因素在各水平下的总产量或平均产量的高低确定最优方案；如果考虑交互作用，则取各种搭配下产量的平均数，按优化标准确定最优

49、方案。本例中，不考虑交互作用，在方案A1B2C2D2最优，但交互作用AC是第三重要因素，所以需考虑A、C的搭配对实验指标的影响，取AiBj的各种搭配的平均数，结果是A1与C1 搭配最好，故本问题的最优方案为A1B2C1D2。方法2 方差分析法基本思想与双因素方差分析方法一致：将总的离差平方和分解成各因素及各交互作用的离差平方和，构造F统计量，对各因素是否对试验指标具有显著影响，作F检验。第五节常用实验设计及统计分析方法十、重复测量设计重复测量设计：是指在不同的时间点上对同一个受试对象的某项指标进行重复测量。此种设计的特点是:不同时间点重复测量值之问存在自相关性;测定时间有时是等距的、

50、有时是不等距的;有时部分受试对象在最后的若干个时问点上出现缺失数据;观测指标有时是定量的、有时是定性的。【例3.1】将15只家兔随机地均分成3个组（处理因素A），即A1（适应组）、A2（平原组）、A3（急性缺氧组）。让全部家兔处于缺氧状态，对接受各种处理的每组家兔中的每一只，分别在缺氧的不同时间点（时间因素T，h）上观测血浆K+含量（ppm），即T1（缺氧前）、T2（缺氧0.5h）、T3（缺氧1h）、T4（缺氧2h）。设计格式和资料见表14.12.1，试判断此资料所取自的实验设计类型，并对资料作相应的统计分析。重复测量设计表14.12.1 接受不同处理的家兔血浆中K+含量的测定结果处理组家兔血浆中K+含量（ppm） (因素A) 编号缺氧时间T(h）： T1（0） T2（0.5） T3（1） T4（2）A1（适应组） 1 154.5 129.8 122.7 171.7 2 173.0 124.0 170.4 168.6 3 186.0 131.0 137.0 138.0 4 161.0 154.0 17

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

医学研究的数据管理与分析-第四章常用研究设计的数据统计分析课件

文档简介

温馨提示

最新文档

评论

医学研究的数据管理与分析-第四章 常用研究设计的数据统计分析课件

文档简介

温馨提示

最新文档

评论

相关文档

医学研究的数据管理与分析-第四章常用研究设计的数据统计分析课件