常用实验设计方法.ppt_第1页
常用实验设计方法.ppt_第2页
常用实验设计方法.ppt_第3页
常用实验设计方法.ppt_第4页
常用实验设计方法.ppt_第5页
免费预览已结束,剩余74页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用的实验设计方法 第二军医大学卫生统计学教研室孟虹 一种研究要最有效的实行 需要科学的设计方法 使得收集的数据适宜统计学方法的分析 得出客观和有效的结论 任何研究都存在两个问题 设计方法和统计分析 二者是紧密相连的 分析的方法依赖所用的设计 科研设计的步骤和内容 1 提出研究问题和假设2 选择研究对象 确定研究因素和对照组 3 确定测量指标与标准化和量化4 选择恰当的统计设计方法 5 科学估计样本含量 6 随机化分组和抽样7 避免机遇 偏倚造成的误差 确保结果的真实可靠 正确 8 采用正确的统计方法分析资料 实验 试验 设计方法概述 实验 试验 设计包括专业和统计学设计 专业设计考虑 确定研究的被试因素个数与水平数 受试对象 效应指标 可控的非处理因素等 统计设计方法选择 1 根据研究对象 可行性和结果要求精度 2 依据要说明因素数量 干预 试验 实验 研究 设计中的三个基本要素 1 实验因素 是人为施加于研究对象 需研究的因素 一般是单因素研究 但可以设置多因素研究 2 受试对象 为人 动物 标本 对象在来源 条件大致一致 3 试验效应 反映处理因素变化的指标 有主要效应指标 有关联性 客观性 和次要指标 实验因素 单因素实验 指实验中研究对象被干预的因素只有一个 因素包括g g 2 个水平 目的 分析不同水平实验结果是否有差别 多因素实验 指实验中研究对象被干预的因素不只一个 各因素的水平为 2 分析某因素不同水平的结果有无差别 分析多因素对实验结果有无交互作用 例4 2 表4 3研究一种降血脂新药的临床疗效 研究对象 高血脂病人处理因素 降血脂药因素水平 服降血脂新药分为2 4g组 4 8g组 7 2g组 安慰剂组试验效应指标 低密度脂蛋白特点 每个研究对象只接受该处理的一个水平 两因素设计 例 研究蛋白含量因素 A 分为正常 a1 和缺乏 a2 组 脂肪含量因素 B 分为正常 b1 缺乏 b2 组 对大鼠的营养状况研究 16只大鼠按完全随机化方法分到以下4组做试验 4种处理组某营养指标结果a1b1a1b2a2b1a2b215182025212328372528193532352640 一 常用实验 试验 设计 实验的定义是 对研究变量 x 做有目的改变 使他能看到和识别引起反应变量 y 的变化 实验研究的目的 1 确定那些实验因素变量 x 对效应指标 y 是有影响的2 确定有影响的x设置在什么水平上可使y接近所希望的值 实验设计的原理 分组实验效应实验组 T S1 E S1 对照组 C S2 0 S2 实验设计理论上组间随机误差S1 S2 两组结果 E S1 S2 差 E 即实验效应 设计的基本原则 对照 随机 重复 均衡 实验对象 处理因素 随机分组 常用的实验 试验 统计设计方法 单因素实验设计方法 使用研究对象1 完全随机分组多难控制2 随机配对或区组设计较多容易控制3 拉丁方设计少容易控制多个因素实验设计方法 使用研究因素1 析因设计多多结果2 正交设计较多多结果3 重复测量设计较多4 交叉设计少 一 单因素比较的设计方法 1 完全随机分组设计 completelyrandomdesign 定义 受试对象完全按随机原则分配到试验组和对照组 对他们的效应进行平行观察 最后对结果进行成组比较的统计分析 统计分析方法 两组或多组的t检验或方差分析 2等 完全随机分组同期研究的设计模式 研究对象纳入符合标准的研究对象随机化分组试验组对照组有效无效有效无效 试验措施 对照措施 优缺点 设计简单 适应面广 可分两组或多组 组间例数可等或不等 在例数较少时 临床研究 采用该设计 组间的均衡性较低 因此采用该设计实验样本例数较多 2 配对设计 配对的含义 指将研究对象按某些特征配成对子的设计方法 包括有 同体配对 用处理前后的比较或同个体两个器官给予不同处理比较 异体配对 不同个体组成对子 每对子中之一随机给予不同水平的处理 配对设计 应用范围 1 自身试验前后配对了解单个处理的效果 多用于急性和短期试验 临床研究观察短期治疗效果 2 同体左右的配对多用于局部用药研究 两种检验方法对同标本的对比 3 异体配对 主要为平行研究两处理的比较 满足条件都可用此方法 3 随机区组设计 区组也称为单位组 block 或配伍组 是配对设计的扩展 设计方法 1 研究对象按规定条件进行配伍 区组 2 区组内的对象数 处理组数3 在区组内随机化分组 分配各处理 规定条件是指希望控制的非处理因素 随机区组设计实例 观察三个染尘时期对肺湿重的结果 15只大鼠采用随机区组设计 1 将体重相似大鼠组成5个区组 区组内对象 3 2 区组内随机化分组如下 区组号12345对象编号123123123123123随机数122056901728342316704680 序号321132321213 规定 序号为1分到甲组 2为乙组 3为丙组 用二氧化硅50mg对15只大鼠染尘不同时期后全肺湿重的结果 区组号染尘1月3月6月13 34 43 623 64 44 634 33 65 144 14 55 054 24 75 5 配对和区组设计优缺点 1 配对 区组 控制非处理因素对结果影响 各处理组间均衡性较好 减少实验误差 2 样本例数少于完全随机分组例数 3 统计检验效率高 局限 临床研究和人群研究满足一定数量异体配对条件的对象较困难 配对设计数据不同饲料大鼠肝中维生素A含量 编号正常饲料缺乏维生素E1 1 070 7420 600 7230 900 5441 190 9651 140 9861 130 8171 040 7580 920 53均数0 99880 7538差值 0 2450 配对差值t 4 208 SE 0 0582 两均数t 2 735 SE 0 0896 1 配对比较样本例数是两组比较的1 2 两样本均数比较的例数估计公式 配对比较例数估计公式 2 配对和区组比较的实验误差小于完全随机分组 多因素试验设计问题 例 研究不同负荷 A因素 和不同航空装置 B因素 对呼吸阻力 A因素有三个水平 在自行车功量计上静坐 250与600kg min的体力负荷 B因素有两个水平 即YX 1与YX 3供氧系统 1 如12受试者 每人接受一种试验 应如何安排 2 如每人在一定时间内可重复接受所有试验 如何安排试验 1 析因设计简介 Factorialdesign 析因设计是研究两个或多个因素的效应及因素间交互作用的实验设计方法 特点 析因设计是各因素和各水平的全面组合试验 表示方法 第1因素的水平数 第2因素的水平数 如2 2 3 3 2 2 3或23 水平数因素数 2 2 2 例 研究蛋白含量因素 A 分为正常 a1 缺乏 a2 脂肪含量因素 B 分为正常 b1 缺乏 b2 对大鼠的营养状况研究 16只大鼠按完全随机化方法分到以下4组做试验 4种处理组某营养指标结果a1b1a1b2a2b1a2b215182025212328372528193532352640 用途和优缺点 用途 可比较各种组合 筛选最佳测定值方案 优点 1 可分析单因素的效应 也可分析因素之间的交互效应2 比单因素节省试验次数 统计效率高 缺点 如果因素和水平过多 则造成处理组数很多和样本例数多 实验样本例数 实验组合数 实验重复例数 例 研究电流和温度对某物质结果 y 的影响 因素 1 温度 25 50 2 电流 1K 3K单因素设计 固定电流 1K 了解温度对结果y值的影响 25 50温度 240230 210205 Y 单因素研究每个水平最少重复两次 D1 240 210 30D2 230 205 25 采用2 2析因设计 25 50 1K 3K 210 180 240 200 温度 电流 变化30 变动20 25 1k 25 3k 50 1k 50 3k 温度效应 固定因素温度的变化平均变化1Ky 240 210 30253Ky 200 180 20电流变化25度y 180 210 30 3550度y 200 240 40析因设计用4次试验代替单因素8次试验 得出两因素变化的效应 2 2析因实验设计方法 1 将2 2析因组合成4个处理组2 根据实验对象 动物 标本 人 选择分配处理随机化方法采用随机化方法 1 完全随机化分组2 随机区组3 每组例数至少2例4 每组例数要相等 2 2析因设计实例 例 比较两种神经缝合方法 A 和时间 B 对神经损伤轴突通过率的情况 缝合方法 外膜缝合 A1 束膜缝合 A2 缝合时间 B 1月 B1 2月 B2 用20只家兔用采用完全随机分组方法分为4组 分别给予4种处理 结果见表12 3 表11 1家兔神经缝合后轴突通过率 外膜缝合 A1 束膜缝合 A2 1月2月1月2月 a1b1 a1b2 a2b1 a2b2 10301050103020504070307050605060103030302444285212022014026074044001120048001440034800 表12 4资料析因试验方差分析表 变异来源SSdfMSFP处理组间26203主效应A18011800 6 0 05B2420124208 070 05误差480016300总742019 2 正交设计与方差分析 1 基本概念 析因设计 G个处理组的全面组合试验设计 例 25 32个处理组 在因素组合多时常采用正交设计 正交设计 是多因素非全面组合的实验设计 是析因设计的部分组合 如1 2G 1 3G 设计 用途和优点 用途 主要用于标本 动物试验 寻找影响因素和筛选最佳实验方案 优点 在不减少效率基础上 可成倍减少试验次数 特别适用多因素 3个及以上 的实验设计 假定 各因素无交互或只有一阶交互作用 2 正交实验设计方法 借助正交表 实验按正交表的表头和表体安排处理组表头用表示其中L 表示正交表N 试验次数 最多的处理组数 m 表示因素的水平数K 表示最多安排的因素例 正交设计表头 因素实施列号个数比例123456731ABABCACBCABC41 2ABABCACBCDCDBDAD 正交表体 处理组列号列号12345671111111121112222312211224122221152121212621221217221121182212112 注 1 某因素低水平 2 高水平 例 研究饲料中添加不同物质对大鼠血清胆固醇 y 的影响 因素和水平因素水平1水平2A胆酸不用胆酸0 3 胆酸B胆固醇不用胆固醇0 1 胆固醇C猪油不加猪油10 猪油D性别雌雄 大鼠血清胆固醇正交设计及实验结果 处理组ABCDA BA CB C结果 列号12473561111111133021122122340312122124034122122158152112221400621212124307221112251682222111558水平11657150316491857174717211869水平219042058191217041814184016922 1247555262 15367119 177 统计学方法 方差分析 变异来源SSDFMSFpA胆酸25421254229 70 001B胆固醇12834112834149 90 001C猪油288211283433 60 001D性别975197511 30 004AB18711872 10 159AC59015906 80 018B20 001误差1369 31685 53 用各处理3次测定值的均数计算方差分析 某人对研究4个因素对某产物的影响 希望找出最佳水平 实验方法 1 培养基含水量 水平 304050607080得出含水量在55 65较好 2 培养基的PH值 得出PH值在6 5 7 5较好 3 温度 202528303235得出培养温度在28较好 4 光线 强光避光得出 避光较好 最后得出的最佳水平 含水量在55 65较好 PH值在6 5 7 5较好 温度在28较好 避光较好 评述 本实验将4个因素在单因素状态得出的最佳水平 如放在一起做实验 结果会发生变化 因素之间一般会存在一定程度的交互作用 因此 结论不一定正确 设计 可考虑用正交设计 3 重复测量试验设计与方差分析 Repeatedmeasuresdesigns 析因设计的特例重复测量数据的定义指试验对象在给定处理后 对同一对象的观察指标在不同时点的测量 观察值间是有相关的 例 表12 6两种药物治疗前后舒张压结果 患者扶正胶囊患者可乐定编号0123天编号0123天11098 68 811106 26 36 52998 58 012107 06 06 0109 08 07 37 5208 06 06 06 0 Xi9381757592666464本例问 那种药物降血压更缓些 重复测量疗效比较的设计 回答 1 不同的药物 两组或多组 效果是否不同 2 不同时间点效果是否不同 3 时间和处理 药物 间有无交互作用设计要求 N个对象随机分为G 2组 给予不同处理 各组 n1 n2 例数可不等 2 所有对象观察时间点要相同 时间点 2 3 基线的测定值通常要有 重复测量疗效对比试验设计模式 设计模式 某指标不同时间测定值标准药A组0246 周 N对象Baseline随机B组0246 周 新药 n2 n1 重复测量数据统计分析方法 统计方法 重复测量数据的方差分析重复测量数据采用下列方法不正确析因设计方差分析完全随机分组方差分析随机区组方差分析 例 两种药物治疗前后结果的方差分析 表12 27 变异来源MSDFF值P值处理间 药物 19 0613122 070 0002测量时间23 6635355 790 0001处理 测量时间1 821834 300 0086研究对象的误差0 863618重复测量误差0 423654 重复测量数据统计分析的误用情况 1 重复测量数据疗效的比较不设平行对照组 2 有对照组 但采用其他统计分析方法 如t检验 随机区组或析因的方差分析计算 结果 1 将增大犯一型误差的概率 2 忽略时间点变化的特征 例 某处理因素对某指标在不同时间的效果比较 比较组np试验前205 5 21周后208 2 3 0 052周后2010 8 2 2 0 0014周后2012 6 3 1 0 001 指标的变化是处理的作用或是时间变化的作用 二 科学的选择样本例数 实验研究中的一个问题 我的这项研究应需要多少样本例数 统计上问你 你希望多大的差别能被查出 能容忍多大的错误结论风险 你研究的指标变异有多大 影响样本例数大小的因素 1 资料性质 计量数据可少于计数资料 2 实验效应 处理作用有多强 或比较组的差别 处理作用大 例数越小 3 误差大小 个体变异越小 例数越小 样本例数估计方法 1 公式计算法2 查表法 略 3 估计法 根据以往经验估计 大动物5 15只中等动物 兔 10 20只小动物 小鼠 15 30只人各组至少30以上 公式法估计样本含量的参数 研究者必须事先确定几个参数 1 犯 误差的概率 即 0 052 检验效能 1 有多大 常定为0 1或0 2 检验效能 1 不低于0 753 两种处理间最小有意义的差值 两均数之差两率之差4 研究指标的标准差或发生率有多大 统计检验效能 power 的概念 本身两总体参数有差别 在一定的样本例数下 统计检验的方法又能查出二者有差别的能力 概率 为检验效能 1 例 0 2 检验效能 1 0 2 0 8 1 两样本均数比较 样本例数估计公式法 n1或n2为每组需要的例数 对照与实验组比较最小有意义的差值 该指标的变异 可用样本的S作为估计值 例 饮食中降低盐的摄取能否降低血压的研究 1 设计 不配对的两组比较 将受试者分为低盐饮食组和高盐饮食组 预试调查时发现两组的血压标准差分别为12 和10 3 mmHg 如 0 05 0 10 希望两组比较有意义的最小平均差值 5 mmHg 问正式研究各组需要多少例数 式中的查t分布中的v 的值 本例方差 2 用样本的估计 双侧 单侧 样本例数估计 样本例数的估计含义本例各组至少调查86例 有90 的可能性查出两组的最小差别 即相差5 mmHg 例 某医院用新药和常规药治疗婴幼儿贫血 20名贫血患儿随机分成两组 测得血红蛋白增加量如下 问两组疗效有无差别 新药组n 10常规组n 10经统计检验问题 此结果是假阴性或是新药不比常规药更优 问 1 本例各组例数为10时 检验效能多大 2 如本例两组血红蛋白平均增加2 7单位为有临床意义 各组应多少病人时差别才统计意义 SAS软件计算 Group1Mean 23 6Group2Mean 20 9 2 7StandardDeviation 5Alpha 0 052 SidedTestN检验效能检验效能Nt值100 2080 700442 13200 3830 800552 39300 5380 900742 77400 664 两样本t检验 2 两样本率比较的样本含量 公式 P1和p2为各组率的估计值 例 观察两药对某病的疗效 初步试验甲药有效率为60 乙药为85 如 0 05 0 1 正式试验每组最少观察多少例 如 如 0 2 单侧 如两率相差15 0 05 0 1 各组需要n 159 三 实验 试验 中误差及控制 观察 实验 数据 x e真值误差误差 error 按产生分类 数据的误差 随机误差 系统误差1 随机误差 由个体变异 个体因素 和未知因素的 微小不可控因素造成 2 系统误差 可知或可控制因素造成 例如 仪器 测量方法 研究对象的选择 医生测量结果的标准不统一 造成测定值与真值的偏差 3 抽样误差 组间的变异与真值 总体指标 误差 试验中误差的控制和缩小 一 在设计阶段1 限制研究对象入选条件 实验和观察研究 2 配对和配伍的实验设计3 随机化和有一定例数4 盲法二 在资料分析阶段分层和多因素统计方法控制混杂因素 二在分析阶段混杂因素 变异控制方法 采用统计学方法1 单个因素控制 用分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论