资源目录
压缩包内文档预览:
编号:67665722
类型:共享资源
大小:7.33MB
格式:ZIP
上传时间:2020-04-06
上传人:独**
认证信息
个人认证
王**(实名认证)
江苏
IP属地:江苏
20
积分
- 关 键 词:
-
中山
卫生
统计
课件
- 资源描述:
-
中山卫生统计课件,中山,卫生,统计,课件
- 内容简介:
-
医学统计学 Ji QianFangSchoolofPublicHealthSunYat SenUniversity 第4章假设检验基本概念与t检验 总体均数的假设检验 Example3 1 续 随机抽取20名某病患者 测定血沉样本均数 9 15 mm h 样本标准差 2 13 mm h 问 总体均数是否如文献所报道 两种可能 1 总体均数是10 50 样本均数 9 15是抽样误差造成的 零假设或无效假设 2 总体均数不是10 50 所以样本均数 9 15 对立假设 问 以上哪一个是对的 假设检验问题 基本逻辑 零假设成立的话 有多大的可能出现目前的情形以及更不利于零假设的情形 计算一个概率值 值 如果零假设成立时 不大可能发生目前的情形以及更不利于零假设的情形 则拒绝 否则 不拒绝 什麽叫 不大可能 给定一个 小 的概率 如果 就认为 不大可能 称为检验水准 levelofthetest Example4 1一项大规模调查报告 健康男子脉搏平均值为72次 分 某医生在山区随机抽取25名健康男子 测定他们的脉搏 样本均数 75 2次 分样本标准差 6 5次 分可否下结论 山区健康男子脉搏的平均值不同于一般健康男子脉搏的平均值 1 完全随机设计一组资料的t检验 可否认为上述P 值 介于0 005和0 001之间 比较小 可以 因为我们规定 在H0成立的前提下 目前的情形以及更不利于零假设的情形不大可能发生 小的P 值表明现有的资料不太支持零假设 给定零假设和检验水准 2 选择适当的检验 计算检验的统计量若X服从正态分布则 当时 根据现有样本 3 确定P值 并作决策 当成立 目前的情形 样本均数 72 5 以及更不利于零假设的情形 样本均数 72 5和样本均数 72 5 出现的概率 0 05 目前的情形以及更不利于零假设的情形出现的概率称为P值 现P 我们决定拒绝 单侧检验 当且仅当有过硬的证据表明另一侧肯定是不可能的 才能使用单侧检验 4 3随机化配对设计资料的t检验 假定差值服从正态分布 上述方法可以应用 Example4 3假定某地区健康男子和健康女子的红细胞记数分别服从正态分布 总体均数不同 总体方差相等 现从这两个总体分别抽取样本各一份 样本均数 样本标准差和样本量分别为试判断样本均数间的差异是否具有统计学意义 4 4完全随机化设计两组独立样本均数的t检验 假定方差齐性 加权平均估计可以证明 当H0成立时 Example4 4随机抽取n1 10名患者和n2 20名正常人 测定某生化指标 样本均数和样本标准差 试判断两个总体均数是否相等 假定方差不齐 4 5完全随机化设计两组独立样本方差齐性的F检验 回到Example4 3 回到Example4 4 不拒绝 拒绝 除了服务于t检验 此检验另有其自己的用处 Example4 5搅匀后将样品分成两组 各10份 两组样品分别送两个实验室测定 结果 两个样本均数的差异没有统计学意义 但样本方差分别为5和3 5 试判断这两个实验室的测量精度是否相同 Example4 6在一项多中心研究中 质量控制的标准规定 标准差不得高于1 5U 某实验室将样品摇匀后分成10份 分别做独立的测定 结果样本标准差为2 1U 试判断该实验室测定的精度是否符合质量控制的标准 你打算怎麽解决 4 6 2Poisson分布总体均数的Z 检验 大 当足够大时 服从Poisson分布的变量X近似地服从正态分布Example4 9某仪器的质量控制标准规定在给定的一段时间内记录到的放射性强度不得超过50 现监测试验的结果为58 试判断该仪器的总体均数是否合格 近似地 不拒绝 Example4 10 两个观察值 独立地测定两份样品在1分钟内的放射性 结果X1 150 X2 120 试判断两个总体在1分钟内放射性的总体均数是否相等 Example4 11 两 组 观察值 独立地测定两份样品的放射性 一份测了10分钟 另一份测了15分钟 结果X1 1500 X2 1800 试判断两个总体在1分钟内放射性的总体均数是否相等 假设检验的功效与样本量 两类错误与功效 影响功效的四要素 常用统计检验的样本量估算 要从样本推断总体 就必需使样本足以代表总体 样本的质通过适当的抽样方法来保证 样本的量则要在实验前进行估计 样本量取决于 1 客观上差异 2 个体间变异 3 第一类错误概率 4 第二类错误概率样本量公式与功效的公式相同 只是已知功效求样本量 正确对待估算的样本量 1 只有完全按照原设计进行重复实验 所估算的n才有效 2 因为估计n都是有条件的 而这种条件却难以在重复实验中一成不变地保持下来 故不可把估算的n当作必能达到目的的准确数值来理解 1 什麽是P 值 P 值是零假设成立的前提下 检验统计量大于等于当前值的概率 当零假设成立时 拒绝零假设就是假阳性 假阳性称为第一类错误 犯第一类错误的概率 PP 值小 表明零假设成立的前提下 不大可能 出现当前的情形 以及更不利于零假设的情形 但它们居然出现了 于是 拒绝零假设 P 值大 表明零假设成立的前提下 颇有可能 出现当前的情形 以及更不利于零假设的情形 现在它们出现了 毫不奇怪 没理由拒绝零假设 假设检验的注意事项 2 不拒绝零假设的话 是不是认为零假设是对的 当对立假设成立时 不拒绝零假设就是假阴性 假阴性称为第二类错误 给定 样本量和实际差距 犯第二类错误的概率 可以计算 1 称为检验的功效 power 它是给定 样本量时识别实际差距的概率 不拒绝零假设时 存在两种情形 1 实际上无差异 正确 2 实际上有差异 因功效低而未察觉 假阴性 需当即计算功效 若功效较高 方可认为无差异 若功效较低 可能存在差异而未能察觉 欲提高功效 主要靠加大样本量 3 什麽是检验水准 反映推断的质量 小表明拒绝零假设是比较谨慎的 如果拒绝零假设 假阳性的概率受 的控制 4 何时采用t检验 变量服从正态分布 样本量较小 5 变量不服从正态分布时怎麽办 样本量不大 采用非参数检验 样本量较大 采用Z 检验 零假设成立时 医学统计常见一,真正差异和统计学差异常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 P 0.05 是有显著性差异; P 0.01 是有极显著性差异。其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。二,卡方检验的局限性我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!这第2条可能大家不要理解,那我就举两个例子:1) 关于男性和女性对于不同颜色的喜好的统计学分析但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。*红色 蓝色 黄色男性 5 7 8女性 15 10 6可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到行 列下边的层化一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!2)两种治疗(A和B)效果的评价分析:*A法 B法生存 41 54死亡 47 31用卡方检验 X2=4.35; P 0.05说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。当样本有小于5的值RC表时,将某两组合并,用pearson卡方检验。三,t 检验的局限性1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!这时应该用 非参数性检验-即 Mann-Whitney U test (Wilcoxon U test)。2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。四,ANOVA 检验的局限性1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。(这个分析说明来源于fengyouxin主任)3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!这时应该用 非参数性检验-即 Kruskal-Wallis rank test 。五,单元线性相关分析有时我们常常只注意到了 P 值大小,可最重要的是 r 值!样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:当 P 值小于0.05时: r 值0.00-0.20 几乎没有相关关系0.20-0.40 弱的相关关系0.40-0.70 有相关关系0.70-0.90 强相关关系0.90-1.00 极强相关关系P 值只是证明这个相关在统计学上是否成立!1, 当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。当样本有小于5的值RC表时,将某两组合并,用pearson卡方检验。 不是说样本小于5而是说:在RC表中理论频数不应该小于1,并且1T5的格子数不应该超过总格子数的15,若出现上述情况可以通过以下方法:a.增加样本含量,使理论频数增大;b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。c.改用双向无序的RC表的fishher确切概率法。还有一点四格表卡方检验的适应指标:(T为理论频数)1。n40,且T5时用卡方检验基本公式。但是当p应该用fisher确切概率法2。n40,但是1T5时,用四格表校正公式3。n40,或者T1时,用fisher四格表确切概率法4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。 补充几点:1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P0.05,不能讲两变量间存在相关关系,r值毫无意义.感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些中走出来!六,Logistic regression 分析在判断某因子对疾病的危险度时常用的方法。1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。其它方法-生存分析 (Kaplan-Meier法+ Logrank法):我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生-死为判别,后者则以复发-不复发为判别。katalyster兄谈到的都是我们这些半桶水的人平时最关心,最容易混淆的问题。谈一谈我对Logistic regression一些不成熟的想法:1.Logistic regression 和cox regression的主要区别是后者是和时间联系在一起的。2.Logistic regression筛选出来的危险因子并不是最相关的因子,而是在多个变量中“相互配合得最好的因子”。例子:从10个人中挑选4个人去完成某项任务,并不是找4个能力最强的人,而是找4个最适合于这项工作而且最具有协作精神配合得做好的。3.Logistic regression中对自变量的要求较低:正态的非正态的,计量的计数的等级的都可以。我认为Logistic回归也可应用于队列研究,而这时的exp(b)应该相当于流行病学的RR值。当然在计算上,这个exp和RR在数值上是有差别的,其实就是把队列研究当成病例对照研究的OR值,只是OR和RR值在患病率较小的疾病中相差并不是很大,是否可以替代,如果不能替代,怎么办,当然不用Cox,因为有些队列研究对时间的记录并不是很令人满意的,甚至没有。我看过类似的论著,好像就是直接替代的。请指教katalyster 在五,单元线性相关分析中的论述极为精辟。我想补充一点,其实也不是补充,是一点想法,可能很不成熟,望批评指正其实对相关系数的解释应该针对不同的数据而异,如实验数据,r值可能需要很大,如在绘制浓度与吸光度的标准曲线中,r值在0.90-0.95可能都不是很令人满意,可能需要0.98以上才ok但对流行病学病因分析中的数据,可能r值会非常的小,如0.2,但病因意义很大。其实在流行病学中很难得到很大的r值。可能很多数据联合的决定系数(r2)都会很小。但实际意义还是有的。统计的数据需要结合实际问题才有意义请教:katalyster 当数据呈非正态分布时,是不可以用方差分析和t检验的。怎么在您的t检验局限性分析里提到可以采用配对t检验呢zhaoqingshan, 我认为可能你的理解有误,我看了一下,katalyster从第二条论述配对的问题,与第一条并不是连贯的。其实我认为所谓的局限性的问题就是各个检验方法适用的条件。适用条件限制了应用某种检验方法的资料类型。如一般计量资料的参数检验要求资料分布正态,方差齐性。我认为还有一点就是个体间的独立性。上述方法均建立在一个假设的基础上。即研究的个体是相互独立的,彼此之间没有相关性,简单的说,不能存在亲缘关系。如果偏离了这个基础,上述方法均不成立。在医学研究中,由于疾病的家族聚集性,很容易突破上述限制。现在有些统计学家已经找到了解决的办法。不过计算真的好复杂。什么时候我把这个问题贴上来,希望大家能给予帮助。赞!也把我的疑惑跟各位高手交流一下:我在用spss13.0做binary logistic regression时,遇到分类变量(不是二分类,而是分5类),点categorical选择此变量,之后contrast选simple,reference category 选at last, 回归的结果是这项分类变量总的是有意义的(但是没有偏回归系数),并且这5个分类变量比较的结果如下:B SE WALD DF EXPx11011.1064.025x110(1)-.626.648.9331.334x110(2)-1.476.7104.3271.038x110(3)-1.035.6822.3041.129x110(4)-.225.700.1031.748请问:用统计术语该如何解释,这5个变量比较出4个结果,分别代表什么意义?谢谢!第10章实验设计的统计学基本原则 方积乾中山大学公共卫生学院2010 10新疆 实验设计 designofexperiment DOE 顺利进行科学研究和数据统计分析的先决条件获得预期结果的重要保证设计 专业设计 从各专业角度考虑实验的科学安排 选题 建立假说 确定研究对象和技术方法等 统计设计 从统计学的角度考虑资料搜集 整理和分析的设计 设计类型 样本含量 指标和分析方法 医学科学研究方法 1 观察性研究 observationalstudy 又称非实验性研究 non experimentalstudy 或对比研究 comparativestudy 非随机化对比研究 以客观 真实的观察为依据 对观察结果进行描述和对比分析 不能人为施加干预措施 即处理因素 受试对象接受何种处理因素或同一处理因素的不同水平不是由随机化而定的 例如 农村地区卫生服务需求情况调查 观察性研究的设计属于调查设计 surveydesign 2 实验性研究 experimentstudy 指研究者能够人为给予干预措施的研究 例如 健康教育能否预防小学生近视的研究 小学生除每天做眼保健操外 随机分为试验组和对照组 试验组另给予预防近视的健康教育 观察一段时间后 比较两组小学生的视力变化 它的设计对应于实验设计 以下主要介绍实验设计的统计学部分包括 基本要素 基本原则 常用设计方案 样本含量的估计和临床试验设计 10 1实验设计的基本概念 其他 处理对象效应其他效应 10 1 1实验设计的三要素受试对象 object 处理因素 treatment 实验效应 experimentaleffect 例如 研究某药对 型糖尿病病人的降血糖效果 受试对象 型糖尿病病人处理因素 某药实验效应 血糖的变化值 1 处理 treatment 例 药剂 手术方法 毒物 1 抓住主要处理因素 2 区分处理与非处理因素 3 处理因素必须标准化2 受试对象动物的选择 种类 品系 年龄 体重 窝别 营养 病例的选择 纳入标准 剔除标准3 效应 effect 指标的选择 准确 accuracy 精密 precision 灵敏 sensitivity 特异 specificity 10 1 2实验误差及其特点 随机误差及其特点随机误差是由大量微小的偶然因素引起的不易控制的误差 大量重复观察的情况下 随机误差呈现出一定的规律性 通过统计分析认识客观实际 非随机误差及其特点 偏倚 bias 没有规律 无法运用统计分析进行推断 来源于研究过程的各个阶段 一旦发生偏倚 事后往往无法纠正或弥补 10 1 3实验设计的统计学原则 10 1 3 1对照 control 目的 比较的对象 控制实验误差和系统误差同期对照 concurrentcontrol 在整个实验过程中 对照组和实验组应始终处于同时同地基线 baseline 比较 对照组设立后 应检验两组开始时的状态是否均衡 常用对照 1 安慰剂 或空白 对照处理组 其他处理对象I效应其他效应对照组 其他安慰剂对象II效应 或空白 其他效应 安慰剂 placebo 无药理作用的 假药 或称伪药物 dummymedication 外观 剂型 大小 颜色 重量 气味及口味等与试验药物一致 目的 1 克服研究者 受试对象 评价者等由于心理因素所形成的偏倚 控制安慰作用 2 消除疾病自然进程的影响 分离出由于试验药物所引起的真正反应 安慰剂对照的使用要慎重 应以不损害病人健康为前提 2 实验对照例如 强化铁预防缺铁性贫血 实验组儿童用强化铁酱油 A B 对照组用普通酱油 B 处理组 其他A B对象IA B效应其他效应对照组 其他B对象IIB效应其他效应 3 相互对照处理组 其他A对象IA效应其他效应对照组 其他B对象IIB效应其他效应 4 自身对照例如 研究治疗烧伤新药 一部位用烧伤新药 另一部位用其它公认有效药物 其他A对象A效应其他效应对照组 其他B对象B效应其他效应 注意 前后对照不是同期对照 在实验中同样需要另外设立一个对照组 用处理前后效应的差值来比较实验组与对照组 实验组 减肥茶对照组 普通茶 问题 研究减肥茶的效果 以肥胖病人用药前的体重作对照 妥否 5 标准对照 standardcontrol 用现有标准值或参考值作对照 不好 6 历史对照 historicalcontrol 与本人或他人过去的研究结果作比较 不好 10 1 3 2随机化 randomization 随机化 randomization 目的 对付大量不可控制非处理因素的另一个重要统计学手段 防止有意无意的 搞鬼 对资料进行统计推断的前提 随机化应贯穿于研究设计和实施的全过程 1 抽样的随机化 总体中每个个体都有相同机会被抽到样本中来 保证所得样本有代表性 使实验结论具有普遍意义 2 分组的随机化 每个受试对象被分配到各组的机会相等 保证受试对象的其他状况在对比组间尽可能均衡 提高组间的可比性 3 实验顺序的随机化 每个受试对象先后接受处理的机会相等 使实验顺序的影响达到均衡 10 2随机化技术 10 3 1随机数的产生1 抽签或掷硬币 已过时 2 随机数 randomnumber 随机数字表 现场用 伪随机数 pseudorandomnumber PRN 介于0和1之间均匀分布的数字统计软件中的伪随机数发生器 如果每次将种子数 seednumber 设为一样 产生的伪随机数便具有重复性 必须报告 用什么统计软件产生伪随机数 种子数 10 3 2随机抽样 随机分组和随机排序1 完全随机化 completerandomization 步骤 编号 取随机数 定组别例1试将同性别 体重相近的15只动物分到A B C三组 用随机数字表 先将动物编号 从随机数字表中任一行 如第16行 最左开始连续取15个两位数字 事先设定规则 每个两位数字除以3 余数0 1和2分别对应于A B C三组 2 分层随机化 stratifiedrandomization 完全随机化并不能保证各组间一定达到良好的均衡性 配对随机化 pairedrandomization 以对子为 层 区组随机化 blockrandomization 以区组为 层 例2为比较四种剂量的碘 A B C D 对脾脏的影响 将小白鼠体重作为分层因素 试随机分配处理 事先规定 在同一层内按随机数由小到大排序的序号分组 10 3常用的实验设计方案 考察单个因素的效应 可选用完全随机设计配对设计交叉设计随机区组设计考察多个因素的效应 可选用析因设计 一 完全随机设计 completelyrandomizeddesign 又称简单随机分组设计 simplerandomizeddesign 将同质的受试对象随机地分配到各处理组 再观察其实验效应平衡设计 balanceddesign 各组样本含量相等非平衡设计 unbalanceddesign 各组样本含量不等 二 配对设计 paireddesign 将受试对象按一定条件配成对子 再将每对中的两个受试对象随机分配到不同处理组 配对依据 可能影响实验结果的主要混杂因素动物实验 窝别 性别 体重等作为配对条件临床试验 病情轻重 性别 年龄 职业等作为配对条件 在医学科研中 配对设计主要有以下情形 1 将两个条件相同或相近的受试对象配成对子 含同一个体的两对称器官或组织 分别接受两种不同的处理 例欲研究国产禽流感疫苗的效果 将同种属的鸡按性别相同 月龄 体重相近配成对子 随机分成两组 接受国产和进口疫苗 2 同一受试对象 人或标本 分别接受两种不同的处理 3 前后配对 同一受试对象接受一种处理的前后若仅观察一组 则要求在处理因素施加前后的影响因素如气候 饮食 心理状态等要相同 但常常难于做到 故存在一定缺陷 现已不提倡单独使用 配对设计的优点 抽样误差较小 实验效率较高 所需样本含量也较小 配对设计的缺点 配对失败或配对欠佳时 反而降低效率 三 交叉设计 cross overdesign 两种处理 A和B两个阶段 I和 随机分两组 先A后B 先B后A 优点 不受个体差异的影响 适用于慢性病 缺点 受试对象一旦在某一阶段退出试验 就会造成该阶段及其以后的数据缺失 四 随机区组设计 randomizedblockdesign 又称随机单位组设计 随机配伍组设计 b个区组 很不相同每个区组内 k个受试对象k个处理 有待比较将受试对象按性质 如动物的性别 体重 病人的病情 性别 年龄等非实验因素 相同或相近者组成b个区组 或称单位组 配伍组 每个区组中的k个受试对象分别随机分配到k个处理组中去 例8 2为探索丹参对肢体缺血再灌注损伤的影响 将30只纯种新西兰实验用大白兔 按窝别相同分为10个区组 每个区组的3只大白兔随机接受三种不同的处理 即在松止血带前分别给予丹参2ml kg 丹参1ml kg 生理盐水2ml kg 并分别测定松止血带前及松后1小时后血中白蛋白含量 g L 算出白蛋白的减少量如表8 4所示 问三种处理效果是否不同 五 析因设计 factorialdesign 又称完全交叉分组设计将两个或多个实验因素的各水平进行组合 对各种可能的组合都进行实验 例8 3研究者欲研究煤焦油 因素A 以及作用时间 因素B 对细胞毒性的作用 煤焦油含量分为3ug ml 和75ug ml两个水平 作用时间分别为6小时 和8小时 将统一制备的16盒已培养好的细胞随机分为四组 分别接受A B不同组合情况下的四种处理 和 测得处理液吸光度的值 结果如表8 7 试对该资料进行分析 优点 1 全面高效性以最小的实验次数探讨各因素的主效应 同时可获得因素间的交互 2 通过比较各种实验组合 还能寻求最佳组合缺点 工作量较大 统计分析复杂 10 4临床试验中的统计学原则 临床试验 在人体 病人或健康志愿者 中进行的关于药品 常为新药 的系统性研究 前瞻性 主要目的 确定药品的疗效和安全性特点 1 以人为试验对象 2 对干预措施进行前瞻性的追踪研究 3 试验过程易受多种因素影响 可能有偏倚 4 试验病例需一定时间的积累 一 临床试验概况 1 临床试验的分期I期临床试验 初步的临床药理学及人体安全性评价试验在数名志愿者身上进行 必要时可包括病人 观察人体对于新药的耐受程度 tolerance 和药物代谢动力学 pharmacokinetics 为制定给药方案提供依据 期临床试验 对新药的有效性和安全性作出初步评价 推荐临床给药剂量 盲法的随机对照试验 randomizedcontrolledtrial RCT 期临床试验 遵循随机对照的原则 进一步评价药物的有效性 安全性 扩大的多中心临床试验 multi centerClinicaltrials 期临床试验 在广泛使用的条件下 考察药品的疗效和不良反应 药品上市后的监测 postmarketingsurveillance 2 病例报告表 casereportform CRF 表格文件 用以记录每一名受试对象在试验过程中的数据 一式三份 用不同颜色标示 使用无碳复写纸复写内容和格式简明确切 观察项目 主要变量和相关信息 填写者 对效应的判断有统一认识 理解并直接接触受试对象者 不应涂改 如需更正 应将原数据划去 填上更正数据 并保证能看清 还需由更正者签字并注明日期 各种实验室数据均应记录或将原始报告粘贴在CRF上 在参考值范围内的数据也应记录 对明显偏离或在临床可接受范围以外的数据须加以核实 由研究者作必要的说明 二 临床试验设计的特殊问题临床试验设计仍属实验设计的范畴 还需考虑其特殊的一面 随机化方法随机化分组方案分组方案的遮蔽 concealment 2 盲法 纠正偏倚的重要措施优点 能够避免受试对象和研究者的心理或精神因素影响 使评价 测量更为客观 如条件许可 均应采用盲法试验 双盲不行 则单盲采用单盲或非盲均应制订控制偏倚的措施盲法常和安慰剂同时采用盲法应自始至终地贯彻于整个试验之中 编制盲底 blindcodes 试验药品的编码 受试对象入组用药 研究者记录试验结果和做出评价 监察员 monitor 进行检查 数据管理直至统计分析 盲底泄露 试验视作无效 充分保障受试对象的个人权益知情同意 informedconsent 向受试对象提供详细材料 不能强迫 受试对象同意后 须由受试者或其法定代理人在书上签字并注明日期 执行知情同意过程的研究者或其代表也需在知情同意书上签名 并注明日期 受试对象保留在任何时候退出试验的权利 3 多中心临床试验优点 可以在较短的时间内搜集所需的病例 病例范围 临床条件广 结果具代表性实施 统一组织领导统一试验方案统一人员培训统一监控措施 4 临床试验的统计分析设计 随机化 样本含量 指标选择 测量 盲法 伦理学要求 1 按照治疗意向 intention to treat ITT 做数据分析根据临床试验的要求 对经随机化并分配到各组的全部病例进行统计分析 而不管其是否依计划完成治疗试验 对于未能观察到全部疗效的病例资料 把最后观察到 脱落时 的结果作为其疗效 carryforwardofthelastobservation CFLO 这样的数据集称为全分析集 fullanalysisset 2 符合方案 perprotocol PP 的数据分析 对所有符合试验方案 依从性好 如服用试验用药数量在该病例需要服用量的80 120 试验期间未服用违禁药 完成CRF规定填写内容的病例进行统计分析 这样的数据集称为符合方案集 perprotocolset 对不符合上述条件的不纳入分析 但在计算不良反应发生率时应包括在内 其数据集称为安全集 小结 1 科研方法的分类 按是否给予干预措施分为实验性研究 有干预 和观察性研究 无干预 实验性研究的设计属于实验设计 而观察性研究的设计则属于调查设计 2 实验设计的三个基本要素 受试对象 处理因素 试验效应 实验中应抓住主要因素 规定明确的纳入标准和排除标准 合理选择受试对象 选用客观 准确 精确的指标来反映实验的效应 实验效应的观察应尽量采用盲法 避免偏倚 3 试验设计的基本原则 对照 随机 重复对照和随机化是使各组均衡可比的重要手段 应根据研究目的和内容选择对照 安慰剂对照 空白对照 实验对照 自身对照以及标准对照等 没有对照的研究无法鉴别产生的效应是否真正来自处理因素 通常借助计算机进行随机化或分层随机化 各种统计分析方法均建立在随机化的基础之上 重复既保证科学性和可靠性 又保证观察结果的精度 4 常用的试验设计方案 考察单个因素的效应 完全随机设计配对设计交叉设计随机区组设计考察多个因素的效应 析因设计研究者可根据研究目的 处理因素的多少或水平数来合理选择 5 临床试验是以人 含病人与健康人 为试验对象 对干预措施 通常为新药 的疗效和安全性进行前瞻性的追踪研新药临床试验设计必须严格遵守 中华人民共和国药品管理法 新药审批办法 药品临床试验管理规范 GoodClinicalPractice GCP 以及 化学药品和生物制品临床试验的生物统计学指导原则 等相关规定 AnalysisofVariance Part March 7th 2005 Vocabulary 1 4 variance方差abbreviation缩写ANOVA方差分析one wayANOVA单因素方差分析 Vocabulary 2 4 invalid 依照律条而判为 无效的permutation排列combination组合athlete运动员 Vocabulary 3 4 highjumper跳高运动员square平方sumofsquares平方 之 和numerator分子denominator分母 Vocabulary 4 4 liver肝脏completelyrandomizeddesign完全随机设计ratio比 比值proportion 百分 比 AnalysisofVariance ANOVA Variance averagevariationofdata Contents 1 Introduction2 Anexampleinsportschool3 Amedicalresearchonp 2974 StepsofANOVA5 ConditionsforANOVAapplication 1 Introduction Thettestandutestareonlysuitabletocomparetwosamplemeans However inmedicalpractice weoftentrytocomparemorethantwosamplemeans Inthissituation analysisofvariance ANOVA isapowerfulmethod Howaboutcompareeverypairsofandwithttestorutest and and and and and and TheProbabilitywithwhichwewronglyrejectatleastonetruenullhypothesisis Theriskthatweactuallytakeishigherthanwhatweassumed Contents 1 Introduction2 Anexampleinsportschool3 Amedicalresearchonp 2974 StepsofANOVA5 ConditionsforANOVAapplication 2 Anexampleinsportschool Thirtyteenagersarechosentobecultivatedashighjumpersin2000 09 01 Thethreegroupsareguidedbythreedifferentcoaches 1 1m 30teenagers Futurehigh jumpathletesinGD Thesituation 2yearslater A Thesituation 2yearslater A B C ThesituationinGXprovince Contents 1 Introduction2 Anexampleinsportschool3 Amedicalresearchonp 2974 StepsofANOVA5 ConditionsforANOVAapplication 3 Amedicalresearchonp 297 SumofSquares summarizedvariationofdata Thefollowingcanbeproved Calculationforsumofsquare Decompositionof degreeoffreedom Since16individualsbeingdrawn Since
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。