医学科研中的统计设计_第1页
医学科研中的统计设计_第2页
医学科研中的统计设计_第3页
医学科研中的统计设计_第4页
医学科研中的统计设计_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LOGO 医医 学学 科科 研研 中中 的的 统统 计计 设设 计计 2 科研设计(专业设计科研设计(专业设计+统计设计)是科统计设计)是科 研工作的基石和保证,是多快好省地完成研工作的基石和保证,是多快好省地完成 实验的基础。实验的基础。 3 要做好实验设计,核心内容要做好实验设计,核心内容 4 实验设计三要素实验设计三要素 处理因素处理因素 1 受试对象受试对象 2 实验效应实验效应 3 5 实验设计四原则实验设计四原则 随机原则随机原则1 对照原则对照原则2 重复原则重复原则3 盲法原则盲法原则 4 6 随机原则随机原则 1 随机化:核心是机会均等。使每个受试者进入各组的随机化:核心是机

2、会均等。使每个受试者进入各组的 机会或概率相等。机会或概率相等。 目的:防止选择研究对象或分组时加入人为主观因素防止选择研究对象或分组时加入人为主观因素 的干扰。因此,随机不是随意,更不是随便。的干扰。因此,随机不是随意,更不是随便。 7 违背随机原则案例违背随机原则案例随意选择研究对象或分组随意选择研究对象或分组 v某医院自某医院自2006年年2月至月至2007年年2月,采用射频月,采用射频 热凝技术共治疗腰椎间盘突出症患者热凝技术共治疗腰椎间盘突出症患者86例,现选例,现选 择择资料齐全资料齐全的腰椎间盘突出症的腰椎间盘突出症28例总结。例总结。 v探讨电针对骨关节炎的治疗作用、将探讨电针

3、对骨关节炎的治疗作用、将40例膝骨关例膝骨关 节炎患者节炎患者按就诊顺序随机按就诊顺序随机分为分为2组,每组组,每组20例。例。 8 方法:简单随机化法方法:简单随机化法 ;区组随机法;区组随机法 ;分层随;分层随 机法;动态随机法机法;动态随机法 9 在对骨关节炎患者分两组时考虑:病情在对骨关节炎患者分两组时考虑:病情(轻、中、重轻、中、重)、 患病时间患病时间(短、长短、长) 非处理因素非处理因素 日常运动量日常运动量(少、多少、多) 现治疗组和对照组各有了现治疗组和对照组各有了1例患者,他们的基本情况如表例患者,他们的基本情况如表1所示。所示。 动态随机化按“最小不平衡指数”分 组 10

4、 如果又来了一例新患者,其病情重、患病时间短、日常运动量多,应将此患者如果又来了一例新患者,其病情重、患病时间短、日常运动量多,应将此患者 分入哪个组为好分入哪个组为好? 试着将新患者分别分入治疗组和对照组,取试着将新患者分别分入治疗组和对照组,取“不平衡指数不平衡指数”较小者所对应的分较小者所对应的分 配方案配方案 11 对照原则对照原则 2 对照:设立条件相同及诊断一致的一组对象,接设立条件相同及诊断一致的一组对象,接 受某种与实验组不一样的实验措施。受某种与实验组不一样的实验措施。 目的:抵消非实验因素的干扰和影响,避免偏倚抵消非实验因素的干扰和影响,避免偏倚 或系统误差,使结论具有可比

5、性,更可靠和更有或系统误差,使结论具有可比性,更可靠和更有 说服力。说服力。 12 对照的形式对照的形式 标准对照标准对照 互相对照互相对照 自身对照自身对照 安慰剂对照安慰剂对照 交叉对照交叉对照 对照的形式对照的形式 13 对照原则的常见错误辨析对照原则的常见错误辨析1缺乏对照缺乏对照 目的目的:观察大黄牡丹汤联合结肠透析治疗慢性肾功能衰观察大黄牡丹汤联合结肠透析治疗慢性肾功能衰 竭竭(CRF)的临床疗效的临床疗效. v方法方法:对对98例例CRF患者进行患者进行常规治疗常规治疗(给予优质低蛋白低给予优质低蛋白低 磷饮食,磷饮食,CRF基础治疗,如对血压、贫血及血糖等对症治疗基础治疗,如对

6、血压、贫血及血糖等对症治疗)的同时的同时, 进行结肠透析及大黄牡丹汤水煎剂保留灌肠,观察进行结肠透析及大黄牡丹汤水煎剂保留灌肠,观察 患者治疗前后症状、体征改善情况,并用配对设计患者治疗前后症状、体征改善情况,并用配对设计 定量资料的定量资料的t检验分析某些相关指标。检验分析某些相关指标。 v结论结论:大黄牡丹汤联合结肠透析对大黄牡丹汤联合结肠透析对CRF有明显的疗效。有明显的疗效。 14 目的:川芎嗪对脑缺血再灌注后脑组织肿瘤坏死因子目的:川芎嗪对脑缺血再灌注后脑组织肿瘤坏死因子 ( TNF-a)含量及髓过氧化物酶含量及髓过氧化物酶(MPO)活性的影响。活性的影响。 l方法:将方法:将36只

7、雄性只雄性SD大鼠随机分为假手术组、模型组和大鼠随机分为假手术组、模型组和 川芎嗪组。假手术组不阻塞大脑中动脉,腹腔注射川芎嗪组。假手术组不阻塞大脑中动脉,腹腔注射1 ml 生理盐水生理盐水;模型组制备局灶性脑缺血再灌注模型,缺血前模型组制备局灶性脑缺血再灌注模型,缺血前 30 min腹腔注射腹腔注射1 ml生理盐水生理盐水;川芎嗪组制备局灶性脑川芎嗪组制备局灶性脑 缺血再灌注模型,缺血前缺血再灌注模型,缺血前30 min腹腔注射川芎嗪注射液。腹腔注射川芎嗪注射液。 l观察川芎嗪对脑缺血再灌注后脑组织观察川芎嗪对脑缺血再灌注后脑组织TNF-含量及含量及MPO 活性的影响。活性的影响。 对照原则

8、的常见错误辨析对照原则的常见错误辨析2对照不全对照不全 15 本资料涉及两个因素:本资料涉及两个因素:1.“是否制备局灶性脑缺血再灌注模型是否制备局灶性脑缺血再灌注模型”, 2.“是否注射川芎嗪注射液是否注射川芎嗪注射液”,这两个因素各有,这两个因素各有“是与否是与否”两个两个 水平,两个水平,两个2水平因素全面组合应该有水平因素全面组合应该有4组,但本文少了一组组,但本文少了一组 “不制备模型,腹腔注射川芎嗪注射液不制备模型,腹腔注射川芎嗪注射液”组。组。 本资料是一个两因素非平衡的组合实验的定量资本资料是一个两因素非平衡的组合实验的定量资 料,若实验设计时增加了遗漏掉的那一组,则此实验料,

9、若实验设计时增加了遗漏掉的那一组,则此实验 设计就是一个设计就是一个2X2析因设计。析因设计。 16 17 表现为二个含义:表现为二个含义: 1. 是样本含量的大小是样本含量的大小 2. 是同一试验重复次数的多少是同一试验重复次数的多少 重复原则重复原则 3 18 样本含量的估计样本含量的估计 若观察指标是计量资料,两组均数差值的大小若观察指标是计量资料,两组均数差值的大小d d 若观察指标是定性资料,它在人群中发生的频率若观察指标是定性资料,它在人群中发生的频率P P 第一类错误的概率第一类错误的概率=0.05 =0.05 把握度:把握度: 单侧或双侧检验单侧或双侧检验 19 u计量资料样本

10、量大小的计算计量资料样本量大小的计算 2 22 )(2 d ZZ N :估计的标准差估计的标准差 d:两样本均数之差:两样本均数之差 u计数资料样本量大小的计算计数资料样本量大小的计算 2 1 2 11 )( )1 ()1 ()1 (2 PP PPPPZPPZ N C CC N:样本含量的大小:样本含量的大小 PC: :对照组的发生率 对照组的发生率 P1:实验组的发生率:实验组的发生率 P=(PC+ P1)/2 20 1. 盲法:在临床疗效实验中,为了去除人(包括盲法:在临床疗效实验中,为了去除人(包括 研究对象、观察者、资料整理者和分析者)的主研究对象、观察者、资料整理者和分析者)的主 观

11、心理因素对研究结果的影响,使相应人员不知观心理因素对研究结果的影响,使相应人员不知 道研究中分组和研究对象接受处理情况,这种方道研究中分组和研究对象接受处理情况,这种方 法称为盲法。法称为盲法。 2. 目的:为了有效地避免研究者或受试者的测量性目的:为了有效地避免研究者或受试者的测量性 偏倚和主观性偏见。偏倚和主观性偏见。 盲法原则盲法原则 4 21 单盲:仅有受试者不知道自己接受何种处理。单盲:仅有受试者不知道自己接受何种处理。 双盲:受试者和研究者均不知道接受何种处理。双盲:受试者和研究者均不知道接受何种处理。 三盲:受试者、研究者和资料统计分析者均不知三盲:受试者、研究者和资料统计分析者

12、均不知 道接受何种处理。道接受何种处理。 开放性试验:受试者、研究者和相关人员均知道开放性试验:受试者、研究者和相关人员均知道 受试者接受何种处理。受试者接受何种处理。 22 常用实验设计方法及错误辨析常用实验设计方法及错误辨析 单因素多水平设计单因素多水平设计 成组设计成组设计 随机区组设计随机区组设计 拉丁方设计拉丁方设计 析因设计析因设计 重复测量设计重复测量设计 单组设计单组设计 配对设计配对设计 正交设计正交设计 23 一、配对设计一、配对设计 配对设计:成对地选择研究对象,分别给予每对中的两配对设计:成对地选择研究对象,分别给予每对中的两 个受试对象以不同的处理。个受试对象以不同的

13、处理。 配对的条件:影响实验效应的主要非处理因素。目的是配对的条件:影响实验效应的主要非处理因素。目的是 消除两个比较组非处理因素的作用。消除两个比较组非处理因素的作用。 动物主要有:种属,性别,年龄,体重,窝别等因素;动物主要有:种属,性别,年龄,体重,窝别等因素; 人群主要有:种族,性别,年龄,体重,文化教育背景,人群主要有:种族,性别,年龄,体重,文化教育背景, 生活背景,居住条件,劳动条件等。生活背景,居住条件,劳动条件等。 其中病人:还应考虑疾病类型,病情严重程度,诊断标其中病人:还应考虑疾病类型,病情严重程度,诊断标 准等方面。准等方面。 24 方法:先将受试者编号,如第一对第方法

14、:先将受试者编号,如第一对第1受试者编为,第受试者编为,第2受受 试者编为,余类推。随机指定随机排列表第试者编为,余类推。随机指定随机排列表第2行,取随机行,取随机 数字。舍去数字。舍去1019之间的数字,并规定单数取甲乙顺序,之间的数字,并规定单数取甲乙顺序, 双数取乙甲顺序。双数取乙甲顺序。 配对设计案例配对设计案例-试将试将10对受试者随机分入甲、乙两处理组。对受试者随机分入甲、乙两处理组。 25 二、交叉设计二、交叉设计 是一种特殊的自身对照设计。在配伍用药时,可是一种特殊的自身对照设计。在配伍用药时,可 以均衡因用药时间顺序不同对结果造成的影响。以均衡因用药时间顺序不同对结果造成的影

15、响。 研究对象的分组方法同配对设计,分组后的研究研究对象的分组方法同配对设计,分组后的研究 分两个阶段,按以下流程安排实验。分两个阶段,按以下流程安排实验。 26 也称为配伍组设计或双因素设计。也称为配伍组设计或双因素设计。 可同时分析两个因素的作用,增强试验效率;要求可同时分析两个因素的作用,增强试验效率;要求 两因素应相互独立,无交互作用;两因素应相互独立,无交互作用; 三、随机区组设计三、随机区组设计 27 随机区组设计案例随机区组设计案例-要观察要观察2个因素的作用。将个因素的作用。将20只动只动 物分到五个区组(窝别)和四个处理组(药物)。物分到五个区组(窝别)和四个处理组(药物)。

16、 (1)取同一品系的动物)取同一品系的动物20只。其中每一区组取同一窝出生的动只。其中每一区组取同一窝出生的动 物物4只。五个区组即为五个不同窝别的动物。只。五个区组即为五个不同窝别的动物。 (2)将每一区组的)将每一区组的4只动物分别顺序编号为只动物分别顺序编号为14号,号,58号,号, 912号,号,1316号,号,1720号,接受号,接受A、B、C、D四种处理方四种处理方 式。式。 (3)借助随机排列表,任意指定)借助随机排列表,任意指定5行,每行只随机取数行,每行只随机取数14, 其余数舍去。依次将随机数字记录于各配伍组的编号下,其随其余数舍去。依次将随机数字记录于各配伍组的编号下,其

17、随 机数字即为该动物应分入的处理组,见表机数字即为该动物应分入的处理组,见表10-7。 28 表表10-8 2010-8 20只动物只动物 的分组结果的分组结果 表表10-7 按随机区组设计要求对按随机区组设计要求对20只动物进行分组只动物进行分组 29 拉丁方:用拉丁方:用r r个拉丁字母排成个拉丁字母排成r r行行r r列的方阵,列的方阵, 每行每列中的每个字母都只出现一次,此方阵叫每行每列中的每个字母都只出现一次,此方阵叫 r rr r拉丁方。拉丁方设计分别用行间、列间和字拉丁方。拉丁方设计分别用行间、列间和字 母间表示三个因素及其不同水平;母间表示三个因素及其不同水平; 拉丁方设计的基

18、本要求是:必须是三个因拉丁方设计的基本要求是:必须是三个因 素的试验,而且三个因素的水平数相等;三个素的试验,而且三个因素的水平数相等;三个 因素相互独立,无交互作用;三个因素试验效因素相互独立,无交互作用;三个因素试验效 应的测量指标服从正态分布且方差齐性。应的测量指标服从正态分布且方差齐性。 四、拉丁方设计四、拉丁方设计 30 析因设计:是一种多因素的交叉分组设计。它不仅析因设计:是一种多因素的交叉分组设计。它不仅 可检验每个因素各水平间的差异,而且可检验各因素可检验每个因素各水平间的差异,而且可检验各因素 间的交互作用。间的交互作用。 最简单的析因设计为最简单的析因设计为2 22 2(或

19、(或2 22 2)析因设计。其)析因设计。其 意义为:试验中共有意义为:试验中共有2 2个因素,每个因素各有两个水平。个因素,每个因素各有两个水平。 再如,再如,2 22 22 2(或(或2 23 3)析因设计,表示试验中有三个)析因设计,表示试验中有三个 因素,每个因素各有两个水平。因素,每个因素各有两个水平。 五、析因设计五、析因设计 31 22析因实验作用模式析因实验作用模式 六、重复测量设计六、重复测量设计 前述的设计方法中若其中的某个因素为前后重复测前述的设计方法中若其中的某个因素为前后重复测 量,则为重复测量设计。其特点是前后测量的数据不量,则为重复测量设计。其特点是前后测量的数据

20、不 能随机安排,数据之间不独立,有一定相关性。能随机安排,数据之间不独立,有一定相关性。 32 正交试验设计:可分析三个及三个以上因素正交试验设计:可分析三个及三个以上因素 的作用及其交互作用。以一套规格化的正交表,的作用及其交互作用。以一套规格化的正交表, 用最少的试验次数获得更多的信息。用最少的试验次数获得更多的信息。 七、正交试验设计七、正交试验设计 33 某研究要安排某研究要安排3 3个试验因素,每因素有个试验因素,每因素有2 2个水平,因素之间个水平,因素之间 有交互作用,请选择合适的正交实验设计方案有交互作用,请选择合适的正交实验设计方案 正交表应用案例正交表应用案例 L4(23)

21、正交表)正交表 34 设计类型辨析设计类型辨析1 不同色谱峰进样方式测定峰面积和不同色谱峰进样方式测定峰面积和PFIB染毒浓度染毒浓度 自身配对设计自身配对设计 ? 成组设计?成组设计? 35 设计类型辨析设计类型辨析2 v研究五种消毒液对四种细菌的抑制效果。研究五种消毒液对四种细菌的抑制效果。 随机区组设计随机区组设计 36 设计类型辨析设计类型辨析3 BMS与对照组的年龄、性别构成比较与对照组的年龄、性别构成比较 两因素析因设计两因素析因设计 37 设计类型辨析设计类型辨析4 甲乙两种方法处理的样品在不同稀释度条件下测得结果甲乙两种方法处理的样品在不同稀释度条件下测得结果 两因素析因设计两

22、因素析因设计 38 设计类型辨析设计类型辨析5 肝纤维化肝纤维化SSS计分值治疗前后的情况比较计分值治疗前后的情况比较 具有重复测量的两因素设计具有重复测量的两因素设计 39 错误辨析错误辨析 型糖尿病总组及亚组体脂参数变化型糖尿病总组及亚组体脂参数变化 多因素非平衡实验,需重新组合分辨设计类型多因素非平衡实验,需重新组合分辨设计类型 40 统计分析方法的选择统计分析方法的选择 实验设计类型实验设计类型结果变量的性质结果变量的性质 前提条件判断前提条件判断 41 定量资料定量资料 成组设计成组设计 单因素多水单因素多水 平设计平设计 多因素设计多因素设计 单组设计单组设计 配对设计配对设计 独

23、立性?独立性? 正态性?正态性? 方差齐性?方差齐性? 独立性?独立性? 正态性?正态性? NO 非参数检验非参数检验 YES 参数检验参数检验 t检验检验/u检验检验 方差分析方差分析 秩和检验秩和检验 或其它或其它 YES 参数检验参数检验 NO 非参数检验非参数检验 配对配对t检验检验 t检验检验 42 定性资料定性资料 四格表四格表 某病患者接受手术时间与伤口感染情况观察某病患者接受手术时间与伤口感染情况观察 成组设计成组设计2检验或检验或Fisher精确检验精确检验 43 四格表四格表 两种培养基对同一批痰液标本同时培养的结果两种培养基对同一批痰液标本同时培养的结果 配对设计配对设计

24、配对设计配对设计 2检验检验Kappa检验 44 双向无序双向无序RC表表 某医院某医院3年间年间4种甲状腺疾病在四季中的发病人数分布种甲状腺疾病在四季中的发病人数分布 现况调查现况调查2检验或检验或Fisher精确检验精确检验 45 等级资料等级资料 单向有序单向有序(结果变量为等级资料结果变量为等级资料)RC表表 3种药物治疗某病患者疗效的观察结果种药物治疗某病患者疗效的观察结果 单因素多水平设计单因素多水平设计秩和检验、秩和检验、Ridit分析、有分析、有 序变量的序变量的logistic回归回归 46 双向有序双向有序(原因和结果变量均为等级资料原因和结果变量均为等级资料)且属性不且属

25、性不 同同 RC表表 地方性甲状腺肿患者各年龄组疗效的观察结果地方性甲状腺肿患者各年龄组疗效的观察结果 47 一般来说,有以下一般来说,有以下 4 个可能的分析目的个可能的分析目的 只关心各年龄组患者治疗结果之间的差异是否具有统计学意义:只关心各年龄组患者治疗结果之间的差异是否具有统计学意义: 可将此时的可将此时的“双向有序双向有序 R R C C 列联表资料列联表资料”视为视为“结果变量为结果变量为 有序变量的单向有序有序变量的单向有序 R R C C 列联表资料列联表资料”,选用:秩和检验、,选用:秩和检验、 Ridit Ridit 分析和有序变量的分析和有序变量的 logistic lo

26、gistic 回归分析。回归分析。 若希望考察年龄与疗效之间是否存在线性相关关系,通常采用若希望考察年龄与疗效之间是否存在线性相关关系,通常采用 Spearman Spearman 秩相关分析方法。秩相关分析方法。 若若 2 2 个有序变量之间的相关关系具有统计学意义,要进一步了个有序变量之间的相关关系具有统计学意义,要进一步了 解这解这 2 2 个有序变量之间的变化关系是呈直线关系还是呈某种曲个有序变量之间的变化关系是呈直线关系还是呈某种曲 线关系,此时宜选用线性趋势检验。线关系,此时宜选用线性趋势检验。 若希望考察列联表中各行上的频数分布是否相同,宜选用一般若希望考察列联表中各行上的频数分

27、布是否相同,宜选用一般 22检验或检验或 Fisher Fisher 精确检验。精确检验。 48 双向有序且属性相同的双向有序且属性相同的 R C 表表 100例脑肿瘤患者临床诊断与例脑肿瘤患者临床诊断与CT诊断的结果诊断的结果 目的是:目的是:2 2 种检测方法检测的结果之间是否具有一致性,故种检测方法检测的结果之间是否具有一致性,故 选用选用Kappa Kappa 检验。检验。 49 高维列联表(列联表中包含的定性变量的格子数大于高维列联表(列联表中包含的定性变量的格子数大于 等于等于 3 ) 孕妇在孕妇在 2 个诊所接受产前护理量与婴儿存活情况的观察结果个诊所接受产前护理量与婴儿存活情况

28、的观察结果 多重多重 logistic 回归分析方法回归分析方法 50 甲、乙医院用甲、乙医院用 A、B、C 3 种药医治某病的疗效观察种药医治某病的疗效观察 有序变量的多重有序变量的多重logistic 回归分析方法回归分析方法 51 错误辨析:多重回归分析时常犯的错误错误辨析:多重回归分析时常犯的错误 v 原文题目:妇科恶性肿瘤患者的生存期预测。原文题目:妇科恶性肿瘤患者的生存期预测。 作者先用单因素分析方法筛选自变量,即采用单因素方作者先用单因素分析方法筛选自变量,即采用单因素方 差分析,从初步调查的差分析,从初步调查的 19 项临床生化指标中筛选出项临床生化指标中筛选出 9 项对生存时

29、间有显著影响的指标,再对这项对生存时间有显著影响的指标,再对这 9 项指标进行项指标进行 多重多重 logistic回归分析,拟合回归方程的过程中采用了回归分析,拟合回归方程的过程中采用了 “后退法后退法”筛选,变量,最后得到包含筛选,变量,最后得到包含“呼吸困难、发热、呼吸困难、发热、 年龄、年龄、KPS 和血尿素氮和血尿素氮”5 个自变量的个自变量的 5 重重 logistic 回归方程,其主要结果列在下面的表中。请问:原作者筛回归方程,其主要结果列在下面的表中。请问:原作者筛 选变量的策略正确吗?基于此选变量的策略正确吗?基于此 5 重重 logistic 回归方程得回归方程得 到的结论可信吗?为什么?正确的做法是什么?到的结论可信吗?为什么?正确的做法是什么? 52 肿瘤患者多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论