临床医学科研设计统计分析技巧.ppt_第1页
临床医学科研设计统计分析技巧.ppt_第2页
临床医学科研设计统计分析技巧.ppt_第3页
临床医学科研设计统计分析技巧.ppt_第4页
临床医学科研设计统计分析技巧.ppt_第5页
已阅读5页,还剩186页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床医学科研设计 & 统计分析技巧,中日友好医院 李光伟,考考你,下述研究水平如何? 非常好 比较好 比较差,可修改 无可救药,例1。胰岛素抵抗抑或胰岛细胞缺陷是2型糖尿病的始动因素?-糖尿病一级亲研究,CONCLUSION and YOUR OPINION,胰岛细胞缺陷是2型糖尿病的始动因素 与国外文献结果一致 Next: What is your suggestion to T2DM prevention and management? No need to improve insulin sensitivity? To improve insulin secretion in order to prevent T2DM in IGT subjects?,例2。不同糖代谢状态 微量白蛋白尿发生的危险因素研究,例2。不同糖代谢状态微量白蛋白尿发生的危险因素研究,例2.糖耐量异常组微量白蛋白尿发生的危险因素 (线性回归),例2.糖耐量异常组微量白蛋白尿发生的危险因素 (LOGIST回归),例2.新诊DM组微量白蛋白尿发生的危险因素,例2.新诊DM组微量白蛋白尿发生的危险因素 (线性回归),例2.新诊DM组微量白蛋白尿发生的危险因素 (LOGIST回归),例3。糖尿病大血管及微血管病变危险因素研究 560例住院病人(心梗,脑梗) 观察指标: Age Sex BMI SBP DBP FPG PG2H FINS INS2H HOMA-IR HOMA-IS TC TG HDL LDL ApoA1 ApoB UAER Duration of DM 统计分析 非正态分布变量对数转化后分析 Pearson Spearman Correlation T test Logistic regression,Results,糖尿病大血管病变: 正相关: SBP Duration Age Male FINS INS2H Homa-IR Homa-IS LDL UAER DBP BMI FPG PG2H TC TG ApoA1 ApoB 负相关: IAI HDL Female,Logistic Regression,大血管病变(yes, no):危险因素 Age 2.04 (p 0.01) HT 3.33 (p 0.0001) (SBP DBP) HINS 2.042 (p 0.004 ) (FINS INS2H) Duration 1.03 (p 0.05) of DM Sex BMI FPG PG2H HOMA-IR HOMA-IS TC TG HDL LDL ApoA1 ApoB UAER,结论 &Your Opinion,1.高血压是糖尿病大血管病的首位危险因素(OR 3.33) (UKPDS为证!) 2.糖尿病大血管病与高血糖无相关 (因为 a.已降糖治疗 b.高血糖对高血压的次要地位) (UKPDS为证!) 3.高胰岛素血症是糖尿病大血管病的第二位危险因素(OR 2.04) (文献 A,B,C.D.E),微血管病变 (偏相关分析) 控制FPG影响后 负相关: FINS INS2H HOMA-IR HOMA-IS 控制FINS影响后 微血管病变 负相关:HOMA-IS HOMA-IR,Logistic Regression,微血管病变(DN,DNP,DR): yes, no) 危险因素 UAER (0,1) 45.64 (p 0.0001) 高血糖 1.488 (p 0.039) (FPG PG2H ) HINS 0.657 (p 0.028) (FINS INS2H) Duration of DM 1.004 (p 0.007) Age Sex BMI HOMA-IR SBP DBP HOMA-IS TC TG HDL LDL ApoA1 ApoB,结论,1.UALB是糖尿病微血管病的首位危险因素?(OR 44.64) (No!文献 ) 2.高血糖与糖尿病微血管病 (OR 1.488) (UKPDS为证!) 3.糖尿病微血管病与糖尿病病程有关(OR 1.004) 高胰岛素血症是糖尿病大血管病的危险因素。 微血管病保护因素?负相关! (OR 0.65!) (No! 文献 接过不一致A,B,C),结论,高胰岛素血症 是糖尿病大血管病的危险因素? 正相关!(OR 2.06!) 高胰岛素血症 是糖尿病微血管病的保护因素? 负相关!(OR 0.65!) What is your suggestion to us? 为防止糖尿病并发症医生在治疗中 应该提高还是降低糖尿病人的胰岛素水平?,存在问题吗?,研究目的(一个?多个?)明确吗? 变量选择(多?少?) 和处理(连续?等级 二分?三分?四分?)合理吗? 结果解释(各取所需?)恰当吗? 结论能说服人(能自圆其说?)吗?,前言,科学研究:是用新的方法去研究新问题 临床科研:常常是研究发病因子与疾病的因果 关 系,或药物干预与疗效的因果关系 真实性是我们追求的最高目标 许多类型的误差(选择偏倚,信息偏倚,混杂)都会将研究者引入歧途,偏离真实的结果。 观察效果 = 真实效果 + 随机误差 + 混杂,统计学定义,统计学(statistics): 就是研究随机现象内在规律性的一门学科。 它是为获得可靠必要的推断结论,研究如何获取数据、组织与表达数据、分析数据与解释结果的科学与艺术。,理论基础: 概率论与数理统计的原理和方法。 研究对象:生命科学领域中随机现象。 研究方法:科学设计、资料搜集、整理、综合归纳、表达及分析发现随机现象背后隐藏的统计学规律。,医学统计学,医学研究的分类,从研究的目的可以分为: 验证性研究与探索性研究 从研究的对象可分为: 以正常人群为基础的社区干预试验、 以病人为基础的临床实验 以动物或其他实验材料为基础的动物实验。 。,医学研究的分类,从研究的指标可以分为: 单变量研究与多变量研究; 从研究的时限来看可以分为: 前瞻性研究、回顾性研究和横断面研究;,临床医学研究分类,实验研究以病人为研究对象、前瞻性、随机对照的验证性研究。 (用统计设计原则控制临床研究中存在的偏倚) 观察研究以病人为研究对象、前瞻性或回顾性、非随机的观察对比研究。 (用统计分析方法分析资料中的混杂因素),科学研究的基本程序,提出一个欲待研究的问题-选一个有意义的课题 严密的科学研究设计(专业设计和统计设计) 获取试验与观察的资料(搜集资料) 数据审核与计算机录入(整理资料) 对资料进行恰当的统计分析 (描述性统计和统计推断) 分析结果的合理解释; 以审慎的态度看研究的结果 得到科学的合乎实际的结论。(专业结论),在科学的入口处就像在地狱的入口处一样,做一项有价值的科研必要的先决条件,是研究者对研究所涉及的领域有广博的知识和深入的了解 若研究得到的结果不是真理而是缪误,则既害人又害已。,一、选题,临床科研系指以病人为研究对象的医学科学研究 其目的是为了提高诊断水平和治疗效果,改善预后和对疾病病因做宏观研究。 选题是临床科研的起点 体现科研设计和实施的指导思想 影响临床科研工作的全过程 因此在科研过程中自始至终处于主导地位。 从这个角度来说,选题比科研方法更重要。,选题就是要正确地发现和提出问题 这些问题有的来自于临床实践 有的来自文献资料 所谓正确就是这些提出的问题要符合科学的认识规律 提出新问题、新假设比完成一项科研工作更难 没有好的科研假设,再好的科研方法也不会有好的科研成果。,例: 提出新问题,医生的共识-冠心病来自已知危险因素。 但是无已知危险因素的人为什么发生冠心病? 冠心病人群血同型半胱氨酸水平显著升高, 那末同性半胱氨酸是否是冠心病新的危险因素? 使之下降发生冠心病危险是否会下降? 选题-同型半胱氨酸是否是冠心病新的危险因素?,我国的临床科研选题: 国家科研攻关项目 高技术研究发展计划项目 个人经验和兴趣立题 仅从短期内是否可以完成、是否可以做出结果,发表文章而不是从临床迫切需要解决的问题着眼选题,出文章,但不会产生重大的临床科研成果。,临床科研选题的原则,首先是研究的问题要涉及我国的常见病、多发病、危害人民健康较严重的疾病。 第二个原则是所选的课题要有创造性和先进性,要选择前人没有解决或没有完全解决的问题。研究的结果应该是前人不明了或不完全明了的。 开拓性(独创性)研究最有价值。 发展性研究,争鸣性研究也有一定的价值 没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。,科研工作的特点就是创新 选题是一项非常艰苦繁重的工作,没有该领域扎实的理论基础和对国内外有关信息深入了解,不可能有好的科研设想 在信息时代,利用各种信息工具,充分掌握该领域国内外的信息和动态,经过充分的思索,是产生好的选题和立题必经之路。,选题必须具有科学性。所提出的新问题、新假设、新思路必须要符合客观规律。 临床实践是临床科研选题的源泉: 在日常临床实践中,人们无时无刻不面临着许多诊断、治疗、病因和预后估计等问题,诊断方法和治疗措施有待于科学的系统评价,这些课题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不仅涉及生物医学,而且涉及临床经济学和医学社会等,这一方面有许多有待研究的临床问题。,最后一个原则是可行性,指研究课题主要技术指标实现的可能性。 选题时必须考虑完成课题的条件,包括人力、物力等,如果这些条件不能满足或根本没有条件,即使所选课题有创造性、科学性又具有临床价值,也无望于成功。,临床科研选题时应注意几点: 前沿,新颖,最好实用(近5-10年有无类似 工作,或存在某些问题) 涉及人群健康的重大问题(发病危险因素,提出新的诊断方法) 建立新实验方法(提供研究新手段) 确定新药疗效及副作用,DCCT/EDIC强化血糖控制与冠脉钙化,对象和方法: DCCT后续研究 1150例患者随访79年 以CT检查冠脉钙化,以钙化评分(CAC) 0, 100, 和 200 Agatston units分组,P. Cleary, et al. 652-P, 63rd ADA,Steno-2 研究,目的,在有微量白蛋白尿的2型糖尿病患者,比较强化多因素达标治疗(包括行为和药物干预在内的)与常规治疗(8年)对心血管疾病的影响,Steno-2研究,169位有微量白蛋白尿 的2型糖尿病患者,9名患者因C 肽600而退出,160位患者随机分组,80位患者接受常规治疗,80位患者接受强化治疗,15例死亡 7例发生CVD 5例癌症 3例其他原因,12例死亡 7例发生CVD 2例癌症 3例其他原因,2例自动退出,1例自动退出,63例完成研究,67例完成研究,Steno-2,初级终点: 所有心血管疾病 心血管死亡 非致死性心梗 冠脉搭桥 非致死性中风 血管重建 截肢 次级终点: 微血管疾病 肾病的进展 视网膜病变的进展 神经病变的进展,8年后的终点事件,达到的治疗目标,糖化血红蛋白6.5%,胆固醇 4.5 mmol/l,甘油三酯 1.7 mmol/l,收缩压 130 mmHg,舒张压 80 mmHg,8年后达到治疗目标的患者,%,p=0.06,p0.0001,p=0.19,p=0.001,p=0.21,Steno-2 研究,强化组 常规组,强化组 常规组,强化组 常规组,强化组 常规组,强化组 常规组,初级心血管终点事件,瑞格列奈与格列齐特,试验目的 比较经4周治疗后,瑞格列奈与格列齐特对于2型糖尿病患者胰岛素分泌的疗效试验方法 对照性试验, 共20名2型糖尿病患者,随机分为两组: 瑞格列奈1mg tds,每餐前服用 格列齐特40mg bd,早餐及晚餐前服用 - 追踪4个月 参数:HbA1c,空腹血糖, 胰岛素AUC0-30和AUC0-240,LAWRENCE S. et al. 1923-PO, 63rd ADA,瑞格列奈与格列齐特,试验结果1: 两者降低糖化血红蛋白和空腹血糖的作用相似,瑞格列奈 格列齐特,HbA1c(%),空腹血糖(mmol/L),0 -1 -2 -3 -4,与基线比较的改变,1.04,0.72,0.89,1.21,试验结果2: 经4个月服用, 瑞格列奈显著改善了2型糖尿病患者的胰岛素的1相分泌,而格列齐特无此作用 瑞格列奈组胰岛素AUC0-30和AUC0-240明显增加, 但格列齐特 组没有明显增加 (p0.001),比较胰岛素联合二甲双胍与三种口服降糖药应用在两种口服药失效时的疗效,P. Hollander et al. P452,总结,在两种口服药治疗不佳的糖尿病患者,分别使用三种口服药或胰岛素二甲双胍治疗,空腹血糖和HbA1c疗效相当,但后者治疗失败率低 胰岛素二甲双胍治疗费用远远低于三种口服药治疗,P. Hollander et al. P452, 63rd ADA,入选人群 平均年龄52.1 (10.0)岁 BMI 28.6 (4.5) kg/m2 FPG 6.0 (0.5) mmol/l HbA1c 5.9 (0.5)% 17% 2h血糖 =11.1 mmol/l 37% IGT, 21% IFG ,46% NGT,糖尿病早期干预试验(EDIT),A+M 155 P+M 160 M 315 A+P 157 PP 159 P 316 A 312 P 319 631,糖尿病早期干预试验(EDIT),结果: 31发展为糖尿病,14失访 发生糖尿病的危险性在3个药物治疗组没有差异 入选时为IGT的患者,阿卡波糖组糖尿病发病危险性降低(0.66, p=0.046),二甲双胍(1.09, p=0.70)或两药合用(0.72, p=0.27)没有作用。 药物干预的效果与患者是IGT或者是IFG 有关,糖尿病早期干预试验(EDIT),Extrapolation of the time to deterioration of beta-cell function,Adapted from UKPDS 16. Diabetes 1995;44:124958,Years from diagnosis,Beta-cell function (%),10 8 6 4 2 0 2 4 6,100 80 60 40 20 0,Name:YL Sex:male Age:28,Ji L, unpublished data,罗格列酮可预防2型糖尿病患者发生冠脉再狭窄,对象和方法: 随机双盲、前瞻性研究 对象为冠脉支架植入的2型糖尿病患者 罗格列酮组(4mg/天)45例,56个支架; 安慰剂组 48例,60个支架 从第1次支架植入开始随访6个月 植入支架的管腔狭窄程度超过50定义 为发生再狭窄,Sung Hee Choi, et al. 82-OR, 63rd ADA,,p0.001,罗格列酮可预防2型糖尿病患者发生冠脉再狭窄,Rosiglitazone (4mg - 26 weeks) reduces coronary stent restenosis in type 2 diabetes,100,80,60,40,20,0,% of in-stent restenosis after 6 months,% of stents with lesions after 6 months,Choi SH et al 2003 ADA abstract No 82 - oral,Double-blind placebo-controlled study,CRP 60%,CRP 60%,% of patients,有的放矢 无病呻吟,二、研究设计,科研设计是科研的灵魂 严密的设计是取得有价值结果的先决条件 从这个意义上说没有“设计”就没有科研。 不少回顾性分析,内容包罗万象,是研究无主题的反映: 研究者在研究之初对研究要解决的问题即主攻方向心中无数,对研究所报的态度是逮着什么算什么,并不是想通过研究解决某一特定的问题,或不知道通过研究能解决什么问题。 这些研究缺乏严格的设计或无设计,这类研究即使有重要的发现也属偶然。,“前瞻性”研究,无前瞻性的设计 几年前做了几万人的糖尿病普查,发现了400例糖尿病和500例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐量低减。 写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素. 这种研究是残缺不全的随访,并不是前瞻性研究,缺点是难以弥补的。 高达50%的失访率会造成严重的信息偏差(information Bias): 若是有问题的人召之即来,则发病率会被高估; 若严重者已去医院看病不来参加,来的只有轻的病人,则会低估疾病的发病率。,例如糖尿病人群中 有许多人合并了高血压、高血脂病 不少人已用药物治疗 治疗中有的长期坚持用药,有人仅偶尔用药 有人血压或血脂一直控制很好,有些人时好时差 此时不论以随访的血压、血脂指标,还是以末次随访的指标分析,都不能反映干预对疾病的影响。 这些重要混杂因素的干扰,分析的结果常会远离实际情况.,更糟糕的是有些研究者对这种情况非常不以为然,当审稿人提出问题让他们补充此方面材料的,得到的回答是估计 服药的人很少,不会对结果发生影响 殊不知“差之毫厘,谬之千里,”在你轻易的原谅自己的疏忽的时候,统计学的P值随之发生了改变。,终点事件过少,有些研究者为了某种原因,希望尽早发表自己研究的结果,仅随访极短的时间(半年或一年),仅有几个或十几个终点事件(如死亡)就进行多因素分析,寻找危险因素。 终点事件过少的这种分析看上去可能条条是道,但其结果往往是不可靠的。应延长随访时间,增加终点事件后再分析 Navigntor研究设计出现1000个终点事体时才结题。,为保证科研的成功,一个完整的科研设计应包括以下几项内容: 有理论或实用价值的选题 选择合适的研究对象 制定可靠的测量指标 选择科学的统计分析方法 若能对结果做恰当的描述,则会得出符合实际的结论。,例1 大庆糖尿病研究设计 目的:探讨单纯生活方式干预是否可有效预防糖尿病 对象:非糖尿病成人 样本量:500例 随机分组:四组,拉丁方块设计 C D E D+E 随访期:预计8年 第0.5年 每月,以后每3月随访 终点:OGTT判定 DM 分析:多因素分析排除混杂因素干扰后证实生活方式干预有效。,例2: DPS 比大庆研究干预目标体重下降7% 例3: DPP 干预目标体重下降7%,增加药物干预组,治疗性研究设计的基本要素,研究设计的方案要科学: 在研究方案的设计上,必须要坚持三条基本原则: 随机化的原则(randomization); 对比原则(comparison),设置对照组; 盲法原则(blindness)。 符合上述三原则者为 随机盲法对照试验(randomized blind controlled trial, RCT)是治疗性研究设计首选方案。,随机化分配的原则的基本要求是 每研究对象均有相同的机会被分配到实验组和对照组, 使两组具备充分的可比性 防止偏倚的干扰和人为的主观干预 有效地避免选择偏倚(selection bias)。,随机化的应用主要用于以下两个方面: 从总体中随机抽取样本进行研究。因为在临床研究中,不可能将所有的某种疾病的患者都纳入研究,为了使抽取的样本能代表总体,就必须采用随机抽机样的方法。 在随机对照的试验研究中样本的随机化分配(random assignment)即将研究对象随机分成实验组和对照组。,随机化的方法 简单随机化:可能参照统计学工具书中介绍的方法,最不带偏倚的方法是运用随机数字表法,或电子计算器/机随机编码法。 区组随机化:如将研究对象总人数,分成四人一区组,对各个区组内的患者,分别根据随机数字进行编号分组,确定奇数和偶数各属于哪一组,其排列组合如下表所示,将24患者分A、B两组。可先按时间先后的顺序将24名研究对象分为6个组,每组4名为例,,表1 区组随机排列组合 区组号 1 2 3 4 5 6 排列组合 ABAB BABA ABBA BAAB AABB BBAA 随机抽取6个区组号,得3、1、6、5、2、4分序号,再按下法将研究对象分组,见表2。,表2 研究对象分组 患者号 1 2 3 4 5 6 7 8 9 10 11 12 分配序号 3 1 6 研究对象分组 A B B A A B A B B B A A 患者号 13 14 15 16 17 18 19 20 21 22 23 24 分配序号 5 2 4 研究对象分组 A A B B B A B A B A A B 患者号为1、4、5、7、11、12、13、14、18、20、22、23的研究对象随机分配到A组,其余患者号共12例分配到B组。,分层随机化:是根据研究对象的主要临床特点或预后危险因素等其分为不同的层,现将层内不同数量的研究对象随机分配到试验组和对照组 例如:已知与研究对象预后有关的重要因素有年龄、性别和吸烟,则分层方法 见表3。,表3 三层因素分层表 年龄(岁) 性别 吸烟史 1、4049 1、男 1、现在吸烟 2、5059 2、女 2、过去曾吸烟 现已戒烟 3、6069 3、从未吸烟 由上表可得323=18层次,每层次内再进行随机化分组。 随机化法的应用,可以平衡实验组和对照组中已知的和未知的混杂因素,有效地避免选择性偏倚,提高两组可比性,为研究结果的准确性提供了重要保证。,随机化分组在大多数情况下十分重要, 但随机化并非总是有利的和有道理的。 在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。 适应症不合理,随机化反使结果变糟。,髋关节骨折手术及保守治疗存活率 (28天) 手术 保守 存活 102/139 (74%) 34/65(52%) 结论:手术效果优于保守疗法 符合适应症 不符合适应症 手术 保守 手术 保守 存活 102/129(73%) 30/33(91%) 1/10(10%) 18/82(12.5%),结论:保守疗法不逊于手术效果,女性激素补充治疗的循证研究 (妇女健康倡议研究WHI),19世纪70年代结论: 雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松。但不会增加子宫内膜癌危险。 WHI(大规模,多中心,随机对照)结论: 雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防,预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少! 心脏事件 29%,卒中 41%,乳腺癌 26%, 结肠癌 37%,髋骨骨折 34%,妇女健康倡议研究(WHI) -再好的研究也有缺陷!,50-79岁 均值63岁 有子宫者随机用雌激素孕激素联合治疗 无子宫者随机用雌激素,妇女健康倡议研究(WHI) -再好的研究也有缺陷!,忽略了HRT最明显的益处: (缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松) 没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以上是没有绝经期症状的老年妇女。不具有HRT适应症 结论不应随意扩大(品种,剂量,种族) 与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的,妇女健康倡议研究(WHI) 恐慌后的冷静思考,共同意见: HRT能有效缓解绝经症状及预防骨质疏松;应用小于4年风险小。 HRT不用予心血管疾病预防。 风波后的冷静思考: 不是否定 而是更深入 不是终止 而是要阻止滥用 不是恐慌和困惑 而是更成熟和清醒 HRT不是更危险 而是更安全,(一). 研究对象的选择,要想证实研究者的思想,确定入选和排除标准,选择合理的研究对象是关键的一环。,1. 研究对象要有代表性 做疾病患病率的调查,随机化的原则可保证研究样本是总体人群的“缩影”,从而避免结果失真。 从某一局部地区“整体人体”调查出的“率”如推广到普遍认群,应说明该局部的“整体”人群与全局的人群结构相似。,1. 研究对象要有代表性 随机化抽样的缺点是研究对象地域较为分散,每个单位仅有少量病例,这对于干预治疗的前瞻性研究的病人管理极为不利,耗费更多人力,常使研究无法进行。 而在人群较多的社区进行“整群”调查,会在相对较小的地域找到较大样本,从而有利干预治疗的管理。如果其人群结构接近全局的人群,其统计的“率”也有重要参考价值。,如果仅为测定一个“率”做几万人的调查则较为浪费人力物力,而随机分层抽样可以以最小的样本,最少的花费取得有代表性的结果。 随机化大样本研究基线资料组间不一定可比,如果差别显著,可用分层分析或多因素分析消除混杂因素的影响。,“随机化”的另一缺点是可能有时“随机化”分组得到的两组(或几组)对象的某些参数值不可比,在样本量较小时尤其突出。 一般来说大样本的随机对照研究试验组资料会有可比性,但有时也会有显著差别。 病例对照研究可保证所选各组对象参考数的平衡,,2.样本含量的估计 队列研究属前瞻性研究,应考虑到失访的可能性,故一般需再加10%的样本量。 失访率40%以上,其研究的真实性就会受到严重怀疑。如果失访与暴露或疾病都有联系,那么即使随访率达到80%以上也难以防止偏倚的发生。,3. 从生物学医学原理选择持定的合理人群 (不犯人群结构错误) 研究对象中所观察变量的梯度,例1, 看生长激素水平与身高的关系: 对2574岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。,例2: 在高血压(或血压正常)人群研究血压水平对冠心病发生的影响 或研究致高血压因子的作用都可能得出假阴性的结果.,研究某些变量的生物学作用时,这些变量必须有一定梯度,否则会掩盖因果关系。 例如:研究继发性高血压的病因 有研究者发现某些 著名的继发性高血压与其公认的病因无关: 柯兴氏病高血压与皮质醇水平不相关 活动性肢端肥大症血压与生长激素水平不相关。,这些怪事如何解释?材料都是真实可靠! 研究对象中所观察变量没有足够梯度 所有来诊病例是经长期辗转来到研究者单位 看病时病情都十分典型,激素水平都很高, 该变量梯度很小,掩盖了激素与血压的相关关系。,解决的办法: 在激素水平相当人群,若能发现病程长短与血压水平有关,也算是发现了激素对血压的影响。 但若病程长短也相同,还是不会有阳性发现。 但若手术后激素水平下降,血压也下降,将治疗前后的病情加以比较则必会发现继发性高血压与激素水平的关系 那是因为人为的制造了梯度。,研究肥胖与糖尿病的关系 不能仅选择超重和肥胖的人群(BMI 25-30) 因为(BMI 25-27) 与(BMI 27-30)的人群糖尿病的患病率可能无明显差别, 但与BMI24人群差别会很显著 变量的梯度是成功的关键。,例. G蛋白3基因C825T亚型多态性与血压,胰岛素抵抗,肥胖的相关性: 2000年一位作者 在血压正常人群未发现该基因多态性与血压相关; 2002年 Hyperten一文发现该基因多态性与胰岛素抵抗及肥胖相关.因为他选择了高血压人群也未发现该基因多态性与血压相关. (170/105mmHg) 在1999年一项大规模的人群调查基础上的包括高血压(43%)和非高血压人群的研究却发现两种不同亚型基因的患者高血压患病率相差3倍(OR=3.43),GNB3 C825T多态性 对胰岛素抵抗与收缩压相关性的影响(第一代子女组),GNB3 C825T多态性 对胰岛素抵抗与舒张压相关性的影响(第一代子女组),LnIAI -4.21 -4.8 -5.15 -4.21 -4.81 -5.15 FINS(uIU/ml) 12.2 22.4 32.5 12.2 22.4 32.5 SBP DBP,第一代子女825CT/TT基因型组不同胰岛素敏感性及空腹胰岛素水平与血压的关系 (调整年龄、性别) (n=376),P0.05,P0.01,P0.001,GNB3 C825T多态性对胰岛素抵抗与血压关联的影响(第一代子女组),GNB3 C825T多态性 对胰岛素抵抗与收缩压相关性的影响(第一代子女组),GNB3 C825T多态性 对胰岛素抵抗与舒张压相关性的影响(第一代子女组),4、设定恰当的入选和排除标准,恰当的入选和排除标准可防止混杂因素的干扰,保证研究结果的科学性,这是在各项研究遵守的。 例如,看血压与胰岛关系,不可纳入有心功障碍及肾病患者,否则可结果会有偏差。,4、设定恰当的入选和排除标准,入组的研究对象的准入指标,是保证研究质量的最重要和最基本的条件,在研究设计和发表的论著中务必详细交代。 但这种选入排除标准应是实事求是的而不是过于苛求。,在制订纳入和排除标准时,在保证研究质量的前题下,一定要考虑研究成果的代表性和研究结果推广的受益面。 例:有一重点课题仅考虑入组病例诊断的严格性 排除标准竟设计了17项 合格的纳入对象约占整个患该病人群的10%左右 90%左右的患者被排除掉。 即使该研究的结果有高度的内在真实性(internal validity),其代表性也仅为10%左右。,过度严格的选择会有轻型病人被排除, 使研究结果出现偏差。 例:冠心病与胰岛素的关系 仅用冠脉造影资料作为诊断标准 结果发现 冠脉造影(-)者:FINS 22 mm/ml 冠脉造影(+)者:FINS 23 mm/ml 结论是冠心病与胰岛素无关 问题出在什么地方?,问题出在“诊断标准”: 冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素! 或有轻度狭窄但达不到“狭窄的定义”的切点 没达到“狭窄”切点, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。,选入排除标准过于苛求 例: 研究胆石症与胰岛素抵抗的关系 (国家自然基金项目): 选择对象为 l 手术证实的初发胆囊胆固醇结石 l 年龄,性别,BMI相配(!) l 血压,糖耐量,血甘油三脂,尿酸,PAI 1, 尿蛋白量正常(!),表: 胆囊胆固醇结石与胰岛素抵抗的关系 结石组 对照组 P 年龄 33.9+9.32 39.97+9.71 0.85 BMI 22+2.44 22.14+2.35 0.23 WHR 0.83+0.06 0.81+0.07 0.05 FINS 17.6+1.3 17.8+1.2 0.72 INS2H 47.5+1.4 38.9+1.5 0.04 SBP 111.4+11.1 102.4+11.9 0.00 Ins Sen index -4.37+0.29 -4.42+0.25 0.33 结果: 未发现胆石症与胰岛素抵抗相关, SBP,INS2H升高是胆石症的危险因素(?),(二)、选择试验效果测试指标: 选择要求,关联性:指标与研究目的有本质的联系,应能确切反映处理因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药物疗效。 灵敏性:指标能正确反映效应变化的最小数量或最小水平 。 特异性:对治疗反应的阳性结果要能准确地测量和确定,其特异性越强越好;尽量选用客观指标作为主要观察指标。 精确性:包含准确度(效度)和精密度(信度)两个方面。 稳定性:变异程度 经济可行:在考虑敏感性和特异性的基础上,应从各种方法比较中,选择经济及可行性良好的测试方法和指标。 指标的选择要少而精,在治疗性研究方法中相应的预防和处理的措施 如防止选择性偏倚,使用随机抽性与随机分配法; 避免测量偏倚,使用盲法; 减少机遇因素的影响,采用限制型及型错误水平的方法; 有的混杂因素可通过配对及统计分层分析法加以避免或处理; 通过严格培训人员,严格实验仪器、条件和方法以防止混乱; 通过医学知识教育,改善医疗服务环节,以促进患者的 依从性等 这些措施和方法均应贯穿整个设计、执行和资料分析的全过程,保证研究的高质量,从而获得科学的结论。,三. 统计分析,在我国临床科研的统计学应用中,在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别有统计学意义,而较少对测定值进行95%可信区间估计,提及样本量估计及抽样方法、样本代表性问题的文章就更少了 在80年代初期,国外医学杂志针对类似的情况曾进行广泛的讨论,提出应重视区间估计的意义而不能将注意力集中在P值是否小于0.05上。,现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值,如相对危险度(Relative Risk , RR, RR值就是暴露人群发病机与非暴露人群发病机率之比,即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。诸如95%可信限的区间估计可以提供更多有价值的信息 但在我国临床科研的统计学应用中尚未引起足够的重视。片面地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。,(1)、描述性统计 描述性统计分析是统计检验的基础,能提供资料的总体特征,不论在最后的论文报告中描述性统计分析的结果占多大的比重,它都是实际的资料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量提供重要的信息, 发现原始资料中的错误 忽略必须的描述性统计分析 是导致统计方法应用不当的原因。,从简单到复杂 最基本的分析形式为单个因素的不匹配不分层资料组间比较的分析 这是病例对照研究推断性统计的基础。 可比较病例组与对照之间危险因素的分布情况,分析其危险因素与患病之间的联系。 由于病例和对照只是总体的代表, 无法直接计算真实的患病率,也就无法直接计算RR值,可以估计相对危险度OR,用以来代替RR。,表6 饮酒与食管癌病例对照研究资料 饮酒 食管癌组 对照组 合计 大量 a 328 b 258 586 不饮 c 107 d 193 300 合计 435 451 886 将表6的数据代入公式得:OR=ad/bc OR值是两个概率的比值,这一数值范围是从0到无限大的正数。当数值为1时,表示暴露与疾病危险无关联,当数值大于1说明疾病的危险度增加,叫做“正”关联,当数值小于1说明疾病的危险度减少,叫做“负”关联。,(2)、统计分析中变量的选择,变量的确定: 研究的目的是相看哪两个变量之间的关系(不妨假设一因,一果) 例 ;高血压为因,冠心病为果,A.明确变量的性质,重点和首要的看变量是否为正态分布 分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白,骨密度等都常为非正态分布。 非正态分布的变量是不能以原始资料进行参数统计分析,此时不进行正态化处理,得出结论会面目全非。,B. 注意变量的动态变化 由于前瞻研究的期限较长,有些长达几年甚至十几年,这类研究中特别要注意变量的自身演变,有些变量是不会变的,如身高;有些因素在“成长”,如血压、血糖;有些变量在某一时期在“成长”,在某时期却在“衰减”,甚至消失,,例: 血胰岛素水平 从糖耐量正常到糖耐量低减这几年,胰岛素水平在逐渐升高; 从糖耐量低减到糖尿病胰岛素水平在下滑;晚期糖尿病胰岛素则衰亡,水平很低,在一个包括NGT、IGT、DM的人群中 观察数年期间 有的个体胰岛素水平在升高 有的胰岛素水平在下降 故此在这总人群以基线水平去预测某种疾病自然得不出正确的结论 在演变中未变成糖尿病人群中,可以发现胰岛素对某事件的阳性作用,而在IGT演变为糖尿病,尤其是糖尿病病情恶化的人群中,则会看到它的阴性作用。,这种影响的两级分化 在极大程度上还会受观察期限的影响: 在非糖尿病人群落观察十年,如不删除研究期间恶化为糖尿病的病例,就可能大大低估胰岛素的致病作用 在NGT人群观察5年,则不会出现上述偏移 对这种消亡中的变量,如不在人群选择和研究时限上加以严格的限制,很难有可靠的结果。,对象和方法,1986-1992 1986年 170 非糖尿病人 (25-74岁) (107 NGT 63 IGT) 1992年 126NGT,IGT 44DM,基线OGTT胰岛素曲线下面基线与6年后血压的关系(n=170),非高血压人群基线OGTT胰岛素曲线下面积与6年后的收缩压水平的关系 ( n=126) 因变量: 随访6年后SBP R2 =0.33,.非高血压人群基线OGTT INSAUC与6年后的DBP水平的关系 因变量: 随访6年后DBP (n=126) R2 = 0.27,C、决定哪些变量进入多因素分析?,过度调整? 调整失当? 调整不足?,确定重要的变量(包括混杂因素)数量的方法,1.首先可根据自己对所研究领域专业知识的了解初步选择 例: 对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系 对照组 糖尿病组 糖尿病组+冠心病组 病例数 38 36 39 男/女 29/9 24/12 36/3 年龄 70.8+10.8 64.8+11.9 72.7+8.3 高血压(有/无) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56 PON-192 BB 13.2% 11.1% 30.8% 年龄是必须调整的混杂因素,确定重要的变量(包括混杂因素)数量的方法,1.首先可根据自己对所研究领域专业知识的了解初步选择 例: 对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系 对照组 糖尿病组 糖尿病组+冠心病组 病例数 38 36 39 男/女 29/9 24/12 36/3 年龄 70.8+10.8 64.8+11.9 72.7+8.3 高血压(有/无) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56 ? DM病程 0 ? ? ? 服药 0 ? ? PON-192 BB 13.2% 11.1% 30.8% 年龄是必须调整的混杂因素,2. 然后加入文献中同类研究必须纳入的变量 3.应用逐步回归分析也会发现哪些变量应该选入。 有些研究在分析中囊括全部已测变量来做多因素步回归分析,或以为计算机挑出的变量就是最佳变量,是一种误解。 计算机挑出的变量受许多因素的影响,有些未被计算计挑出的变量有时非常重要(如年龄、性别), 所选变量中若不含有这些变量,分析结果可能不会被承认。,变量的选择,1、强制进入模型(logistic stepwise); 2、 Age Age2 ; 3 、interation:BMI.INS(BMIINS); 4、调整混杂因素后的(meanSE); 5、调整年龄性别后的率 : logistic回归 Model DM=age sex r_BMI,连续变量(BMI)改为分组变量(r_BMI),1组 2组 3组 4组 5组 HP=Age Sex r_BMI,因果关系与研究对象选择及分组 -BMI HP,因 BMI25 BMI25 AGE Sex HP SBP DBP,因果关系与研究对象选择及分组 -HP BMI,因 HP0 HP1 Age Sex BMI TC SMO HPH.s,D、决定用等级变量还是连续变量,分析中随意决定将原来的连续变量改为等级变量也是常见的错误 研究者不明白哪些变量应作为连续变量,哪些变量应作为等级变量 分析中将某一变量作为等级变量还是连续变量不是可以随意决定,而是由变量本身的性质决定的。,D、决定用等级变量还是连续变量,将本应作为连续变量的参数改为等级变量有时会丢掉许多有用的信息。 决定哪些变量应作为连续变量,哪些变量应作为等级变量应由其与因变量线性相关(pearson)及等级相关(spearman)的结果来决定,线性相关优于等级相关的变量不应以等级变量进入分析。 pearson 相关优于spearman 相关用连续变量较合理。 spearman 相关优于Pearson相关用分组变量较合理。,E. 确定入选变量的数目,入选变量并非入选变量的数目越多研究越严密, 总的自变量数应由样本数决定(1:10),(对于多因素设计,观测变量数为样本例数的1/5-1/10)。 一些作者在分析中自变量的选择目的不明,一共有100个病例,每人有30个变量,就将30个变量都用作为自变量,以为自变量越多,分析水平越高。,注意变量间相互关系 作者应十分明确所研究的两个主要变量的关系 将可能的混杂因素作为协变量放入模型 选入过多变量画蛇添足,徒劳无益,甚至有害 选入过多的协变量统计学上称为“过度调整”,这种调 整常常掩盖有意义的关联。,作为一个原则,多因素分析中,如不是为什么特殊目的,不宜将两个密切相关的变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论