




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,北京地区人群代谢综合征组分及其组合动态风险评估与高凝聚类发病机制的糖基组学研究,主讲人:郭秀花教授guoxiuh单位:首都医科大学公共卫生学院北京市临床流行病学重点实验室时间:2015.9.12,1978年8月9号美国一著名报纸刊登了一条科技信息:某单位对美国20个城市做饮水氟化研究,10个城市的饮水氟化,而另10个城市未氟化作对照,结论是:“饮水氟化有致癌作用”。但过了一个时期,该报纸又刊登了相反的文章。,案例:引水氟化是否有致癌作用?,原来前述论文发表后,受到美国癌肿协会和英国统计协会的怀疑,他们派人对该批数据重新做统计分析,其结论是:“饮水氟化没有发现有致癌作用,相反,却略有保护作用。两个结论差别如此之大,根源在于第一分析法未控制混杂,采用单因素分析法,而后一个结论则把两个城市中的种族、生活环境上的混杂因素进行控制(多元统计分析),再去比较两组城市的癌症患病率。,案例:携带火柴和发生肺癌间有关系?,某研究者进行问卷调查,结果发现:是否携带火柴和肺癌患病率有关,携带火柴的人更有可能发生肺癌。难道这表明携带火柴可能引起肺癌?!,客观事实:携带火柴不可能引起肺癌!,混杂因素的影响,携带火柴?肺癌吸烟,这中间存在混杂因素-吸烟,6,一、混杂因素,混杂(confounding):指在流行病学研究中,由于一个或多个潜在的混杂因素的影响,掩盖或夸大了研究因素与疾病(或事件)之间的联系,从而使两者之间的真正联系被错误地估计,造成混杂。,1.概念,混杂因素(confoundingfactor):指与研究因素和研究疾病均有关,若在比较的人群中分布不均,可以歪曲研究因素与疾病之间真正联系的因素。,7,2.混杂因素的基本特点:(1)必须与所研究疾病有关(2)必须与所研究因素有关(3)一定不是研究因素与研究疾病因果链上的中间变量具备基本条件,如果在比较的人群中分布不均,即可导致偏倚。,策略,8,分析阶段分层分析标准化多因素分析,如何控制混杂因素?,二、如何通过建模控制混杂因素,表1数据形式(P2)观察对象X1X2XpY1a11a12a1py12a21a22a2py2nan1an2anpyn,分因变量具体情况:y是计量资料,多元线性回归分析y是定性资料,尤其是二值资料,采用Logistic回归分析y=t是生存时间,后面有是否为完全数据标志,采用COX回归分析,设在实际研究问题中,含有p个自变量x1,x2,xp;1个因变量,n个观察对象。,在医学实践中,常会遇到一个应变量与多个自变量数量关系的问题。如医院住院人数不仅与门诊人数有关,而且可能与病床周转次数,床位数等有关;儿童的身高不仅与遗传有关还与生活质量,性别,地区,国别等有关;人的体表面积与体重、身高等有关。,多元线性回归模型,通过实验测得含有p个自变量x1,x2,x3,xp及一个因变量y的n个观察对象值,利用最小二乘法原理,建立多元线性回归模型:其中b0为截距,b1,b2bp称为偏回归系数.bi表示当将其它p-1个变量的作用加以固定后,Xi改变1个单位时Y将改变bi个单位.,例:27名糖尿病人的性别、年龄、血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表3中,试建立血糖与其它几项指标关系的多元线性回归方程。,13,表327名糖尿病人的血糖及有关变量的测量结果,14,15,资料的研究目的是建立血糖与其它因素的线性回归方程性别和年龄与应变量(血糖)含量有关,也可能与自变量(血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白)有关,因此,怀疑性别、年龄为混杂因素将混杂因素(性别和年龄)放到多元线性回归模型中进行控制,从而更加准确地考察其它自变量与血糖的关系,SPSS分析结果,结果为扣除性别和年龄两个混杂因素的影响后,各指标与血糖的关系,16,在医学上,人们更关心疾病是否发生或发展的影响因素,既因变量是二值的。令:y=1发病(阳性、死亡、治愈等)y=0未发病(阴性、生存、未治愈等)Logistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。,Logistic回归-Logistic回归种类,表5肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区11103002101461300035130000261注:是否患病中,0代表否,1代表是。性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不吸烟。地区中,1代表农村,0代表城市。,由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有影响。所得的回归方程为:Logit(P)=-9.781+2.520X1+3.999X2+0.189X3-1.3067X4,解释,设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数。当bi0时,对应的优势比(oddsratio,记为ORi):ORi=exp(bi)1,说明该因素是危险因素;当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是保护因素。,弗明汉心血管疾病研究742名居住在弗明汉年龄为40-49岁的男性,在各自暴露不同水平的影响因素(详见下表中的6种因素),经过12年的追踪观察冠心病(CHD)的发病情况。根据此742名受试者每人暴露各项因素的水平和CHD发病与否的资料,采用多因素Logistic回归模型进行分析。,22,多因素Logistic回归分析,资料的研究目的是探讨CHD发病与否的危险因素血液中的胆固醇水平、血红蛋白浓度、血压水平、吸烟量因素可能是CHD发病的危险因素年龄既与胆固醇水平、血红蛋白水平、血压水平等因素相关,又与CHD是否发病相关,怀疑年龄是混杂因素使用多因素Logistic回归分析,将年龄放到模型中进行控制,考察CHD发病的危险因素,23,24,SPSS分析结果,影响生存时间的长短不仅与治疗措施有关,还可能与病人的体质,年龄,病情的轻重等多种因素有关。如何找出它们之间的关系呢?对生存资料不能用多元线性回归分析。1972年英国统计学家CoxDR.提出了一种能处理多因素生存分析数据的比例危险模型(Coxsproportionalharzardmodel)。,2020/5/17,26,生存时间(survivaltime):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。完全与不完全数据:一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据:censordata)。,27,例:某医师对1988年收治的16例鼻腔淋巴瘤患者随访了13年,信息包括:年龄(X1)、性别(X2)、疾病分期(X3)、鼻血(X4)、放疗(X5)、化疗(X6),数据见表2,试作COX回归分析鼻腔淋巴瘤的危险因素。,28,表2鼻腔淋巴瘤患者随访资料编项目登记观察记录整理号性别年龄分期鼻血放疗化疗开始日终止日结局生存天数1145220188-1-1789-8-1715782036220188-1-2192-4-17115493045201088-2-290-12-3104717051221088-12-195-5-2212363注:性别1为男性;放疗1表示采用,0表示未采用;结局1表示死亡。,该生存资料的研究目的是考察鼻腔淋巴瘤的生存时间的危险因素疾病分期(X3)、鼻血(X4)、放疗(X5)、化疗(X6),可能是鼻腔淋巴瘤患者生存时间的危险因素或者保护因素性别和年龄可能是鼻腔淋巴瘤患者生存时间的混杂因素因此使用COX回归分析控制混杂因素,探讨鼻腔淋巴瘤患者生存时间的危险因素。,29,30,SPSS分析结果,第i个因素的回归系数为bi,对应的风险比(riskratio,记为RRi):RRi=exp(bi),表示在控制其它因素(包括混杂因素)的情况下,该因素每增加一个单位时,风险度改变多少。,31,在本例中放疗X5,取值0和1,b=-1.589,RR=0.204,表示控制年龄、性别两个混杂因素,以及疾病分期、是否化疗等因素前提下,化疗(水平1)与不化疗(水平0)比较,样本资料前者的风险度是后者的0.204倍(20.4%),提示“放疗”是保护因素。“鼻血”X4取值是0、1、2,b=1.38,RR=3.979,表示控制其它因素的前提下,样本资料该因素水平每增加1个等级,风险度增加3.979倍,提示“鼻血”是危险因素。,COX比例风险模型,生存分析的基础模型?,先进模型,32,一般的生存时间过程:T0事件1竞争风险过程:T0,删失,可能发生的终点事件(endpoint)只有一个类型,事件1,事件2,事件m,删失,可能发生的终点事件有多个,研究方法,33,考虑竞争事件:竞争风险模型,34,首先需要注意变量的赋值方法对自变量的结果值编码方法(习惯上称为赋值)不同,则自变量的对应参数估计值及符号将有所不同,从而对结果的解释方式亦不同,某研究者探讨成人过敏性鼻炎的环境危险因素,采用11配对的病例-对照研究设计,选择某医院耳鼻喉科确诊的100例过敏性鼻炎患者为病例;同时选择该院耳鼻喉科确诊的非过敏性鼻炎患者,与病例11相匹配为对照。通过问卷调查的方法收集两组人群的一般社会人口学特征、疾病健康状况、吸烟史、职业接触史、室内环境状况及家族史等信息。问卷的统计分析采用多因素的条件Logsitic回归分析。,37,38,释疑:,资料的研究目的是探讨成人过敏性鼻炎的环境危险因素,应变量为是否患过敏性鼻炎,为二值变量,自变量都是定性变量,其中有二值的定性变量、多值有序的定性变量和多值名义的定性变量。对于二值变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 成品品种分类培训
- 智能小车启蒙课件
- 课件模板护眼
- 住陪师资培训
- 课件样片拍摄
- 新进教师培训心得
- 教师招聘之《小学教师招聘》题库检测试题打印附答案详解【突破训练】
- 考眼力考试题及答案
- 矿井电气防爆检查工专业技能考核试卷及答案
- 混合气生产工工艺考核试卷及答案
- 1.1 观察物体(1)(课件)人教版三年级数学上册
- 2025年国家网络安全宣传周知识竞赛题库(试题及答案)
- 2025年秋季学期“1530”安全教育记录表
- 手术室眼科无菌技术课件
- 骨折夹板固定技术课件
- 细胞生物学-第五章-物质的跨膜运输
- 中成药相关培训课件
- 景区安全用电管理制度
- 《生物化学》课件-1、绪论
- 大队委选拔笔试题目及答案
- 全科医师基层实践结业考试试题及答案
评论
0/150
提交评论