Poisson回归模型及其应用.ppt_第1页
Poisson回归模型及其应用.ppt_第2页
Poisson回归模型及其应用.ppt_第3页
Poisson回归模型及其应用.ppt_第4页
Poisson回归模型及其应用.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Poisson回归模型及其应用,宁波大学医学院沈其君,问题提出,队列研究开放队列固定(封闭)队列特点:随防时间长随访中有进有出(失访)影响因素多低发病率M-H法和标准化法Logistic回归模型Cox回归模型Poisson回归模型,Poisson回归模型的引入,回归分析研究因变量与自变量间关系分析目的预测与控制、因素分析与筛选、危险度估计(RR和PAR)Logistic回归模型因变量为二项分布Poisson回归模型因变量为Poisson分布,低发生率的(分组)计数(离散)资料(如低发病率或死亡率),自变量可以连续型或离散型,率(发生数)与因素间关系一个实例,例Scotto等人对美国北方城市M城和南方D城15岁以上妇女患非黑色素皮癌状况进行调查,结果见表13-3,年龄每10岁一层。试用Poisson回归模型分析年龄效应和南北城市的差别。,率(发生数)与因素间关系资料结构,对于队列研究资料,设一个变量为混杂因素(如年龄)分为J层(可以是多个因素交叉形成的层),另一个变量为暴露因素,分为K个水平(可以是多个因素形成的水平)。假如在第j层、第k个暴露水平(j=1,2,J;k=1,2,K)观察了njk例(人年),其中有djk例发病(或死亡)。形成如表13-1的形式。并可计算观察发病(死亡)率或发病密度。,率(发生数)与因素间关系资料结构,表中最后一列是第j层的发病率或发病密度(对暴露因素求合计)。表中的jk为第j层第k个暴露水平下的发病(死亡)率或发病密度的估计值,其真正的发病(死亡)率或发病密度为hjk,是层别因素和暴露因素的作用结果。,层别、因素组成设计阵,对于队列研究资料,将层别和因素交叉分组形成列联表资料,这里的层别和因素实际上为有序分类变量资料(等级资料),分析中可以将层别、因素用多个01变量表示形成设计阵(designmatrix)。为叙述方便,假定J=8,K=2,记i为82列联表格子的顺序编号,则设计阵为表13-2的形式,率与协变量间的回归模型结构,在hjk与层别因素、暴露因素间可通过几种不同模型结构反映其间的关系,并通过模型中参数来反映层别因素、暴露因素的效应大小。若用j表示层别因素第j层的效应,k表示暴露因素第k个水平的效应,则常用的表示hjk与层别、暴露因素间关系的模型常见的有两种。,加法模型(additivemodel),hjk与层别j、暴露因素k间加法模型表示形式为:hjk=jk当设计阵表示资料结构时,率的加法模型为:hi=,p=J+K-1参数j和k可以用观察数据进行估计。对于第一暴露水平的基准组,由于1=0,则有hj1=j,或hi=j。,乘法模型(multiplicativemodel),当加法模型不成立时,常将率作对数变换,其形式为:lnhjk=jk或表示为:hjk=exp(jk)=exp(j)exp(k)当资料结构以设计阵形式表示时,率的乘法模型形式为:,乘法模型(multiplicativemodel),上述hjk、hi与j、k间的模型形式称为乘法模型。当层别与因素间无交互作用时,以k=1为基准组(exp(1)=1),而exp(k)就是第k个暴露水平相对于基准组的疾病相对危险度。当层别与因素间存在交互作用时,只能分层计算第k个水平相对于k=1水平的相对危险度。,幂转换模型(powermodel),幂模型的形式为当=1时为加法模型,由于在=0时为log(h),即乘法模型,当在01时为一簇模型。可根据实际数据拟拟合模型的形式。但解释上不如加法和乘法模型简单。,非线性模型(nonlinearmodel),对于流行病学资料,在研究因素与疾病发生间的关系时需要鉴别其间的关系是加法模型还是乘法模型。然而,从经验和实践的角度,肿瘤等慢性病流行病学的暴露效应很多情况都符合乘法模型。除加法模型和乘法模型外,率与协变量间可以有非线性形式,需对研究问题深入了解的基础上来构建非线性模型。,Poisson回归模型及其参数估计,Poisson分布条件下回归模型的似然函数参数估计模型拟合度与参数检验,Poisson分布下模型的似然函数,对于低发生(病)率的开放性队列研究资料,由于di服从Poisson分布,其概率函数为:其中di是随机变量,可取值为di=1,2,其期望发生数i=nihi()。回归模型的似然函数为Poisson分布条件下各个格子概率函数的总概率(积)。L()=,参数估计,两侧取对数,回归模型的对数似然函数为:lnL()=对数似然函数中的未知参数可以用迭代重复加权最小二乘法(简称IRLS法)估计,它与通常的极大似然估计结果一致。也可用极大似然估计法,模型拟合度与参数检验偏差统计量,Poisson回归模型拟合好坏用偏差统计量(deviance)表示,偏差统计量实际上是对数似然比统计量,它是饱和模型(saturatedmodel)和拟合模型对数似然值差的两倍,其在Poisson分布条件下的计算公式为:,模型拟合度与参数检验2统计量,G2服从于自由度为n-p的2分布(n为格子数,p为模型中参数个数)。模型的拟合度也可用每个格子的实际发生数与期望数的2统计量来表示。,参数(因素)检验,参数检验可通过两个包含不同参数个数模型的偏差统计量G2的差(G2)和自由度的差(df)来实现,当G2时,PChiSqAGE266.9143CITY8.19501258.72ChiSqAGE72561.57.0001CITY1258.72ChiSqIntercept1-7.07600.0476-7.1694-6.982622070.7.0001AGE112.28830.06272.16542.41121331.64.0001CITY110.80310.05220.70080.9054236.92ChiSqIntercept2790.3403AGE1272.649312517.69ChiSqAGE112555.40.0001CITY1258.28.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论