




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS详细操作:广义估计方程 SPSS详细操作:广义估计方程2017-03-18 17:40一、问题与数据在临床研究中,经常会比较两种治疗方式对患者结局的影响,并且多次测量结局。例如,为了研究两种降压药物对血压的控制效果是否存在差异,研究者会对两个人群服药后在不同时间点记录血压值,然后评价降压效果。或者对两组动物分别施加两种干预,连续记录多个时间点的结局,然后比较两种干预的效果。这种设计可以用如下示意图表示:另外,有时研究只需要收集一个时间点的数据,但是一个研究对象会提供多个部位的数据点。例如,研究者想评价冠心病患者在冠脉搭桥术后应用阿司匹林是否可以有效降低患者血管的再堵塞,评价的方法是术后1年做冠脉造影观察血管是否堵塞,但是每个患者可能会在同一次手术中对多条冠状动脉血管进行搭桥,因此有的患者可能会贡献多组数据。这种设计可以用如下示意图表示:以上两种设计,不管是临床试验还是动物试验都非常常见,它的特点在于数据间非独立,同一个体间数据具有相关性。对于这样的设计类型,该如何分析呢?今天我们来介绍另外一种非常好的方法广义估计方程(GEE)。GEE既可以处理连续型结局变量也可以处理分类型结局变量,它实际上代表了一种模型类别,即在传统模型的基础上对相关性数据进行了校正,可以拟合Logistic回归、泊松回归、Probit回归、一般线性回归等广义线性模型。本文将以阿司匹林预防冠脉搭桥后血管再堵塞为例介绍运用SPSS进行GEE的操作方法。以下为数据格式:表1. 数据格式每名患者贡献数据量不等。如编号为1的患者只对一根血管进行了搭桥手术,编号为2的患者则有两根血管进行搭桥手术。表2. 变量赋值(注:本例中数据纯属虚构,分析结果不能产生任何结论。性别为待调整变量。)二、SPSS分析方法1. 数据录入SPSS首先在SPSS变量视图(Variable View)中新建上述表2中变量,然后在数据视图(Data View)中录入数据。2. 选择Analyze Generalized Linear Models Generalized Estimating Equations3. 选项设置 在Repeated模块中,将患者ID选入Subject variables 框,搭桥血管Num选入Within-subject variables框。在Working Correlation Matrix的Structure下拉列表中选择同一患者贡献数据的相关性结构。其有5个选项,分别为:Independent:各数据间独立,即同一患者贡献的数据可以视为来源于不同个体。AR(1):自相关,用于不同时间点的数据,相邻时间点相关性最大,时间间距越大相关性越小。Exchangeable:等相关,各数据点的相关性均相等。M-dependent:相邻相关,仅临近的M+1个数据相关。Unstructured:不限定相关结构,由数据本身决定。本例中,同一患者搭桥的血管互相之间应等同看待,两两间相关性应相等,因此选择等相关更合适。其他维持默认。 在Type of Model模块中设置模型类型在此界面有6种模型类型可选:Scale Response:结局变量为连续型变量Ordinal Response:结局变量为有序分类变量Counts:结局变量为计数Binary Response or Events/Trials Data:结局变量为二分类变量Mixture:结局变量为Tweedie分布变量Custom:自定义以上6大类类型下还需选择连接函数。本例中结局变量为二分类变量,Logistic回归应用更加普遍,因此我们选择Binary logistic来拟合校正数据相关性的Logistic回归模型。 在Response模块指定结局变量将Outcome变量选入Dependent Variable,在Reference Category中选择最小值作为参考值(本例中0为最小值,代表未发生结局)。 在Predictors模块中将要纳入模型的Treatment和Sex变量选入Covariates中。Covariates应放入连续型变量,Factors中放入分类变量,但是本例中两自变量均为二分类变量,放入Covariates处也可。 在Model模块中将Treatment和Sex选入Model框内,还可纳入交互项,本例中不纳入。 在Statistics模块中除默认外,另外勾选Include exponential parameter estimates以获得OR值,然后点击OK。三、结果解读结果中首先给出的是一些模型基本信息,在此略过。这里仅介绍模型参数估计值结果:从结果可以看到,Treatment变量的系数值(B)为-1.077,Exp(B)为0.341,即OR值,P=0.046,说明术后使用阿司匹林的患者1年后发生血管再堵塞的风险是使用安慰剂组的0.341倍且有统计学意义,即阿司匹林具有保护作用。另外我们纳入校正的性别变量Sex OR值为0.692,但P=0.531未达显著水平。如果我们不考虑数据间的相关性,直接采用传统的Logistic回归模型,那么将得到以下结果:从结果中可以看到,尽管Treatment的OR值与GEE模型中相差不大,但其P值却不再显著。从本例中可以看到,如果在数据分析中方法选用错误将可能得不到正确结论。四、结果汇总冠脉搭桥术后患者应用阿司匹林可以有效降低发生血管堵塞的风险。服用阿司匹林组患者发生血管堵塞风险是服用安慰剂组患者的0.341倍(P=0.046)。五、总结与拓展对于文首提及的两个例子,常见的分析方法有重复测量方差分析和多水平模型,但是重复测量方差分析要求结局变量为连续变量,不适用于分类变量。多水平模型处理相关性数据时非常灵活,结局可以为连续变量,也可以为分类变量,应用非常广泛。GEE的应用似乎没有前两种广泛,但其具有非常好的特性。GEE既可以处理连续型结局变量也可以处理分类型结局变量,其优势在于,即使设定的数据间相关结构与实际有偏差,在样本量较大时其模型估计参数仍然具有无偏性。GEE模型中自变量系数估计值准确性的论证相较于多水平模型更加充分,因此部分研究者更加推荐使用GEE。虽然GEE模型中数据间相关结构指定错误时模型系数也具有无偏性,但前提是样本量要足够大。在同样的样本量下,正确的相关结构更可能得到准确的参数估计和置信区间,因此应仔细分析数据类型,选择最可能正确的相关结构。关于GEE的内容较为复杂,在此无法详述,对GEE有兴趣的读者或需要使用GEE模型的读者,推荐阅读专业书籍和文献。SPSS详细操作:广义估计方程2017-03-18 17:40一、问题与数据在临床研究中,经常会比较两种治疗方式对患者结局的影响,并且多次测量结局。例如,为了研究两种降压药物对血压的控制效果是否存在差异,研究者会对两个人群服药后在不同时间点记录血压值,然后评价降压效果。或者对两组动物分别施加两种干预,连续记录多个时间点的结局,然后比较两种干预的效果。这种设计可以用如下示意图表示:另外,有时研究只需要收集一个时间点的数据,但是一个研究对象会提供多个部位的数据点。例如,研究者想评价冠心病患者在冠脉搭桥术后应用阿司匹林是否可以有效降低患者血管的再堵塞,评价的方法是术后1年做冠脉造影观察血管是否堵塞,但是每个患者可能会在同一次手术中对多条冠状动脉血管进行搭桥,因此有的患者可能会贡献多组数据。这种设计可以用如下示意图表示:以上两种设计,不管是临床试验还是动物试验都非常常见,它的特点在于数据间非独立,同一个体间数据具有相关性。对于这样的设计类型,该如何分析呢?今天我们来介绍另外一种非常好的方法广义估计方程(GEE)。GEE既可以处理连续型结局变量也可以处理分类型结局变量,它实际上代表了一种模型类别,即在传统模型的基础上对相关性数据进行了校正,可以拟合Logistic回归、泊松回归、Probit回归、一般线性回归等广义线性模型。本文将以阿司匹林预防冠脉搭桥后血管再堵塞为例介绍运用SPSS进行GEE的操作方法。以下为数据格式:表1. 数据格式每名患者贡献数据量不等。如编号为1的患者只对一根血管进行了搭桥手术,编号为2的患者则有两根血管进行搭桥手术。表2. 变量赋值(注:本例中数据纯属虚构,分析结果不能产生任何结论。性别为待调整变量。)二、SPSS分析方法1. 数据录入SPSS首先在SPSS变量视图(Variable View)中新建上述表2中变量,然后在数据视图(Data View)中录入数据。2. 选择Analyze Generalized Linear Models Generalized Estimating Equations3. 选项设置 在Repeated模块中,将患者ID选入Subject variables 框,搭桥血管Num选入Within-subject variables框。在Working Correlation Matrix的Structure下拉列表中选择同一患者贡献数据的相关性结构。其有5个选项,分别为:Independent:各数据间独立,即同一患者贡献的数据可以视为来源于不同个体。AR(1):自相关,用于不同时间点的数据,相邻时间点相关性最大,时间间距越大相关性越小。Exchangeable:等相关,各数据点的相关性均相等。M-dependent:相邻相关,仅临近的M+1个数据相关。Unstructured:不限定相关结构,由数据本身决定。本例中,同一患者搭桥的血管互相之间应等同看待,两两间相关性应相等,因此选择等相关更合适。其他维持默认。 在Type of Model模块中设置模型类型在此界面有6种模型类型可选:Scale Response:结局变量为连续型变量Ordinal Response:结局变量为有序分类变量Counts:结局变量为计数Binary Response or Events/Trials Data:结局变量为二分类变量Mixture:结局变量为Tweedie分布变量Custom:自定义以上6大类类型下还需选择连接函数。本例中结局变量为二分类变量,Logistic回归应用更加普遍,因此我们选择Binary logistic来拟合校正数据相关性的Logistic回归模型。 在Response模块指定结局变量将Outcome变量选入Dependent Variable,在Reference Category中选择最小值作为参考值(本例中0为最小值,代表未发生结局)。 在Predictors模块中将要纳入模型的Treatment和Sex变量选入Covariates中。Covariates应放入连续型变量,Factors中放入分类变量,但是本例中两自变量均为二分类变量,放入Covariates处也可。 在Model模块中将Treatment和Sex选入Model框内,还可纳入交互项,本例中不纳入。 在Statistics模块中除默认外,另外勾选Include exponential parameter estimates以获得OR值,然后点击OK。三、结果解读结果中首先给出的是一些模型基本信息,在此略过。这里仅介绍模型参数估计值结果:从结果可以看到,Treatment变量的系数值(B)为-1.077,Exp(B)为0.341,即OR值,P=0.046,说明术后使用阿司匹林的患者1年后发生血管再堵塞的风险是使用安慰剂组的0.341倍且有统计学意义,即阿司匹林具有保护作用。另外我们纳入校正的性别变量Sex OR值为0.692,但P=0.531未达显著水平。如果我们不考虑数据间的相关性,直接采用传统的Logistic回归模型,那么将得到以下结果:从结果中可以看到,尽管Treatment的OR值与GEE模型中相差不大,但其P值却不再显著。从本例中可以看到,如果在数据分析中方法选用错误将可能得不到正确结论。四、结果汇总冠脉搭桥术后患者应用阿司匹林可以有效降低发生血管堵塞的风险。服用阿司匹林组患者发生血管堵塞风险是服用安慰剂组患者的0.341倍(P=0.046)。五、总结与拓展对于文首提及的两个例子,常见的分析方法有重复测量方差分析和多水平模型,但是重复测量方差分析要求结局变量为连续变量,不适用于分类变量。多水平模型处理相关性数据时非常灵活,结局可以为连续变量,也可以为分类变量,应用非常广泛。GEE的应用似乎没有前两种广泛,但其具有非常好的特性。GEE既可以处理连续型结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025微信支付商业合作合同
- 2025租房定金合同范本
- 2025年保洁员考试及答案
- 兰州消防证书题库及答案
- 私人模块化厕所施工方案
- 江宁工厂隔音墙施工方案
- 中央电视台吊顶施工方案
- 池塘新建排水渠施工方案
- 黄冈玻璃棉卷毡施工方案
- 医务人员高考试卷及答案
- 中国民间传说:田螺姑娘
- 桥式起重机Q2练习测试题附答案
- 高级茶艺师理论知识试题
- 哈里伯顿Sperry定向钻井介绍专题培训课件
- 2021年江苏省徐州市中考生物试卷(附详解)
- JJF 1704-2018 望远镜式测距仪校准规范
- 石油化工设备维护检修规程通用设备12
- 《三角形的面积》教学设计方案
- GB/T 14667.1-1993粉末冶金铁基结构材料第一部分烧结铁、烧结碳钢、烧结铜钢、烧结铜钼钢
- 带状疱疹及带状疱疹后神经痛
- 2022年毕节市农业发展集团有限公司招聘笔试试题及答案解析
评论
0/150
提交评论