版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、周泉,常德市第一人民医院科教科,2017年5月,常德市第一人民医院,倾向性评分匹配的原理及软件操作,常德市第一医学院临床研究青年重点组培训课程课件,倾向性评分匹配原理介绍,01,倾向性评分匹配的软件操作,02,倾向性评分匹配应用注意事项,03,内容,常德市第一人民医院,倾向性评分匹配原理介绍,01,X,10指定曝光度?观察性,实验性,分析性横断面病例对照病例对照队列研究,随机对照试验(RCT),否,是,临床研究的常见类型,1。1简介。RCT研究,研究人群,治疗组,对照组,结果,结果,随机化,比较,失明?RCT研究介绍,RCT研究被称为临床预防研究的“金标准”,因为在RCT研究中,实验组和对照组
2、可以通过“随机分布”的方式平衡混杂因素,如研究一种药物对哮喘的疗效。在招募了一些哮喘患者后,研究人员将他们随机分为实验组和对照组,实验组接受药物治疗。对照组接受安慰剂治疗。经过一段时间的治疗,如果两组有效率不同,我们可以认为两组有效率的差异完全是由药物引起的。理论上,除药物外,实验组和对照组的临床特征相同或可比较。介绍RCT的研究,GCP是严格按照RCT的研究标准进行的,有些研究不能解决伦理问题。例如,吸烟与肺癌,我们不能做RCT研究,而RCT研究也有其不可避免的缺陷:RCT研究是特定人群在理想条件下的干预结果,不能很好地外推至真实的临床环境。例如,RCT的药物一般限制研究人群,年龄是有限的,
3、儿童不想要它,老年人不想要它,患有基础疾病的人也不想要它,但是在实际的临床环境中,如果他们遇到这些人,RCT的研究需要很高的试验条件和大量的投资,所以普通的小医院很难开展高质量和大样本的RCT研究。1.RCT研究,药品上市后扩大适应症的研究是药品的一种补充注册,要求研究人员对药品进行临床研究后向国家食品药品监督管理局报告,批准后允许在说明书中增加新的适应症。观察研究导论,上面流行的术语“现实世界的研究”实际上是一种观察性的临床研究。与RCT研究相比,观察性临床研究受试者的特点是客观的,所以研究者不能干预他们,他们的研究结果更接近实际情况。同时,由于其更广泛的纳入和排除标准,他们的研究成果更具外
4、推性和实用性。观察性研究,但与RCT研究相比,观察性研究相当尴尬。因为没有随机分组,所以除了要研究的暴露因子X之外,实验组和对照组之间的基线特征存在许多差异(即混杂因素)。因此,两组中结果事件的发生可能不完全是由暴露因子x引起的。观察性研究,一项探讨基线胆固醇升高的个体是否更有可能发展为急性心肌梗死的研究。在本研究中,根据受试者的胆固醇水平,研究人员将队列分为两组:高胆固醇血症组和正常胆固醇组,并对两组进行随访。20年后,观察结果显示,基线高胆固醇血症组的急性心肌梗死发生率高于基线正常胆固醇组。可以认为高胆固醇血症是急性心肌梗死的危险因素吗?答案是:不,这种现象可能是因为基线高胆固醇血症组中可
5、能导致急性心肌梗死的其他相关因素与正常胆固醇组中的因素不一致。在观察人群中,基线高胆固醇血症组的甘油三酯和高血压水平也可能高于基线正常胆固醇组。尚不清楚这是由胆固醇升高引起的急性心肌梗死,还是由混合因素甘油三酯和高血压引起的急性心肌梗死。引入倾向评分匹配原则,混合偏倚可能会改变研究结果的真实性,从而相应地限制观察性临床研究结果的实际应用价值。在观察性临床研究中,能否有效控制偏倚成为其成功的关键。在这种情况下,趋势分数匹配就诞生了。罗森鲍姆和鲁宾在20世纪80年代首次提出倾向得分的概念。触痛评分法是利用倾向性评分值综合所有观察到的变量信息,从而达到平衡变量和减少偏差的目的。触痛评分符合SCI论文
6、的写作常规。近年来,倾向性评分的应用越来越普遍。pubmed数据库在2010年专门为使用这种方法的论文指定了一个关键词。2017年5月16日,我搜索了PUBMED数据库,发现有11,469篇论文采用了倾向评分法。倾向评分网格术语或(倾向评分匹配标题/摘要)或(倾向匹配分析标题/摘要)或(倾向匹配研究标题/摘要)或(基于倾向评分的分析标题/摘要)或倾向评分标题/摘要、触痛评分匹配SCI论文的写作常规,与每年发表的倾向评分相关的论文分布如下图所示:3。倾向性评分匹配原则的介绍是倾向性评分方法应用的一个方面,在英语中称为“触痛评分匹配”,即通过一定的统计方法对实验组和对照组进行筛选。使选定的受试者在
7、临床特征(潜在的混杂因素)上具有可比性。此时,实验组和对照组的结果存在差异,这可以完全归因于实验因素,即暴露因素。趋势评分匹配原理及研究步骤介绍:根据临床经验和实际需要,以处理因素为因变量(y),混杂因素为自变量(x),构建回归模型。从大量观测数据拟合回归模型的参数;根据拟合的回归模型,计算出每个个体的倾向指数,指数范围为0-1,反映了该个体被分为实验组的概率;在倾向性指标的基础上,采用倾向性评分匹配法来平衡群体间的协变量分布。倾向性评分匹配的原理、软件操作、实例介绍,以我院杨博士的一篇SCI论文数据为例,说明如何利用统计软件实现倾向性评分匹配。实例介绍,该实例是本文数据的一部分:共有483例
8、患者样本,收集的变量有患者身份证号、性别、乙肝表面抗原、儿童评分、相册等指标。软件准备,使用的软件是易易统计软件,是美国解决方案公司最新研发的一套数据分析软件。软件背景程序基于软件,是国际公认的。2013年底,为中国研究人员开发了中文版。该软件基于科学研究和分析的新设计理念,融合现代计算机软件技术,采用可视化数据挖掘和分析操作界面。统计方法的自动选择2.软件准备,下面介绍如何下载、安装和登录软件。百度的“易易统计”进入第一个网页。2。软件准备,下载“易易统计”到电脑并安装它。2。软件准备,进入软件登录界面,点击右上角的“注册新账户”,您可以通过填写电子邮件地址免费使用软件一个月。2。软件准备,
9、登录后的软件界面如上图所示、3。示例操作,用“易软件”开始实现PSM:导入数据,打开EXCEL电子表格文件,保存为“文本文件(制表符分隔)”并命名。实例操作,导入数据,打开“易易软件”,点击“分析项目”和“新建项目”,读入刚刚保存的文本文件(制表符分隔)NLR2,然后点击下面的“读取数据文件”。3。示例操作,数据读取成功、3。示例操作,PSM操作,单击软件上方的“数据操作”菜单,并选择“病例对照配对”。3。示例操作,PSM操作,进入“病例对照匹配”界面后,在病例对照分组变量处选择研究分组变量NLR,在研究对象编号处选择原研究编号变量id,在匹配变量处选择要调整的混合因子(下图右侧蓝色部分)变量
10、,然后勾选“计算趋势得分和按得分匹配”,在1: N匹配处选择n=1。示例操作、结果解释、示例操作、结果解释,软件还生成了一幅图片,形象地展示了原始数据中118个病例和365个对照的倾向得分分布。可以看出,软件计算的趋势得分在0到0.8之间。两组在每个得分区间的重叠越多,就越容易成功匹配。3。示例操作,匹配后显示数据,右键点击软件左侧“案例控制匹配”分支树中的“PROJ1_1tbl.htm”,选择图中的第一个xls表,再次点击,在弹出的对话框中选择“是”,软件将自动打开EXCEL表。3。示例操作,匹配后数据显示,打开EXCEL后PP.score变量显示所有记录的趋势得分。3。示例操作,匹配后显示
11、数据,然后回到软件左侧“病例对照匹配”分支树中的“项目1_1tbl.htm”,右键点击,选择项目1 _ 1 _ TBL _ NLR _ PPS _ Match _ DD XLS表,再次点击,在弹出的对话框中选择“是”,软件会自动打开EXCEL、3。示例操作,匹配后显示数据,在打开的EXCEL表中有五个变量,group.id表示案例控件配对组号,group.n表示每个组中有多少人,如果只有一个人表示没有找到控件,如果两个人表示找到了一个控件。ID是原始数据的编号,NLR是原始数据中的分组变量,pp得分是趋势得分值、3。病例操作,匹配后显示数据,利用vlookup功能将软件生成的匹配数据与原始研究
12、数据进行比较,剔除三个未匹配成功的病例数据和对照组数据,生成新表。示例操作,下面是匹配后的数据显示,将其保存为NLRpsm,并显示匹配后的数据。示例操作,显示匹配效果,由于匹配是为了使两组的基线特征相似,因此有必要检查匹配后的数据是否达到预期效果。首先,我们使用易易软件对匹配前的原始数据进行基线统计。步骤1:选择软件“数据分析”菜单下的“研究人群描述”模块。示例操作,匹配效果显示,步骤2:在“研究人群描述”模块中,选择NLR作为列分层变量,选择如下图所示的蓝色混合变量作为分析变量。在小数点处选择0.01,然后单击下面的“查看结果”。示例操作,匹配效果显示,从生成的结果可以看出,原始研究中有四个
13、混杂因素在两组之间分布不同。、3。示例操作,匹配效果显示;第三步:用易软件读取匹配的数据表;第四步:在易易软件的“课题组描述”模块中设置相应的参数。示例操作和匹配效果显示,从生成的结果可以看出所有基线特征变量都匹配。倾向性评分匹配应用中的注意事项,03,倾向性评分匹配应用中的注意事项,与倾向性评分匹配相关的论文有其基本的报道要求,以2015年中国内科学发表的一篇论文为例说明:倾向性评分匹配应用中的注意事项,1。有必要描述匹配前后研究对象的基本特征(代表性)、温柔。混杂变量的匹配效应通常用标准化差异指数来衡量。比较匹配前后各组间混杂变量的标准差变化,匹配后标准差越接近0,匹配结果越令人满意。当标
14、准差小于10时,认为组间变量的平衡更好。连续性变量计算公式、分类变量计算公式、倾向分数匹配应用中的注意事项,2。为了观察匹配效果,有必要描述匹配前后各组混杂因素之间的差异。倾向分数匹配应用中的注意点。3.敏感性分析基于对现有数据的分析,鼓励使用多种统计分析方法。如果结果相互支持,证据的可信度就会增加。图2匹配前后两组患者年龄、性别及所有临床因素调整后的生存曲线。2A匹配前低白蛋白组的累积生存率明显低于正常白蛋白组(HR 3.048,95CI 1.649-5.634;低白蛋白组2b配对后的累积存活率明显低于正常白蛋白组(HR 2.246,95,1.2134.159: P=0010)。倾向得分匹配应用中的注意事项,倾向得分的优缺点:优点:倾向得分整合了多个协变量的信息,如相应的风险因素;在各种分析模型中,趋势得分可用作单一变量;趋势得分可用于回归、分层和匹配。缺点:这取决于协变量是否合适;需要相对较大的样本量;可能导致较低功效的限制(因为样本丢失):对于未知/未测量的混杂因素无效,对于时间相关的混杂变量无效。参考文献,周至锐、胡之德。智能统计m .长沙:中南大学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论