会员注册 | 登录 | 微信快捷登录 支付宝快捷登录 QQ登录 微博登录 | 帮助中心 人人文库renrendoc.com美如初恋!
站内搜索 百度文库

热门搜索: 直缝焊接机 矿井提升机 循环球式转向器图纸 机器人手爪发展史 管道机器人dwg 动平衡试验台设计

   首页 人人文库网 > 资源分类 > DOC文档下载

多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc

  • 资源星级:
  • 资源大小:28.00KB   全文页数:6页
  • 资源格式: DOC        下载权限:注册会员/VIP会员
您还没有登陆,请先登录。登陆后即可下载此文档。
  合作网站登录: 微信快捷登录 支付宝快捷登录   QQ登录   微博登录
友情提示
2:本站资源不支持迅雷下载,请使用浏览器直接下载(不支持QQ浏览器)
3:本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc

多重填补处理有缺失数据的22交叉设计资料的计算机模拟者李清华夏结来薛富波【关键词】缺失数据【Abstract】AIMTohandle22crossoverdatasetwithmissingdatabyusingMultipleImputationmethodprovidedbyRubinandtoavoidthedifficultiesinstatisticalanalysisowingtomissingdatainmedicalresearch.METHODSWeusedMItofillinmissingdataandanalyzedthemultiplyimputeddatasetswithstandardstatisticalprocedure,thencombinedthestatisticalinferenceswithMIANALYZEprocedure.RESULTSThemultipleimputationmethodimputedmissingvaluesofthecrossoverdesignandgeneratedvalidstatisticalinferences.CONCLUSIONMIandMIANALYZEproceduresprovideavalidstrategyforhandling22crossoverdatasetwithmissingdata.【Keywords】multipleimputationanalyzemissingdatacrossoverdesign【摘要】目的探讨利用Rubin提出的多重填补的方法处理有缺失数据的22交叉设计的资料,以避免医学科研中常常发生观测数据的缺失而造成统计分析的困难.方法用MI对缺失数据进行填补,用标准的统计程序对填补后的数据集分析,最后用MIANALYZE综合各个数据集的统计分析结果.结果多重填补的方法可用于交叉设计中缺失数据的填补并得出正确的统计推断.结论MI与MIANALYZE为处理存在缺失数据的22交叉设计的资料提供了有效的策略.【关键词】多重填补分析缺失数据交叉设计0引言交叉设计是临床试验中比较两种处理A,B效应的常用方法.其优点是减少个体差异对试验结果的影响,减小样本量.但长期以来如何处理交叉设计的缺失数据是一个棘手的问题,临床试验中最常用的处理缺失数据的LOCF(LastObservationCarriedForward)原则并不适合于交叉设计.通常,当受试者有一阶段的数据缺失时,则把受试者的信息全部剔除.这造成了资源的极大浪费,特别是在样本量较小的情况下.1976年,Rubin[1]提出了处理缺失数据的多重填补(multipleimputation,MI)的方法[2].多重填补用一系列可能的值来替换每一个缺失值,以反映被替换的缺失数据的不确定性.然后,用常规的方法对多次替换后产生的若干个数据集进行分析,最后用多重填补分析(multipleimputationanalyze,MIANALYZE)把来自于各个数据集的统计结果进行综合.这种方法反映出了由于数据缺失而导致的不确定性,能够产生更加有效的统计推断[3].在近二、三十年来,随着计算方法的不断成熟和相应统计软件的出现,这一方法被认为是解决缺失值问题的首选方法.根据多重填补与多重填补分析的方法及其统计推断原理,可以利用SAS程序处理有缺失数据的22交叉设计的资料.由于多重填补只处理包含两个变量以上的资料,在SAS程序中先按处理重复资料的方式排列22交叉设计的资料,用PROCMI进行填补,然后利用SAS程序对填补后的m个数据集进行转换,对转换后的数据集用GLM分析,最后用PROCMIANALYZE的odsoutput语句读取对m个数据集分析后得到的参数估计和协方差矩阵,得出综合的统计推断结果.多重填补与多重填补分析的整个过程可以用Fig1表示.1计算机模拟与分析为了验证多重填补方法处理有缺失数据的22交叉设计资料的有效性,建立线性模型如下[4]yijβ0β1x1ijβ2x2ijμ0jeij以yij表示第j个患者的第i次测量值,以x1ij表示A,B两种处理的哑变量,x2ij表示两个试验阶段的哑变量,它们均为0,1变量.j1,2,,100,表示患者,i1,2,表示重复测量值.β0为固定效应估计值.残差μ0j为随机变量,μ0jN0,σμ02,反映了患者间变异,残差eij即通常的残差项,eijN0,σe02.交叉试验主要关心A,B处理间的差别,所以在计算机模拟时,重点考虑β1的取值并且在模拟结果中只分析处理效应的检验效能.先根据建立的模型,利用MonteCarlo模拟创建一个完全数据集,然后用SAS程序把这个完全数据集随机去掉几个测量值,变成缺失数据集,再对有缺失值的数据集进行填补.用常规的统计方法分别对完全数据集、有缺失值的数据集以及多重填补后的数据集进行统计分析,并比较它们的检验效能.现用下面几个图表述主要研究结果Fig2是样本量为24,两总体均数之差为0.1,完全数据集、有不同缺失值的数据集以及对缺失数据集各填补5次后的检验效能的比较.从Fig2可以看出,完全数据集的检验效能最高,随着缺失值的增加,检验效能越来越低,对缺失数据集进行多重填补处理后,检验效能明显提高,其中,对缺失3个值的数据集填补5次后,检验效能基本上接近于完全数据集的检验效能.Fig3是样本量为24,两总体均数之差为0.1,完全数据集、有5个缺失值的数据集以及对缺失数据集填补3次、5次和10次后得到的检验效能的比较.从Fig3可以看出,对缺失数据集不做任何处理时,检验效能最低,随着对缺失数据集填补次数的增加,检验效能越来越高.对缺失数据集填补10次后的检验效能基本上接近完全数据集的检验效能.Fig4是两总体均数之差为0.1,样本量从10增加到60,完全数据集、缺失3个值、缺失5个值的数据集以及分别对它们填补5次后得到的检验效能的比较.从Fig4可以看出,当样本量很小时,完全数据集、缺失数据集以及对缺失数据集进行填补分析后得到的检验效能都非常低,随着样本量的增加,检验效能都显著上升,对缺失3个值的数据集填补5次后得到的检验效能基本上接近于完全数据集的检验效能.Fig5是样本量为24,两总体均数之差从0.01增加到0.2,完全数据集、缺失3个值、缺失5个值的数据集和分别对它们填补5次后的检验效能的比较.从Fig5可以看出,随着两总体均数相差的绝对值越来越大,完全数据集、缺失数据集以及对缺失数据集进行填补分析后得到的检验效能都明显上升.比较5种数据集的检验效能,随着缺失值的增加,检验效能明显下降,对缺失数据集进行多重填补处理后得到的检验效能优于不对缺失数据集做任何处理.Fig6是两总体均数之差为0.1,样本量从10增加到60,完全数据集、缺失5个值的数据集以及对缺失数据集分别填补3次、5次和10次后的检验效能.从Fig6可以看出,随着样本量的增加,5种数据集的检验效能都明显提高,对缺失数据集进行多重填补处理后,检验效能显著提高,随着填补次数的增加,检验效能基本上接近于完全数据集的检验效能.Fig7是样本量为24,两总体均数之差从0.01增加到0.2,完全数据集、缺失5个值的数据集以及对缺失数据集分别填补3次、5次和10次后得到的检验效能的比较.从Fig7可以看出,随着两总体均数之差增加,5个数据集的检验效能都明显提高,对缺失数据集进行多重填补处理后的检验效能高于不对缺失数据集做任何处理.并且,随着填补次数的增加,检验效能越来越接近于完全数据集得出的检验效能.2讨论Fig27显示了相同参数组合下以及不同参数组合下,完全数据集、缺失数据集以及对缺失数据集多重填补处理后得到的检验效能.通过对检验效能的比较,可以看出随着填补次数的增加检验效能基本上接近于完全数据集的检验效能.MI与MIANALYZE是SAS9STAT模块中处理包含多个变量的不完全数据集资料的过程.用这两个程序处理22交叉设计的资料,可以用SAS程序对数据集转换,满足MI要求的数据集包含多个变量这一条件,再做统计分析.用多重填补的方法处理有缺失数据的22交叉设计的资料,改进了以往剔除在任一阶段退出治疗的受试者的全部信息的方法,避免了资源的浪费,尤其在样本量较小的情况下.经过计算机几十万次的模拟结果可以验证它反映了由于数据的缺失而导致的不确定性,通过对填补后的多个数据集的综合统计推断,能够得出有效的统计分析结果.【参考文献】[1]RubinDB.MultipleimputationAprimer[J].StatMethodsMedRes,199981315.[2]曹阳,谢万军,张罗曼.多重填补的方法及其统计推断原理[J].中国医院统计,20031027781.CaoY,XieWJ,ZhangLM.Multipleimputationandassociatedstatisticalinferencialprinciple[J].ChinJHospStat,20031027781.[3]JamesMR.Inferenceforimputationestimators[J].Biometrika,2000871113124.[4]李晓松,张文彤,倪宗瓒.多水平模型在交叉设计资料分析中的应用[J].中国卫生统计,1999165273274.LiXS,ZhangWT,NiZC.Multilevelmodelsusingincrossoverdesigndata[J].ChinJHealthStat,1999165273274.

注意事项

本文(多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc)为本站会员(abaodong)主动上传,人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知人人文库网([email protected]),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。

copyright@ 2015-2017 人人文库网网站版权所有
苏ICP备12009002号-5