欢迎来到人人文库网! | 帮助中心 人人文库renrendoc.com美如初恋!
人人文库网
首页 人人文库网 > 资源分类 > DOC文档下载

多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc

  • 资源大小:28.00KB        全文页数:6页
  • 资源格式: DOC        下载权限:游客/注册会员/VIP会员    下载费用:5
游客快捷下载 游客一键下载
会员登录下载
下载资源需要5

邮箱/手机号:
您支付成功后,系统会自动为您创建此邮箱/手机号的账号,密码跟您输入的邮箱/手机号一致,以方便您下次登录下载和查看订单。注:支付完成后需要自己下载文件,并不会自动发送文件哦!

支付方式: 微信支付    支付宝   
验证码:   换一换

友情提示
2、本站资源不支持迅雷下载,请使用浏览器直接下载(不支持QQ浏览器)
3、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc

多重填补处理有缺失数据的22交叉设计资料的计算机模拟者李清华夏结来薛富波【关键词】缺失数据【ABSTRACT】AIMTOHANDLE22CROSSOVERDATASETWITHMISSINGDATABYUSINGMULTIPLEIMPUTATIONMETHODPROVIDEDBYRUBINANDTOAVOIDTHEDIFFICULTIESINSTATISTICALANALYSISOWINGTOMISSINGDATAINMEDICALRESEARCHMETHODSWEUSEDMITOFILLINMISSINGDATAANDANALYZEDTHEMULTIPLYIMPUTEDDATASETSWITHSTANDARDSTATISTICALPROCEDURE,THENCOMBINEDTHESTATISTICALINFERENCESWITHMIANALYZEPROCEDURERESULTSTHEMULTIPLEIMPUTATIONMETHODIMPUTEDMISSINGVALUESOFTHECROSSOVERDESIGNANDGENERATEDVALIDSTATISTICALINFERENCESCONCLUSIONMIANDMIANALYZEPROCEDURESPROVIDEAVALIDSTRATEGYFORHANDLING22CROSSOVERDATASETWITHMISSINGDATA【KEYWORDS】MULTIPLEIMPUTATIONANALYZE;MISSINGDATA;CROSSOVERDESIGN【摘要】目的探讨利用RUBIN提出的多重填补的方法处理有缺失数据的22交叉设计的资料,以避免医学科研中常常发生观测数据的缺失而造成统计分析的困难方法用MI对缺失数据进行填补,用标准的统计程序对填补后的数据集分析,最后用MIANALYZE综合各个数据集的统计分析结果结果多重填补的方法可用于交叉设计中缺失数据的填补并得出正确的统计推断结论MI与MIANALYZE为处理存在缺失数据的22交叉设计的资料提供了有效的策略【关键词】多重填补分析;缺失数据;交叉设计0引言交叉设计是临床试验中比较两种处理A,B效应的常用方法其优点是减少个体差异对试验结果的影响,减小样本量但长期以来如何处理交叉设计的缺失数据是一个棘手的问题,临床试验中最常用的处理缺失数据的LOCF(LASTOBSERVATIONCARRIEDFORWARD)原则并不适合于交叉设计通常,当受试者有一阶段的数据缺失时,则把受试者的信息全部剔除这造成了资源的极大浪费,特别是在样本量较小的情况下1976年,RUBIN[1]提出了处理缺失数据的多重填补(MULTIPLEIMPUTATION,MI)的方法[2]多重填补用一系列可能的值来替换每一个缺失值,以反映被替换的缺失数据的不确定性然后,用常规的方法对多次替换后产生的若干个数据集进行分析,最后用多重填补分析(MULTIPLEIMPUTATIONANALYZE,MIANALYZE)把来自于各个数据集的统计结果进行综合这种方法反映出了由于数据缺失而导致的不确定性,能够产生更加有效的统计推断[3]在近二、三十年来,随着计算方法的不断成熟和相应统计软件的出现,这一方法被认为是解决缺失值问题的首选方法根据多重填补与多重填补分析的方法及其统计推断原理,可以利用SAS程序处理有缺失数据的22交叉设计的资料由于多重填补只处理包含两个变量以上的资料,在SAS程序中先按处理重复资料的方式排列22交叉设计的资料,用PROCMI进行填补,然后利用SAS程序对填补后的M个数据集进行转换,对转换后的数据集用GLM分析,最后用PROCMIANALYZE的ODSOUTPUT语句读取对M个数据集分析后得到的参数估计和协方差矩阵,得出综合的统计推断结果多重填补与多重填补分析的整个过程可以用FIG1表示1计算机模拟与分析为了验证多重填补方法处理有缺失数据的22交叉设计资料的有效性,建立线性模型如下[4]YIJΒ0Β1X1IJΒ2X2IJΜ0JEIJ以YIJ表示第J个患者的第I次测量值,以X1IJ表示A,B两种处理的哑变量,X2IJ表示两个试验阶段的哑变量,它们均为0,1变量J1,2,,100,表示患者,I1,2,表示重复测量值Β0为固定效应估计值残差Μ0J为随机变量,Μ0JN0,ΣΜ02,反映了患者间变异,残差EIJ即通常的残差项,EIJN0,ΣE02交叉试验主要关心A,B处理间的差别,所以在计算机模拟时,重点考虑Β1的取值并且在模拟结果中只分析处理效应的检验效能先根据建立的模型,利用MONTECARLO模拟创建一个完全数据集,然后用SAS程序把这个完全数据集随机去掉几个测量值,变成缺失数据集,再对有缺失值的数据集进行填补用常规的统计方法分别对完全数据集、有缺失值的数据集以及多重填补后的数据集进行统计分析,并比较它们的检验效能现用下面几个图表述主要研究结果FIG2是样本量为24,两总体均数之差为01,完全数据集、有不同缺失值的数据集以及对缺失数据集各填补5次后的检验效能的比较从FIG2可以看出,完全数据集的检验效能最高,随着缺失值的增加,检验效能越来越低,对缺失数据集进行多重填补处理后,检验效能明显提高,其中,对缺失3个值的数据集填补5次后,检验效能基本上接近于完全数据集的检验效能FIG3是样本量为24,两总体均数之差为01,完全数据集、有5个缺失值的数据集以及对缺失数据集填补3次、5次和10次后得到的检验效能的比较从FIG3可以看出,对缺失数据集不做任何处理时,检验效能最低,随着对缺失数据集填补次数的增加,检验效能越来越高对缺失数据集填补10次后的检验效能基本上接近完全数据集的检验效能FIG4是两总体均数之差为01,样本量从10增加到60,完全数据集、缺失3个值、缺失5个值的数据集以及分别对它们填补5次后得到的检验效能的比较从FIG4可以看出,当样本量很小时,完全数据集、缺失数据集以及对缺失数据集进行填补分析后得到的检验效能都非常低,随着样本量的增加,检验效能都显著上升,对缺失3个值的数据集填补5次后得到的检验效能基本上接近于完全数据集的检验效能FIG5是样本量为24,两总体均数之差从001增加到02,完全数据集、缺失3个值、缺失5个值的数据集和分别对它们填补5次后的检验效能的比较从FIG5可以看出,随着两总体均数相差的绝对值越来越大,完全数据集、缺失数据集以及对缺失数据集进行填补分析后得到的检验效能都明显上升比较5种数据集的检验效能,随着缺失值的增加,检验效能明显下降,对缺失数据集进行多重填补处理后得到的检验效能优于不对缺失数据集做任何处理FIG6是两总体均数之差为01,样本量从10增加到60,完全数据集、缺失5个值的数据集以及对缺失数据集分别填补3次、5次和10次后的检验效能从FIG6可以看出,随着样本量的增加,5种数据集的检验效能都明显提高,对缺失数据集进行多重填补处理后,检验效能显著提高,随着填补次数的增加,检验效能基本上接近于完全数据集的检验效能FIG7是样本量为24,两总体均数之差从001增加到02,完全数据集、缺失5个值的数据集以及对缺失数据集分别填补3次、5次和10次后得到的检验效能的比较从FIG7可以看出,随着两总体均数之差增加,5个数据集的检验效能都明显提高,对缺失数据集进行多重填补处理后的检验效能高于不对缺失数据集做任何处理并且,随着填补次数的增加,检验效能越来越接近于完全数据集得出的检验效能2讨论FIG27显示了相同参数组合下以及不同参数组合下,完全数据集、缺失数据集以及对缺失数据集多重填补处理后得到的检验效能通过对检验效能的比较,可以看出随着填补次数的增加检验效能基本上接近于完全数据集的检验效能MI与MIANALYZE是SAS9STAT模块中处理包含多个变量的不完全数据集资料的过程用这两个程序处理22交叉设计的资料,可以用SAS程序对数据集转换,满足MI要求的数据集包含多个变量这一条件,再做统计分析用多重填补的方法处理有缺失数据的22交叉设计的资料,改进了以往剔除在任一阶段退出治疗的受试者的全部信息的方法,避免了资源的浪费,尤其在样本量较小的情况下经过计算机几十万次的模拟结果可以验证它反映了由于数据的缺失而导致的不确定性,通过对填补后的多个数据集的综合统计推断,能够得出有效的统计分析结果【参考文献】[1]RUBINDBMULTIPLEIMPUTATIONAPRIMER[J]STATMETHODSMEDRES,1999;81315[2]曹阳,谢万军,张罗曼多重填补的方法及其统计推断原理[J]中国医院统计,2003;1027781CAOY,XIEWJ,ZHANGLMMULTIPLEIMPUTATIONANDASSOCIATEDSTATISTICALINFERENCIALPRINCIPLE[J]CHINJHOSPSTAT,2003;1027781[3]JAMESMRINFERENCEFORIMPUTATIONESTIMATORS[J]BIOMETRIKA,2000;871113124[4]李晓松,张文彤,倪宗瓒多水平模型在交叉设计资料分析中的应用[J]中国卫生统计,1999;165273274LIXS,ZHANGWT,NIZCMULTILEVELMODELSUSINGINCROSSOVERDESIGNDATA[J]CHINJHEALTHSTAT,1999;165273274

注意事项

本文(多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟.doc)为本站会员(abaodong)主动上传,人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知人人文库网(发送邮件至[email protected]或直接QQ联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

网站客服QQ:2846424093    人人文库上传用户QQ群:460291265   

[email protected] 2016-2018  renrendoc.com 网站版权所有   南天在线技术支持

经营许可证编号:苏ICP备12009002号-5