一个医保基金风险防控平台中的数据挖掘技术.doc_第1页
一个医保基金风险防控平台中的数据挖掘技术.doc_第2页
一个医保基金风险防控平台中的数据挖掘技术.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一个医保基金风险防控平台中的数据挖掘技术摘要 针对医保基金管理的关键环节和基金风险的主要因素,从医保业务出发,开发了相应的数据挖掘算法,构建医保基金风险防控的模型库和方法库,实现政策风险、运营风险、供需矛盾风险和违规欺诈风险防控。通过实施验证、不断修正并应用、影响于医保业务系统,从而全面建立与医保改革和管理相适应的医保基金风险防控机制,与日常运行的医保业务系统共同构成了基金运营、监控的良性循环,为医保基金风险防控系统的建设、实施奠定基础并提供借鉴意义。关键词 数据挖掘医保风险防控The Application and Realization on a Medical-Insurance-Fund Risk-Prevention Data Mining TechniquesAbstract Aiming at the key steps of medical-insurance-fund management and critical factors of risk, this paper constructs a new medical-insurance-fund risk prevention platform. In this platform, we realized the collection and integration of multiple data sources in medical-insurance area, built a data warehouse for fund risk prevention, and developed data mining algorithms. The practical application shows that the platform is effective and efficient for risk prevention. Keywords Data Mining Medical-Insurance Risk-Prevention一个医保基金风险防控平台中的数据挖掘技术30 引言社会医疗保险制度作为社会保障体系的有机组成部分之一,对保障公民基本医疗、促进社会公平和维护社会稳定有着重要意义。随着国民收入的增加和医疗保险覆盖面的扩大,医保基金规模不断增大。医疗保险由于其自身特点,逐渐面临着一系列突出问题,如我国人口老龄化、疾病谱改变、新医疗技术的采用和医疗需求的增长等原因造成医疗费用增长迅速,对医保基金形成了较大压力。然而,医保特有的复杂的委托代理关系和严重的信息不对称,使医疗费用控制难度加大,医保基金被浪费、骗取、挪用等现象不同程度地存在,损害了医保基金的使用效果和效率。因此,为维护参保人的基本医疗保险权益,减少浪费,促进医保制度可持续发展,加强医保基金支付控制、增强医保基金风险监控已成为非常紧迫的现实问题。收稿日期: 2010-03-31。上海市科委科研计划基金项目(08511500203),上海市重点学科建设项目(B114)。高臻耀,主任,主要研究领域:数据挖掘,数据仓库医保基金管理是一项复杂的工程,涉及面广、数据量大,除管理参保人,还涉及各级医疗机构;要负责个人账户的建立和使用,还要负责基本医疗保险费的征收、管理和支付,并对基金的使用进行监督1。如何从复杂的海量数据中得到有价值的信息,从而指导决策是需要解决的关键问题。本文针对医保基金管理的主要环节,研究医保基金风险的主要影响因素,设计实现了多种数据挖掘算法,建立了相应的数据挖掘方法库/模型库,使医保基金风险防控从过去的事后稽查变为“事前预测、事中监控、事后稽查”全过程的控制,对有效防范医保基金风险起到支撑作用,为有效控制基金风险提供指导,对医保基金的运营和监控具有重要作用。 1 相关工作控制医疗保险基金风险是世界各国一直努力解决的难题。发达国家的医疗保险基金风险控制工作起步较早,例如德国在80年代建立了医保预测预警系统,由于建立时间长,覆盖范围广,征缴严格,基金收入环节存在的问题相对较少,预测预警的重点主要集中在支出上2。但最为关键的是借助计算机应用系统开展实时监测和预警分析。我国社会医保工作开展较晚,从某种意义上讲,对医保基金的管理缺乏一定的理论指导。受认识、技术以及数据等方面限制,国内在这方面的研究不多,更没有成熟的软件开发和应用3。国内目前已有的研究,主要从医保基金收支监测、简单指标预警等方面开展基金风险管理工作,在医保基金预测预警建模方面,仍处于起步阶段,一些相关研究缺乏系统性和深度。目前有些地区也开发了一些控制或监控费用的系统,虽然部分实现了费用监控功能,但仍存在一些不足:1)由于系统建设的目的并不主要是费用监控,监控的效果非常有限。2)采用的实现技术并不适合医保费用监控业务。从长远看,医保基金管理仍面临着巨大压力,潜在因素主要有:1)医疗服务需求随经济增长水平而大幅度提升,当经济增长趋缓时,医疗需求增长的刚性仍然不变;2)新技术运用对医疗卫生费用增长的作用凸显;3)城市人口老龄化趋势越趋明显;4)医疗价格的增长和医院的利益驱动,造成医疗费用持续增长。针对医保基金风险防控问题,上海已积累约10年的基础业务数据;医药机构对医保中心系统账务的可信性和数据采集代码规范性的认可程度较高,形成上海地区医疗卫生行业信息处理事实上的部分规范和标准;已建立了一套基础性的统计分析报表体系、数据随机查询功能,审核监督已依托计算机筛选数据展开运作。因此,我们已经具有了丰富的数据基础和业务领域知识,为有效利用数据资源,减缓医保基金风险管理的压力,我们采用数据挖掘技术,针对风险防控需求和数据特点设计并实现了医保基金风险防控平台中的数据挖掘方法库/模型库。实际应用表明,其对防控医保基金风险取得了良好效果。2 医保基金风险防控平台医保基金面临的风险因素多种多样,主要包括政策因素、运营因素、供需矛盾因素、违规欺诈因素和运行支撑因素等。针对以上风险因素,医保基金风险防控平台主要涉及政策风险、运营风险、供需矛盾风险、违规欺诈风险防控四个方面。医保基金风险防控平台针对监控对象设置预警、报警规则,建立预警、报警系统,使业务人员和决策层及时了解基金收支、基金运营中潜在的风险,提高监控效率。其主要功能有:1)在数据仓库逻辑模型上,设计业务数据到“业务大集中库”再到数据仓库的ETL过程的调整及优化,在实施上探索在部分数据集市上做到实时或准实时(T+0,或仅相差几小时)动态数据仓库。在线分析业务从高层次的汇总表到具体明细数据的连结。2)加强基金运营风险的管理,在收入分析方面,在考虑人口变动(不同险种、不同人群筹资比例,含人口老龄化预测)、收入预测(宏观经济),退休政策变动(退休年龄,在职退休比)等影响因素的的基础上,对筹资进行分析及预测;在支出分析方面,根据以收定支的原则,对医保基金支付趋势及预测、逐月的医保支付、缓付的计算、医保基金支付预警、基金支付方式分析、测算、各种支付方式的分析。3)针对部分医疗机构、医师、参保人员由于利益驱动造成医保医药费用浪费等违规欺诈行为,监控其在门急诊、住院挂号、用药、检查、治疗、收费等可能存在漏洞指标数据,建立各种违规筛选模型,为审核监督提供重点监督管理对象,提高审核监督力度和效率。同时,建立参保者个人、定点医药机构、定点医生相关信息档案,并进行综合评分,为充分了解不同参保人员的情况,选择定点医药机构及其医生提供科学依据。4)为医保政策调控提供模拟测算平台,主要针对现有政策调整(微调):帐户注入定额、三条线调整、支付比例调整等的测算。使决策层充分了解政策调控所涉及的人群、费用、医疗等多方面的信息,为政策调控提供可靠依据。5)客户管理及信息评估。对参保个人考虑医保待遇、缴费情况、健康状况、违规行为评估等指标;对定点医药机构考虑服务范围、服务量、服务能力、服务质量、违规评估等指标;对定点医生考虑服务能力、服务质量、违规情况评估等指标。3 医保基金风险防控数据挖掘模型与算法针对医保基金风险防控管理的需求,结合医保行业的领域知识、经验以及特殊的数据分析需求,我们设计和实现了具有针对性的医保基金风险防控数据挖掘算法,构建针对医保基金风险防控的数据挖掘方法库/模型库,实现对医保数据的挖掘分析,有效支持医保基金风险防控平台的预测和处理,有利于医保基金风险防控平台对日常业务数据进行更有效的实时监控。 医保结算费用预测模型采用时间序列预测方法-ARIMA(AutoRegression Integrated Moving Average,自动回归整合移动平均)模型,建立医保结算费用预测模型,实现对医保结算总费用的预测,并能详细到各区县,各级别医院医保结算费用的预测,为医保基金监管提供方向。医保结算费用预测数据模型导入的数据包括各医院每月结算费用、医保支付费用和总控内医保支付费用。在预测过程中实施平稳性检测、差分处理、白噪声检测、拟合预测模型、序列预测几个关键技术,实现对未来三期的时间序列预测。具体实施分以下步骤:i.从数据仓库应用数据模型中获取医保结算费用的时间序列数据;ii.对医保结算费用时间序列做平稳性检测,若无法通过平稳性检测,则对结算费用序列实施差分处理,即转步骤iii),否则进行白躁声检测,即转步骤iv);iii.对结算费用序列作差分处理直到序列平稳化;iv.对差分后序列进行白噪声检测。通过白噪声检测则生成模型,否则使用模型建摸,即转步骤v);v.使用ARMA模型建模非白噪声序列;vi.生成ARIMA拟合预测模型;vii.根据最终拟合模型对医保结算费用进行预测。医保风险评估(参保人类别管理)模型设计聚类算法实现对参保人的经济情况、健康状况和信用情况聚类,为参保人的分类提供依据。并且,随着参保人数据的更新,需要多次应用该模型进行聚类以调整类别信息。我们选择的聚类方法有K-均值(Means)和K-中心点(Centroid)方法。这些方法均可指定生成簇个数的区间。最终通过实验验证,选择了适合医保数据的实际情况,并且聚类结果较好的Ward聚类算法。根据医保数据实验结果表明,由于数据量大,数据点十分密集,平均值点和中心点差别非常小,Ward方法是改进的k中心点方法,将医保参保人聚合成多个簇,其中每个簇中参保人具有较大的相似特征,而分属不同簇的参保人则存在明显的特征差异,成簇效果佳,用户容易解释。医保信用评估模型在对参保人的经济情况、健康状况和信用情况聚类完成后,利用聚类结果作为训练集,构建参保人分类模型,生成分类规则,实现对参保人所属类别的确定,即指定该参保人所属的健康、经济类别以及按信用情况划分的信用等级等等。我们采用决策树算法,算法采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,最后在决策树的叶结点得到结论。因此从根到叶结点的一条路径就对应着一条合取规则,而整棵决策树就对应着一组析取表达式规则。考虑到随着时间的变化,参保人数据的更新,分类规则不会一成不变,即聚类结果的不同造成训练集的变化,需要重新建立参保人分类模型以产生新的分类规则,达到对参保人新的经济、健康和信用等级进行有效分类。就医聚集行为挖掘医保就医聚集行为通常表现为在医院就医时,多张医保卡过于频繁地同时同地消费。这种就医聚集现象可能是由于某些特殊人群如某些慢性病人需要频繁就医造成的自然聚集现象,也有可能存在违规的倾向:某人持多张医保卡同时消费。找出这些具有就医聚集行为的人群一方面能够对特殊疾病人群提供针对性的管理和服务,另一方面能有效提高对违规人群的监督力度。我们可以将就医聚集行为的表现形式简化为某种一致性:在就医时多张医保卡在同一时间段内(我们细化为一天)在同一家医院就医。这些医保卡若一致性消费过于频繁则可以认为是一种异常现象,将被列为重点监管对象。我们设计一个一致行为挖掘算法实现此类人群。算法采用模式增长策略,通过逐步增加子空间的长度,直到找出所有最长频繁模式下出现的对象集。但是需要指出的是我们的目的并非旨于找到最长模式,而是找到模式中包含的异常对象集合,这与通常的频繁模式挖掘4的目标不同,因此,算法执行过程中仅保存了一维模式的物理存储,在此后的模式增长过程中不保持中间模式对象的物理存储,而是通过对数据库添加索引结构,并在模式逐步增长过程中保存生成信息来实现,从而避免重复全局扫描数据库。 异常违规模型设计异常数据挖掘算法,对医保欺诈等异常违规行为进行检测,对有严重违规或不诚信行为的参保人实施重点跟踪和监控,实现预警。利用已经过监督所处理后返回的已知参保人是否违规的数据样本,建立分类模型,对那些未知是否违规的参保人数据,进行违规筛选。该模型中涉及其他挖掘算法提供的结果信息:参保人的健康、经济、信用以及是否属于可疑参保群组等,即以这些属性作为建立分类模型的特征。因此,随着参保人数据的更新,该违规筛选模型也会随之重建和更新。数据仓库应用模型中载入的数据有两种:一类为已经经过监督所处理后返回的数据,这类数据已知是否阳性或阴性。另一类则为未知是否违规的数据,待违规筛选处理。对已知类别的数据,将进入模型训练过程,构造出适用医保数据特征的分类模型,即决策树;对未知类别数据,需要先进行筛选后再进一步用分类模型判别类别,将判定为违规的参保人信息优先送往监督所。上述各个模块涉及的关键技术中的一个共同的难点是,考虑到随着时间的变化,参保人数据的更新,要在一定的周期中,在所建立的数据挖掘方法库中多次选择相应的挖掘算法重新构建挖掘模型,得到新的规则。例如:前已述及,在参保人分类管理中,分类规则不会一成不变,即聚类结果的不同造成训练集的变化,需要重新建立参保人分类模型以产生新的分类规则,达到对参保人新的经济、健康和信用等级进行有效分类。另一方面,医保数据量非常大,因此算法的设计我们兼顾了结果的有效性和效率两个方面的利益。4 应用由于医疗保险数据库中的数据量非常巨大、数据结构的特殊性,尤其是数据维数较高时,数据可视化变得尤为重要,它有助于增加分析人员对理解数据、观察模型的效果。医保基金风险防控平台采用Oracle的Hyperion前端展现工具,基于Hyperion的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论