




已阅读5页,还剩67页未读, 继续免费阅读
(计算机应用技术专业论文)基于多水平模型医疗保险决策支持系统的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
江苏大学硕士研究生毕业论文 摘要 医疗保险是社会保障体系的重要内容,近年来随着医疗保险事业的不断发 展,该领域内的风险因素越来越多,关系错综复杂。同时随着数据量的日益增多, 如何根据医疗保险的自身特点进行有效的风险控制,挖掘蕴藏的运行规律,为领 导层决策过程提供有力支撑,推动医疗保险事业发展与进步,已经成为该领域一 个迫切需要解决的课题。 本文的主要工作如下: 对医疗保险数据的系统结构进行了分析,根据数据呈自相关性和层次性特 征,提出一种面向医疗保险领域的多水平决策分析模型。 针对医疗保险领域的数据特征给出了多水平模型的定义,进行了模型的构 建,并以两水平模型为基础详细阐述了多水平模型的参数估计、假设检验以及扩 展的方法。 以医疗机构和病人为两个不同的水平单位,运用方差成分模型分析门诊费用 风险因素的影响大小,依据水平单位问的方差、协方差和水平内的相关性等参数 的值,得出分析结果比传统回归模型在单一层面上拟合的结果更为全面和准确。 通过这个应用实例,验证了两水平模型在医疗保险门诊费用风险因素预测中的可 行性。 以多水平模型为基础进行了基于多水平决策分析医疗保险决策支持系统的 设计。系统以数据仓库为基础,通过多维数据集市描述和组织层次结构化分析数 据;结合多水平分析的特点运用联机分析处理技术对分析数据进行组织和筛选; 通过多水平决策分析模型进行决策分析,为决策过程提供全面、准确和可靠的支 持信息。同时,根据业务决策过程的需要设计了数据查询与统计、报表生成等辅 助决策支持功能。 最后,在实际项目应用中实现了本文提出的原型系统,通过实践验证了本文 提出的模型和方法的正确性。 关键词:多水平模型,决策支持系统,数据仓库,多维数据模型,多维数据集市,医疗保险。 江苏大学硕士研究生毕业论文 a b s t r a c t m e d i c 缸ei s 龃i i n p o r t 锄tp a r to fs o c i a ls 洲t ys y s t e m h lr e c e n ty e a 璐,w i t l lt l l e m o d i c a 坞c o n t i n u 鼯t 0d e v e l o p ,l e r ca r em o r e 锄dm o 他r i s kf 如o r si nt l l ea r e ao f m e d i c a ,a n dt h er c l a t i o l l s h i p s 锄o n gm o s ef a c :t o 璐a 他v 盯yc o m p l i c a t e d a tn l c s 锄et i i i l e 嬲t l l e 讥c r e 髑i n gv o l 眦eo f d a t a i th 嬲b e c o m e 锄u 增吼tn e c dt 0 l v em e p b l 锄i nm ea 嗽t h a h o w t oc o n l r o le f j f & 嫩v e l yr i s k sb 豁e do nm cc l l 黝c t 丽s t i 璐o f m e d i c 黜,l i l i n et h c 唧材a t i 伽l a lm l 铭o fn l ea 嘲t 0 跚p p o r td e c i s i o l l 硼a l ( i n gp f o c c s so f n l el e a d 钟出p ,觚d 幻p 椭。童et h ed e v e l o l 跚e n ta n dp g 芦e 鼹o fm e d i c a 他 u n d e f t a l 【i n g s t h em a i nw o r ki s 嬲f o l l o w s : t t l es y s t e ms 缸u 曲j r eo fd a t ai s 吼a l y z e di i lm c d i c a 纸t h e 舢l t i l e v e ld e c i s i 雠 a n a l y s i sm o d e lf o rm e d i c a r ea r e ai sp i 0 p o s o d ,孤删i n gt on l ec o r r e l a t i o na n dl e 、,d s t m c t u r ea m o n gd a t a b 弱e do nd 如c h a r a c t c r i s t i c so fn l em e d i c a r e 硼强m ed 商n i t i o n 锄db u i l do f m u l t i l e v e lm o d e la r c 西v ;l l ,趾dn l em e t h o do fm u l t i l e v e lm o d e lp a r a m e t e re s t i m a t i o 玛 h y p o n l e s i st e s t i n ga i l dn l o d e le x t d i n ga r ce x p o l l i l d e d m e d i c a l i n s t i t l l t i o n sa n dp a t i 伽t sa r ec 0 n s i d a 耐t 0b et w od i 盱e r 饥“e v e l so f 啪l i 奴 u s i n gv 撕a 1 1 c ec 0 m p o n e i l tm o d e lt oa na _ i y z em er i s kf a c t 0 i si n n u 饥c ce ) 【锄l t 鳓 o u l p a t i e n tm e d i c a lf 曲s t h ea n a l y s i sr c 跚l t sa m o 坞咖p r e h a 塔i v ea n d 烈:c l 聆a t c n l a n 仃a d i t i o n a lr e 黜i o nm o d e lb 勰e do ns i n 酉el 酬,a c c o r d i n gt ot h ev 柚u eo f v 撕a i l c e ,c 0 v 撕a n c ea i l di m 豫l e v e l sc o r 豫l a t i o nb e t 、) l r 黜似r ol e v d so fu i l i t s 田1 内雌g 量i 锄印p l i c a t i o nc x 锄p l e ,t l l ef e 嬲i b i l 时o f l et 、o l e v e ll n o d e li nt l l er i s k 细加璐 p 删c 乞撕l i t ) ,o fo u t p a t i e n tm e d i c a ll i 苕咚i sc e f t m e d a c c 翻r d i n gt 0m l l l t i l e v e lm o d e i ,m e d i c a d i s i o ns u l y p c h r ts y s t e mb a s e d 硼 m u l t i l 吼 e ld i s i o n 砒i a l y s i sm o d e li sd 鹪i g 棚t h e 跗s t 锄i sb u i l to nd a 乏aw a 确。嘲曩 锄dt l l el e v e ls 砸比t u r eo fa l l a l y s i sd a t ai sd 锱嘶b c dn l r o u g hd a l am a r t ,锄dt l 艳觚a l y s i s d a t ai sp r o c e s s e db yo n l i i 蟛a n a i y t i c a lp r o 潞i n ga c r d m gt o l ec _ h 锄c t e r i s t i 岱o f m u l t i l e v c l 觚a l y s i s ,a n dt l l e 锄a 1 ) r 8 i sr e 跚l t so fm u l t i l e v e ld c c i s i 伽锄a l y s i s 跚p p 0 恤 伽忸p f 岫i v e 觚吼m 重伧觚d 托l i a :b l eh e l pf :1 0 r d e c i s i o 小m a l 【i n gp r o c 骼s m 翩删l c 瓠硎i n gt ot l l cn e e d so fb 璐i n e 鼹d o c i s i o i 卜m a l 【i n gp l 硼瑚s ,d a t as t a l i s t i 锵,q l l e 巧a n d 托p 0 i ng m a 蚰ga d 岱i 删t 0s u p p 0 i n 锄x i l i a 巧d e c i s i o n m a l 【i n 辱 江苏大学硕士研究生毕业论文 f i i l a l l y ap r o t o t y p es y s t 锄b 弱e do nt h ep r o p o s c dm o d e l 锄d m e 吐1 0 di s 印p l i 。d i nap i 枷c a l 刚e c 乞觚d 也es 沁d y 删t so f 也i sd i 鹦蒯o na v e r i 最e d 也f o u g h 也e 州e c t k e yw o r 由:m m t i l e v c lm o d d ,d e c i s i o n 鲫p p ( 哦 s y s t e m , d a l a w 解6 h o 璐e m r u l 虹碰m 铡l s i o n a ld 如m o d e l ,m u l t i i m s i o n a ld 鑫t am a 峨m e d i c a r e 江苏大学硕士研究生毕业论文 图目录 图2 - 1 决策支持系统体系结构1 0 图2 2 数据仓库的结构。1 1 图2 3 星型模型12 图2 4 雪花模型12 图2 - 5 螺旋式开发方法13 图2 6 独立数据集市和从属数据集市的区别。1 4 图3 - 1 多水平决策分析模型一2 6 图4 1 医疗保险决策支持系统总体架构2 8 图4 2 数据仓库双重粒度级别设计3 0 图4 3 数据仓库主要数据模型3 0 图4 - 4 医疗保险数据仓库主题域模型简图3 1 图4 - 5 参保人员业务模型3 1 图4 6 元模型实体关系图一3 4 图4 - 7e t l 工作流程3 4 图4 - 8 数据抽取模型3 5 图4 9 数据分区3 7 图4 1 0 多维数据集市的设计3 7 图禾 门诊医疗费用的星型模型。3 8 图牛1 2 门诊医疗费用的雪花模型3 8 图4 13 多水平分析水平单位表与维表的关联4 1 图4 14 向上钻取操作4 2 图4 15 向下钻取操作4 3 图4 16 切片操作4 3 图年17 切块操作4 4 图4 18 旋转操作4 4 江苏大学硕士研究生毕业论文 图5 1 原型系统技术方案4 7 图孓2 定义数据源4 9 图5 3 个人档案信息映射关系5 1 图5 4 数据部署j 5 1 图5 - 5 原型系统主界面5 2 图5 击风险分析与预测业务流程5 2 图5 7 多维数据展现5 3 图孓8 多水平决策分析结果5 5 图5 9 决策效果5 6 江苏大学硕士研究生论文 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文 的规定,同意学校保留并向国家有关部门或机构送交论文的 复印件和电子版,允许论文被查阅和借阅。本人授权江苏大 学可以将本学位论文的全部内容或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和 汇编本学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于 不保密囱。 学位论文作者签名秭磊指剥币躲 矽矿多年歹月叶日 p 锻如 沙缛磊彳日 江苏大学硕士研究生论文 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指 导下,独立进行研究工作所取得的成果。除文中已注明引用 的内容以外,本论文不包含任何其他个人或集体已经发表或 撰写过的作品成果。对本文的研究做出重要贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的 法律结果由本人承担。 学位论文作者签名:卢唐磊 日期:2 眇。艿年月钟日 江苏大学硕士研究生毕业论文 1 1 研究背景 第一章绪论 在管理工作中,每天都要面临各种决策问题,决策贯穿于管理活动的各个方 面,并成为管理工作的核心。美国著名学者西蒙有旬名言“管理就是决策”,可 见决策的重要性【1 】。随着我国社会经济和科学技术水平的不断发展,面临的决策 问题越来越复杂,对决策科学性的要求越来越高,决策的领域也越来越广,涉及 到社会生活的各个方面。 我国的医疗保险制度作为一个国家的安全保障制度,对于维护社会稳定、发 展社会经济、保障人民生活具有重要影响。自1 9 9 8 年开始改革,经过近十年的 改革历程,到目前为止,城镇职工基本医疗保险制度已在全国范围内基本建立。 然而,近年来,随着覆盖面的不断扩大和各项改革措施的逐步深入,医疗保险面 临着越来越多的挑战,潜在的风险不断增加。 由于医疗需求的普遍提高、医疗技术的进步以及医疗欺诈行为等因素的影 响,使得医疗费用快速的上涨,已严重威胁到医疗保险制度的稳定运行。某地 2 0 0 4 年住院率为8 8 ,与2 0 0 3 年相比增幅为6 0 ,人均住院医疗费用平均每 年递增1 4 5 。此外,医院的大处方、人情方、大型检查比例高、滥用高档药物 等原因,造成一些地区的住院医疗费用进入大病范围的参保人数占住院参保人数 的比例逐年上升,平均每年增幅5 0 以上 。据社保基金管理部门2 0 0 4 年第三 季度对全国2 5 个省份的统计显示,有2 0 个省份的1 4 2 个统筹地区出现医疗保 险统筹基金超支现象。 同时,由于目前的医疗保险管理机制尚未对不规范的医疗服务和不合理的费 用增长进行有效的监控和抑制,致使近年来各地都存在着大量的医疗机构套取医 疗保险基金的现象,本是广大参保人员救命钱的医疗保险基金,有时却成了少数 医疗机构的唐僧肉闭。另外,由于老龄化的趋势日益加剧,也越来越威胁着医疗 保险基金的正常运转,支付风险日益加剧【3 l 。 另一方面,医疗保险面临的诸多风险又是由于医疗保险所涉及到的各类问题 的复杂性造成的,正如著名的诺贝尔经济学奖获得者a 盯0 wk j 在其学术论文 “u n c e r i a i n t ya n dt h ew 电脑陀e c o n o m i c s0 fm e d i l 陷( 不确定性与l 墓疗 保健福利经济学) 中所写道【4 1 :“社会医疗保险理论尚不完备,常用的检验方法 国金永红:医保基金为何。亮红灯,健康报,2 0 0 5 年4 月2 8 日 l 江苏大学硕士研究生毕业论文 似乎并不能得出有用的结果,因为,潜在于长期公共决策过程中的因素可能太难 以捉摸而无法在经济估计中被定量化。 正是由于上述医疗保险的风险因素众多,且风险因素间的相互作用错综复 杂,目前对于医疗保险风险因素的研究已成为困扰各类医疗保险机构的技术难 题,也限制了医疗保险事业的快速和健康发展阎。为了在控制医疗保险风险的同 时,又能保障医疗保险服务的公平性和可及性,紧密结合医疗保险自身特点进行 适宜医疗保险技术的系统研究,既有重大的现实意义,也有一定的理论价值。 而运用决策分析的方法,通过对医疗保险的运行规律和风险因素进行科学的 分析,将为医疗保险管理部门和工作人员进行决策提供重要的支持信息。本文从 医疗保险的自身特点出发,尝试运用与自身特点相适应的统计学理论进行识别和 定量描述各种风险因素对医疗保险费用的影响及强度,并尝试将该理论应用于医 疗保险决策分析模型中,通过设计面向医疗保险的决策支持系统进行风险因素选 择、风险因素分析、医疗费用统计和基金预测等,以期为医疗保险管理机构进行 风险控制和决策分析提供科学依据,促进医疗保险管理机构提高风险管理和业务 决策的科学性。 1 2 研究现状 在国外,决策分析在医疗保险领域的应用j 下在不断深入。上世纪8 0 年代以 来,受到医疗费用急剧增长的困扰,有关社会医疗保险经济运行状况及其内在规 律的研究工作已成为该领域内的热点。h i t i r st 和p o s n e t lj 通过人均g d p 收入、 老年人口赡养系数、通货膨胀率和医疗费用在政府全部公共性支出中所占的比例 等因子建立了欧共体的医疗费用预测模型嘲。胁仟m 、t h e oh 、a d r a n g ib 和 r a 俪e ek 等众多的学者对医疗费用的宏观经济模型作了研究,并对不同国家的 医疗费用支出状况进行了对比和分析1 7 川。值得关注的是,他们采用动态 a i d s ( a i m o s tl d e a ld e m a n ds y s l e m ) 模型对消费者行为所产生的医疗费用进行 了估计,得出了许多有意义的结论。于此同时,在统计学最新研究成果的推动下, 国外研究人员已经把风险分析技术推向数理研究领域,使得风险管理成为建立在 雄厚数学基础之上的一门新型交叉学科唧。而一些较大的保险经营机构和政府监 管机关在积累了大量的经验数据的基础上,将系统论和系统工程方法也引入到风 险管理中,建立起了完整的风险决策分析的方法体系。 我国与发达国家相比,医疗保险制度开始还不久,有关的研究工作基本上集 中于制度的改革和体制的完善上,对其内在经济规律的定量研究与消费者行为特 征的研究尚比较缺乏。谭伯渊、周为、温小霓等人从保险精算学的角度对医疗保 险的损失分布与费用估计问题进行了研科协1 2 1 ,胡苏云和祝向军等对医疗保险中 2 江苏大学硕士研究生毕业论文 的信息不对称性和道德风险问题作了深入的探讨【1 3 - 佣,刘明霞对医疗保险中的 风险因素分析方法及其应用作了大量的研究【1 铆,吴静建立了描述我国城镇职工 医疗保险需求的l o g i s t i c 模型【1 叼,上述研究工作反映了我国医疗保险的经济学与 统计学特征,为从事医疗保险决策分析奠定了基础。 近年来,随着科学技术的不断发展,网络技术的普及,社会各个部门之间的 联系越来越来紧密,相互之间的影响也越来越复杂,以及各种信息量的增加,管 理决策不再停留在手工和人脑的基础上,单纯依靠决策者的洞察力、理智和经验, 己不能满足决策的需要。决策支持系统( d e c i s i o ns u p p o r ts y s t e m ,简称d s s ) 作为决策分析领域信息系统的重要方面已成为计算机管理应用的热点和主要发 展方向。 国外,在19 9 7 年o m n i 医疗组织就将决策支持系统应用于医疗领域,为保 险统计专家、市场营销、财务关系和医务管理者提供帮助,促进他们做出决策【17 l 。 比利时学者a i a i nm o s m a n s ,j e a n - c i a u d ep r a e t 和c h r s t o p h ed u m o n t 设计了 一个面向医疗保险基金预算的决策支持系统【1 8 j ,b o s e 和r a n j n 对在医疗保险管 理系统中应用决策支持进行了研究i 侧,以及s a n d e e ps o m a n 研究并设计了集合 s a s 统计分析在内的多功能医疗决策支持系统【2 0 j 。 国内,随着国家劳动和社会保障部在2 0 0 0 年3 月印发的城镇职工基本医疗 保险管理信息系统建设指导意见中明确指出:“要求包括对政策进行敏感性 分析、对基金支撑能力进行中长期预测的决策支持系统,国家明确了医疗保险 领域内决策支持系统的发展方向。戴伟辉对我国现行医疗保险基金运行模式下的 数量经济模型体系和消费者行为规律进行了研究,建立了医疗保险基金运行过程 的计算机仿真分析理论和方法,并对我国医疗保险试点的数据资料进行了分析和 研究1 2 。孙伟在基于数据仓库的医疗保险决策支持系统的研究中做出了大量的 工作阎。 然而,国内将决策分析方法应用于决策支持系统的研究在医疗保险领域却很 少涉及。相反,相关的研究在其他领域得到了很大的关注,张晓东研究了多元线 性回归模型在决策支持系统中的应用i 仃铆,牛振喜和蔡康英设计了基于回归算法 的决策支持系统【z 4 l 。 因此,从医疗保险的自身特点出发,研究将适宜医疗保险风险管理和业务决 策的决策分析方法作为决策分析模型应用于决策支持系统,进行数据分析、预测 和决策,不仅具有一定的理论研究价值,而且具有相当重大的现实意义。 3 江苏大学硕士研究生毕业论文 1 3 研究内容 目前,在医疗保险领域内,经过多年信息系统的建设,医疗保险数据呈现明 显的系统结构特征,该特征具体表现为数据具有自相关性和层次性【2 5 l 。自相关 性是指医疗保险业务数据和风险因素间存在着相互关联和相互影响:层次性是指 医疗保险业务数据( 如医疗费用) 聚集在不同的水平单位( 如病人和医疗机构就 是两个不同的水平单位) 上,且在不同水平单位上具有相似性。由于传统的决策 分析模型忽略数据在层次单位上的聚集性,同时,数据的系统结构特征又违背了 传统的决策分析中的独立性要求,这就使得在进行风险因素分析和业务数据分析 时出现偏差,影响风险控制的水平和业务决策的效力。 因此,本课题的主要研究内容就是面向医疗保险的自身特点,分析医疗保险 数据的系统结构特征,研究运用多水平模型来解决数据分析不够准确的问题,并 已多水平模型为基础研究建立多水平决策分析模型,进行医疗保险决策支持系统 的设计和实现。其主要技术路线以及研究内容包括以下几个方面: 1 多水平模型的研究和应用。 分析了医疗保险数据的系统结构特征,阐述了进行多水平分析的必要性,并 提出了基于该数据特征的决策分析方法一多水平模型。结合两水平模型的构建 过程研究了多水平模型的构建,同时,以两水平模型为基础探讨了多水平模型在 医疗保险门诊风险控制中的应用。最后,基于多水平模型设计了一种面向医疗保 险数据分析的多水平决策分析模型,为进行医疗保险决策支持系统的设计准备了 决策分析方法。 2 基于多水平模型医疗保险决策支持系统设计。 以多水平模型为基础,设计了面向医疗保险风险控制和业务决策过程的医疗 保险决策支持系统。该系统以数据仓库为基础,通过多维数据集市描述和组织决 策分析数据集,以多水平决策分析模型为决策分析方法而进行构建。其中关键的 技术是多维数据模型对医疗保险数据层次结构的描述和组织形式的设计,以及联 机分析处理技术对医疗保险数据的层次结构和多水平决策分析的水平单位结构 的数据处理方式的设计。 3 原型系统的实现。 结合本课题的研究内容,给出了一种医疗保险决策支持系统的主体设计和原 型系统的实现,通过实际工程项目的应用,验证了本课题研究内容的正确性。 4 江苏大学硕士研究生毕业论文 1 4 结构组织 根据研究的主要内容,本文结构上做如下安排: 第一章介绍本课题的研究背景和研究目的,概述了目前医疗保险风险控制 和管理决策方面存在的问题,研究了医疗保险风险控制方法和决策支持系统的研 究现状,分析了目前医疗保险决策支持系统研究中的不足,最终引出本文的研究 目的和方向,以及主要研究内容。 第二章简要介绍了多水平模型、决策支持系统、数据仓库和o l a p 等相关 知识。 第三章分析了医疗保险数据的系统结构特征,讨论进行多水平分析的必要 性;详细给出了多水平模型的基础模型两水平模型的构建过程,并扩展到多 水平模型的构建;分析了两水平模型在医疗保险门诊费用风险因素分析中的具体 应用;提出了一种基于多水平模型的多水平决策分析模型。 第四章基于医疗保险领域,给出了一个医疗保险决策支持系统的设计过程。 其中包括数据仓库的具体设计和两个关键技术:多维数据集市和多维处理的设 计。 第五章原型系统的实现。将本文的研究内容应用于具体的工程项目中,在 实践中检验研究内容的正确性。 第七章对全文进行总结,并指出下一步研究需要开展的工作。 5 江苏大学硕士研究生毕业论文 第二章系统理论 本章主要介绍一些和本课题研究相关的背景知识,其中主要包括:多水平模 型、决策支持系统、数据仓库、和联机分析处理等相关知识。 2 1 多水平模型 多水平模型( m u 蚓e v e im o d e l ) 又称层次结构模型( h i e 陷r c h l c a l 蝤n e a r m o d e i ) ,是将l i 型方差理论与多元统计分析相结合的新技术,是专门针对具有层 次结构特征的数据发展起来的一种非独立性数据统计分析方法阑。 2 1 1 多水平模型的发展 2 0 世纪8 0 年代中期,许多研究者开始寻求怎样将系统的方法引入到具有层 次结构特征数据( h i e r a r c h i c a n ys t c t u r e dd a t a ) 的统计建模与分析中。1 9 8 1 年 a i t k i n 等人对教学风格资料分析的早期工作,以及19 8 6 年a - l k i n 和l o n g f o r d 的 经典工作使之得到了发展。在随后的研究中,作为多水平模型研究和应用的先驱 之一的英国伦敦大学教育研究所的h a n ,e yg o l d s f e i n 教授做出了突出的贡献, 他于1 9 8 7 年出版的教育及社会学研究中的多水平模型是第一本全面介绍多 水平模型及其应用的专著。在1 9 9 8 年,h a n ,e yg o l d s t e i n 教授经过1 0 年的研 究和总结,出版了又一巨作多水平统计模型,该书直到目前仍然是同领域内 介绍多水平模型最全面、实例最丰富的权威性参考书。鉴于h a r v e yg o l d s t e i n 教授的突出成就,同年他被英国皇家统计学会授予了盖氏银质奖章。 近年来,随着计算技术的不断发展,多水平模型已经被广泛应用于教育学、 心理学、社会学、经济学、政治学、地理学、流行病学以及其它具有层次结构特 征的领域。在国外,关于多水平模型的研究已经成为了统计学领域内的热门话题。 a n d 怕wp j o n e s 和s t i gh j o 叼e n n 研究了多水平模型在交通意外事故信息 预测分析中的应用i z 丌,g 叼e sv a nl a n d e g h e m 、p a t r i c ko n g h e n a 和j a nv a n d a m m e 在相对固定的数据中应用多水平模型进行数据可分离性的研究阑, t h o m a se g e t 硷n 探讨了多水平模型在医疗保险个人费用支出方面的应用网。 在国内,2 0 世纪年代末,随着华西医科大学卫生统计学教研室及江苏南 通医学院医学统计学教研室的青年教师和博士研究生们将多水平统计模型一 书译成中文版,极大的推动了中国应用统计界在该领域内的研究和应用。李佳萌 研究了多水平模型在卫生领域内的应用i 则,施红英、沈毅和何凡在2 0 0 6 年进行 6 江苏大学硕士研究生毕业论文 了多水平模型在住院费用影响因素分析中的研究和应用1 3 1 1 。同时,结合数据的 结构特征,王艳梅、王洁贞和丁守銮等研究了多水平模型在纵向研究资料中的应 用【3 2 l 。 2 1 2 多水平模型的基础 多水平数据( m u n i i e v e ld a t a ) 或具有层次结构( h j e 陷代:h i is t r i j c t u 旧) 的数据 是多水平模型发展和应用的基础。此类数据的主要特征是反应变量的分布在个体 问不具备独立性,同时又存在地理距离内、某行政划区内或特定空间范围内等层 次单位上的聚集性( c i u s t e r n g ) ,即包括自相关性和层次结构的系统结构特征。 这类特征存在于许多类型的数据中,例如医疗保险领域内,参保人在参保单 位内成为一组;来自于同一医疗机构或同一地区的病人,其医疗费用特征较从一 般总体中随机抽取的个体趋向于更为相似。同时,数据的层次是指若干单位聚集 在不同的水平。例如,参保人是一个两水平结构中的水平1 单位,此时,水平2 单位就是参保单位;病人是医疗机构中的水平1 单位,此时,医疗机构就是水平 2 单位。 然而,这类数据特征的存在不是偶然的,也是不能忽视的。人是有个体差异 的,这种差异必然反映到各种社会活动中,而此时,后者常常是前者的直接结果。 例如,病人到不同的医疗机构的门诊就诊,就形成了不同的组群,即使这种组群 的建立是随机的,但它们也将趋向于变得不同,这种不同是组及其成员相互影响 的结果。忽略这种关系就冒着忽视组效应( g 帕u p 删) 的危险,因而许多用于研 究这种数据关系的传统统计分析技术是无效的。而多水平模型正是为了解决这种 数据关系的统计和分析问题而产生的。 2 1 3 多水平模型与传统分析模型的比较 传统分析模型的假定条件是一个单一的水平和单一的随机误差项,由于数据 系统结构的存在,传统分析模型随机误差项独立常方差的假定就不再成立。当忽 略实际数据的层次结构,用传统回归模型对此类数据进行分析时会存在一些问 题: 当高层次有聚集性时,随机误差项并非相互独立,且正态误差的来源多 个,离散型分布误差会出现方差过大或过小( o v e ro ru n d e rd i s p e 倦b n ) 现象; 无法把低层次和高层次的协变量同时引入模型,不利于探讨有关高层次 变量的影响因素; 7 江苏大学硕士研究生毕,业论文 如以每一层次各变量的均值作回归模型,即将数据分成小块分析,不仅 会损失大量的信息,而且不便在高层次上作出综合统计推断。 而多水平模型将高水平单位的参数估计作为随机变量,并估计随机效应,提 供了高水平单位所代表潜在总体特征的信息包括变异和协变异信息,同时将水平 一单位原来单一的随机误差分解到数据系统结构的相应水平上,这是多水平模型 不同于传统分析模型的主要特征。而且,由于考虑到数据聚集性的问题,可以在 数据存在聚集性时对影响因素进行正确的估计和假设检验,并对变异的影响因素 加以分析,即哪些因素导致数据间聚集性的出现,哪些因素又会导致个体问变异 的增大。 因此,多水平模型在分析具有层次结构特征的数据对具有明显的优势,具体 表现如下: ( 1 ) 它获得回归系数的有效估计; ( 2 ) 通过利用聚集信息,提供芷确的标准误、可信区间和假设检验。一般来 说,它比传统方法更“保守”,后者的标准误是通过简单地忽略聚集的 存在丽获得; ( 3 ) 引入在任何水平上测量到的协变量,它使得研究者能够探讨诸如组织实 践以及病人的其它特征,对于病人在医疗机构之间平均医疗费用的差异 到底起多大的作用;它也能够研究具有不同类型人群的医疗费用差异的 程度; ( 4 ) 人们对于每个医疗机构各项医疗费用的相对顺序常有很大的兴趣,而这 种排序对于多水平模型方法来说就很简单。 2 2 决策支持系统 决策支持系统( d s s ) 就是以信息技术为手段,应用管理科学、运筹学、控制 论和行为科学的理论和方法,针对某一类型的半结构化或非结构化的问题,通过 提供决策所需的数据、提供背景资料、协助明确决策目标和问题识别、修改和完 善决策分析模型、提供可能方案、并对各种方案进行分析和比较等方法,为管理 者做出正确决策提供辅助的信息系统f 3 3 j 。 2 2 1 决策支持系统的发展 决策支持系统( d s s ) ,是在管理信息系统( m a n a g e m e n tl 晌咖a t b n s y s t e m ,简称m i s ) 的基础上发展起来一种更高一级的先进信息管理系统。它起 源于2 0 世纪7 0 年代,s c o t tm o 哟n 在管理决策系统( 19 7 1 ) 一书中首次提 出d s s 。随后,p e t e rg w k e e n 等人编写了一套丛书,阐明d s s 的主要观 8 江苏大学硕士研究生毕业论文 点,初步构造出d s s 的基本框架。在1 9 7 8 至1 9 8 8 年间,d s s 得到迅速发 展,许多实用系统被开发出来,投入实际应用,产生了明显效益。 到了2 0 世纪8 0 年代末,随着i n t e m e t 技术的迅速发展,世界经济发生了 巨大的变化,在决策支持领域出现了一些先进的技术。这些技术包括: 数据仓库技术:采用全新的数据组织方式,对大量的原始数据进行各种 处理并转换成有用的信息,用户可以通过分析这些信息从而做出策略性 决策; 联机分析处理( o n 刈n ea n a l y t i c a ip 帕c e s s i n g ,简称o l a p ) 技术和数据 挖掘( d a t am i n i n g ,简称d m ) 技术:为d s s 提供了多方面的数据处理 和分析支特,极大地推动了d s s 的发展删; a g e n t 技术:使得d s s 更加的趋于主动智能化和群智能化,决策分析 的准确度进一步的提升网; w e b 技术:使得d s s 能够跨越地域的限制,最大的利用人力资源,节 约了组织开支,降低了决策的风险1 3 5 l 。 由于上述先进技术的推动,新一代的d s s 技术也应运而生。新一代的d s s 主要有以下几个发展方向: 一般决策支持系统:即以数据仓库为基础,通过运用o l a p 、d m 以及 定量分析等技术实现对组织决策活动的支持; 智能决策支持系统( i n t e m g e n td e c i s b ns u p p o r ts y s t e m ,简称i d s s ) : 是指在一般决策支持系统的基础上,着重研究把人工智能的推理技术和 d s s 的定量分析技术有机结合起来,从而形成一个数值分析和知识处理 的结合体; 。 群决策支持系统( g u pd e c i s i o ns u p p o r ts y s t e m ,简称g d s s ) :是指 在指在一般决策支持系统的基础上,运用现代群决策理论,来支持具有 共同目标的决策群体,求解半结构化和非结构化的、群体决策的、集成 化的、互动式的决策支持系统【3 7 1 ; 分布式决策支持系统( d i s t n b l j t e dd e c i s i o ns u p p o r ts y s t e m ,简称 d d s s ) :是指在一般决策支持系统的基础上进行的扩展,是分布决策、 分布系统、分布支持三位一体的决策支持系统; 综合决策支持系统( s y n t h e s 乜豫d e c l s b ns u p p o r ls y s i e m ,简称s d s s ) : 实际上是前面几个新一代d s s 的各种技术的综合集成p 鳓。 9 江苏大学硕士研究生毕业论文 2 2 2 决策支持系统的体系结构 决策支持系统的体系结构与其他别的信息系统一样都遵循系统的互操作性、 系统的兼容性和系统的可扩展性等设计要求。其一般体系结构如图2 1 所示,同 时,由于软、硬件平台的不同,体系结构主要分为以下几个模式: 基于组织中央系统:决策支持系统和组织内其他的信息系统并存于组织 内的中央计算机系统,充分利用系统资源。 基于客户机厂服务器计算模式:就是常说的c 擂模式,服务器作为后台 数据库,用户通过客户机应用程序访问决策支持系统。 基于w e b 模式:就是常说的b ,s 模式,服务器作为后台数据库,用户 通过w 曲测览器访问决策支持系统。 基于分离系统的共享数据模式:该模式主要由操作型数据库、数据仓库、 客户机组成。决策支持数据从操作型数据库中分离出来,进入数据仓库, 由数据仓库对数据进行组织和管理,并为决策支持系统服务,用户通过 客户机应用程序访问决策支持系统。 2 3 数据仓库 图2 - 1 决策支持系统体系结构 数据仓库( d a t aw a r e h o u s e ,简称d i w ) 是伴随着信息与决策支持系统的发展 过程产生的,是决策支持系统处理的基础。这是因为在数据仓库环境中有单一集 成的数据源( 数据仓库) ,并且对数据仓库中的粒度化的数据的访问非常容易, 以及数据仓库本身就是数据可重用性和一致性的基础,所以,相对于传统数据环 境,在数据仓库环境中进行决策分析的工作将要容易得多。 l o 江苏大学硕士研究生毕业论文 2 3 1 数据仓库的特征 数据仓库是一个面向主题的( s u b j e c to f e n t e d ) 、集成的( i n t e g 陷t e d ) 、相对 稳定的( n o n - v o i a t i i e ) 、反映历史变化( t i m ev a r i a n t ) 的用来支持管理人员决策的 数据集合【3 锄。它是在2 0 世纪8 0 年代由数据仓库之父w h 1 n m o n 在他的 b u - i d i n gt h ed a t aw a 呛h o u 一书中首先提出。 根据w h i n m o n 的定义,数据仓库有四个特征: ( 1 ) 面向主题。主题是在较高层次上将组织内的信息系统中的数据综合、归 类后进行分析利用的抽象。在逻辑意义上,它是对应组织中某一宏观分析领域所 涉及的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式,就 是在较高层次上对分析对象数据的一个完整、统一并一致的描述,能完整及统一 地刻画各个分析对象所涉及的有关组织内的各项数据,以及数据之间的关系。 ( 2 ) 集成数据。数据仓库的数据是从分散的各个操作型系统中经过抽取,转换 ,装载( e ) c t 阳c l ,t 阳n s f 0 佣a n dl o a d ,简称e t l ) 工具统一集成起来的。 ( 3 ) 数据是不可更新的。数据仓库中的数据是供分析之用的,所涉及的操作 主要是数据查询和分析,一般不作修改。 ( 4 ) 数据是随时间不断变化的。数据仓库的数据虽然是不可更新的,但并不 是说永远不变。数据仓库随时间变化不断地增加新的数据内容,而数据就可以以 更高的综合层次被不断综合,以适应趋势分析的要求。 2 3 2 数据仓库的结构 数据仓库中的数据如图2 2 所示存在着不同的细节:早期细节级( 一般是存 储在备用海量存储器上) 、当前细节级、轻度综合数据级( 数据集市) 以及高度 综合数据级。 图2 2 数据仓库的结构 江苏大学硕士研究生毕业论文 数据仓库的粒度问题是设计数据仓库最重要的方面。所谓粒度指的是数据仓 库中数据单元的细节程度或综合程度的级别。细节程度越高,粒度级别就越低; 相反,细节程度越低,粒度级别就越高。相应的,粒度级别越低,查询范围越广 泛;反之,粒度级别越高,查询范围越少。 2 3 3 数据仓库的数据模型 数据仓库的数据模型主要有两种,即由c h r sd a t e 和t e dc o d d 开发的关 系模型和由r a l p hk - m b a 博士开发的多维模型。 关系模型也就是基于实体- 关系图( e n t i 妒r e l a t j o n s h i pd i a g 陀m ,简称e r d ) 对数据进行组织,是目前应用最广泛的数据库设计模型。 多维模型是由事实表和维表组成,其中事实表是包括大量数据值的一种结 构,用来存储事实的度量值和各个维的码值;维表是用于描述事实表的某个重要 方面,包括维的层次及成员类别等。多维模型的主要描述方式是星型模型( s t a r s c h e m a ) 和雪花模型( s n o 、 用a k es c h e m a ) 。其中星型模型是基础,雪花模型是 星型模型的扩展。在星型模型中,事实表为中心,维表围绕着事实表,如图2 3 所示。雪花模型是对星型模型维表的进一步层次化,将某些维表扩展成事实表, 新的事实表又包含新的维表删,如图2 4 所示。 图2 3 星型模型 、 堆寰 7 图2 _ 4 雪花模型 1 2 , 、- 丧维 江苏大学硕士研究生毕业论文 关系模型和多维模型作为数据仓库设计的基础,两者之间存在着很多的不同 刚】,具体表现在以下几个方面: 形成的过程不同:关系模型通过纯数据模型和其他模型设计,而多维模 型通过处理请求塑造。 灵活性和性能不同:关系模型具有高灵活性,但是对用户来说在性能方 面却不是理想的;而多维模型在满足用户需求方面是非常高效的,但是 灵活性不好。 数据访问方式的不同:关系模型由于本身的高灵活性,限制了直接数据 访问的执行效率;而多维模型在直接访问数据方面却是快速而高效的。 因此,关系模型适合于大范围数据( 如一个企业级模型) ,而多维模型适合 于小范围数据( 如一个部门或甚至一个子部门) 。 2 3 4 数据仓库的开发方法 传统开发生命周期( s 珊w a r ed e v e l o p m e n tl 舱c y c i e ,简称s d l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中语文选择性必修教学设计及教学反思
- 2025-2030动力电池负极材料技术迭代与产能规划报告
- 基础会计实务操作流程与实战技巧
- 技术经理管理能力提升方案
- 2025-2030动力电池梯次利用在储能电站中的经济效益测算研究
- 初中物理教研组集体备课工作总结
- 2025-2030动力电池梯次利用储能系统安全标准与退役电池评估体系报告
- 2025-2030动力电池回收网点建设标准与环保处理技术规范
- 2025-2030动力电池回收利用网络布局与梯次利用技术突破点分析
- 钢结构用镀锌钢管规格与计算
- (零模)南昌市2025年高三年级九月测试语文试卷(含标准答案)
- 燃料电池催化剂研究报告
- 湖北省华大新高考联盟2026届高三上学期9月教学质量测评语文试题(含答案)
- 人工智能应用技术-教学大纲
- 虚拟货币挖矿管理办法
- 2025重庆市涪陵区马武镇人民政府选聘本土人才1人考试参考试题及答案解析
- 2025-2026学年苏少版(2024)小学美术一年级上册教学计划及进度表
- DB3302T1135-2022新建小区室内公共体育设施配置和管理规范
- 2025年装载机行业当前竞争格局与未来发展趋势分析报告
- 2025年飞行服务站无人机培训行业现状分析报告
- 如何上好语文课的讲座
评论
0/150
提交评论