




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医保欺诈行为的主动发现摘 要本文主要讨论了主流的异常检测方法,着重研究并分析了基于统计分布的异常检测在医疗保险数据挖掘中的应用。通过数据挖掘技术模型和聚类分析模型对医疗保险数据特点进行研究分析,找出了医保欺诈行为的可能记录,同时给出了医疗保险数据的预处理方法。针对每类医疗保险报销行为,应用基于统计学的离群点检测,为其假设一个分布,然后利用统计学的相关方法确定其参数,得到其精确的分布频数。以得到的每类医疗保险行为分布频数为基础,利用区间选取算法进一步得到其正常阈值区间。利用统计学和MATLAB软件针对医疗保险欺诈行为构建了数据挖掘模型和聚类分析模型,模型考虑了数据间存在的相互联系,对医疗保险行为的欺诈做出了统计和分析。通过对附表中的数据按照核算进行分类,对所得的三类核算结果进行筛选,通过聚类分析的标准化进行处理,得到聚类分析模型的谱系图,再按照标准化处理的结果进行排序,得到欺诈记录对应的病人ID号的顺序。对用药事件,由于其功效并非药物功效的简单叠加,而是功效和功效、药物和药物之间相互形成的复杂结果的特点,给出了效-效相似关系挖掘,以得到用药事件的更精确的检验模型。本文最后通过对可能的欺诈记录随机选取进行检验,结果得出:通过数据挖掘所得的可能医保欺诈记录,均可用单张处方药费高、一次性拿药数量过多、相同药物数量大和单价过高来解释。关键词:异常检验;统计学;概率分布;聚类分析;数据挖掘技术一 问题重述随着我国医疗卫生体制改革的深入,医疗保险参保人数正在迅速增加,同时欺诈违规行为也在日益增多,形式和手段也不断的在翻新,对医疗保险基金的安全造成极大的影响,社会危害极大。医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。骗参保人进行医保欺诈时通常使用的手段有:1、拿着别人的医保卡配药;2、在不同的医院和医生处重复配药。下面这些都可能是医保欺诈行为:单张处方药费特别高、一张卡在一定时间内反复多次拿药、过度医疗(检查、用药)、分解住院、降低入院标准、分解收费、串换药品名和诊疗项目、冒用与出借医保卡等。二 问题分析本文的工作是将数据挖掘的相关技术应用到临床行为管理中,设计一个构建正常临床行为进行异常检测的模型,这不仅能对合理的临床路径的制定提供决策依据,并且对发现违规行为以及医疗欺诈有着非凡的意义。数据挖掘,是从存放在数据库、数据仓库或者其他信息库中的大量数据中获取有效、新颖、潜在有用、最终可理解的非平凡过程。所存在的大量数据中有许多可以广泛应用,并且迫切需要将这些数据转化成有用的信息和知识。而数据挖掘技术善于从缺乏先验信息的海量数据中发现隐含的、有意义的知识,预测未来趋势和行为,及甄别不符合隐含规则的异常行为。正是这种优势使得数据挖掘技术在医学数据的异常检验研究中被广泛地采用并取得了许多有价值的成果:对于可能存在医疗欺诈行为控制方面,应用主要包括:决策树算法、回归模型、神经网络模型等。对可能存在医疗欺诈行为的因素进行挖掘,根据就诊情况可能存在反映欺诈行为,预防欺诈,促进医疗保险制度的标准化和规范化。本文主要讨论了异常检验方法,着重研究并分析了基于统计分布的异常检验在医学临床数据挖掘中的应用。分析了医疗领域临床数据的特点以及适用于基于统计分布的异常数据特点,以此为基础,本文对临床数据进行相应的预处理,由于适用于统计分布处理的数据主要针对单个属性,也就是适用于低维数据,所以本文对数据的预处理除了常用的数据集成、数据清理和数据规约等以外,还对其尽心分类,并统计频率。建立了模型构架,实现了相关算法,并对模型的效果进行了检验,验证了模型的正确性和可靠性。三 模型假设(1) 假设附件中的相关数据是在没有任何大型灾难或疾病时期收集的;(2) 假设其他未考虑的次要影响因素对模型建立不产生重要影响;(3) 假设各个附件中的相关数据都真实可靠(除题中注明之外); (4) 假设所有的相关数据具有独立性,各个指标之间无相互影响 ;(5) 假设附表中的相关数据可以正确反映目前我国医疗保险现状。四 符号说明本文模型的建立及求解过程中所涉及的数学符号及其说明如下表所示:符号说明样本平均值样本标准偏差样本标准差标准化变量样本相似系数五 模型的建立和求解5.1 数据挖掘技术1) 数据挖掘技术的介绍数据挖掘:是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识的过程。数据挖掘一般存放在数据库、数据仓库或其他信息库中的大量数据中,运用统计学、人工智能、机器学习、数据库技术等方法发现数据的模型和结构,发现有价值的关系或知识。数据挖掘不是用于验证某个假定的模型的正确性,而是在数据库中自己寻找模型。以下是数据挖掘(即知识发现)的两个较为经典的定义:(1) 知识发现是指从数据中深刻的抽取隐含的、以往未知的及潜在有用信息的过程。(2) 知识发现是一个从大量收集的数据中确定有效的、异常的、潜在的有用的而且最终得出可坪解的模式的复杂过程。数据挖掘是知识发现中的一个过程。以下是一般进行数据挖掘都需要完成的环节或步骤,医学数据挖掘也不例外:明确分析目的在这个阶段确定的分析目标决定了随后的数据挖掘方法的选择和组织,因此必须明确。这是建立正确分析的先决条件和基础。但是,要明确所需解决的问题并不总是很容易,特别是将潜在的问题转化为需要分析的具体目标。首先要确定数据来源(一般都满足来自于内部资源),并加以适当的组织。研究者可以从本身所在机构的一个或几个数据源(数据库)中抽取和研究目的相关的数据创建挖掘对象,作为数据挖掘的基本输入。通常需要将这些数据以列表的形式组织和表示,称为数据矩阵,有时也称其为平面文件。然后,需要对数据矩阵进行初步的数据清洗,即对数据进行质量控制(如删除不适合分析的数据、补偿丢失数据、清除数据噪声等)。在某些情况下(如数据库非常大),也可以对原数据矩阵中的部分数据进行抽样分析。因为在这种情况下,对原数据全体进行完全分析得到的信息质量并不总是比进行抽样分析得到的更好。探索性分析数据对数据进行探索性分析的目的是使分析者预测什么数据挖掘方法最适合下阶段的数据分析。探索性数据分析的方法近似于数据挖掘,但两者的主要区别在于目的不同。探索性分析数据的目的在于描述数据的结构和关系,而数据挖掘的目的是在描述数据结构和关系的基础上直接生成规则。例如,尽管要观察的数据往往是多变量的,且这些变量之间也是相互作用的,但在探索性分析阶段,可以先从一元(单变量)分析开始,每次静态的考虑单一变量的作用,然后再作二元分析等。实施数据挖掘方法,并以此分析数据数据挖掘的方法和过程取决和服从于研究的目的。在根据研究目的对原始数据作探索性分析的基础上,初步决定数据挖掘的方法,每种方法有不同的技术可供选择。例如,若要描述数据的某些特性(如将原始数据划分成若干事先未知的类别,或表达数据间事先未知的关系等),就可采用描述性方法(如聚类分析、关联规则等);若要描述一个或多个和其他所有数据有关系的数据,就可采用预测性方法(如回归分析、神经网络等)。确定方法及具体技术后,开始实际分析数据,并得出分析结果。评价和比较各种方法的性能,确定最终的结果虽然在上一步骤中以数据挖掘方法分析数据后已得出分析结果,但还需要对不同挖掘方法得到的结果进行比较。这一环节既能对数据挖掘方法的性能作出定量评价,也为最终选择确定最佳数据挖掘方法及其分析结论提供了依据。如果通过性能评价表明已采用方法得出的结论均不符合研究要求和目标,则应另行选择数据挖掘方法(甚至重新进行探索性数据分析),重复上一步骤。解释数据挖掘结果及其在本专业领域中的应用数据挖掘的目的不仅仅是分析数据,更重要的是将分析得到的结论运用到各自专业领域,解决待定的问题,这才是数据挖掘的终极目标。2) 数据挖掘模型从数据挖掘进入工程应用领域起,就有人对数据挖掘的过程进行归纳和总结,提出了不同的数据挖掘处理过程模型。其中MEUsama、ESGregory等人给出的多处理阶段模型是一种通用模型,也是被广泛接受的一种处理模型,如图所示的模型示意图在数据挖掘领域被多次引用。图1 数据挖掘处理过程模型图1数据挖掘处理过程模型该模型中,各个阶段要完成的工作分别是:(1) 数据准备,了解KDD相关领域的有关情况,熟悉有关的背景知识,并掌握用户的要求;(2) 数据选择,根据用户的要求从数据库中提取与KDD相关的数据;(3) 数据预处理,检查数据的完整性及数据的一致性,对其中的医疗保险数据进行处理,对多余的数据可以利用统计方法进行踢出;(4) 数据缩减,对经过预处理的数据,根据知识发现的任务对数据进行再处理,主要通过投影、求交集或数据库中的其他操作减少数据量;(5) 确定KDD的目标,根据用户的要求,确定KDD是发现何种类型的知识;(6) 确定知识发现算法根据阶段(5)所确定的任务,选择合适的数据挖掘算法,这包括选取合适的模型和参数,并使得知识发现算法与整个KDD的评判标准相一致;(7) 数据挖掘采用选定的知识发现算法,从数据中提取出用户所需要的知识,这些知识可以用一种特定的方式表示或使用一些常用的表示方式;(8) 模式解释对发现的模式进行解释,在此过程中,为了取得更为有效的知识,可能会返回前面处理步骤中的某些步骤以反复提取,从而提取出更有效的知识。上述处理模型的共同点是都要经过准备、预处理、算法设计、数据挖掘和后处理等共同的阶段,如图2所示。准备阶段包括问题定义、对象理解、数据收集等准备工作;预处理包括数据清理、压缩、变换等;后处理包括结果解释、输出、评价、分析、使用等。图2 挖掘模型公共处理阶段5.2 模型一的求解1) 数据处理图3 数据处理手段(1) 核算分类通过数据挖掘分析发现了题目各个附表之间的联系,根据附表2.2中的核算内容将所有数据分为三类:第1类为总价较高,数量较小的数据;第2类为总价及数量相对适中的数据;第3类为总价较小,数量较高的数据。通过对1、2、3类的统计分析,发现核算分类1、2、3类在总价数量上具有明显的差别,所以本文将题目附表2-2中数据进行按核算标准分为1、2、3类,分别对每一类数据进行研究。(2) 数据处理的几个手段和名词解释数据清理,现实世界的数据一般是不完整的、有噪声的和不一致的。数据清理例程试图填充缺失的值、光滑噪声、识别离群点,并纠正不一致的数据。其中填充缺失值包括:忽略元组、人工填写缺失值、使用一个伞局变量填充缺失值、使用属性的均值填充缺失值、使用与给定元组属同一类的所有样本的属性均值和使用最可能的值填充缺失值的方法;光滑噪声数据包括:分箱、回归和聚类的方法。数据规约,大量的数据在进行复杂的数据分析和挖掘时,将需要很长时间,使得这种分析不现实或者不可行。而数据规约技术可以用来得到数据集的规约表示,虽然结果小得多,但仍然能接近保持原数据的完整性。这样,对规约后的数据集挖掘将更有效,并产生几乎相同的分析结果。数据规约的策略包括:数据立方体聚集、属性子集选择、维度规约、数值规约以及离散化和概念分层产生。计数,是一个重复加或减1的数学行为,通常用于算出对象有多少个或放置想要数目个对象(对第一个对象从一算起且将剩下的对象和由二开始的自然数做一对一对应)。此外,计数亦可以被使用来学习数字名称和数字系统的知识。数据集成和变换,数据挖掘经常需要数据集成合并来自多个数据存储的数据。数据还可能需要转换成适于挖掘的形式,也就是数据转换。其中,数据转换可能涉及到如下内容:光滑、聚集、数据泛化、规范化和属性构造等。(3) 异常数据的处理及数据处理异常检测又称为基于行为的检测,其思想是利用已建的正常用户和系统的行为特征来检测当前行为的背离度,以确定当前的行为是否为异常行为。其优点是能够检测未知、异常、不需要建立的异常模式库,其缺点是误报率高。异常检测的一般模型图4所示,包括数据提取模块、数据分析模块和结果处理模块。通常异常检测系统的检测是针对某个特定的对象。首先监视对象的行为,学习这个对象的行为特征,以便产生这个对象的正常使用模式,并通过其后的监视,对比正常使用模式,检测出这个对象的异常行为,产生警告。提取模块负责提取反映受保护系统运行状态的数据,并完成数据的过滤及其预处理工作,为异常分析模块和结果处理模块提供原始的安全审计数据。数据分析模块首先从输入的数据中提取出当前对象行为的特征,把这个概貌和以前建立的正常使用模式进行比较,如果超出某个既定的范围,就认为是异常行为,产生警告信息并提交给结果处理模块。结果处理模块的功能主要用于告警和反应。图4 异常检测一般模型异常检测模型一般分为三类,统计性模型、预测模型和基于机器学习的异常模型,本文采用统计性模型。利用数据挖掘技术分别在挖掘出有密切关联的医疗保险欺诈考虑因素明显的病人ID号对应的数据,考虑的主要因素为单张处方药费即单价,一张卡在一定时间内反复多次拿药即次数,巨额账单即总价,以及数量进行分类别、分因素进行整理。最后简化模型在所有附表中找出可能出现医疗保险欺诈行为的数据并经排序、多次筛选统计在Excel表格中。筛选统计的标准:单张处方药费特别高即总价高,一张卡在一定时间内反复多次拿药即次数多,单价高和数量多。筛选思路各个病人ID号所对应的可能出现医疗保险行为的数据及排列后其值排列靠前,数据出现的频率较高,同一个病人在不同医生下开药,买取药物的价格不合常理等情况,而后在表格中分别整理出总价,单价,数量及次数各200位病人ID号所对应的数据。计数过程在附表中找出有相互联系的病人ID号,分析并得出附表2.1中的数据在附表2.2中大量重复出现的病人。故以附表2.2为依据,将所有ID号进行排序,然后通过Excel计数功能将所有ID号统计出来。 数据集成和转换 在权重系数最优的条件下对这600位病人ID号所对应的数据(即总价,单价,数量,次数)进行分析及筛选。筛选的过程中需要返回到原始表格中查找,找出病人ID号所对应的原始数据,并统筹出最具有代表性的200个数据见附表。2) 聚类分析模型生产实际中,经常遇到给产品等级进行分类的问题,如一等品、二等品等,在生物学中,要根据生物的特征进行分类;在考古时要对古生物化石进行科学分类;在球类比赛中经常要对各球队进行分组如何确定种子队,这些问题就是聚类分析问题。随着科学技术的发展,我们利用已知数据首先提取数据特征,然后借助计算机依据这些特征进行分类,聚类的依据在于各类别之间的接近程度如何计量,通常采取距离与相似系数进行衡量,利用样本的指标值对样本进行分类的统计方法成为聚类分析法。聚类分析法问题:设有n个样本,每个样本有p个指标值衡量样本接近程度的方法常用的有:将每个样本看作维空间中的一个点,在p维空间中定义两点间的距离,并把距离近的点归成一类;或者是定义指标点的相似系数,相似系数接近1或者-1的两个指标相似性最大,把相似的归成一类。 定义距离和相似系数都与数据类型有关,数据按其测量的尺度可以分为间隔尺度、有序尺度、名义尺度。(1) 距离的概念为了消除各变量量纲的影响,以保证各变量在分析中处于同等地位,通常需要对数据进行标准化变换,下面是两种常用的标准化方法。 利用标准差进行标准化。令: , (1)那么的标准差标准化变量为: (其中:;) (2) 利用极差标准化。令: (3)那么的极差标准化变量为,(其中:;) (4)用标准差标准化和用极差标准化后的变量其均值都为0,相应的标准差和极限差均为1,对标准化的变量可以定义样本间的距离。设E是一个集合,若E上的一个一元二次函数d(x,y)满足下面的条件,则称d(x,y)是E内两点(x,y)的距离。(i) 非负性:对任何x,yE,d(x,y)0,且d(x,y)=0当且仅当x=y;(ii) 对称性:对任何x,yE,d(x,y)=d(y,x);(iii) 三角不等式:对任何x,yE,d(x,y)d(x,z)+d(z,y),若d(x,y)满足(i)、(ii)及 (iii)对任何x,y,zE,d(x,y)max(d(x,z),d(z,y),则称d(x,y)极端距离。以下的讨论都从标准化后的值或者出发,为了简便仍记为,几种常见的距离:绝对距离:; (5)欧几里得距离: ; (6)闵可夫斯基距离:,q1; (7)切比雪夫距离: (8)其中表示第i个样本值(1,2,.,n)。容易看到绝对距离和欧几里得距离都是闵可夫斯基距离的特例。闵可夫斯基距离的最大缺点是没有考虑指标间的相关关系。下面介绍一种考虑指标间相关关系的距离马氏距离。设S是子样的相关矩阵,令: (9)则称为第个样本和第个样本间的马氏距离,其中子样相关矩阵为: , (10)(其中:;)马氏距离更适用于随机变量情形。(2) 相似系数相似系数表示两组指标间的相似程度。若以表示第个指标与第个指标的相似程度,它应该满足如下三个要求: (i)当且仅当为常数,其中 ; (11) (ii)对任何 (iii)对任何 常用相似系数有:两个样本指标(向量)夹角之余弦 (12)两个指标的子样相关系数 (13) 易知,当是被标准化了的变量时,则有: (14)(3) Q型聚类分析的主要作用:可以综合利用多个变量的信息对样本进行分析;分类结果直观,聚类谱系图清楚地表现数值分类结果;聚类分析所得到的结果比传统分类方法更细致、全面、合理。5.3 模型二的求解1) 模型的求解思路(1) 模型一中整理汇总在模型一中我们通过数据挖掘技术筛选得到的1、2、3类各200个ID所对应的总价、单价、医疗次数、取药数量等信息进行了整理汇总见附表;(2) 利用标准差进行标准化在附表中对1、2、3类各200个ID所对应的总价、单价、医疗次数、取药数量主要因素分别进行求解平均值,标准差。(3) 极差标准化变量的求解利用步骤(2)中对附表中对1、2、3类各200个ID所对应的总价、单价、医疗次数、取药数量主要因素分别进行求解平均值,标准差值,根据公式求解出标准差标准化变量 见附表。(4) 距离的求解利用、中求解距离的公式进行求解,通过发现马氏距离更适合于随机变量模型。(5) MATLAB画聚类图的实现(i) 在MATLAB软件中输入程序;(ii) d1=pdist(a); % 此时计算出各行之间的欧氏距离;(iii) 为了得到距离矩阵,我们键入命令:D= squareform(d1), % 注意此时d1必须是一个行向量,结果是实对称矩阵,若想得到的三角阵,则有命令:S = tril(squareform(d1)利用MATLAB所画出的谱系图如图5-7所示。2) 模型的求解结果(1) 对第一类核算分类的数据进行分析,筛选出总价、单价、数量及次数前200位病人所对应具体数据,通过聚类分析模型的标准化过程,得到以下结果:表1 第1类核算分类标准化结果病人ID总价数量单价次数病人ID总价数量单价次数2256840.547-0.3811.0300.383660581-0.572-0.185-0.5900.4541655070.547-0.3811.030-0.325659043-0.6723.762-0.599-0.6096199510.778-0.3811.304-0.113652151-0.606-0.225-0.589-0.2544782840.778-0.3811.304-0.042649736-0.787-0.381-0.550-0.1132604600.778-0.3811.304-0.113637814-0.623-0.179-0.592-0.5382390110.547-0.3811.0300.100603339-0.608-0.363-0.5330.3121908320.547-0.3811.030-0.325603194-0.1280.178-0.590-0.4671627440.547-0.3811.030-0.254217226-0.789-0.381-0.5521.5883203490.547-0.3811.0300.879212088-0.781-0.381-0.5430.8796276910.778-0.3811.304-0.3962054860.5790.743-0.5900.8796199110.778-0.3811.304-0.4671903410.023-0.375-0.0950.8796184300.778-0.3811.304-0.325482950-0.793-0.381-0.5570.8795646300.778-0.3811.304-0.396473794-0.744-0.381-0.4990.8082950830.547-0.3811.030-0.325452293-0.762-0.381-0.5200.8082633230.778-0.3811.304-0.467510864-0.6334.798-0.599-0.4672318900.547-0.3811.030-0.467505371-0.626-0.214-0.591-0.3962019680.547-0.3811.030-0.042501174-0.653-0.214-0.592-0.2541627990.778-0.3811.304-0.467496642-0.4943.762-0.598-0.5386276900.778-0.3811.304-0.113482749-0.756-0.271-0.5940.5962074190.778-0.3811.304-0.538481526-0.792-0.329-0.594-0.3963877761.922-0.3751.030-0.467460202-0.792-0.329-0.594-0.5383372490.547-0.3811.030-0.325455947-0.680-0.283-0.5890.9503288890.547-0.3811.030-0.183454916-0.6710.074-0.596-0.3966282872.054-0.329-0.257-0.609398023-0.616-0.225-0.590-0.3965988311.189-0.346-0.257-0.750397767-0.628-0.225-0.590-0.6095557280.8260.178-0.579-0.467394087-0.675-0.110-0.5950.1004617620.574-0.346-0.362-0.325381991-0.6723.762-0.599-0.6092861230.547-0.3811.030-0.042381773-0.190-0.375-0.221-0.1136927470.974-0.3811.536-0.609373910-0.6334.798-0.5990.3126901830.974-0.3811.536-0.183350607-0.744-0.346-0.5851.3756825540.974-0.3811.536-0.538350274-0.675-0.214-0.5930.9506813580.974-0.3811.536-0.538336948-0.6640.167-0.597-0.3966707950.974-0.3811.536-0.6093267290.039-0.023-0.582-0.6096640922.090-0.3812.857-0.679318611-0.7050.236-0.5971.8006601501.810-0.3812.526-0.679290628-0.8250.190-0.599-0.5386565640.778-0.3811.304-0.679288856-0.491-0.225-0.585-0.5386543540.778-0.3811.304-0.113286622-0.628-0.225-0.590-0.3256446040.974-0.3811.536-0.609279708-0.672-0.248-0.591-0.0426397991.810-0.3812.526-0.679270378-0.6323.070-0.598-0.4676397190.3331.826-0.595-0.467261458-0.8175.375-0.599-0.5386159891.810-0.3812.526-0.609256400-0.090-0.225-0.5680.4546126571.810-0.3812.526-0.538243949-0.7112.725-0.5990.3125891762.090-0.3812.857-0.396239810-0.3711.273-0.597-0.3255819610.974-0.3811.536-0.467236708-0.787-0.381-0.550-0.1835795021.810-0.3812.526-0.609233349-0.587-0.185-0.591-0.4675724520.974-0.3811.536-0.679231911-0.6870.017-0.596-0.5385398692.090-0.3812.857-0.679231909-0.6870.017-0.596-0.5385294100.974-0.3811.536-0.609231456-0.792-0.329-0.594-0.5384630112.090-0.3812.857-0.467230446-0.799-0.369-0.5870.2424050322.090-0.3812.857-0.679228436-0.5910.305-0.596-0.4673974882.090-0.3812.857-0.609227205-0.578-0.369-0.500-0.3963836920.547-0.3811.030-0.3252243240.2750.766-0.592-0.4673454290.778-0.3811.304-0.609224152-0.6000.443-0.5976.8303259390.974-0.3811.536-0.467219141-0.688-0.214-0.593-0.467287278-0.726-0.369-0.558-0.183218347-0.491-0.225-0.585-0.6092175272.090-0.3812.857-0.467213587-0.491-0.225-0.585-0.467194579-0.804-0.214-0.598-0.396212115-0.575-0.265-0.585-0.538189503-0.807-0.363-0.5920.312208681-0.680-0.283-0.5890.45492494-0.790-0.248-0.597-0.538207572-0.671-0.214-0.593-0.6096956324.902-0.3290.080-0.609202762-0.659-0.041-0.595-0.3966873570.875-0.3750.4101.517202558-0.5503.070-0.598-0.6096873551.727-0.3690.4101.517202392-0.509-0.381-0.221-0.325654624-0.7070.167-0.5973.501201598-0.828-0.225-0.588-0.5386501344.817-0.156-0.432-0.679200533-0.703-0.346-0.578-0.3966486120.656-0.335-0.403-0.325197210-0.7000.074-0.597-0.1836472190.674-0.283-0.500-0.538196833-0.5210.017-0.594-0.4676462810.6690.651-0.589-0.679196560-0.4943.762-0.598-0.4676460461.177-0.214-0.520-0.467196091-0.718-0.271-0.592-0.183618485-0.4600.098-0.594-0.467195712-0.555-0.064-0.593-0.4676162690.5820.132-0.580-0.467195241-0.707-0.369-0.551-0.0426086842.054-0.329-0.257-0.325195215-0.554-0.214-0.588-0.254217369-0.718-0.375-0.5331.021195034-0.443-0.225-0.582-0.3965609991.0530.305-0.580-0.538194483-0.754-0.265-0.595-0.538549944-0.491-0.225-0.585-0.042193883-0.578-0.369-0.500-0.254530813-0.827-0.369-0.598-0.254192174-0.572-0.185-0.590-0.5384779451.766-0.335-0.257-0.396191160-0.706-0.225-0.594-0.538418715-0.799-0.381-0.5641.446190331-0.563-0.185-0.5900.454159984-0.770-0.381-0.5301.233190176-0.801-0.381-0.5660.950645899-0.643-0.381-0.3791.163189703-0.784-0.381-0.546-0.467644308-0.722-0.381-0.4731.163189658-0.578-0.185-0.590-0.609603281-0.756-0.369-0.5701.163186881-0.706-0.225-0.594-0.325160177-0.793-0.381-0.5571.588175401-0.753-0.271-0.594-0.467117550-0.779-0.375-0.5691.588625378-0.797-0.381-0.5611.375649962-0.793-0.381-0.5571.517174265-0.509-0.381-0.221-0.042525449-0.631-0.317-0.5791.517173769-0.653-0.214-0.592-0.042195436-0.750-0.375-0.5521.375168018-0.384-0.104-0.588-0.538190291-0.489-0.369-0.4651.375167743-0.728-0.381-0.4793.288177563-0.714-0.248-0.5931.375167636-0.7112.725-0.599-0.325160865-0.671-0.363-0.5521.375167175-0.346-0.185-0.5820.808648979-0.718-0.375-0.5331.304162386-0.797-0.317-0.5961.163546395-0.771-0.375-0.5651.304161213-0.695-0.375-0.5201.942519164-0.712-0.363-0.5641.304160790-0.715-0.381-0.465-0.113339307-0.797-0.381-0.5611.3041373120.504-0.3810.979-0.538688917-0.491-0.225-0.5851.3751260200.504-0.3810.979-0.609686815-0.190-0.375-0.2215.484874250.504-0.3810.979-0.679686617-0.715-0.381-0.465-0.396126508-0.652-0.271-0.588-0.254683284-0.709-0.179-0.595-0.538128722-0.728-0.179-0.595-0.609675372-0.793-0.041-0.5980.808130917-0.765-0.110-0.597-0.679673830-0.6340.017-0.5961.942131315-0.7020.167-0.597-0.4676640970.1442.932-0.5970.242132275-0.652-0.271-0.588-0.538通过标准化所得结果,做出第一类核算聚类分析模型谱系图如下:图5 第1类核算聚类谱系图(2) 对第二类核算分类的数据进行分析,筛选出总价、单价、数量及次数前200位病人所对应具体数据,通过聚类分析模型的标准化过程,得到以下结果:表2 第2类核算分类标准化结果病人ID总价数量单价次数病人ID总价数量单价次数93845-0.282-0.6331.7240.971657469-0.127-0.326-0.3220.971167541-0.1890.398-0.458-0.5116575960.2841.538-0.468-0.882167636-0.096-0.392-0.264-0.511658226-0.382-0.6443.144-0.882170256-0.493-0.129-0.4562.824658612-0.776-0.392-0.494-0.882172666-0.541-0.6441.855-0.8826586560.1891.976-0.4781.341172817-0.678-0.556-0.374-0.511658896-0.551-0.545-0.284-0.882174265-0.096-0.392-0.264-0.882658922-0.250-0.6331.8550.971174499-0.677-0.260-0.478-0.511658990-0.551-0.545-0.284-0.882178614-0.198-0.457-0.2272.4536602990.282-0.326-0.2110.971182132-0.368-0.436-0.324-0.882660346-0.639-0.6441.052-0.511186572-0.480-0.216-0.441-0.511660374-0.270-0.436-0.284-0.8821868810.1160.529-0.442-0.8826610390.6431.538-0.453-0.511186919-0.368-0.436-0.3241.341661131-0.639-0.6441.052-0.8821903314.3563.555-0.403-0.511661606-0.096-0.392-0.264-0.511190356-0.382-0.6443.144-0.882662148-0.541-0.6441.855-0.882195882-0.248-0.129-0.414-0.511662294-0.382-0.6443.144-0.511196091-0.464-0.523-0.264-0.511
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安阳疾控考试题库及答案
- 语文成教考试题库及答案
- 易班安全考试题库及答案
- 化工原理A2期末考试题库及答案
- 2025年锅炉水处理作业人员(特种作业)考试题库(含答案)
- 2025年新疆甜菜种植与农业技术推广应用合同
- 2025年贵州社区工作者考试备考题库及答案
- 浙江省高考试题及答案
- 港口督导员考试题及答案
- 水城县农机安全培训课件
- 2022燃煤机组耗差计算方法
- 食品公司原辅料及包装材料验收规范
- 新闻播读培训课件
- 《蔚来汽车发展》课件
- 装配钳工试题库及答案
- 新手必看保安证考试试题和答案
- 脓毒性休克护理要点
- 海洋空间资源开发与国家安全教学课件-2024-2025学年人教版(2019)高中地理选择性必修三
- 个人信息保护法亮点解读
- 《往复式压缩机制造监理技术要求》
- 《护士输血流程》课件
评论
0/150
提交评论