(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf_第1页
(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf_第2页
(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf_第3页
(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf_第4页
(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf_第5页
已阅读5页,还剩85页未读 继续免费阅读

(计算机软件与理论专业论文)基于关系式的数据稽核方法研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摹于关系式的数据稽核方法研究! j 实现北京邮电大学通信软件t 程中心 陈异 基于关系式的数据稽核方法研究与实现 摘要 随着市场竞争的加剧,越来越多的电信运营商已经意识到,在寻 找业务增长点的同时,要更加关注企业内部的收入管理。为了减少电 信企业的收入流失,业界开始了对电信企业收入保障的研究。数据稽 核是实现收入保障的有效方法之一。然而,目前对数据稽核方法的研 究刚处于起步阶段,既缺乏理论基础,也没有业界公认的方法论。作 者以从事运营商数据稽核工作的实践为基础,提出并研究了基于稽核 关系式的数据稽核方法,并在研究成果的基础上详细设计了该稽核方 法的稽核方案,最后对该方案进行了部分实现与实例验证,证明了该 稽核方法的可行性。 论文首先提出了稽核关系式的概念口关系式以运营商数据稽核实 践中的数据约束关系为基础。论文对关系式进行了形式化的定义和业 务描述,并且提出数据实体的概念,对关系式中的数据实体进行了形 式化定义和业务描述。论文研究了基于关系式理论的单个关系式稽核 方法,研究了运营商的系统中大量关系式的性质和对大量关系式之间 的关系进行处理的方法,从而能对大量关系式进行稽核。论文详细设 计了基于关系式的数据稽核方法的一种实现方案。该方案以关系式模 型为基础,建立了信息模型、数据模型,设计出s c h e m a 规范,设计 出写x m l 的解析方法和读x m l 的解析方法,从而实现了稽核关系式的 x m l 标准化描述,使该稽核方法具有了通用性。论文最后对方案进行 了部分实现,并以企业数据稽核工作中的一个实际例子加以验证,说 明了基于关系式的数据稽核方法具有实用性。 关键词收入保障数据稽核数据实体稽核关系式x m l 北京邮电大学硕士学位论文 基于关系式的数据稽核方法研究j 实现北京邮电人学通信软件t 程中心 陈异 r e s e a r c ha n di m p l e m e n t a t i o no ft h e m e t h o do fd a t aa u d 薹t l n gb _ a s e do n a u d i t i n g r e l a t i o n s h l pe x p r e s s i o n w i t ht h ed e v e l o p m e n to fc o m p e t i t i o ni nt e l e c o mm a r k e t s 。t e l e c o m o p e r a t o r sh a v ea l r e a d yr e a l i z e dt h a tt h e ys h o u l dp a ym o r ea t t e n t i o nt o r e v e n u em a n a g e m e n to fc o m p a n yw h i l ek e e p i n gt h ed e v e l o p m e n to f s e r v i c e s i no r d e rt or e d u c er e v e n u el o s s 也er e s e a r c ho nr e v e n u e a s s u r a n c e ( r a ) h a sb e e ni n i t i a t e d d a t aa u d i t i n gi sa ne f f e c t i v em e t h o d f o rr a 。h o w e v e r , t h ec u r r e n tr e s e a r c ho fd a t aa u d i t i n gi si u s ta tt h ei n i t i a l s t a g e i tn e e d sat h e o r e t i c a lf o u n d a t i o na n dag u i d i n gm e t h o dw h i c hi s a g r e e do nb ya l li nt h ea r e ao fr e v e n u ea s s u r a n c e 。w i t he x p e r i e n c e so f d a t aa u d i t i n gf o rac e r t a i nt e l e c o mo p e r a t o r , an e wm e t h o df o rd a t a a u d i t i n gb a s e do na u d i t i n g r e l a t i o n s h i pe x p r e s s i o ni sp u tf o r w a r d e di nt h e p a p e r a n db a s e do nt h er e s e a r c ho ft h i sm e t h o d ,ad a t aa u d i t i n gs o l u t i o n i sd e t a i l e dd e s i g n e d t h es o l u t i o ni sa l s op a r t i a l l y i m p l e m e n t e da n d v e r i f i e db yar e a le x a m p l et og e ti t sp r a c t i c a b i l i t yp r o v e d n ec o n c e p to f a u d i t i n g r e l a t i o n s h i pe x p r e s s i o n i sf i r s t p u t f o r w a r d e d i ti sb a s e do nt h ec o n s t r a i n t so fd a t ai nt h et e l e c o mo p e r a t o r s s y s t e m s n ec o n c e p to fa u d i t i n g r e l a t i o n s h i pe x p r e s s i o na n dd a t ae n t i t y a r ef o r m a l l yd e f i n e da n dd e s c r i b e df r o mt h eb u s i n e s sa s p e c t b a s e do nt h e r e s e a r c h ,am e t h o do fd a t aa u d i t i n gf o ro n es i n g l ea u d i t i n g r e l a t i o n s h i p e x p r e s s i o ni sp u tf o r w a r d e d t h e n i nt h ep a p e r , t h er e l a t i o n s h i p so fa l lt h e a u d i t i n g r e l a t i o n s h i pe x p r e s s i o n si ns y s t e mm sa r es t u d i e da n dam e t h o d f o rh a n d l i n gt h e s ee x p r e s s i o n si s p u tf o r w a r d e ds o t h a ta l lt h e s e e x p r e s s i o n sc a nb ea u d i t e d ad a t aa u d i t i n gs o l u t i o ni sd e t a i l e dd e s i g n e d 。 t h es o l u t i o ni sb a s e do nt h em o d e lo fa u d i t i n g r e l a t i o n s h i pe x p r e s s i o n a n di tc o n t a i n si n f o r m a t i o nm o d e l ,d a t am o d e l ,s c h e m a ,x m lw r i t i n g 北京邮电大学硕十学位论文l i i i i m e t h o d ,x m lr e a d i n gm e t h o d a t l a s t ,t h es o l u t i o ni s p a r t i a l l v 1 m p l e m e n t e da n dv e r i f i e db yar e a l e x a m p l ef r o mt h ep r a c t i c eo ft h e t e l e c o mo p e r a t o r ld a t aa u d i t i n gs ot h a ti t s p r a c t i c a b i l i t yi sp r o v e d k e yw o r d sr e v e r l u e a s s u r a n c e ,d a t aa u d i t i n g ,d a t a e n t i t y , a u d i t i n g - r e l a t i o n s h i pe x p r e s s i o n ,x m l 北京邮1 1 1 人学硕上学位论文 蒺鼍:关系武麴数搬稽孩方法研究j i 实现托隶邸电大学暹信软件下程串心陈异 示图目录 图2 - 1 数据流模型图9 图2 幢数据流分解示图1 0 图数据截面示图1 0 图 视价款转预存流程图1 2 图3 - 2 机价款转预存流程中数据实体图。1 2 图弘3 相邻截面间数据实体约束关系图1 7 圈跨截蔼数据实体零图2 7 图3 - 5 跨累账、出账截面不分数据实体示网2 8 鎏辅系统约束零图。2 9 图3 - 7 中国联通省级现有b s s 系统体系结构图2 9 图3 8 第一条关系式树形代入圈4 1 图3 - 9 第二条关系式树形代入图4 1 图3 - 1 0 第三条关系式树形代入图4 2 图争 稽核方案圈。4 毒 图4 - 2 稽核方案关键点层次依赖图4 5 图4 门关系式存储数据模型 r 銎。鞫 图4 - 4 关系式模型图5 l 霾和5 表达式模餮图5 2 图4 - 6 子表达式模型图5 2 图4 7 数据实体模型图5 3 图4 - 8 地址模型豳s 4 图关联属性模型图5 4 圈p o 过滤属性模型图。5 5 图4 - 1 1 分组属性模型图5 5 圈争 2b a i a n c e 包含关系图。s 7 图4 - 1 3e x p r e s s i o n t y p e 包含关系图5 8 豳幸_ 4d a t a e i e m e n t t y p e 包含关系圈5 8 图4 - 1 5e x p r e s s i o n g r o u p 包含关系图。5 9 图4 _ 1 6a d d r e s s t y p e 包含关系图5 9 圈4 _ 1 7m a t c h t y p e 包含关系图。 图4 - 1 8f ii t e r t y p e 包含关系圈6 0 1 1 84 - 1 9g r o u p t y p e 包含关系鹜。6 图5 _ 1 退补费计算过程流程图6 9 露锻关系式文本表数据图7 0 图5 元素类型编码表数据图7 0 图5 - 4 关系符号表数据圈7 0 图5 _ s 关系符号类型编码表数据图,7 0 图弘6 关系函数表数据图7 1 图s 7 关系函数类型编码表数据露+ 。7 图5 _ 8 数据实体表数据豳7 1 戋褒邮电犬学硕七学位论文 v l 麓于关系的数据稽核方法研究j 蜜现l e 京邮电人学通信软件t 程中心陈异 l 圈5 - 9 地址表数据圈7 1 圈5 - 1 0 关联属性表数据图7 1 图5 - 1 1 过滤属性表数据图7 1 图5 - 1 2 分线属性表数据图7 2 表格目录 表3 - i 机价歉表部分结构1 5 表3 - 2 关联属性二元组值对表1 8 裹3 - 3 数据实体元组镶悫表。2 表3 - 4 用户账户表部分结构2 3 表3 - 5 用户预存表部分结构2 4 表3 - 6 用户费项表部分结稳。2 s 表3 - 7 关系函数优先级顺序表3 5 表3 - 8 关系式文本表结构4 7 表3 - 9 元素类墅编码表结构。毒7 表3 - 1 0 关系符号表结构4 8 表3 1 1 关系符号类型编码表结构4 8 表3 - 1 2 关系螽数表结构。4 8 表3 - 1 3 关系函数类型编码表结构4 8 表3 - 1 4 数据实体表结构。4 9 表p s 地蠊表结构钧 表3 - 1 6 关联属性表结构4 9 表3 _ 钌过滤属性表5 0 表3 - 1 8 分缱属性表缩梅。5 0 表4 _ 1s c h e m a 简单类型元素列表5 6 北京邮电人学硕。l :学位论义 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含先获零导北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本入签名: 登:翌日期:垫堕:兰:z 关于论文使用授权的说明 学位论文作者完全了解北京邮电犬学有关保留和使用学位论文的规定,即;研究生在校 攻读学位期闯论文王弦的知识产权攀位藩鸵京邮电大学。学校有权保留并向国家有关部 门或机构送交论文的复印作和磁盘,允许学位论文被凌阅窝借阕;学校以公布学位论 文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不瘸于僳密范围,适用本授权书。 本人签名: 导师签名: 墨飙 缝:查:; 嚣嬲:尘堕牡 莲手关系式酌数蕹稽辕方法磺究实现乾窳邮电天学通嵇软稗t 程中心陈异 - i 。i l 论文背景及目的 1 1 1 背景 第一章绪论 目前,在经历了数年的高速发展之后,巾国的电信运营企业芷面临着巨大的 变革。一方面,市场的逐渐饱和以及竞争的日益激烈促使运营商努力寻求最先进 的设备、系统和管理方法,不断开创新的业务增长点以迎接挑战;另一方面,运 营利润的薄化促使运营商更加重视对收入流失的控制,企业运营收入保障成力新 的研究热点。 据i d c 、s t r a t e c a s tp a r t n e r s 、普华永道、r h k 等国际知名咨询公司对全球 5 0 多家知名电信运营商的调查显示,约有三分之一的公司由于缺乏完善的收入 保障工作而蒙受重大经济损失,损失的收入平均约占公司年度总收入的2 5 l l j 。收入保障,就是保证从用户通话行为发生到业务收入准确、及时地归拢、 入账,有效控制收入的“跑、冒、滴、漏”,减少收入流失。收入保障已成为电 信企数目前露临的重要工作。众多国际知名电信公霹已经将收入保障作为企业重 点战略之一,并且制定了长远规划加以实旋,以大幅提高运营效率。著名的电信 业务运营管理研究机构电信管理论坛也将收入保障作为单独的课题进行重 点研究,并将其纳入精益运营的范畴。 造成运营商的收入流失的原阏很多【埘,如话单数据错误、批价计费错误、 用户信息错误、欺诈、坏账等。而人工操作,流程衔接,数据处理错误,信息延 迟等方面的错误均可造成以上这些引起收入流失的原因。因此,收入保障的具体 实施方法也是多静多样的,如信用控制、流程规范等。数据稽核是实现收入保障 的方法之一。所谓数据稽核,就是通过对现有业务流程与业务支撑系统的调研诊 断、数据比对,查找数据差异,确定收入流失点,从而阻止并预防收入流失。其 核心愚想是查找、验证运营商的系统内以及系统间的数据约束关系,通过对数据 约束关系的验证确保其中的数据是正确的,从两实现收入保障。 本论文对数据稽核的方法进行研究,提出并研究了基于关系式的稽核方法, 并且在此基础上设计出稽核方案,并做了关键部分的实现和实例验证,从而验证 了基于关系式的数据稽核方法以及由该方法所提出的稽核方案的可用性。 托京憋逛大学硕士学位论文 糍卡关系炎的数据稽核方法研究j 实现北京邮i u 人学通f ? i 软件t 稷中心陈异 1 1 2目的 对数据稽核方法进行研究,提出稽核关系式的理论,并在此基础上研究 基于关系式的稽核方法,为数据稽核开发邂通用的产品模型提供理论依 据。 在对稽核方法进行研究的基础上设计出稽核方案,该方案能够实现业务 人员与稽核人员的分离,或业务人员与自动稽核系统的分离,即:在论 文对稽核理论和方法的研究基磊i | ;上,设计出稽核关系式的信息模型和通 用撼述,业务人员按照此信息模型,通过配置每一个具体的关系式,实 现关系式的实例化。稽核人员或稽核系统,能从实例化的关系式中解析 出所有稽核信息。 对该方案做关键部分的实现和实例验证,证明可用性。 1 2 工作内容及成果 1 2 1 王作内容 l 基于稽核关系式的稽核方法的提出与理论研究 数据稽核,是以数据作为收入保障工作的检查对象,核对系统内部以及系统 间的数据约束关系。目前的数据稽核方法是直接检查数据库表的字段之阍所具有 的约束关系,核对数据是否满足约束关系。该方法需要稽核人员深入数据库表的 字段之间去了解、掌握业务流程,查找字段之间的函数关系,并依据函数关系对 各字段所对廒的物理数据进行手工检查。这种方法需要稽核人员完全掌握业务知 识,业务耦合性太强,且不利于实现自动稽核。 论文提出了基于稽核关系式的数据稽核方法。该方法以数据实体作为数据稽 核的原子单位,以稽核关系式表征数据实体之间的数据约束关系。业务入员可对 数据实体和稽核关系式进行灵活的配置。数据稽核人员或技术人员不需要深入了 解业务知识,也不需要了解生产数据的底层数据模型,便可对业务人员所配置的 稽核关系式实现有效稽核。论文首先提出了稽核关系式和数据实体的数学模型, 包括形式纯定义和摇述,以及其业务含义和实例攒述。并且提出了单个数据截面 阆以及跨多个数据截面阆的数据稽核的理论方法和实例说明。论文整理了江西联 通营账、计费、结算现有流程和部分数据约束关系,建立了大量稽核关系式,提 出了对系统内大量稽核关系式之间关系处理和化简的方法。 2 北京i l i | f 电大学顾 :学位论文 基予关系式的数瘫稽核方法磷究i 实现托隶郎电大学逶嚣软件t 程中心陈异 2 基于关系式的数据稽核方案设计 论文在基于关系式的稽核方法的理论研究基础上提出了基于该理论的稽核 方案。该方案能够建立关系式的信息模型和规范化s c h e m a 攒述,以及建立数据 模型存储用户所配置的关系式详细信息。这两个模型以及s c h e m a 规范为用户所 需要稽核的一类关系式建立了通用的“模版,在此基础上,业务人员只要配置 关系式详缁信息,便能实例他稽核关系式,这个实例化的稽核关系式熠标准的 x m l 语言描述所有信息,能够实现系统内以及系统间稽核信息的共享。方案还包 括对生成x m l 文件的“写解析 方法的详细设计以及对读取x m l 文件中稽核信息 的“读解析弦方法的详细设计。 3 基于关系式稽核方案的部分实现与验证 论文部分实现了该稽核方案,验证了该方案是可行和有实际意义的。并且以 用户实际鲎务中的一个稽核关系式为例,详细验证了方案中数据模型,写解析生 成x m l 文件,x m l 文件读取等功能。该实例验证说明了方案本身具有使用价值。 1 2 2 研究成果 通过对收入保障和数据稽核的学习,结合作者本人在企业现场从事为期 近一年的企业收入保障工作与数据稽核监控系统开发工作的实践总结, 提出了基予关系式的数据稽核方法理论,并对该理论进行了研究。 详细设计出了基于关系式的稽核方案,包括关系式信息存储数据模型, 信息模型的u m l 建模,信息模型的s c h e m a 描述,对关系式进行写解析 生成x m l 文俘的方法,对x m l 文髂读解析的方法。 部分实现了该稽核方案。以从企业运营流程中总结出的一个稽核关系式 加以实例验证,说明了可用性。 _ 1 3 论文结构 论文结构安排如下: 第二章论文相关知识与理论 详细介绍了论文工作所基于的基础知识与理论,包括收入保障、数据稽核与 代数基础理论。 第三章基于关系式的数据稽核方法研究 详细介绍了论文对数据稽核方法所做的研究工作。首先提出数据实体和稽核 关系式的概念,对数据实体和稽核关系式进行形式化定义与描述,并阐述其 魏索郑邀大学硕二学德论文 3 基于关系式的数据稽核方法研究j 实现北京邮i 乜人学通信软件t 程中心 陈异 4 业务含义,然后研究了基于关系式的截面问与跨截面稽核方法,最后对稽核 系统中大量关系式的关系处理方法进行了研究。 第四章基于关系式的数据稽核方案设计 详细介绍了基于关系式的稽核方案的设计过程,描述了设计成果。设计了关 系式信息存储的数据模型和关系式信息模型,设计了信息模型的规范化描 述,对“写解析 方法与“读解析”方法进行了详细设计。 第五章基于关系式的数据稽核方案实现与验证 部分实现该方案,并以从运营商稽核工作总结出的一个稽核关系式的实际例 子加以验证该方案的可用性。 第六章总结与展望 对全文进行了总结,并对下一步要进行的工作做了描述 北京邮电人学硕。卜学位论义 基于关系式的数据稽核方法研究,实现北京邮电大学通信软件t 程中心陈异 第二章论文相关知识与理论 2 1代数相关理论 定义1 把一些确定的、彼此不同的事物作为一个整体考虑时,这个整体称 为一个集合。因此,我们可以将各类数据对象的整体看作一个集合。 定义2 笛卡尔积矗1 a :& 的任意一个子集称为a ,a “,a 0 上的一个 n 元关系。 定义3 设有集会焘、魏f 是由矗到b 的关系,如果对于每个涎亟,存在唯一 的b b 使得a f b ,则称关系f 是由a 到b 的一个函数。根据定义知:允许集合a 中多个元素共有一个相同的函数值,也允许集合b 中有的元素在a 中没有像源。 定义4 设有非空集合a ,函数f :一 a 称为a 上的一个n 元运算。n 称为此 运算的阶。根据上述运算的定义,可以定义数据对象上的各类基本操作。 定义5 设:i c 是集合矗上的二元运算,如果存在一个元素e l _ a ,使得对于 所有的a e a 都有e l * a = a ,则称e l 是a 上关于运算木的左单位元:如果存在一个元 素e r r = a ,使得对予所有的获熬都有a * e r = a ,燹| j 称e r 是度上关于运算术的右单 位元:如果存在一个元素e a ,使得对于所有的a a 都有e * a = a * e = a ,则称e 是 轰上关于运算枣的单位元。 定义6 设:i :是集合a 上的二元运算,如果存在一个元素z l ea ,使得对于所 有的a a 都有z l * a = z l ,则称z l 是a 上关于运算枣的左零元;如果存在一个 元素z r a ,使得对于所有的a 每- _ a 都有a 木z r = z r ,则称z r 是a 上关于运算冰的右 零元:如果存在一个元素z a ,使得对于所有的a a 都有z , a = a , z = z ,则称z 是 a 上关于运算零的零元。 定义7 一个非空集合和定义在该集合上的一个或多个运算所组成的系统称 隽一个代数系统,用记号 表示。其中,s 是非空集合,称 为这个代数系统的域;0 ,0 2 ,”,0 0 是s 上的运算。 2 2电信收入保障 2 2 1 电信业务收入 电信业务收入 l 是指电信企韭在提供各项电信业务晌日常活动中新形成的 经济利益的总流入。其形成过程主要包括以下几个主要环节 北京邮电大学硕士学位论文 5 甚于关系式的数据稽核方法研究j 实现北京邮i u 人学通信软件t 程中心陈异 客户业务受理 业务开通与变更 客户通话明细记录 数据采集 计费账务处理 结算 收费 2 2 2 电信收入流失 在电信收入形成过程的任意环节均可能渤错,从而导致收入流失。收入流失 指的是那些电信运营商应该挣得,但是却在其经营活动过程中遗失,未能进入公 司账户形成实际收入的业务运营收 入1 2 1 。导致收入流失的原因主要有如下几种鸭 不准确的客户受理资料 联枫控制错误 不完善不正确的通话明细记录 数据采集不完整 不准确的计费账务处理 不准确的结算 欺诈 2 2 。3 收入保障定义 电信管理论坛t m f 认为,从1 9 9 0 年以来电信运营商开始了业务上的迅速扩 张,市场上的激烈竞争,使运营商在抢占市场时被迫简化了很多业务流程,为满 足临时需求建设了很多独立的系统。临时系统的增加,跨部门的不合理的业务流 程,数据的不同步,人工操作的失误,这些原因都直接导致了商监成本的增加帮 企业收入的流失。很多电信运营商已经意识到在激烈的竞争中寻找业务增长点的 同时,疲该核查企业内部的业务流程,合理设置企业的祝构,减少收入损失。为 了最大化企业的收入,收入保障项阿出现了。 t m f 对收入保障的定义是:为确保引发收入的各种过程都可以完整、准确和 及时计费并入账,组织所采取的各种措施( a n ya c t i v i t ya no r g a n i z a t i o np e r f o r m st o e n s u r et h a tp r o c e s s e s ,p r a c t i c e s ,a n dp r o c e d u r e sr e s u l ti nr e v e n u et h a ti sb i l l e da n d 6 北京邮l 乜大学硕士学位论文 麓手关系式的数据稽援方法研究与实现鸵京郎电入学通稿软件工程中心陈异 c o l l e c t e dc o m p l e t e l y , a c c u r a t e l ya n di na t i m e l ym a n n e r ) p o l 。收入保障涉及到企业 运营的各个方面,包括管理、技术和业务等,涵盖从运营商设计实现并提供服务 到用户定购使用服务并付费褥到运营商收费并入账的全过程。收入保障是企业全 范围的协调动作。它通过对企业进行独立的业务流程一致性和连贯性以及数据的 准确性和完整性的验证,以确保计费、统计和收费对每个产生收入的事件在最 大限度上不遗不漏地执行。 2 ,2 。4 收入保障分类 电信管理论坛将收入保障分为三类,分别体现三种层面的收入保障f l l 】。 r e a c t i v er e v e n u ea s s u r a n c e 在收入流失发生之詹,发现收入流失原因,并且解决该问题。 a c t i v er e v e n u ea s s u r a n c e 实时的监控各相关流程和数据,发现收入流失苗头,在可能发生收入流 失之前做出适当的反应以避免收入流失。 p r o a c t i v er e v e n u ea s s u r a n c e 通过企业内部控制以及其他相关措施的实施来预防可能造成收入流失 的问题发生。 2 2 5 收入保障研究现状 t m f 认为弓| 起收入流失有很多原因,诸如:通信网络问题,计费话单错误, 计费的不准确,数据文件的丢失,分离的支撑系统,业务流程的不合理。收入流 失不能完全消除,有业务开展就会存在收入流失,重要的是如何使收入流失降低 到可接受的范围内,如何最小化企业的收入流失。遗憾的是,目前还没有业界公 认的有效的收入保障方法论。 t m f 专门成立了收入保障研究小组,主要研究的工作包括【1 2 l : 重新检查g b a ( g l o b a lb i l l i n ga s s o c i a t i o n ) 组织已完成的收入保障领 域的工作。主要工作集中在:项目保障,数据完整性,信用和风险管理, 客户发展管理,服务提供管理,计费正确性,互联互逯计赞正确性,欠 费催讨,防欺诈,流程管理。 将收入保障纳入到现有的t m f 框架范围内,包括( n g o s s ,e t o m ,s i d ) , 特别是在现有的n g o s s - i - 作基础上,建立新的过程模型来指导收入傈障 的活动,并试图将收入保障的过程域和信息模型融入到现有的e t o m 框 架和s i d 中。 悲哀邮电夫学嫒| j 学位论艾 7 基于关系式的数据稽核方法研究与实现北京邮电人学通信软件t 程中心陈异 指导性文档的起草。包括一些词汇的定义,如对收入保障活动的分类, 补救性( r e a c t i v e ) 和预防性( p r o a c t i v e ) 收入保障的定义。包括收 入保障在i p 业务和数据业务上可能存在的新的问题点。 2 3数据稽核 2 3 1 数据稽核定义 数据稽核是指通过对现有业务流程与业务支撑系统的调研诊断、数据比对, 查找数据差异,确定收入流失点,从而阻止并预防收入流失。数据稽核不但能够 帮助电信运营商降低收入流失,提高企业效益,而且能够建立规范的数据稽核流 程和业务流程,提高运营效率l 引。 数据稽核目前采用的方法主要分为2 类1 2 。3 j ,它们共同的特点是解决运营流 程中业务处理逻辑的正确性和准确性问题,但从进行的收入保障实践过程中看, 收入流失问题主要还是运营流程执行不规范、缺乏流程完整性控制机制造成的, 如用户数据和局数据不一致导致的收入流失问题,而真正业务支撑软件系统因逻 辑性错误造成的收入流失问题相对较少。本文约定按照运营流程进行的数据操作 为合法的数据更新,而未按照运营流程,或人为原因、或系统异常退出原因等进 行的数据操作为非法的数据更新。非法数据更新所造成的数据异常,破坏了数据 的完整性,这类不完整的数据会随着业务流程在系统内传播和蔓延,导致数据异 常进一步扩散卜7 1 。 2 3 2 数据稽核相关概念 数据流 如何在应用层确保数据一致性,首先要针对电信业务支撑系统的业务流程进 行认真分析,采用“自顶向下,逐布求精”的方法进行流程细分,细分出一个个 原子流程,对原子流程进行数据稽核;再对原子流程进行组合,在组合流程中对 数据进行稽核。 运营流程的数据流模型8 1 :一般的业务流程模型包括活动、事件、数据对 象及约束条件。根据研究目标,这里实际关注的是数据对象和数据对象的变换, 因此可将数据处理过程从业务流程当中抽象出来。数据处理的过程实际为数据的 变换过程。如图2 一l 所示,运营流程中的数据流包括如下的特征: 1 ) 具有明确的输入数据对象i 2 ) 具有明确的输出数据0 8 北京邮i 【1 人学倾l :学位论义 皋于关系式的数据槠核方法研究+ 勺实现北京邮电大学通信软件t 程中心陈异 图2 - 1 数据流模型图 数据流的分解 电信运薷商的业务支撑系统构成极为复杂,从系统上可以分为计费系统、营 账系统、结算系统、缴费卡系统、智能网系统等,从业务流程上来看,账务部分 又可缨化为数据采集、详单优惠、累账、毒账、调账、销账、呆坏账处理、欠费 管理、账单管理、无主话单管理、账务统计等流程。累账流程可分为合账、月租 计算、账务优惠、赠送优惠等活动,出账流程包括账前调账、话单生成、账后调 账等活动。不同的系统之间以及系统内部,单个业务流程内部以及跨流程的数据 都需要稽核。因此,首先采用自顶向下逐步分解的方法,将数据处理流程按照功 能特征分解为多个处理活动,或者称为子流程,重复上述流程分解过程直到规约 为最基本的数据处理逻辑( 或称基本操作) 。业务流程分解后,数据处理逻辑的特 征仍然满足业务流程模型所具备的3 个特征,即i p o 。需要说甓豹是,操律之闻 的数据既是前一个操作的输出,又是后一个操作的输入数据。如图2 2 所示: 北京邮电大学硕七学位论文 9 基于关系式的数据稽核方法研究j 实现北京邮l 【i 人学通f 膏软件t 程中心陈异 图2 2 数据流分解示图 数据截面 在运营商的数据处理流程里,将数据处理逻辑p 。,p :,p 。隐去,只保留数 据镜像,称为数据截面。数据截面里的数据包括数据库中的表,以及数据处理产 生的各种临时数据文件或临时库表。数据截面具有时态特征,即数据截面中某些 实体或实体中的某些数据在数据处理过程中可能被增加、删除、更改等,实体处 于不稳定状态,只有数据处理过程结束后才处于相对稳定状态。如图2 3 所示 1 0 图2 - 3 数据截面示图 北京邮电人学硕t 学位论义 基于关系式的数据稽核方法研究吁实现北京邮电人学通信软件t 程中心陈异 第三章基于关系式的数据稽核方法研究 3 1 数据实体 3 1 1 数据实体概念提出 数据实体是一个业务的概念。在不同的数据截面上存在着各种各样的数据, 这些数据有各种不同的形式,如数据库表、数据文件等,不同的数据又包含了不 同的业务信息。比如,详单表包含了用户各费项的信息,缴费流水表和销账表包 含了用户账务方面的信息。本文提出的稽核关系式描述的是业务层面的数据约束 关系,因此,首先定义数据实体的概念,它能够从业务的层面描述数据信息。 数据实体由企业的业务人员定义和配置的能够表现企业计费、营账、结算 系统中某一方面业务信息的数据集合。数据稽核工作所要检查的就是数据实体间 的数据约束关系是否满足。数据实体是数据稽核工作的目标点,也是包含完整业 务信息的最小原子单位,不可再分。本文中提到的“数据实体”、“数据项都是 指的数据实体的概念。数据实体具有如下性质: 业务性数据实体是一个业务的概念,由业务人员定义和配置。其并不 具体针对某张表的某一属性,而是从业务层面指向包含了业务信息,可 以作为稽核目标的数据的集合。其具体对应哪些数据,需要由业务人员 进行配置。 原子性数据实体是包含业务信息的最小数据单位,不可再分。 以企业的机价款转预存流程为例说明什么是数据实体。在企业的出账流程中 存在着业务“机价款转预存 。其业务涵义是指目标客户预存相应话费,签署月 最低消费的1 年或2 年在网协议,即可获赠新款手机1 部。预存话费分成1 2 或 2 4 个月平均抵扣、月度不结转。其业务流程如图3 1 : 北京邮电大学硕:l 学位论文 皋于关系式的数据稽核方法研究j 实现 北京邮电人学通信软件t 程中心陈异 图3 - 1 机价款转预存流程图 其业务处理部分是在每一个账期之初从机价款流水表里转出固定额度的金 额作为用户的预存话费,该处理流程循环执行至出账结束。按照数据截面的定义, 将该处理流程隐去,只保留处理前后的数据镜像作为数据截面。因此,两个数据 截面分别是出账前数据截面和出账后数据截面,从业务上看,两个数据截面的数 据镜像分别是出账前用户机价款转出金额和出账后用户机价款流水金额,且这两 个数据镜像的数据状态稳定。因此,业务人员定义两个数据实体如下: 1 机价款表金额( 已转金额) : 2 机价款流水表金额( 期初至今转出或到期金额) 这两个数据实体包涵了机价款转预存流程中的业务信息,即出账前的转出金 额和出账后的转出流水金额,且这两个数据实体间存在数据约束关系。 图3 - 2 机价款转预存流程中数据实体图 3 1 2 数据实体定义与业务描述 数据实体定义 数据实体的形式化定义如下: 数据实体d a t e e l e m e n t 定义为以下二元组 。 d f n ( d a t a e l e m e n t _ n a m e ) 表示数据实体名 1 2 北京邮电人学硕上学位论文 基于关系式的数据稽核方法研究畸实现北京邮电大学通信软件t 程中心陈异 d e d ( d a t a e l e m e n t _ d e f i n i t i o n ) 表示数据实体描述信息,其定义为如下六 元组 l ( l o c a t i o n ) 数据实体对应的物理数据的地址,其定义为如下的五元组 l - i ( l o c a t i o n i p ) 物理数据对应i p 地址 l p ( l o c a ti o np o r t ) 物理数据对应端目 l s ( l o c a ti o n _ s e r v i c e ) 物理数据对应数据库服务名 lu ( l o c a t i o n _ u s e r n a m e ) 物理数据对应用户名 l - p w ( l o c a t i o n _ p a s s w o r d ) 物理数据对应密码 t ( t a b l e _ n a m e ) 数据实体对应的表名 矗辍t t r i b u t e _ n a m e ) 数据实体对应的属性名 j ( j o i n ) 数据实体对应的关联属性,其定义为如下的二元组 q 上,3 翼 j _ a ( j o i n _ a t t r i b u t e ) 关联属性名 jn ( j o i n _ n a l i l e ) 关联属性语义名 0 ( o p e r a ti o n ) 数据库操作函数名 f ( f i l t e r ) 数据库过滤操作,其定义为如下的四元组 好 鼍璺。摹童,摹j f a ( f il t e r _ a t t r i b u t e ) 过滤属性名 凹过滤属性操作函数 f - e 过滤函数比较运算 fv ( f ilt e r _ v a l u e ) 过滤属性值 g ( g r o u p ) 分组属性名 即数据实体可以用如下元组来表示 d e _ n , 数据实体业务描述 数据实体所定义的元组中,d en 是数据实体名,如“机价款表。金额( 已转 金额) ”; l 是数据实体对应的物理数据所在的地址。该地址可能包括i p 、用户名密 码、数据库服务名,还可以包糕数据文件绝对路径等。 t 是满足系统约束的企业系统中所有表名的集合中的一个元素,即对于一个 北京邮电大学硕十学位论文 1 3 基于关系式的数据稽核方法研究。j 实现北京gn u , u , 人学通信软件t 程中心陈异 数据实体来说,其对应的数据库表是唯一的。这是由数据实体的原子性决定的。 假如某数据实体涵盖了两张数据库表,则可以将元组中的数据库表和数据库函数 抽取出来,重新划分为两个数据实体。因为在关系数据库里,数据库表本身就对 应有意义的数据实体,而数据库函数则表明了两个实体的约束关系。比如,如果 一个数据实体为“用户余额 ,其数据包含了用户预存表和用户账单表,则可将 该数据实体拆分为“用户预存金额”和“用户消费金额两个数据实体,并且从 原数据实体的数据库函数中抽象出两个新数据实体间的约束关系。 a 是满足系统约束的企业系统中所有属性名的集合的一个子集。即一个数据 实体可能对应同一张表的多个属性。 二元组 对数据实体的关联属性作了约束和限定。在实际的数据 稽核中,不同数据实体间需要进行关联,这样才能保证在稽核时,不同的数据实 体对应到具有业务关联性的数据之间。比如数据实体a 和b 之间,需要指定关联 属性为“用户i d ”,才能保证其对应的物理数据是属于同一个用户的数据。在粒 度为用户级的数据稽核中,属于同一个用户的数据间存在数据约束关系,不同用 户的数据间不存在约束关系。在企业应用系统中,常见的关联属性包括按用户 i d 关联、按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论