(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf_第1页
(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf_第2页
(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf_第3页
(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf_第4页
(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(管理科学与工程专业论文)基于mas的数据组合征信自动化系统设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本论文结合中国征信数据环境实际,提出了数据组合征信的概念,数据组合 征信是指征信机构通过自动化软件系统,将分散在商业银行和各个社会机构的信 用信息汇集和组合起来,形成虚拟的企业信用数据库,在此基础上对其进行评估, 为社会各有关方面了解企业信用状况提供服务。其系统建设优点是启动和维护资 金非常小,效率比较高。并在此概念基础上,给出了一个基于m a s 架构的数据 组合企业征信系统整体设计,通过此架构,可以比较好的解决在缺乏统一的信用 数据源,征信数据资源分散的情况下进行有效征信的问题。 关键词:信用管理、征信系统、数据库 a b s t r a c t b ya n a l y z i n gt h ea c t u a l i t yo fc r e d i ti n v e s t i g a t i o nd a t ae n v i r o n m e n ti nc h i n a s o c i e t y t h ea u t h o rd e v e l o pt h ec o n c e p to f c r e d i ti n v e s t i g a t i o nb yd a t ac o m b i n a t i o n ,w h i c h m e a r l st h a tt h ec r e d i ts e r v i c e c o m p a n yc o l l e c t t h ed i s s e m i n a t ec r e d i ti n f o r m a t i o n w h i c hi s s e p a r a t e di nd i f f e r e n tc o m m e r c i a lb a n ka n do t h e rc o m m u n i t yo r i g i n a t i o n s , a n db u i l dav i r t u a lc r e d i td a t a b a s e t h ep r o c e s so f c o l l e c t i n ga n db u i l d i n gi sb a s e do n a u t o m a t i cs o f t w a r es y s t e m t h e a d v a n t a g eo ft h i sb u i l d i n gm o d ei s s m a l li n i t i a l i n v e s t m e n t ,s m a l lm a i n t e n a n c ec o s ta n dh i g he f f i c i e n c y t h ea u t h o rp a r t i c u l a r l y i l l u s t r a t e sa r c h i t e c t u r eo fc r e d i t i n v e s t i g a t i o ns o f t w a r es y s t e mb a s e do nm a s b y u s i n gt h i ss y s t e m ,t h ec r e d i ts e r v i c ec o m p a n y c o u l dc o n t a i ne f f e c t i v ec r e d i td a t aw i t h l o wc o s ta n dh i g he f f i c i e n c y , e s p e c i a l l yi nc o n d i t i o no fu n i v e r s a lc r e d i td a t as o u r c e s c a r c i t y k e y w o r d :c r e d i t m a n a g e m e n t ,c r e d i ti n v e s t i g a t i o ns y s t e m ,d a t a b a s e 致谢 y6 1 5 7 1 4 本研究论文得以顺利完成,首先要感谢导师方兆本教授的悉心指导。方老师 不仅在专业领域上具有丰富的学识和经验,对于所指导的学生更是竭尽所能加以 照顾,在这三年的研究生生涯中,不管在做学问的态度或是平同的待人处事,都 蒙其悉心教诲,让本人实在获益良多,在此献上诚心的敬意与谢意。 在求学期间所有同学们在学业上的切磋琢磨、相互鼓励,浓情厚谊永志不忘, 愿他们踏出校门之后,有另一番光明前程。 智识平凡的我之所以能慢慢移步而达至学问之门,实得感谢在座的诸位老 师,也正是承蒙诸位老师的指正,才能使本论文能更加臻美与完善。 论文写作过程中,要感谢受访的单位与相关人员,若没有他们的帮助,这篇 论文也无法在短期f 司内如期完成。 最重要的,是感谢我的父亲惠彦中和母亲党卫彬,他们对我的无怨无悔的关 怀和照顾,让我能够在无后顾之忧的情况下得以完成学业。没有他们默默的付出, 就不会有今天的我。 这段日子的学习,确实让我成氏不少。今后,我将更加努力,以不负诸位师 长与亲友们的关怀与期望。 最后,谨将此沦文献给我最爱的家人与朋友愿与他们共享这份荣耀。 螂耆、导师随意 鸯垒文公帝 基于m a s 的数据组合征信自动化系统设计 1 绪论 11 信用与信用管理体系 广义而言,信用( c r e d i t ) 是二元主体或多元主体之间,以某种经济生活需要 为目的,建立在诚实守信基础上的心理承诺与约期实践相结合的意志和能力,它 是从属于商品和货币关系的产物。简单的说,它是种建立在信任( t r u s t ) 基础上的 能力,不用立即付款就可获取资金、物资、服务的能力。这种能力受到一个条件 的约束,即:受益方在其应允的时间期限内为所获得的资金、物资、服务而付款 或还款。上述时间期限必须得到提供资金、物资、服务一方的认可。这种交易过 程永远存在着一定程度的风险,即信用风险。 伴随着世界经济全球化步伐和中国经济体制改革的进一步深入,信用已经成 为社会主义市场经济活动中必不可少的要素之一。市场经济体制的本质,其外在 的规制是法律体系和公平交易制度,其内在的约束机制就是信用。在西方经济发 达国家,信用与货币现金地位等同,承担了商品流通的交易媒介职能,成为国民 经济命脉中的血液。因而,从某种意义上来说,现代经济也就是信用经济,买卖、 租赁、雇佣、信托等经济关系都是以信用关系为基础的,通过科学的信用管理建 立完善的社会信用体系,已成为进一步发展市场经济的必然要求。 信用管理的基本含义是对于消费者个人的信用和企业的资信状况进行管理, 管理的内容包括征信数据的收集和处理,使之变成征信产品,然后以征信产品为 工具,从技术上保证信用交易的成功实现。 信用管理体系是一种社会机制,具体作用于一国市场经济行为的规范,它保 证一国的市场经济从原始支付手段为主流的市场交易方式向以信用交易为主流 的市场交易方式的健康转变。就功能而言,信用管理体系必须包括4 个主要组成 部分,它们分别是:征信数据的开放和信用管理行业的发展;信用管理系列立法 的建立和执法,即信用规范和失信惩罚机制的建立和完善;政府对信用交易和信 用管理行业的监督和管理,包括信用民间机构的建立;信用管理正规教育和研究 的发展。 信用管理体系 征信数据1l 立法和执法l1 监督和l 量理l 塾直塑堑蕉 资产征信和评估 企业资信调查 消费者信用调查 银行有关立法 非银行有关立法 失信惩罚机制 政府相关部门 民间机构 标准化 大学常规教育 在职培训 信用管理科研 图1 1 信用管理体系概念示意图 广义的信用管理行业包括如下的1 0 个行业分支,它们分别是:企业资信调 查( 工商征信) 、消费者个人信用调查、资产调查和评估、市场调查、信用评级、 商账追收、信用保险、国际保理、信用管理顾问、查证票据服务。 图1 2 信用管理行业分支归类 12 征信业务与征信数据库 信用关系具有下述性质:第一,时间差与不对称性。行动和兑现较之诺言和 2 约定是置后的,言与行、承诺与兑现之间存在着时间差,信任者与被信任者之间 存在着“信息不对称”。在信息经济学中,信用的需求正是来源于信息的不对称 性,而信誉就是指掌握信息的一方不欺骗对方的承诺:第二,不确定性。具备了 确定性,就不存在风险和应对风险的这一特定方式,也就不存在信任问题。第三, 缺乏足够的客观根据,信任属于主观的倾向和愿望。 因此从根本上讲,信用总是表现为信息,信用管理无非就是改善信用双方( 受 信方和授信方) 之间的信息对称度,信用管理的实质就是信息管理。因此,可靠 的信息是信用管理的首要前提。 在完善的信用管理体系中,“征信”的地位十分重要,所谓“征信”就是指 对他人的资信状况进行系统调查和评估,主要就是将有关企业信用或个人信用的 资料进行系统收集。 征信系统负责信用信息的采集、管理工作,有些还直接进行信用评估,它具 体体现在资本、商业和消费者3 个市场上的信息在法律规范下被公开( r e l e a s e l 和公正( f a i r ) 的报告。通过征信系统,可以快速取得资本市场、商业市场上任何 一家企业和消费者个人真实的资信背景调查报告。 根据工作性质和征信产品特征,狭义的信用管理行业是征信行业,其主要业 务范围可以被划分为:企业资信调查、个人资信调查、资信评级、个人信用评级、 市场调查、国家风险分析、各行业平均指数等。 根据征信行业的服务特征,关于在3 个市场上开展征信服务所需要的开放信 息如表1 1 所示。 表1 1 征信业务和信息来源 由于征信产品是一种信息产品,其产品的制造需要各种数据,而数据就是征 3 信企业的生产原料。因此,在征信系统的工作过程中,最重要的部分就是对受信 方信用信息数据的收集。资信调查需要大量真实的被调查个体有关数据,即征信 数据。征信数据库要求这些数据是连续提供的,即所谓的动态数据。以企业资信 调查为例,因为被调查的对象可能是一国范围内的任何一家企业,所以覆盖一国 工商企业以满足各种深度企业资信调查报告生产条件的企业数据集合可以成为 企业征信数据库。对于中国这样的大国而言,完整的中国企业征信数据库至少拥 有1 5 0 0 万- - 2 0 0 0 万个企业的资信档案,它包括目前尚在经营的数百万家有限 公司、数百万个体、私营企业和因各种原因已经停止营业的企业。 一般情况下,收集信用数据是一件很困难的事情,这是由于信用数据本身所 具有的特点造成的。信用数据一般具有如下特点: ; 一是内容广泛。例如,就企业信用信息而言,有金融系统掌握的交易信息, 还牵涉到企业个体的经营状况、诉讼信息、产权状况信息、税务信息、所在行业 状况信息等等。 二是高度分散。由于信用质量信息内容的广泛性客观上造成信用信息资料的 分散性,客户的相关资料散落在各个管理部门或经济单位,这一点在我国表现得 更为突出。 三是数据异构。由于信用质量数据资料高度分散在许多不同单位和部门,各 个单位之间的数据库往往是异构的。有些原始数据可能是结构化的,如关系数据 库中的数据,也可能是半结构化的,如文本、图形、图像数据、声频、时间序列 数据、空间序列数据等,甚至是分布在网络上的异构型数据。这些各种各样的数 据来源、特殊的属性、复杂的内部结构以及特殊的处理方式使得信用数据资料显 得极为复杂。 由于征信数据自身所具有的这些特点,所以在实际运营中,虽然每家资信调 查服务公司都希望拥有自己的征信数据库,但真j 下能够实施的非常少。 从成本角度考虑,一个合算的征信数据库是有标准的,即数据库中的每一个 “在案”个体的数据获取成本必须小于其被出售时获得的价格。通常情况下,这 必须通过规模效益来实现,对于一个大型企业征信数据库来说,同一家在案企业 的企业资信调查报告必须至少能够卖给3 个以上的客户才划算。目前,在世界上 拥有涵盖多国比较完整企业资信数据的数据库非常少,只有最大的信用管理服务 4 跨国公司和地区联盟才拥有覆盖面广的企业征信数据库,典型的巨型企业数据库 有邓白氏公司的“世界数据库( v v o r l d b a s e ) ”和欧盟的“欧洲大r ( e u r o g a t e ) ”。 13 典型的巨型企业征信数据库及其功能 美国邓白氏公司拥有的“世界数据库( w o r l d b a s e ) ”是世界上最大的企业信 用数据库,其基地在美国东部。“世界数据库”内有来自世界各国的近5 7 0 0 万 家企业信用档案。在世界数据库内,合格的企业资信数据必须是完整和经过若干 年连续记载的( h i s t o r i c a ld a t a ) ,而且需要后续数据,以保持数据的动态化。邓 白氏公司在全球有3 7 个数据库建设分基地,有3 0 0 0 多名员工从事“世界数据 库”的数据收集和加工。世界数据库有5 个子系统,它们分别是邓白氏世界数据 库联机服务( d & bw o r l d b a s eo n l i n e ) 、全球企业家谱和联系( g l o b a lc o r p o r a t e f a m i l yt r e ea n dl i n k a g ei n f o r m a t i o n ) 、全球数据库支持系统( g l o b a ld a t a b a s e e n h a n c e m e n ts o l u t i o n s ) 全球市场分析( g l o b a lm a r k e ta n a l y s i sp r o f i l e ) 和全球 市场方案( g l o b a lm a r k e t i n gs o l u t i o n s ) 。 邓白氏世界数据库联机服务,允许客户实时检索世界各国企业的商业信息和 信用信息,而且这种征信信息可以通过网上取得。如果客户透过e x c e l 、l o t u s 等制表软件,可以一次下载2 0 0 0 个企业的基本记录。另外,通过邓白氏世界数 据库联机服务可以从网上定购邓白氏公司出品的任何产品。全球企业家谱和联系 系统可以帮助客户了解被调查企业的完整结构,包括它在全球的投资。通过 d u n s 编码进行的公司认定,可以帮助客户了解到一个公司的“家族”关系和每 个分支的状况,包括投资状况,而且不会重复。了解一个公司的“家族”结构有 利于在交易中增加销售机会和取得同等价格的服务等好处。全球数据库支持系 统,是用于帮助客户企业的客户档案数据库( c l i e n tp o r t f o l i o ) ,它随时更新,查 出数据库中档案对应的d u n s 编码,排除重复的和子母公司配有不同编码的档 案。将数据按照相同投资人关系排出,形成被调查企业的家谱,并检查被调查企 业的信用分类,将被编错行业企业的s i c 编码纠正过来。全球市场分析服务帮 助客户划定最佳潜客户群,可以确定预算,提高效率。数据库给出的潜客户名单 中的每个个体记录称之为“完整潜客户记录( f u l lp r o s p e c tr e c o r d ) ”。 企业征信数据库的最基本功能是能够产生企业资信调查报告,换言之,企业 5 资信调查报告是征信数据库的最基本产品。企业资信调查报告不是将征信调查中 所获得的信息进行简单的罗列,而是将经过核实并进行统计处理的信息,经过在 一套符号或者检索系统的逻辑排列下,以国际流行企业资信调查报告版式编排的 报告。它还应该给出对于被调查对象的企业资信评级或者风险指数( r i s ki n d e x ) 。 附件1 给出邓白氏国际信息( 上海) 公司的一份企业资信调查报告( b u s i n e s s i n f o r m a t i o nr e p o r t ,b i r ) 样本。 1 4 企业征信系统的运营方式 目前国外发达国家对企业征信系统的运营方式主要有三种。 第一种是以中央银行建立的中央信贷登记为主体的企业征信管理体系。:中央 银行信贷登记系统登记的内容包括企业信贷信息登记和个人消费信贷信息登记。 中央银行建立中央信贷登记系统的全国数据库和网络系统,征信加工的产品主要 是供银行内部使用,服务于银行防范贷款风险和央行金融监管和货币政策决策, 这神模式以欧洲一些国家为代表。 第二种是以市场化运作的征信公司为主体的企业征信管理体系。如美国,全 国的企业、个人征信公司、追账公司等基本上是以市场化运作为主。经过1 0 0 多 年来的激烈竞争,形成了目前由美国信用管理协会、邓白氏等著名公司为主体的 美国信用管理系统,全方位向社会提供有偿商业征信服务,包括资信调查、资信 评级、资信咨询、商业信用研讨与教育、出版刊物等,这些公司的分支机构遍及 全世界许多国家和地区。 第三种是以银行业协会建立的会员制征信机构与商业性征信机构为主体的 企业征信管理体系,以日本为主要代表。在这种模式下,银行业建立的会员制征 信机构向会员银行提供企业及个人的征信服务,同时会员银行有义务如实提供客 户的信用信息。除此之外,社会上还广泛存在一些商业性征信公司,对社会提供 企业信用调查服务。 从目前世界各国征信系统的运行状况来看,以市场化方式运作,由信用管理 公司自己建立并经营企业征信数据库已经成为主流,由于这些机构需要有偿的向 客户提供规范的资信调查服务和信用评估服务,从业者必需按照市场需求有针对 性的开发征信产品,因此建立的资信数据库具有数据量大,信息齐全,能够比较 6 准确的反映被调查企业信用状况等特点。 1 5 我国企业征信行业现状 企业资信调查服务业在我国产生于2 0 世纪8 0 年代后期。当时经过近1 0 年的 改革开放,我国对外贸易取得长足发展的同时也出现了一些不容忽视的问题,即 一些外商利用我国吸引外资的迫切性,损害我国外贸企业的利益,突出表现为我 国外贸企业出现大量逾期应收账款不能收回的问题。为了规避外贸中的信用风 险,对外贸易经济合作部决定将国外的信用风险管理技术和服务引入我国,首先 由外经贸部计算中心与国外著名企业资信调查公司合作,为我国的外贸企业提供 其海外贸易伙伴的资信调查服务,这对我国外贸企业更好地了解海外企业的资信 状况,减少外贸交易中的各种信用风险起到了重要作用。自1 9 9 0 年以来,外经 贸部计算中心在与国外著名资信调查公司合作的基础上,开始向海外客户提供我 国企业的资信调查报告,我国的企业资信调查服务开始起步。 1 9 9 2 年底,我国第一家专业从事企业资信调查服务的公司北京新华信 商业风险管理有限责任公司成立,标志着我国的企业资信调查服务进入新的发展 时期,在商业征信服务领域引入了市场竞争机制,即企业资信调查服务开始由政 府驱动向市场驱动转变。此后,国内又陆续成立了一些从事企业资信调查服务的 专业性公司,形成了企业资信调查彳亍业新的竞争格局。目前,我国国内企业资信 调查专业服务公司大体有三类:一类是中资的企业资信调查公司,目前有4 0 多 家,以新华信商业风险管理有限公司、华夏国际企业信用咨询有限公司和上海中 商征信有限公司等为代表;第二类是外经贸系统、国家统计系统和国家工商管理 系统以及各商业银行系统所属的专门提供企业资信调查服务的有关机构;第三类 是已进入我国的外国征信公司,如邓白氏公司、a b c 公司、t c m 公司。以及我国 台湾地区的中华征信所、香港城市顾问有限公司等,均已在我国大陆设有分支机 构,并提供企业资信调查服务。 就目前而言,我国企业征信系统发展状况具有以下几个特点 ( 1 ) 市场化运作模式已经基本形成 我国的企业征信服务行业是在政府驱动下起步的,但是目前的企业征信市场 上,各征信公司均采取商业化运作方式,不同类型的征信公司均是按照商业化原 7 则在市场上展开竞争,向社会提供客观、独立的资信调查报告。一些行政机关下 属的征信机构,在业务运作上也基本采取了市场化的方式。我国企业征信行业市 场运作模式已经基本形成。 ( 2 ) 市场集中度逐步提高 虽然目前国内企业征信市场上有数十家征信公司并存,但是从业务数量和征 信规模来看,经过几年来的激烈竞争,企业征信市场的集中度相对较高。新华信 商业风险管理有限公司、华夏国际企业信用咨询有限公司、美国邓白氏咨询上海 有限公司、台湾省的中华征信所在大陆的分公司一中领公司等几家公司已占据了 全部市场份额的8 0 左右,其他各种类型的公司占市场份额不足2 0 。另外,部 分商业银行自身开展了对贷款企业的征信,并相应成立了自己的征信部门,也占 有征信市场的部分份额。 ( 3 ) 企业征信市场的开放度已比较高 在对企业征信服务行业机构准入管理方面,政府按照信息咨询企业的标准进 行工商注册管理,而在从业人员执业资格、执业技术准则、行业标准等方面迄今 为止没有出台任何管理规定,仅在业务归口管理方面指定由国家统计局民间和社 会调查管理处负责。而且,政府对该行业实行了比较宽的开放政策,即政府在企 业征信行业的外资机构准入方面没有任何特别的控制,只是在业务管理上,国家 统计局对外资企业征信公司进行规范,规定只有国家统计局授予涉外企业调查许 可证的公司才可以开展企业资信调查工作。 ( 4 ) 机构规模普遍较小 目前我国企业征信公司的总体规模普遍较小,几家规模比较大的征信公司, 其年营业收入也仅有1 0 0 0 万元左右,这和国际上大型征信公司年营业收入1 0 亿 美元左右的规模相比相差甚远。如邓白氏公司1 9 9 8 年实现产值2 1 亿美元。另外, 我国企业征信机构从业人员较少,最多的公司也仅有上百人,通常为几十人,有 的征信公司仅有几个人。 目前,在我国征信行业发展格局中,信用数据缺乏完整性已成为企业征信行 业发展的瓶颈。 从国外征信行业发展的经验来看,一个国家征信行业能否健康迅速发展,关 键在于该国有关资信方面的信息和大多数数据能否比较“透明”,能否通过合法 8 的、公开而有效的渠道被合法的征信公司所取得。这些信息和数据的来源包括政 府、企业、金融机构、法律机构、公用事业单位以及个人,等等。在一国范围内, 征信公司能够快速、真实、完整、连续、合法、公开地获得用于完成企业资信调 查报告和个人资信调查报告的数据,是保障该国征信行业健康发展的基础。 根据我国现行的政府管理体制,符合国际惯例的完整的企业资信调查报告的 信息和数据主要来自于工商、海关、法院、技术监督、财政、税务、外经贸、银 行等政府和业务部门,当然还有相当部分信息和数据直接来自于企业。在现行 的数据管理体制下,目前各征信公司主要通过以下三种渠道获得企业信用数据: 一是通过新闻媒体等公开的渠道获得;二是通过到被调查企业调查直接获取;三 是通过政府部门和有关机构获得。而通过政府渠道获得信用数据又有以下几种情 况:向正式开放企业信用数据的政府部门获得;各征信公司通过和相关政府部门 建立信息共享机制,向合作部门获得相关数据:通过私人关系从政府部门获得。 总体上来说,我国企业资信数据基本上分散于各个社会机构和政府部门,缺 乏统一规划,处于相对分散的状态,这对我国企业征信行业造成了很大影响,突 出表现在以下几方面: ( 1 ) 企业信用数据收集困难,导致企业资信调查报告难以真实、准确、完整 地描述被调查企业的资信情况,企业征信难以发挥其应有的功能。 ( 2 ) 数据收集成本较高,征信公司步履维艰。由于我国目前缺乏统一的信用 信息数据源,征信数据资源分散,收集和协调征信数据的技术手段落,信用数据 交换缺乏相应标准( 如征信报告格式标准、数据库建立标准等) ,这造成了数据 收集成本过高,征信公司盈利微薄,制约了征信市场的发展。 从征信行业健康、长远发展的角度来看,由专业的资信调查公司、信用评估 机构建立全面的企业征信数据库是保证信用管理系统能够科学、有效贯彻的必需 条件,这些机构由于需要有偿的向客户提供规范的资信调查服务和信用评估服 务,从业者必需按照市场需求有针对性的开发征信产品,因此建立的资信数据库 具有数据量大,信息齐全,能够比较准确的反映被调查企业信用状况等特点。但 从另一方面讲,市场化运作的征信数据库,必须能够在其经营过程中保证其运行 成本低于其有偿服务产生的收入,而此类有偿服务收取费用又不可能太高,特别 在我国当前条件下,社会对信用产品的需求不大,信用服务市场规模有限,以上 9 海市实施的个人信用联合征信系统为例,该系统采集了2 4 0 万上海市民的个人信 用信息,几乎覆盖了上海市有信用消费能力人群的1 2 ,并在上海市范围内建立 了3 0 0 多个查询网点,但至t j 2 0 0 1 年底,系统累计接受查询1 4 万余次,平均每天查 询约8 0 0 次,平均每个网点每日查询量不超过3 次,这样的市场需求状况很难支 持在巨额投资下的商业运作。信用市场的需求规模有限,在实际上造成了我国在 征信系统的运营方面,将面临比信用发达国家更大的困难。 因此,如何利用先进的技术、方法和手段,努力解决我国由于我国目前缺乏 统一的信用数据源,征信数据资源分散问题,保证征信系统能够以低成本方式高 效运行,设计出符合当前中国国情的,科学、全面的企业征信系统架构,是我们 在征信系统建设过程中必须认真考虑的问题。; 本文将我国征信数据环境现状,就保证企业征信系统运行技术架构进行相应 探讨,并给相应的系统结构和设计建议,供我国信用管理相关企业和机构之借鉴。 2 基于数据组合的自动化企业征信数据库构思 2 1 广义的企业征信数据库 企业资信调查需要大量真实的有关被调查企业的有关数据,即企业征信数 据。征信数据库要求这些数据是连续提供的,即所谓的动态数据。因为被调查的 对象可能是一国范围内的任何一家企业,所以覆盖一国工商业且满足各种深度的 企业资信调查报告产生条件的企业数据集合可以被称为企业征信数据库。对于 中国这样的大国而言,完整的中国企业征信数据库将至少有1 5 0 0 - - 2 0 0 0 万个企 业的资信档案,它包括全部尚在经营的数百万家有限公司,数百万个体,私营企 业和因种种原因已经停止经营的企业。在中国,对任何征信公司而言,建立这样 庞大的企业征信数据库,都是非常艰巨的一项任务。在经济全球化的今天,从客 户需求看,仅涵盖一国全部企业资信数据的征信数据库已经是不够了,从实践角 度看,信用管理公司只要能够被允许合法的获得向全社会开发的征信数据源的 使用权,就等效于拥有一个完全的企业资信数据库,这是一个无形的企业征信数 据库。当今计算机技术,网络技术和通讯技术的飞速发展,为专业信用管理公司 快速组合任何征信数据提供了技术上的可能性,由此形成了广义的企业征信数据 库的概念。 1 0 而以我国社会信息系统发展的现状看,经过近1 0 年飞速发展,各个行业、部 门、政府机构基本都已建立了与自身业务相关的信息系统,这些信息系统中存储 了大量与企业信用相关的信息。仅从企业信用信息的存在角度看,目前,与企业 信用相关数据总存在于这样或者那样的社会信息系统中,征信数据基本没有缺 项,伴随政策环境的逐渐改善,这些信息系统的数据开放性也有了长足的提高。 对于特定的单项数据而言,总是可以从某个社会信息系统中比较方便的获取。 因此,从信息存在性的角度看,我国已经基本形成了广义企业征信数据库 的数据环境。 但是,国内企业与信用相关的信息较为分散,主要集中在工商、银行、税务、 外贸、海关、公安、法院等各个部门。一方面,政府部门和一些专业机构掌握着 企业资讯,其中,大部分得不到有效利用;另一方面,信用状况和各类市场主体 不易查询,增加了征信和获取企业信息的难度。 可以说,缺乏统一规划,征信数据资源分散,收集和协调征信数据的技术手 段落,信用数据交换缺乏相应标准,已经成为阻碍我国信用系统建设的一个瓶颈。 2 2 我国建设企业征信数据库模式探讨 要在征信数据资源分散,利用效率不高的客观条件下建设企业征信数据库, 有两种模式,种是国家信用数据库建设模式,即由中央政府出资建设覆盖全国 范围内的企业征信数据库,另外一种是信用管理企业自建自营征信数据库,并通 过数据库兼并方式扩大某些数据库容量,最终在一国范围内形成少数巨大型的主 流征信数据库。 一般而言,在没有建立国家公共数据库,或者没有强制要求各个数据源贡献 电子形态数据制度的国家,其中央政府不会去专门建立一个相对完整的征信数据 库,特别在目前客观条件下,如果从零开始建立国家范围内的统一征信数据库, 需要巨大的投资,建设风险和工程周期都非常大,并且这样的做法对于已经在各 个地区、行业建立的局部征信数据库而言,也是一种浪费,因此,从实施的角度 看,建设国家征信数据库的方式并不适合我国当前实际。 在世界各国征信市场上,由信用管理公司自己建立并经营企业资信数据库是 市场上主流方向,各个征信国家均经历过由征信企业投资建立各种征信数据库, 1 1 然后通过数据库兼并方式扩大某些数据库容量,最终在一国范围内形成少数巨大 型的主流征信数据库的路径。 由征信行业的业者自己投资建立各种征信数据库的方式是纯市场方式,采取 这种方式有诸多有点,一是从业者懂得市场需求,能够按照市场规律发展征信数 据库和有针对性的开发产品,另夕 ,在一国范围内开发信用管理企业自营自建征 信数据库有助于自然形成征信市场竞争机制,在信用管理业者之间优胜劣汰,非 常有利于征信产品和服务的本地化。 采用自营自建征信数据库的建设模式也有一定的不足,主要缺点是在起步阶 段总体投资规模会比较小,因此,数据库建设规模会受到维护和运行费用的限制, 从而使得征信产品质量相对偏低。: 因此,要取得经营的成功,信用管理公司必须在建立自己的征信数据库的基 础上,同时具有征信数据的快速组合能力,征信数据库的容量不求最大,而求最 佳设计,重点在于收录有效的企业资信调查档案。 协调数据并支持任何一个大型征信数据库的建设和维护都需要巨大的投资。 因此,在数据源稳定可靠且通讯技术发达的条件下,也可以不建设任何巨大的征 信数据库,只要征信公司能够快速将方方面面的数据快速组合在一起,其组合速 度在国际信用管理行业的有关服务的客户合同期平均值以内,这种高效的组合方 式就等效与一个无形的征信数据库。这种方法很类似于生产管理中的“零库存管 理”方法,在此模式下建设的企业征信系统可以被称为数据组合征信系统。 数据组合征信是指征信机构通过自动化软件系统,将分散在商业银行和各个 社会机构的信用信息汇集和组合起来,形成虚拟的企业信用数据库,在此基础上 对其进行评估,为社会各有关方面了解企业信用状况提供服务。其系统建设优点 是启动和维护资金非常小,效率比较高,成功的实现这种构建方式的关键在具备 开发的和足够用的数据源和快速组合征信数据的能力。 2 3 以数据组合方式建设征信数据库设计目标 对于我国当前信用环境而言,信用数据的分布非常分散,征信系统收集和协 调征信数据的技术手段相对比较落后,信用数据资源缺乏统一规划已成为征信行 业发展的瓶颈。我国征信数据资源具有以下几个特点: 1 2 一是内容广泛。例如,就企业信用信息而言,有金融系统掌握的交易信息, 还牵涉到企业个体的经营状况、诉讼信息、产权状况信息、税务信息、所在行业 状况信息等等。 二是高度分散。由于信用质量信息内容的广泛性客观上造成信用信息资料的 分散性,客户的相关资料散落在各个管理部门或经济单位,这一点在我国表现得 更为突出。 三是数据异构。由于信用质量数据资料高度分散在许多不同单位和部门,各 个单位之间的数据库往往是异构的。有些原始数据可能是结构化的,如关系数据 库中的数据,也可能是半结构化的,如文本、图形、图像数据、声频、时间序列 数据、空间序列数据等,甚至是分布在网络上的异构型数据。这些各种各样的数 据来源、特殊的属性、复杂的内部结构以及特殊的处理方式使得信用数据资料显 得极为复杂。 与企业信用相关的各种类型信息主要分布和来源如下图所示。 图2 1 我国企业信用信息来源分布 根据我国现行的政府管理体制,符合国际惯例的完整的企业信用信息和数据 主要来自子工商、海关、法院、技术监督、财政、税务、外经贸、银行等政府和 业务部门,当然还有相当一部分信息和数据直接来自于企业。在这样的现实条件 下以联合征信方式构建综合征信系统,主要面临以下两方面的技术难度。 1 3 首先是如何在物理位置分布分散、数据格式多种多样的情况下全面获取信用 信息。在信用信息获取过程中,需要大量来自会融、财务、生产、管理等各个不 同领域问信息,这些数据势必来源于分散于不同物理位置的不同系统中,数据格 式、存储方式和检索方式肯定是无法统一的,从数据类型上来看,有些原始数据 可能是结构化的,如关系数据库中的数据,也可能是半结构化的,如文本、图形、 图像数据、声频、时间序列数据、空间序列数据等,甚至是分布在网络上的异构 型数据。这些信息的来源、格式、获取方式都不尽相同,使得在一个统一的平台 下协同的存取不同格式信息,并能够正确的抽取信息中与信用相关的要素,对于 有效的资信调查是至关重要的。 其次是如何以低成本方式保证征信系统的正常运作。征信系统作为社会信用 体系的基础设施,其服务收取费用不可能太高,而我国缺乏信用信息开放的相关 法规和制度,也缺乏相应的社会信息中心数据源,如工商注册数据库、工商年检 数据库、工业企业普查数据库、法院诉讼数据库、银行的企业还款记录数据库、 企业产品质量投诉数据库等。信用数据的获取,一般只能通过与数量众多的企业 和政府机构个体合作和共享完成,在小规模数据共享的前提下,如何降低数据收 集的成本,也是关系到征信系统能够健康、持续运行与发展的重要问题之一。 而对于征信数据产生的最终产品资信调查报告而言,其作为征信产品,还须 应具备: ( 1 ) 对信用对象的反映在区间上必须是全面的,涵盖信用对象在各个地域、 各个行业中的活动记录。 ( 2 ) 对信用对象的反映在时问上必须连续,直到形成信用产品为止的较长一 段时间内对信用对象的反映必须是持续连贯的,有些内容还必须追溯到更远。 ( 3 ) 对信用对象的反映在内容上必须是真实准确的,包括对信用对象的现 状、优缺点、发展变化前景的真实反映,不仅仅包括信用对象好的方面,还必须 如实反映信用对象的缺陷和不良记录。 ( 4 ) 渗透性要求。信用产品不仅仅要反映信用对象的信用状况,还必须包括 对信用对象的信用能力、信用行为可能产生影响的相关人和事的信用记录。 综上所述,征信数据自身特点和信用产品的特点,决定了数据快速组合方式 征信数据库的设计目标如下: 1 4 f 1 ) 保证征信数据完整性。 在信用管理的过程中,对一个用户信用分析需要考察财务、金融、管理水平、 行业趋势以至于国家风险等定性、定量的各方面的信息,涉及的面相当广。其中, 定量信息主要是财务信息,一般基于公司财务报告,其中包括偿债能力、营运能 力、盈利能力等与企业个体相关的内部数据:定性信息主要包括公司的管理质量, 及其在行业内的竞争力和行业的状态,以及行业的技术变化、制度变化等。 一般而言,在对受信方进行信用风险评估的指标体系中,一类指标由受信方 的基本信息所构成,这些基本信息是对受信方信用特征的描述,如行业、会计指 标、资本、规模等所组成的信用特征。如果有某些极其重要的信用特征没有征集 到征信数据库中,那么在这样的数据库的基础上生成的模型就不够显著。另一类 指标是说明受信方信用状况好坏的标识变量,只有完整地分析了受信方所有的信 用相关记录之后,才能判断受信方信用状况的好坏。这类指标对信息的完整性 提出了更高的要求。只有分析了受信方所有的信用或信用相关交易和企业的经营 记录之后,才能在一定程度上判断企业的信用状况是好是坏。如果一个企业按时 按量的偿还银行的信用贷款,同时征信数据库中只收录了企业与银行的业务往来 情况,则会判断该企业的信用状况良好。但是如果该企业一直拖欠了大笔应付账 款不予支付,或者是做假帐、偷税漏税,而且这部分信息没有得到征集,那么将 会把一个信用状况坏的企业判断为好的企业。采用这样的数据建立的模型在实用 中会造成巨大的损失。因此,在建立征信数据库时应该尽可能全的包括企业各个 方面的信息。 ( 2 ) 保证征信数据的质量 在征信过程中,征信系统获取的数据有可能是不准确的,甚至可能是错误数 据,这主要体现在数据的真实性、逻辑性、健全三方面。由于现存于工商、银行、 税务等部门的信息是彼此不能相互沟通的,这些信息的抽样的时间不一致,抽样 的时间间隔也不尽相同,因此在数据共享时要注意检查数据的逻辑性,既要保证 进入征信系统的数据是最新最全的数据,也不能丢弃过时的数据,还要注意抽样 的时间间隔,尽可能的把散布于各个数据库的数据统一。另一方面,即使是在同 一时阃抽样得到数据也可能不一致,比如说银行和工商都保存着某企业在同一时 期的总经理的个人信息,而这两个部门的记录却不致。这就对数据的逻辑性提 1 5 出了另一要求,即在数据共享的时候要注意各个数据库之间的交互验证,舍弃错 误的数据。 ( 3 ) 保证征信数据的存储规模 在联合征信系统的工作过程中,数据量是必须要考虑的问题。以每个企业每 月发生2 5 笔信用交易,每笔交易需要用2 0 0 个汉字描述,这样一个企业一年的 信息量是1 2 x 1 05 b y t e 。邓自氏的世界数据库包含7 千万个企业资信档案,这样 每年仅信用交易记录一项就将有8 ,4 0 0 g b y t e 的数据,需要1 万两千张容量为 7 0 0 m 的光盘爿能装下这些数据。因此征信数据库将面临一个信息爆炸的问题, 这些数据的存储、整理、检索、更新都需要考虑海量的数据。而且这些数字仅是 信用交易记录一项。如果要考虑新企业的诞生,旧企业的消亡,企业股东的变换 等一些需要在数据库中及时更新的信息,信息量将会更大。 ( 4 ) 多类型异构信息的存储与转化 在信用信息获取过程中,需要大量来自金融、财务、生产、管理等各个不同 领域间信息,这些数据势必来源于分散于不同物理位置的不同系统中,数据格式、 存储方式和检索方式肯定是无法统一的,而在实际应用中,甚至是相同类型数据, 由于来源系统不同,其格式也是不同的。例如,对于不同开发商开发的财务系统, 其交易记录和财务数据的存储和交换格式都是不同的。从数据类型上来看,有些 原始数据可能是结构化的,如关系数据库中的数据,也可能是半结构化的,如文 本、图形、图像数据、声频、时间序列数据、空间序列数据等,甚至是分布在网 络上的异构型数据。这些信息的来源、格式、获取方式都不尽相同,使得在一个 统一的平台下协同的存取不同格式信息,并能够正确的抽取信息中与信用相关的 要素,对于有效的信用分析也是至关重要的。 ( 5 ) 动态交易数据的收集和存储 信用风险分析方法主要分为两类,一类可以被称为指标方法,这类方法的特 点是通过研究企业中与信用相关的某些特征指标( 如资产结构) ,从而根据这些 指标表现出的特点给企业作出信用状况的评估,第二类可以被成为结构化方法, 它的主要思想是假设企业的信用好坏是一个动态的连续过程,通过对历史数据和 市场数据( 主要是资本市场数据) 的研究,可以模拟出这个过程,并确定特定企 业在这个过程中当前所处的位置,从而确定出企业当前信用状况的好坏。 1 6 从对各类信用i x l 险评估方法的实证分析中,我们可以了解到,无论采取哪种 分析方法,信用风险部是强交易相关的,并且它会随着外部经济环境和内部经营 环境的变化而变化。因此,信用风险分析必须基于连续,充分的交易数据。 以企业信用分析为例,在不同的时期,企业的信用特征和破产特征不尽相同。 一方面,征信数据库中应当征集最新的信用信息,也只有在最新的信用信息的基 础上开发的模型才能代表当前企业的信用特征。这对数据的征集提出了及时性的 要求。但是对于一个上市公司来说,每半年公布一次财务报表,而且中报不必审 核,这样的数据进入模型后只能得到该公司半年前的信用状况,而不是当前的信 用状况。如果在这半年内企业的信用状况发生质的改变,那么将会给基于企业信 用级别的授信造成损失。而对于非上市公司来说,信息的征集更为困难。更难以 保证企业信息的及时性。因此,需要建立一个动态的信息征集系统,企业的每笔 信用或是信用相关的交易在一发生的时候,就被系统所征集。 另方面,企业过去的信息或是已经消亡的企业的信息也应该得到充分的重 视,只有从时间轴的纵切面方向综合研究很多企业的整个生灭过程,才能找到企 业生灭的一般规律,才能发现企业在何种情况下将会面临着信用危机。这样才能 够考察企业信用状况迁移的过程,为后面的授信机构的经营战略提供指南。 因此,一方面需要保证采用最新的数据建立模型,采用企业最新的数据进入 模型考察企业的信用状况;另一方面,需要保存企业过去的信息或是已经消亡的 企业的信息,这对数据库的存储能力提出了较高要求。 ( 5 ) 异构数据的无缝集成能力 作为征信系统进行处理后的最终产品,系统输出信用数据集必须能够全面并 且有线索的反映被调查个体的信用特征,而征信系统从各个独立信用数据源间收 集的信用数据必然是相互独立的。并且在数据结构、数据类型上也各不相同。以 企业信用数据为例,与企业信用相关的信息及包括表明企业状态的静态数据,如 股份结构、经营规模等,也包括与经营状况相关的动态数据和历史数据,如付款 记录、交易记录等,还包括相关的统计信息和计算数据,如财务比率等,从物理 结构上来看,这些数据既包括从常规关系数据库中获得的结构数据,也包括财务 报告等半结构化数据和非结构数据,而从逻辑结构上来看,这些数据既有以时间 为线索的记录型数据,也有以交易关系为线索的网状数据,还包括相对独立的孤 1 7 立数据,如资产规模等。在获取上述数据的基础上,如何组织这些数据间相互关 系并且将这种关系以一种有线索的结构统一表达和检索,提供统一的接口供信用 分析应用程序应用,也是系统设计过程中必须考虑的问题。 2 4 数据组合征信数据库系统结构 数据组合征信数据库系统是以数据自动收集和快速组合为基础的数据加工 分析系统,基于上述征信数据库系统的实施目标,作者提出了基于多a g e n t 采 集和主题式存储的数据快速组合征信数据库系统基本设计思路如下。 从系统结构上来说,系统整体从逻辑应用功能上被分为3 个相对独立的子系 统,即信用采集系统,信用数据中心和信用信息查询系统。 信用采集系统负责原始信用数据的采集、集成、筛选和融合,采集过程中, 采集系统既负责采集结构化数据,也采集非结构化数据,在数据采集过程中,由 于分散在各个数据源的数据格式各不相同,并且数据格式、流量的变化也是不可 预测的,因此需要采集系统具有对各种数据灵活处理的智能能力,并且在数据采 集过程中,会有大量的原始数据需要通过网络来传送给中心数据存贮,并且可能 要多次传送,在保证对各种数据类型的灵活、协同处理的基础上,如何保证海量 数据采集工作的稳定性和处理能力,是需要仔细考量的。 在信用数据的采集过程中,还需要考虑的一个问题就是数据的主动同步能 力,当原始信用数据发生变化时,采集系统能够主动发现变化并进行同步更新, 而不是传统的定期轮询机制,以减少采集系统和原始数据源之间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论