房产档案数字化清理整合方案.doc_第1页
房产档案数字化清理整合方案.doc_第2页
房产档案数字化清理整合方案.doc_第3页
房产档案数字化清理整合方案.doc_第4页
房产档案数字化清理整合方案.doc_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

房产档案数字化清理方案目 录1 需求11.1 政策需求11.2 现实需求21.2.1 贵单位档案现状21.2.2 档案现存问题21.3 项目实施效益32 分析42.1 我们对数据清理的理解42.1.1 数据清理的定义42.1.2 数据清理的实现方式62.1.3 数据清理与档案数字化加工的区别72.1.4 技术路线82.2 数据清理重点和难点92.2.1 数据清理重点92.2.2 数据清理难点102.3 数据清理关键技术应用112.3.1 人工智能112.3.2 语义分析132.3.3 档案分形133 总体设计173.1 总体架构183.2 技术特点213.3 性能指标214 技术方案224.1 档案数字化加工224.1.1 档案整理224.1.2 档案扫描234.1.3 数据录入244.2 建立逻辑幢394.2.1 数据移植404.2.2 分词处理414.2.3 分形处理444.2.4 分形后处理464.3 建立自然幢及房屋落地504.3.1 分幅编幢514.3.2 外业调查554.3.3 自然幢录入664.3.4 关联落地734.4 成果利用784.4.1 质量检查784.4.2 生成登记簿784.4.3 数据利用785 项目实施方案795.1 项目实施计划795.2 项目管理计划815.3 项目成果移交825.4 项目管理825.4.1 项目整合管理825.4.2 项目范围管理835.4.3 项目时间管理835.4.4 项目进度控制计划845.4.5 项目成本管理855.4.6 项目质量管理855.4.7 质量控制的难点及重点865.4.8 项目小组人员配备875.4.9 项目设备的组织885.4.10 项目安全管理90901 需求1.1 政策需求随着我国城镇住房制度改革的深化、住房建设步伐的加快和住房消费的有效启动,我国房地产行业得到了飞速发展,在国民经济建设中发挥着巨大的带动作用,并已成为了我国的重要支柱行业。房屋权属登记档案是房地产行政管理部门在房产登记、调查、测绘、产权转移、房屋变更等房产权属管理工作中直接形成的,有保存价值的文字、图表等不同形式的历史记录,是房屋权属登记管理工作的真实记载和重要依据。记载房屋物权归属和内容的权属档案,具有法律效力,是房地产管理部门和人民法院确认房屋产权、处理房屋纠纷的重要依据。2007年10月1日,对房地产权属登记行为、登记信息系统都影响深远的中华人民共和国物权法(后简称物权法)正式执行,其中,第十八条规定权利人、利害关系人可以申请查询、复制登记资料,登记机构应当提供。2008年,为了贯彻落实物权法,规范房屋登记行为,建设部下发了房屋登记办法(建设部令第168号),指出“县级以上人民政府建设(房地产)主管部门应当加强房屋登记信息系统建设,逐步实现全国房屋登记簿信息共享和异地查询。” 为房屋权籍档案的利用提出了新的要求。为抑制过快上涨的房价,国务院再出房地产调控重拳,2009年12月14日,温家宝总理主持召开国务院常务会议上,就促进房地产市场健康发展提出增加供给、抑制投机、加强监管、推进保障房建设等四大举措,简称“国四条”。2010年4月17日,国务院关于坚决遏制部分城市房价过快上涨的通知(国发201010号,简称“新国十条”)出台。在重申加强房地产市场监管、维护正常房地产市场秩序等要求的同时,首次提出了要根据购房人家庭当前拥有房屋套数,执行差别化的信贷政策要求,并在通知中提出“加快个人住房信息系统的建设”。2010年6月24日,在“加快推进全国个人住房信息系统建设”会议上,齐骥副部长发表的讲话中提出“要充分认识加快个人住房信息系统建设的重要性和紧迫性,并且要理清工作思路,明确工作目标和任务,狠抓落实,扎实推进个人住房信息系统的建设。”个人住房信息系统建设的数据基础就是各城市通过数字化清理形成的业务历史数据库,因此,进行房产档案数字化清理也是建设个人住房信息系统的需要。1.2 现实需求1.2.1 贵单位档案现状目前贵单位现存纸质档案万卷,约万宗。其中万宗档案进行了扫描;档案数据存储在系统中,约万。1.2.2 档案现存问题 档案系统信息不完整由于在当时办理业务时,没有严谨的录入规范,导致档案系统中很多信息没有录入,致使信息并不完整。 档案系统记载与实际不符在档案系统中,存在有些信息与纸质档案信息不一样的情况。 档案系统数据录入不规范同样由于业务办理时没有统一严格的录入规范,致使档案系统中的数据相当的不规范。 档案系统数据前后不一致在档案系统中,同样存在数据前后不一致的情况,如同样一套房子,前一手和后一手在办理业务时录入的信息不完全一致。 档案本身记载信息有误上面介绍的都是档案系统信息的缺失、不完整、不一致等问题。其实除了档案信息系统的问题以外,档案本身也存在着很多问题。由于档案是业务办理的结果,每个时期业务办理的规则也不尽相同。而且早时期都采用的手工办案方式,因此难免会产生一些错误。如此种种,在手工办案时代,由于房产权属业务的复杂性,导致档案本身发生错误的情况屡见不鲜。1.3 项目实施效益 有利于贯彻落实“个人住房信息系统”的建立; 有利于个人所得税、房产税的征收; 有利于解决历史遗留问题掌握现实状况; 有利于贯彻房屋登记办法和建立房屋登记簿; 有利于贯彻宏观调控政策; 有利于提高工作效率; 有利于降低登记风险; 有利于加强规范化管理; 有利于协助房屋普查工作; 有利于方便群众、服务社会; 有利于与金融部门协同工作。2 分析2.1 我们对数据清理的理解2.1.1 数据清理的定义随着计算机技术的飞速发展和信息技术的深入应用,信息量急剧膨胀,用户积累了大量的电子数据,这些数据记录了用户的工作成果,非常珍贵。由于录入错误、部门合并以及业务规则随着时间的推移而改变等因素,都会影响数据的质量。根据“垃圾进,垃圾出”的原理,为了支持正确的分析决策,就要求原始数据完整准确。数据清理就是为了解决数据质量问题而提出的。数据清理在不同应用领域的要求不完全相同,很难有一致的定义,但总的来说,数据清理的目的是检测数据中存在的错误和不一致,剔除或者改正它们,以提高数据的质量。在通常的信息系统开发项目中,数据质量往往只被理解为控制错误数据的输入,即在数据输入程序程序中加入检查和防范机制,保证进入系统的输入都是合法的数据值。但数据质量的真正含义远不止此。从语义角度而言,数据是事实及意义的结合体,数据质量可以通过正确性、准确性、不矛盾性、一致性、完整性、集成性等几个元素来描述。按照广义的数据质量定义,高质量的数据就是指那些适合于用户使用的数据。常见有质量问题的数据主要包括不完整数据、错误数据和重复数据三类。不完整数据的特征是一些应有的信息缺失,如产权人身份证号空缺等。错误数据产生的原因是业务系统不够健全,在接收输入后没有进行判断而直接写入后台数据库。错误值包括输入错误和错误数据,输入错误是由原始数据录入人员疏忽而造成的,而错误数据大多是由一些客观原因引起的,例如业务类型定义不规范等。异常数据是指所有记录中如果一个或几个字段间绝大部分遵循某种模式,其它不遵循该模式的记录,如身份证字段输入信息位数不足或超出规定的长度等。重复数据也就是“相似重复记录”,指同一个现实实体在数据库集合中用多条不完全相同的记录来表示,由于它们在格式、拼写上的差异,导致数据库系统不能正确识别。从狭义的角度看,如果两条记录在某些字段的值相等或足够相似,则认为这两条记录互为相似重复。数据质量的问题并不会突然之间显现出来,很多是历史遗留问题,加上一些主观或客观因素所造成的,诸如系统平台的不一致,缺乏规范的操作流程和标准,数据处理人员水平的差异,组织缺乏数据质量监督管理措施等。基于以上概念我们可以给出广义的数据清理的定义:利用相关信息技术如数理统计、人工智能、数据分形等预定义清理规则,对数据源进行处理,补充完整缺失数据,规范不一致数据,清除错误数据和重复数据,从而提高数据的质量。具体到房产档案数据清理,包括档案数字化、输入、处理和输出三部分。档案数字化:房屋登记和交易的纸质档案通过整理、扫描、录入的方式,生成电子图片、非结构化数据,并为后续清理工作提供基础数据。输入:把档案数字化生成的数据移植到中间库;处理:1、在中间库,采用智能算法(分词、分形等)生成楼盘表和基于楼盘表的案例上下手关系、权利人和物权(所有权、抵押权、用益权和限制权);2、采用地理信息技术(GIS)对照档案数据到现场进行实地勘察,实现楼栋落地。输出:把楼盘表、楼盘表和宗地的关系导出到业务库和档案库。2.1.2 数据清理的实现方式数据清理的实现方式通常有以下几种: 手工实现通过人工检查,理论上只要投入足够的人力、物力、财力和时间,也能发现所有错误,但效率低下。尤其在大数据量的情况下,几乎是不可能的。 定制开发专用的数据清理软件目前,国内外针对数据清理已提出了一些有效的清理算法,或根据某种算法针对特定应用领域开发出一些专门的清理软件。但是,由于数据清理的复杂性,对不同的数据源,要求数据清理适应不同的数据类型、数据数量及具体业务。这种方法能解决某个特定的问题,但不够灵活,特别是清理过程需要反复进行多次(一般来说,数据清理一遍就达到要求的很少),导致程序复杂。清理过程变化时,工作量大,而且这种方法也没有充分利用目前数据库提供的强大数据处理能力。 基于开放式框架的数据清理平台如何把数据质量问题与用户业务领域知识结合起来,设计一个能够把数据清理与特定业务领域知识结合起来的模型框架已势在必行,人工智能的发展则给这个领域带来了新的生机。必特思维基于长达二十年的房地产管理信息系统开发经验和取自数百家用户的房地产管理专业知识,集合人工智能、语义分析、档案分形等国际最前沿的IT技术,创新性的开发出了国内第一个专门针对房地产管理领域的开放式的数据清理平台。该平台利用专家系统的外壳,便于规则的表示和利用,规则库和算法库是其核心。在对数据源进行数据处理之前,通过预定义清理规则和选择合适的算法,使平台具有较强的通用性和适应性。在数据清理过程中,由于很多错误不可预料,不可能所有错误都被自动清理,人工交互是必要的。当数据清理过程中出现异常错误时,系统会给出相应的警告信息,提示用户手工处理。另外,基于开放式框架的数据清理平台还具有开放的规则库和算法库,可不断扩充新的数据清理算法,并可根据具体业务定义所需的清理规则,能够大大提高数据清理的工作效率。2.1.3 数据清理与档案数字化加工的区别综上所述,数据清理是一项复杂的系统工程,它的专业性和技术性要求不言而喻,然而在实际工作中并没有得到足够的重视。有些人认为数据清理是一个需要大量劳动力的过程,往往容易将它与档案数字化加工这一劳动密集型工作混淆起来,而忽视了其中所蕴含的技术含量。其实不然,档案数字化加工的主要目的是通过扫描、录入等方式将用户的纸质档案转化为电子影像档案,方便查询。虽然在这一过程中也会借助于一些简单的软件工具来进行数据输入输出处理,但数据质量基本上还是靠人工检查而不是依托严密的逻辑校验算法。与之相反,数据清理的原则则是最大限度的发挥计算机的数据处理能力,减少人工的工作量。简单地说,档案数字化加工是人工为主,软件为辅;数据清理则是软件为主,人工为辅。因此,数据清理与档案数字化加工在形式上虽有相似之处,但其本质上是完全不同的。2.1.4 技术路线具体工作分为三大部分,分别是:档案数字化加工,建立逻辑幢,建立自然幢及房屋落地。 档案数字化包括档案整理和档案扫描和档案录入三个部分,将对登记和交易的纸质档案拆分后进行扫描,形成电子图片。再按照数据清理要求和数据录入规范,对纸质档案数据进行录入。 建立逻辑幢建立逻辑幢包括以下内容:(1)数据移植将录入的档案数据移植到数据清理数据库。(2)房屋组栋通过分词、分形等软件智能算法,自动建立逻辑幢。(3)登记关系清理以组建的逻辑幢楼盘表为基础,对存在于数据库的登记数据按照登记的前后手顺序进行清理,建立起房屋与登记业务之间的唯一对应关系。 建立自然幢及房屋落地建立自然幢及房屋落地工作包含以下内容:(1)建立自然幢通过开展外业调查,组建自然幢楼盘表。(2)房屋落地将组建的自然幢楼盘表与地籍图上的建筑物图元进行关联。2.2 数据清理重点和难点2.2.1 数据清理重点 数据的完整性此次数据清理形成的房产基础数据,是业务系统运行的基础。数据录入的完整性、准确性直接影响到数据清理的成败和业务系统运行的效果。尤其房屋信息、土地信息、权利人基本信息等,它们是房屋登记薄生成的基本要求,因此,必须尽可能地全面采集这些信息,才能确保数据清理达到预期的目的。数据清理将完善和统一基础数据,使基础数据更加真实和准确,为下一步新业务系统顺利实施奠定基础。因此本项目的重点之一是数据的完整性。 数据的规范化按照数据大集中、应用大集中的设计思想,房产数据信息系统所有数据要统一规划、统一标准。在本项目实施过程中需要通过一定的技术手段将现有系统中不规范、不统一的数据,按事先制定的房产数据标准进行规范。因此,本项目的重点之二是数据的规范化。 数据的安全性房产档案数据安全的重要性,如何强调都不为过。数据安全关系到业务活动正常开展,关系权利人的切身利益、关系到社会的稳定,在数据清理过程中数据的安全性必须得到保证。因此,本项目的重点之三就是保证数据的安全性。2.2.2 数据清理难点 项目的质量保障保证数据质量是数据清理工作开展的前提,对于海量的档案数据,上千万个的字段记录,以及大量的图片,案例与案例,案例与房,房和楼,楼和楼的关系的质检,必须依托于计算机的逻辑检验并辅以人工的重点检查。 如何利用技术手段和管理机制保证数据清理的质量是本项目首先要解决的难点。 项目的进度控制数据清理项目工作量大,要想在合理的时间内完成,必须最大限度的发挥计算机的数据处理优势,尽量减少人工处理的工作内容,这也是本项目需要解决的一个难点。 项目管理与协调数据清理涉及用户的多个业务部门,涉及面广,参与人员众多,尤其还涉及到外业测绘调查,需要大量协调和配合工作,任何一个环节协调不好配合不积极都会影响项目的整体推进,影响数据清理的质量和进度。因此本项目的难点之一是加强各相关单位人员的管理和协调。 清理工具的开发对于海量数据的清理,要求实施单位能够提供性能先进的清理软件工具,清理工具的开发除了要有扎实的房地产管理专业知识和成熟的智能算法外,还要对用户现有的业务系统非常的熟悉和了解,才能有针对性的研发出合适的清理工具,实现数据的顺利移植和输出。此外,还需具有测绘能力,而想达到这一点,绝大部分公司是难以做到的,这也是此次项目的难点之一。 清理设备的组织清理设备在房产档案数据清理整合当中,起到非常重要的作用,如何在短时间内组织大量的设备,满足用户的需要,将是数据清理工作需要解决的又一大难点。 清理人员的组织和清理设备的组织类似,清理人员的组织也是数据清理工作面临的又一大难点,如何在短时间内组织足够的专业人员,保证项目的顺利实施,将是数据清理工作的重要难点。上述难点,我们将在后续的方案中一一提出解决方法。2.3 数据清理关键技术应用必特思维开发的数据清理平台中采用了多种先进的IT技术,如人工智能、语义分析、档案分形等,下面我们分别介绍。2.3.1 人工智能人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能在计算机上实现时有2种不同的方式。一种是采用传统的编程技术,使系统呈现智能的效果,而不考虑所用方法是否与人或动物机体所用的方法相同。这种方法叫工程学方法(Engineering approach),它已在一些领域内作出了成果,如文字识别、电脑下棋等。另一种是模拟法(Modeling approach),它不仅要看效果,还要求实现方法也和人类或生物机体所用的方法相同或相类似。人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。 关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(consciousness)、自我(self)、思维(mind)(包括无意识的思维(unconscious_mind)等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。 人工智能目前在计算机领域内,得到了愈加广泛的重视。在数据清理过程中,我们可以利用人工智能技术实现如图像自动更名等一些自动化处理,提高数据录入的效率。2.3.2 语义分析语义分析(Semantic Analysis )是语言分析的一个分支,目的是根据上下文辨识一个多义词在指定句子中的确切意义,以及根据一个句子的句法结构和其中各词项的词义推导出这个句子的句义表达式。在自然语言理解和机器翻译中,用来表达句义的方式很多,常见的有:一阶谓词逻辑,语义网络,格框架等等。语义分析的方法也会因采用的语义学理论和句义表达方式的不同而不同。语义分析的应用之一是进行自动分类。例如,在数据清理中我们可以利用语义分析技术对房屋的坐落信息进行自动分类以辅助建立楼盘表,如海棠路1号院1-2-3-4,我们可以理解为1号楼2单元3层4号,也可以理解为1号楼2层3单元4号,诸如此类的坐落组合最多可达325种。利用语义分析中的分词技术,我们可以找出最合理的几种组合,缩小范围,减少人工判断的工作量。2.3.3 档案分形“分形” FRACTAL一词是美籍法国数学家曼德尔布罗特(B.B.Mandelbrot)教授于1975年首先提出的。分形理论是20世纪70年代科学上的三大发现(耗散结构,混沌和分形论)之一,它与混沌可以看成是继相对论和量子力学之后的本世纪物理学的第三次革命。 分形是一种具有自相似特性的现象、图象或者物理过程。也就是说,在分形中,每一“组成部分”都在特征上和“整体”相似,只仅仅是变小了一些而已。让我们来看下面的一个例子。下图是一棵厥类植物,仔细观察,你会发现,它的每个枝杈都在外形上和整体相同,仅仅在尺寸上小了一些。而枝杈的枝杈也和整体相同,只是变得更加小了。那么,枝杈的枝杈的枝杈呢?自不必赘言。 目前分形理论已成为一门重要的新学科,已被广泛应用到自然科学和社会科学的几乎所有领域。上图看似简单的外表下隐藏着复杂的水晶体北京SOHO尚都承袭了建筑师和后现代建筑卓越的诠释者查尔斯詹克斯所称之“复杂的分形结构建筑”理念。 用潘石屹的话说,就是“墙壁、天花板、窗户、楼梯,这里面没有一条线是直的”。同样,在房地产管理领域也存在着分形理论的应用基础。物权:权利人+物+权利内容权利人+物+权利内容所有权:权利人+物+权利内容担保权:权利人+物+权利内容权利人+物+权利内容用益权:权利人+物+权利内容权利人+物+权利内容权利抵押权:权利人+物+权利内容典权:权利人+物+权利内容地役权:权利人+物+权利内容权利人+物+权利内容地上权:权利人+物+权利内容如上图所示,每一种物权的部分和它的整体一样,都由三部分构成。这就是我们采用分形方法的依据和秘密。那么什么是档案分形呢?首先,我们来描述五个基本概念:档案、房地产权属档案、案例、资源和权利。档案:是指过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教、等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的“历史记录”。(中华人民共和国档案法)。房地产权属档案(以下简称,房地产档案):是城市房地产行政管理部门在房地产权属登记、调查、测绘、权属转移、变更等房地产权属管理工作中直接形成的有保存价值的文字、图表、声像等不同形式的历史记录,是城市房地产权属登记管理工作的真实记录和重要依据。(城市房地产权属档案管理办法)。案例:即业务。其单位是宗,即一手业务。例如,初始登记。资源:是指房地产权利人(人);税费价格(财);楼盘、证书(物);办理时间(时间);房屋座落(空间)。例如,老王,西大街22号楼1单元501室。权利:是指从权利人的角度看,权利人与其他资源的关系。例如,小张对西大街22号楼1单元501室具备所有权。有了上述五个概念,就可以对档案分形进行定义了。档案分形:是指通过一定的算法,对房地产档案数据进行处理,最终建立:正确的案例上下手关系、统一的资源(权利人、楼盘等)、明晰的权利(物权所有权、担保权和用益权),最终形成“房屋登记簿”的过程。 3 总体设计经过上述分析,房产档案数字化清理整合具体工作内容可分为档案数字化加工、建立逻辑幢(包括数据移植、数据录入、分词处理、档案分形)、建立自然幢及房屋落地(包括分幅编幢、外业调查、自然幢录入、房屋落地、数据关联),并且清理完成的房产档案数据,能够在后续的成果利用中满足业务系统运行的需要。档案数字化清理整合流程示意图必特思维基于长达二十年的房地产管理信息系统开发经验和取自数百家用户的房地产管理专业知识,集合人工智能、语义分析、档案分形等国际最前沿的IT技术,创新性的开发出了国内第一个专门针对房地产管理领域的开放式的数据清理平台。该平台主要包括建立逻辑幢、建立自然幢、关联和房屋落地等功能,能够满足数据清理工作中相关的各个环节的工作需要。下面以该平台为基础,来介绍房产档案数字化清理整合工作方案。3.1 总体架构数据清理总体架构图如下:总体架构图一图 软件总体架构(二)3.2 技术特点系统的技术路线包括:1、以标准协议和规范为基础,通过适应性服务组件体系结构保证系统在分布、异构的多数据库和操作系统环境下集成运行。2、基于面向服务架构应用系统,将业务服务作为协调应用系统与用户需求的关键组织原则,3、提供具有高度灵活性、伸缩性的服务组件平台,包括一系列根据标准协议封装、既可独立提供服务,也可协同工作的各种服务组件,达到不需要重新编写代码就可以快速实现各类业务的优化和流程的再造。4、基于目前业界公认成熟、完善的.NET企业级应用开发框架,采用B/S三层架构模式,将业务应用逻辑抽取形成服务对象,单独存放于应用服务器,客户端仅仅作为浏览界面,避免了客户机数目的增加和处理负荷的变动对系统的影响,提高系统可用性和可扩展性。5、提供基于数字证书的身份认证、数字签章安全技术。3.3 性能指标1、高效性,系统的响应时间非常迅速,保证系统使用具有高效性。2、可用性,系统所提供的各项功能可实现所要求业务功能的需要,并具有可恢复性操作的功能。3、简便可操作性,系统界面简单美观,按钮符号易辨认。4、开放性,开放的数据结构设计。系统结构设计灵活、开放。对数据实行标准化管理,规范化存储,为相关行业的应用提供扩展的可能,另一方面,数据库设计合理、规范。系统为其他软件开发提供开放的数据接口,满足数据的共享和交换要求。5、可靠性,系统提供724小时的连续运行,平均年故障时间少于5天;具有较强的灾难恢复能力,平均故障修复时间少于24小时。6、可扩展性,系统具备良好的可扩展性,可灵活根据业务的需要进行扩展。7、部署方便性,系统采用B/S架构,具有很好的部署方便性。8、安全性,系统通过注册、身份验证、权限管理、日志管理、数字签章等手段,自动记录用户的访问情况和操作记录,保障系统安全可靠。4 技术方案必特思维的档案数字化清理整合平台,包括档案数字化、逻辑幢建立、自然幢建立、逻辑幢与自然幢关联、自然幢落地等功能,最终实现房产档案数据清理整合和档案清理成果利用。4.1 档案数字化加工包括档案整理、档案扫描、档案录入三个部分,对登记和交易的纸质档案拆分后进行扫描、装订、换封皮、增加条码,形成电子图片。再按照数据清理标准和数据录入规范,对纸质档案数据进行录入。此环节属于劳动密集型的工作,以人工为主,软件为辅,技术含量较低。4.1.1 档案整理历史档案可能存在尚未归集或整理状况达不到档案管理要求的情况,所以在进行档案数字化工作之前,需要按照相关档案管理规范和要求,对历史档案进行规范化整理,主要包含: 各类房地产档案进行归集清点; 对残破、模糊、散落的档案进行识别修补并装订成册; 清理、修正重建档、插(并)错档的资料,确保资料完整; 编写和标注档案页码; 按照科学的方法对房地产档案进行立卷、编目、摆放。4.1.2 档案扫描 功能定义应用高速扫描仪软件,对权属档案进行扫描。系统通过各种参数的设定,灵活调整扫描方式、图片大小、图片格式、存储路径、命名规则、压缩模式等,保障扫描的效率以及质量。 工作界面图 扫描格式的设置图 扫描方式的设置4.1.3 数据录入如果用户没有结构化的历史档案数据库,需要进行完整的档案数据录入。如果用户已有录入到数据库的档案数据,则可以先通过数据移植,将现有档案数据导入到清理库,再根据统一的数据标准进行数据补录。我公司利用软件将扫描的图片自动识别后与录入字段相关联,实现每个字段与图片上相应内容对应,极大提高了录入的质量和效率。具体步骤如下: 更名.1 功能定义本系统主要完成对扫描档案图片的自动更名。通过建立识别图片的参照标准、建立图片比对作业,由系统按照参照标准自动比对后,将图片更名为参照标准中的图片命名,生成比对结果。具体功能如下:图 图像处理用例图.2 功能列表一级功能二级功能定义参照标准新建操作建立识别页的参照标准。一审对参照标准进行第一次审核。二审对参照标准进行第二次审核。三审对参照标准进行第三次审核。反馈参照标准注销操作注销识别页的参照标准。识别页的注销前提是,识别页有效,且没有与识别页相关的宗图像一审对参照标准进行第一次审核。二审对参照标准进行第二次审核。三审对参照标准进行第三次审核。反馈参照标准变更操作变更识别页的参照标准。识别页的变更前提是,识别页有效,且没有与识别页相关的宗图像一审对参照标准进行第一次审核。二审对参照标准进行第二次审核。三审对参照标准进行第三次审核。反馈分宗更名编页新建新建一共4步操作:1、将图片从磁盘复制到数据库中保存为宗图像;2、识别”分宗纸“图像,每遇到一页分宗纸,建立一个宗序号,并把宗序号与此宗下的图像与宗号建立一对多的关系。识别分卷图像和卷图像中的条码,每遇到一页分卷纸,与已用于打印输出的卷序号进行核对,把卷序号与每卷下的宗及其图像建立一对多的关系。宗序号为系统自动生成, 3、根据定义的参照标准对所有未匹配的图像进行匹配然后更名,更名实质上是建立名称(参照标准)和图像数据的对应关系;4、对于更名后的图像,编此图像在整宗内的页码;一审对卷号、宗号、图像、页名称、页码进行第一次审核。二审对卷号、宗号、图像、页名称、页码进行第二次审核。三审对卷号、宗号、图像、页名称、页码进行第三次审核。反馈分宗更名编页注销注销注销已有卷或宗下的图像。当一卷或一宗下的图像都被注销,那么该卷或该宗也随之被注销一审对卷号、宗号、图像、页名称、页码进行第一次审核。二审对卷号、宗号、图像、页名称、页码进行第二次审核。三审对卷号、宗号、图像、页名称、页码进行第三次审核。反馈分宗更名编页变更变更变更已有卷或宗下的图像。包括其与名称的对应关系、页码等属性一审对卷号、宗号、图像、页名称、页码进行第一次审核。二审对卷号、宗号、图像、页名称、页码进行第二次审核。三审对卷号、宗号、图像、页名称、页码进行第三次审核。反馈查询统计.3 工作界面图 参照标准新建界面图 参照标准图片上传界面图 分宗更名编页新建界面【注解:系统根据参照标准自动分卷、分宗、进行图像更名和页码排序,未成功识别的图像可手工更名。】图 分宗更名编页详细界面图 图像手工更名 标注.1 功能定义在扫描图像上标注活动、主体、客体、权利内容等信息,并对标注信息进行三审检查。系统提供在扫描图片上对每手登记案例信息的活动信息、主体信息、客体信息和权利内容信息用带颜色(如红色)的圆圈、方框等图形着重标示出应录入或核对的字段,后续录入或审核工作人员在录入数据或审查数据时,可方便进行对应,提高工作效率和数据录入的准确性。系统支持圆框、方框、矩形框等多种图形对图片上某个需要录入的信息点(即字段)进行着重标注。标注后,再次查询扫描图片时,将同时显示扫描图片和图片上的标注信息;支持对标注框的颜色、线条粗细进行设置;支持对扫描图片上的标注框进行删除的功能;系统采用工作流平台实现了流程化管理模式,从标注、一审、二审直至三审进行全过程的量化管理,每一步都可填写意见,如果发现问题可回退上一步骤,业务流程可随时根据需要任意调整,所有操作均记录在业务日志和系统日志中,便于明晰责任。.2 工作界面图 图像标注 录入.1 功能定义系统提供两种录入方式,一种是“先扫后录”方式,另外一种是“先录后扫”的方式。“先扫后录”方式,参照档案标注图片,按照录入规范进行档案数据的录入。参照标注录入活动、主体、客体和权利内容信息,并对录入内容进行三审检查。系统提供“参照图像录入数据”的功能,将录入界面划分为上下两个部分,上面显示经过标注的扫描图片,下半部分显示录入界面,操作人员根据扫描图片上经过标注出的信息,在界面下半部分对应的字段内录入数据,使整个录入工作轻松快捷和准确无误。参照录入支持录入每手房地产权属登记数据中的活动信息、主体信息、客体信息和权利内容信息。“先录后扫”方式,在导入已有房产权属档案数据以及档案图片后,建立档案数据和图片间的关联。系统提供将导入的案例信息与扫描图片进行关联的功能,通过在系统中查看每一宗档案扫描图像,找出关键字(案例编号、所有权证号、所有权人、房屋),然后通过关键字在导入的权属数据中找到相应的案例,最后在找到的权属案例数据中录入宗号,建立权属案例信息与该案例扫描图片之间的关联。具体功能如下:图 分形录入用例图.2 功能列表一级功能二级功能三级功能定义先扫后录图像导入导入导入已扫描的图像。一审对导入的图像进行第一次审核。二审对导入的图像进行第二次审核。三审对导入的图像进行第三次审核。反馈图像标注新建新建在图像上对录入信息进行标注。一审对新建标注第一次审核。二审对新建标注第二次审核。三审对新建标注第三次审核。反馈图像标注注销注销将图像上已经建立的标注注销。一审对注销标注第一次审核。二审对注销标注第二次审核。三审对注销标注第三次审核。反馈图像标注变更变更在图像上对已建的标注进行变更。一审对变更标注第一次审核。二审对变更标注第二次审核。三审对变更标注第三次审核。反馈任务分派新建新建给录入人员分派参照录入任务。一审对任务分派第一次审核。二审对任务分派第二次审核。三审对任务分派第三次审核。反馈任务分派注销新建将已经分派的参照录入任务注销。一审对任务分派注销第一次审核。二审对任务分派注销第二次审核。三审对任务分派注销第三次审核。反馈任务分派变更新建对已经分派的参照录入任务进行变更。一审对任务分派变更第一次审核。二审对任务分派变更第二次审核。三审对任务分派变更第三次审核。反馈参照录入新建新建参照标注录入数据。一审对录入的数据进行第一次审核。二审对录入的数据进行第二次审核。三审对录入的数据进行第三次审核。反馈参照录入注销注销参照标注注销数据。一审对注销的数据进行第一次审核。二审对注销的数据进行第二次审核。三审对注销的数据进行第三次审核。反馈参照录入变更变更参照标注变更数据。一审对变更的数据进行第一次审核。二审对变更的数据进行第二次审核。三审对变更的数据进行第三次审核。反馈数据导出导出导出已录入的数据。一审对导出的数据进行第一次审核二审对导出的数据进行第二次审核三审对导出的数据进行第三次审核反馈先录后扫数据导入导入导入已录入的数据。一审对导入的数据进行第一次审核。二审对导入的数据进行第二次审核。三审对导入的数据进行第三次审核。反馈图像导入导入导入已扫描的图像。一审对导入的图像进行第一次审核。二审对导入的图像进行第二次审核。三审对导入的图像进行第三次审核。反馈案例图数关联新建关联新建查看每一宗档案图像,找出关键字(案例编号、所有权证号、所有权人、房屋)。通过关键字在权属库中找到相应的案例,在权属库中录入宗号。一审对关联的图像和数据进行第一次审核。二审对关联的图像和数据进行第二次审核。三审对关联的图像和数据进行第三次审核。反馈案例图数关联注销关联注销查看每一宗档案图像,找出关键字(案例编号、所有权证号、所有权人、房屋)。通过关键字在权属库中找到相应的案例,在权属库中注销宗号。一审对注销关联的图像和数据进行第一次审核。二审对注销关联的图像和数据进行第二次审核。三审对注销关联的图像和数据进行第三次审核。反馈案例图数关联变更关联变更查看每一宗档案图像,找出关键字(案例编号、所有权证号、所有权人、房屋)。通过关键字在权属库中找到相应的案例,在权属库中录入宗号。一审对变更关联的图像和数据进行第一次审核。二审对变更关联的图像和数据进行第二次审核。三审对变更关联的图像和数据进行第三次审核。反馈数据导出导出导出已录的数据。一审对导出的数据进行第一次审核二审对导出的数据进行第二次审核三审对导出的数据进行第三次审核反馈.3 工作界面图 派件图 参照录入图 房屋档案历史查看图 房屋档案历史详细查看4.2 建立逻辑幢此项工作是基于现有的历史房屋档案数据进行房屋组栋并实现业务上下手关联。通过各地的清理实践,我们发现普遍存在以下问题:在历史房屋档案数据中,常常会发现同一个楼,同一套房屋或者同一个权利人有多个不同的描述。比如:同一个楼在先后两手业务中,一个叫幸福小区1号楼,另一个叫解放路25号1幢;同一个权利人,以前的描述为工商银行,现在的描述又为中国工商银行股份有限公司。不规范的座落描述给房屋组栋带来了很大困难,靠人工在几十万份档案中一手一手去找根本是不可能完成的。我公司经过不断的摸索和研发,现已找出方法可以通过技术手段解决以上问题,可以大大减轻人工参与工作量,提高数据清理的质量和效率。建立逻辑幢具体包括数据移植、分词处理和档案分形三个部分的工作。4.2.1 数据移植将用户现有的的档案数据移植到数据清理数据库。4.2.2 分词处理分词处理系统可以对组织、房屋属性等信息进行分形前的分词处理。 功能定义具体功能如下:图 分形预处理用例视图 功能列表一级功能二级功能定义业务类别对照操作建立用户业务业务大类、业务细类与标准业务大类、业务细类的对照关系。一审对对应关系进行第一次审核二审对对应关系进行第二次审核三审对对应关系进行第三次审核反馈组织分词操作对实质相同形式不同(笔误、简称等)的单位权利人进行归类,以标准名称为基准,将名称的其他不同表现形式建立为标准名称的同义词。一审对组织分词进行第一次审核二审对组织分词进行第二次审核三审对组织分词类进行第三次审核反馈坐落分词操作将楼栋坐落按区县、乡镇、路街巷、小区、楼号进行分段,并对每段中实质相同形式不同(笔误、简称等)的名称进行归类,以标准名称为基准,将名称的其他不同表现形式建立为标准名称的同义词。一审对坐落分词进行第一次审核二审对坐落分词进行第二次审核三审对坐落分词进行第三次审核反馈 工作界面图 分形预处理(坐落分段定义)图 分形预处理-坐落同义词定义1图 坐落同义词定义2图 权利人同义词定义4.2.3 分形处理通过分词、分形等软件智能算法,自动建立逻辑幢。以清理完成的楼盘表为基础,对存在于数据库的登记数据按照登记的前后手顺序进行清理,建立起房屋与登记业务之间的唯一对应关系。 功能定义将各种来源的权属登记数据导入到分形系统,对这些数据分析其数据特征,用智能的分形算法,分析这些数据的上下手之间的关系。具体功能如下:图 分形正式处理用例视图 功能列表一级功能定义分形正式处理将各种来源的权属登记数据导入到分形系统,对这些数据分析其数据特征,用智能的分形算法,分析这些数据的上下手之间的关系。 工作界面图 分形结果查看4.2.4 分形后处理通过对分形后的楼盘树进行后处理操作,使逻辑楼的楼盘表与物理幢一致,并检查逻辑楼下房屋的案例上下手信息。缺手次的需要补足,挂错了的需要移动清理。从而实现预更正处理。系统可以查阅档案、查询查阅老系统信息。逻辑楼:根据登记部门的登记信息,通过档案分形得到的楼栋为逻辑楼;物理幢:通过实地调查,测绘部门命名的楼为物理幢(自然幢)。 操作.1 功能定义1、搜索需要清理的逻辑楼;2、以房子比较全的楼作为母楼,通过修改房屋信息将分到其他楼的房屋移过来。修改房屋信息的同时注意填写准确房屋的所在层和房序号:所在层=房屋所在幢的行,房序号=房屋所在幢的列;3、遍历相关楼后,如果逻辑楼比起物理幢来有缺少的房屋,则通过编辑楼盘将缺少的房屋补录进去。请注意录入正确的所在层和房序号,以使房屋在正确的行列显示;清理逻辑楼中房屋的现实行列,以使与物理幢一致;4、检查房屋业务手次,查看业务档案图片。发现挂错的案子需要拖动到正确的房屋下;发现遗漏的案子需要通过复制补齐到对应的房屋下。.2 工作界面图 搜索处理目标图 修改清理整个楼栋房屋属性信息图 新建房屋图 移动案子图 分形后处理-组栋结果浏览【注释:包括楼栋上每套房屋案例上下手关系、登记簿、档案图片的浏览。】图 分形后处理-楼盘移动、合并、拆分 查阅档案分形后处理系统可以查阅分形后的逻辑楼盘以及详细档案信息。图 逻辑楼盘树搜索界面图 查看档案信息4.3 建立自然幢及房屋落地以逻辑幢楼盘表为基础,对已经

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论