




已阅读5页,还剩65页未读, 继续免费阅读
(计算机应用技术专业论文)基于svm的idss研究与应用设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 智能决策支持系统( i d s s ) 是决策支持系统和人工智能技术相 结合的产物,有效地解决了系统中定量与定性相结合以及半结构化、 非结构化的问题,扩大了决策支持系统的应用范围,提高了系统求解 问题的能力。随着计算机技术以及人工智能技术的不断发展,智能决 策支持系统在许多领域得到研究和应用,并发挥着越来越重要的作 用。 本文以辅助房地产企业决策人员进行科学决策为出发点,在对房 地产投资决策的理论和程序进行深入分析的基础上,以数据仓库、数 据挖掘、联机分析处理和支持向量机( s v m ) 等先进智能决策技术 为手段,设计了房地产投资智能决策支持系统( r e i i d s s ) 的原型系 统。该系统对减少盲目性带来的风险、提高决策效率等具有重要的理 论意义和现实价值。 首先,借助智能决策支持系统的基本理论和方法,提出了房地产 投资i d s s 的设计思想,设计了体系结构,并对数据仓库、模型库系 统和知识库系统进行了具体分析和设计。 其次,针对关系投资成败的关键步骤房地产投资选址决策问 题,采用支持向量机建立了相应的模型。该模型可以降低决策者的自 身经验和主观认知对选址决策的影响,增加选址决策的客观性和科学 性。 最后,根据房地产投资项目的特点,结合支持向量机和多层模糊 综合评价法,建立了房地产投资方案优选模型。该模型将具有模糊性 质的经验、意见、观点等定性指标加以解析化和定量化,使方案建立 在科学基础上,从而保证了结论的科学性,同时又利用支持向量机的 先处理提高了决策分析的效率。 关键字:智能决策支持系统、房地产投资、支持向量机、多层模糊综 合评价 a b s t r a c t i n t e l l i g e n t d e c i s i o ns u p p o r t s y s t e m( i d s s ) i sa c o m b i n a t i o no fd e c i s i o ns u p p o r t s y s t e m sa n da r t i f i c i a l i n t e lli g e n c e i d s sc a ne f f e c t i v e l ys o l v et h e p r o b l e m o f q u a l i t a t i v ea n a l y s i sc o m b i n e dw i t hq u a n t i t a t i v ea n a l y s i s ,a n d t h o s es e m i s t r u c t u r a la n dn o n s t r u c t u r a lp r o b l e m s i t s a p p l i c a t i o nr e a l m sa r ee x t e n d e d ,a n di t sa b i l i t yo fs o l v i n g p r o b l e m sisi m p r o v e d a l o n gw i t ht h eu n c e a s i n gd e v e l o p m e n to f t h ec o m p u t e rt e c h n o l o g ya sw e l la st h ea r t i f i c i a li n t e l l i g e n c e t e c h n o l o g y ,t h ei n t e l l i g e n c ed e c i s 怕ns u p p o r ts y s t e mw i l lb e r e s e a r c h e da n da p p lie df u r t h e r ,a n dw il lp l a yam o r ea n dm o r e v i t a lr o l ei nm a n yr e a l m s f o c u s e do na s s i s t i n gt h ed e c i s i o n - m a k e r so fr e a le s t a t e e n t e r p r i s et om a k es c i e n t i f i cd e c i s i o n ,b a s e do nt h ei n d e p t h a n a l y s i so fr e a le s t a t ei n v e s t m e n td e c i s i o n - m a k i n gt h e o r ya n d p r o c e d u r e s ,a n db ym a k i n gu s eo ft h ea d v a n c e dt e c h n i q u e so fd a t a w a r e h o u s e ,d a t am i n i n g ,o n l i n ea n a l y tic a lp r o c e s si n ga n d s u p p o r tv e c t o rm a c h i n e ( s v m ) ,t h i st h e s i sd e s i g n e dap r o t o t y p e s y s t e mo fr e a le s t a t ei n v e s t m e n ti n t e l l i g e n td e c i s i o ns u p p o r t s y s t e m ( r e ii d s s ) t h es y s t e mh a si m p o r t a n tt h e o r ym e a n i n ga n d r e a l l i f ev a l u ef o rr e d u c i n gt h er i s k so fb l i n d n e s sa n d i n c r e a s i n gt h ee f f i c i e n c yo fd e c i s i o n f i r s t l y ,b ym e a n so ft h eb a s i ct h e o r i e sa n dm e t h o d so fi d s s , t h ec 0 1 1 e c t i v i t ys t r u c t u r eo fr e i i d s sw e r ed e s i g n e di nt h i s t h e s i s a n dt h ed a t aw a r e h o u s e ,t h em o d e ls u b s y s t e ma n dt h e k n o w l e d g e 。b a s e ds u b s y s t e mw e r es p e c i f i c a l l ya n a l y z e da n d d e s i g n e d s e c o n d l y ,i na l l u s i o nt ot h ek e ys t e p so ft h er e a le s t a t e i n v e s t m e n tl o c a t i o nd e c i s i o n - m a k i n g ,s u p p o r tv e c t o rm a c h i n ei s u s e dt oe s t a b lis ht h ec o r r e s p o n d i n gm o d e l ,w h i c hc a nr e d u c et h e i m p a c t s f r o mt h e e x p e r i e n c ea n ds u b j e c t i v ea w a r e n e s so f d e c i s i o n - m a k e r sa n di n c r e a s et h e a c c u r a c y o fl o c a t i o n d e c i s i o n s f i n a ll y ,a c c o r d i n gt ot h ec h a r a c t e r is ti c so ft h er e a l e s t a t ei n v e s t m e n t p r o j e c t s ,s v m a n d m u l t i l e v e l f u z z y s y n t h e t i cj u d g m e n ta r eu t i l i z e dt ob u i l du par e a le s t a t e i n v e s t m e n t o p t i m i z a t i o nm o d e l t h em o d e l 。a n a l y z e sa n d q u a n t i f i e ss o m eq u a l i t a t i v ea n df u z z yf e a t u r e s ,s u c ha s e x p e r i e n c e ,o p i n i o na n dv i e w p o i n t i tc a u s e st h es c h e m eb e i n g e s t a b l i s h e di nt h es c i e n t i f i cf o u n d a t i o nt oe n s u r et h es c i e n c e o ft h ec o n c l u s i o n a tt h es a m et i m e 。i ti sf a v o ro fs 1 i 1 讧t oh a n d l e t h o s eq u a n t i f i e df e a t u r e s ,a n di n c r e a s e st h ee f f i c i e n c yo f d e c i s i o na n a l y s i s k e yf f o r d s :i n t e l l i g e n td e c i s i o ns u p p o r ts y s t e m , r e a le s t a t e i n v e s t m e n t ,s u p p o r tv e c t o rm a c h i n e s ,m u l t i l e v e lf u z z y s y n t h e t icj u d g e m e n t m 湖南师范大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论 文不含任何其他个人或集体已经发表或撰写过的作品成果对本文的 研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人 完全意识到本声明的法律结果由本人承担。 学位论文作者签名:虏瘤, 2 , o 。子年占月r 日 湖南师范大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权湖南师范大学可以将本学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密口。 ( 请在以上相应方框内打“ ”) 作者签名:唐诗日期:弦谚年占月r 日 导师签名:多7 勿 日期:办甥年占月,日 基于s v m 的i d s s 研究及虑用设计 1 1 论文研究背景及意义 第一章绪论 决策是人们为了达到某一目的而进行的有意识、有选择的行动。 在一定的人力、设备、材料、技术、资金和时间因素的制约下,人们 为了实现特定目标,而从多种可供选择的策略中作出决断以求得最优 或较好效果的过程就是决策的过程。随着科学技术不断的发展,决策 经历了传统决策、科学决策和决策科学三个阶段,并逐步形成了该学 科一整套的理论和方法。 决策支持系统( d e c i s i o ns u p p o r ts y s t e r n , d s s ) 就是顺应了决策 科学化这一趋势而产生的,它是以信息技术为手段,应用决策科学及 有关学科的理论和方法,针对某一类型的半结构化和结构化的决策问 题,在决策过程中以人机交互的方式,为决策者提供决策所需的数据、 信息和背景材料,帮助明确决策目标和进行问题的识别,提供多种决 策的参考方案,并对其进行评价、选优,为决策者做出正确决策提供 有力支持的系统【l 】。 自d s s 提出以来,在概念内涵、结构设计和应用研究诸方面都 取得了较快发展,但由于它采用的两库结构( 数据库、模型库) 和数 值分析方法,使其应用范围受到很大的限制。尤其是对那些不确定性 的问题,用数值方法很难解决,再加上缺少与决策有关的知识及相应 的推理机制,使得系统不具备思维能力和对高层决策的有效支持,具 有无法表示复杂决策过程的局限性。随着人工智能技术( a r t i f i c i a l i n t e l h g e n c e ,a i ) 的发展,专家系统( e x p e r ts y s t e m , e s ) 的成功使决 策系统的研究受到启示,人们开始考虑把m 的有关技术应用于d s s 。 1 9 8 1 年b o n c z e k 等人提出将d s s 与e s 相结合,分别发挥d s s 在数 值分析方面的优势与e s 在知识及知识处理方面的特长,将定性分析 和定量分析有机结合,使其能够进行知识处理,以方便、准确地模拟 客观世界,全面地反映决策过程,从而有效地解决那些半结构化及非 结构化问题,扩大了d s s 处理的范围,提高了决策能力,形成最初 硕士学位论文 的智能决策支持系统( i n t e l l i g e n td e c i s i o ns u p p o r ts y s t e m , i d s s ) 【2 】。 i d s s 的核心思想就是将人工智能技术和其它相关学科的成果及其技 术相结合,使d s s 仿真人类的知识行为。近2 0 多年来,i d s s 的研 究取得了巨大的进步,并且在咨询、诊断、预测、管理、设计等领域 得到了广泛的应用。 目前我国房地产业投资过热,造成了盲目投资、商品房积压、土 地抛荒等诸多问题。这些问题的出现使得房地产企业迫切需要种智 能的辅助决策工具帮助决策者做出科学的决策。研究房地产投资智能 决策支持系统,对辅助决策者了解和分析房地产的市场状况,综合处 理复杂数据,及时确定房地产投资项目的最佳方案,提高决策效率, 具有重要的理论意义和现实价值。 1 2 智能决策支持系统应用现状及发展方向 i d s s 的理论发展和研究与很多学科有关,它涉及到计算机软件 和理论、信息论、人工智能、信息经济学、管理科学以及行为科学等, 这些学科构成了它发展的理论框架。它是一种开放的技术,总是不断 吸收其它学科的研究成果。 1 2 1id s s 的应用现状 进入2 0 世纪9 0 年代以来, d s s 的研究有了一些新的变化:( 1 ) 分析、决策用的数据不再集中于某一固定场所,而是分散到网络上的 不同地区、不同部门:( 2 ) 分析、决策模型和知识处理方法也由一台 机器上的集中式处理,变成在网络条件下的分布或分布加并行的处理 方式。随着分布计算和网络计算的迅速发展,i d s s 也开始由集中式 演化产生了一系列新的概念、观点和结构。主要表现在以下几个方面: ( 1 ) 分布式决策支持系统( d i s t r i b u t i n gd e c i s i o ns u p p o r t s y s t e m , d d s s ) 。分布式决策支持系统是对集中式d s s 的扩展,是分 布决策、分布系统、分布支持三位一体的结晶。从概念上理解,d d s s 是由多个物理上分离的信息处理节点构成的计算机网络,网络的每个 节点至少含有一个决策支持系统或是具有若干辅助决策的功能【3 】。 基于s v m 的i d s s 研究及应用设计 d d s s 的主要优势在于:1 ) 比集中式系统更可靠;2 ) 系统的效率更 高,更接近于大型组织决策活动的实际情况;3 ) 易于扩展;4 ) 能够 实现平行操作,资源共享。 ( 2 ) 群决策支持系统( g r o u p d e c i s i o ns u p p o r ts y s t e m , g d s s ) 。 2 0 世纪8 0 年代以来d s s 的研究与应用的热门方向之一就是群决策支 持系统。g d s s 是对个体决策支持系统的扩展,是为群体决策活动提 供支持的信息系统,它将通讯技术、计算机技术和决策理论结合在一 起,促进具有共同责任的群体求解半结构化和非结构化决策问题【4 】。 g d s s 和d d s s 既有区别又有联系,前者是对个体决策支持系统的扩 展,后者则是相对于集中式d s s 而言的,两者研究的重点和关注的 焦点有所不同。如果说d d s s 是以技术为导向的话,g d s s 则是面向 群体活动的,它可为群体活动提供三个层次的支持,即沟通支持、模 型支持及机器诱导的沟通模式。g d s s 对群体决策的支持既可是集中 式决策,又可是分布式决策。但在通常情况下,群体决策是在分布环 境下实施的,这就决定了g d s s 与d d s s 有着非同寻常的关系。g d s s 大多采用分布式和分散式结构:系统支持“水平方向的分布式处理, 即支持对数据对象的远距离操作;系统还支持“垂直方向 的分散式 处理,即通过在用户和各应用层之间的接口,来实现各个应用领域的 功能。g d s s 是从传统的d s s 发展而来的,但和d s s 又有较大的差 别。d s s 的对象是单个用户,且决策具有较高的自动化而g d s s 面临 着多个参与者,并将决策的权力分层次地留给了参与决策者们。 ( 3 ) 高层决策的支持系统。高层决策的特点包括:1 ) 高层平衡 形式多,低层平衡形式少;2 ) 协商平衡做出的决策多,个人单独做 出的决策少;3 ) 决策结果定性成分多,定量成分少。面向高层的决 策支持系统有战略决策支持系统( s t r a t a g e md e c i s i o ns u p p o r t s y s t e m , s d s s ) 和决策支持中心( d e c i s i o ns u p p o r tc e n t e r , d s c ) 。s d s s 是支持战略管理的,这里的战略是指全局性、长远性、根本性决策【5 】。 而d s c 是在高层管理部门,配备熟悉环境和事务的信息系统人员, 支持应急和重要决策的计算机信息系统。 硕士学位论文 1 2 2id s $ 的发展方向 从对i d s s 发展历史的研究分析可以看出,i d s s 的发展趋势是向 着综合化、集成化方向发展,综合利用多种技术来实现i d s s 已是构 建现代i d s s 的必然趋势。i d s s 的研究工作应该突出在系统的智能性 和对决策支持两个方面。进入2 0 世纪9 0 年代以来,人工智能、专家 系统、数据库、网络等领域都出现了新的技术,如何有效地将这些技 术应用于i d s s 的构建中,把数据仓库、联机分析、数据挖掘、模型 库、专家系统、面向对象、a g e n t 、机器学习等的优点结合起来,集 成综合的决策支持系统,开发出实用而有效的i d s s 是当前i d s s 发 展的主要方向【6 1 。 1 3 文章的研究内容及结构安排 本文首先在深入分析房地产投资决策的理论和程序的基础上,设 计了房地产投资i d s s 的原型系统;再针对关系投资成败的关键步骤 房地产投资选址决策问题,采用支持向量机建立了房地产投资选 址模型。它通过再现专家的经验、知识和直觉思维,降低评价过程中 人为的不确定性因素,可以较好的保证评价结果的客观性和预测的准 确性。既具备综合评价方法的规范性又能体现出较高的问题求解效 率;最后根据房地产投资项目的特点,结合支持向量机和多层次模糊 综合评价法,建立了房地产投资方案优选模型。该模型将具有模糊性 质的经验、意见、观点等定性指标加以解析化和定量化,使方案建立 在科学基础上,从而保证了结论的科学性,同时又利用支持向量机的 先处理提高了决策分析的效率。 论文的具体章节安排如下: 第一章对研究背景和意义、智能决策支持系统的研究现状、发展 方向和本文主要内容进行了简要的论述。 第二章在对房地产投资决策的理论和程序进行深入分析的基础 上,引入了数据仓库、联机分析处理、数据挖掘等先进智能决策支持 技术,提出了房地产投资i d s s 的设计思想,设计了系统体系结构, 并对数据仓库、模型库系统和知识库系统进行了具体分析和设计。 4 基于s v m 的i d s s 研究及应用设计 第三章通过对房地产投资地段的了解,建立和优化了房地产投资 选址评价指标体系;对支持向量机的模型选择进行了研究,确定了应 用的方法、核函数及相关的参数,最终建立了基于支持向量机的房地 产投资选址模型;应用这个模型,对长房集团样本集中的测试样本进 行了预测分类,达到较高的判断正确率。实验结果表明,将支持向量 机运用于房地产投资选址决策问题中是行之有效的。 第四章结合支持向量机和多层模糊综合决策方法,建立了房地产 投资方案优选模型。该模型先用支持向量机对方案进行筛选,淘汰一 些很不理想的方案,然后用多层模糊综合评价方法对投资方案进行综 合评价,为投资者提供科学的决策支持。 第五章对全文的工作进行了总结,得出了本次研究的结论、研究 过程中可能存在的问题,并对今后的研究工作提出了要求。 基于s v m 的i d s s 研究及应用设计 第二章房地产投资i d s s 的设计 房地产业是当今世界各国经济发展的重要支柱产业之一,随着我 国城市建设的高速发展,使得房地产市场得到巨大发展。它所能创造 的高额附加值以及为投资者所带来的丰厚利润,强烈地吸引着投资 者,使其已成为当前投资领域内的一个热点。然而随着房地产市场越 来越激烈的竞争,正确决策成为投资者取胜的关键。 房地产投资决策是房地产开发公司在房地产投资项目经营开发 前首先要解决的一个重要环节,它是一个相当复杂的过程,需要决策 者同时考虑主市场、材料、资金、市政建设等诸多因素,并且作出综 合评价。这种复杂的决策,领导者已很难仅凭经验正确地作出。因此 房地产业急需优良的智能辅助决策工具帮助决策者做出科学的决策。 本文研究的房地产投资i d s s 以数据仓库技术( d a t a w a r e h o u s e ,d w ) 、数据挖掘( d a t am i n i n g ,d m ) 、联机分析处理 ( o n l i n ea n a l y t i c a lp r o c e s s i n g ,o l a p ) 和支持向量机等先进智能技 术为手段,建立一个智能化、专业化的辅助决策环境。它能够为决策 者提供决策所需的数据、信息和背景材料,帮助明确决策目标和进行 问题的识别,建立或修改决策模型,提供各种决策备选方案,并且对 各种方案进行评价和优选,通过人机交互功能进行分析、比较和判断, 为正确决策提供必要的支持。 2 1 系统设计思想 ( 1 ) 多目标决策的设计思想。房地产投资的目标很多,获取高 额利润、无形收益、社会效益、环境效益等都是投资者所追求的目标。 在这些目标中,有的相互联系、相互制约,有的相互冲突、相互矛盾, 其层次繁多,结构极其复杂。要解决这一问题,关键是要合理地选择 和构造投资目标准则体系,从总体上对各种投资可行方案进行比较和 优选。 ( 2 ) 集成化思想。由于房地产投资i d s s 是一个基于数据仓库的 硕士学位论文 智能化系统,系统中用到了数据仓库、数据挖掘、o l a p 等先进技术, 其中数据仓库用于数据的存储和组织,o l a p 集中于数据的分析,数 据挖掘致力于知识的发现。如何将这些技术应用到投资决策中去就格 外重要。 ( 3 ) 开放性思想。这主要体现在两方面t 一是在设计系统时要 将企业的局域网与广域网联系起来考虑。所有的计算机终端彼此通过 网络相互相连,通过服务器共享资源。另一方面由于时间和环境的不 断变化更替,使得房地产投资i d s s 必须适应这些变化,这就要求系 统的设计要基于开放性原则,即模型和方法等可以随时更新、添加或 删除,这样的系统才能适应企业发展的需要。 , ( 4 ) 智能化思想。采用人工智能的理论方法,使系统具有一定 的智能水平,白适应、自组织能力,处理不确定性、非结构化决策问 题的能力。 ( 5 ) 协调化思想。在人机系统设计中,实现人机合理分工,人 机智能结合,具有提示用户并能解答问题的能力。 2 2 体系结构设计 房地产投资i d s s 的体系结构是r e i i d s s 中重要的一环,它体现 了系统的部件关系和层次结构。 从i d s s 的逻辑结构来看,可分为三库( 数据库、模型库、知识 库) ,四库( 数据库、模型库、知识库、方法库) ,五库( 数据库、 模型库、知识库、方法库、文本库) 等几种结构。其中最为广泛应用 的是四库三功能的结构,本文采用将其中的方法库溶合于模型库中的 方法,增加一个案例库,结合数据仓库、数据挖掘、o l a p 等i d s s 的新技术来构建r e i i d s s 的系统结构,其体系结构如图2 1 。 基于s v m 的i d s s 研究及应用设计 一 联机分析处理 f 一 投资类型选择 f = 蚶未出冲据 人 k 。三机 i 投资地段选择i f t 。( = 一一、一 u 懈黼源 交 c 爿数据管理 互 i 1 , 一 心 及页砚偎伽肥 与 知识库 酵爿数据挖掘 用 c 问一o 经营力式抉择 _ n 、, : 知识管理 户 题 处 i 筹资方式抉择l 印 理 系- 1 营销策略确定i e 爿案例管理 r 一 统 、- - 一 l 投资伙伴选择i 模型库 一一 l 柚+ 出雄,止l h c 爿一一 l 1 孜贸万莱优j 歪l 。7 l 模型管理 图2 - l 房地产投资i d s s 体系结构 系统中数据库系统、模型库系统、知识库系统和人机交互及问题 处理系统相互协调作用。人机交互与问题处理系统实现用户与系统的 动态交互,同时提供问题分析与综合、查询分析、管理维护等功能; 数据仓库能够实现对决策主题数据的存储和综合,o l a p 实现多维数 据分析,d m 用以挖掘数据库和数据仓库中的知识;知识库则利用知 识推理进行定性分析,它的运用使系统具有智能化功能;案例库存储 各种功能子系统采集的案例;模型库提供各种模型,支持决策者做出 最优的投资决策,并引导决策者选择有效的模型组合。它们集成的综 合i d s s ,将相互补充、互相依赖发挥各自的辅助决策优势,实现更 有效的辅助决策。 2 3 模型库系统 模型库系统包括模型库和模型库管理系统两部分,它的主要任务 是建立决策模型并支持其使用,通过帮助决策者理解决策问题、检验 9 硕士学位论文 候选方案和增强预测能力等一系列手段来改善决策者的行为表现 7 1 。 2 3 1 模型库 模型库是i d s s 的共享资源,它由一些具有支持不同层次决策活 动的基本模型组成,其中有一些为支持频繁操作的单一模型,还有一 些用于生成新模型的基本模块和基本要素。这样模型库就是一个预存 和产生模型的基地,而不是机械的预先建立的模型的集合。通过模块 的组合和单元的变更,可以使模型更加灵活机动。 模型库设计研究的主要问题是模型的组成问题和如何表示问题。 以下详细阐述本系统模型的组成和表示策略。 2 3 1 1 模型的组成 模型是对现实世界的事物、现象、过程或系统的抽象描述,人们 通过对模型的认识来增加对复杂问题的理解和处理。用模型来辅助决 策己经是人们的共识。 模型的种类很多,我们可把房地产i d s s 的模型库建立成不同的 模型群,如: ( 1 ) 预测模型:如常用的指数平滑、趋势延伸、季节指数、简 单平均、移动平均和市场需求预测、市场供给预测、需求量的预测、 销售价格预测等模型,其中后4 个模型是复合模型,主要利用历年的 市场销售资料,预测房产的市场需求状况及房屋的销售价格。 ( 2 ) 分析模型:盈亏平衡分析、数理统计分析模型、价值分析 模型、趋势分析、投入产出分析、随机序列分析模型等。 ( 3 ) 优化模型:线性规划、动态规划、搜索论、梯度法( 最短 路径法) 、多目标规划、概率分析法、决策树法等。 ( 4 ) 评价模型:专家评价法、主因素分析法、层次分析法、加 权分析法等。这类模型可用于经济效益分析、投资效益分析等。 ( 5 ) 推理模型:如演绎推理模型、归纳推理模型、类比推理模 型、文法推理模型等。 ( 6 ) 决策模型:如选址决策、方案优选决策、风险性决策、筹 资决策等模型。 基于s v m 的i d s s 研究及应用设计 本文重点介绍房地产投资选址决策模型和投资方案优选模型。 2 3 1 2 模型的表示 , 在房地产投资i d s s 中,模型库采用面向对象体系结构来表示。 根据面向对象的思想,把概念、实体及模型组成部分都当作对象,这 样模型就可以当作对象的集合,也可以单独作为一个对象,复杂模型 就可以由相对简单的模型来层层组合而成,模型之间也可以构成一种 层次关系,这种关系的存在既可以减少模型的冗余度,又有利于建模 过程中继承以往的简单模型结构。这种模型表达方式为面向对象的模 型管理和建模创造了有利条件。 采用面向对象表示方法的模型库系统包括以下几部分:模型说 明,存放各种模型名、建模者名称、建模日期、模型使用的置信度和 前提假设等信息;模型参数,存放模型的输入、输出和参数的具体 数值;模型公式,存放模型所有的算式和算法;模型关系,存放 模型之间的关联关系、分解关系、复合模型与子模型之间的关系等。 2 3 2 模型库管理系统 模型库管理系统( m o d e lb a s em a n a g e m e n ts y s t e m s ,m b m s ) 是为 生成模型和管理模型提供一个友好的计算机模型管理界面,用户可以 通过它灵活地访问、更新、生成和运行模型。模型库管理系统使模型 的适用范围拓宽,从而决策者能方便地使用模型;同时还为决策者提 供将现实问题抽象成模型的工具。模型库管理系统是联系决策问题、 数据和模型的桥梁。 本文采用与专家系统相结合的方式来构建智能化的模型管理系 统。这种智能化m b m s 除了应具有传统的功能外,还要求具有以下 功能: ( 1 ) 最优模型匹配。系统应提供必要的匹配手段自动寻找局部 最优的模型。 ( 2 ) 可视化建模。系统应通过人机交互的手段进行机器学习, 在学习过程中,可视化建模的方法将大大减轻用户的工作量。 ( 3 ) 在复杂目标求解过程中,系统应自动规划求解策略,包括 硕士学位论文 自动实现模型的智能调度,进行模型的横向关联与纵向关联。最后形 成待求解问题的模型触发网。 ( 4 ) 支持多目标求解问题的自动规划。 ( 5 ) 在不断提供可行方案的同时,系统能为用户提供丰富的信 息,以引导用户进行改进,最终能给出用户满意的求解方案。 2 4 数据仓库 在房地产投资决策过程中需要用到的信息无论在类别和范围上 还是在数量和质量上都要求甚高,同时在操作上除了对业务数据进行 增、删、改等事务处理操作和简单的统计汇总以外,高层管理者还要 使用数据( 历史的、现在的) 进行各种复杂分析,如长期趋势分析等, 以支持决策。 i d s s 中数据仓库主要用途是支持决策制定过程,因此它与一般 通用数据库中的数据不同,首先,i d s s 数据仓库中的数据是和决策 过程密切相关的,一切数据都经过适当的加工、浓缩;其次,由于i d s s 一般面向高层决策,所以除了内部数据外,还要用到大量的外部数据。 房地产投资i d s s 中,内部数据指的是企业内部生产经营活动中所涉 及的各种数据;外部数据是指国内经济环境、政府经济政策取向、消 费发展水平、房地产市场状况等数据。它们共同构成数据仓库的数据 源。通过数据的抽取与转化,将来自数据源的、影响数据仓库的数据 转化为数据仓库模式。当数据源中数据发生变化时,通过数据的抽取 和转换功能对数据进行过滤、总结,并和其它数据合并,把新的数据 集成到数据仓库中。 2 4 1 数据仓库的逻辑结构 我们可以利用数据仓库技术从日常的联机事务处理系统( o n l i n et r a n s a c t i o np r o c e s s i n g ,o l t p ) 数据库或外部资料库中抽取、整理 数据,形成多维数据仓库,再利用o l a p 工具实现对多维数据仓库中 的数据进行多维分析,形成分析与决策的有用信息 8 1 。在多维数据仓 库中,联机分析处理可以直观地表现现实世界中的“一对多、“多对 基于s v m 的i d s s 研究及应用设计 一和“多对多关系,能够体现数据仓库的优势。 基于数据仓库的房地产投资i d s s 可分为五个组成部分:基础数 据库、数据采集、数据仓库管理、多维数据仓库和信息输出。它们之 间相互作用,共同构成了层次分明的数据仓库信息分析环境,其逻辑 结构如图2 2 所示。 房地产投资i d s s 数据仓库系统的数据处理流程为:由决策者 根据决策主题,从模型库中选择相应的评价模型,从而确定所需要的 数据和知识。通过数据采集来收集相关的内部各类业务数据和外部 资料数据。通过对基础数据的加工处理,并结合数据仓库管理系统的 数据处理功能和元数据中数据定义,将基础数据库中的数据转存到多 维数据仓库中。利用o l a p 数据分析工具对多维数据仓库中的数据 进行分析处理,最终输出决策有用信息。 2 4 2 主题数据仓库 信息输出 数据仓库管理 数据采集 o l t p 基础数据 图2 - 2 数据仓库逻辑结构图 数据仓库的一个重要特征就是要求数据必须按照分析与决策主 题来组织,即面向主题。主题是在一个较高层次上的数据综合、归类 的标准,是数据仓库的组织核心,每个主题对应于一个客观的分析领 域。面向主题的数据组织方式,即是分析对象数据的一个完整的、一 硕士学位论文 致性描述。主题在数据仓库中由一组相关的表来具体实现,一个主题 可以划分成为多个表,主题只是一个逻辑上的概念。 房地产投资i d s s 中主要确定了八个主题,分别是投资类型选择、 投资地段选择、投资规模确定、经营方式抉择、筹资方式抉择、营销 策略确定、投资伙伴选择和投资方案优选。投资决策分析与评价的各 种方法主要是围绕这八个主题进行的,在这八个主题之下,还有细分 的下层主题。对于某一具体投资决策主题而言,其数据可能来源于基 础数据库( 包括外部资料库) ,也可能来源于数据仓库,这要视决策 主题和分析条件而定。如果决策主题和分析条件在案例库中具有类似 的案例,则通过案例推理可查询到类似案例数据,再从数据仓库中将 参考决策方案数据输出即可;如果在案例库中查询不到满足条件的案 例数据,则需根据基础数据库进行决策,并将其决策结果数据存储到 数据仓库中,以便下次决策时直接取用。 2 4 3 多维数据仓库 2 4 3 1 多维数据仓库的结构设计 数据仓库结构共有三种存在形式,分别是星型结构、雪花型结构 和事实星座型结构【9 】。星型结构表示的多维数据仓库由一个包含主题 的事实表和多个包含事实的非正规化描述的维度表组成。在进行多维 数据仓库设计时,一般多采用星形结构以提高系统的响应速度,但这 种结构不适合表示有多个层次的多维数据。雪花型结构是对星型结构 的扩展,对星形的维表进一步标准化,维可划分为较细的粒度,增加 了应用程序的灵活性,数据冗余度低、易于维护,并能够节省存储空 间,但是由于执行查询时需要更多的连接操作,很可能会降低浏览的 性能,影响查询的效率。事实星座型结构主要适用于复杂的应用,即 当有多个事实表共享维表的时候,采用这种结构比较合适。 基于上述原因,本着数据仓库简单明了的要求,本系统采用星型 结构。图2 3 给出了投资地段选择这一主题的星型结构。 基于s v m 的i d s s 研究及应用设计 图2 - 3 房地产投资地段选择多维数据仓库的星形结构 2 4 3 2 联机分析处理的应用 数据仓库是管理决策分析的基础,要有效地利用数据仓库的信息 资源,必须要有强大的工具对数据仓库中的信息进行分析决策。联机 分析处理就是一种用于对大容量数据归总和分析的技术,是基于数据 仓库的信息分析处理过程。数据仓库和o l a p 相结合为i d s s 进行数 据分析提供了新的技术手段。数据仓库侧重于存储和管理面向决策主 题的数据;而o l a p 则侧重于数据仓库中的数据分析,并将其转换成 辅助决策信息,它允许用户动态随机查询、浏览、计算、时序分析以 及复杂建模等方式来访问数据仓库中所存储着的数据。 o l a p 的一个重要特点是多维数据分析,它是指对多维形式组织 起来的数据采取切片、切块、旋转、钻取等各种分析方法,以求剖析 数据,使最终决策者能从多个角度、多侧面观察数据仓库中的数据, 从而深入地挖掘包含在数据仓库中的信息和内涵。多维分析方式迎合 了人们的思维模式,因此,减少了混淆,并且降低了出现错误解释的 可能性。 ( 1 ) 切片和切块。在多维数据结构中,按二维进行切片,按三 维进行切块,可得到所需要的数据。如在“地段、“专家、“评价指 标三维立方体中进行切块和切片,可得到各地段、各专家、各评价 指标的情况,如图2 4 所示。实际上,切块操作可以看成是多次切片 操作以后,将每次切片操作所得到切片重叠在一起而形成的。 硕士学位论文 评 价 指 标 专家 图2 - 4 0 l a p 切片示意图 ( 2 ) 旋转。旋转操作相当于平面或空间数据坐标轴的旋转,通 过旋转可以得到不同视角的数据。 表2 - 1o l a p 旋转示意表 专家l专家2 地段优惠政策 资源环境优惠政策资源环境 长岭地段 0 8 50 6o 90 5 伍家岭地段 0 6 0 7 50 5 50 8 - 渔湾市地段0 7 50 5 5o 80 5 优惠政策 资源环境 地段专家1 专家2专家1专家2 长岭地段 0 8 50 9 0 6 0 5 伍家岭地段0 60 5 5o 7 50 8 渔湾市地段o 7 50 80 5 50 5 ( 3 ) 钻取。钻取就是将一条概要性的条款分解成一些详细的部 件,它包含“向下钻取和“向上钻取两种操作,钻取的深度与维 所划分的层次相对应。例如在“时间维的年度上,可向下钻取到季 度、月份等;同样,在季度或月份上,可向上钻取到年份。 2 4 4 数据挖掘 数据挖掘是指从大型数据库或数据仓库的数据中提取人们感兴 趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取的知 基于s v m 的1 d s s 研究及应用设计 识表示为概念、规则、规律、模式等形式【1 0 1 。它是一个知识发现的过 程,能帮助用户理解有关数据的真正含义,并了解数据之间所存在的 关系,还能在信息中揭示出相应的模式与趋势。在i d s s 中运用d m 技术能够更好地实现其决策支持的作用。 数据挖掘是一门交叉学科,它会聚了数据库、人工智能、统计学、 可视化、并行计算等不同学科和领域,近年来受到各界的广泛关注。 2 4 4 1 数据挖掘的步骤 数据挖掘一般有以下几个主要步骤【1 1 】: ( 1 ) 数据收集。 大量全面丰富的数据是数据挖掘的前提,没有数据,数据挖掘也 就无从做起。因此,数据收集是数据挖掘的首要步骤。数据可以来自 于现有事务处理系统,也可以从数据仓库中得到。 ( 2 ) 数据整理 数据整理是数据挖掘的必要环节。由数据收集阶段得到的数据可 能有一定的“污染,表现在数据可能存在自身的不一致性,或者有 缺失数据的存在等,因此数据的整理是必须的。同时,通过数据整理, 可以对数据做简单的泛化处理,从而在原始数据的基础之上得到更为 丰富的数据信息,进而便于下一步数据挖掘的顺利进行。 ( 3 ) 数据挖掘 利用各种数据挖掘方法对数据进行分析。 ( 4 ) 数据挖掘结果的评估 数据挖掘的结果有些是有实际意义的,而有些是没有实际意义 的,或是与实际情况相违背的,这就需要进行评估。评估可以根据用 户多年的经验,也可以直接用实际数据来验证模型的正确性,进而调 整挖掘模型,不断重复进行数据挖掘。 ( 5 ) 分析决策 数据挖掘的最终目的是辅助决策。决策者可以根据数据挖掘的结 果,结合实际情况,调整策略等。 硕士学位论文 2 4 4 2 数据挖掘的方法 。 数据挖掘的方法由人工智能和机器学习的方法发展而来,它和人 工智能领域中的知识发现具有很大的重合度,结合传统的统计分析方 法、运筹学方法、模糊数据方法等,以数据仓库为对象,形成了房地 产投资i d s s 中数据挖掘的方法和技术。其具体方法主要有【1 2 】: 决策树方法:利用信息论中的信息增益寻找数据库中的具有最大 信息量的字段,建立决策树的一个结点,再根据字段的不同取值建立 树的分枝,在每个分支子集中,重复建立树的下层结点和分支的过程, 最终形成决策树。 神经网络方法:模拟人脑神经元方法,以m p 模型和h e b b 学习 规则为基础,可建立大量神经网络模型( 前馈式网络、反馈式网络、 自组织网络) 。该方法适合于根据以前已经标识出的行为识别出一些 模式或预测出某些发展趋势,数据挖掘过程基本上是先将数据抽取, 然后分类计算权值。 关联发现方法:该方法用来对数据集合进行研究,从而试图表示 出数据内部各种属性之间的关联。关联试图揭示出记录中有关数据值 的相似事件,从而在看似毫不相干的环境中揭示出一些关系。 贝叶斯网络:基于后验概率的贝叶斯定理,是建立在对数据进行 统计处理基础上的方法。将不确定事件通过网络连接起来,可以对与 其他事件相关的事件结果进行预测,其网络变量可以是可见的,也可 以隐藏在训练样本中。贝叶斯网络具有分类、聚类、预测和因果关系 分析的功能,其优点是易于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程项目可行性研究
- 妇幼保健院扩建项目风险管理方案
- 2024年六安市裕安区引进事业单位真题
- 2024年衡南县事业单位招聘真题
- 华夏古韵模板
- 颅内血肿护理个案讨论
- 电子护理记录单书写规范
- 呼吸内科康复治疗心得体会
- 幼儿园家庭教育培训内容
- 幼儿科学教育三到六岁实践心得体会
- 人教版七年级英语下册期末复习专练:任务型阅读(含答案解析)
- 2025年司法考试综合素质模拟试卷及答案
- 2023版 电压二次回路图识绘培训手册
- 【中国出口信用保险公司】2025稳外贸新兴市场开发指南
- 师德师风建设领导小组职责及活动安排
- 2025深圳辅警考试真题
- 中外航海文化知到课后答案智慧树章节测试答案2025年春中国人民解放军海军大连舰艇学院
- 部队夏季行车安全
- 计划生育门诊工作制度
- 三年级数学《两位数乘两位数口算题(共100道)》专题训练
- 《圆》导学案
评论
0/150
提交评论