网络环境下信息组织应用ppt课件_第1页
网络环境下信息组织应用ppt课件_第2页
网络环境下信息组织应用ppt课件_第3页
网络环境下信息组织应用ppt课件_第4页
网络环境下信息组织应用ppt课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络环境下信息组织的应用,1自然语言的应用2搜索引擎的应用3知识组织的发展4在e-B和e-G的应用,1,自然语言的应用,自然语言在信息组织中的使用是大势所趋。自然语言处理NLP,以计算机为工具对自然语言进行智能处理的技术。是一门交叉性学科,涉及计算机、数学、语言学多个学科。P243自动分词、自动标引、自动分类、自动文摘、人机接口、问答系统、机器翻译等;自然语言检索:全文检索,搜索引擎.,2,全文检索Full-TextRetrieval,20世纪80年代开始,到90年代。首先得益于数字化文本,全文信息源。全文检索系统是从全文数据库中,通过各种逻辑关系,允许用户使用自然语言进行检索,直接获取原文中的信息。核心技术:高效索引。以关键词的形式与索引数据库进行匹配,包括字符串检索、截词检索、位置检索等技术。,3,如何建立全文索引?,如何将源文档中的所有基本元素适当的记录到索引库中?分词(中文)停用词过滤建立索引字索引方式(字表法):以单字为基础进行检索方法.词索引方式(词表法):以词或词组为检索单位.统计方法N-Gram法词索引+BI-Gram法:最佳中文文本索引法.,4,网络搜索引擎的诞生,搜索引擎的检索思想源起于全文信息检索理论,一般以词为单位。通过计算机程序扫描每个网页中的每个词,建立词索引。网络检索工具的近十年的发展,搜索引擎已融合了多种技术完善自身检索能力:智能扩展技术、自动反馈技术、个性化检索、关联检索、检索结果组织等。,5,发展历程,关键词匹配检索简单提问式输入检索(QA系统)问题分析信息检索答案提取基于自然语言理解的检索基于语义的检索,6,存在的问题,用户界面不易准确表达用户的搜索意图;专题性的搜索引擎较少;部分搜索引擎的索引数据库不及时,搜索出来的信息有些已过时,甚至存在错误链接或“死链接”;对网上信息检索效果的评价没有一个统一的标准;搜索引擎的选择多是根据经验进行初步选择,还没有形成一套固定的选择原则和方法;网络信息组织的局部有序性与整体无序性。,7,未来搜索引擎的发展趋势,(1)建立垂直化专业领域搜索引擎;(2)搜索引擎的智能化发展;(3)多媒体搜索是趋势;(4)促进搜索引擎的本土化、结构化、个性化;(5)增强搜索引擎的知识处理能力和理解能力;(6)实现自然语言和受控语言一体化;(7)对索引数据库的规范化组织和管理;(8)搜索引擎集成化;(9)实现检索语言自然化;(10)关联式的综合搜索。,8,搜索引擎的系统结构,9,搜索引擎的使用方法,布尔逻辑检索截词检索词组与名称检索范畴检索图像检索,10,实例1.Google,1998年Stanford大学LarryPage和SergeyBrin,11,实例2.百度,1999年底美国硅谷李彦宏、徐勇,12,元搜索引擎,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。,客户端浏览器,请求提交,索引结果显示、去重,接口代理,引擎1,引擎2,.,用户,元搜索引擎,其它搜索引擎,13,14,知识组织知识的定义,知识:对信息经过吸收与消化,由个人或组织所拥有,据以产生信仰、行动与决策,包括经验、专业技术、价值、见解、经文字外显的信息等。显性知识:指记录在各种介质上的知识,如图书、档案、数据库、各种计划、总结报告、报表等。显性知识是具有有形的物质载体、被符号化了的知识,它是知识的一种沉淀,属静态知识。隐性知识:是指存在于人的头脑中的未被编码的经验性知识,如个人的技术诀窍、直觉、想象与创意等,是高度个性化的且难以格式化的知识,是活跃着的动态知识,而且只能通过与知识专家直接合作与交流才能获得。显性知识与隐性知识的相互转化:显性知识通过学习即成为隐性知识,隐性知识记录下来(即符号化)即转变为显性知识。,15,知识组织的提出与发展,1929年英国著名的分类法专家HE布利斯就曾使用过“知识组织”1989年,在德国法兰克福成立了国际性学术机构“国际知识组织学会”(ISKO)自1993年1月1日起,历史悠久、影响广泛的国际性学术刊物国际分类法(IC)更名为知识组织(KO),16,知识组织的目标,对知识进行组织,使知识存贮有序化并且可获取。也就是说,运用有效方法处理知识的存贮,使那些在知识获取方面受到物理限制的人能够对知识加以利用。发展推力:用户的信息需求:从信息需求的角度出发,不再满足于一般层次的文献服务、信息服务,而是要求通过文献信息的深层次开发,将分散的专门知识信息加以集中利用,将分散在本领域及其相关领域的专门知识信息加以集中组织,进行文献信息的内涵知识二次开发,进行知识重组,从中提炼出对用户的研究、开发与管理创新思路的形成起着至关重要作用的“知识基因”,供人使用。技术发展:有关知识组织的核心技术包括文本映像、摘要整理、概念聚类、语义索引。新的技术包括采用XML技术、基于本体的知识组织、语义网络等。,17,图书馆知识组织,18,图书馆的知识组织,图书馆的知识组织是指利用现代信息技术,将各种数据库、电子期刊、图书馆馆藏、网络资源透过知识管理的技术,加以组织、编辑,产生互动关联,使读者在检索利用上更加简便。组织对象领域知识:它是描述应用领域中客观事物的重要知识,例如学科分类知识、元数据和专业概念知识。用户知识:它包含用户个性化需求、偏好、背景知识,用户的交互、检索行为知识,以及用户对检索机制和检索结果的反馈知识。,19,图书馆知识组织技术知识表示,知识表示:知识表示是关于如何描述事物所做的一组约定,是知识的符号化过程。表示方法:说明式方法:形式简单,新事实易于加进系统,且不改变其他事实或局部过程,利于知识获取。过程型方法:便于表达如何处理问题的知识;能够表述不适合说明式方法的知识,如缺省推理和概率推理等;易于表达怎样高效处理问题的启发式知识。,20,图书馆知识组织技术知识存储,数字档案馆中的大学研究图书馆合作模型研究项目为开放式存档信息系统(OAIS)建立了一个标准参考模型。OAIS参考模型运用信息对象类目分类法(TaxonomyofInformationObjectClasses)标识和区分了用来支持数字信息与知识保存的不同种类的元数据,并把每种信息与知识和它的元数据作为一个“信息包”捆绑在一起。信息包(InformationPackage):内容信息(ContentInformation)聚集了各种保存数字资源或数据对象;保存描述信息(PreservationDescriptionInformation)聚集了各种描述元数据。,21,图书馆知识组织技术知识分析,主题分析(SubjectAnalysis)知识分析(KnowledgeAnalysis)信息分析(InformationAnalysis)领域分析(DomainAnalysis),22,针对特定的企业和产业环境,辨识出它们有那些知识需要组织,及如何去组织。领域分析是多面向的去发掘使用者的研究兴趣、信息需求、概念架构以及术语,以建构使用者导向的索引词典。,综合应用定性分析法及定量分析法,从事信息分析工作,其主要方法包括内容分析法、专家调查法、文献计量学方法、多元分析法等。以内容分析法是为基础。,以主题分析技术为基础,除分析文献中所含之知识内容外,同时以术语知识框架及学科知识框架为蓝本,搜寻适当之知识内容填入框内。,先从科学文献中,分析出代表文献内容的主题概念,再将主题概念以内涵相同的术语表示。主题分析的程序:文献的语法分析(GrammarAnalysis)、逻辑分析(LogicalAnalysis)、主题结构分析(StructuralAnalysis)、主题分面分析(FacetAnalysis)、主题范畴分析(CategoryAnalysis)以及主题标引分析(IndexingAnalysis)。,23,图书馆知识组织的方式,学科知识门户学科信息门户平台(SubjectInformationGatewayToolkit,简称SIGT)是一个能够帮助学术团体快速建立自己的专业信息门户的建站工具。它能够将分散的网络信息资源通过科学的知识组织体系进行有机集成,提供多样化的知识导航和资源检索查询服务,引导用户方便有效地实现知识的发现和获取。,24,学科知识门户组织结构,参考链接(SFX),SFX是一个基于开放链接协议体系,开放的统一资源定位器(OpenURL)标准的上下文相关的参考链接系统。SFX可以动态链接大量电子资源。文献信息机构通过SFX的引进、二次开发,充分利用学术信息网络环境中的导航与发现的工具,能为学术信息用户传递强有力的链接服务。,25,企业知识组织,26,企业知识组织,发展推力:对于一个以知识为主要资产的现代企业而言,隐性知识是培育创新、增强竞争力的关键。企业已经开始认识到他们最宝贵的资产和资源是知识,知识已成为推动经济增长的动力,将把企业的知识资源纳入其管理之中。因此,企业知识组织研究是知识管理研究的发展趋势之一,建立企业知识库已成为企业进一步发展所必需的基础设施以及企业决策所必需的专家支持系统,也是企业在激烈的竞争中保持不败的保证。,27,企业知识组织对象,企业基本信息,包括公共关系信息,年度报告,出版物,企业总体介绍等;企业组织结构信息,包括地址、代理商、分公司、服务中心等的信息;产品和服务的信息,包括技术专长、服务特点等;基本运作流程信息;关于专利、商标、版权,使用其他企业技术、方法许可证的信息;顾客信息。,28,企业知识库,知识库是以一致的形式存储知识的机构。知识库中的知识是高度结构化的符号数据。知识库具有比数据库更强的知识组织功能。信息数据库属于知识库的一部分,但知识库的内容要广泛得多。知识库在信息技术的支持下多以数据库的形式存在,它包含信息使用者所需的相关知识和信息的内容或地址。它所涉及的信息的载体既可以是物质载体,也可以包括有此类知识的人,即显性知识和隐性知识的汇合。,29,企业知识库的作用,知识库使信息和知识有序化,是知识库对组织的首要贡献;知识库加快知识和信息的流动,有利于知识共享与交流;知识库还有利于实现组织的协作与沟通;知识库可以帮助企业实现对客户知识的有效管理。,30,企业知识门户,企业知识门户(EnterpriseKnowledgePortalEKP)是EIP的一种新表现形式。EKP更关注于企业内部员工和信息内容,它是知识管理系统KM与企业信息门户EIP的结合。企业知识门EKP是企业员工日常工作所涉及相关主题内容的统一入口,通过企业知识门户,任何员工都可以实时地与工作团队中的其它成员取得联系、寻找到能够提供帮助的专家或者快速连接到相关的知识。企业知识门户是信息集成、知识分类、个性化展示和系统资源管理的集成。,31,企业知识门户的基本服务,经验知识管理:案例管理、知识文档、工作总结、专家网络、培训系统、考试系统;事务协作管理:规范制度、审批流程、公文流转、个人工作台,团队协作;组织文化管理:内部论坛、网上调查、贺卡系统、电子期刊、员工活动、文化窗口;信息发布管理:主页管理、新闻系统、电子邮件;系统维护管理:系统配置库、催办系统、登录配置库、网络域搜索、帮助系统;可选扩展模块:人事档案管理、ISO文控管理、合同管理、图书管理、技术支持;知识管理工具:CKO工具箱、知识推进、知识地图、知识评测、知识审计。,32,知识组织的工具知识仓库,知识仓库是一种特殊的信息库,库中元数据有相关的语境和经验参考。许多人用知识仓库这个术语代替数据库和信息库这两个词,以此迎接知识管理的浪潮。真正的知识库远比这两个概念复杂,知识仓库拥有更多的实体,它不仅仅存储着知识的条目,而且存储着与之相关的事件、知识的使用记录、来源线索等等相关信息。正确运用知识不仅仅需要人们了解表示知识的信息、数据,人们还要了解与这条知识相关的语境,因此在帮助人们利用知识的作用上,知识仓库要比数据库更有效率。,33,知识仓库的体系结构,知识条目:与知识相关的事件、知识的使用记录、来源线索等等相关信息;,语境信息:通过知识的关联信息了解与这条知识相关的信息。,34,知识组织的工具主题地图,TopicMaps(Topics,Associations,Occurrence):即主题、关联及呈现,涵盖其广度、深度以及相互关系。即是电子化的主题索引,架设在WWW环境,利用XML语义标准、及DTD定义来提供运用,将资源内容所代表的主题及领域,呈现在同一层级上。主题地图的架构过程:简单说来就是将各种不同的资源,通过资源的主题内容分析,找出可代表各资源之主题(Topic),进一步定义出各主题之间的关系,加以串连,形成关联(Association),为了便于使用者利用资源,则利用参照(Occurrence)连接到资源的所在处。,35,主题地图的架构,T:Topic主题:主题指的是TopicMap文件的主题连接中,代表所指题目的元素。A:Association相互关联:主题地图中的相互关联的功能可大大提高TopicMap的功效,能够将所有对某一主题有相同关系的主题结合在一起。O:Occurrence参照:一个主题可以连结到一个以上与主题在某些部分相符的信息资源,这种资源便称为主题的参照处。参照处可以是针对某一主题的专题论文、也可以是用来描述主题的图片或影片、在其它文章中简略提到的该主题、或对该主题的评论等。这些参照处通常都位于TopicMap文件之外,但他们能利用系统辅助的机制与文件相连结。,36,知识组织的工具专家系统,专家系统是一种智能信息系统,它用一定的知识和推理进程去解释通常需要人的知识和经验才能解决的复杂问题。专家系统是由知识库、推理机制、知识获取和用户界面组成。知识库包括与该专家系统所面对的问题、相关的事实、启发式知识、经验和诀窍。推理机制包括知识库管理系统和推理机,前者自动地控制、扩展更新知识库中的知识,它根据推理过程的需求去搜索适用的知识,能对知识库中的知识作正确的解释;后者在问题求解过程中生成并控制推理的进程,使用知识库中的知识,使之结构化为知识库和推理机制适用的知识。,37,知识组织的工具基于本体的知识组织,语义网(SemanticWeb)构建的核心技术。网络信息组织成一种便于计算机理解的形式语义网是信息有良好定义的,便于人机交互的,分布式网络。本体组织结构就是在RDF(资源描述框架)的基础之上构建一套逻辑体系,是让计算机理解信息的基础。,38,本体的概念,本体是共享概念化的形式化的、明晰的规范。概念化:指识别反映某些现象的相关概念的抽象模型。明晰的:对所选用的概念及其应用的限定有明确的界定。形式化的:此本体机器可读。共享:交互知识。在网络信息组织领域中,本体就是一整套对某一领域的知识进行表述的词和术语。,39,基于本体的信息组织的特点,提供了对领域知识的共同理解与描述,方便共享、交流、重用。本体由概念及概念之间的关系构成。构成本体的概念及其关系是经过精确定义的。本体主要是为计算机使用的可用的数学表达。OWL网络本体描述语言本体模式是现代网络信息组织的发展趋势满足语义检索的要求。,40,布置作业二,论文主题:数字图书馆的信息组织数字图书馆概述及其发展历程、信息组织技术在数字图书馆中的应用,及其特点,最后阐述数字图书馆今后的发展趋势。要求2500字以上;文章要有标题、分章节;条理明晰;排版美观;参考文献不少于5篇;要求有内容摘要和关键词。小组二的讲座可以以论文主题为线索进行,也可以抽取中间的一个环节进行论述。要求分工明确,各司其职;团结协作;形式多样;,41,信息组织在电子商务和电子政务中的应用,4月19日,42,电子商务的产生与发展,(1)20世纪60年代90年代:基于EDI的电子商务“无纸贸易”完成数据传输是EDI的根本目标电子数据交换(EDI),是将商业数据、信息或业务文件,按一个公认的标准进入一台计算机传输到另一台计算机上去的电子传输方法。(2)20世纪90年代以后:基于Internet的电子商务与EDI相比的优势:费用低廉覆盖面广功能更全面使用更灵活,43,电子商务的含义,简而言之,指两方或多方通过计算机和计算机网络所进行的一切商务活动。E-businessVSE-commerce值得注意的是,电子商务不仅属于计算机科学,更应属于管理科学。基于Internet的电子商务的特性:普遍性、方便性、整体性、安全性、协调性。,44,电子商务的主要模式,B2B:企业对企业特点:定单数量小,交易额大,需要商业洽谈,按照固定合同条款和商业规则进行交易。B2C:企业对消费者特点:定单数量大,订单额小,主要是按价目表或者固定价格,属于冲动购买或者偶尔购买,所以广告的作用很大。信用依靠消费者信用卡,基础设施主要是互联网的链接。C2B:消费者对企业C2B完全改变了传统商业中固定价格出售和一对一讨价还价模式,使得买方定价成为现实,单个消费者通过聚合成为强大采购集团的一份子,可充分享受到大批发商的价格买单件商品的实际利益。C2C:消费者之间网上拍卖是其主要形式,45,一般的B2C系统解决方案,查询系统分类检索系统在线订货系统在线支付系统用户注册、登录系统管理员管理系统信息分析系统,46,电子商务系统模型,47,电子商务概念模型,是对现实世界中电子商务活动的一般抽象描述,它由电子商务实体、电子市场、交易事务和信息流、资金流、物流等基本要素构成:信息流:既包括商品信息的提供、促销行销、技术支持、售后服务等内容,也包括诸如咨询价格单、报价单、付款通知单、转账通知单等商业贸易单证,还包括交易方的支付能力、支付信誉等。商流:是指商品在购、销之间进行交易和商品所有权转移的运动过程,具体是指商品交易的一系列活动。资金流:主要是指资金的转移过程,包括付款、转帐等过程。物流:指物质实体(商品或服务)的流动过程,具体指运输、储存、配送、装卸、保管、物流信息管理等各种活动。,48,电子商务系统的信息组织,电子商务系统的设计步骤(1)商务分析阶段(2)系统设计阶段(3)系统实现阶段(4)整合运行阶段,49,电子商务系统的设计步骤,第一步:全面规划企业制定整个电子商务项目所需达到的目标、购置的硬件系统规划(或新添的硬件系统规划)软件的规划(含软件的选型、实施步骤、实施周期、实施范围、人员配备)整体费用的规划整体项目的投入产出分析、风险评估等工作。,50,电子商务系统的设计步骤,第二步:后台的应用系统(即传统的MIS)供应链系统:库存管理、采购、含售前和售中的销售系统、运输后勤系统、销售分析系统等。财务系统:建立总帐、应收、应付、现金、资产管理系统、财务分析系统等。制造系统:建立工程数据管理、物料清单、生产计划/物料需求计划、能力需求、车间作业、质量管理、成本管理。客户关系管理系统:建立市场管理、销售、服务、呼叫中心等系统。商业智能/决策分析系统:在前期基本应用系统建立完成之后,应对前期积累的数据进行多维的数据分析与挖掘,建立企业各层次的决策分析系统。,51,电子商务系统的设计步骤,第三步:构造基础电子商务平台(即企业的信息门户)基于Internet的数据库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论