




已阅读5页,还剩80页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,知识管理KnowledgeManagement,李海生Li_haisheng,2,课程邮箱,btbukmPWD:12345678,3,与知识管理相关的Topic,信息检索InformationRetrieval知识工程KnowledgeEngineering语义网SemanticWeb本体Ontology资源描述框架ResourceDescriptionFramework本体描述语言OntologyWebLanguage知识网格KnowledgeGrid面向服务的架构Service-OrientedArchitecture知识管理成熟度模型KnowledgeManagementMaturityModel(K3M)知识管理案例,4,知识管理标准,知识管理标准国家标准GB/T23703.1欧洲标准澳大利亚国家标准加拿大国家标准英国国家标准美国APQC标准(美国生产力与质量中心AmericanProductivityandQualityCenter),5,知识管理国家标准,框架术语组织文化知识活动实施指南评价,6,知识管理业务流程知识管理成熟度模型K3M知识管理评估模型,7,上次课程内容回顾,元数据召回率(Recall)检索出的相关文档数和文档库中所有的相关文档数的比率衡量的是搜索引擎的查全率精度(Precision)检索出的相关文档数与检索出的文档总数的比率衡量的是搜索引擎的查准率,8,语义Web,语义Web的基础架构TimBerners-Lee,2000,9,语义网书籍推荐,10,语义网书籍推荐,11,元数据表示语言,标记语言标准通用标记语言SGML超文本标记语言HTML可扩展标记语言XML虚拟现实模型语言VRML无线标记语言WML元数据标准DublinCoreHL7(描述医学网络资源的元数据)教育资源元数据机读目录(MARC),12,XML,性质W3C于1998年2月发布的一种标准是SGML的一个简化子集可扩展标记语言特点较好地解决了HTML无法表达数据内容等问题允许各个组织、个人建立适合自己需要的标记集合,13,XML与HTML比较,文档的3个要素数据、结构以及显示方式HTML显示方式内嵌在数据中在创建文本时,要时时考虑输出格式创建文档的重复工作量大不易抽取语义信息XML显示格式从数据内容中独立出来,保存在样式单文件(StyleSheet)中自我描述性质能够很好地表现许多复杂的数据关系,14,XML结构,文件头与HTML类似,是可选的文件主体包括一个或多个元素形式是一棵分级的树混杂的“结尾部分”由注释、处理指令和空白组成注释用表示,可在文档中任意位置,15,元素(Element),表示方法由开始标记、结束标识以及标识之间的数据构成标记之间的数据被认为是元素的值每个元素都有不同的标记名王力元素名是director元素值是“王力”王力元素名是actor元素值是“王力”,16,元素要点,关键的3点所有元素必须有结束标记所有元素必须正确嵌套,不允许交迭所有属性值必须加引号注意点XML文档主体有且仅有一个XML根元素可以嵌套XML元素,形成一棵树形结构,17,XML文档例子,数据结构许卓群等数据挖掘韩家炜等,18,例子的树状结构,19,XML属性,给元素提供进一步的说明信息必须出现在起始标记中以名称/取值对出现,属性名不能重复名称与取值之间用等号“=”分隔用引号把取值引起来例如100000说明了工资的货币单位是人民币元,20,XML处理器,目的解析XML文档提供对XML文档内容和结构的访问文档对象模型(DocumentObjectModel,DOM)将完整的XML转换成一棵树的形式放在内存中供随机访问元素、属性XML简单API(SimpleAPIforXML,SAX)采用事件驱动模型通过标记的起止来触发事件DOM与SAX的比较(讨论),21,处理指令(ProcessingInstruction),目的给XML处理器提供信息,使其能够正确解释文档内容表示起始标记是“”方法XML分析器把这些信息原封不动地传给应用程序由应用程序来解释这个指令遵照它所提供的信息进行处理,22,两种处理指令,XML声明必须包括version属性,指明所采用的XML的版本号,而且它必须在属性列表中排在第一位standalone属性表明该XML文档是否和一个外部文档类型定义DTD配套使用encoding属性则指明了数据所采用的编码标准XSL样式单引用告诉XSL样式单解析器,样式单的类型是text-xsl类型text-xsl可以在文档contacts.xsl中找到,23,XML的名字空间,背景由于XML对互操作性的支持,每个人都可以创建属于自己的XML词汇不同的开发者会用相同的元素来代表不同的实体作用为XML文档元素提供了一个上下文允许开发者按一定的语义来处理元素为什么引入NS(命名空间)讨论,24,XMLNS例子,?xmlversion=1.0?hamburgersxmlns:purchase=/franchise/pricesxmlns:sales=/customer/priceshamburgerlowfat=dreamonnameCowBurger/namedescriptionGreasyandgood./descriptionpurchase:price0.99/pricesales:price2.99/price/hamburger/hamburgers,25,XSL(ExtensibleStylesheetLanguage),背景用标准的DOMAPI来实现XML数据的交互,是十分单调乏味的如想找到所有满足某些条件的元素,或转换为简单的HTML表格,必须手工书写代码遍历整棵树来寻找目的为标准化及简化人们完成这些任务所需做的工作,26,食品的例子,XML文档月饼中秋节食用的传统食品2.99,HTML文档食品月饼,中秋节的传统食品,2元,27,XSL文件,28,XSL用途,增强了互操作性XML数据转换为HTML从一种XML格式到另一种XML格式之间的转换开发人员不用为了描述某种类型的数据而采用通用的词汇某个人向你的系统发送了一篇XML文档,而你的系统不认识它所采用的XML词汇只要进行一次简单的XSL转换就可以得到自己熟悉的词汇,29,文档类型定义DTD,目的定义XML文档结构,即其中的元素、属性以及元素之间关系的定义了文件中的元素能用什么名字,能放在什么位置,应该怎样组合可以检测XML文档的结构是否正确例如描述一组,其中每个又可以包含若干个DTD中应该有语句:生成的表:管乐弦乐器乐,30,DTD引用,内部引用包含在XML文档的前导说明部分如文档体外部引用作为一个外部文档被引用如文档体SYSTEM指一个作者或组织所编写的通用的DTD或是PUBLIC指由权威机构制订的、提供给特定行业或公众使用的DTD,31,DTD中ETD(元素类型声明),作用声明所有有效的文档元素结构类型空元素类型使用空元素标记,元素中没有内容ANY元素类型元素中可以包含任何内容父元素类型元素中可以包含子元素在DTD中通过正则表达式规定子元素出现的顺序和次数混合元素类型元素中可以包含文本文本之间可以有选择地插入子元素,子元素出现的顺序和次数不受限制,32,XMLSchema,DTD缺点采用了非XML的语法规则不支持数据类型扩展性较差XML模式己经渐有取代DTD的趋势拥有比DTD更强大的功能用于更精确和有效地描述XML文档结构,33,XML模式的优点,一致性直接借助XML自身的特性利用XML的基本语法规则定义XML文档的结构不必再利用一种特定的形式化的语言扩展性引入了数据类型、命名空间在基本数据类型基础上用户可自己扩展数据类型互换性利用模式能够书写XML文档并验证文档的合法性对不同的模式进行转换,以实现更高层次的数据交换规范性利用元素的内容和属性来定义XML文档的整体结构基于XML,更具有规范性,34,数据类型,用途为ElementType和AttributeType指定数据类型基本数据类型(10种)entity,entities,enumeration,id,idref,idrefs,nmtoken,nmtokens,notation和string扩展数据类型bin.baSe64,bin.heX,boolean,char,date,dateTime,dateTime.tz,fixed.14.4,float,int,number,timetime.tz,i1,i2,i4,r4,r8,ui1,ui2,ui4,uri,uuid,35,XMLS元素类型,基本格式取值及含义(略),36,XMLS属性类型,基本格式取值及含义(略),37,数据类型的使用例子(1),定义元素“名字”和“生日”其中string和date类型都是Schema中自带的基本数据类型minOccurs和maxOccurs是最少和最多出现次数的约束,这里表示有而且只出现一次,38,数据类型的使用例子(2),扩展数据类型Schema中没有规定的类型,如“性别”类型定义例子注释name属性是该数据类型的名称数据类型由restriction子元素进行约束该元素中的base属性是基类型,39,元数据自动抽取技术,预处理剔除在格式、内容、语言等方面存在问题或严重缺失的文档产生格式相对规整的文本文档提取元数据由数字化文档元数据的规范定义,产生提取元数据的各种模式依据元数据模式进行数字化文档的挖掘与匹配利用与数字化文档相关的启发式规则和经验规则,有效提取元数据,40,MathML,含义MathematicalMarkupLanguage用途用来描述数学符号、纪录其结构和内容目标是在Web上实现能像HTML处理文本一样,处理数学问题,41,例:x2+4x+4=0,applyplus/applypower/cix/cicn2/cn/applyapplytimes/cn4/cncix/ci/applycn4/cn/apply,42,SMIL,含义SynchronizedMultimediaIntegrationLanguage用途一种基于XML的表述多媒体演示的语言将一组独立的多媒体对象整合为一个多媒体演示,43,SMIL例子,HTMLHEADSTYLE.timebehavior:url(#default#time);/STYLE/HEADBODYDIVCLASS=timet:timeline=seqPclass=timet:dur=1Thisappearsforonesecondandgoesaway/PPclass=timet:dur=1Thisappearsafteronesecond,remainsvisibleforonesecondandgoesaway/PPclass=timet:dur=1Thisappearsaftertwoseconds,remainsvisibleforonesecondandgoesaway/P/DIV/BODY/HTML,44,CDF,含义ChannelDefinitionFormat一种开放的规格允许Web的发布者经常更新信息或是频道CDF起到了频道内容目录的作用用户仅需选择一下频道信息就会从Web服务器定时的传递到客户端,45,资源描述语言RDF,46,资源描述框架语言RDF,采用元数据来索引网络上的信息使用RDF(ResourceDescriptionFramework)来描述元数据以及元数据之间的关系元数据是“关于数据的数据”,是用来描述网络资源的数据。RDF是处理元数据的基础,它为在应用程序之间交换机器可理解的网络数据提供了可互操作性。,47,RDF的应用领域,RDF可以应用在很多领域中在资源发现中,RDF可以增强搜索引擎语义处理能力在编目领域中,RDF可以用来描述某个网站、网页之间或者数字图书馆中的内容及内容之间的关系采用RDF的智能主体(Agent)能够提高机构之间知识共享和交换的能力,48,RDF的作用?,RDF(ResourceDescriptionFramework)来描述元数据以及元数据之间的关系长江的XML描述文档,HereisdataabouttheYangtzeRiver.Ithasalengthof6300kilometers.ItsstartingLocationiswesternChinasQinghai-TibetPlateau.ItsendingLocationistheEastChinaSea.,49,XML-RDF,50,RDF格式,RDFprovidesanIDattributeforidentifyingtheresourcebeingdescribed.,TheIDattributeisintheRDFnamespace.,Addthefragmentidentifiersymboltothenamespace.,1,2,3,51,RDF格式(cont.),52,命名规则,53,RDF格式,54,使用RDF格式的好处,TheRDFformat,ifwidelyused,willhelptomakeXMLmoreinteroperable:Toolscaninstantlycharacterizethestructure,thiselementisatype(class),andhereareitsproperties”.RDFpromotestheuseofstandardizedvocabularies.standardizedtypes(classes)andstandardizedproperties.TheRDFformatgivesyouastructuredapproachtodesigningyourXMLdocuments.TheRDFformatisaregular,recurringpattern.Itenablesyoutoquicklyidentifyweaknessesandinconsistenciesofnon-RDF-compliantXMLdesigns.Ithelpsyoutobetterunderstandyourdata!Youreapthebenefitsofbothworlds:YoucanusestandardXMLeditorsandvalidatorstocreate,edit,andvalidateyourXML.YoucanusetheRDFtoolstoapplyinferencingtothedata.ItpositionsyourdatafortheSemanticWeb!,Networkeffect,Interoperability,55,使用RDF格式的缺点,受限制:在设计XML文件时受到RDF格式的约束.RDF使用命名空间来唯一识别类(types/classes),属性和资源。要求对命名空间有准确的理解。必须掌握RDF格式的语法。,56,唯一识别资源,EarlierwesaidthatRDFisveryconcernedaboutuniquelyidentifyingthetype(class)andtheproperties.RDFisalsoveryconcernedaboutuniquelyidentifyingtheresource,e.g.,Thisistheresourcebeingdescribed.Wewanttouniquelyidentifythisresource.,57,rdf:ID,Thevalueofrdf:IDisarelativeURI.ThecompleteURIisobtainedbyconcatenatingtheURLoftheXMLdocumentwith#andthenthevalueofrdf:ID,e.g.,SupposethatthisRDF/XMLdocumentislocatedatthisURL:/geography/rivers.Thus,thecompleteURIforthisresourceis:,Yangtze.rdf,58,xml:base,OnthepreviousslideweshowedhowtheURLofthedocumentprovidedthebaseURI.Dependingonthelocationofthedocumentisbrittle:itwillbreakifthedocumentismoved,oriscopiedtoanotherlocation.AmorerobustsolutionistospecifythebaseURIinthedocument,e.g.,ResourceURI=concatenation(xml:base,#,rdf:ID)=concatenation(/geography/rivers,#,Yangtze)=/geography/rivers#Yangtze,59,rdf:about,不使用相对的URI,而是用rdf:about标识出完整的资源URI。,60,RDF三元组-资源/属性/值,61,TheRDFFormat=triples!,ThefundamentaldesignpatternofRDFistostructureyourXMLdataasresource/property/valuetriples!,Thevalueofapropertycanbealiteral(e.g.,lengthhasavalueof6300kilometers).Also,thevalueofapropertycanbearesource,asshownabove(e.g.,property-AhasavalueofResource-B,property-BhasavalueofResource-C).Wewillseeexamplesofpropertieshavingaresourcevalueinalittlebit.,Value-C,valueofproperty-A,valueofproperty-B,NoticethattheRDFdesignpatternisanalternatingsequenceofresource-property.Thispatternisknownasstriping.,62,命名规范,类名的第一个字母大写,属性名的第一个字母小写。便于快速识别类名,属性名。,uppercase,lowercase,63,RDFModel(graph),Legend:EllipseindicatesResourceRectangleindicatesliteralstringvalue,64,rdf:Description+rdf:type,ThereisstillanotherwayofrepresentingtheXML.Thiswaymakesitveryclearthatyouaredescribingsomething,anditmakesitveryclearwhatthetype(class)isofthethingyouaredescribing:,Thisisreadas:ThisisaDescriptionabouttheresource/geography/rivers#Yangtze.ThisresourceisaninstanceoftheRivertype(class).The/geography/rivers#Yangtzeresourcehasalengthof6300kilometers,astartingLocationofwesternChinasQinghai-TibetPlateau,andanendingLocationoftheEastChinaSea.,Note:thisformofdescribingaresourceiscalledthelongform.Theformwehaveseenpreviouslyisanabbreviationofthislongform.AnRDFParserinterpretstheabbreviatedformasifitwerethislongform.,65,Alternative,Alternativelywecanuserdf:IDratherthanrdf:about,asshownhere:,66,EquivalentRepresentations!,Note:IntheRDFliteraturetheexamplesaretypicallyshowninthisform.,67,RDFNamespace,68,术语,AsyoureadtheRDFliteratureyoumayseethefollowingterminology:Subject:thistermreferstotheitemthatisplayingtheroleoftheresource.predicate:thistermreferstotheitemthatisplayingtheroleoftheproperty.Object:thistermreferstotheitemthatisplayingtheroleofthevalue.,69,RDFParser,ThereisaniceRDFparserattheW3Website:,ThisRDFparserwilltellyouifyourXMLisintheproperRDFformat.,70,Example#2,Yangtze2.xml,ModifythefollowingXMLdocumentsothatitisRDF-compliant:,71,Notethetwotypes(classes),River,Dam,Instance:YangtzeProperties:lengthstartingLocationendingLocation,Instance:ThreeGorgesProperties:namewidthheightcost,72,Dam-outofplace,Dam,Types(classes)containproperties.HereweseetheRivertypecontainingtheproperties-length,startingLocation,andendingLocation.ItalsoshowsRivercontainingatype-Dam.Thus,thereisaResourcethatcontainsanotherResource.ThisisinconsistentwithRDFdesignpattern.(WeareseeingoneofthebenefitsofusingtheRDFformat-toidentifyinconsistenciesinanXMLdesign.),73,PropertyvaluemustbeaLiteraloraResource,6300kilometers,property,ValueisaLiteral,property,ValueisaResource,74,ModifiedXML(tomakeitconsistent),Yangtze2,v2.xml,TheYangtzeRiverhasanobstaclethatistheThreeGorgesDam.TheDamhasaname-TheThreeGorgesDam.Ithasawidthof1.5miles,aheightof610feet,andacostof$30billion.,75,RDFFormat,Changedidtordf:ID,Addedthe#symbol,Asalways,theotherrepresentationsusingrdf:aboutandrdf:Descriptionareavailable.,76,RDFModel(graph),77,6300kilometerswesternChinasQinghai-TibetPlateauEastChinaSea,Three-Gorges-Dam.rdf,Alternatively,supposethatsomeonehasalreadycreatedadocumentcontaininginformationabouttheThreeGorgesDam:,Yangtze.rdf,ThenwecansimplyreferencetheThreeGorgesDamresourceusingrdf:resource,asshownhere:,78,Note:referenceistoaresource,nottoafile,79,Anyone,Anywhere,AnytimeCanTalkAboutaResource,Inallofourexampleswehaveprovidedauniqueidentifiertoresources,e.g.,Consequently,ifanotherRDFdocumentidentifiesthesameresourcethenthedatathatitspecifiesgivesadditionaldataaboutthatresource.Anaggregatortoolwillbeabletocollectalldataaboutaresourceandpresentaconsolidatedsetofdatafortheresource.Thatspowerful!,80,rdf:IDversusrdf:about,Whenshouldrdf:IDbeused?Whenshouldrdf:aboutbeused?Whenyouwanttointroducearesource,andprovideaninitialsetofinformationaboutaresourceuserdf:IDWhenyouwanttoextendtheinformationaboutaresourceuserdf:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石油批发企业财务风险防范考核试卷
- 部编版四年级语文下册习作《游-》精美课件
- 2025全面合同租赁手册
- 水彩花草树木教学课件
- 2025职员借用合同协议书
- 2025届广东省深圳市高三二模历史试题(含答案)
- 2025年合同法疑难点睛:常见合同法律问题解析
- 2025年的上海合同范本
- 2025中介服务合同书
- 2025小学道德与法治教师课标考试模拟试卷附参考答案 (两套)
- 仁爱版初中英语单词表(默写版)
- 企业防渗漏标准做法案例库图文丰富
- Unit 2 Listening and talking -高中英语人教版(2019)必修第一册
- 医院分娩记录单
- GB/T 17872-1999江海直达货船船型系列
- GB/T 12027-2004塑料薄膜和薄片加热尺寸变化率试验方法
- 中医手诊培训资料课件
- 消防主机运行记录表(标准范本)
- 应急处置措施交底
- Q∕GDW 12154-2021 电力安全工器具试验检测中心建设规范
- 第四章 金融监管(商业银行管理-复旦大学)
评论
0/150
提交评论