




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
动手体验关联数据与开放数据 曾蕾林夏2015年七月 LinkedData LOD C FiveStepstoBecomeALinkedDataLibrarian 第1步 阅读和理解RDF数据第2步 验证RDF数据 转换格式第3步 学习和探索SPARQL查询第4步 探索可链接数据接口和API第5步 数据再处理 可视化 第1步 阅读和理解RDF数据 XMLIt salanguage astandard andatechnology It satooltolabel organize andrepresentdocumentcontent It sbothhuman andmachine readable RDFItdescribesrelationshipsthroughtriples Subject Predicate Object主语 谓语 对象 宾语 RDFstatementscanbedescribedinagraph Expressedindifferentsyntaxes includingXML plaintext n triples etc RDF XMLisoneofthem identifier lv 263p Fathersanddaughters identifier identifier identifier identifier lv 263p Fathersanddaughters hasauthor hastitle haspagination hassubject hasauthor haspagination hastitle hassubject WilliamShakespeare WilliamShakespeare Asyoulikeit Asyoulikeit GRAPH TRIPLES 要把 记录 打开了 就能联接现成的数据 示意 比如 将作者名称字符串换成其VIAF的URI 图片来源 KarenCoyle SemanticWeb LinkedDatahttp dublincore org resources training dc 2010 Tutorial3 transitional Coyle pdf http viaf org viaf 96994048 动手1 a 创建和读取一个RDF文件 并绘制它的graph http www w3 org People EM contact http www w3 org People EM contact b 动手 创建你的FOAF文件 也许这是你的第一个RDF文件 转至工具填几个字段 加1或2个朋友 生成FOAF文件 阅读RDF XML文件并解释 你的姓氏如何编码的 你的朋友如何被编码为朋友的 第2步 验证RDF数据 转换格式 转到http www w3 org RDF Validator粘贴你的FOAFRDF文档选择 triplesandgraph 点击 ParseRDF 2 3 4 www w3 org RDF Validator 动手2 Itshouldlookslikethis http marciazeng slis kent edu MarciaZeng rdf 现在 看一下效果 验证正确吗 你有没有可视化的关系 一些提示 如果引号不是纯文本 计算机不能处理的 试试 如果你将你做的FOAF文件放到这里 可以转换成很多格式 RDF有很多种格式 不要怕 那是机器的任务 http www easyrdf org converter Austen Jane AustenJane prefixschema aschema Person schema name Austen Jane schema familyName Austen schema givenName Jane 简 奥斯汀规范文档格式1 机器直接转成格式2 第3步 学习和探索SPARQL查询 SPARQL是关联数据的查询语言 W3C推荐标准从结构化和半结构化数据中取值通过提问未知关系来探索数据用简单的提问式来建立复杂的 跨数据库的联结点将RDF数据从一种数据模型的词汇转换成另一种词汇SPARQL提问式是针对有RDFgraphs的RDF数据集来操作 ref SPARQL 看上去非常复杂 用起来非常方便具体的应用经常要写很复杂 很长的提问式提问式可以事先准备好范例 通过界面操控 如GettyAAT等 提问式也可以藏在幕后 界面只是各种选项 还可以提供生成提问式的工具 下面我们会用一个 PREFIXdataset SELECT uri influencedByWHERE uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Pablo Picasso i UNION uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Henri Matisse i 有许多实用的关联数据SparqlEndpoint可供练习 演示 OpenLinkVirtuoso Open PREFIXfoaf SELECT nameWHERE personfoaf name name 演示 Dbpedia 采用Sparql提问式从dbpedia中获取数据 然后可视化http dbpedia org sparql PREFIXdataset SELECT uri influencedByWHERE uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Pablo Picasso i UNION uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Henri Matisse i 1 在DbpediaSPARQLendpoint 输入检索公式 从 艺术家 类别中 发现 谁是受毕加索Picasso和马蒂斯Matisse影响的艺术家 输出数据格式多样 SELECT WHERE s p o 1 大致过程 2 2 部分结果 3 对部分结果用GEPHI工具来对结果进行可视化 3 From Overview mode trydifferentsettings Showtext adjusttextsize color etc Tip FollowGephiTutorialQuickStarthttp gephi org tutorials gephi tutorial quick start pdf Goto http marciazeng slis kent edu metadata sparqlTemp html 如果你不是一个日常SPARQL语言用户 可能做提问式不是那么容易 所以 我们创建了一个工具 动手3 做一SPARQL提问式 步骤 在模板中选项 下面是这个演示的查询将用于 从 艺术家 类别中 发现 谁是受xxx影响的人 xxx如 毕加索Picasso和马蒂斯Matisse输出数据将包含艺术家的URISubmit 将拿到的SPARQL提问公式copy paste到DBpedia sendpointhttp dbpedia org sparql PREFIXdataset SELECT uri influencedByWHERE uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Pablo Picasso i UNION uriadataset Artist uridataset influencedBy influencedBy filterregex influencedBy Henri Matisse i 将这个box清理干净 然后paste 先选html看看 然后选CSV格式存档 之后便可以到Gephi去做图像了 2 应该有这种结果 以后可对部分结果用GEPHI工具来对结果进行可视化 3 第4步 探索可链接数据接口和API GettyVocabularyEndpoint 演示 到GettyLOD艺术与建筑叙词表 地理名称叙词表 艺术家人名规范文档获取知识性数据 http vocab getty edu queries 动手4 GettyLODhttp vocab getty edu queries4 11MembersoftheEuropeanUnion4 12MembersoftheUnitedNations5 2AssociativeRelationsofAgent找500010879 LeonardodaVinci 动手5 IdentifyadomainofyourinterestandfindaLOVorSPARQLendpointforthedomainToday workwiththeRomanCoinsexerciseDemo 古代罗马硬币研究网站OnlineCoinsoftheRomanEmpire OCRE http numismatics org ocre OnlineCoinsoftheRomanEmpire OCRE TheAmericanNumismaticSociety 古代罗马硬币研究网站OnlineCoinsoftheRomanEmpire OCRE http numismatics org ocre 本体构建 多种属性描述的目录 在后端数据为RDF三段式形式 完全用SPARQL提问公式支撑 用户在前端用多种选择形式和可视的分面 过滤功能查找 浏览 OnlineCoinsoftheRomanEmpire OCRE TheAmericanNumismaticSociety 也可以直接看统计分析结果 地理分布等 本体构建 多种属性描述的目录 在后端数据为RDF三段式形式 完全用SPARQL提问公式支撑 3 先看看HTML出来的结果 然后重新存成CSV文档 练习 将SPARQL提问公式在endpoint上交后 获取数据构建者为了讲解SPARQL提供了一些sparql公式源码 总体过程 1 你可以上 这个提问是要索取 古代罗马Republicancoinage发行的硬币的种类数 并按照硬币英语名称分组和排序 第1个例子 古代罗马Republicancoinage发行的硬币的种类数 并按照硬币英语名称分组和排序 PREFIXnm PREFIXnmo PREFIXdcterms PREFIXskos SELECT label count mint as count WHERE typesnmo hasMaterialnm ar dcterms sourcenm rrc nmo hasMint mint mintskos prefLabel label FILTERlangMatches lang label en GROUPBY labelORDERby label 具体操作步骤 1 将第1个例子的语句copy paste到http nomisma org sparql2 先看看HTML出来的结果3 然后选CSV文件格式 存档 4 如果打开文件 应该像spreadsheet下面你就可以用其它工具来看数据了 比如说 googleFusionTable5 Loginat 从下面开始copy source 3 先看看HTML出来的结果 4 然后重新存成CSV文档 2 copy paste放到这里的endpointhttp nomisma org sparql 以便在此获取数据 这个提问是要索取 古代罗马Republicancoinage发行的硬币的种类数 并按照硬币英语名称分组和排序 5 到Google做FusionTable融合表 Loginat 6 将CSV文件上传 7 Google融合表可以有各种输出 如果你还想试一个 那么就做第二个例子 VisualizeGreekcoinproduction 希腊硬币生产可视图source PREFIXdcterms PREFIXgeo PREFIXnm PREFIXnmo PREFIXskos SELECT label lat longWHERE mintsanmo Mint skos prefLabel label dcterms isPartOfnm greek numismatics geo location loc locgeo lat lat geo long longFILTERlangMatches lang label en 具体步骤 1 将例子的语句拷贝到http nomisma org sparql pastthequery 2 先看看HTNML出来的结果3 然后选CSV文件格式 存档 4 如果打开文件 应该像spreadsheet下面你就可以用其它工具来看数据了 比如说 googleFusionTable5 Loginat 5 到Google做FusionTable融合表 Loginat 数据类型一定要正确 如果是经纬度 就应该是 location 第5步 数据再处理 可视化 Readytousehttp en dataviva info http en lodlive it Readytobuildhttp gaphi org http cytoscape org VisualProgrammingToolsRpackagesD3 js Readytouse Example1 http en dataviva info Readytouse Example2 Lodlive http en lodlive it http en lodlive it OtherVisualizationExamples http X Bottlenose TweetDataVisualization Bottlenose theworld sfirstreal timevisualanalyticstool 回去后试试RelFinder InteractiveRelationshipDiscoveryinRDFData http www visualdataweb org Example FindrelationsbetweenLeonardodaVinciandRenaissance basedonDBpediadataset 1 PointingtoaSPARQLendpoint2 Typetwotermstofindmatchingentries 3 Thetoolwilldisplaythetriplesonebyone4 Clickonanyconcepttohighlighttherelations LeonardodaVinciandRenaissance basedonDBpediadataset 2 Readytobuild Gaphivs Cytoscape 回去后试试 http gaphi org http cytoscape org CytoscapeQuickTutorial 4种方式创立网络图Importingpre existing fixed formatnetworkfiles Importingpre existing unformattedtextorExcelfiles Importingdatafromfrompublicdatabases Creatinganemptynetworkandmanuallyaddingnodesandedges CytoscapeQuickTutorial 网络图的优化LayoutStyles colors fonts etc forlin
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大学生暑期“三下乡”社会实践总结模版
- 组态软件技术整体教学设计-张松枝
- 糖原累积病Ⅵ型的临床护理
- 小米3小米电视发布会
- 广西南宁市第四十九中学2025届数学七下期末综合测试模拟试题含解析
- 统编版语文一年级上册1秋天 课件
- 医学生模拟谈话技能培训大纲
- 2025年秋学期初二家长会班主任发言稿模版
- 2025年民办学校审工作总结模版
- 狂犬病医学发展史
- 汽机发电量计算
- 西南交通大学《行车组织》区段站工作组织课程设计(附大图)
- GB∕T 1457-2022 夹层结构滚筒剥离强度试验方法
- 康复治疗技术(康复养老服务)专业群建设方案
- 防止水电站水淹厂房措施研究报告
- 卫生监督稽查规范
- 第五章结型场效应晶体管
- 修正责任准备金
- 丽声北极星自然拼读绘本第一级Uncle Vic‘s Wagon 课件
- authorware7程序设计制作一个时钟
- 变速器换挡叉的加工工艺规程及工装设计带图纸】
评论
0/150
提交评论