版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录1 实验目的12 实验设备、材料13 实验内容与实验步骤13.1 数据库名13.2 实验内容13.3 Greenstone简介13.4 安装Greenstone V 2.8623.5 Greenstone功能简介63.6 Greenstone模块介绍73.6.1 Download模块73.6.2 Gather模块93.6.3 Enrich模块103.6.4 Design模块113.6.5 Create模块133.6.6 Format模块143.7 Greenstone实验过程153.7.1 确定馆藏主题163.7.2 导入并描述馆藏资源163.7.3 定制馆藏资源的检索与浏览方式193.7
2、.4 定制馆藏功能与外观253.7.5 生成与发布馆藏资源314 实验收获与体会341 实验目的本质目的:考核学生对Greenstone软件的运用能力,提高自主创新能力。任务目的:利用Greenstone创建信管课程资料库,资料库要包含文本文档(doc.exl.ppt)、音频、图像,视频。2 实验设备、材料 电脑、u盘、Greenstone软件、Greenstone资料与案例3 实验内容与实验步骤3.1 数据库名数据库名:信管专业课程资料库3.2 实验内容实验内容:建立的库必须包含:包含文文本文档、音频、图像,视频。布局合理,显示主题。3.3 Greenstone简介Greenstone是一个
3、面向全球、基于unicode编码支持多语言的开源软件。也是一套用于创建、管理及发布数字图书馆馆藏的软件包。提供了组织信息并在因特网或CD-ROM上发布的新方法。Greenstone数字图书馆软件包的主要目的是为了帮助用户,特别是在大学图书馆以及其它公共服务机构里的用户来创建数字图书馆,鼓励信息的分享和共享。数字资源要存储到Greenstone文档中,必须经过一个导入过程。将原有的数据格式转换Greenstone系统特有的数据格式,Greenstone通过一系列插件来完成这个转换。Greenstone系统本身提供了一些常用的插件,同时也允许用户编写自己的插件放入系统中。在数据标引阶段,该系统允许
4、为资源建立不同级别层次上的索引,例如可以在文件、章、节等不同层次上建立索引。由Greenstone创建的馆藏支持各种文件格式的全文检索和基于不同元数据类型的元数据检索和浏览功能。Greenstone可以通过基于Web和基于命令批处理两种方式建立收藏,可以接受html、pdf、txt、Email、Bibliographic等格式。该系统支持文件分级浏览的全文标签,支持自动文本抽取和索引,数据转换为HTML,XML格式显示。系统可以自动抽取简单的元数据(title、email,简要描述信息等),并通过元数据实现按主题的等级浏览和按机构和作者的分类列表。Greenstone系统除了可以在因特网上发布
5、资源外,还可以用于CD-ROM方式的内容发布。Greenstone是一个完整的数字图书馆系统,包含了创建,管理和发布功能。系统提供了可视化的操作界面,使用该系统的机构或个人不需要特殊的编程开发即可直接安装使用。总结而言,Greenstone基本上可满足用户建立个人数字图书馆的需求,并且功能可以根据用户自身的需求设置,有较强的灵活性,操作简单,适合各类人群使用。3.4 安装Greenstone V 2.86双击Greenstone.exe文件。图3-1选择软件语言。V 2.86版的Greenstone能提供英语,法语,西班牙语,德语中文等多国语言,但经过亲身体验,我们发现安装英语的用户体验是最好
6、的,中文版本的适配并不完善,而且部分系统无法成功安装。图3-2阅读软件许可,主要提到Greenstone是免费的开源软件等条款,我们点击接受即可进入下一步。图3-3选择安装路径。默认是装在C盘,但是我们可以自由选择装在其他盘里。图3-4选择好目录之后,可以根据需要选择安装的组件,一般情况下我们都会选择全部安装,然后点击下一步。图3-5然后会进入管理员设置页面,因为本实验所建的资料库是我们自用的,因此我们没有设置管理员。点击下一步。图3-6然后点击“安装”,等待完成即可。图3-73.5 Greenstone功能简介Greenstone具备了个人数字图书馆的主要功能:(1)资源采集服务。帮助用户将
7、个人计算机上的自创数字资源直接导入到数据库中;提供搜索下载界面,运用http协议从网上下载资源,支持下载遵循OAI协议、Z39.50/SRW等互操作协议的数字仓储中的资源;内嵌有MediaWiki开源搜索引擎软件,在检索框中输入关键词,就可以在网络上搜索。(2)资源组织服务。允许用户采用文件夹的方式组织信息,用户可以新建文件夹,建立文件夹等级结构。文件夹内的文献采用元数据进行组织,提供多种元数据格式供用户选择,默认的元数据格式为DC元数据。可以将两种不同的元数据集融合,也可以运用辅助工具Greenstone元数据集编辑器(GEMS)修改现在的元数据。(3)查询服务。允许用户像平时浏览硬盘文件那
8、样浏览该系统的文件,也可以按照作者、题名、日期、文件夹等浏览;可以同时在多个文件夹中检索,也可以检索元数据的某一具体元素;支持全文检索;支持信息过滤功能,如可选择只显示某一格式如HTML,XML的文件;提供插件供用户自行设置,扩展符合用户需要的特定检索功能需求。(4)支持与其他数据仓储之间及元数据层面的共享。用户可以通过stoneD将Greenstone的内容导入Dspace中,也可以将Dspace的内容导入到Greenstone中。Greenstone使用的特殊格式遵循元数据编码与传输标准(METS),其元数据可以导出到METS中,也可从METS中导入元数据。用户还可以将个人数字图书馆中的资
9、源发布到网络上。(5)其他功能。包括界面个性化设置、支持多种文件格式、随时都有帮助功能、软件更新不会影响数据的使用等。3.6 Greenstone模块介绍3.6.1 Download模块Download模块的界面见图3-8,可以看出,该模块的主要工作是从互联网上下载相应的资料,可以说,这个模块就是一个通用的爬虫工具,用于抓取馆藏建设将要用到的资料。图3-8此模块下面,提供了多个下载方式,见图3-8中左上侧所示,它们分别是:Web:通过HTTP和FTP协议下载网页及文件。 MediaWiki:通过HTTP从一个MediaWiki网站上下载网页和文件。 OAI:从OAI-PMH(开放式存档倡导)服
10、务器下载元数据记录(以及文档,可选项)。 Z3950:从Z39.50服务器下载与特定搜索条件匹配的MARC记录。 SRW:从SRW服务器下载与特定搜索条件匹配的MARCXML记录。在这里,我们只使用过前两者,后面三种下载方式,我们在实验中没有用上,所以不作过多描述。第一种Web是最常见的,工作原理是输入一个种子网址,然后爬虫工具根据这个种子网站进行网页的下载与保存,在下载种子网址的时候,将会抓取到页面上的链接,进而将该链接也下载与保存下来,这样循环工作,便会把所需的资料省时省力地下载到本地。MediaWiki方式工作原理与Web类似,只是这种方式是主要针对使用MediaWiki软件作为网站的知
11、识管理和内容管理系统的那些网站。3.6.2 Gather模块Gather模块的界面见图3-9,我们可以在该模块上选定好所需的馆藏资源,然后将其复制到我们所创建的collection(馆藏集)上。图3-9从图3-9可以看到,左侧有四个文件夹,每个文件夹的作用如下:Documents in Greenstone Collections:打开该文件夹便可以看到我们在Greenstone上面创建的集合。Local Filespace: 打开该文件夹便可以看到主机上的各个盘符及里面的文件。Home Folder: 打开该文件夹便可以看到系统用户的文件夹。Downloaded Files: 打开该文件夹便
12、可以看到上一个download模块所下载的资料。图3-9中的右侧所显示的是本实验的馆藏集里的文件,将在下一部分进行描述。3.6.3 Enrich模块Enrich模块的界面见图3-10。这个模块是本系统的重点模块,作用在于选择所需的元数据集,对馆藏集里的文件进行元数据描述。图3-10图3-10中左下角可以看到一个按钮,可以打开元数据集管理的界面,在系统里预定义的元数据元素集合称为元数据集。都柏林核心元数据集就是一例,也是默认给出的一例。当将一个元数据集添加到的馆藏中后,便可选择其中的元素。可以添加多个元数据集。为了防止名称冲突,一个标识该元数据集的简短标识符将被添加到元数据元素名称的前面。比如都
13、柏林核心元数据元素创建者就成为dc.创建者。元数据集都存放在图书馆员界面的metadata文件夹中,并以.mds为后缀。Greenstone从文档中自动抽取元数据并存入一个以ex.为前缀的元数据集。这些元数据没有树结构且不可编辑。当然,对于建设小型的馆藏而言,我们一般选择都柏林核心元数据集和Greenstone自动抽取的以ex.为前缀的元数据集便可,同时也可以自由创建更适合的数据集。关于编辑文件的元数据这一工作,还有两点需要注意的,一,文件的元数据值继承自其父目录(或上级目录)。继承的元数据不能被编辑或者删除,只能被扩展。点击文件夹图标将直接转到该元数据被赋值的文件夹。二,元数据值可用层级结构
14、组织。这在元数据值树结构中则体现为用文件夹来显示内部层次。要输入层级的元数据值可使用|符号来分隔层级。例如,卡|红色|方块可以是代表一叠卡片的层级结构。这使得元数据值可以组织到一起。多组元数据值也可作为一个元数据赋予文件。3.6.4 Design模块Design模块的界面见图3-11。这个模块的作用主要在于建立查询索引和浏览索引,这两个功能也是本系统的重点内容。图3-11图3-11中左侧的四个功能分别是:Document Plugins: 这部份描述如何配置馆藏中使用的文档插件。它解释如何指定所要使用的插件,传递给这些插件的参数,以及插件以什么顺序出现。在导入文件后对文件进行处理时系统会自动使
15、用到这里的很多插件。Search Indexes: 索引指定馆藏中可被搜索的部分。这部分解释如何添加和删除索引,以及设置默认的索引。具体情况将在后文进行阐述。Partition Indexes: 索引是被建立在特别的文本或者源元数据上的。那搜索空间可以更进一步地通过分区索引来控制,也可以通过语种或者一个预先确定的过滤器。这个部份描述了如何可以做到这些。Browsing Classifiers: 这部分介绍如何指定分类浏览的选项,在此设置好用户使用时如何浏览馆藏。Search Indexes的界面见图3-12。图3-12图3-12中,正中间的内容代表目前的搜索字段有哪些,以及搜索字段的显示顺序,
16、是否有默认搜索字段。而且这些搜索索引还可以支持是否对大小写敏感,还有是否去中日韩三语进行分词的支持。Browsing Classifiers的界面见图3-13。图3-13在这里,我们可以设置供给用户浏览的方式,在这里主要介绍两种,分别是List和Hierarchy,即按列表形式浏览和按层级形式浏览。我们小组在实验的过程当中发现,对于浏览而言,因为有着按层级形式浏览可能更适合用户。3.6.5 Create模块Create模块的界面见图3-14。这个模块是用于生成馆藏的,也就是在这里系统会把之前输入进来的并被描述过的资源进行处理,使之成为真成可供浏览和检索的馆藏。图3-14这一模块功能和操作比较简
17、单,在此不再多作描述。3.6.6 Format模块Format模块的界面见图3-15。这个模块的作用是对馆藏页面的外观进行简单的定制。图3-15这个模块需要了解的功能主要是“General”、 “Search”、 “Format Features”和 “Collection Specific Macros”。它们的作用如下:General:用于录入馆藏的基本描述,如创建者和维护人员的联系方法,馆藏的名字、图标、说明等。Search:设置导航栏上各栏目的名字。Format Features:此处用于修改各个页面的网页结构,需要一定的HTML基础。Collection Specific Macro
18、s:此处用于修改整个网站的风格与网页结构,需要一定的HTML基础。3.7 Greenstone实验过程整个实验过程除了前面对Greenstone的预学习外,主要包括以下四个步骤,分别是确定馆藏主题、导入并描述馆藏资源、定制馆藏资源的检索与浏览方式、定制馆藏外观以及生成与发布馆藏资源。3.7.1 确定馆藏主题第一步是确定馆藏主题,馆藏的资源应该同属一个主题下,或相互之间有关联,以便于接下来的信息组织工作。经过讨论后,我们小组选取了“信息管理与信息系统本科专业课程及资料”为主题,原因有如下。1)作为本科是信息管理与信息系统的学生来说,此部分资料容易获取,对此主题了解全面。2)该主题的资料含有各种形
19、式的资料,如PDF,WORD文档,TXT文档,PPT文件,音频文件,视频文件等。3)该主题的资料具有一定的系统性与组织性,适合当作主题馆藏。由于该主题的资源有将近16G大小,文件数量近3000,故为了方便实验,我们对该资料进行了筛选的预处理。选取了19个学科的200多个文件进行实验,同时,为了方便下一步的信息组织工作,我们把资源的文件名进行了翻译,将中文的文件名转换成英文名。3.7.2 导入并描述馆藏资源第二步,导入并描述馆藏资源。在Gather模块的Workspace下,在Local Filesapce下找到所需资源在本地电脑存储的目录,然后将资源复制到Documents in Greens
20、tone Collections下的本馆馆藏的文件夹内,如本实验的是Information management and information system文件夹。见图3-16。图3-16导入完之后在右视图(Collection视图)中便可以看到导入后的资源。见图3-17。图3-17导入成功后便在Enrich模块下对导入的资源进行描述。在3.6.3 Enrich模块一章中已经介绍到,Greenstone默认给出了元数据集是都柏林核心元数据集,但是我们并没有使用,而是使用了自定义的im元数据集,如图3-18所示。图3-18我们使用的这一套元数据集包括title(标题或文件名)、grade(年级
21、,大一到大四)、subject(学科名)、teacher(任课老师)、type(文件类型)。我们主要是从信息组织与用户使用的角度上来考虑的。1)本馆藏的资源不同于传统的图书等资源,且都柏林核心元数据集显得过于复杂,所以使用了自定义的im元数据集,使资源组织起来更符合课程资源的特点。2)按自定义的im元数据集对资源进行描述更符合用户浏览与检索资源的习惯。在此,我们制成了元数据表见表3-1。表3-1Grade(年级)Subject(学科)Teacher(任课老师)FreshmanC+Huang LeqiuFreshmanManagementNie YonghaoFreshmanManagerial
22、 EconomicsNie YonghaoFreshmanVisual BasicHuang LeqiuSophomoreComputer networkDu YusongSophomoreInformation Analysis and DecisionChen MinghongSophomoreInformation OrganizationWu LinSophomoreMarketingNie YonghaoJuniorBusiness ConsultingNie YonghaoJuniorCompetitive IntelligenceHuang XiaobinJuniorDataba
23、seCao XiaoyangJuniorE-commerceLu YongheJuniorERPLu YongheJuniorInformation resource sharingZhou QiJuniorInformation RetrievalChen DingquanJuniorJavaXu JianJuniorJSPXu JianJuniorMISChen DingquanSeniorInformation science foundationWu Lin注:Freshman(大一),Sophomore(大二),Junior(大三),Senior(大四)在对资源进行元数据描述的时候,
24、有两个需要注意的要点。1)因为Greenstone里面有继承父属性的特点,所以对于同一个课程的资源(它们都位于同一个文件夹),可以把公共的属性抽取出来,只需要对父文件夹进行描述,那么该文件夹下的资源都会有相同的描述。如对于ERP文件夹下的资源而言,只需对ERP文件夹进行描述,见图3-19。图3-19grade(年级)、subject(学科名)和teacher(任课老师)三者为公共属性,那么该文件夹下的资源都会有着相应的描述,见图3-20。图3-20注:这个时候要修改公共属性则必须要直接修改父文件夹上的描述。2)元数据值可用层级结构组织。这在元数据值树结构中则体现为用文件夹来显示内部层次。要输入
25、层级的元数据值可使用|符号来分隔层级。所以为了方便下一步的定制馆藏资源的检索与浏览方式,我们在grade(年级)和teacher(任课老师)两个描述设定了内部层次,即年级(年级|课程)、任课老师(任课老师|课程),见图3-20。作用将在下一步进行阐述。3.7.3 定制馆藏资源的检索与浏览方式第三步是定制馆藏资源的检索与浏览方式。1)对于检索而言,主要是确定哪些字段需要提供检索。因此,我们最后选择了提供五种检索方式,分别是:全文搜索、标题搜索、年级搜索、学科搜索、任课老师搜索。见图3-21。图3-21其中,我们把全文搜索定义为默认检索。页面效果见图3-22。图3-22而这里的检索相应地提供了两种
26、检索式,分别是选择some时的或搜索,以及all时的与搜索。2)对于浏览而言,首先要了解Greenstone所提供的浏览模式,而其中最常用的有两种,一种是List(列表)形式,另一种是Hierarchy(层级)形式。List形式由于是把所有资源直接排列展示出来,所以并不适合用户进行浏览,所以List形式我们只提供了一种,就是用按标题首字母把全部资源展示出来。见图3-23。图3-23而Hierarchy形式则很适合浏览本馆藏的资源,尤其是在上一步对资源进行了分层级的描述后,更容易使用Hierarchy形式把资源展现给用户。所以,我们定制了四个栏目的Hierarchy形式的浏览模式,分别是年级、学
27、科、任课老师和文件类型。见图3-24。图3-24每一种浏览模式都可以在馆藏主页上的一级目录上看到,一种浏览模式就代表一个一级目录上的栏目。而在页面中的显示效果见图3-25至图3-27。图3-25图3-26图3-27使用Hierarchy形式的浏览模式,用户可以一层一层浏览所需要浏览的资源。除了以上的从年级到学科的形式进行浏览外,还有按学科进行浏览,见图3-28与图3-29。图3-28图3-29也有从任课老师到学科的形式进行浏览,见图3-30。图3-303.7.4 定制馆藏功能与外观我们将会从以下几部分来介绍如何定制馆藏外观:(1)Greenstone的主页面图3-31为我们系统的定制页面。图3
28、-31我们采用蓝色调的背景和图片使系统的界面显得美观与大方。我们所做的工作有如下:一、替换系统的主页LOGO,此处,我们使用了一张 “孙中山雕像”的图片替换了原Greenstone的LOGO,具体做法为找到系统所在目录下的网页样式图片文件夹“C:Program FilesGreenstonewebimages”用所需要的主页LOGO照片替换掉“gsdlhead.gif”。二、替换系统的页面风格,将原绿色的页面风格替换为自选的蓝色的背景图片,具体做法如上一步,找到系统所在目录下的网页样式图片文件夹,分别用所需要的主页LOGO照片替换掉相应的背景样式图片。三、选择馆藏的图标,在Format模块下的
29、General功能页面下的“URL to about pageimage”选择所需的馆藏的图标文件即可。见图3-32。图3-32(2)馆藏集的主页面图3-33为我们馆藏集的主页面。图3-33馆藏集的主页面的风格继承了系统页面的风格,故也是蓝色的风格,在这一部分,我们的工作有如下几部分:一、选择馆藏集的主页面的LOGO,在Format模块下的General功能页面下的“URL to home pageimage”选择所需的馆藏的LOGO文件即可。见图3-32。二、关于馆藏内容的介绍文字,添加此处的内容主要是在Format模块下的General功能页面下的“colletion descriptio
30、n”一栏中填上相应的文字描述。(2)馆藏集的外观细节定制。对于馆藏集的外观细节定制,我们也有做出相应的定制。如:一、由于我们的浏览模式主要是使用Hierarchy形式的浏览模式,所以我们在显示每个层级的目录时加上该层级下的所有文件数量,如图3-34所示。图3-34主要的做法是在Format模块下的Format Features功能页面下找到相应的CL1Vlist至CL5Vlist,在显示完标题后的位置加上“Ifnumleafdocs, (numleafdocs)”此串代码,意为如有文件则把文件的数量显示出来。如图3-35所示。图3-35二、打开每一个文档后,我们都会在网页上显示出“This i
31、s the full text.”然后才把对应的文件内容显示出来。效果如图3-36。图3-36具体的做法是在Format模块下的Format Features功能页面下找到相应的“DocumentHeading”加上相应的代码,如图3-37所示。图3-37三、由于Greenstone所提供的页面模板没有提供相应的网页尾部,故我们为我们的馆藏集网页加上了相应的尾部,如图3-38所示。图3-38具体的做法是在Format模块下的“Collection Specific Macros”功能上添加相应的HTML代码。如图3-39所示。图3-393.7.5 生成与发布馆藏资源Greenstone软件提供
32、的生成与发布馆藏的方式主要是把资源导出形成一个本地服务器,可存放在硬盘与U盘上,也可写入CD与DVD中。具体的操作在菜单上选择“File”下的“Write CD/DVD image”,见图3-40。图3-40然后在相应的界面(图3-41)上填好相应的内容,选择“Write CD/DVD image”按钮。图3-41导出结束后,打开“C:Program FilesGreenstonetmpexported_IM”(相应的导出文件夹,其中exported_IM中的IM为上一步自填的名字)。便可以看到图3-42的文件列表。图3-42可将该文件夹下的文件全部复制到CD/DVD里,形成镜像。或者要使用时只需打开Setup.exe然后进行简单的安装,便会有如下的文件列表,见图3-43。图3-43打开server.exe便可在浏览器上面浏览馆藏内容。4 实验收
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年新生儿窒息诊断流程
- 护理礼仪的教育与培训
- 护理质量改进方法:获奖课件分享
- 山东省济宁市济宁学院附中2025-2026学年下学期初四道德与法治期中考试题(含答案)
- 6.1《老子》四章课件(共56张) 2024-2025学年统编版高中语文选择性必修上册
- 巧克力原料处理工操作技能测试考核试卷含答案
- 轮轴装修工安全培训竞赛考核试卷含答案
- 磨料制造工安全知识竞赛水平考核试卷含答案
- 2026年新科教版高中高一地理下册第一单元人口迁移影响因素卷含答案
- 制帽工诚信竞赛考核试卷含答案
- 成人癌性疼痛护理团体标准
- 2025年统计学期末考试题库:时间序列分析核心考点解析
- 实验室生物安全应急预案
- DG-TJ08-2177-2023建筑工程消防施工质量验收标准
- 《低聚糖功能性质》课件
- 华南理工大学《工程热力学》2023-2024学年第一学期期末试卷
- T-NBHTA 004-2024 热处理企业环境保护技术规范
- 2024年广西南宁市小升初数学试卷(含答案)
- DB32T 4786-2024 城镇供水服务质量标准
- 9.1美国基础知识讲解七年级地理下学期人教版
- 13S201 室外消火栓及消防水鹤安装
评论
0/150
提交评论