浅析联合国教科文组织的免费软件——WINISIS_第1页
浅析联合国教科文组织的免费软件——WINISIS_第2页
浅析联合国教科文组织的免费软件——WINISIS_第3页
浅析联合国教科文组织的免费软件——WINISIS_第4页
浅析联合国教科文组织的免费软件——WINISIS_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅析联合国教科文组织的免费软件WINISIS浅析联合国教科文组织的免费软件WINISIS石德万(广西工学院图书馆柳州545006)摘要介绍了WINISIS及其发展概况,分析了WINISIS的基本功能特点.并对WINISIS的应用进行较为详细的分析与探讨.关键词WINISIS数据库数据库软件1WINISIS殛其发展概况【一WINISIS是CDS/ISIS(ComputerizedInformationS-vice/In.tegratedScientificInformationSystem)的Windows版,是联合国教科文组织开发,维护和免费推广的面向全球非赢利性图书情报机构的情报检索软件.目

2、前,WINISIS有单机版,多用户版,JAVA网络版等.它的前身是基于DOS操作系统的CDS/ISIS系统,是联合国教科文组织1985年推出的.当时,由于它的功能先进,加之免费发行,因而受到世界各国,特别是发展中国家的欢迎.但是从20世纪90年代中期以后,随着计算机技术和网络技术的迅速发展,基于DOS的CDS/ISIS显得落后了.从1997年开始,联合国教科文组织开始推出基于Windows的CDS/ISIS.并不断更新升级,于2001年推出WINISIS1.4版,目前的最新版本为WINISIS1.5.世界各国,特别是发展中国家密切跟踪WINISIS的发展,使WINISIS在这些国家受到了高度的

3、重视和广泛应用.这个软件的正式版本是英文版,法文版和西班牙文版,许多国家都把该软件进行了语言本地化,并成立了经联合国教科文组织授权的发行中心,开展培训I和学术研究活动,成立了WINISIS用户协会,并把用WINISIS建成的数据库在因特网上发布,实现数据库的共享.我国于1986年从联合国教科文组织接受了这个软件,并由中国科技情报研究所和国家建材局对其进行了汉化,使之适合于中文信息资源的处理,至90年代中期,我国约有8000多家用户正式采用.后来,我国由于没有跟上这个软件的变化和发展,这个软件在我国逐渐被人们所遗忘.2001年7月,武汉大学信息管理学院的陈光祚教授开始研究WINISIS及其在中国

4、推广的可行性.随后带领他的博士生威国全和阮建海对WINISIS1.4版的菜单,对话框及系统提示信息进行了汉化,编出了WINISIS的中文版,并编印了中文的wINIsIs用户手册.2002年7月8日,联合国教科文组织正式授权武汉大学信息管理学院,武汉大学信息资源研究中心为WINISIS在中国的发行人.此后,武汉大学信息管理学院和武汉大学信息资源研究中心立即决定成立了.联合国教科文组织信息软件推广培训I中心.,开始向全国各种类型的图书馆和信息服务单位提供免费发行和咨询解答及培训I服务.根据联合国教科文组织拟订的.使用协议.,使用方只要填写用户协议书,与武汉大学发行中心签署协议,并参加培训I,即可取

5、得中文版的WINISIS软件和中文版的用户手册.目前,推广培训I工作已逐步展开.2WINISIS的基本功能特点WINISIS作为一个实用的多类型数据库建立和检索软件,经过了长时间的开发,使用和优化,已经汉化的WINISISI_4版是一个很优秀的情报检索软件,其功能之强大完全可以与现存的任何一种商业化和非商业化的情报检索系统相媲美.其基本功能特点有El,4:2.1建库功能WINISIS在建库方面有如下特点:可设置重复字段和子字段,所有字段均为变长型.WINISIS可管理的数据库数量不限.系统提供多种输出打印模板和字段选择表中的抽词模板.系统管理员可用WINISIS提供的格式化语言修改或建立新的抽

6、词模板.用户可自定义数据库录入工作单.对数据为空的字段,系统可不予显示和存储,从而节约显示和存储空间.系统设置了字段级和记录级的数据合法性检验功能,用户可定义合法性检验文档.数据库的数据录入既可由用户逐条录入.又可成批导人,导人数据需符合IS02709格式.系统还提供了数据的导出功能,用户可选择导出的数据格式.另外,WINISIS既可建立书目数据库系统,事实数据库系统,又可建立多媒体数据库系统.一个软件能同时支持上述三种数据库,这是一大特色,其它的同类软件很少具有这种功能.2.2倒排档的建立和堆护功能WINISIS倒排档中的索引词取决于用户定义的字段选择表及其抽词规则,系统提供了9种抽词索引技

7、术,基本含盖了自然语言抽词的所有方法.对于英文文献,用户可设置一个停用词表,用于英文文献抽词素材中的索引词的抽取.对于中文文献,可采用加标示符的方法.系统还提供了倒排档的自动维护功能,一旦顺排档的记录内容发生变化(或抽词规则发生了改变),该功能可使顺排档与索引词典保持一作者简介:石德万.男,1964年生,副研究馆员,主要研究方向为信息组织及信息服务.圃致.具有对检索结果进行多种形式的输出及排序功能.输出时,可重新定义输出格式.排序键可多达4个之多.2.3检索功能WINISIS系统提供了专家检索窗口和导引式检索窗口两个检索界面.系统具有完全的布尔逻辑检索,右截词检索,后控词表检索,字符相邻度检索

8、,字段限定检索及字段级无索引全文检索功能.系统自动保留检索式,并可随时召回检索式.检索结果的显示有标准和表格两种模式.可对检索结果中的检索词进行反象显示定义,可对检索结果中的全部或部分按照用户自定义的显示打印格式进行打印,也可将检索结果导出到另一文件中.包括单词检索,多词间的布尔逻辑检索,位置检索,字段限定检索,截词检索(无限位截词检索和有限位截词检索),全库顺序扫描检索及后控词表检索.可产生检索词典,并加以显示,检索时可直接从检索词典中选择检索词.索引方式灵活多样,共有9种之多,针对不同的字段可设置不同的索引方式.与同类商业化软件相比,其检索功能是高超的.2.4超链功能WINISIS的格式化

9、语言提供了超链命令,其功能包括记录导航的超链,改变当前显示格式的超链,执行外部程序的超链,打开另一数据库的超链,调用执行系统其它操作的超链和窗口间相互调用的超链.利用WINISIS的超链功能可实现虚拟图书馆中从检索结果显示的URL字段的内容直接调出原始的网站网页.2.5系统管理功能WINISIS的各种管理均以参数的方式保存在一个称之为SYSPAR.PAR的文件中.系统管理员可以设置和修改该文件中的参数从而实现系统的各种管理.包括数据库存取模式的管理,数据录入的管理,数据库检索和对检索结果显示的管理,字体设置,用户访问权限的管理等.2.6建立特大数据库的功能WINISIS具有建立特大型数据库的功

10、能.WINISIS软件可建立的数据库数目不限.每个库容量最多可达3000万条记录;在每个记录中,设置的字段(描述项)数可达上千个,数据库中记录个数可达上千万条.这种巨大容量.可以适应数据库不断增长的要求.当前我国书目数据库和全文数据库的容量最大的一般是百万条或数百万条.可以说,WINISIS的3000万条的容量对于特大型数据库的建设是足够的.3WINISIS的应用3.1数据库建设WINISIS是一个实用的多类型数据厍的建立,检索和维护软件,它既能支持书目数据库,事实与数值数据库的建立与维护.同时也能支持全文数据库的建立与维护J.3.1.1书目数据库建设.WINISIS以及其前身DOS下的CDS

11、/ISIS.原本是面向图书馆建立书目数据库而设计的,因而它在书目数据库建设方面.具有很大的优势和优良的性能.同其它数据库管理系统软件相比,它的字段是可变长的.可设置重复字段与子字段,每个字段可以有不同的索引方式(索引方式达9种之多),具有截词检索,布尔检索,位置检索,字段限定检索,全库顺序扫描检索,后控词表检索等检索功能,有索弓l词词典(每词之下有文献量)的显示并可据此选词检索,用户可设定和修改检索结果的项目及其次序,对检索结果可以进行多层次的排序,并可对全库或命中记录进行IS02709标准格式的输出与输入等等.WINISIS书目数据库的这些性能,是其它软件所不能比拟的.3.1.2事实与数值型

12、数据库建设.WINISIS在事实与数值型数据库的建设方面也有独到之处.联合国教科文组织发布了圃可与WINISIS配套的IDAMS数据统计与分析软件.为了对WINISIS数值数据进行统计分析,还推出了WINIDIS软件.也就是说,先把WINISIS库内的数据通过WINIDIS转换成IDAMS库内格式的数据.IDAMS软件包能对数据的有效性如数据的代码和数据的一致性进行校验;对数据进行标淮的统计分析,如列表,回归分析,聚合分析,还能进行一些更高级的技术,如方差的单向分析,因子分析,交互式的时列分析,多维表的交互式构建等等.因此,WINISIS建立的数值型数据库借助上述两个软件,可以进行包括各种高级

13、手段的统计分折,并进行数据挖掘.3.1.3全文数据库建设.用WINISIS来建设全文数据库可有两种方式:一是将文献全文纳入数据库.可对文献的标引项和文献全文进行基于索引的直接检索,在一条记录中,只要全文不超过1.6万字(32K)的文献,均可适应此种方式的建库,其索引与检索方法等同于书目数据库.二是对超过1.6万字的任何长度(例如数万字或lO多万字)的文献.仅将文献的标弓l项纳入数据库,而将文献的全文进行外挂,即将文献全文存储在计算机的某一或某几个目录之下.检索时,用户对标引项进行检索,当需察看全文时,对命中文献进行点击,即可展示全文,并可打印.这种做法,与清华大学的.中国期刊网.的办法一样.但

14、比清华的做法优越的是,全文文献并不要求一致的格式(清华要求方正排版格式),而是各种格式均可.例如TXT,Word,HTML,JPG,PS,甚至PDF的压缩格式.只要在计算机中装有各种相应的浏览器软件,就能原汁,原味地按原来的格式显示打印.显示打印结束后,又回到WINISIS系统,可继续进行检索.这种特性,特别适于网上下载的不同格式的文献并统一建立全文数据库的要求.3.2建立和雏护多媒体信息管理系统-2对于多媒体文献,WINISIS通过对文献的标引项(描述项)统一建设.而将文献本身进行.外挂.的方法进行管理.利用多媒体文献时,可通过对命中记录的点击,而展示文章,图片,动画,音乐,VCD,DVD等

15、文献的内容.具体作法是:将经过收集,整理的各种多媒体文件(如文字,图形,声音等)处于外挂.的状态.而在wINISIS数据库内,每个文件作为一条记录,每条记录设置数十个(最多可达1000个)的字段(描述项),如名称,作者,时代,文献类型,关键词,分类号等等.关键词,分类号可以标引数十个乃至百余个,作为.重复字段字处理,其中每一个都可作为检索词.这样,一条记录的描述项和检索点可达数百至1000以上之多,因而可以充分地描述和反映各种媒体文献的各种特征.用户通过所需特征的布尔组合,可准确地检索所需的信息对象.而点击所命中的记录.就可以展示相应的多媒体文件.虽然这种方法并不是管理多媒体信息的最好方法,但

16、从目前情况来看,WINISIS的这种描述项+外挂全文的模式仍不失是一种实用的模式.3.3建立虚拟图书饽虚拟图书馆就是根据特定的目标选定信息资源的学科领域.对有关的网站网页进行搜索和收集,加以鉴定核实.并对核实后的网址进行合理组织,使之成为能够提供检索,浏览和链接的信息集合.目前因特网上广泛存在的虚拟图书馆的构建方法大都是采用ASP和ADO技术.但由于该技术的复杂性,致使建设时付出的人力,物力较多,并且建成的虚拟图书馆的性能也较弱.而利用WINISIS能够按记录中的网址自动链接上网的功能,同样可以构建虚拟图书馆.由于WINISIS技术成熟,性能稳定,开发成本低廉(软件是免费的),倒捧档生成灵活且

17、检索点多,检索功能完备,因此,用WINISIS建设的虚拟图书馆,其各种性能指标都不逊色于目前广泛采用的ASP和ADO技术构建的虚拟图书馆.但这种方法尚有一个遗憾之处,即无法实现分类表列举的检索界面,这可通过设计一个分类检索程序来弥补.3.4个人数字图书馆的建设在当今的e时代,网络信息以指数形式不断增长,人们从网上下载与自己工作,生活,学习,研究相关的各种信息,嗣时自己也有不少的文稿,书信等电子文献.日积月累,信息多了,就出现了如何科学组织,准确检索,合理使用的问题.个人数字图书馆就是管理个人数字信息的一种形式.由于WINISIS具有管理各种格式文件(如TxT,Word,HTML,JPG,PS,

18、甚至PDF的压缩格式)和强大的外挂功能,非常适合用来管理包含多种格式文献的个人数字信息,即建立个人数字图书馆.采用WINISIS构建的个人数字图书馆,其本质就是一个全文数据库,文件可以存储在不嗣的地点,数据库仅存储文件的描述项,而采用外挂的方式和数据库相连.虽然它的功能单一,但它最贴近个人的信息需求,具有个性化的特点,建设容易,能使众多的资料多而不乱,一索即得,并展示文献全文,大大提高使用效率,无疑将会得到广大从事研究学习人员的欢迎.3.5可作为信息计量的工具WINISIS为信息计量提供了一个有效的工具,它可进行数据库记录中各种信息单元的计量统计.在WINISIS的词典中,可按全部可检项排序,

19、每一个可检项均有登录数;也可选择某一字段.在该字段中出现的每一个可检项也有登录数.这些可检项可以是人名,作者,作者机构,关键词,主题词等.同时,可通过全文扫描来加强这些统计功能的实现.例如.从作者字段中,可按作者的登录数来统计出核心作者与高产作者等.又如,从作者机构的字段中,可根据各作者机构的登录数来判断各机构的科研整体水平,并为各种科研奖励和学位点的评审等活动提供定量的参考依据.再如,从关键词或主题词字段中,可根据其登录数来评析某一时期的研究热点及热点的转移过程.4结束语总之,WlNISIS是一个多语种软件,适合于中外文文献的统一建库.WlNISIS在我国的广泛推广应用,可使我国的数据库建设

20、与国际接轨,甚至能与国外嗣行交换和共享数据.但是,WlNISIS是信息存储与检索软件,而不是图书馆自动化软件,也就是说,它的主要功能是建设数据库,而不是以图书馆的采购,分类,编目,流通,期刊管理等工作环节为目标而编写的图书馆自动化软件.它不能代替图书馆自动化软件.当然,在图书馆自动化软件(如ILAS)下建立数据库可与WINISIS数据库进行交换数据.这就是从馆藏目录中抽取有关记录建立WINISIS专题数据库的根据.参考文越1臧国全.WINISIS在虚拟图书馆建设中的应用.情报科学,2003:(2)2陈光柞.论联合国教科文组织信息管理软件WINISIS在中国推广的巨大意义.情报科学,2003;(

21、10)3陈光柞,威国全,阮建海,编译.C-WINISIS用户手册,武汉大学信息资源研究中心.2o01.124陈光柞,威国全,阮建海.一个值得重视和推广的信息存储与检索软件WINISIS.大学图书馆学报,2002;(5)(责:勃阳l(_v_tlt63页l然后将该网页通过人工标注,再次训I练.归档这一步骤对于进一步克服训I练阶段知识的欠缺性和完善知识库有重要的意义.5总结中文文本的自动分类是中文信息处理领域中的一项重要研究课题.本文探讨中文信息分类技术,对关键性技术问题和分类算法阐明了方法.建立专业分词字典,剔除词词典等.随着www网上中文信息应用水平的不断提高,人们还将继续研究中文信息自动分类的技术问题,进一步对分类算法加以优化和改进.如何做到高效,准确地对网页进行分类,是我们的研究目标.用计算机自动实现基于结构挖掘的分类模式方法尚处于实验阶段,还有很多地方需要提高和改善.文档间的超链接反映了文档间的某种联系,根据网页作者的兴趣或知识结构的不同,有时候所用的链接文本对被链网页可能并不能起到归纳或概括的作用.甚至是一种.噪音.所以在生成扩展页前,可以先用某些方法对链接文本进行预处理.例如采用MRF(Markovra

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论