




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 6 中国分类主题词表 WEB 数据库建设 【内容提要】本文介绍了中国分类主题词表 WEB 数据库采用微软公司 ASP 与 SQL SERVER2000 的集成技术开发研制,论述了中国分类主题词表 WEB 数据库建设的必要性,选用的软件、建库的重点及检索的途径。 【摘 要 题】信息化与网络化建设 【关 键 词】中国分类主题词表 /WEB 数据库/ASP/SQL &nbs 1994 年正式出版发行的中国分类主题词表(以下简称词表)是在中国图书馆图书分类法第 3 版(含中国图书资料法第 3 版)和 汉语主题词表基础上编制的大型分类法,是一部集分类、主题为一体的综合性工具书。它从内容到形式、从结构到语义等方面,实现了分类语言与主题语言、先组语言与后组语言的相互兼容。该表实现了经一次主题分析,通过标引数据的转换,同时完成分类标引和主题标引,因而降低了标引难度,提高了标引质量,节省了人力和物力;便于分类检索和主题检索以及有分类号、主题词和自然语言三者组成的混合检索,实现了分类检索和主题检索的互补,提高了检全率和检准率。 ASP 技术可以简便易行地实现构建 Web 数据库的查询程序,它集简单与高效于一身,可 以非常直观地开发出复杂2 / 6 的 Web 应用,基于 ASP 开发的中国分类主题词表 Web 数据库具有良好的交互式使用方式,将有助于它在中国各类图书馆、文献情报机构中普及使用,大大地提高图书分类的准确度与效率,对我国图书情报机构文献管理和图书情报服务的现代化具有深远意义。 1 中国分类主题词表电子化的必要性 我国分类主题一体化的发展趋势在很大程度上取决于词表的出版和使用。由于词表的广泛使用,推广了主题工作、提高了主题标引的质量,为文献标引工作提供了权威的标引依据。但是,随着科学技术的发展与社会 的进步,面对先进的网络技术、计算机技术在图书馆广泛应用的前景,标引人员不仅要求词表能满足新学科、新技术、新主题文献标引的动态需要,还呼唤能实现各种文献信息的自动标引或智能标引,满足各种用户包括读者在内的文献信息检索需要,实现自动检索或智能检索。 实现自动标引的基础是用于标引的词表库。系统标引词表库是自动标引系统辅助标引人员寻找合适的分类标识、主题标识和标识间相互转换的依据。由于词表完成了分类法类目与主题词或主题词串的对应,使得文献分类标引和主题标引同步进行变得易于实现,因此词表为标引词库表 的建立奠定了坚实的基础。 电子化的词表首先摆脱了计算机编目中的分类主3 / 6 题手工标引,充分利用 Microsoft SQL Server 为基础建立起来的大型数据库应用程序,系统界面友好、操作简便,计算、分析、检索功能非常强大,提高了标引质量,节省了人力。其次也解决了由于外在因素带来的使用上的不便,比如印刷版词表价格高,一般图书馆只买一部,至多两部,而中型以上的图书馆从事文献标引工作的人员不少于两人,词表作为必备的常用工具书,就明显不够用,尤其是在回溯建立馆藏文献数据库时,情况更为突出,严重影响 了工作进度。又如词表体积大,作为标引人员随时都在翻阅的工具书,就显得十分笨重和不方便,不到一年就破损严重。以上种种原因表明,电子化的词表是十分必要的,也只有将词表电子化、网络化,才能充分发挥它所蕴藏的多种潜在功能。 2 中国分类主题词表 WEB 数据库建库软件 中国分类主题词表的数据量比较大,数据库有 20多万条记录,要有相应快的响应速度,并且需要支持多人同时访问。 SQL Server 2000 能满足以上要求。以 C800 的计算机为例,检索 21 万条记录的数据库只需要 6 秒。 SQL Server 2000 完全的 Web 支持 SQL Server 2000 提供了以 Web 标准为基础的扩展数据库编程功能。丰富的 XML 和 Internet 标准支持允许使用内置的存储过程以 XML 格式轻松存储和检索数据。还4 / 6 可以使用 XML 更新程序容易地插入、更新和删除数据。SQL Server 2000 具有强大的 Web 访问功能,使用HTTP 可向数据库发送查询、对数据库中存储的文档执行全文搜索以及通过 Web 进行自然语言查询。 SQL Server 2000 高度的可伸缩性和可靠性 使用 SQL Server 2000 可以获得非凡的可伸缩性 和 可 靠 性 。 通 过 向 上 伸 缩 和 向 外 扩 展 的 能 力 ,SQL Server 满足了苛刻的电子商务和企业应用程序要求。向上伸缩。 SQL Server 2000 利用了对称多处理器 (SMP)系统。 SQL Server Enterprise Edition最多可以使用 32 个处理器和 64 GB RAM。向外扩展。向外扩展可以将数据库和数据负载分配给多台服务器。可用性。通过增强的故障转移群集、日志传送和新增的备份策略,SQL Server 2000 达到了最大的可用性。 ASP 技术的使用 ASP 是 Active Server Pages 的简称,它是一种 在 微 软 公 司 的 WEB 服务器IIS(Internet Infomation Server)上开发交互网页的新技术。微软公司最初在版上使用它以取代 CGI。随着Windows NT 在 WWW 上的使用日益增多, ASP 已经成为了开发动态网站、构筑 Internet 和 Intranet 应用的最佳选择。 如果你的计算机上装的是 Windows NT ,那么5 / 6 你 可 以 通 过 安 装 NT 的 可 选 包WindowsNT Option Pack 来安装,然后你就可以在里使用 ASP 了。如果你的操作系统是 Windows 98,那么你可以在 Win98光盘里找到一个 ADD-ONS目录,下面的 PWS目 录 里 面 有 一 个 小 型 WWW 服 务 器 软 件PWS(PersonalWeb Server),它也可以支持 ASP。而Windows &nbs p;2000 Server 版或 Advanced Server 版,都已经自带。 3 中国分类主题词表 WEB 数据库建库重点 (1)词表 WEB 数据库除包含 现有词表的全部内容,重点应以中图法第四版为基础,全面修订主题词及其与中图法四版类目的更新对应关系,对从三版到四版删改的分类号、类名、注释、对应的主题词及其参照关系进行修订,对新增类目和调整的类目编制对应主题词,对删改的叙词应建立参照关系或进行沿革注释。 (2)词表 WEB 数据库要重点修订现有词表中类目与主题词的对应关系,提高词表的分类主题一体化标引功能和检索功能,使词表无论从类号还是从主题词检索都可查全相应的主题词和类号。如第一卷中 J915下没有“音响模拟”一词,类似情况 说明现有词表第一卷并未6 / 6 包括第二卷中的所有词汇,这就使得从分类入手进行主题标引时有些主题词未能得到选用。 (3)随着网络化程度的迅速提高,检索语言的兼容问题已经成了必须解决的问题。为达到兼容目的,在规范语言中必须逐步加入自然语言,并建立词间关系,将对主题词的规范控制从要求检索者用规范词语转向由数据库内部依据词间关系进行转换控制。电子化词表应加大入口词的范围,大量增加非正式主题词,建立完整的词间关系,以满足各种类型读者的检索需要。 (4)词表 WEB 数据库对于现有词表中由于各种原因而产 生的错误和前后不一致的现象应认真检查修改。例如 J80
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论