基于数据仓库技术的中药科学实验信息数据库_第1页
基于数据仓库技术的中药科学实验信息数据库_第2页
基于数据仓库技术的中药科学实验信息数据库_第3页
基于数据仓库技术的中药科学实验信息数据库_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于数据仓库技术的中药科学实验信息数据库

中药实验数据仓库是科技部基础性课题--一”中医药科技信息数据库”的子课题之一。收录范围是自1990

年以来公开出版在中文医学期刊上的有关中药单味药、方剂、化学成份在药理、临床药理、毒理方面的一次实验

文献。课题总周期三年,目前已经送行了两年。

1.概况:

本数据库采用计算机数据仓库技术,在忠实于原文献内容的基础上,按照中药学研究的特点,建立了十五个

空间维,将收录内容进行编辑和结构化存储,实现了对中医药文献资料中出现的术语进行标准表达以及术语间的

相互关系的多重组合形式,用户可以进行研究数据的统计和相关多维的频次统计,作为药厂、临床、科研、管理、

教学工作者必需的查询工具,将为启发科研思路,开掘出具有突出疗效的新药提供依据。

在科技部领导的关心,中医研究院领导的支持下,我们采用远程建库的新模式,在浙江大学计算机系的技术

支持下,由全国六家省级中医药学院和研究院的50余位中药专业人员通过互联网进行建库工作。经历了基础工

作准备阶段、人员培训与程序测试阶段、大量数据加工阶段,经过深题组全体人员近两年的共同努力,克服了多

重困难,解决了多项技术难点,到目前为止,数据已经做到2002年,文献量已经到达20000余篇,数据量到达

38900余条,原文图片到达55000余张,整体工作已经根本完成,可以提供网上数据查询与效劳。局部数据已经

投入使用与应用,实现了网上科技实验数据的便利检索与精确统计分析利用。

2.目标与方案:

2.1目标:依据中医药科技期刊文献科学实验数据,利用数据仓库技术,建立中医药科学熨验信息数据仓库,为

中药新药开发、科研创新及中医临床决策提供科研数据与思路。

2.2任务方案:初步完成中药药理、毒理、临床药理数据库的整体结构的设计,合理搭建结构关联型数据库字段。

在完成数据库应用程序的设计与开发的基础上,完成上述数据库1990-2002年约20000条数据的存储与加工,提

供网上数据查询与效劳。

3.课题设计思路与理念:

3.1关于数据仓库的概念:

数据仓库(DalaWarehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支

持管理决策。对丁数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用丁支持决策,面向分析型数

据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题

进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

中药药理数据仓库就是针对结构不同的药理学文献数据源,进行抽取、清理,并有效集成,按照主题进行组

织编辑,最后到达可以进行数据统计和分析的目的。

3.2数据仓库的建模方式:

数据仓库建立的基础是OracleA'arehouseBuilder,而逻辑建模是其实施中的重要一环,因为它能直接反映

出技术需求,同时对系统的物理实施有着重要的指导作用。本数据仓库采用了两种建模方法,即第三范式和星型

模式。

范式是数据库逻辑模型设计的根本理论,一个关系模型进行无损分解的过程称为标准化。在数据仓库的模型

设计中目前一般采用第三范式,它有非常严格的数学定义。即必须具有三个条件:属性量值唯一,不具有多义性;

非主属性必须完全依赖整个主键;非主属性不能依赖于其他关系中的属性。

星型模式由一个事实表(FactTable)和一组维表(DimensionTable)组成,是一种多维的数据关系。事实表

主键的每个元素都是维表的外键。事实表的非主属性称为事实(Fact),它们一般都是数值或其他可以进行计算的

数据;而维大都是文字、时间等类型的数据实体。

4.课题设计谋略与原则:

4.1依照中药药理学科分类,筛选中药实验药理数据归类:

根据中药药理学科分类特点,按照中药药理学范围进行实验药理数据归类;选择主要数据项,利用结构化形式,

表达数据特征与数据关联方式。

4.2依照数据特点与现状,设计中药药理实验仓库的结构;

利用数据仓库的概念和技术,从一般数据库中抽取相关主题所需要的数据。找出中药科学实验数据分布特点,

研究数据的主题信息抽取数最,是构思数据仓库的基础。在前期对中药实验药理血瘀证专题的数据进行分析与统

计时,发现实验方法种类繁多,实验角度各有不同,数据值表达分散、涉及范围广泛,数据具有“高维、小样本"

的特点,过分细化结构很难发现共性规律;因而针对中药药理实验数据的现状,降解难度,减少实验数据仓库的

建模方式,筛选了有一定分析与统计意义的十五个数据维(文献出处、单味药、化学成分、方剂、剂型、疾病、

证候、表现、病理生理、效应部位、微生物、药理分类、临床药理分类、毒理分类、指标),十五个维根本全面

表达了中药科学实验数据的内涵值,可以支撑数据统计与分析。

4.3依照数据仓库建模方法,编辑加工中药药理实验数据仓库数据;

中药药理数据仓库共建立了十五个维,每个维具有独立属性,通过后台的相互关联,共同组成事实表达方式。

由于数据仓库需要数据值的标准化与术语用语的标准化;囚而,在总体构架实现的基础上,必须研制中药药理学

科涉及的常用术语与标准化加工方法。同时建立了十四张标准数据表格,便于数据加工与利用。杈据中药科学实

验数据的特点,对选择的数据进行结构化处理,对中药科学实验的对象、主要内容、方法与研制指标等数据进行

抽取与加工。

5.研制标准技术标准:

5.1科技基础数据收集范围与原则:

收录范围是自1990年以来公开出版在中文生物医学期刊上的有关中药单味药、方剂、化学成份在药理、临

床药理、毒理方面的一次实验工程。收录原则:全面收录中药实验研究的一次文献数据,转载或综述性文章均不

在收录范围内。

5.2科技基础数据编辑加工流程:

课题组制定良好的工作流程:口心组文献初筛与加工人员二次复筛一一主题抽取一一标准数据表一一数据

编辑加工、全文图片上传一一数据初审一一数据二审一一总审一一数据拆分一一修改补充标准表

5.3数据编辑加工标准与细则:

建立与研制了《中药药理数据仓库的编辑流程和技术要求》、《全文图片扫描技术标准》、《中药药理实验仓

库的质量考核标准》等一系列操作手册和质控标准。

5.4研制并建立了中药实验数据仓库标准表:

研制并建立了单味药、化学成分、方剂、剂型、疾病、证候、表现、病理生理、效应部位、微生物、药理分

类、临床药理分类、毒理分类、指标等十四张标准表。

6.研制应用程序:在浙江大学的配合下,完成了具体应用程序与数据加工管理程序;

程序名称工具环境内容与功能

数据仓库数据AspWin2000,I中药实验数据仓库的录入局部,网上建立了基于标准

录入界面IIS5.0数据查询的功能,可进行远程数据加工、归类、分组、

整理的操作,并实现远程加工数据在线人员管理。

数据仓库分析AspWin2000,中药系统相关数据统计分析界面,提供了查询中医药

界面IIS5.0文献资料中出现的术语以及术语组合进行频次统计

的有效途径。

标准词汇表杳AspWin2000,基于web的标准库查询系统,为中药基础数据库与中

询IIS5.0药实验数据库提供了标准数据查询与应用。

Web标准数据VBWindows用于web标准数据库的管理界面,实现标准数据的倒

库管理界面入、倒出与标准表的增加、删除与修改等功能。

数据仓库管理VBWindows用于数据仓库数据的管理界面,实现数据仓库的审校

界面与加工数据量的统计,并对数据进行结构拆分,将数

据倒入15维的数据仓库中,实现数据库拆分功能。

标准表管理程VBWindows中药标准数据库的VB录入界面,可实现本地对中药

序基础数据库的数据加工、修改与审定,并可实现新数

据的增加与管理。

Oracle文献数VBWindows把文献库和图片库相关检索和浏览,在本地局域网内

据库和全文库实现了对图片的查询。

的连接

7.完成课题任务:

7.1完成数据库加工建设任务:

本课题采用远程建库的新模式,在浙江大学计算机科学与技术学院的技术支持下,由全国六家省级中医药学

院和研究院的50余位中药专业人员通过国际互联网进行建库工作c经历了基础工作准备阶段、人员培训与程序

测试阶段、大量数据加工阶段,经过课题组全体人员近两年的共同努力,克服了多重困难,解决了多项技术难点,

到目前为止,实现数据已收录了20000余项,数据量到达38900余条,原文图片到达55000余张。

7.2建立了数据管理与质量控制方式:

设立了远程三级审校管理界面,实现了对异地远程加工过程的监控与管理,不同的工作性质拥有不同的管理

权限,实现了数据的三级管理方式与人员的远程在线管理。

7.3建立了数据仓库应用平台:

数据仓库平台实现了对中药科学实验文献中出现的术语进行标准化表达,同时实现了术语间相互关系的多重

组合,用户可根据不同需求进行中药科学实验数据的统计,以及多维数据出现频次的统计,通过频次显示相关数

据值在199()年后获得重视的程度,用户可在此科学实验信息数据仓库的基础上,了解与分析近年来中药科学实

验的进展情况,该平台将成为药厂、临床、科研、管理、教学工作者有效的查询工具,将为启发科研思路,开掘

出具有突出疗效的新药提供依据。用户可根据自己的需求,执行相关操作程序,获得所需数据。

7.4其他:

7.4.1人员技术培训:进行了分中心人员技术培训,从计算机软硬件配置,网络条件、编辑和审校人员素质、工

作数量和质量控制等各方面,对其进行了培训,为课题顺利进行打下了基础;

7.4.2人员权限分级管理:开设了远程编辑人员与远程审校人员的权限分级帐号,便于管理;

7.4.3远程培训与编辑工作同步进行:管理人员通过本地管理程序进行及时的数据审校,发现问题即时与编辑人

员联系,实现了远程培训与工作同步进行;

7.4.4无时差、多途径、远程培训模式:用各种现代化通讯方式,创立了无时差、多途径、远程培训模式,在工

作中及时发现并解决问题,力争把问题解决在萌芽状态;

7.4.5年度考核:在年中、年末分别进行了进度和质量考核,对先进集体进行精神和物质嘉奖;

7.4.6鼓励机制:为了保护分中心人员的工作热情,特别设置了“实验库半月排行榜〃,每两周进行一次工作数

量、数据质量、图片质量等各方面工作的名次排行,极大地表彰了先进,鼓励了暂时落后的单位。这个举措得到

领导和各单位的一致好评;

7.4.7专题论证:组织对中药实验数据仓库的论证,反复修改程序,召开论证会三次;

7.4.8广泛征求专家意见:收集中药实验数据仓库使用意见,就不同的导航形式与应用方法广泛征求了专家意见。

7.4.9设备更新与网络升级:为保证果题软硬件的实施,中心与各分中心进行设备更新与网络升级等工作,保证

了课题的顺利进行:

8.中药药理实验数据仓库应用平台:

本课题为中药科学实验信息数据的利用提供了新的思路,提高了中药科学实验数据的利用度,对促进中药科

研的开展具有重要意义。中药数据仓库提供了用户应用平台,构建了数据查询与应用界面,作为口药实验数据仓

库首次效劳于用户,成为中药学科及相关专业必备的工具。由于中药数据仓库技术起点高、结构清晰、数据抽取

主题概念明确,因而提供了最大的效劳与应用空间。同时,本平台具备数据统计与频次排序,提供了数据评价的

功能。上述两点特性,使中药实验数据仓库应用平台能够为中药知识发现与挖掘提供思路与依据。

9.中药药理实验数据仓库应用平台的特点和应用范围:

9.1数据结构设计合理,数据加工标准,具备准确地普适型检索的特点:

良好的数据导航,为数据检索与查询提供了便利的方式,用户可以按照数据导航介绍,进行一药科学实验数

据准确、结构清晰、目的明确的检索;由于中药数据仓库是基于文就数据库的结构化处理,因而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论