XX主题数据库介绍(举例)---国家人口与健康科学数据共享平台课件_第1页
XX主题数据库介绍(举例)---国家人口与健康科学数据共享平台课件_第2页
XX主题数据库介绍(举例)---国家人口与健康科学数据共享平台课件_第3页
XX主题数据库介绍(举例)---国家人口与健康科学数据共享平台课件_第4页
XX主题数据库介绍(举例)---国家人口与健康科学数据共享平台课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医药卫生科学数据共享网总中心国家科技基础条件平台医药卫生科学数据共享网资源体系建设与标准规范建设培训张业武资源体系建设课题组标准规范建设课题组2008年11月29日 北京 公用数据元目录胡 凯普通用户定义一个数据元进行数据元的属性著录提交数据元审核注册机构完成一个数据元的定义审核有问题返回给用户通过标准化审核与注册标准化数据元库公用数据元目录意义:相同含义的数据元直接使用公用数据元目录中的定义,保证数据的一致性通过公用数据元目录标准的研制:规范和统一领域内基础性、通用性的数据元;规范、推动和促进科学数据在语义层面上的共享;解决数据共享工程中的数据一致性问题;为建立规范化的领域数据元目录提供方法

2、和实例。公用数据元目录(医药卫生领域) 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工一、领域公用数据元目录内容框架基础是遵循和参考科学数据共享工程的公用数据元目录去掉与医药卫生领域无关的数据元增加了医药卫生领域多个专业共同使用的数据元一、领域公用数据元目录内容框架领域公共数据元药学公用数据元。基础医学公用数据元临床医学公用数据元公共卫生公用数据元中医药学公用数据元内容框架 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工公用数据元目录(医药卫生领域)二、数据元描述与标

3、识标识符:在数据元目录中,为数据元分配的与语言无关的惟一标识。名称:数据元的中文名称,是标识数据元的主要手段。英文名称:数据元的英文全称。说明:关于数据元的含义和基本特性的说明,并使之区别于其他数据元。表示:数据元值的数据类型及字符长度的组合表示格式。参见 5。值域:数据元取值范围或相关内容的说明。如所采用的代码标准,或通过枚举的等方式 给出所有可能的取值。同义名称:本数据元的其他许用名称。(可选)相关环境:产生或使用数据元的应用环境的说明。(可选)版本:数据元所在数据元目录的版本标识。备注:对数据元的补充说明(可选) 本标准中,数据元是通过标识符、名称、英文名称、说明、表示、值域、同义名称、

4、相关环境、版本、备注这些属性来表达的1、摘要表示的描述符2、数据元标识码分配 XX XX XXXX 数据元的大类(公共、基础医学、临床医学等)数据元的组号(公共数据元中的组,机构人员等)数据元流水号(最后一位的奇偶代表是否为代码型)二、数据元描述与标识1)数据元大类编号分配 2、数据元标识码分配 MC - 代表医药卫生公共数据元BM 代表基础医学公用数据元CM 代表临床医学公用数据元PH 代表公共卫生公用数据元TM 代表中医药学公用数据元PM 代表药学公用数据元二、数据元描述与标识2)组号分配 2、数据元标识码分配 各个大类分别单独分组,排序赋予两位组序号。对每一个大类的数据元目录来说,保留组

5、号99为其它组。 二、数据元描述与标识3)流水号分配 二、数据元值的表达方式2、数据元标识码分配 使用4 位数字作为数据元的流水号其中最后一位码的奇偶性决定数据元是否为代码型,非代码型数据元采用偶数标识,紧随其后的奇数用来标识同一概念的代码型数据元。如:MC010506代表数据元:性别 MC010507代表代码型数据元:性别代码 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工公用数据元目录(医药卫生领域)三、数据元值的表达方式1、数据类型表示方式 表 1 数据类型表示法表示符数据类型说明S字符型可以包含汉字(中、国等)、字母字符(

6、a-z,A-Z)、数字字符等。(默认 GB 2312信息交换用汉字编码字符集 基本集)N数值型数字形式表示的数值T日期时间性采用GB/T7408中规定的 YYYYMMDD、YYYYMMDDThhmmss 格式三、数据元值的表达方式2、字符长度表示方式 表 2 字符长度表示方式分类表示方法固定长度在数据类型表示符后直接给出字符长度的数目。可变长度1) 可变长度不超过定义的最大字符数。在数据类型表示符后加 “.”后给出数据元最大字符数目。2) 可变长度在定义的最小和最大字符数之间。在数据类型表示符后给出最小字符长度数后加 “.”后,再给出最大字符数。有若干字符行表示的长度按固定长度或可变长度的规定

7、给出每行的字符长度数后加“X”后,再给出最大行数。三、数据元值的表达方式3、应用实例1) S 字符型S12 固定长度为 12 个字符(相当于 6 个汉字)长度的字符。S.12 可变长度,最大为 12 个字符长度的字符。S4.12 可变长度,最小为 4 个字符,最大为 12 个字符长度的字符。S.40X3 3 行最大长度为 40 个字符长度的字符。三、数据元值的表达方式3、应用实例2) N 数值型N3 固定长度为 3 位数字。N.3 最大长度为 3 位数字。N9,2 最大长度为 9 位的十进制小数格式(包括小数点),小数点后保留 2 位数字。三、数据元值的表达方式3、应用实例3) T 日期时间型

8、T8 采用 YYYYMMDD 格式(8 位定长)表示年月日。 如 1998 年 1 月 8 日,应表示为 19980108。T15 采用 YYYYMMDDThhmmss 格式(15 位定长)表示年月日时分秒。时分秒之前加大写字母“T”。如 2004 年 3 月 25 日 9 时 8 分 5 秒为 20040325T090805。 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工公用数据元目录(医药卫生领域)四、领域公共数据元目录1、公共数据元分组第 01 组机构、人员类数据元;第 02 组地理位置、空间、几何图形类数据元;第 03

9、组日期、时间、期限类数据元;第 04 组金额、数量、比率、计量单位类数据元;第 05 组仪器、设备、物品类数据元;第 06 组数据资源生成、管理、应用类数据元;第 99 组(其它);四、领域公共数据元目录第一组 机构、人员类数据元标识符: MC010000 中文名称:单位名称 英文名称:Organisation name 说明: 批准成立的组织机构的正式名称,与公章上的名称一致。表示: S.100值域: 文本同义名称:机构名称相关环境:科学数据共享工程版本号: v1.0备注:五、与各个数据中心的合作与分工领域公共数据元药学公用数据元。基础医学公用数据元临床医学公用数据元公共卫生公用数据元中医药学公用数据元五、与各个数据中心的合作与分工1、共享网总中心标准化课题组1)公用数据元目录的制定 职责一:定义 数据元描述方式的定义(数据类型、长度等的表示方法)标识 目录中每个数据元描述符的选择与界定 数据元标识编码的定义与分配 职责二:制定领域公共数据元 通用数据元的选择(国家、性别、职业) 领域公用数据元的纳入(诊断、体重) 五、与各个数据中心的合作与分工1、共享网总中心数据元标准化工作组2)数据元目录的维护 执行对数据中心所提交数据元的标准化审核 数据元目录的更新与维护 收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论