计算机图纸检索.pdf_第1页
计算机图纸检索.pdf_第2页
计算机图纸检索.pdf_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机图纸检索 2 O O 3矩 计 算 机 图 纸 检 索 Dr a wi ng Re t r i e v a l By Co m pu t e r 廖青梅贾云 福 大连理工大 学大连1 1 6 0 2 3 摘要 通过对图纸检索现状的分析与研究 提 出了一种以图纸中全部文字信息为对象的图纸全文检索办法 进而提 出了将设计文档资料引入全文数据库以实现 图纸高命 中率检索的新思路 D蝴 图纸检 索 全 文检 索 Ob j e c t A RX A BS 1 A Th i s p a p e r p u t s f o r wa r d a f u l l t e xt r e t rie v a l me t h o d o f d r a wi n g b a s e d o n t h e a n a l y s i s a n d s t u d y o f dr a wi n g r e t r i e s t a t u s a n d p r e s e n ts a n e w c o n c e p t t h a t d e s i g n d o c u me n t s s h o u l d b e i n t r od u c e d i n t o f u l l t e xt d a t a b a S c t O r e a l i z e h h h i t t i n g r e t r i e v a l o f dr a wi n g KEY WOR D S dra wi n g r e t r i e v a l f ull t e x t r e t ri e v a l o b j e c t ARX 计 算机 图纸检索 一般可 以采 用 以下 几种 方式 基于传统关系数据库的检索方式 按照预先定义好的 字段分类检索出所需要的图纸 例如 用户可以按照预 先定义 的图纸名 称 图纸编 号 制图者 姓名 完 成 日期 等字段分类检索 基于浏览方式的图纸检索 用户通 过浏览大量的与图纸对应的预览图片 找出 自己感兴 趣的图纸 达到检索的 目的 基于图形匹配的图纸检 索方式 这种检索方式主要是通过将用户提交的样本 图纸与 图库 中的 图纸 作对 比 从 而找 出与提交 的样 本 图纸几何相似度最大的图纸 针对 目前计算机图纸检索的研究现状 本文提 出 了一种图纸检索的新方法 他充分挖掘和利用了工程 图纸中文字信息的重要性 以文字信息为对象间接地 实现 了图纸的全文检索 1 工程 图纸特点分析 工程图纸的显著特点是图文并茂 图是设计思想 的主要表 现形式 而文字是 对图的补 充说明 图纸 中的 文字信息主要包括标题栏 明细栏和技术要求 标题栏 在图纸检索中的重要性不言而喻 基于传统关系型数 据库 图纸 检索 主要是 以它为基 础进行 设计 的 它也是 手工检索的主要依据 是图纸的唯一标识 而明细栏的 设计原则决定了它与图的一一对应关系 凡是图纸中 包含的零部件 在明细栏中都对它进行了唯一标识 由 于文字本身就含有丰富的语义信息 所以 明细栏中的 每一项事实上反应 出了对应图中相应部分 的语义内 容 透过明细栏我们可以了解到图的基本内容及构成 状况 由此可见 图纸中的文字在图中具有重要的地 位 图纸检索以文字为基础将大大的提高检索的准确 性 例如 当设计部门开始一项新的设计时 面对大量 同类 产 品图纸 设 计者 有时更 希望按 照某 一特 征 如 是否含有某一或多个零部件 将有用的和不用的图纸 分开 基于这一思想 我们以图中的文字信息为对象 将全文检索技术引入图纸检索中来 希望通过对图纸 中文 字的全文搜索 达 到 图纸检索 的 目的 2 全文检索技术简介 计算机全文检索是信息检索领域的重要课题 它 以文本信息为检索对象建立全文数据库 并允许用户 以自然语言检索 全文检索技术 目前是成熟技术 被广 泛应用于各类文档资料等非结构化数据的检索上 我 国在全文检索技术方面的研究起步于 8 0 年代初 当时 受汉语 自身特点 如 汉字数量大 句 中词组短语之间 无任何分割符等 的影响 我们不能直接利用西文全文 检索的成熟技术 必须 自行研究适合于我国汉语言的 自动分词技术 我国的研究人员在吸收了西文全文检 索成熟技术的基础上 结合我国现有的汉语言处理技 术 提出了基于分词和单汉字索引的全文检索技术 该 项技术在实际应用中取得了很好的效果 目前被广泛 应用于各类中文文档资料的检索上 目前的主流数据 库都支持全文检索 3 全文检索技术在 图纸检 索中的应用 3 1 具体实现过程 全文检索技术在图纸检索中的应用主要是通过管 理文字信息进行的 其简要过程 如图 1 所示 将从图 纸中提取出来的文字信息形成的文本文件输入全文数 据库 将该文件作为全文数据库的一条记录存储 建立 2 0 0 2 0 8 2 6收到 J 寥青梅 女 1 9 7 5 年生 在读硕士 研究方 向 计算机图形学 计算机图档管理 贾云福 男 教授 博士 硬导 维普资讯 第 1 6 卷第 1 期 电 脑 开 发 与 应 用 与该文字信息文件对应 的 图纸文件或 图纸编号 的对应关 系 当用户向 图纸检索 系统输入 任意 词 时 只要检 索 出相关 的文 件记 录 即可 找 到 对应的 图纸文件 3 2 关键技术 图1 图纸实现全文检 索 的简 要过 程 由于全文检索技术在处理文档等非结构化数据方 面 已经 比较 成熟 所 以图纸实现 全文检 索 的关键 是 图 纸 中文 字信息的提 取及与文档应用程 序的接 口问题 3 3 关键技术 的解 决 3 3 1 开发 工具 本 文 以 Au t o CAD2 0 0 0环 境下 生 成 的 图纸 为例 综 合 应用 Ob j e c t ARX2 0 0 0以及 Vi s u a l C 6 0开 发工具 对其中涉及的主要功能模块及接 口进行了开 发 O b je c t A R X是 A u t o C A D系统的第三代开发工具 它 采 用面 向对象 的 C 语 言 开发 A RX 应 用程 序 A R X应用程序不再是 个独立的进程 而是 个动态链 接库 它与 Au t o C AD在同一址址空间运行 能够直接利 用 Au t o C AD 的内核代码 直接访 问 Au t o CAD 的图形 数据库 Au t o CAD数 据库 Au t o C AD Da t a b a s e 简称 Ac D b 是按一定结构组织的 Au t o CAD 图形全部有关数 据的集合 存储 在 Ac D b中的数据称为数据库对象 Ac D b Ob j e c t 它是 幅 A u t o C A D图形的基本组成部 分 包括可见几何 实体对象和不可见的非几何实体对象 等 A u t o C A D数据库的关键组成部分是 组符号表 如 块表 层表 线型表等 和有名对象字典 它们作为容器对 象 又包括了其它对象 具体结构如图2 所示 图 2 Au t o C AD图形 数 据库结 构 一 个 新创 建数 据库 的块表 具有 3个预 定义记 录 M ODEL SPACE PAPER S P AC E和 P AP E R S P AC E0 它们分别表 示模型空间和两个 预定义的 图 纸空间布局 MODE L S P AC E对象 是一个特殊 的 B l o c k对象 它包 含 了图纸 中所 有的实体 图形对 象 在 这些实体 中 文本 字符 串仅存在于 T e x t 文本对 象 Mt e x t 多行文本对象 B o l c k R e f e r e n c e 块 引用 对象 At t r i b u t e 属性对象 几种对象 的类 型 中 3 3 2图纸中文本信 息 的提取 与保存 考虑到图纸 中的标题栏 明细栏等在生成的过程 中可能采取 了不 同的绘 制方 法 而我 们提取 文 本字符 串的 目的就是要存入没有格式限制的文本文件中 不 需要对所提取 的内容 加以识 别 所 以 我 们选择 了直接 遍 历 MODE L S P ACE的办 法 来一 层 一 层地 提 取 文本 字符 串 首先 遍历 MOD EL S P ACE中 的所 有 实 体 通 过 实体 的 类 型 属 性 判 断 是 否 为 Te x t对 象 MTe x t 对象 或 B l o c k Re f e r e n c e对象 若是 Te x t 对象 或 MTe x t 对象 则 直接读 取文 本字符 串 若是 B l o c k Re f e r e n c e对象 则判断该 B l o c k Re f e r e n c e对象 中是否 包含 At t r i b u t e对象 如果包含 则 获取 At t r i b u t e对象 的列表 读取文本 字符 串 得到文本字符 串后 接下来 需要将 文本字符 串写入文档类文 件 如文本 文件 由于 文 本 字 符 串 的提 取 采 用 的 是 Ob j e c t ARX 它 运 行 在 Vi s u a l C 环境下 所 以我 们可 以直接 利 用 C f i l e类 提供的流操作函数将文本字符 串写入文本文件 至此 我们将图纸中包含的文字信息全部提取出来了 并存 放在 了指 定的文本 文件里 3 4 全文数据库结构 全 文数据库 结构如 图 3所示 全 文数据 库中定义 图 3全文 数据 库表 结构 属性字段的目的是增加图纸检索的入 口点 将从图纸 中提取出来的文字信息文件 文本文件 放入全文数据 库后 还需要用软件来对数据库中的各条记录进行处 理 主要是建立索引 关于中文文档文件如何建立索 引 如何实现全文检索 很多文献都有介绍 并有成熟 产品在使用 所以 这方面的内容将不再赘述 4 结论 本文通 过两步 搜索 间接 实现 了图纸 的全 文检 索 第一步是通过遍历图形数据库提取出图纸中文字信 息 第二步是通过全文检索技术实现对图纸文字信息 文件的全文检索 采用全文检索技术的图纸检索具有 灵活 方便 快速的检索功能 可以直接根据图纸资料 的内容进行检索 支持多角度 多侧面的综合查询方 式 例如 用户既可以按图纸编号 图纸名称等传统字 段检索 图纸 也可 以输 入任意词 查找 只要是 图纸 中存 在的 都可以作为检索词 又如 在不知道装配图纸的 下 转 第 2 4页 维普资讯 多 媒体 背单 词软 件 的开 发与 实现 2 0 0 3年 Re s u l t Ge t Vo l u me l n f o r ma t i o n c 一 St r i n g 2 5 5 Chr O 2 5 5 SI 0 0一 St r i n g 2 5 5 Chr O 2 5 5 s 2一 LTr i m S t r s 1 2 4 3函 数 应 用 根据硬 盘序 列号计算 软 件注 册号 再根 据软 件注 册号 变换 成软 件密码 再 去判断软 件数 据 文件密 码 点 密钥是否一致 可判断软件是 否为正版软件 2 5音 标 显 示 音标 字库字体 D Z J p h o n e rr F字体 实现 音标 的 显示 主要音 标和数字对应表 存 储1 2 3 4 5 6 7 8 9 0 显示 a 3 Q 6 A 0 n 3 3 结 束 语 本 单 词记忆软 件 www s i n c e s t a r c o rn 提供 单词 音标 显示 真 人单词发音 wa y音库 为主 与 电脑合成 发音补 充 单 词 音标 词 义 发音 f 复读 打 写 一一 对应 做到边 看边读 边 听边写 眼嘴耳手脑 同时并 用 开创 了新的单 词记忆 模式 特别 是对 手写 打 字 记忆 强者 在进行单词记忆 时提供 了有效辅 助教学 手段 参 考 文 献 1 张 树 兵 Vi s u a l B a s i c 6 0中 文版 入 门 与提 高 北 京 清 华 大 学 出 版社 1 9 9 9 6 全 书 2 清 汉 工 作 室 Vi s u a l B a s i c 6 0数 据 库 开发 实 椤 j 北 京 机 械 工 业出版 社 2 0 0 1 全书 上 接 第 2 1页 名称 编号 的情况 下 用 户也可以通过 关键零部件 信息 查找相应的装配 图纸 当然 将全文检索技术 引入 图纸 检索并 不是 一个 完美 的解 决方 案 它还 存在 以下不 足 之 处 图纸 检索本 身是 一件很 复 杂的事情 而图纸 中 的文字 信息又是 非常有 限的 利用 有限 的信 息检索 图 纸 结果 依然是不全面的 在将 全文检 索技 术 引入 图纸 检索 的过 程 中 由 于需要 建立 中间文档 文件作 为桥 梁 所 以增 加 了系统 的开销 全文 检索 技 术本 身 在 中文 切词 技 术 方 面 的不 足 针 对这 种情 况 我们可以考虑将 以往 的与设计相关 的文 档资料等 信息输入 全文检 索 数据库 一方面解 决 了文档 资料 的管理 问题 另一方 面 也扩 充了 图纸 的描 述 内容 从而提高检索 的命 中率 随着 中文全文检索技 术的 不断完善 以文字 信息为 基础 的 图纸 检索 必将 在 图纸管理 中发挥 更大的作用 当然 我们主张在 图纸检 索 中引入全 文检索技 术 这并 不意 味着要 以该 技术 取 代其 它检索 技术 而是 希望 在其它 已有检 索 办法 的基 础上再增 加一个 新的更强有力 的办法 参 考 文 献 1 周 强 中文 信 息 的全 文检 索 技 术D 微型 电脑 应用 1 9 9 8 2 5 7 2张 俭恭 陈 定权 汉 字 全 文检 索 系统 的关 键 技 术 与实 践 J 现代 图 书情 报技 术 2 0 0 1 8 5 2 1 6 1 8 3 马 迎 春 全 文 检 索 系 统 概 述 口 情 报 科 学 2 0 0 0 1 8 1 2 1 13 2 1 135 山 东 茌 平 一 中韩 幸 幸 带有光驱的 电瞄能播放 VC D 能听 C D盘片 有的发烧友 头的光束大 小吗 这样 你的光驱的读写头不是最容易坏吗 这 买 回 电脑 后 经 常用 其播 放 VC D盘 可 是 电脑 不宜 多放 VC D 样 经常 性 的忽 大 忽小 它 的寿 命 不就 很 短 了吗 况 且 光驱 本 来 盘 你知道 吗 的寿命 也就 一 年 多点 由于计 算机 讲 究数 据准 确 可靠 因 此光 驱 在读 取 盘 片数据 而 VC D 机 的 机芯 就 和 光 驱 不 一 样 它 是 专 门 被 设计 用来 时 往 往要 经过 检 查 它 会把 读 出 来 的每一 位 数据 进 行 样验 只 读 取 VC D盘 片的 它 对 影像 数据 是 以块 为 单 位来 读取 的 不像 有 在证 明该 数据 是被 正 确读 取 时 光 驱 才会 接 着读 取 下一 位 致 光 驱 那 样是 以致 据位 来读 取 的 它 进 行 数 据 的 样 验 操 作 比光 据 这 种安 全机 制使 光驱 在 读有 期 伤 的 VC D 盘 时 显 得格 外 难 驱 简单 因此 在这 个 数据 块 中有 个 别 数据 位 出错 也 就 不会 影 响 通 过 当光驱 在 读取 VCD盘 中有 问题 的数 据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论