基于关键词的文档层次查询.doc_第1页
基于关键词的文档层次查询.doc_第2页
基于关键词的文档层次查询.doc_第3页
基于关键词的文档层次查询.doc_第4页
基于关键词的文档层次查询.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于关键词的文档层次查询Hierarchical Query of Documents Ba sed on Key words尹文生陈修国涂平晖张恒喜(华中科技大学机械科学与工程学院 武汉 430074) (武汉市交通基本建设工程质量监督站 武汉 430015)摘 要 文档查询是科学工作中的重要环节 。从实现机理来看 ,文档查询是一种基于关键词的数据库查询过程 ,其核心就是构建查询语句即设计查询界面及向数据库查询语句转化 。提出了一种面向文档查询的查询树概念 ,将每 个叶结点对应于一条 SQL 语句 ,而分支结点则表示子结点之间的并交差集合运算关系和其他运算关系 ,便于表达 复杂文档查询要求 。设计了查询树向 SQL 语句转化算法 ,将整个查询树合并为一条 SQL 语句 ,充分发挥 DBMS 查 询优化功能 。关键词 文档查询 关键词查询 查询树 查询子句中图分类号 TP391 . 3 G350文档查询是科学工作中的重要环节。随着计算机技术、通信技术、信息技术等的飞速发展 , 人们可以获 得的文献资料越来越多 , 视野变得越来越开阔。然而 问题也随之产生 ,人们可能不必为资料比较少而发愁 , 却为资料太多很难发现有用的资料发愁。因此为用户 提供简便而有效的查询方法具有很大意义。合关系等等。为与用户的使用习惯相符 , 这里用关键词查询表示一般的文档查询。因此 ,查询过程是一个不断选择关键词及其关系 , 缩小搜索范围 ,提高搜索速度 ,最终找到自己所需要的 文档的过程。1 . 2 查询方式 目前常见的商用查询系统通常提 供两种查询方式 : 简单查询和高级查询。简单查询一 般只需要用户输入少量的关键词 ,逻辑关系比较简单 , 而高级查询则输入的关键词比较多 , 甚至可以输入比 较复杂的逻辑关系。在大多数情况下 , 简单查询和高 级查询之间的差别一般都不是本质上的 , 常常体现为 查询所使用的关键词的多少不同。许多查询系统还提供对查询结果进行并交差集合 运算的功能。例如百度搜索引擎等网上搜索引擎可以 对查询的结果进行进一步的搜索 , 直到搜索完成或没 有可选文档为止。这样的查询方式是一种线性的方 式 ,即一步一步进行的查询方法。常用的查询方式具有查询界面简洁、使用简单、易于被大家所接受等优点 ,但是也存在查询功能不强、不 容易表达比较复杂的关系、可重用性差等缺点。由于 查询的使用者往往是普通的用户 , 简单的用户界面具 有较强的适应性 ,因此采用简洁的设计风格是有效的 但是这种简洁的设计风格在表达复杂关系时具有较大 的缺陷 ,主要体现为 : 关键词及其关系固定 , 不允许自 由地对关键词进行关系组合等等。例如不能像公式表 达式那样通过引入括号来包含复杂的层次关系。事实1常用查询方法1 . 1查询过程 在日常生活中 ,人们经常使用计算机系统进行文档的查询。查询的一般过程是: 搜索一 篇文档中出现的字词 , 或者数据库一些表中的某些字 段取值 ,如果这些字词或字段的取值与用户给定的字词及其关系相一致 ,则相应的文档或数据内容被选中。 例如人们经常使用的网上搜索引擎就是这种工作方 式。在查询过程中 , 因为用户给定的字词及其关系是 选择文档的重要依据 , 所以称这样的查询为关键词文 档查询 ,并将这些字词或数据库表中字段的取值称为 关键词。严格地说 ,人们经常使用的关键词包含关键词类 型、关键词取值及关键词类型和关键词取值之间关系 三种概念。由于在进行文档查询时关键词类型和关键 词取值之间的关系常常是相等关系 , 所以将关键词的 取值也称为关键词。事实上 ,在查询过程中 ,关键词类型和关键词取值 之间还可以存在许多关系 , 如算术关系、逻辑关系、集作者简介 :尹文生 ,男 ,1963 年生 ,博士 ,副教授 ,研究方向为智能 CAD 、虚拟现实、人工智能 ; 陈修国 ,男 ,1984 年生 ,硕士研究生 ,研究方向为智能 CAD 、人工智能 ;涂平晖 ,男 ,1968 年生 ,博士 ,高级工程师 ,研究方向为桥梁隧道 ; 张恒喜 ,男 ,1972 年生 ,工程师 ,研究方向为建筑工程。上 ,如果查询系统为用户提供很强的查询表达式输入功能 ,使用效果反而会很差。为了增强查询能力 ,可以 采取以下一些方法。a . 设计功能强大的查询界面。有两类方法 , 一类是设计可以表示多种复杂关系的专用的交互界面 , 另 一类方法是设计通用的交互界面 , 用户通过掌握高级 的查询描述方法来构建查询语句 , 显然这两种方式都 增加了普通用户使用它们的难度。b. 提供关键词层次查询1 2 。例如 , Oracle 系统 中引进层次树查询( Hierarchical Tree Query) 机制来扩 展原有的 SQL 语言 , 提供面向层次数据的查询谓词 ( S TAR T WI T H - CONN EC T ION B Y) , 从而可以有效 的实现对层次数据的查询。c . 构建 XML 查询树3 7 。根据查询请求描述特 点的不同 ,将 XML 查询方式概括为两大类 , 即 : XML Query 查询模式和 XML IR ( Infor matio n Ret rieval) 查询 模式。其中 , XML Query 的查询过程是 : 首先定义精 致的查询模式描述语言( 如 XPat h , XQuery 等) , 用户 借助它来描述自己感兴趣的模式 , 然后将用户的模式 交由实际的 XML 数据处理系统处理 ,即可返回与模式 相匹配的结果。显然这种查询方式要求用户必须学习 相应的语法机制 , 而且即便是用户已经掌握了相关的 查询描述机制 ,如果他/ 她不了解实际查询的 XML 数 据的组织情况 ,那么同样不能完成查询操作。XML IR 是在 XML 数据查询中吸收传统信息检索的特点 ,如方 便用户使用、返回的结果能够体现与查询模式的相关 程度等 ,同时又具有自身的特点 ,如查询结果往往不是 整个文档 ,而是 XML 数据中的片段等 , 它是 XML 数 据处理中的新研究点。d. 采用多叉树描述 SQL 中的 WHER E 子句8 。 文献8 针对 WHER E 子句的要求设计了一个多叉树 , 用于输入查询的条件 , 这样可以构成非常复杂的 SQL 查询语句 ,但是这种多叉树没有重视集合的关系和系 统的扩展能力。1 . 3 查询的实现 文档的查询其实可以理解为数 据库中数据的查询 ,而且从逻辑上说 ,文档的查询可以 归结为单表查询( 物理上可以由多个表组成) , 即一般 的文档查询实际上是数据库的单表查询。在关系型数据库系统中 , 查询一般采用结构查询 语言 SQL 实现。SQL 语言是一种非常简单、非过程的、功能强大的数据库查询语言 , 使用 SQL 语言可以实现非常复杂的查询9 。然而 , 一般的查询系统并没 有完全发挥 SQL 强大的功能 ,而只用到了其中一个很 小的子集。查询系统通过查询界面获得用户的输入 , 并将其转化成 SQL 语句 ,然后交由数据库管理系统执 行。显然 ,实现查询的关键是 SQL 语句的转化。一般来说 ,这种转化是一种填空操作 ,即将用户给定的关键 词或 关 系 填 入 到 对 应 的“SEL EC T ”语 句 ( 主 要 是 WHER E 子句) 中 ,用户只能有关键词或关系的具体取 值的变化 ,而不能有结构上的变化。如果用户需要对查询结果进行二次查询 , 则重复 上述过程 ,所不同的是文档的范围发生改变 ,即二次查 询时不是对总数据库的内容进行搜索 , 而是对上次查 询中生成的临时数据库进行搜索。为了提高查询效率 ,许多商家都对文档查询进行了优化处理 ,但是总的 查询实现方法是一样的。2查询树目前常用的查询是通过交互界面按照预先设定格式接受关键词及其关系 ,然后将其转换成 SQL 语句实 现的。显然 ,这种预先设定的格式严重地限制了系统 的查询能力。而对查询的改进虽然取得了一些效果 , 但是仍然存在一些缺陷。例如 Oracle 提供的层次查询 的功能仅限于层次化的数据1 ; 查询界面太复杂则让 普通用户难以接受 ; 针对 WHER E 子句的多叉树具有 很强的表达能力 , 但是没有引入普通用户较为熟悉的 集合概念8 。为了充分发挥数据库的查询能力 , 同时 也不增加用户使用难度 , 应该将常用的查询方法和层 次查询方法结合起来。2 . 1 查询的层次化 查询层次化的思路是 : 将一个 复杂的查询任务分解成若干个简单的查询 , 然后将它 们用树组织起来实现查询目标。定义 1一条可以独立执行的 SQL 查询语句即SEL EC T 语句称为一条查询子句。查 询 子 句 具 有 典 型 的 SEL EC T - FROM - WHER E 结 构 , 是 具 体 的 查 询 执 行 单 元。其 中 , WHER E 后面不能包括嵌套查询。定义 2表示查询结果之间运算关系的树结构称 为查询树 ,其递归定义为 :a . 任何一棵查询树是一个二元组 Q T = ( root ,F) , root 是查询树的根节点。b. F 是 m 棵互不相交的子树的集合 , F = ( Q T1 , Q T m ) 且 Q T i = ( root i , Fi ) 是 root 的第 i 棵Q T2 ,查询树 , m = 0 , 1 , 2 ,。c . 当 m 0 时 , 存在关系 R = |, m , m 0 。i = 1 , 2 ,因为任何一个查询子句执行的结果都得到一个集合 , 所以查询树就是一个表示查询结果集合运算的树。由于集合运算一般都是二目运算 , 故应该用二叉树表示查询树 , 但是由于相同的集合运算可以合并 , 所以用 多叉树来表示可能更简便些。查询树中主要包括两类基本结点 , 即 :关系结点和子句结点 , 前者是树上的分枝结点 , 后者是树上的叶结 点。这里分支结点和叶结点 , 以及多叉树、二叉树等与 数据结构中树结构中的相关概念是对应的。下面给出 关系结点和子句结点的定义。定义 3用于表示查询结果集合运算关系的结点称为集合关系结点 , 简称关系结点。设 r 表示关系节点 , R 表示关系结点的取值集合 , 在这里取 R = , , - 。其中“”表示集合之间的 并运算“, ”表示集合之间的交运算“, - ”表示集合之 间的差运算。图 1 查询树2 . 2查询树的构建在讨论查询树构建之前有必 要对查询树的一些约束条件做一下说明。约束条件 1 :关系结点 r 只能用作查询树的分支结 点 , 子句结点 s 只能用作叶结点。如果关系结点下没有查询子句 , 集合运算就不能 进行。由于子句结点只表示一次查询后的结果集合, 而不能表示集合之间的关系运算 , 所以子句结点下不能再有子句。约束条件 2 : 同一个分支结点下各个子结点具有 相同的集合运算关系。如图1 所示 , 关系结点“”下的子句结点 s1 , s2 , s3表示集合运算 s1 s2 s3 。约束条件3 :当 r =“- ”时 , 即差结点 , 以 r 为父结 点形成的查询树是一棵二叉树 , 集合运算后的结果是差结点两个子结点的差。约束条件 4 : 所有查询子句的查询都是针对文档 的单表查询 , 即所有查询子句转换成SQL 语句后 ,只有 WHER E 子句存在差别 , 其余部分完全一样。定义 4结点。用于表示一条查询子句的结点称为子句由于任何一条子句都是一条可以独立执行的 SQL语句 , 由关系数据库面向集合运算的特点可知, 任何一 条子句执行的结果都是一个集合 , 所以子句结点同时 也代表了一个查询结果的集合 , 可以用 s 表示。定理 1一的。用于实现同一查询要求的查询树是不唯定理 1 的正确性是显然的。例如要查询同时满足条件 c1 和 c2 的对象 , 可以将 c1 和 c2 作为一个子句结点 的条件部分 , 即 : c1 AND c2 进行查询 , 也可以作为 关 系结点下的两个子句结点进行查询。定理 1 表明通过采取某种措施来实现查询树的优 化是可能的。本文主要讲述查询树的构建及其应用 等 ,对于查询树的优化将不做过多的叙述。查询树具有以下特点 : a . 集合性。每个结点均表 示集合 ,子句结点表示一个查询结果集合 ,而关系结点 则代表查询结果之间的关系运算 , 因此运算后的结果仍然是一个集合 ,而且集合中的元素类型是相同的 ,即都是文档。例如在查询某一主题的科学论文时 , 查询 的中间结果和最后结果都是科学论文 , 只是它们的数 量或范围发生了变化。b. 简单性。无论是分支结点 还是叶结点 , 都是操作比较简单的结点。分支结点只 有三种集合操作 ,而叶结点是一个不含嵌套、不含括号 的简单 SQL 查询。c . 有效性。使用查询树可以形成 非常复杂的查询 , 即可以形成在简单的查询子句及其 并交差集合运算下的任意复杂查询。d. 开放性。从 上述的描述中可以看出关系结点集合 R 中仅包括三 种运算符 ,这是考虑到实际的应用而做的决定。实际 上 ,还可以扩充关系结点集合的元素个数 ,比如添加谓 词 Exist s ,定义与或非结点管理一系列查询子句等等 , 实现复杂文档或多表查询中的各种查询( 包括相关查 询) 。关于扩展的关系结点集合将在另一篇文章中专 门阐述。图 1 表示一棵典型的查询树。如图 1 所示 , 关系结点“- ”下的子句结点 s , s表4 5示集合运算 s - s 。对于并和交结点 , 其子结点之间的4 5顺序没有特别规定。从本质上说 , 查询树的构建就是将查询要求转化 成查询树的过程。根据查询树的定义及约束条件 , 可 以按下列步骤进行查询树的构建 :步骤 1 :根据约束条件 1 构建子句结点。步骤 2 :根据约束条件 1 、2 、3 构建关系结点 , 最终 形成查询树。下面以一个例子说明查询树的构建方法:某地区挑选北京奥运候选火炬手的条件是: a . 本 地区常住居民包括有户口的人员 ; 或有暂居证的长期 务工人员 ;年龄大于 14 岁 ; 有能力顺利完成 400 米火 炬接力( 需要通过测试) ; 没有犯罪前科。b. 社会公开 报名的话 ,必须在本行业有突出贡献或者是技术能手; 如果是下岗工人或者残疾人则应有感人的故事; 不包 括专业体育人员。c . 组织系统选送的话 , 限于专业体 育人员 ;并获得国家级比赛项目名次。这里假设上述所有挑选条件均可以映射成一定的 关键词并进行匹配操作 ,例如“有能力顺利完成 400 米火炬接力”可以通过测试成绩来判断“, 技术能手”则有获得承认的等级证书 ,而“突出贡献”、“感人故事”等可用奖状证明。 将例子中可以查询的关键词用数字加以描述 , 例如“有能力顺利完成 400 米火炬接力”用数字 加以描 述 ,而分支结点用英文字母表示 ,可以得到图 2 所示的一种查询树。果类型也是相同的 , 即在它们的查询语句中 SEL EC T子句 和 FROM 子 句 都 是 一 样 的 , 不 一 样 的 只 是WHER E 子句。假设子句结点 si ( i = 1 , 2 , 3 , 4 , 5) 中对 应的查询条件 , 即子句中的 WHER E 部分 , 分别为 ci ( i= 1 , 2 , 3 , 4 , 5) 。子句结点 si 表示第 i 个查询子句 , 同时 也代表子句的查询结果集合 , S 表示最终的查询结果集合 , c 表示最终查询结果 S 对应的查询条件。 在算法 2 的 SQL 转换中 , 用“OR”转换“ ”, 用“AND”转换“”,用“AND NO T”转换“- ”, 则 :算法 1 为 : S = ( s1 s2 s3 ) ( s4 - s5 )算法 2 为 : c = ( c1 OR c2 OR c3 ) AND ( c4 AND NO T c5 )于是根据集合的交、并、差的定义可知 :对于 x S ( x s1 x s2 x s3 ) ( x s4 x | s5 )而 si 是按条件 ci 查询得到的结果所以 , 当 x si 时 , x 一定也能保证条件 ci 成 立。从而当 x S 时 , x 一定可以使条件c = ( c1 ORc2 OR c3 ) AND ( c4 AND NO T c5 ) 为真。反之 , 当 x 使条件 c = ( c1 OR c2 OR c3 ) AND ( c4AND NO T c5) 为真时 , 那么 x 同时也满足 : ( x s1 x s2 x s3 ) ( x s4 x | s5 )于是可知算法 1 与算法 2 的结果集合是相等的 ,证毕。将查询树转换成 SQL 的本质就是将不同的查询 子句合并到一个 SQL 语句中去 ,即构建具有层次结构 的 SQL 条件表达式。从形式上看 ,这种 SQL 条件表达 式包含了许多括号对 , 例如图 2 所示的查询树可以转 换成以下查询条件表达式 :( ( ( or ) and and and ) and ( ( ( or图 2 北京奥运候选火炬手的挑选条件查询树3 查询树转换算法查询树清楚地表明了比较复杂的查询关系 , 便于 普通人员掌握。实现查询树的算法主要有两种:算法 1 :将查询树从左到右按深度优先遍历每个 结点。如果是子句结点则执行一次 SQL 查询 ,如果是 关系结点则先对所有的子结点求解 , 然后再对这些子 结点的结果进行交、并、差集合运算。算法 2 :将查询树从左到右按深度优先遍历每个 结点 , 并将每个结点转换成 SQL 语句中对应部分 , 从 而将整棵查询树转换为一条 SQL 语句 ,然后再去执行 这条 SQL 语句完成查询操作。对比算法 1 和算法 2 ,由于算法 1 每遇到一个子句 结点就要进行一次 SQL 查询 , 而算法 2 只进行一次SQL 查询 ,所以在时间复杂度上算法 2 要相对优于算 法 1 。另外 ,由于算法 1 中要进行集合运算 ,那么对于同一层的关系结点在按照父结点规定的集合操作进行 之前都必须分配一定的存储空间来存储当前的查询结 果 ,于是在空间复杂度上不如算法 2 , 因为对于一般的 文档查询 , 算法 2 只需分配一定的存储空间来存储最 终查询结果 , 不需要的数据在查询时已经被抛弃。如果数据库系统具有比较优秀的优化能力 , 则算法 2 还 可以对自动形成的 SQL 语句进行优化 ,从而获得更高的查询效率。因此一般都采用算法 2 , 即将查询树转 换成一条 SQL 语句。定理 2 :算法 1 与算法 2 的查询结果是相等的。 证明 :不妨以图 1 所示的典型的查询树为例来证明 ,对于其他查询树的证明思路是一样的。根据约束条件 4 , 无论是算法 1 还是算法 2 , 它们 都是单表查询 ,在查询语句中数据源是相同 ,查询的结)and not ) or ( and ) ) )查询树转换算法描述如下 :FU NC T ION Inquire Tree To SQL ( NOD E no de , S TR IN G SQL - st ring) SQL - st ring. AddSt ring“( ”DO R EP EA TFetch 一个子结点 X IF X 不存在 T HEN退出循环END IFIF X 是分支结点 T HENSQL - st ring. AddSt ring 本结点运算符/ / 写 AND 、OR 或( AND) NO T递归调用本算法EL SESQL - st ring. AddSt ring“( ”SQL - st ring. AddSt ring X 的查询子句SQL - st ring. AddSt ring“) ”END IF END DOSQL - st ring. AddSt ring“) ”END FU NC T ION运行查询树转换程序时 , 首 先获得根结点 Root Node , 然后将 它 作 为 参 数 代 入 Inquire Tree2To SQL 中即可 , 最后的结果存放 在 SQL - st ring 中。4应用实例在开展“公路工程质量智能分析与诊断专家系统研究”课题 研究时提出了一种面向问题分析 与决策的专家系统构建方法 , 其 中在进行推理时需要根据公路质 量问题的现象及相关的质量问题 主体对象进行公路工程质量问题 的查询。考虑到数据库数据量非 常大 , 问题的现象与主体对象的 组合数也比较大 , 所以在开展这 部分的研究工作中 , 采用了上述 查询树的思想 , 开发了质量问题 查询模块。查询模块由两部分组成。一部分用于构建查询子 句 ,如图 3 所示 ; 另一部分则用于构建查询树 , 如图 4 所示。因为质量问题的关键词比较少 , 只有问题现象 和主体对象( 也称为基本对象) 两个 , 而且关系也非常 简单 ,所以查询子句的界面比较简单。而查询树则使 用一个树型控件来实现 , 它的使用与普通的树操作完 全一样。在查询某个或某些质量问题之前 , 首先选择与其 相关的主题对象以及( 或者) 问题现象。“基本对象列 表”和“问题现象列表”中已经将知识库中所有的主体 对象和问题现象罗列出来。在选择主体对象和问题现 象时 ,可以从列表中选择 ,亦可输入相关的关键字进行 检索。主体对象和问题现象的检索支持“模糊”和“精 确”两种方式 , 用户可以精确输入关键词 , 也可以只输 入部分关键词。另外 ,为了缩小查询范围 ,还可以选择 在结果中继续进行检索。当选择了在结果中查询之 后“, 结果列表”中的数据将出现在“基本对象列表”以 及( 或者)“问题现象列表”中。当查询到所需的主体对 象和问题现象之后就可以构造查询树进行质量问题的 查询了。在构建查询树过程中 ,可以通过点击查询树界面(图 4 所示) 上的“添加“或者”条件”、“添加“并且”条件”以及“添加“不包括”条件”按钮( 分别对应查询树概 念中的“并”、“交”、“差”结点) 来添加条件结点。要在 某个条件结点下添加子句结点 , 可以先选择相应的条 件结点 ,然后在查询子句界面( 图 3 所示) 的基本对象 查询结果列表以及问题现象查询结果列表中选择要添 加的子句 ,然后点击“ ”按钮即可在指定的条件结 点下添加相关的查询条件。在构建查询树过程中如果 发现某个或某些结点出错了 , 可以将其删除后重新添 加 ,其中“删除条件/ 关系”按钮用于删除某个或者若干 个条件结点、关系结点及其子结点“, 删除全部”按钮则 用于删除整个查询树 , 以实现查询树的重构。构建好 查询树之后 ,点击“ ”按钮就可查询出满足查询树 的质量问题。系统还支持查询逆问题 , 即可以根据已查询出来 的质量问题来检索它所对应的主体对象和问题现象 所以 ,当点击了在结果中查询之后 ,在查询子句界面中 的“基本对象列表”和“问题现象列表”显示的将会是与 查询树界面中质量问题查询结果列表有关的主体对象 和问题现象。另外 ,还开发了针对一般情况的层次查询原型系 统 Inquire Tree 。该系统对关系结点进行了( 下转第 55 页)的就是产生关联规则 ,在满足最小支持度和最小置信度的情况下 ,可以直接得到强关联规则 ,对于置信度可 有下面的公式5 得到 :库中 , 有 70 % 还邻近大型停机坪。这条规则对于分析机场油库位置规律、机场范围内各目标相对位置关系 有一定的指导作用。Co nfidence ( A B )= P ( B / A )4总结与展望Suppo rt - co unt ( A B )=Suppport count ( A )本文中 ,我们提出了基于空间关联规则的图像数据挖掘模型 ,旨在挖掘图像中情报对象的空间知识 ,挖 掘对象是空间关系数据和图像情报数据的联合数据 库 ,在分析空间关系的同时关联了图像情报的信息 ,使 得到的规则更有针对性。挖掘的过程整体软件实现是 下一步研究的主要内容 ,其中包括用户界面中的可视 化关联规则。-其中 Support count ( A B ) 是指包含项集 A B 的事务数量 , Support count ( s) 是指包含项集 A 的事务数 量。根据上式 , 关联规则可以如下产生 :a . 对于每个频繁项集 L , 产生 L 的所有非空子 集。b. 对于 L 的每一个非空子集 s , 如果满足参 考 文 献Support - count ( L )min co nfSuppport - count ( s)孔庆先 ,方 涛 ,郭达志. 图像数据挖掘中的关联规则J . 计算机工程 ,2006 ( 3) :116 - 119马超飞 ,刘建强. 遥感图像多维量化关联规则挖掘J . 遥感技术 与应用 ,2003 ( 8) :87 - 90Kangkachit T , Waiyamai K. A Business - o riented Spatial Associa2 tio n Rule Mining System Protot ype DB . ht t p :/ / pindex . ku. ac . t h/ file2research/ , 2004 . 10J iawei Han , Micheline Kamber . 数据挖掘 : 概念与技术第二版.M . 北京 :机械工业出版社 ,2007张 鹤 ,关泽群. 多媒体数据挖掘中图像数据的关联规则挖掘J . 地理空间信息 ,2005 ( 12) :61 - 64( 责编 :刘武英)1则输出规则“s ( L - s) ”, 其中 min - co nf 是最小置信度阈值。2输出知识发现的输出是一系列令人感兴趣3 . 33的强关联规则 , 比如本文得出的一条关联规则: Is -a ( X ,Oil - Storage) Close - To ( X , 主 干 道 ) Adjacent -to ( X , 机 库) Adjacent - to

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论