信息检索术语_第1页
信息检索术语_第2页
信息检索术语_第3页
信息检索术语_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文本操作( text operation ) 标引词( indexing term )倒排文档( inverted file ) 用户反馈( user feedback ) 检索评价( retrieval evaluation ) 查询语言( query language )用户界面( user interface ) 特别检索( ad hoc etrieval ) 用户需求档( user profile ) 语词加权( term-weighting )数据检索( data retrieval ) 用户任务( User task )查全率 (R, Recall Ratio) 查准率 (P, Precision Ratio)漏检率 (O, Omission Ratio) 误检率 (M, Miss Ratio)用户负担( user effort ) 面向用户( user-oriented )扩展布尔模型( extended Boolean model ) 词干提取( stemming )参考测试集( reference test collection ) 扩展模式 extended patterns容错查询 searching allowing errors 有序包含( ordered inclusion )无序包含( unordered inclusion ) 查询重构 query reformulation查询扩展 query expansion 语词重新加权 term reweighting用户相关反馈 User Relevance Feedback 描述性元数据 Descriptive Metadata语义元数据 Semantic Metadata 信息检索( Information Retrieval, IR )受控词汇表( controlled vocabulary ) 文本压缩 text compression压缩比( compression ratio ) 词汇分析 lexical analysis排除停用词 elimination of stopwords 词汇表( vocabulary )事件表( occurrence ) 倒排文档 inverted files散列变换( hashing ) 查询语法树( query syntax tree )移位 - 或( shift-or ) 顺序检索( sequential search )并行计算( parallel computing ) 分布计算( distributed computing )算术逻辑单元( arithmetic logic unit, ALU ) 虚拟处理器( virtual processor )中介器( broker ) 数字图书馆( Digital Library, DL )信息存取任务( information access tasks ) 信息可视化( information visualization )上下文关键词( keyword-in-context, KWIC ) 半结构化数据( semi-structured data )动态服务器( dynamic server ) 档案库服务器( archive server )精确匹配( exact match ) 基于内容( content-based )收集器 - 标引器( crawler-indexer ) 机器人 robots蜘蛛 spiders 查询界面 the query interface响应界面 the answer interface 网页级别 PageRank漫游 Web Crawling the Web 广度优先 breadth-firstd 深度优先 epth-first fashion 专指性查询 Specific queries泛指性查询 Broad queries 网络目录 Web Directories元搜索引擎 Metasearchers 用户培训 Teaching the User网络目录 Web Directories 元搜索引擎 Metasearchers软件代理 Software Agents 工程索引( Engineering Index,EI )从用户的角度( from a user-centered perspective )杜威十进分类法( Dewey Decimal Classification )结构化文本检索( structured text retrieval, STR )联机公共检索目录( online public access catalog, OPAC )多媒体信息检索( Multimedia Information Retrieval, MIR )从计算机学科的角度( from a computer-science perspective )文献逻辑表示(视图)( logical view of the document )检索性能评价( retrieval performance evaluation )通用标记语言( SGML , standard general markup language )机读目录记录( Machine Readable Cataloging Record, MARC )资源描述框架 (Resource Document Framework, RDF)XML(eXtensible Markup Language, 可扩展标记语言 )HTML ( HyperText Markup Language, 超文本标记语言)分布式信息检索 (distributed information retrieval)通过图像内容查询( Query by Image Content, QBIC )Distributed Architecture 分布式结构 Centralized Architecture 集中式结构国会图书馆分类法( Library of Congress Classification )联机计算机图书馆中心( Online Computer Library Center, OCLC )数字图书馆创新项目( Digital Libraries Initiative, DLI )基于数字化对象标识符( Digital Object Identifier, DOI )1 boolean retrieval 布尔检索2 the term vocabulary and postings lists 词汇表和文档记录列表3 dictionaries and tolerant retrieval 字典和容错检索4 index construction 构建索引5 index compression 索引压缩6 scoring, term weighting, and the vector space model 评分,词条权重和向量空间模型7 computing scores in a complete search system 全文搜索系统中的计算评分8 evaluation in information retrieval9 relevance feedback and query expansion 关联信息反馈和查询扩展10 xml retrieval xml 检索11 probabilistic information retrieval 概率信息检索12 language models for information retrieval 信息检索中的语言模型13 text classification and naive bayes 文本分类和贝叶斯算法14 vector space classification 向量空间模型15 support vector machines and machine learning on documents支持向量空间模型的关于文档的机器学习16 flat clustering 扁平聚类17

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论