信息检索模型研究.ppt
第二讲信息检索模型研究陆铭66134922richard.lushu.edu.cnmingler.ccshu.org2内容提要检索模型的基本概念与分类布尔模型向量模型概率模型其他模型结构模型浏览模型统计语言建模国内外检索模型理论研究现状3参考资料TF/IDF算法介绍http:/202.120.121.216:2048/slider/jyx/mir/tfidf.doc信息检索知名人物介绍http:/202.120.121.216:2048/slider/jyx/mir/whoswho_chronology.doc如何写好文献综述http:/202.120.121.216:2048/slider/jyx/mir/review-writing.ppt4检索模型的基本概念信息检索模型信息检索模型是指如何对查询和文档进行表示,然后对它们进行相似度计算的框架和方法本质上是对相关度建模信息检索模型是IR中的核心内容之一5检索模型的基本概念相关概念标引项(IndexTerm)文档表示成多个Term的集合通常用词来表示,但是也可以用其他语言单位来表示关键词(keywords)可以看成Term的一种标引项的权重(Weight)不同标引项作用是不同的通过权重加以区分6模型F检索模型的基本概念检索模型的定义信息检索模型是描述信息检索中的文档、查询和它们之间的关系(匹配函数)的数学模型。文档D查询Q匹配函数R(qi,dj)7检索模型的基本概念模型要素F是一个框架,用以构建文档,查询以及它们之间关系的模型D是一个文档集合,通常由文档逻辑视图来表示。可以是一组索引词或关键词。既可以自动提取,也可以是由人主观指定。Q是一个查询集合,是用户任务的表达,由查询需求的逻辑视图来表示。R(qi,dj)是一个排序函数,它给查询qi和文档dj之间的相关度赋予一个排序值即:IR模型由上述三个要素组成R(qi,dj)=F(D,Q)