![[计算机]Web挖掘论文:基于Web日志挖掘的原型系统研究与实现.doc_第1页](http://file.renrendoc.com/FileRoot1/2019-1/10/a14982ab-2d56-4890-a63e-b40148c71043/a14982ab-2d56-4890-a63e-b40148c710431.gif)
![[计算机]Web挖掘论文:基于Web日志挖掘的原型系统研究与实现.doc_第2页](http://file.renrendoc.com/FileRoot1/2019-1/10/a14982ab-2d56-4890-a63e-b40148c71043/a14982ab-2d56-4890-a63e-b40148c710432.gif)
![[计算机]Web挖掘论文:基于Web日志挖掘的原型系统研究与实现.doc_第3页](http://file.renrendoc.com/FileRoot1/2019-1/10/a14982ab-2d56-4890-a63e-b40148c71043/a14982ab-2d56-4890-a63e-b40148c710433.gif)
![[计算机]Web挖掘论文:基于Web日志挖掘的原型系统研究与实现.doc_第4页](http://file.renrendoc.com/FileRoot1/2019-1/10/a14982ab-2d56-4890-a63e-b40148c71043/a14982ab-2d56-4890-a63e-b40148c710434.gif)
![[计算机]Web挖掘论文:基于Web日志挖掘的原型系统研究与实现.doc_第5页](http://file.renrendoc.com/FileRoot1/2019-1/10/a14982ab-2d56-4890-a63e-b40148c71043/a14982ab-2d56-4890-a63e-b40148c710435.gif)
全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Web挖掘论文:基于Web日志挖掘的原型系统研究与实现【中文摘要】在Internet信息大爆炸的年代,用户大量地借助搜索引擎获取所需信息。然而现有的信息检索系统基本对不同用户键入同一查询词返回同样的结果集,忽视了用户自身的知识领域背景和兴趣趋向,使用户陷入了信息资源迷航状态。为此,信息检索领域拓展开了一个新兴的研究方向-个性化检索研究。提供个性化检索的前提条件是要能准确地识别用户并合理的建立其知识兴趣背景。Web日志中含有大量的用户记录信息,通过对相关信息的挖掘可以识别出单一用户,通过分析用户的浏览行为信息可以抽取用户特性信息,从而构建出用户知识兴趣背景。结合用户知识兴趣背景,对不同用户键入同一查询词进行用户识别,分析其领域知识、兴趣偏好、喜好趋势等信息,从而返回相对不同用户意图需求的结果集,实现个性化检索,提高查全率、查准率以及用户的满意度。本文重点研究通过Web日志挖掘技术建立用户知识兴趣背景,实现个性化检索原型系统。主要研究内容如下:探讨了针对Web日志数据预处理阶段的数据清理技术,同时对数据预处理主要几个步骤进行了详细分析、阐述。针对基于词频的TF/IDF算法忽略了用户知识兴趣与文档相关性问题,结合对Web日志中用户浏览行为和查询日志中.【英文摘要】In an era of Internet information explosion, the users usually acquire information by means of using search engine. However, ignoring the knowledge background and interest of the users, the existing information retrieval system gives the same results to the same query input by the different users, and makes the users into a trek state of information resource. Therefore, this leads to a new research direction for the information retrieval field-the study on personalized information retrieval.The preco.【关键词】Web挖掘 个性化 Web日志 TF/IDF 数据预处理 用户知识兴趣背景【英文关键词】Web Ming Personalized Web Log TF/IDF Data Preprocessing Users Knowledge and Interest Background【目录】基于Web日志挖掘的原型系统研究与实现摘要4-5Abstract5第一章 绪论9-161.1 研究背景、目的9-101.2 个性化研究意义及其现状10-111.3 Web 日志挖掘研究意义及其现状11-131.3.1 国外研究现状121.3.2 国内研究现状12-131.4 本文的主要研究内容13-141.5 本文组织结构14-16第二章 数据挖掘与Web 挖掘16-282.1 数据挖掘概述16-172.1.1 数据挖掘定义16-172.1.2 数据挖掘的一般过程172.2 Web 挖掘17-222.2.1 Web 挖掘基本概念17-182.2.2 数据挖掘与Web 挖掘182.2.3 Web 挖掘与信息检索182.2.4 Web 挖掘对象18-192.2.5 Web 挖掘处理过程192.2.6 Web 挖掘分类19-222.3 Web 日志挖掘22-252.3.1 Web 日志挖掘相关术语222.3.2 Web 日志挖掘对象22-232.3.3 Web 日志挖掘一般过程232.3.4 Web 日志挖掘常用技术23-252.4 个性化25-272.4.1 个性化信息推荐262.4.2 个性化信息检索26-27本章小结27-28第三章 个性化检索28-313.1 个性化检索28-303.1.1 个性化检索涉及的相关技术28-293.1.2 个性化检索评价指标29-30本章小结30-31第四章 Web 日志预处理研究31-364.1 Web 日志介绍31-324.2 Web 日志预处理过程32-354.2.1 数据清理32-344.2.2 用户识别344.2.3 会话识别34-354.3 用户点击日志35本章小结35-36第五章 用户知识兴趣背景36-405.1 用户知识兴趣背景概述36-375.1.1 知识兴趣背景的研究对象36-375.1.2 知识兴趣背景的获取方式以及构建方法375.2 用户知识兴趣背景表示方法概述37-39本章小结39-40第六章 构建用户知识兴趣背景40-486.1 本文用户知识兴趣背景表示方法40-416.2 数据过滤41-426.3 基于词频统计的TF/IDF 算法426.4 改进的偏加权TF/IDF 算法42-456.4.1 用户交互页面权重分析43-446.4.2 改进的偏加权TF/IDF 实现44-456.5 用户知识兴趣背景构建45-466.6 用户知识兴趣背景更新46-476.6.1 Rocchio 反馈算法466.6.2 基于Rocchio 反馈算法衍化的用户知识兴趣背景更新46-47本章小结47-48第七章 基于用户知识兴趣背景的优化重排48-517.1 基于用户知识兴趣背景的检索结果集分类48-497.2 优化重排49-507.2.1 文档向量的相关性49-507.2.2 文档与查询的相关性50本章小结50-51第八章 个性化检索系统原型51-558.1 原型系统设计与架构51-528.2 原型系统相关模块介绍52-548.2.1 信息采集器52-538.2.2 索引器、检索器以及用户接口模块53-548.2.3 用户知识兴趣背景模块54本章小结54-55第九章 原型实现与实验分析55-639.1 实验平台的软硬件环境55-569.1.1 系统软、硬件环境559.1.2 Larbin 和Xapian 简介55-569.2 实验分析56-639.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中山科技新城项目定位及产品规划定价方案
- 文化说课课件
- 户用光伏系统应用培训
- 南京江苏正德职业技术学院公开招聘人员笔试历年参考题库附带答案详解
- 上海2025年上海市金融稳定发展研究中心招聘6人笔试历年参考题库附带答案详解
- 2025至2031年中国汽车用耐热低压电缆行业投资前景及策略咨询研究报告
- 独立电影工作室企业制定与实施新质生产力项目商业计划书
- 2025至2031年中国摩托车中央控锁行业投资前景及策略咨询研究报告
- 特教师资培训行业跨境出海项目商业计划书
- 2025至2031年中国干鲜果品行业投资前景及策略咨询研究报告
- 招投标管理招聘笔试题及解答(某大型国企)
- 新版《铁道概论》考试复习试题库(含答案)
- 2024至2030年中国快餐业调研分析及发展前景预测报告
- 2024年公选处级领导干部面试题选及参考答案
- 6.3基层群众自治制度 说课课件高中政治统编版必修三政治与法治
- AQT 1009-2021 矿山救护队标准化考核规范(正式版)
- 厂房保安合同范本
- 中国慢性冠脉综合征患者诊断及管理指南2024版解读
- 重庆市南岸区2023-2024学年五年级下学期期末质量抽测数学试题
- 2023~2024学年四年级下册语文期末模考试卷·创意情境 统编版
- MOOC 灾难逃生与自救-同济大学 中国大学慕课答案
评论
0/150
提交评论