毕业设计开题报告基于关联规则的图书阅读推荐系统.doc_第1页
毕业设计开题报告基于关联规则的图书阅读推荐系统.doc_第2页
毕业设计开题报告基于关联规则的图书阅读推荐系统.doc_第3页
毕业设计开题报告基于关联规则的图书阅读推荐系统.doc_第4页
毕业设计开题报告基于关联规则的图书阅读推荐系统.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京理工大学泰州科技学院毕业设计(论文)开题报告学 生 姓 名:学 号:专 业:软件工程设计(论文)题目: 基于关联规则的图书阅读推荐系统指 导 教 师:2015年1月18日开题报告填写要求1开题报告(含“文献综述”)作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。此报告应在指导教师指导下,由学生在毕业设计(论文)工作前期内完成,经指导教师签署意见及所在专业审查后生效;2开题报告内容必须用黑墨水笔工整书写或按教务处统一设计的电子文档标准格式(可从教务处网页上下载)打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教师签署意见;3“文献综述”应按论文的格式成文,并直接书写(或打印)在本开题报告第一栏目内,学生写文献综述的参考文献应不少于15篇科技论文的信息量,一般一本参考书最多相当于三篇科技论文的信息量(不包括辞典、手册);4有关年月日等日期的填写,应当按照国标GB/T 740894数据元和交换格式、信息交换、日期和时间表示法规定的要求,一律用阿拉伯数字书写。如“2010年3月15日”或“2010-03-15”。 毕 业 设 计(论 文)开 题 报 告1结合毕业设计(论文)课题情况,根据所查阅的文献资料,每人撰写2000字左右的文献综述:文 献 综 述摘要 随着移动互联网的迅速发展,手机阅读已经渐渐的成为主流产品了。随着用户阅读的增多将会产生大量的数据。如何为用户推荐其真正喜欢的书籍将成为重大问题。我们通过数据挖掘技术通过挖掘用户阅读记录中的关联关系来发现用户的喜好并为用户推荐书籍。关键词 数据挖掘 关联规则 Apriori算法 android 阅读器 图书1 研究背景随着移动互联网的发展,人们通过手机来产生的数据信息已越来越受到人们的重视。数据显示,2014年第三季度中国移动互联网市场规模达到515.6亿元,环比增长11.0%,同比增长93.4%。然而手机阅读作为移动增值业务中的一个重量级的产品,已经渐渐的成为主流产品。根据和阅读的数据显示,目前和阅读的书本量208553本,其中单本书籍点击量最高的可到达几十亿次。对于如此大的数据量,如何为这些用户推荐其真正喜欢的书呢?为了能够给用户推荐其真正喜欢的书,数据挖掘走入了我们的视野。2 关联规则所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。设I=i1,i2,im为所有项目的集合,设A是一个由项目构成的集合,称为项集。事务T是一个项目子集,每一个事务具有唯一的事务标识Tid。事务T包含项集A,当且仅当AT。如果项集A中包含k个项目,则称其为k项集。D为事务数据库,项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度(support)。如果项集的支持度超过用户给定的最小支持度阈值,就称该项集是频繁项集(或大项集)。关联规则就是形如XY的逻辑蕴含关系,其中XI,YI且XY=,X称作规则的前件,Y是结果,对于关联规则XY,存在支持度和信任度。支持度是指规则中所出现模式的频率,如果事务数据库有s%的事务包含XY,则称关联规则XY在D中的支持度为s%,实际上,可以表示为概率P(XY),即support(XY)= P(XY)。信任度是指蕴含的强度,即事务D中c%的包含X的交易同时包含XY。若X的支持度是support(x),规则的信任度为即为:support(XY)/support(X),这是一个条件概率P(Y|X),即confidence(XY)= P(Y|X)。3 相关技术 本系统是利用Java开发技术实现的基于事务数据库的频繁项集挖掘算法。后台选用MySql作为数据库系统平台,前台采用android平台。2.1 Apriori算法 Apriori算法是一种挖掘关联规则的频繁项集算法,这个算法总体上说就是两步,一步是连接,另外一步就是剪枝。连接就是用迭代的方法,而剪枝的目的则是为了生成符合要求的频繁项目集。Apriori算法的总体流程是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义6。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。2.2 Java开发技术Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台的总称。Java 不同于一般的编译执行计算机语言和解释执行计算机语言。它首先将源代码编译成二进制字节码,然后依赖各种不同平台上的虚拟机来解释执行字节码。从而实现了“一次编译、到处执行”的跨平台特性。2.3 MySqlMySQL 是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle公司。MySQL是最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策(本词条“授权政策”),它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据库。由于其社区版的性能卓越,搭配PHP和Apache可组成良好的开发环境。2.4 AndroidAndroid是一种基于Linux的自由及开放源代码的操作系统,主要使用于移动设备,如智能手机和平板电脑,由Google公司和开放手机联盟领导及开发。尚未有统一中文名称,中国大陆地区较多人使用“安卓”或“安致”。Android操作系统最初由Andy Rubin开发,主要支持手机。2005年8月由Google收购注资。2007年11月,Google与84家硬件制造商、软件开发商及电信营运商组建开放手机联盟共同研发改良Android系统。随后Google以Apache开源许可证的授权方式,发布了Android的源代码。第一部Android智能手机发布于2008年10月。Android逐渐扩展到平板电脑及其他领域上,如电视、数码相机、游戏机等。2011年第一季度,Android在全球的市场份额首次超过塞班系统,跃居全球第一。 2013年的第四季度,Android平台手机的全球市场份额已经达到78.1%。2013年09月24日谷歌开发的操作系统Android在迎来了5岁生日,全世界采用这款系统的设备数量已经达到10亿台。参 考 文 献1 刘世平.数据挖掘技术及应用M.北京:高等教育出版社,2010.1.2 韩慧等.数据仓库与数据挖掘M.北京:清华大学出版社,2009.8.3 曾珂.基于数据挖掘的微博用户兴趣群体发现与分类D.华中师范大学,2014.4 喻云峰.数据挖掘算法的分析与研究J.科技广场. 2010(09).5 范明,孟小峰.数据挖掘:概念与技术M.北京:机械工业出版社,2007.1.6 齐玉成,郑丽英,高三营.基于网格的数据挖掘算法J.电脑知识与技术. 2010(04).7 刘士琛.面向推荐系统的关键问题研究及应用D.中国科学技术大学,2014.8 王世江.Google Android 开发入门(第二版)M.北京:人民邮电出版社,2009.6.9 李培林.安卓系统的应用及发展趋势展望J.计算机光盘软件与应用,2012,10(18):161162.10 郑晶.基于网格的并行数据挖掘算法的实现J.福建工程学院学报. 2010(01).11 姚亮.一种基于hash和项集空间划分的关联规则挖掘算法J.微计算机信息. 2010(18).12 杨楠,罗省贤.Web数据挖掘在云计算平台的实现J.电脑知识与技术. 2011(19).13 王强,郑世珏,宋志明.基于Android的交互式学习微阅览器设计与实现J.现代教育技术.2012,22(09):8992.14 刘平.Android手机访问服务器的一种数据交互方法J.电子设计工程. 2010,18(09):9698.15 李晓虹,尚晋.一种改进的新Apriori算法J.重庆:计算机科学,2007,34(4):196198 毕 业 设 计(论 文)开 题 报 告本课题要研究或解决的问题和拟采用的研究手段(途径):(1) 要研究或解决的问题本课题研究的是关联规则挖掘在图书阅读中的应用。用到的技术是基于关联规则挖掘的基本算法FP-growth算法和Java开发技术。在本次的课题中,要对FP-growth算法进行深入研究,并基于Java语言实现该算法。用实现的FP-growth算法在移动应用的阅读记录中得到应用。本文是对图书阅读用户的阅读记录的数据进行挖掘,发现不同类别书籍的共同特征及其规则,以及用户的阅读特征和阅读喜好。利用关联规则挖掘出的这些相关性,去对图书的推荐和推广,使用户能够最快的获取到喜好的图书。(2) 拟采用的研究手段(途径)查找相关资料对FP-growth算法进行一个详细的了解,知道其运算的基本原理以及运算方式。还有在运行过程中应该注意的相关规则。深入国内外android系统开发者社区,与一线开发者进行交流,获取更多信息与技术,详细了解学习Android应用软件的开发流程。设计过程应用软件工程原则,严格按照需求分析、概要设计、详细设计、程序编码、软件测试等步骤。 毕 业 设 计(论 文)开 题 报 告指导教师意见:1对“文献综述”的评语:阅读文献的数量达到15篇,文献综述内容具备一定的深度和广度,比较清楚的描述了毕业设计课题的研究背景,介绍了基于关联规则图书阅读推荐系统的现状和其所具有的优势,以及通过对用户阅读记录进行关联规则挖掘来实现图书的推荐的意义,符合毕业设计文献综述标准要求。2对本课题的深度、广度及工作量的意见和对设计(论文)结果的预测:本课题研究的是一个基于关联规则图书阅读推荐系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论