jsp基于关联规则的学习资源系统mysql论文_第1页
jsp基于关联规则的学习资源系统mysql论文_第2页
jsp基于关联规则的学习资源系统mysql论文_第3页
jsp基于关联规则的学习资源系统mysql论文_第4页
jsp基于关联规则的学习资源系统mysql论文_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEI摘要互联网技术的迅猛发展把我们带进了信息爆炸的时代。如此多的信息,别说找到自己感兴趣的部分,即使是全部浏览一遍也是不可能的。传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息的爆炸使得信息的利用率反而降低,这种现象被称之为信息超载。智能推荐,包括智能化搜索,被认为是当前解决信息超载问题最有效的工具之一。本系统主要是关联规则的算法从学习系统中的用户浏览记录和收藏评论的数据中找出一种规律,系统可以根据这种规律实现学习资源有趣的,方便的,节约时间的推荐服务。关联规则算法就是在学习资源推荐系统中收藏量最大,阅读量最大的图书或者学习资源,数据挖掘的重要方法之一是应用关联规则,关联规则用于发现事务数据库中潜藏的重要规律,这些规律不仅反映了用户的主要行为模式,也为用户进行学习节约了时间精力,是学习资源推荐系统进行读者分析的重要方法之一。本系统运用两类关联规则算法,主要通过对学习资源中用户的节约记录分析,这两种关联规则一种是相关图书,一种是相似用户,了解书籍之间潜藏的规律,进行分析挖掘本文研究利用关联规则挖掘的方法,对图书学习资源推荐系统中用户的借阅记录分析,发现用户借阅习惯相似的读者。关键词关联规则,数据库管理,JSP,html,JavaPAGEIII

AbstractTherapiddevelopmentofInternettechnologybroughtusintotheeraofinformationexplosion.Somuchinformation,letalonefindtheirowninterestinthepart,evenifallbrowsingagainisnotpossible.Thetraditionalsearchalgorithmcanonlybepresentedtoallusersthesamesortofresults,cannotbeinterestedindifferentuserstoprovidetheappropriateservices.Theexplosionofinformationmakestheutilizationofinformationlower,whichiscalledinformationoverload.Intelligentrecommendations,includingintelligentsearch,areconsideredoneofthemosteffectivetoolsforresolvinginformationoverloadissues.Inthispaper,theassociationrulesminingtechnologyisusedtoextracttheborrowingrulesofthebooksfromthereaders'borrowinghistoricaldata,andaccordingtotheserules,thelibraryispersonalizedandtheactivebookrecommendationserviceiscarriedout.TheApplicationofAssociationRulesinLibraryPersonalizedBookRecommendationTheminingofassociationrulesisoneoftheimportantmethodsofdatamining.Itisoftenusedtodiscovertheimportantlawshiddeninthetransactiondatabase.Theserulesreflectthebehaviorpatternofthereaders,whichisthecurrentpersonalizedinformationOneofthecommonmethodsofreaderanalysisinserviceresearch.Inthispaper,weusethemethodofminingassociationrulestoanalyzetheborrowingrecordsofreadersinthelibrarydatabase,anddigouttwokindsofassociationrules.Oneisrelatedbooks,theuseofassociationrulestoanalyzethereadertoborrowhistoricaldata,tounderstandthehiddenrulesbetweenbooks,andtheotherissimilarreaders,throughthereaderborroweddataassociationrulesmining,foundthatborrowinghabitssimilarreaders.Keywordsassociationrules,databasemanagement,JSP,html,Java目录摘要 IAbstract II第1章绪论 11.1课题背景 11.2课题的目的和意义 11.3国内外概况 11.4课题的发展趋势 1第2章可行性分析 32.1社会可行性 32.2技术可行性 32.3操作可行性 32.4系统的技术介绍 32.4.1JavaScript介绍 32.4.2MVC介绍 42.4.3MYSQL介绍 52.5系统开发平台及运行环境 62.5.1系统开发平台 62.5.2运行环境 7第3章需求分析 83.1系统需求分析 83.2数据库结构分析 83.3平台功能分析 93.4数据库分析 103.4.1ER图分析 103.4.2数据库表分析 11第4章订餐前台设计与实现 13第6章系统测试 266.1测试目的与目标 266.2测试方法 266.3s测试结论 27结论 28致谢 29参考文献 30PAGE23第1章绪论1.1课题背景由于图书馆拥有着数量庞大的、系统有序的信息资源、相对稳定的读者群,这使得图书馆在开展读者个性化服务时比一般的商业网站都更加具有优势。而且,图书馆还积累运用了大量读者利用馆藏资源的历史数据,这些信息正是读者借阅兴趣的最真实表现。在数据爆炸式的年代,关联规则技术所表现出来的强大的生命力引起了学者的关注,学习资源推荐服务成为一大热门问题。就目前发展情况来看,我国学习资源推荐系统与国外相比还存在很多不足,自动化程度低,针对性不强。因此,对学习资源推荐的研究还存在很大空间。因此,选择难成了用户查阅文献资源的主要障碍。本文采用关联规则挖掘技术从系统用户借阅浏览历史数据中挖掘出读者的图书借阅规律,并根据这些规律实现学习资源有趣、方便的图书推荐服务。1.2课题的目的和意义关联规则应用是本系统进行推荐服务的重要方法之一,常用于发现事务数据库中潜藏的主题规律,这些规律反映出了读者的行为方式,是目前个性化信息服务研究中对读者行为模式分析的常用方法其中之一。本课题充分地利用所学到的网页设计、Java语言编程以及数据库等方面知识加以进行实践,以此提高自己的理论及实践能力。开发基于关联规则的学习资源推荐系统,希望提高创新能力,提取潜在的关联信息供读者使用,提高文献信息的获取速度,为学生节约大量的时间和精力,帮助学生在信息超载的社会现状下,快速找到适合自己的学习资源,节约时间,提高学习效率。1.3课题的发展趋势随着信息技术广泛、深入地应用到人类社会的各个领域并发挥着越来越重要的作用。目前而言,关联规则挖掘技术已经被广泛应用在西方金融行业企业中,它可以成功预测银行客户需求,关联规则就是描述这种在一个事务中物品之间同时出现的规律的知识模式。更确切的说,关联规则通过量化的数字描述物品甲的出现对物品乙的出现有多大的影响。国外关联规则挖掘技术应用范围很广,尤其在金融业,零售业等发挥着举足轻重的作用。而我们国家,关联规则挖掘技术起步较晚,对于关联规则挖掘技术的发展我们任重而道远。第2章可行性分析可行性分析指通过对系统的调查,判断他的必要性、可行性,我们一般从经济、技术、社会三方面进行分析,保证系统的可执行性,确保程序的开发成功,也就是说用最小的代价在尽可能短的时间内确定问题是否能够解决。2.1社会可行性在数据的时代,数据挖掘技术所表现出来的强大的生命力引起了大多数研究者的关注,学习资源推荐服务成为一大热门问题。首先对某个图书馆数据进行分析,然后以图书馆的历史借阅记录为具体挖掘对象,运用关联规则的数据挖掘方法,从图书馆的借阅历史数据中挖掘出了两类关联规则:相关书籍和相似读者,并根据这两类规则实现相关的图书推荐服务。采用关联规则挖掘技术从图书馆的读者借阅历史数据中挖掘出读者的图书借阅规律,并根据这些规律实现图书馆个性化的、主动式的图书推荐服务。2.2技术可行性本系统采用B/S三层结构进行设计,使用MyEclipse集成开发平台,使用Java编程语言,页面通过JSP,html等相关技术,以及主要用到两种算法:聚类算法和关联算法。聚类分析算法取决于数据的类型、聚类的目的和应用,这里采用K-Means算法。关联算法就是通过分析,找出给定项目组与事务记录集合中项目之间未知的依赖关系,采用Apriori算法。以SQLSERVER2005进行数据库的设计,开发设计整个学习资源推荐系统,最后充分利用软件测试方法保证软件质量,对图书资源推荐系统进行单元测试、集成测试、验收测试、系统测试2.3操作可行性目前,大多数计算机都能运行该系统,该系统的安装、调试、运行不会改变原计算机系统的设置和布局,并且系统界面简单,提示信息完整,运用本系统操作通俗易懂,兼容性良好,信息处理方面做得很精准规范。2.4系统的技术介绍2.4.1JSP介绍JSP(JavaServerPages)是由SunMicrosystems公司倡导、许多公司参与一起建立的一种动态网页技术标准。JSP技术有点类似ASP技术,它是在传统的网页HTML文件(*.htm,*.html)中插入Java程序段(Scriptlet)和JSP标记(tag),从而形成JSP文件(*.jsp)。用JSP开发的Web应用是跨平台的,不但在Linux下运行,也能在Windows系统上运行。JSP技术使用Java编程语言编写类XML的tags和scriptlets,来封装产生动态网页的处理逻辑。网页还能通过tags和scriptlets访问存在于服务端的资源的应用逻辑。JSP将网页逻辑与网页设计和显示分离,支持可重用的基于组件的设计,使基于Web的应用程序的开发变得迅速和容易。2.4.2Java介绍Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java看起来设计得很像C++,但是为了使语言小和容易熟悉,设计者们把C++语言中许多可用的特征去掉了,这些特征是一般程序员很少使用的。例如,Java不支持goto语句,代之以提供break和continue语句以及异常处理。Java还剔除了C++的操作符过载(overload)和多继承特征,并且不使用主文件,免去了预处理程序。因为Java没有结构,数组和串都是对象,所以不需要指针。Java能够自动处理对象的引用和间接引用,实现自动的无用单元收集,使用户不必为存储管理问题烦恼,能更多的时间和精力花在研发上。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。(1)简单性Java具有简单性。Java可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等。(2)分布性Java设计成支持在网络上应用,它是分布式语言。Java既支持各种层次的网络连接,又以Socket类支持可靠的流(stream)网络连接,所以用户可以产生分布式的客户机和服务器。网络变成软件应用的分布运载工具。Java程序只要编写一次,就可到处运行。(3)稳健性Java原来是用作编写消费类家用电子产品软件的语言,所以它是被设计成写高可靠和稳健软件的。Java消除了某些编程错误,使得用它写可靠软件相当容易。Java是一个强类型语言,它允许扩展编译时检查潜在类型不匹配问题的功能。Java要求显式的方法声明,它不支持C风格的隐式声明。这些严格的要求保证编译程序能找到调用错误,这就导致更可靠的程序。可靠性方面最重要的是Java的存储模型。Java不支持指针,它消除重写存储和讹误数据的可能性。类似地,Java自动的“无用单元收集”预防存储漏泄和其它有关动态存储分配和解除分配的有害错误。Java解释程序也执行许多运行时的检查,诸如验证数组和串,以确保其访问是否在界限之内。(4)安全性Java的存储分配模型是它防御恶意代码的主要方法之一。Java没有指针,所以程序员不能得到隐蔽起来的内幕和伪造指针去指向存储器。更重要的是,Java编译程序不处理存储安排决策,所以程序员不能通过查看声明去猜测类的实际存储安排。编译的Java代码中的存储引用在运行时由Java解释程序决定实际存储地址。Java运行系统使用字节码验证过程来保证装载到网络上的代码不违背任何Java语言限制。这个安全机制部分包括类如何从网上装载。例如,装载的类是放在分开的名字空间而不是局部类,预防恶意的小应用程序用它自己的版本来代替标准Java类。(5)可移植性Java使得语言声明不依赖于实现的方面。例如,Java显式说明每个基本数据类型的大小和它的运算行为(这些数据类型由Java语法描述)。Java环境本身对新的硬件平台和操作系统是可移植的。Java编译程序也用Java编写,而Java运行系统用ANSIC语言编写。高性能Java是一种先编译后解释的语言,所以它不如全编译性语言快。但是有些情况下性能是很要紧的,为了支持这些情况,Java设计者制作了“及时”编译程序,它能在运行时把Java字节码翻译成特定CPU(中央处理器)的机器代码,也就是实现全编译了。Java字节码格式设计时考虑到这些“及时”编译程序的需要,所以生成机器代码的过程相当简单,它能产生相当好的代码。2.4.3MyEclipse介绍MyEclipse企业级工作平台(MyEclipseEnterpriseWorkbench,简称MyEclipse)是对EclipseIDE的扩展,利用它我们可以在数据库和JavaEE的开发、发布以及应用程序服务器的整合方面极大的提高工作效率。它是功能丰富的JavaEE集成开发环境,包括了完备的编码、调试、测试和发布功能,完整支持HTML,Struts,JSP,CSS,Javascript,Spring,SQL,Hibernate。MyEclipse是一个十分优秀的用于开发Java,J2EE的Eclipse插件集合,MyEclipse的功能非常强大,支持也十分广泛,尤其是对各种开源产品的支持十分不错。MyEclipse可以支持JavaServlet,AJAX,JSP,JSF,Struts,Spring,Hibernate,EJB3,JDBC数据库链接工具等多项功能。可以说MyEclipse是几乎囊括了目前所有主流开源产品的专属eclipse开发工具。2.4.4SQLServer介绍 SQLServer是一个关系数据库管理系统。它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的,于1988年推出了第一个OS/2版本。在WindowsNT推出后,Microsoft与Sybase在SQLServer的开发上就分道扬镳了,Microsoft将SQLServer移植到WindowsNT系统上,专注于开发推广SQLServer的WindowsNT版本。Sybase则较专注于SQLServer在UNⅨ操作系统上的应用。SQLServer2000是Microsoft公司推出的SQLServer数据库管理系统,该版本继承了SQLServer7.0版本的优点,同时又比它增加了许多更先进的功能。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行MicrosoftWindows98的膝上型电脑到运行MicrosoftWindows2000的大型多处理器的服务器等多种平台使用。MicrosoftSQLServer2005是一个全面的数据库平台,使用集成的商业智能(BI)工具提供了企业级的数据管理。MicrosoftSQLServer2005数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,使您可以构建和管理用于业务的高可用和高性能的数据应用程序2.4.5HTML介绍HTML是一种规范的,标准的超文本标记语言,标准通用标记语言下的一个应用。“超文本”就是指页面内可以包含图片,超链接,音乐、等非文字元素。网页标题的信息是HTML的“头”,网页的内容是“主体”。标记网页中各个部分是通过html文本中的标记符。标记符号来标记网页中的各个部分,网页上显示的是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。浏览器按顺序阅读网页文件,然后根据标记符翻译和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。要注意的,对于不同的浏览器,同一标记符可能会有不完全相同的解释,所以可能会有不同的显示效果。2.5系统开发平台及运行环境2.5.1系统开发平台本系统的开发是在Tomcat环境下进行的。Tomcat是一个Servlet容器,它是免费的开源的,Tomcat是Jakarta项目中的一个核心项目,隶属于Apache基金会的,由Apache,Sun和其它一些公司及个人共同开发而成。最新的Servlet和Jsp规范总能在Tomcat中得到体现,其中有了Sun的参与和支持。在业界的地位体现在Tomcat被JavaWorld杂志的编辑选为年度最具创新的Java产品。Tomcat的环境主要有以下几方面技术优势:1.Tomcat中的应用程序是一个WAR(WebArchive)文件。WAR是Sun提出的一种Web应用程序格式,与JAR类似,也是许多文件的一个压缩包。2.在Tomcat中,应用程序的部署很简单,你只需将你的WAR放到Tomcat的webapp目录下。3.Tomcat具有传统的Web服务器的功能:处理html页面,是一个Servlet容器。4.Tomcat也可以与其它一些软件,比如jsp,java,c++集成起来实现更多的功能。2.5.2运行环境操作系统:Windows2000。服务器软件:Tomcat6.0。浏览器:InternetExplorer6.0及以上版本。

第3章系统总体设计分析本章主要进行系统需求分析,数据库需求分析和运用MYSQL软件为本系统建立必须的表。3.1系统需求分析随着互联网的普及,,技术的迅速发展,信息爆炸的大时代,如何选择出自己感兴趣的部分,自己需要的一部分学习资源?同时既准确又方便。效率和技术结合起来,为不同用户提供相应的方案。本系统基于关联规则的学习资源推荐系统,通过相应算法从各种各样的海量信息中发现自己需要的资源,从而避免了时间精力的浪费,本系统具有较高的推荐精度和推荐效率,更适合图书这个相对来说大数据环境的推荐系统。3.2系统功能模块设计(a)用户注册(b)用户登录(c)用户评论(d)图书收藏(e)后台管理(f)图书管理(g)图书类别管理(h)用户管理3.3系统功能模块图首页前台功能图(如图3-1)主要包括用户入系统首页进行的相应操作。用户登录系统后,进入系统首页有三大功能:用户登录,用户评论,用户收藏图书三大模块。后台管理图(如图3-2)主要介绍系统管理员登录网站后台进行的相应操作。图书管理模块主要的功能是图书添加,图书维护。图书类别管理模块主要的功能是图书类别添加,图书类别维护。用户管理模块主要的功能是用户添加,用户删除。图3-1前台功能图图3-2后台管理图3.4数据库结构分析数据库的结构分析在数据库开发前期的设计中占很重要的位置,一个好的系统,离不开一个层次清晰,功能完善的后台数据库结构。首先在设计数据库时要分离各个实体和表,一个实体对应一个表;同时,要明确各实体间的关联,明确各实体的属性,以便确定它的字段。下面从实际需求的角度来说明本系统的数据库的结构设计。数据库实体是:用户,图书,管理员。数据库属性是:评论,收藏,管理。3.5系统功能分析首先进入系统图书类别分为1.计算机类2.文字艺术类3.人文社科类4.政治地理类5.哲学经济类6.中外名著类以及后台管理模块。用户先浏览图书类别,在每个领域都是系统筛选推荐的阅读量高且评分优的图书。当用户对一本书进行评论一本书特别好的时候,可以对这本书收藏,在首页我的收藏中可以看到全部收藏的书。后台管理这一模块图书管理模块主要的功能是图书添加,图书维护。图书类别管理模块主要的功能是图书类别添加,图书类别维护。用户管理模块主要的功能是用户添加,用户删除。3.6数据库分析3.6.1ER图分析建立各表间的关系,除有利于进行连接查询外,还可以大大简化数据库的操作,从而提高工作效率。通过建立各表间的关系,就可以有效地管理各表的记录。用户与管理员关系如图3.2所示。图3.2用户与管理员之间关系图3.4.2数据字典分析阶段用到的最重要的工具是数据字典。数据字典的用途是供人查询不了解的部分。在系统结构化分析中,数据字典的作用是给数据流图上每个成分加以定义和说明。换一种说法,数据流图上全部成分的定义和解释的文字集合就是数据字典,改进分析员和用户的通信是靠在数据字典中建立一组严密,细致的定义。数据库数据字典不仅是每个数据库的中心,而且对每个用户也是非常重要的信息。用户可以用SQL语句访问数据库数据字典。(1)管理员数据字典(如图3.3)。t-admin别名管理员信息表描述保管管理员信息定义T-admin=adminId+adminName+adminPwd位置Books图3.3管理员数据字典(2)用户信息数据字典(如图3.4)。t-user别名用户信息表描述保管用户信息定义t-user=userName+password+attention+collent位置Books图3.4用户信息表(3)图书类型数据字典(如图3.5)。t-bookstype别名图书类型信息表描述存放图书类型定义t-bookstype=newsTypeId+typeName位置Books图3.5图书类型数据字典(4)用户评论数据字典(如图3.6)t-comment别名用户评论信息表描述存放用户评论信息定义t-comment=booksId+content+userName+commentDate+statet-位置Books图3.6用户评论数据字典3.4.3数据表设计(1)管理员数据表表1管理员数据表字段名数据类型长度主键描述adminIdint11是管理员编号adminNameVarchar20否管理员名称adminPwdVarchar20否密码(2)图书数据表表2图书数据表字段名数据类型长度主键描述Booksidint11是图书编号Titletarchar40否题目Contenttext0否内容PublishDatadatetime0否出版日期Authorvarchar20否作者Typeidint11否图书类型编号Clickint11否用户点击Isheadtinyint4否主题ismagetinyint4否图片Imagenamevarchar40否图片名字Ishottinyint4否热点(3)图书类型表表3图书类型表字段名数据类型长度主键描述newsTypeIdInt11是图书类型编号typeNameVarchar20否图书类型名字(4)用户评论表表4用户评论表字段名数据类型长度主键描述commentIdint11是用户评论编号booksIdint11否图书编号contentvarchar200否评论内容userNamevarchar40否用户名commentDatedatetime0否评论日期statevarchar10否说明(5)用户信息表表5用户信息表字段名数据类型长度主键描述userIdint11是用户编号userNamevarchar20否用户名字passwordvarchar20否密码attentionvarchar255否用户关注collentvarchar255否关注内容第4章详细设计4.1系统流程分析系统实施是系统开发的最后阶段,也是将前一阶段的设计结果最终在计算机系统上实现的阶段,系统主要功能的实现。4.2主要模块的运行4.2.1登陆界面首先会先进入登录界面,在此需要输入相关的登录名和密码。(如图4.1)4.1登录界面在服务器端进行用户身份验证的程序流程图如图4.2程序流程图所示。4.2用户登录流程图4.2.2系统首页系统首页有这几个类别的图书类型:1.计算机类2.文字艺术类3.人文社科类4.政治地理类5.哲学经济类6.中外名著类以及后台管理模块。读者根据自己兴趣点选取浏览哪个类别图书,也可根据系统推荐点击率高的图书。读者对感兴趣的书进行收藏。关于评论优的书在首页我的收藏中可以查看。(如图4.2首页)。图4.2首页4.2.3后台管理输入用户名,密码进入系统后台管理。后台管理模块是管理员图4.3后台管理4.2.4后台管理—添加如图4.4管理员进行图书添加,图书添加主要图书标题的添加,图书作者,图书类型,图书简介几个部分。添加部分分为:图书添加,图书类型添加,用户添加。图4.4图书添加如图4.5图书类型添加。图4.5图书类别添加如图4.6用户添加。图4.6用户添加查看图书添加情况,“好书”添加成功(如图4.5)。图4.7添加完成4.2.4后台管理—修

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论