基于Hadoop的个性化新闻定制推 荐系统_第1页
基于Hadoop的个性化新闻定制推 荐系统_第2页
基于Hadoop的个性化新闻定制推 荐系统_第3页
基于Hadoop的个性化新闻定制推 荐系统_第4页
基于Hadoop的个性化新闻定制推 荐系统_第5页
已阅读5页,还剩37页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录229041绪论 679161.1研究背景 6158181.2研究目的和意义 6301081.3国内外研究现状 610911.3.1国内研究现状 610911.3.2国外研究现状 7249172系统开发工具及相关技术 818432.1系统开发工具 810912.1.1VMwareWorkstation 810912.1.2Pycharm 810912.1.3Xshell 810912.1.4MySQL 856122.2相关技术 910912.2.1Hadoop 910912.2.2Python 910912.2.3ECharts 910912.2.4Hive 910912.2.5Flask 1034243系统需求分析 10310293.1可行性分析 1010913.1.1技术可行性 1010913.1.2操作可行性 1010913.1.3经济可行性 10173373.2功能性需求分析 1010913.2.1数据采集清洗 1010913.2.2数据储存管理 1010913.2.3数据处理分析 1110913.2.4数据集成可视化 1148863.3非功能性需求分析 1110913.3.1界面需求 1110913.3.2性能需求 1110913.3.3兼容性需求 11198203.4系统人员角色分析 12198203.5系统总体流程图 12198203.6系统主要用例图 1310913.6.1客户端主用例图 1410913.6.2管理端主用例图 14198203.7系统总体时序图 1455764系统概要设计 15191324.1系统体系结构设计 15198174.2系统总体模块结构设计 15198174.3系统主要功能模块说明 16198174.4系统数据库设计 2010914.4.1概念结构设计 2010914.4.2逻辑结构设计 20163055系统详细设计 2374545.1系统核心算法说明 23159975.2数据事务性处理说明 22271625.3系统界面设计说明 24110996系统编码实现 2874546.1数据采集清洗 2874546.2数据存储管理 2974546.3数据处理分析 3074546.4数据集成可视化 3174546.5前端页面展示 3274546.6后端业务逻辑编写 33163057系统测试 3374547.1测试目的 3374547.2测试方法 3410917.2.1系统功能部分 3410917.2.2系统非功能部分 3574547.3测试用例说明 357.3.1数据爬取测试用例357.3.2数据清洗测试用例357.3.3数据存储测试用例367.3.4数据分析测试用例367.3.5数据可视化测试用例377.3.6登录测试用例377.3.7注册测试用例387.3.8后台管理测试用例3874547.4测试结论 39163058结论 3919537参考文献 4119546致谢 421绪论研究背景随着互联网的飞速发展和信息的透明化以及信息量激增的现状,信息不断涌现,而且水平参差不齐。大家在面对各种新闻信息,鉴于信息内容的复杂性和冗余性,用户很难在预定时间内找到自己喜好的、有兴趣的内容。然而,传统的新闻推荐方式主要依赖于开发团队的主观判断,无法满足用户多元化的需求。在此背景下,实时新闻推荐可视化系统运用数据挖掘和机器学习等技术,通过获取并分析用户行为,如历史浏览记录、点击率、社交平台活动等多维度数据,建立用户画像和构建算法模型来进行个性化推荐。将互联网与信息技术应用于决策的经营与管理当中,为用户精准推广个性化的新闻信息,让用户可以获得更多更加符合自己兴趣的新闻内容,提高用户的阅读体验。研究目的和意义该项目的主要是研究基于Hadoop的个性化新闻推荐系统。传统的新闻平台无法满足使用者的个性化需求,因为它们向每个使用者提供的东西都是同样的。通过利用Hadoop和相关大数据组件,可以构建一个强大的推荐系统,能够根据用户的兴趣和偏好,为每位用户提供定制化的新闻推荐体验。优秀的系统有助于提高用户的体验感和参与度,促进用户保留与活跃度的提升。这种有个性化新闻推荐系统的重要性在于改善用户体验感和提升平台开发价值。利用推荐算法和用户画像技术,系统能够精准地为了更好的鼓励用户更频繁、更长时间地使用系统,我们既能定期向他们提供符合其兴趣的新闻相关的内容,帮助他们持续保持对平台的参与。同时个性化推荐也能够提高内容的曝光和点击率,为平台带来更多的流量和广告收入。1.3国内外研究现状1.3.1国内研究现状近年来,得益于人工智能、大数据和云计算等技术的深入应用,新闻平台的发展呈现出一个显著趋势,即个性化推荐服务的普及和增强。国内技术专家针对此方向也开展了一系列研究。其中,基于Hadoop的个性化新闻推荐系统引起了研究者们的极大兴趣。利用Hadoop集群技术处理大量用户和新闻数据,采用机器学习技术建立用户画像,为用户提供个性化的新闻推荐服务是该系统的核心实现方式。在这个系统里,主要技术包括协同过滤算法、内容分析算法、情感分析算法等等。国内研究者经过一系列的改进和优化,使得该系统的推荐效果得到了显著提升。例如,将深度学习技术应用于系统中,能够更好地提取用户偏好和文本特征,进一步提高了推荐的准确性和精度。同时,结合社交媒体的数据,也可以更好地掌握用户的社交背景和兴趣爱好,从而更好地为用户提供有意义的新闻推荐服务。此外,研究者还探索了系统的商业化前景,通过搭建广告投放平台,为用户提供更精准的广告服务。同时,该系统被广泛应用于新闻平台和社交媒体等领域,在改善用户体验的同时,也对新闻平台的商业发展产生积极影响。总的来说,基于Hadoop的个性化新闻推荐系统在国内得到了大量的推广研究以及应用。尽管仍然存在一些技术难题和待解决的问题,但从整体上看,该系统已经为新闻平台的发展和用户的服务带来了很大的推动作用。1.3.2国外研究现状科学技术发展作为先进生产力,国外也对基于Hadoop的个性化新闻推荐系统进行了深入研究。国外学者们在协同过滤算法上做出了突破性的发展,提高了个性化推荐的可靠性和效果。利用Hadoop分布式计算框架,他们能够处理大量的用户和新闻数据,并根据用户的偏好和行为模式生成精准的推荐结果。外国大量参与研究人员深入研究了自然语言处理技术在个性化推荐系统中的应用。情感分析算法能够捕捉新闻文章的情感信息,从而更精确地向用户推荐相关内容。此外,国外研究者还注重整合社交媒体数据。通过整合来自Facebook、Twitter等平台的数据,他们更好地了解用户的社交关系、兴趣爱好和讨论话题,从而为用户提供更有针对性和吸引力的新闻推荐。在商业化方面,国外研究者也将个性化新闻推荐系统与广告投放相结合。通过结合用户画像和定向广告技术,他们成功地开发出能够向用户提供高度个性化广告的平台,提高了点击率和收入。总体而言,国外的研究者在基于Hadoop的个性化新闻推荐系统方面取得了显著的进展。通过创新的算法方法和大规模数据处理技术,他们能够提高新闻推荐的准确性、相关性和个性化程度,为全球用户提供更好的新闻阅读体验。2系统开发工具及相关技术2.1系统开发工具2.1.1VMwareWorkstationVMwareWorkstation是一款桌面虚拟机应用软件,可以让用户在单台物理计算机上操作运行多个操作系统,以简化新应用程序的开发、测试及部署过程。该软件的主要特点在于能够在单一桌面环境下同时运行不同的操作系统,使用户能够在一台计算机上模拟完整的网络环境并使用便携虚拟机。另外,VMwareWorkstation还具有丰富的性质和应用效果,例如拖放共享文件夹、支持PXE等,使其成为IT开发人员和系统管理员不可或缺的工具。2.1.2PyCharmPyCharm是Python集成开发环境(IDE),具备独特的语言工具,例如调试项目、单元测试、语法高亮、浏览代码和维护版本。PyCharm不仅是一款多语种的编译机,还实现许多语言的在线编译,例如.py.css.js等。2.1.3XshellXshell是一款功能强大的安全终端模拟软件,支持SSH1、SSH2和具备MicrosoftWindows平台上的TELNET协议能力。通过Xshell,用户可以与主机建立连接,从而能更有效地进行远程控制终端的管理,并提供更优质的使用体验。在Windows界面下,Xshell可以根据用户的需求,以及用户的喜好进行个性化设置。使得用户能够访问远程服务器上不同操作系统,达到更加便捷的远程控制终端的目的。2.1.4MySQLMySQL是一种开源的关系型数据库管理系统。常用的数据库语言是SQL。它的数据被存放在不同的表中,因此MySQL具有高度的数据存储灵活性。2.2相关技术2.2.1HadoopHadoop是Apache基金会研发的开源重点项目,主要用于处理海量数据的分析计算与存储,分布式文件系统HDFS和计算框架MapReduce是它的两大核心组件。2.2.2PythonPython是一种通用计算机编程语言,具备跨平台特性,可作为解释型语言和面向对象编程范式的实现方式,在多个领域有广泛的实际应用,例如Web开发、人工智能、网络爬虫、游戏开发和模型建立等。2.2.3EChartsECharts是一款能够提供折线图、柱状图、散点图等多种图表类型,基于JavaScript的并且能够直观展示数据的数据可视化图表库,旨在为开发者提供灵活且功能强大的数据可视化解决方案。用户结合多种图表进行可视化展示,使数据呈现更加直观。2.2.4HiveHive是建立在Hadoop之上的数仓分析系统,具有数据提取、转换、分析和存储的功能。因为Hadoop它具备强大的存储能力和数据分析处理机制,因此适用于大规模数据处理。2.2.5FlaskFlask是一种备受欢迎的Web后台管理框架,采用了Python编程语言来实现其功能。该框架的核心结构具有良好的扩展性和兼容性。能够结合MVC模式让用户能够更好地进行开发。3系统需求分析3.1可行性分析3.1.1技术可行性该项目所采用的的技术栈:前端采用HTML、CSS、JavaScript;后端采用Flask管理框架、数据库采用MySQL、数据可视化采用ECharts技术、相关的编程语言Python以及相关的大数据组件:Hadoop、Hive。我对以上所采用的技术栈和语言目前已经熟练掌握,即该项目在技术上是可行的。3.1.2操作可行性该项目采用的是B/S架构,只需要有一台能够运行浏览器的计算机即可,这降低了开发的成本和难度,即该项目在操作上是可行的。3.1.3经济可行性该项目的开发只需要一台可运行编程的计算机,用一些常用的软硬件资源完成整个系统项目模块的实现以及搭建部署,不需要额外的购买服务器等资源,除此之外没有其他额外的成本支出,即该项目在经济支出上是可行的。3.2功能性需求分析3.2.1数据采集清洗该项目采用Python语言编写网络爬虫,从多个新闻平台和网站上爬取包含标题、摘要、关键词、分类标签、发布时间等内容的新闻数据信息。进而对获取的新闻数据进行预处理,包括异常值和缺失值数据、规范化数据格式等,以确保数据的品质。数据经过清洗、处理和整合后,在Hive数仓中进行清理异常数据、填充缺失值、处理无效数值和去重等处理,为进一步的分析做好准备。3.2.2数据存储管理根据数据分析结果得知数据为关系型数据。利用Sqoop工具将数据导入Hive数据仓库中,选择MySQL关系型数据库进行存储管理。3.2.3数据处理分析使用机器学习,依据用户的历史浏览记录和兴趣爱好等行为数据,构建用户画像。通过对用户数据进行分析和挖掘,将用户划分为不同的分类或群体,并为每个用户建立个性化的偏好模型。利用Hive查询语句对数据进行分析,然后将分析结果存储到MySQL数据库中。3.2.4数据集成可视化可视化技术采用HTML、CSS、JavaScript,并采用基于JavaScript的Echarts组件库进行多样化的展示。利用Echarts写出图表、热力图、标签云等可视化工具,将数据分析结果以直观的方式展示给用户。3.3非功能性需求分析3.3.1界面需求(1)配色需求:系统主体采用科学适配的主题色,让颜色搭配具有简单高级感;(2)格式统一需求:在不减少数据图表多样性的前提下,尽量让所有数据图表格式统一;(3)搭配需求:让每一张数据表的存在都有理有据,不能单纯为了展示而存在。3.3.2性能需求(1)在系统前端,我们要提高模块内的内聚度,减少模块之间的耦合度,避免导致模块相互影响从而产生无法修复的错误。(2)系统后端:系统会优化每一个函数方法、函数的业务逻辑,使时间复杂度达到最优。3.3.3兼容性需求该系统支持当前流行的各种浏览器,比如IE、Chrome、Firefox、Edge等,同时也能够向下兼容,可以在低版本浏览器中正常运行。3.4系统人员角色分析在系统中,Actors扮演与外部用户或系统交互的角色。这些角色通常分为一般用户和管理员两类。管理员负责执行添加、修改和删除操作,主要负责管理网站用户信息以及日常维护工作。普通用户则通过注册或登录,进入可视化页面来查看网站信息。3.5系统总体流程图系统总体流程图概述了系统各模块部分之间的操作,具体内容如图3-1所示。图3-1系统总体流程图3.6系统主要用例图系统分为客户端子系统、管理端子系统两部分,角色人员包含用户和管理员,系统主用例图如图3-2所示。图3-2系统主用例图3.6.1客户端主用例图客户端子系统包括用户登录、注册、可视化集成系统,用例图如图3-3所示。图3-3客户端主用例图3.6.2管理端主用例图管理端子系统包括用户管理、新闻管理、留言管理、权限管理,管理端主用例图设计如图3-4所示。图3-4管理端主用例图3.7系统总体时序图本系统主要描述用户与可视化系统的信息交互,系统总体时序图如图3-5所示。图3-5系统总体时序图4系统概要设计4.1系统体系结构设计用户行为分析可视化集成系统采用基于浏览器和服务器的B/S架构,通过这种结构,主要的系统业务逻辑集中在服务器端进行实现,只有少量业务逻辑在浏览器端完成。在这个体系中,浏览器的职责主要是与用户进行交互,而服务器通常负责管理数据。系统整体结构包含客户端、服务器端和数据库三个部分,l每层实现的步骤主要包括数据采集、数据清洗、数据分析、数据可视化,具体结构如图4-1所示。图4-1系统体系结构设计图4.2系统总体模块结构设计个性化新闻推荐可视化系统前端与用户进行交互,管理员使用后台系统,负责管理用户信息、新闻数据和留言等内容。主要的功能模块包括用户管理、管理员权限、可视化操作和新闻数据管理。系统总体模块结构设计内容如图4-2所示。图4-2系统功能模块图4.3系统主要功能模块说明系统登录模块主要功能如表4-1所示。表4-1登录模块功能描述模块名称登录模块功能用户登录、管理员登录。功能描述①用户账号、密码等信息验证;②跳转可视化页面。系统注册模块主要功能如表4-2所示。表4-2注册模块功能描述模块名称注册模块功能用户注册。功能描述①用户信息注册验证;②跳转登录页面。 系统用户管理模块主要功能如表4-3所示。表4-3用户管理模块功能描述模块名称用户管理模块功能用户管理。功能描述实现对新闻用户的增删改查操作。系统新闻管理模块主要功能如表4-4所示。表4-4新闻管理模块功能描述模块名称新闻管理模块功能新闻管理。功能描述实现对新闻数据信息的增删改查操作。系统留言管理模块主要功能如表4-5所示。表4-5留言管理模块功能描述模块名称留言管理模块功能留言管理。功能描述实现对用户留言的增删改查操作。系统权限管理模块主要功能如表4-6所示。表4-6权限管理模块功能描述模块名称权限管理模块功能权限管理。功能描述增加管理权限,实现对管理员信息的增删改查。新闻数据可视化模块功能如表4-7所示。表4-7新闻数据可视化模块功能描述模块名称新闻数据可视化模块功能新闻数据可视化。功能描述查看可视化数据信息。词云分类可视化模块功能如表4-8所示。表4-8词云分类可视化模块功能描述模块名称词云分类可视化模块功能词云分类可视化。功能描述查看可视化数据信息。数据新增模块功能如表4-9所示。表4-9数据新增模块功能描述模块名称数据新增模块功能数据新增。功能描述对新闻数据信息进行增添操作。数据删除模块功能如表4-10所示。表4-10数据删除模块功能描述模块名称数据删除模块功能数据删除。功能描述对新闻数据信息进行删除操作。数据修改模块功能如表4-11所示。表4-11数据修改模块功能描述模块名称数据修改模块功能数据修改。功能描述对新闻数据信息进行修改操作。数据查询模块功能如表4-12所示。表4-12数据查询模块功能描述模块名称数据查询模块功能数据查询。功能描述对新闻数据信息进行查询操作。搜索推荐模块功能如表4-13所示。表4-13搜索推荐模块功能描述模块名称搜索推荐模块功能搜索推荐。功能描述用户通过搜索关键词来查找相关新闻,系统会根据用户搜索关键词的行为数据来实现相关推荐。收藏推荐模块功能如表4-14所示。表4-14收藏推荐模块功能描述模块名称收藏推荐模块功能收藏推荐。功能描述用户通过收藏感兴趣的新闻或者热点话题,系统会根据用户收藏的行为数据来实现相关推荐。浏览推荐模块功能如表4-15所示。表4-15浏览推荐模块功能描述模块名称浏览推荐模块功能浏览推荐。功能描述用户在浏览新闻信息时系统会记录用户浏览的新闻类型以及浏览的时长等并根据用户浏览的行为数据来实现相关推荐。评分推荐模块功能如表4-16所示。表4-16评分推荐模块功能描述模块名称评分推荐模块功能评分推荐。功能描述用户通过对感兴趣的新闻或者热点话题新闻进行评分,系统会根据用户评分的行为数据来实现相关推荐。4.4系统数据库设计4.4.1概念结构设计系统总体E-R图如图4-3所示。图4-3系统总体E-R图根据ER图将实体_关系转换为关系模式,得到关系模式如下。用户(用户id,账号,密码,性别,年龄)管理员(管理员id,账号,密码)新闻数据表(新闻id,标题,内容,地址,发布时间,发布者,类型)新闻推荐(用户id,新闻id,标题,类型,收视率)留言(留言id,用户id,新闻id,留言内容)收藏(用户id,新闻id,收藏时间)4.4.2逻辑结构设计账户信息表以账户id为主键,账户类型分为管理员和普通用户,账号和密码作为代表各自登录系统的权限,状态代表当前用户是否已登录,用户信息表如表4-6所示。表4-6用户信息表(user_info)字段名称字段编码字段类型是否为空是否为主键用户idu_idint(11)NY用户名u_usernamevarchar(50)NN账号u_useridvarchar(45)NN密码u_passwordvarchar(45)NN性别u_sexvarchar(2)NN年龄u_ageint(11)NN管理员信息表是单独从账户信息表中分离出来的,里面仅包含管理员数据,以便于管理管理员账户,管理员信息表如表4-7所示。表4-7管理员信息表(admin_info)字段名称字段编码字段类型是否为空是否为主键管理员ida_idint(11)NY账号a_adminidvarchar(45)NN密码a_passwordvarchar(45)NN新闻数据表存储着所有记录的新闻数据,每条新闻记录都有自己唯一标识的id作为该表的主键。新闻数据表如表4-8所示。表4-8新闻数据表(mynew)字段名称字段编码字段类型是否为空是否为主键新闻idm_idint(11)NY标题m_titlevarchar(100)NN内容m_contenttextNN地址m_new_urlvarchar(100)NN发布时间m_publish_timevarchar(32)NN发布者m_publishervarchar(32)NN类型m_categoryvarchar(10)NN新闻推荐表记录着用户访问新闻的收视率、热点话题、用户兴趣相关推荐等,唯一的新闻id和用户id作为该表的主键。新闻推荐表如表4-9所示。表4-9新闻推荐表(rec)字段名称字段编码字段类型是否为空是否为主键新闻idr_idint(11)NY用户idu_idint(11)NY标题r_titlevarchar(100)NN内容r_contenttextNN发布时间r_publish_timevarchar(32)NN发布者r_contentvarchar(32)NN类型r_contentvarchar(10)NN收视率r_contentvarchar(100)NN留言表记录着用户访问新闻信息后发表的评论、感想等,每条留言都有唯一的id,用户id,新闻id作为该表的主键。留言表如表4-10所示。表4-10用户留言表(message)字段名称字段编码字段类型是否为空是否为主键留言idm_idint(11)NY用户idm_useridint(11)NY新闻idm_newidint(11)NY留言内容m_contenttextNN收藏表记录着用户访问新闻数据后喜欢或者感兴趣的内容或话题,是体现新闻推荐的最直观的表现形式。用户收藏表如表4-11所示。表4-11用户收藏表(part2)字段名称字段编码字段类型是否为空是否为主键用户idp_useridint(11)NY新闻idp_newidint(11)NY收藏时间p_timedateNN5系统详细设计5.1系统核心算法说明该系统采用基于用户的协同过滤算法,以用户群体行为数据为基础的推荐系统,通过获取用户的历史行为,如点击、收藏、浏览、购买、评分、评论等,寻找与目标用户兴趣相似的其他用户,进而预测目标用户的兴趣爱好。主要过程有以下三个步骤:(1)收集用户喜好:收集用户对新闻浏览率、点击率以及评论评分等行为数据来预测用户的兴趣话题和偏好;(2)用户之间相似度比对:采用相似度矩阵公式来计算不同新闻用户之间的相似度,选出与目标用户U最为相似的K个用户,并向其推荐10篇新闻。计算相似度的公式如(1);(1)(3)进行推荐:将K个用户所浏览的相关新闻内容推荐给用户U,产生推荐并通过准确率、召回率和覆盖率进行评估。5.2数据事务性处理说明本系统中对数据的操作包括数据的增删改查四个方面,其中对数据得到的增添和删除如图5-1至5-2所示。图5-1数据添加操作删除数据信息方法流程图如图5-2所示。图5-2数据删除操作5.3系统界面设计说明数据可视化模块将数据库数据转换为用户容易观察的形式,便于用户发现数据信息,系统登录注册界面针对主题颜色、字体样式、交互按钮等进行简约大方、方便的设计。登录注册界面设计如图5-3至5-5所示。图5-3用户登录页面图5-4用户注册页面图5-5管理员登录页面新闻数据推荐根据用户的行为数据来实现,推荐模块如图5-6所示。图5-6推荐模块页面爬虫爬取话题数据信息可视化模块设计如图5-7所示。图5-7系统可视化页面后台用户管理模块设计如图5-8所示。图5-8后台用户管理后台数据管理模块设计如图5-8所示。图5-8后台数据管理6系统编码实现6.1数据采集清洗使用Python第三方库requests来获取数据,利用Json解析数据格式,在Hive中,对数据进行清洗、转换和整合。数据爬取具体编码实现如图6-1至6-3所示。图6-1获取数据图6-2获取数据图6-3获取数据6.2数据存储管理数据存储到MySQL数据库,具体代码实现如图6-4所示。图6-4数据存储实现数据采集部分数据如图6-5所示。图6-5数据采集明细6.3数据处理分析将数据导入MySQL中,Hive对数据进行分析和处理。代码如图6-6所示。图6-6数据处理分析实现新闻推荐是通过基于用户的协同过滤算法来实现,部分代码实现如图6-7至6-8所示。图6-7推荐算法实现图6-8推荐算法实现6.4数据集成可视化后端获取数据信息传给前端页面,数据集成可视化ECharts部分代码如图6-9至6-10所示。图6-9ECharts实现数据集成可视化图6-10ECharts实现数据集成可视化6.5前端页面展示登录注册页面风格简单,登录页面若输入数据库不存在的用户名则会提示“账号或密码错误”,注册新用户需要填写账号、密码、昵称、性别和年龄等基本信息,登录注册实现核心代码如图6-11所示。图6-11登录注册实现6.6后端业务逻辑编写后端管理模块主要使用Flask来实现,Flask实现后台管理前端部分代码如图6-12所示。图6-12Flask实现后台管理数据接口部分代码实现如图6-13所示。图6-13数据接口实现7系统测试7.1测试目的系统测试的目的是评估软件系统是否满足《用户需求和规格说明书》的要求,发现系统中隐藏的缺陷与错误。当系统的每个模块基本功能都是完好的,程序运行不出现bug,这样可以确保在长期的使用过程中的可靠性。7.2测试方法系统测试实际上是针对系统中各个组成部分进行的综合性检验,本系统采用的是黑盒测试,黑盒测试主要是在不影响程序内在构造状况下,对程式接口执行检测,它只检查程序功能是否是依照要求标准规格介绍书的规范正常。系统主要从系统非功能、系统功能两部分进行测试。7.2.1系统功能部分(1)用户登录和注册功能是否顺畅可用。(2)数据信息是否能够准确显示在可视化界面上。(3)后台管理功能包括数据的添加、删除、修改与查询是否正常运作。(4)链接跳转是否正常。7.2.2系统非功能部分(1)系统的整体配色是否协调一致;(2)界面导航设计是否简单合理,操作方便,符合用户需求;(3)对可能给用户带来损失的操作是否做可逆性处理;(4)数据集成可视化布局是否合理;7.3测试用例说明7.3.1数据采集测试用例数据采集测试用例如表7-1所示。表7-1网络爬虫测试用例测试用例网络爬虫测试流程(1)使用Python来进行数据获取,通过运行爬虫程序。检测过程控制平台,以确保IP池的运行状态;(2)运行爬虫程序后,查看数据是否爬取成功。预期结果运行爬虫无异常,控制台显示所需爬取的数据信息。实际结果运行爬虫无异常,控制台显示所需爬取的数据信息。测试是否通过通过。7.3.2数据清洗测试用例数据清洗测试用例如表7-2所示。表7-2数据清洗测试用例测试用例数据清洗测试流程(1)在使用Python数据获取的同时对数据进行异常值、缺失值、无效值、重复值等处理;(2)启动爬虫程序后,查看控制台获取到的数据信息是否还包含缺失值、重复值等。预期结果获取到的数据信息不存在缺失值和重复值,数据清洗和预处理完成。实际结果获取到的数据信息不存在缺失值和重复值,数据清洗和预处理完成。测试是否通过通过。7.3.3数据存储测试用例数据存储测试用例如表7-3所示。表7-3数据存储测试用例测试用例数据存储测试流程(1)使用Pycharm工具运行爬虫程序;(2)查看数据库对应的表是否有数据产生,数据存储过程是否存在异常。预期结果运行程序无异常,数据库对应表中有相应数据产生。实际结果运行程序无异常,数据库对应表中有相应数据产生。测试是否通过通过。7.3.4数据分析测试用例数据分析测试用例如表7-4所示。表7-4数据分析测试用例测试用例数据存储测试流程(1)使用Pycharm工具运行程序代码;(2)观察控制台运行是否异常,结果数据是否成功写入到csv文件中;(3)查看csv文件数据。预期结果结果数据成功写入csv文件。实际结果结果数据成功写入csv文件。测试是否通过通过。7.3.5数据可视化测试用例数据可视化测试用例如表7-5所示。表7-5数据可视化测试用例测试用例数据可视化测试流程(1)运动后端代码;(2)访问前端可视化页面;(3)观察可视化页面与网页是否适配、页面展示是否正确。预期结果可视化页面与网页适配,数据能正确显示。实际结果可视化页面与网页适配,数据能正确显示。测试是否通过通过。7.3.6登录测试用例登录测试用例如表7-6所示。表7-6登录测试用例测试用例登录测试流程(1)进入系统登录页面;(2)输入账号、密码;(3)点击登入。预期结果页面正常响应,登录成功、进入可视化界面。实际结果页面正常响应,登录成功、进入可视化界面。测试是否通过通过。7.3.7注册测试用例注册测试用例如表7-7所示。表7-7注册测试用例测试用例注册测试流程(1)进入系统注册页面;(2)输入账号、昵称、性别、年龄、密码;(3)点击注册。预期结果页面正常响应,注册成功返回登录页面。实际结果页面正常响应,注册成功返回登录页面。测试是否通过通过。7.3.8后台管理测试用例后台管理测试用例如表7-8所示。表7-8后台管理测试用例测试用例后台管理测试流程进入后台系统管理页面;(2)添加信息后提交添加请求;(3)修改信息后提交修改请求;(4)提交删除请求进行信息删除。预期结果提交添加、修改、删除请求信息得到及时响应,添加、修改、删除信息成功。实际结果提交添加、修改、删除请求信息得到及时响应,添加、修改、删除信息成功。测试是否通过通过。7.4测试结论本系统总共设计了8个测试用例,测试用例全部通过测试。通过系统测试可以得出以下结论:该系统各主要功能模块运行指标正常,性能表现和安全性能都得到了很好的保障,满足需求分析的要求和预期目标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论