




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、电商平台下用户画像的设计与实现 专 业: 计算机科学与技术姓 名: 史维君指 导 教 师:申请学位级别: 学 士论文提交日期: 年月日学位授予单位: 天津科技大学摘 要大数据是数量非常巨大的复杂的半结构化或者非结构化的数据集。随着时代的发展,越来越多的数据产生,用传统的数据库管理方式,无论是从数据的储存,获取,或者查找等方面都已经无法满足要求了。随着大数据的来临,人们有了解决大量数据的处理,储存等能力后,人们为了将数据细化,将数据分行业,类型的分了好多种类。在这里我们所研究的是其中的一个种类:用户画像。用户画像核心价值在于了解用户,猜测用户对产品的需求或者潜在需求,精细化的定位人群特征,挖掘潜
2、在的用户群体,为媒体网站、广告主、企业及广告公司充分认知群体用户的差异化特征,根据族群的差异化特征,帮助客户找到营销机会、运营方向,全面提高客户的核心影响力。在电商行业中。用户画像可以分析客户的使用习惯、喜好、一系列的购买行为,以及周边的人群的身份、属性、年龄等,它对我们的商务行为、对营销的判断会有一定的借鉴。本文通过使用技术,结合,和等编程语言,设计并完成了一个具有简单的电商平台下的用户画像。本设计依赖框架设计出了简洁漂亮的前端界面,使用 进行数据分析与产生研究结果。本系统主要包括,系统管理:分别从用户管理,角色管理,菜单管理等方面对整个系统进行权限管理。用户行为:分别从跳出率,忠诚度,活跃
3、度判断用户在某一天或者某一段时间的整体状况。访客分析:分别从地域分布,速度分布,客户端环境等对某个地区的整体环境和地区消费情况进行产品销售。关键词:用户画像; ; . , , , , , . , , , , , . : . , , , , , , , , , . . , , , , , , , . , , , , . , , , . : , , . : , , , . : , , , . : ; 目 录 第一章 引言 第一节用户画像的背景及意义 第二节系统所用的开发技术及工具简介 第三节系统环境搭建 第四节论文整体设计结构 第二章 系统需求分析与概要设计 第一节用户画像的需求分析 第二节可行性
4、分析 第三节系统总体结构设计 第四节系统功能模块设计 第三章 系统的详细设计与实现 第一节数据仓库建模 第二节系统部分功能模块流程图设计 第三节部分功能模块的实现说明 第四节系统结构和页面详细设计 第四章 系统测试 第一节软件测试的目的 第二节测试的方法及步骤 第三节系统部分功能测试和结果 第五章 论文总结和今后展望 第一节总结 第二节展望 参考文献 致 谢 引言 随着互联网时代的来临,人们越来越重视对数据的利用与处理,在海量数据中提取有效信息,进行数据分析与挖掘发现商业价值。用户是时代发展的最重要的因素,利用大数据来分析用户的行为与消费习惯,可以预测商品的发展的趋势,提高产品质量,同时提高用
5、户满意度。本文基于大数据与技术进行电商用户画像的开发与设计,论文将从国内外研究,需求分析,系统概要设计,系统详细设计,系统的实现等方面进行整个项目的描述。 用户画像的背景及意义 随着大数据兴起与不断发展,数据量越来越来,人们想着从这些数据中挖掘出自己想要的信息。所以有了各种各样的数据挖掘方式或者种类并将其抽象到各个行业。再次我们讨论的是其中的一个种类,用户画像。 在“用户中心论”理论支持下,很多行业意识到用户的重要性,在整个社会发展的过程中用户是主导因素。所以有很多行业从原来以产品和服务为中心的思维方式转换到以用户为主导,开始研究用户的需求,反馈和用户满意度等信息。互联网行业也是如此,互联网企
6、业开始加深对用户的了解。为了使生产或销售的产品能够吸引更多的新用户,同时留住老用户,提高企业的利润,基于用户的研究越来越重要了。 在很多传统行业中,商家为了提高用户量,经常会分析用户的生命周期和价值,用户的忠诚度,地域等信息来进行商业决策。比如电商行业,商家会对用户的年龄分布,地区,性别,星座,消费能力,家庭收入的方面对用户进行分析,判断用户将来会给商家带来的利润,来进行商业决策。再者分析用户的整体消费情况可以了解用户的消费偏好,进行商品的推送服务,例如:短信推送,邮件推送等。这样就形成了比较成熟的用户行为与消费习惯分析体系,为商家如何长远的获得利益与吸引新用户打下坚实的基础。 随着互联网行业
7、的不断发展,人们对网上消费人群的分析越来越重要。例如很多大型互联网企业都推出了自己的分析体系,例如:百度,谷歌,阿里和京东等。京东将在电子商务全过程中的所有用户的数据都添加到用户画像的建模当中,而且对用户进行全方位的精确定位,描绘用户的特征。目前京东的用户画像中运用大约三百多个标签来描述客户,涵盖了用户的基本属性,购买能力,偏好等各个方面,利用分析的结果来推荐产品,广告等,同时也更加智能的设置搜索提示功能,更好的服务于用户,来提高用户的满意度。 系统所用的开发技术及工具简介一、 开发技术简介 与简介是一种与相似的面向对象编程语言,但它比功能更强大、学起来更为简单,而且它具有简单、安全、高性能、
8、面向对象、高可移植性以及跨平台性等优点,因而受到了广大编程人员的追捧。同时由于其具有其强大的平台无关性,所以用开发的应用程序可以在各个系统平台上运行,这使得成为目前应用范围最广的编程语言。是一套用于开发企业级应用程序的规范标准,功能十分强大,目前有许多网站的服务端代码都由它完成编写,使用可以开发出类似电子商务网站和企业资源评估系统这一类伸缩性与灵活性强,且容易维护的分布式企业级网络应用程序。的结构如图所示。图 * 的结构图分布式框架 本质上来说是一个开源的分布式框架。在的三大论文发表之后,有基金会负责开发的大数据的开发工具。的核心内容是和算法。有以下三个特点:.可靠性,因为在数据处理是会维护多
9、个数据副本,使得即使在某一节点上计算失败还能重新继续分布处理,而不对数据造成不可恢复性错误。.高扩展性,在集群处理上,可以特别方便的扩展节点数量。.低成本,因为是开源的,所以可以降低好多软件开发成本。数据仓库是一款基于的数据仓库基础架构,他可以方便的将一个结构化的数据文件映射成数据库里面的一张表,还提供查询,学习成本低等优点。还可以将查询语句转为算法运行,特别适合大型数据的开发与分析。目前想,淘宝等大型公司都是用进行数据仓库建模和数据分析。简介是一个轻量级的前端开发框架,是一套的前端开发库,提供了很多常用的各种和合集,内置了非常多的漂亮样式,简洁灵活,而且是可扩展的,我们可以根据自己需求在他原
10、始的基础上加以扩展来达到我们个性化功能的开发,除此之外还对一下常用的方法进行了分装可以很简单的时候项目开发过程中前后要的交互。二、 开发工具与环境介绍操作系统全成 ,又被很多人成为“社区企业操作系统”,是的发行版之一。是企业版产品的克隆版,但是是不收费的,具有以下四个特点:环境比较稳定有稳定的开发团队提供长久的免费的更新支持具有保守性. 性能比较好,就算是大规模的系统也能保持良好的性能工具是一款开源的开发工具,系列里面有很多版本,比如说支持等开发的专门的版本。而且可扩展能力比较强,可以给里面做各种插件,比如说我们熟知的插件,在这具有很好的提示和查找功能,给我们的开发带来了很多的便利之处。当前也
11、有收费的不开源,但是提供了很多插件的开发工具。 系统环境搭建基础环境搭建本系统的开发运行环境都是基于虚拟机安装的系统,安装和配置环境变量 解压首先在目录下创建一个文件夹,然后将执行 语句将安装到目录下 将添加到环境变量中执行 命令打开配置文件在文件最后加入以下两句话配置环境 $:$然后执行 刷新环境配置集群搭建配置,搭建伪分布式,需要修改一下五个配置文件内容:第一个:,配置路径,开发依赖于 第二个: 配置中的地址 第三个:配置数据存储是,备份副本的数量 第四个: 指定运行在上 第五个:,配置的管理者的地址 将添加到环境变量 $:$:$:$ 格式化(是对进行初始化) ( ).配置免登陆首先生成免
12、登陆密钥然后到我的目录 (四个回车)执行完这个命令后,会生成两个文件(私钥)、(公钥)将公钥拷贝到要免登陆的机器上 安装与配置安装完成后修改一下配置文件:修改 告诉使用外部的 , 安装与配置.安装和配置查询以前安装的相关包 暴力删除这个包 执行命令设置执行一下语句,将添加到环境变量当中 .* ;. 利用将当中的数据直接导入到当中 论文整体设计结构一、 系统设计思想本项目通过技术,设计并实现一个简单的用户画像的界面系统,系统通过后台数据操作得出的结果,将其以界面形式反映到前台,决策者可以根据系统提供的图表等信息对整个平台下客户的忠诚度,所属区域,访客的跳出率等几个方面对客户进行初次的总结归纳,最
13、后知道企业的整体营销措施。二、 论文结构安排第一章主要介绍了本设计的选题背景、选题意义、然后再介绍开发所使用的语言与软件工具,再者介绍个整个系统的环境搭建,最后介绍本论文的整体结构安排。第二章主要介绍了系统整体的需求分析,然后根据需求写出初步的概要设计。首先对系统进行简单的需求分析、可行性研究分析,然后接着介绍本网站总体结构、功能模块设计,最后对界面进行简单描述。第三章主要介绍介绍了用户画像的详细实现过程,在需求分析和概要设计之上更加详细的设计和实现部分系统功能,其次进行功能模块流程图设计,并对一些关键的地方进行代码的说明,最后对整个系统的界面做一下简单的说明与介绍。第四章主要介绍了系统测试的
14、方法与步骤。首先简单介绍了系统测试的目的、意义及步骤,然后根据系统测试要求对本系统进行某些模块的测试。第五章是总结与展望。对本系统开发与设计过程中遇到的问题和难点,还有自己所收获到的东西进行总结,并对自己以后的职业生涯和努力方向加以重定向、或者进行阶段性的计划。 系统需求分析与概要设计在这一章里面我们对用户画像这整个系统进行进行需求分析,可行性研究,还有系统的总体结构介绍和和分模块介绍,最后对部分页面进行简单的介绍。 用户画像的需求分析本系统大的范围划分总共分为两块:. 后台数据处理与分析采用进行数据分析与数据仓库的建模,系统分析元数据来源于数据库. 前台显示运用了技术,对后台分析数据进行前台
15、展示。本系统利用这样的总体结构对整个用户画像进行开发与设计,使之能够初步实现对电商客户的初步分析以及对领导者决策进行帮助。首先我们从系统的后台数据处理进行分析,我们利用进行数据分析,将整个平台的与客户相关的数据分为了以下的七张表进行数据分析与数据结构化存储:客户消费订单表根据客户的消费情况提取用户标签用于了解用户的消费总体情况,以根据用户的消费习惯和消费能力来进行营销行为。数据来源于数据库中的:订单表,退货表,购物车表,用户表。 客户购买类目表根据客户购买类目的情况来提取用户标签用于了解购买人群情况和某一类目的营销策略数据来源于数据库中的:订单表,类目维表,购物车表。客户购买商店表根据客户购买
16、商店来提取用户标签用于了解商店及品牌的购买人群情况常用来用作某一商店或者某一品牌的营销数据来源于数据库中的:订单表,退货表,购物车表,商店表。客户基本属性表根据用户所填写的属性标签与推算出来的属性用于了解用户的人口属性的基本属性和按属性统计按人口属性进行营销,例如金牛座的优惠和生日优惠数据来源于数据库中的:用户表,用户调查表,孕归模型表,马甲模型表,用户价值模型表。客户营销信息表将用户营销相关的常用标签放到一张表中,方便使用数据来源于数据库中的:用户表,订单表,用户价值模型表,购物车表,客户品类分群模型表,活动表。客户活动信息表根据客户参与的活动的情况提取的客户标签用户了解用户的对活动的参与情
17、况,以进行活动的策划或者根据对活动不同敏感度的人群做营销数据来源于数据库中的:订单表,活动表,活动订单表,用户表。客户访问信息表根据客户访问的情况提取的客户标签用户了解用户的访问总体情况,以根据用户浏览的习惯做营销数据来源于数据库中的:端表,端表,端表,端表。然后进行前台显示界面功能的分析,在前端我们要用图表加数据的模式展示给用户或者决策者,主要以一下几个方面进行展示:系统管理模块在这个模块里面我们就主要对用户画像前端系统的一个管理和配置,主要包括,菜单管理,系统用户管理,和角色管理,当然在这个里面也对整个系统的权限进行管理。用户行为分析在这个模块里面我们就针对用户的一些行为进行分析,然后得到
18、具体的数据,主要从用户的跳出率,忠诚度,活跃度等几个方面对用户进行分析。客户分析在这个模块里面我们就根据访客所在的地域信息,访客使用的终端环境,还有访客访问速度等几个方面进行分析。 可行性分析每个软件的开发过程中都会受到各种条件限制,比如说资源,时间,技术,资金等制约因素。所以在每个软件开发之间我们都要对这个软件各个方面进行调查出一份比较权威的可行性分析研究报告,看这个软件开发各个方面条件是否满足,对于商业软件来说主要还是这个软件的开发是否盈利,是否成本大于盈利等等各个方面进行权衡。在软件开发之前进行可行性的研究可以避免软件开发风险,避免人力,资源等方面的浪费。下面我们就这几个方面进行简要的可
19、行性分析。技术可行性本系统在后台服务方面利用了和 因为现在是大数据时代,我为了提高自身能力所以自学了大数据方面知识,其中就包括 ,而且对于操作系统我们在大学课程里面学了操作这门可能讲的操作系统所以在后台服务方面技术上是可行的。本系统的前台展示页面使用的技术,在大学课程里面我们既学习了也学习了并且本人从事开发行业也一年多了所以在这方面还是比较有经验的所以技术上也是可行的。对于前端显示框架和图表插件而言,他们两都是轻量级的,并且在官网上都有所对应的案例,所以学习起来也比较容易,再者在前面公司做项目是也用到了这两个框架,所以整理而言在技术方面也是可行的。再者图,我们在大学阶段开设过软件工程这门课学的
20、就是图的制作和整个软件开发流程,在上课时我们也学会了利用等工具画图,所以在技术上也是可行的。综上所述,我们可得出结论本系统的开发在技术上是可行的。经济可行性本系统开发使用的,环境还有开发语言都是开源的,所以在整个开发成本上节约了很多资源。法律可行性由于本系统开发过程中使用的开发语言,开发环境这些都是采用开源项目,所以不涉及版权问题,而且本系统不会用于商业用途,当然也不会泄露企业内部信息,所以软件整体而言在法律上是可行的。操作可行性本系统后台数据不需要用户进行操作,用户或者决策者所能接触到的只是前台的数据分析成果展示,所以在操作上没有什么难度,主要是需要用户操作的地方和专业名词都有相应的备注。用
21、户只需要有一台电脑,能够联网就可以对系统进行操作,所以系统整体而言操作简单符合操作可行性。 系统总体结构设计本系统是由和开发,其中数据分析采用,在数据分析时需要计算出用户的各种行为等,比如说用户的跳出率的计算,用户忠诚度的分析方法,还有用户对商品打折促销等电商进行的促销活动的敏感度,用户价值的潜力等各个方面的计算与分析,在系统前端用做的前台展示效果,侧重于整个系统权限的管理还有对用户行为,地域等信息进行分析。本系统达到的效果是使电商更加了解客户,理解客户的真正需求,然后分种类,分地域,分人群进行产品的推销,已达到客户满意度最高,也可以使电商获得最大利润。系统的整体框架图如图所示。图 用户画像整
22、体框架图本系统分为后台数据分析和前台分析结果展示,后台数据分析主要是为了数据挖掘工程师用来研究和统计,建模用的,前台是展示给一般系统用户看的,这个主要是提供给企业内部,领导者,或者公司内部做营销等专家作分析,并在分析的基础上领导企业的发展方向和以后生产产品定向。系统后台全是数据的分析和算法,基本上是供程序员使用的,后台通过简历的七张表对整个企业客户的消费行为,购买能力等方面进行分析,统计生成数据。而统计数据来源于企业以前系统用来储存数据的数据库中的表。整个后台的整个功能就是数据仓库建模,根据一定的算法模型计算出客户消费订单表,客户购买类目表,客户购买商店表,客户基本属性表,客户营销信息表,客户
23、活动表,客户访问信息表七张表。这七张表分别从不同的方向统计了用户在购买能力,区域分布,忠诚度,敏感指数等方面的值,对用户潜在价值进行挖掘与分析。同时后台还进行很多算法模型的设置和分析例如:潜在汽车消费模型现在大多数电商网站都具有汽车频道,对用户的汽车模型也很关心,如表所示。表 汽车消费模型表用户是否有车:未识别:是根据用户是否购买汽车相关的产品来判断用户是否有车潜在汽车用户:未识别:是用户浏览或者搜索汽车相关的产品进行判断用户价值模型体现用户对网站的价值,对于提高用户留存率非常重要使用实现用户价值模型参考指标最近一次消费时间或者最后一次消费至今时间消费频率消费金额用户忠诚度模型忠诚度越高的用户
24、越多,对网站的发展有利,如表所示表 用户忠诚度模型表用户忠诚度忠诚型用户偶尔型用户投资型用户浏览型用户未识别浏览型用户:只浏览没购买购买天数大于一定天数的直接判断为忠诚用户购买天数小于一定天数的大部分有优惠才购买的其他类型根据购买天数,购买最后一次距今时间,购买金额进行聚类客户活跃状态模型注册未购买(只注册没购买,多是第三方登录)活跃(可以分为高频,中频,低频,或者直接最近六十天有购买者)沉睡(近九十天购买了,近六十天没有购买)流失(近九十天无购买,曾经购买过)疑似马甲模型马甲是指一个用户注册多个账号多次访问地址想的用户账号是同一个人所有同一台手机登录多次的用户账号是一个人所有收货手机号相同的
25、账号是同一个所有以上几个模型是其中比较典型的几个分析模型,我们的整个数据分析都是在这些模型的基础上生成的和操作的。本系统前台主要功能有菜单管理,用户管理,角色管理,跳出率,忠诚度,活跃度,访客流失度,地域分析,速度分析,客户端分析等,如表所示。表 系统功能表用户管理实现对新添用户,给用户赋予角色,和编辑用户基本信息,删除用户等功能。菜单管理对系统的左侧菜单进行管理,实现增删改查等功能。角色管理一个系统可以具有多个角色,而每个角色又具有不同的权限,在这个模块里面实现了对角色的增删改查的功能,除此之外,还有给角色赋予权限和修改权限等功能。跳出率利用折线图对客户跳出率进行展现,同时在图表下面配有查询
26、的数据集做图表作为支持。忠诚度利用饼状图对用户忠诚度进行展现,同时在图表下面配有查询的数据集做图表作为支持。活跃度利用折现图对用户活跃度进行展现,同时在图表下面配有查询的数据集做图表作为支持。在这个模块里面还统计了用户流失率的统计,同时也有相应的数据作为对图表的支持。地域分析利用饼状图对用户所在地域等信息进行展现,同时在图表下面配有查询的数据集做图表作为支持。速度分析利用地图对每个地方用户的访问速度进行分析,同时在地图下面配有查询的数据集做图表作为支持。客户端分析利用饼状图对用户访问所使用的浏览器和操作系统进行分析。同时在图表下面配有查询的数据集做图表作为支持。 系统功能模块设计系统用例图分析
27、用例图是在整个软件或系统开发的分析阶段,常用来描述整个网站的或系统的整体功能,是软件开发中的一种可视化的建模语言。用例图由三部分组成,分别是参与者,用例,以及参与者与用例之间关系的线或箭头。参与者,是指系统以外的操作系统或者与系统发生交互的人。用例,是指整个系统的功能模块。在画用例图时一般小人表示参与者,椭圆形图标表示用例。用例图只是展示整个系统功能模块和操作人的关系,并不是介绍代码。本系统利用用例图展示系统前台的功能模块和操作者的关系。超级管理员可以操作:菜单管理,用户管理,角色管理,用户行为分析,用户访客分析等整个功能,而普通用户或者一般决策者只能使用用户行为分析,用户访客行为等非系统管理
28、功能模块。本系统的总体用例图 如下图:图 系统总体用例图系统功能模块分析 根据前面的对本系统的需求分析,我们可将整个系统分为三块,系统管理,用户行为,访客分析。以下对每个模块进行介绍:系统管理系统管理,管理的是整个系统的配置信息,比如说权限管理,系统菜单管理,用户管理等等。() 用户管理:由于本系统是公司或企业内部系统,所以不存在注册等信息,本系统的用户管理包括:新用户的添加(只有超级管理员才有权限),用户角色的分配,还有用户基本信息的修改,例如修改密码等等功能。() 用户登陆:系统里面已经存在的用户,可以根据自己的账号和密码,同时输入系统自动生成的验证码,当这些信息都对的时候才能登录系统。进
29、入系统后系统会根据用户的不同角色显示不同的菜单和数据,同时支持登录用户修改自己密码的功能。() 角色管理:此功能只有超级管理员才能用,在这块里面用户可以建立不同的角色,比如说超级管理员,一般用户等等信息,除此之外还可以对角色信息分条件查看,删除,修改等功能,在这个里面最重要的就是给不同的角色授予不同的权限。 () 菜单管理:这个模块只有在建系统或者系统功能变更或者系统新添加或去除功能的时候才会用到,因为这个涉及到写代码,建立后台处理了。当然我们在本系统中对此功能也是进行了添加修改,删除,查看等功能。用户行为模块用户行为模块主要包括对用户的行为分析,包括用的使用网站的跳出率,用户忠诚度,用户的活
30、跃度等信息。注: 跳出率:跳出者是指访问量只有一页(即( )是)访问者。此类访问者所占的比例越高,说明网站的对他们没有太高的吸引力。跳出率是指单页访问次数(即访问者从进入页面离开网站的访问次数)所占的百分比。跳出率是衡量访问质量的指标,跳出率较高通常表示网站进入页(目标网页)与访问者相关性不强。我们可以针对每个关键字和我们投放的广告来调整目标网页,从而最大程度地降低跳出率。目标网页应提供广告中承诺的信息和服务。 忠诚度:回访次数,距离上次访问超过小时的再次访问,被记录为一次回头。 该功能有助于站长了解站点粘性和用户忠诚度。忠诚的访问者通常对我们的品牌有较高的兴趣,大量的重复访问表示客户为优质客
31、户并且网站有较好的访问者保持力。新访问者量大表示对访问者有强烈的吸引力。() 跳出率:根据后台数据统计的数据建立用户的跳出率菜单,该功能在界面上显示功能主要包括,根据时间查询一个时间段内的访客量和跳出访客量,然后做成折线图进行展示,并提供相应的数据支持。() 忠诚度:根据后台数据统计的数据建立用户的忠诚度菜单,该功能在界面上显示功能主要包括,根据时间查询一个时间段内的访问次数和比例,然后制成饼状图进行显示,并提供相应的数据支持。() 活跃度:根据后台数据统计的数据建立用户的活跃度菜单,该功能在界面上显示功能主要包括,根据时间查询一个时间段内的活跃访客量,当然在这个模块里面我们也添加了查看流失访
32、客的数量,然后做成折线图进行展示,并提供相应的数据支持。访客分析该模块里面主要是针对客户地理位置,访客浏览速度,和访客所使用客户端类型等几个方面从客观角度,对客户进行分析。()地域分布:根据后台数据统计的数据建立用户的地域分布菜单,可以使决策者直观的看出我们现在的客户主要来自哪里,等地域分布情况。根据用户自己设定的时间查询不用地区客户的访问量和占总访问量的百分比等信息,将统计结果利用饼状图显示,并提供的相应的数据支持。() 速度分布:根据后台数据统计的数据建立用户的速度分布菜单,查询每个地方的访客访问速度等信息,最终在前台用一张地图作为图表,显示不同地区访问速度等数据,直观大方同时提供相应的数
33、据支持。() 客户端分析:根据后台数据统计的数据建立用户的客户端分析菜单,查询并统计用于使用的不同客户端信息,如浏览器版本,不同浏览器,操作系统等,然后将统计数据制作成饼状图进行显示,提供相应的数据支持。() 移动端分析:根据后台数据统计的数据建立用户的移动端分析菜单,查询并统计用于使用的不同移动端信息,如移动版版本,手机型号等,然后将统计数据制作成饼状图进行显示,提供相应的数据支持。 系统的详细设计与实现本章主要介绍了详细实现过程,在上一章需求分析与概要设计的基础之上首先进行数据仓库建模,其次进行功能模块流程图设计,再次对功能模块的实现过程与代码进行详细说明,最后对本网站的大体结构进行简单介
34、绍。 数据仓库建模数据仓库概述数据仓库从本质上来讲是一种工具或者整个企业内数据集成环境。它是操作系统过渡到决策者为了决策而用的支持系统。在这个过程中它还解决了好多数据流相关的问题。这些问题主要包括以下几类:如何从原来的操作系统中提取数据。如何把不同数据统一化,并且能够提高性能等。二、 数据仓库表的概念结构设计不管是数据库建库还是利用数据仓库建模,建表,其实其最重要和最本质的东西或者原型就是实体。一个实体应包含名称和属性等各个属性。一个实体一般有其所特定的概念模型。概念模型的表示方法有很多,目前最常用的是实体联系()模型设计方法,实体联系模型一般使用图来表示,它使用不同形状来分别表示实体、属性、
35、和联系,其中实体用方框表示,代表用户体中客观存在的事务;属性使用椭圆来表示,描述了每个实体所有的特性;而实体间的联系用菱形来表示。根据上一章对系统的需求分析以及概要设计,建立部分实体的图,如图所示。 图 系统管理图三、 数据库逻辑结构设计数据仓库逻辑结构设计,这个阶段是将上个阶段完成的数据库实体属性图转换成在数据表里面可以建表的属性和字段类型,属性名等信息。在实际应用时,应先建立实体的物理模型,将模型关系和应该包含的字段确定下来之后进行数据仓库表的建模。 () 系统用户表,存放所有的系统用户信息,表结构如表所示。表 普通用户表()字段名称类型字节数描述用户编号(主键)(自增)用户名(非空)密码
36、(非空)邮箱(非空)状态(非空)地址(可为空)性别(可为空)联系电话(可为空)用户角色(非空)用户类型(非空)备注(可为空)() 系统菜单表,存放所有的系统菜单信息,表结构如表所示。表 系统菜单表()字段名称类型字节数描述菜单(主键)(自增)菜单名(非空)对应路径(非空)父级菜单(可为空)菜单图标(可为空)菜单状态备注(可为空)() 系统角色表,存放所有的角色信息,表结构如表所示。表 系统角色表()字段名称类型字节数描述角色(主键)(非空)角色名称(非空)菜单(非空)备注(可为空)()客户消费订单表,存放所有的客户消费订单的分析结果数据,表结构如表所示。表 客户消费订单表()字段名称类型字节数
37、描述客户第一次消费时间最近一次消费时间首单距今时间尾单距今时间近三十天的购买次数近三十天的购买金额近六十天的购买次数近六十天的购买金额近六十天的购买次数近九十天的购买金额最大消费金额最小消费金额累计消费次数累计消费金额累计使用代金卷金额常用收货地区常用支付方式上午下单总数下午下单总数晚上下单总数()客户购买类目表,存放所有客户购买类目的分析数据,表结构如表所示。表 客户购买类目表()字段名称类型字节数描述客户一级分类一级分类名称二级分类二级分类名称三级分类三级分类名称近三十天购买类目次数近三十天购买类目金额近六十天购买类目次数近六十天购买类目金额近九十天购买类目次数近九十天购买类目金额累计购买
38、类目次数累计购买类目金额最后一次购买类目时间 () 客户购买商店表,存放商店近期的所有分析数据信息,表结构如表所示。表 客户购买商店表()字段名称类型字节数描述客户商店商店名称品牌品牌名称最近三十天购物车次数最近三十天购物车商品件数最近三十天商品提交件数最近三十天的交易成功率最近三十天的购物车取消商品数最后一次购物车时间最近九十天排除退据商品件数最近九十天排除退据商品金额最近九十天购买订单数最近九十货到付款订单数最近九十天的退货数最近九十天的退货金额最后一次退货时间() 客户属性信息表,存放所有客户属性信息,表结构如表所示。表 客户属性信息表()字段名称类型字节数描述客户客户登录名性别生日年龄
39、星座大区域省份城市城市等级邮箱加密手机手机前几位手机运营商注册时间登录地址登陆来源邀请人会员积分已使用积分会员等级名称客户黑名单婚姻状况学历月收入职业性别模型是否为孕妇是否有小孩孩子性别概率孩子年龄概率是否有车 潜在汽车用户概率使用手机品牌使用手机品牌档次使用多少种不同手机更换手机频率疑似马甲标识疑似马甲账号用户忠诚度用户购物类型身材身高 () 客户营销信息表,存放所有客户营销分析数据的表,表结构如表所示。表 客户营销信息表()字段名称类型字节数描述客户营销手机号第一个有效订单时间第一个有效订单来源第一个有效订单地址第一个有效订单城市第一个有效订单省份第一个有效订单城市等级最近一次收货地址省份
40、最近一次收货地址城市最近一次使用手机号最常用的手机号最常用的手机运营商使用不同手机号数最近一次使用收货地址最常用的收货地址不同收货地址数量最近一次收货人姓名最常用的收货人姓名不同收货人数量客户分群:潮妈族,男人帮等等活跃状态用户价值模型是否有纠结商品纠结时间纠结商品() 客户活动信息表,存放所有客户活动分析数据的表,表结构如表所示。表 客户活动信息表()字段名称类型字节数描述客户用户促销敏感度满减促销敏感度换购促销敏感度满赠促销敏感度打折促销敏感度购买力分段品牌偏好品类偏好颜色偏好败家指数冲动指数累计积分可用积分已用积分累计代金券金额累计代金券数量已用代金券数量已用代金券金额过期代金券数量过期
41、代金券金额可使用代金券数量可使用代金券余额() 客户访问信息表,存放所有客户访问分析数据的表,表结构如表所示。表 客户访问信息表()字段名称类型字节数描述客户最近一次访问时间最近一次访问时间最近一次访问最近一次访问最近一次访问最近一次访问使用浏览器最近一次访问使用操作系统最近一次访问名称最近一次访问使用操作系统最近一次访问 最近一次访问城市最近一次访问省份第一次访问时间第一次访问时间第一次访问第一次访问第一次访问第一次访问使用浏览器第一次访问使用操作系统第一次访问名称第一次访问使用操作系统第一次访问 第一次访问城市第一次访问省份近七天访问次数近十五天访问次数近三十天访问次数近六十天访问次数近九
42、十天访问次数近七天访问次数近十五天访问次数近三十天访问次数近六十天访问次数近九十天访问次数近三十天访问天数近三十天访问并购买次数近三十天访问近三十天访问平均近三十天使用不同次数近三十天使用相同的近三十天使用相同的数近三十天最常用的浏览器名称近三十天访问最常用的操作系统 系统部分功能模块流程图设计 功能模块是指本系统所含有的所有功能的设计,比如说功能说明,功能设计。流程图设计等。现在软件开发都是把一个大的系统分成一块一块的进行开发,每个功能都是独自实现的,也就是我们这个模块修改,理论上来说不影响其他模块,而最后这个一个个的小模块又组成了整个大的系统。下面我们就系统功能里面的几个模块内容进行具体的
43、分析和流程图设计。 系统整体流程图系统的整体流程图描述整个系统功能和权限的设定这些信息。整体功能流程图如图所示:图 系统整体流程图用户登录当系统里面已存在账号,进入系统登录界面输入密码账号,验证码,当这些信息都通过是将会登录成功,并将登录人的信息放入里面,进行保存,以用户系统其它地方应用这些数据或者进入其它页面时进行是否已登录验证等作用,避免有些人在知道系统其它路径的前提下随便进入系统对整个系统的数据这些重要信息随意修改和破坏,同时登陆完之后,页面将跳转到系统的主页面,并根据当前用户的角色这些赋予当前用户在系统里面的权限(包括数据权限和链接权限)。用户登录流程图如图所示:图 用户登录流程图 修
44、改密码用户登录系统之后再左边菜单栏里面有一个修改密码菜单,点击菜单打开界面用户就可以修改自己的登录密码了,当然在修改密码时还会有一定的限值,比如说输入原始密码,或者密码确认等。下面是用户修改密码的流程图,如图所示:图 用户修改密码流程图 部分功能模块的实现说明下面我们具体介绍一下整个系统的部分功能的实现。用户登录在本系统中我们严格要求用户登录后才能进行其他的操作,在登录信息填写完之后我们进行将用户和密码插入后台然后根据查询相关数据库中的表,查看表中是否有该条记录,如果有登录成功进入系统,如果没有则返回提示消息并将页面停留在当前登录页面,实现代码如下:建立实体 (, );()获取数据库连接 (,
45、 );()(, 用户名或密码错误!); ()(, ); (, ();();(, );();二、 用户跳出率 在本系统中我们统计用户的跳出率方法是先计算出当前时间段里一共有多少访客,跳出的有多少访客,具体实现我们分两步走,首先是根据查询数据做出一个统计的折现图,其次将查询的数据集也返回到前台显示。下面两端代码分别是生成折线图和最后的数据集合的代码:. 生成折线图的代码,首先创建两条线,然后将计算所得数据按照所需要的格式放入这两条线的对象中,然后设定所需要的格式,最后返回生成图片的名字。 (访客数, ); (跳出访客, ); 添加数据 (); (); () ();(); ( : ) (); (:)
46、; ;(); () ();(); () ;( () );( () ); 定义时间序列的集合 ();();(); (访客统计时间折线图, 日期, 访问量, , , , );设置主标题( (访客统计对比图, (隶书, , ); 设置子标题(); 设置时间轴的范围。 () (); ()();( (); 设置曲线是否显示数据点 ()();(); 设置曲线显示各数据点的值 (); ();( (, ); ( ();( (, , ); (); (, , , ); ;. 生成显示数据集代码。首先我们根据条件查询所需要的数据,然后将返回值封装成格式,最后将对象返回前台,进行显示。(); (); ; ; () (
47、) (, ); () (, ); (), , );() (, ); () (, ); (); (); () (); ();(); ( : ) (); (:); ;(); () ();(); () ;(:():():(); () (:()*);();(); (); ();(, );(, );(, ); 系统结构和页面详细设计本文研究的是电商平台下的用户画像,我们利用软件开发技术,现将元数据进行分析,然后利用进行数据仓库建模,然后进行数据分析,得出一定的数据和分析结论,最后将得到的结论的一部分功能利用技术将其显示在页面上,供决策者查看,然后做出一定的商业决断。下面我们就将本系统的部分功页面截图展示
48、和功能讲解:首先我们先简单的介绍一个我们的整体框架,我们前使用了框架进行整体的布局,然后在图标显示方便利用了 和结合使用。 () 主界面的介绍,我们主界面整体布局是利用了传统的布局方式,上下左右中的模式。当然这也是利用框架布局的优点之处,布局方便简单。然后在分开说在整个页面的顶部我们利用一个图标和显示当前登录人和当前登录人的角色。左边显示的是这个系统的所有功能菜单,利用树形结构进行显示。底部比较单调就写了“版权所有”四个字,中间是主要内容,首页我们选择用“欢迎使用”四个字,当然中部也是后面所有功能页面显示的地方,系统主界面如图所示: 图 系统主页面() 给角色授予权限界面:在这个页面里,我们首
49、先点击左边的角色管理菜单按钮,然后在右边弹出角色列表界面。在这个地方出了我们平时的增删改查外,还多出一个按钮,那就是角色授权。点击这个按钮弹出一个界面,利用用树形图列出了当前系统的所有权限菜单,勾选了这个菜单,然后点击保存,那我们就给这个角色授权成功,然后我们新建一个用户,给他赋予当前授权成功的角色,那么下次利用当前建立的用户登录的话。就只会显示当前已授权的那些菜单,其他菜单就不会再显示。下面就是我们的授权页面如图所示:图 授权页面() 跳出率,点击左边菜单跳出率,然后在右边就会显示我们当前系统的统计的跳出率,整个页面布局如下:首先在最上面使我们自己定义的查询条件,分为年的到月的数据,每个查询
50、条件的时间段都为一个月。后面还有一个自定义查询框,用户只要输入统计开始时间和统计结束时间点击分析按钮,系统就会按照用户所设定的时间段去分析数据并显示结果。在查询条件下面,是我们 生成的折线图,折线图分两部分组成,一条线是当前时间段的每个时间点访问的人数,而另一条线是跳出访客的统计数,在数据的下面我们显示的是对应当前图表生成结果的数据集,如图所示:图 跳出率界面() 用户忠诚度页面,在这个功能里面我们要完成对用户忠诚度的计算和显示,而对于我们计算用户忠诚的算法模型我们在前面已介绍过了,在这里我们只是显示页面功能,这整个页面的上方我们布局仍然是查询条件,不过这次查询条件变为今天、昨天、过去三十天、
51、过去六十天、过去九十天,和自定义输入,除此之外我们还多了回访次数,和回访频率两个查询按钮。我们查询的最终结果以饼状图的形式展现出来,如图所示:图 用户忠诚度界面() 用户活跃度,在这个功能里面我们完成对用户活跃的计算,及一个客户在距上次访问后的六十天内有访问了平台并购买了商品,我们就认为这个是活跃客户,而活跃度是一定时间段内的活跃客户除以所有客户,由此我们计算出用户的活跃度。在页面里显示我们采用折线图进行显示,整个页面,我们上面也是查询条件,而下面为图表,最底部我们显示的统计数据。如图所示:图 用户活跃度页面 () 用户的访问速度分布,这个功能统计了不同地区客户的访问网站的速度,由此可以判断出
52、我们平台对用户的吸引力,和以后平台在那个地区适合推广和营销措施。在这里面我们采用里面的中国地图进行统计每个省市的访问速度等信息,页面布局和前面一样上面也是自定义或者使用系统提供的按钮进行查询,然后将整个查询结果放入地图中,使之简单明了,更利于决策者观察。具体显示如图所示:图 用户访问速度界面 系统测试在这章里面我们主要介绍一下,软件测试的目的,意义,和简单的测试方法,并对本系统进行简单的测试介绍。 软件测试的目的软件测试是整个软件开发过程中不可缺少的一部分,也是整个软件开发流程的一个阶段。软件测试在一定意义上我们替用户受过,为了让用户用起来在视觉或者功能使用上都比较难爽,提高用户满意度,同时也
53、提高整体软件质量,提高整体企业的信用度。我们进行软件测试的最主要目的是调整和提高软件功能和性能。除此之外,软件测试,还可以降低软件的整体风险,但是做不到预防风险,所谓预防风险就是我们开发的软件是零风险。所以我认为我们不可能开发一个软江让其零风险,软件测试只能降低风险。 测试的方法及步骤一、 测试方法软件测试是从软件立项到整个软件上线,伴随转件开发的全过程。其实软件测试不仅是指程序测试,还有文档测试,整个项目开发成本等测试。程序测试的方法有很多种,最常用的就是很多人都知道,也在软件开发过程中都用到过的黑盒测试和白盒测试。其中黑盒测试比较简单,他只关心我们输入一个用例,肯输出结果是否正确。其实黑盒
54、测试还可以细分为功能性测试和性能性测试,功能性测试简单而言就是我们做的这个程序满不满足客户所提的需求,也就是说我们做出的结果是不是客户想要的,输出结果是不是正确的。性能性测试也是分两方面时间上和空间上的,时间上就是我们点击一个按钮系统反应回馈时间,而空间上的是指运行这个程序,消耗了多少的内存,我们的硬件环境能不能支持整个程序的长期运行。白盒测试就对测试人员的能力要求比较高了,最简单的一点要会写单元测试类等,白盒测试期间,整合程序就是透明的,我们需要对程序里面的部门需要测试的类或者方法整体进行逻辑执行速度等方面的测试。目前我们介绍的两种测试方法是最常用的两种测试方法,测试方法还有很多种,在此我们
55、就不一一进行介绍了。二、 测试用例测试用例是我们软件测试过程中不可避免需要设计的东西,所谓测试用例就是软件测试过程中为了测试一个功能而特意设计的一组测试数据,从而验证我们所开发的这个功能是否满足客户需求。有时候我们在测试过程中设计出一个好的测试用例,可以避免很多不必要的工作量,同时也可以提高整体软件的质量,所以测试用例的设计,在软件测试里面占着非常重要的作用。三、测试步骤我们在这里只讲软件的开发完后的整体测试。我们在测试前先通过软件开发说明设计测试用例,然后根据提前设计的好的测试用例进行分模块,分功能测试,最后得出测试结论,书写测试报告。 系统部分功能测试和结果本系统由于后台数据测试不好显示等
56、原因,所以我们只对前台显示的部分功能进行测试,主要是集中在系统管理模块,如登录,用户管理,菜单管理,角色管理等功能。并且,由于我们测试的功能比较简单,而且也没有复杂的业务逻辑关系,所以整个测试都是围绕着黑盒测试进行的,下面是具体的测试内容和测试结果 一、 登录测试在用户等这么模块,只要我们的系统里面提前录入了该用户的相关信息,测试如正确的账号,密码和验证码,即可登录进入系统,登录所用测试用例如表所示。表 登录测试用例操作输入数据预期结果实际结果如果系统用已经存在改用户信息,则输入正确的用户名,密码和验证码则可以登录进入系统用户名:密码:验证码:登录成功登录成功,跳转到系统主页面用户名不存在用户
57、名:密码:验证码:提示用户名不存在页面弹出用户名密码不对,系统仍在登录页面密码错误用户名:密码:提示密码错误页面弹出用户名密码不对,系统仍在登录页面验证码错误用户名:密码:验证码:提示用户验证码错误页面弹出验证码错误,系统仍在登录页面当用户输入正确的登录信息后,点击登录按钮,系统首先将我们的当前登录人的信息放到里面,然后系统跳转到主页面,与此同时在主页面的上方显示当前登录人的姓名和角色,并且左边菜单栏根据用户的权限显示不同的菜单。用户登录页面如下图所示。图 用户登录界面二、 用户添加功能当前用户登录成功后进入主界面,查看当前用户是否具有用户管理这个权限。如果有这个权限,我们点击用户管理菜单,进
58、入用户管理界面,点击添加按钮弹出用户添加页面,填写相关信息,然后按保存按钮保存当前添加用户,并且系统添加页面关闭,列表刷新。用户添加测试用例如表所示。表 用户添加测试用例操作输入数据预期结果实际结果合理的填写所有必须填写信息,并且选择了用户所属角色填写用户名,密码,选择了新添加用户所属角色添加成功添加成功,关闭添加窗口用户名没有填写填写了密码,选择了角色添加失败添加失败,仍留在原页面,提示用户,用户名不能为空密码没有填写填写了用户名,选择了用户所属角色添加失败添加失败,仍留在原页面,提示用户,密码为空没有选择用户所属角色填写了用户名和密码添加失败添加失败,仍留在原页面,提示用户,角色名称不能为
59、空当所有信息都填对了,用户角色选择之后,点击保存按钮,当前用户保存成功。用户添加界面如下图所示图 用户添加页面三、 修改密码功能测试当用户登录成功后,在左边菜单有一个修改密码菜单,点击修改密码,弹出修改密码窗口,输入原始密码和新密码等信息后点击保存按钮保存用户下次登录时,就验证新密码。测试用例如表所示。表 测试用例操作输入数据预期结果实际结果输入所有正确信息原密码:新密码:确认新密码:修改成功修改密码成功,关闭当密码修改窗口原密码错误原密码:新密码:确认新密码:提示原密码错误提示原密码错误,系统停留在当前修改密码窗口新密码为空原密码:新密码:确认新密码:提示新密码不能为空提示新密码不能为空,系
60、统停留在当前修改密码窗口确认密码与密码不一致原密码:新密码:确认新密码:提示新密码和确实密码不一致提示新密码和确实密码不一致,系统停留在当前修改密码窗口当所有信息填写正确后,点击保存按钮,保存修改结果并且关闭修改密码窗口。修改密码窗口如图所示。图 密码修改界面 论文总结和今后展望总结在经过将近半年的学习和开发,我顺利的完成了电商平台下用户画像的设计与实现。现在是大数据的时代,我相信用户画像也许在将来将会是一个发展方向。在我们所制作的系统里面,我们将传统系统中的数据,导入中,并在里面进行数据的分析与计算,最后得出我们想要结果。有了这个系统我们可以预测我们平台以后的发展趋势,和我们应该如何能够吸引
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程测量考试题型及答案
- 2025年湖南企业面试真题及答案
- 亲情的力量记事作文(5篇)
- 高电压理论考试题及答案
- 2025年福建省莆田华侨职业中专学校校聘教师招聘1人考前自测高频考点模拟试题及答案详解一套
- 红旗汽车模拟测试题及答案
- 全面绩效考核指标体系模板
- 跨平台协作标准化工具及其功能覆盖场景
- 2025杭州青少年活动中心招聘工勤岗位工作人员20人考前自测高频考点模拟试题及完整答案详解
- 销售合同管理工具合同要素审核清单版
- 网络安全教育主题班会通用课件
- DB4405-T 303-2023 狮头鹅屠宰操作规程
- 经合组织成员国
- 浅谈如何做好危化品安全管控工作
- 人工智能技术及应用习题答案题库
- 县中医院妇科重点专科建设汇报
- 坚持人民至上 工会研讨发言
- 美学原理全套教学课件
- 期末复习(课件)新思维英语四年级上册
- 子宫脱垂试题及答案
- GB/T 90.1-2023紧固件验收检查
评论
0/150
提交评论