




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子商务网站论文关于Web挖掘在电子商务网站的应用论文范文参考资料 摘要:该文在对Web使用挖掘的相关研究基础上,为了深入分析消费者的网上购物行为,提出了结合点击流数据的策略,利用多维关联规则算法从用户的购买历史记录中挖掘出用户的购买模式及商品间的联系,向用户提供个性化推荐。 关键词:点击流;数据仓库;Web使用挖掘;多维关联规则 1009-3044(xx)31-7594-03 The Applied Research of Web Usage Mining to Electronic Commerce Website ZOU li-xin (Fujian Jiangxia University, Fuzhou 350108, China) Abstract: In the paper,in order to analyze the customers behavior on inter,author put forward a method of bination of click-stream data based on the related research of web usage mining,using multidimensional association rules algorithm to mine the mode of purchase behavior and the internal relations between products from customers history transaction records,for providing personalized remendation. Key words: clickstream; datawarehouse; Web usage mining; multidimensional association rule 点击流数据仓库也称为Web日志数据仓库,主要用于Web使用情况的统计分析,包括最经常访问的页面、网站某时段的总点击量、某时段网站的总访问人次等。由于上述应用没有涉及日志数据仓库基础上的用户使用模式的深层次挖掘,因此无法充分利用日志数据的价值,体现Web 使用挖掘的优势1。鉴于此目前状况,本文以电子商务网站上的点击流数据为基础,提出了将点击流数据与网站交易数据库数据整合的策略构建点击流数据仓库,并引入了联机分析处理和数据挖掘等技术对这些数据进行深层次分析,为网站提供经营状况、改善客户关系、了解用户行为等方面的决策支持。 1 理由分析与准备工作 我们知道,购物网站上的访客在一次访问历史中可能有几次购买行为,或者有几次将商品放入购物车的行为,或者有几次将商品放入暂存架的行为,或者有几次查看商品详细信息的行为或者只是浏览网站。会话就是每个用户从进入网站到离开网站所进行的一系列活动。那么会话类型可分为:多次购买、一次购买、只放入购物车、暂存、查看和浏览。而其中 只放入购物车、暂存、查看和浏览这四种情况的用户可以说就是电子商务网站潜在的客户,是点击流数据中很重要的信息。比如说有人想在线购买某一本书,但是却没有找到该书,在日志里记录了寻找这本书的全部过程。如果使用了点击流的这种信息,在线书商就能帮助你找到这本书或者倡议你购买另一本类似的书。至少,书商知道该去定购这本书,因为市场对此有需求2。通过挖掘用户会话事实表中的该类行为,为商业争取更多的客户,使电子商务满足更多不同客户的需求。通过日志记录中的username域可以判断是注册用户和非注册用户。如果是注册用户,可以结合网站数据库中注册信息,通过Email进行调查或者推荐相关商品。如果是非注册用户,综合考虑商品、商品价格、打折等因素,以更深刻地理解网上消费者的行为,针对所以可能性采取有作用的措施以吸引和争取该客户。 因为放入购物车以及暂存都是注册用户才能进行的操作,所以在数据准备阶段,根据会话类型将用户分类,只要选择出非注册用户查看过的商品信息,并将这些记录存进特定库表中。而对于注册用户,网站交易数据库已提供了详细的信息,其放入购物车及浏览过的商品信息。对于网站交易数据库,所需的准备工作是根据订单表抽取出每个用户ID及其购买过的商品,构造事务数据库。在上述操作的基础上,在事务数据库以及客户表(用户的详细信息)两个表上进行关联规则挖掘等后续工作。 2 相关库表设计 3 实现步骤 根据以上分析,本文使用关联规则挖掘算法产生向用户推荐其可能会购买的前N项商品的算法步骤设计如下: 1) 根据网站交易数据库每个用户购买过的的所有商品的历史交易数据创建每个用户的事务记录,构造事务数据库即表Purchase。 2) 用关联规则算法对用户购买表及客户表进行关联规则挖掘,其中以购买表为事例表,以客户表为嵌套表,选择两表中相应的键列、输入列以及预测列,得到满足最小支持度(Minimum Support)和最小置信度(Minimum Confidence)的所有关联规则,记为关联规则集合R。 3) 对当前所分析的用户U,设置一个候选推荐集P,并将其初始化为空。 4) 对当前所分析的用户U,搜索关联规则集合R,找出该用户支持的所有关联规则集合RI,即关联规则左部的所有商品出现在用户U的购买过的历史交易记录中。 5) 对关联规则集合RI右部的所有商品先判断用户是否已经购买过,若已购买则删除,否则加入候选推荐集P中。 6) 根据关联规则集合RI的置信度对候选推荐集P中所有候选项进行排序,如果一个项在多条关联规则中出现,则选择置信度最高的关联规则;对于置信度相同的关联规则,选择重要性分数最高的关联规则。 7) 结合用户游览过的商品表记录以及放进购物车的商品记录进行排序选择,从候选集P中选择置信度最高的前N项,作为推荐结果返回给用户U。 需要特别指出的是,在构造事务数据库时,因为数据库中一般都包含了太多的细节理由,将影响分析的效率,本文提出先对数据进行处理,比如在顾客信息表中,对每个客户都有年龄属性,可以将这些连续的年龄值分成十段,比如将年龄范围在10岁到20岁之间的用户年龄统一归为1020年龄段,年龄范围在20岁到30岁之间的用户年龄统一归为2030年龄段,同样处理其他年龄范围。接着结合顾客的个人信息有针对性地选择加入事务数据库的购买记录,比如首先分别按年龄段、性别、职业、文化程度等属性统计出各自占产生购买行为的比例,然后根据这些统计信息以及特定的分析需要,筛选出满足特定条件的记录,比如分别满足占最高比例的记录。这样做的作用在于能针对多个维的特点进行考虑,可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国移动鸡西市2025秋招笔试题库含答案
- 临汾市中石油2025秋招笔试模拟题含答案法律与合规岗
- 中国广电焦作市2025秋招笔试行测题库及答案市场与服务类
- 宜昌市中石油2025秋招面试半结构化模拟题及答案油品分析质检岗
- 克拉玛依市中储粮2025秋招面试专业追问题库综合管理岗
- 中国移动襄阳市2025秋招笔试行测题库及答案互联网运营
- 巴彦淖尔市中储粮2025秋招财务资产岗高频笔试题库含答案
- 中国广电克拉玛依市2025秋招笔试行测题库及答案财务审计类
- 国家能源六安市2025秋招面试专业追问及参考法学岗位
- 2025年供热二次网考试题及答案
- 消防政治工作课件
- 松木桩地基处理施工方案
- 二城市轨道交通类型111课件
- 研学活动合同协议书模板
- 工程勘察设计收费标准(2002年修订本)
- 规范团费账户管理制度
- 销售团队组建方案-
- 坚持以人民为中心 课件
- 物业服务提升方案模板
- 不同茶叶的冲泡方法
- 人教版高中地理必修第一册第一章宇宙中的地球第一节地球的宇宙环境练习含答案
评论
0/150
提交评论