




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘电子商务论文范文:试谈关联规则挖掘的算法及商务应用word版下载导读:本论文是一篇关于关联规则挖掘的算法及商务应用的优秀论文 范文,对正在写有关于数据挖掘论文的写作者有一定的参考和指导作 用,论文片段:数量与日俱增,从而使得数据挖掘技术的重要性日益 加强,关联规则挖掘是数据挖掘中最活跃的研究策略之一。该文先介 绍了关联规则挖掘的研究情况,进一步提出和实现了一种有效的基于 矩阵的apriori改善算法,最后探讨和实现apriori算法在商务中的 应用。 关键词:数据挖掘;关联规则;apriori算法;商务应用 1009-3044 (2013) 14摘要:随着数据库技术的迅速发展,数据的存
2、储数量与日俱增,从 而使得数据挖掘技术的重要性li益加强,关联规则挖掘是数据挖掘中 最活跃的研究策略之一。该文先介绍了关联规则挖掘的研究情况,进 一步提出和实现了一种有效的基于矩阵的apriori改善算法,最后 探讨和实现apriori算法在商务中的应用。关键词:数据挖掘;关联规则;apriori算法;商务应用1009-3044 (2013) 14-3217-031数据挖掘体系结构与关联规则1.1数据挖掘体系结构数据挖掘(data mining)从定义上可以将其界定为从大量的、 不完全的、有噪声的、模糊的、随机的数据屮识别有效的、新颖的、 潜在有用的,以及最终可理解的模式的过程1。通过对数据挖
3、掘的 定义的分析可以看出,数据挖掘是一个高级的处理过程,其最终要达 到的目的就是能够实现从数据集中识别出以模式来表示的知识。ftl此 可以看出,数据挖掘作为一门学科,涉及的学科知识十分广发,最主 要的是涉及到机器学习、模式识别、统计学、智能数据库、知识获取、 数据可视化等多个领域。借助数据挖掘这一工具和策略,其最终的分 析结果和成果可以用在信息管理、过程制约、科学研究、决策支持等 许多方面。一般来说,一个完整的数据挖掘过程由以下七个步骤组成: 数据清理、数据集成、数据选择、数据变换、数据挖掘、模型评估和 知识表示。1.2关联规则关联规则的挖掘(arm)是数据挖掘的一项重要的任务。关联规 则挖掘
4、最根本的目的就是能够快速有效地发现大量数据屮项集之间 有趣的关联或相关联系。其目的就是从事务数据库、关系数据库中发 现项目集或属性之间的相关性、关联性以及因果性。随着数据挖掘相 关研究的不断深入,许多研究学者更多地将研究的目光集中在了挖掘 关联规则方面。从数据挖掘的本质特征来分析可以看出,关联规则更 多地反映一个事件和其他事件之间依赖或关联的知识。通过关联规则 的定义可以发现,如果两项或多项属性之间存在关联,那么其中一项 的属性值就可以依据其他属性值进行预测。2 一种基于矩阵的apriori改善算法挖掘关联规则的对象是含有大量事务的事务数据库,所以如何 设计一个高效的算法,以提高挖掘的计算效率
5、,降低数据库的扫描次 数,是研究关联规则挖掘的重要课题。虽然现在对于挖掘算法apriori 相关的改善和发展不断涌现,但是仍然有着自身的一些缺陷,最具有 代表性的就是对数据库进行多次扫描而造成的精确度的降低,以及显 著地存在由候选集ck产生频繁集lk等不足。正是由于这些缺陷的 存在,本节提出一种基于矩阵的改善算法来产生频繁集l k ,这种 算法只对数据库扫描一次,并且无需候选集ck ,即可得到频繁集l k o2. 1与算法相关的几个概念3 apriori算法在商务中的应用3. 1理由提出假如一家大型超市的管理人员想要知道每天超市的销售情况, 顾客的购买模式,通过顾客特征,采取相应的货价摆放以增
6、加顾客满 意度和销售额。如果仅仅靠传统人工技术,从巨大的购买信息中找出 相应的答案就像大海里捞针,非常困难。本章利用数据挖掘技术针对这一理由进行研究。研究对象是顾 客在一次购物的过程中,购买相关范文由第的不同商品之间联系,进 而借助数据挖掘来进一步深入地分析顾客的购买习惯。在对不同商品 种类和数量进行充分分析的基础上,进一步地分析出哪些商品最受顾 客欢迎,从而购买频率很高,进而借助这种关联的发现可以帮助零售 商制定营销策略。理由归结为分析当前销售情况,找出商品统计信息 之间的关系。3. 2数据来源对于一个实际的数据挖掘应用来说,数据是进行数据挖掘的基 础和根本,同时数据挖掘技术的应用对数据量也
7、有一定的要求,只有 这样数据挖掘才能有实际作用0数据的获取确实是这次研究数据挖掘 面对的很大的理由。通过仔细的搜索和分析,我最终选择了 belgium 的一家的超市的销售数据。整个数据源是在三个非连续的时期收集 的,在每一个间隔期,没有可获的数据。数据收集期跨时近5个月, 总共收集到的数据记录有88163条。在整个数据收集期间里,该超 市总共出售了 16470种商品,共有5133位顾客在该超市购买了至少 一种商品。但是与我们期望的数据还是有许多不同之处,数据表结构与我 们需求的也存在很大的差别,这里可以采用等同和类比的策略,从而 实现了对表结构的修改和数据的替换,这样以来就有效地实现了对大 量
8、的数据替换和表结构重组,解决了数据来源理由。3. 2. 1数据处理由于数据仓库中各个主题中的数据是按照前端应用需求存放 的,因此在数据应用前必定存在一个数据处理和转换的过程,这一过 程需要对数据进行变形,使之适应前端应用需要。为了能够提高关联 规则的效率,充分实现数据挖掘需要达到的既定目标,在进行数据挖 掘之前,需要对交易数据库中的销售数据进行定的预处理才能有效 地应用数据挖掘技术和策略。这里采用超市销售表中的相关信息来进 行数据挖掘,具体的每一条记录包括以下信息:顾客编号 发票编号 购买日期商品1名称 商品1总价 商品 2名称商品2总价商品n名称商品n总价总计通过分析可以发现,这种数据结构的特点是数据库的每一条记 录能够对每一位顾客在一次进入商店进行购物的详细信息进行充分 的记录,次完整的交易记录通常由多种商品的名称和支付的价钱组 成,这种数据结构提供的信息比较详细,但是不利于关联规则挖掘的。 因为关联规则所描述的只是不同项目之间的关系,它只关注一次交易 中有哪些商品被同时购买。我们不用去考虑顾客在一次交易中所购买 物品的数量、价格等信息,每种商品(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财务出纳担保责任协议(含保密协议)
- 城市排水设施拆迁补偿安置协议书
- 车辆事故道路修复赔偿协议书范例
- 草场承包租赁与农业产业化合作协议
- 财务担保资产担保合同范本
- 文化创意产业代理记账及知识产权财务保护合同
- 旧区改造拆迁安置房购置合同范本(含产权)
- Brand KPIs for hotels:Lemon Tree in India-英文培训课件2025.5
- 2025年电子商务与供应链管理职业考试试卷及答案
- 2025年各行业技能提升考试试卷及答案
- 2024年山东省初中学业水平考试语文试题(文字版-含答案)
- 2024-2025教科版一年级下册科学期末考试卷附参考答案 (三套)
- 高血压药的类型
- 2025-2030年力控玩具项目投资价值分析报告
- 家规家训课件
- 基于学校区域文化优势背景下的小学水墨画教学研究
- 设备欠款协议书范本
- 《深圳音乐厅解析》课件
- 2025届河南省鹤壁市淇县第一中学高三下学期联合考试英语试题含解析
- 机柜租赁合同协议
- 2025年2月22日四川省公务员面试真题及答案解析(行政执法岗)
评论
0/150
提交评论