



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关联规则论文关于关联规则挖掘的算法商务应用论文范文参考资料 摘要:随着数据库技术的迅速发展,数据的存储数量与日俱增, 从而使得数据挖掘技术的重要性日益加强,关联规则挖掘是数据挖掘中最活跃的研究策略之一。该文先介绍了关联规则挖掘的研究情况,进一步提出和实现了一种有效的基于矩阵的Apriori 改善算法,最后探讨和实现Apriori 算法在商务中的应用。 关键词:数据挖掘;关联规则;Apriori 算法;商务应用 1009-3044(xx)14-3217-03 1 数据挖掘体系结构与关联规则 1.1 数据挖掘体系结构 数据挖掘(Data Mining)从定义上可以将其界定为从大量的、不完全的、有噪声的、模糊的、随机的数据中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的过程1。通过对数据挖掘的定义的分析可以看出,数据挖掘是一个高级的处理过程,其最终要达到的目的就是能够实现从数据集中识别出以模式来表示的知识。由此可以看出,数据挖掘作为一门学科,涉及的学科知识十分广发,最主要的是涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化等多个领域。借助数据挖掘这一工具和策略,其最终的分析结果和成果可以用在信息管理、过程制约、科学研究、决策支持等许多方面。一般来说,一个完整的数据挖掘过程由以下七个步骤组成:数据清理、数据集成、数据选择、数据变换、数据挖掘、模型评估和知识表示。 1.2 关联规则 关联规则的挖掘(ARM)是数据挖掘的一项重要的任务。关联规则挖掘最根本的目的就是能够快速有效地发现大量数据中项集之间有趣的关联或相关联系。其目的就是从事务数据库、关系数据库中发现项目集或属性之间的相关性、关联性以及因果性。随着数据挖掘相关研究的不断深入,许多研究学者更多地将研究的目光集中在了挖掘关联规则方面。从数据挖掘的本质特征来分析可以看出,关联规则更多地反映一个事件和其他事件之间依赖或关联的知识。通过关联规则的定义可以发现,如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。 2 一种基于矩阵的Apriori改善算法 挖掘关联规则的对象是含有大量事务的事务数据库,所以如何设计一个高效的算法,以提高挖掘的计算效率,降低数据库的扫描次数,是研究关联规则挖掘的重要课题。虽然现在对于挖掘算法Apriori 相关的改善和发展不断涌现,但是仍然有着自身的一些缺陷,最具有代表性的就是对数据库进行多次扫描而造成的精确度的降低,以及显著地存在由候选集C K 产生频繁集LK 等不足。正是由于这些缺陷的存在,本节提出一种基于矩阵的改善算法来产生频繁集L K ,这种算法只对数据库扫描一次,并且无需候选集C K ,即可得到频繁集L K 。 2.1 与算法相关的几个概念 3 Apriori算法在商务中的应用 3.1 理由提出 假如一家大型超市的管理人员想要知道每天超市的销售情况,顾客的购买模式,通过顾客特征,采取相应的货价摆放以增加顾客满意度和销售额。如果仅仅靠传统人工技术,从巨大的购买信息中找出相应的答案就像大海里捞针,非常困难。 3.2 数据 对于一个实际的数据挖掘应用来说,数据是进行数据挖掘的基础和根本,同时数据挖掘技术的应用对数据量也有一定的要求,只有这样数据挖掘才能有实际作用。数据的获取确实是这次研究数据挖掘面对的很大的理由。通过仔细的搜索和分析,我最终选择了Belgium 的一家的超市的销售数据。整个数据源是在三个非连续的时期收集的,在每一个间隔期,没有可获的数据。数据收集期跨时近5个月,总共收集到的数据记录有88163 条。在整个数据收集期间里,该超市总共出售了16470 种商品,共有5133 位顾客在该超市购买了至少一种商品。 但是与我们期望的数据还是有许多不同之处,数据表结构与我们需求的也存在很大的差别,这里可以采用等同和类比的策略,从而实现了对表结构的修改和数据的替换,这样以来就有效地实现了对大量的数据替换和表结构重组,解决了数据理由。 3.2.1 数据处理 顾客编号 *编号 购买日期
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度高品质社区临时安保服务合同
- 2025版球队官方周边产品赞助合作框架协议
- 二零二五年度门面转让合同法律风险识别与防范策略
- 二零二五年餐厅室内设计与装饰施工合同
- CNG加气站建设项目可行性研究报告
- 山行课件教学课件
- 山居秋暝鉴赏课件
- 大队委知识培训心得课件
- 山东防控知识培训平台课件
- 2025年能源行业智能电网在电力系统智能化应用中的协同创新报告
- 公共场所卫生知识培训材料
- 证据目录范本
- 标准档案盒脊背(格式已设置好)
- GB/T 21475-2008造船指示灯颜色
- 园林绿化工高级技师知识考试题库(附含答案)
- 安医大生殖医学课件04胚胎的培养
- 可下载打印的公司章程
- 关于推荐评审高级工程师专业技术职务的推荐意见报告
- Q∕GDW 10356-2020 三相智能电能表型式规范
- 教研工作手册
- CINV化疗相关呕吐课件
评论
0/150
提交评论