版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,Apriori算法,团队成员吴国权,唐思远,赵庆伟,张博,2,购物篮分析:触发示例,问题相关性分析解决方案,1:经常同时购买的商品可以放置得更近,从而进一步刺激这些商品一起销售。2.规划哪些辅助商品可以降价销售,从而刺激主要商品的捆绑销售。购物时,顾客可以同时购买哪一组商品?关联分析的基本概念,关联规则是隐含形式,(支持度)规则是在事务集D中建立的,而支持度S是事务包含的百分比。支持度()=P()(置信度)置信度C是D中同时包含A和B的事务的百分比。置信度()=P()/P(A) (k项集)包含k项的项集称为k项集,频繁k项集的集合被表示,候选k项集的集合被表示。(1)K维数据项集LK是频繁项
2、集的必要条件是其所有的K-1维子项也是频繁项集,用LK-1 (2)表示。如果K维数据项集LK的任何K-1维子集LK-1不是频繁项集,则K维数据项集LK本身不是最大的数据项集。(3)LK是一个K维频繁项集。如果所有的K-1维频繁项集l K-1中包含l K的K-1维子项的数量小于K,LK不能是K维中最大的频繁项集。(4)同时满足最小支持阈值和最小置信度阈值的规则称为强规则。Apriori算法表明,Apriori算法中寻找最大项目集的基本思想是:算法需要分多步处理数据集。第一步是简单地计算包含一个元素的所有项目集的频率,找出那些不低于最小支持度的项目集。即一维最大项集L1。从第二步开始,循环过程开始,直到没有生成最大项集。在:的K步骤中,根据在k-1步骤中生成的(k-1)维最大项集生成K维候选项集CK,然后搜索数据库以获得候选项集的项集支持度,将其与最小支持度进行比较以找到K维频繁项集Lk。记住lij代表li中的j项。假设Apriori算法按照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论