Apriori算法.docx_第1页
Apriori算法.docx_第2页
Apriori算法.docx_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Apriori算法Apriori算法48最早是由Agrawa等人提出。算法通过对数据库的多次扫描来计算项集的支持度,发现所有的频繁项集后,进一步生成关联规则。算法利用的核心思想是频繁项集的任何非空真子集必定也是频繁的,非频繁项集的任何超集必定不是频繁的。表5-1 Apriori算法步骤Table 5-1 Steps of Apriori AlgorithmApriori算法步骤:(1) 扫描整个数据库,产生候选1-项集的集合C1(2) 根据最小支持度min_sup,从C1中产生频繁1-项集的集合L1(3) 对k1,重复执行步骤(4)、(5)、(6)(4)对Lk执行连接和剪枝操作,产生候选(k+l)-项集的集合Ck+1,(5)根据最小支持度min_sup,从Ck+1中产生频繁 (k+1)-项集的集合Lk+1(6) 若Lk,则k=k+1,跳往步骤(4); 否则,跳往步骤(7);(7) 根据最小置信度min_con,由频繁项集产生强关联规则(8)结束。 其中对产生频繁项集的连接和剪枝操作解释如下:a) 连接(join)采用递推的连接方法求,用与自身作连接产生候选k-项集的集合。具体来说,设 和 是中的项集且各项按统一标准排序。当满足条件时,则和 是可连接的,产生新的项集为:,将该项集加入集合,直到不能产生新的项集。b) 剪枝(prune)频繁k-项集的任何子集必须是频繁项集。由连接生成的集合需要进行验证,去除小于支持度阈值的非频繁k-项集。5.2.2.2 Apriori 算法描述Apriori算法主要由4个函数构成,分别如表5-2-表5-5所示。表5-2 Apriori由频繁项集产生候选集Table5-2 Apriori from Frequent Set to Candidate SetApriori_gen (Lk-1) / 通过(k-1)-频繁项集产生k-候选集begin for al1 itemset I1 in Lk-1 do for al1itemset I2 in Lk-1 doif (Il1=I2l)(I12=I22) (I1k-1=I2k-1) c=I1 join I2 ;/ 连接产生候选集 if has_infrequent_subset(c,Lk-1) delete c; else add c to Ck;end forend forendreturn Ck;表5-3 Apriori发现频繁项集Table 5-3 Apriori Find Frequent SetApriori_genfreItems(D,min_sup)输入:数据库D,最小支持度阀值min_sup输出: D中的频繁集LBeginL1=1-频繁项集;for (k=2; Lk-1; k+) doCk=Apriori_gen(Lk-l); /构造候选集for all 事务 t in D do Ct=subset(Ck,t); / 搜索t包含的候选集for all CCt do C.sup=C.sup+1; end for; /计算支持数 end for;Lk= CCt | C.sup min_sup; /得到k阶频繁项集end forEndReturn Lk=;表5-4 判断集合是否含非频繁子集 表5-5由频繁项集生成规则Table 5-4 Determine Set is Frequent or Not Table 5-5 Produce Rules from Frequent Sethas-infrequent-subset(c,Lk-1) /判断c是否含有非频繁子集Beginfor all (k-1)- subset s of c do if s Lk-1 return true; return false; End generateRule (Lk,min_con)Beginfor each I Lk dofor XI and X doif support(L)/support(X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论