版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关联分析产生关联规则关联规则
2关联规则产生事务TIDITEMS1I1,I2,I32I2,I3,I43I1,I3,I5,...………关联规则{I1,I2}{I3}{Ii,Ij}{Ik}……c≥minConf“候选”关联规则{I1,I2}{I3}{I1,I3}{I2}
{I1,I5}
{I2}{Ii,Ij}{Ik}……频繁项集+支持度{I1},7
{I2},6{I3},5{I1,I2},5{I1,I3},4{I1,I2,I3},4……,…s≥minSup3方法:对于频繁k-项集Z,
将集合Z
划分为
X
和Y
两个不重叠子集,
由X
和Y
生成“候选”的关联规则。
若候选规则X
Y
的置信度满足阈值,
则X
Y
为关联规则。
Z
X
Y
这样的规则必然已经满足支持度阈值,因为它们是由频繁项集产生的那么产生关联规则,是对于所产生出的频繁k-项集Z,关联规则产生从频繁项集产生候选的关联规则例:频繁项集{ABCD},候选规则有:{ABC}{D},{ABD}{C},{ACD}{B},{BCD}{A}{AB}{CD},{AC}{BD},{AD}{BC},{BC}{AD},{BD}{AC},{CD}{AB}{A}{BCD},{B}{ACD},{C}{ABD},{D}{ABC}4前件3,后件1前件2,后件2前件1,后件3还可以产生ABCD、关联规则产生关联规则X
Y的强度的度量指标:支持度
s:确定规则可以用于给定数据集的频繁程度置信度c:确定
Y在包含
X的事务中出现的频繁程度计算关联规则的置信度并不需要再次扫描事务数据集5
生成“候选”规则6暴力破解法基于Apriori的方法暴力破解法(Brute-forceapproach)
计算代价过高7fk
h
fk-h
h
fk-hApriori原理8支持度度量的单调性按照Apriori原理置信度也遵循“先验”规则被剪枝的规则低置信度规则9
按照Apriori原理如果规则X
Y
不满足置信度阈值,则形如X-
Y+
的规则一定也不满足置信度阈值,其中
是X
的子集。例如:10
大家可以看到,前件中项的数量逐渐变少,后件中项的数量逐渐变多…算法针对每一个不同大小的频繁项集,依次处理。根据频繁项集
fk和后件Sm,计算规则(fk-Sm)→Sm的置信度,若满足阈值要求,则确认该规则并输出;基于后件Sm,产生增加了一个项的后件Sm+1的集合{Sm+1},对其中的每各后件Sm+1,结合频繁项集fk,递归调用gen_rules(),处理所有的规则组合。11如果它满足阈值要求,则确认该规则并输出{1237}
{}{123}{7}{127}{3}{137}{2}{12}
{37}{13}
{27}{23}{17}{1}-{237}{7}-{123}{3}-{127}{17}{23}{27}-{13}{237}{1}{37}-{12}{2}-{137}12{I7I3I2I1}
{}{I7I3I2}{I1}{I7I3I1}{I2}{I7I2I1}{I3}{I7I3}{I2I1}{I7I2}{I3I1}{I3I2}{I7I1}{I7}-{I3I2I1}{I1}-{I7I3I2}{I2}-{I7I3I1}{I7I1}{I3I2}{I3I1}-{I7I2}{I3I2I1}{I7}{I2I1}-{I7I3}{I3}-{I7I2I1}13【例】购物篮分析支持度计数≥4转换为二元数据去除非频繁项组合产生候选2-项集,并计数按列求和,统计各数据项计数去除非频繁项14【例】购物篮分析支持度计数≥4组合产生候选3-项集(Fk-1
Fk-1)去除非频繁2-项集超集和非频繁项组合产生候选4-项集(Fk-1
Fk-1)去除非频繁2-项集超集和非频繁项15【例】购物篮分析支持度计数≥4置信度≥0.85生成规则提取关联规则16从频繁2-项集和频繁1-项集以及它们的支持度计数,【例】购物篮分析支持度计数≥4置信度≥0.85生成规则提取时,可先提取前件为2-项集,后件为1-项集的规则,如果置信度不满足要求,则不再提取前件为1-项集后件为2-项集的规则。17【例】购物篮分析支持度计数≥4置信度≥0.85生成规则提取时,可先提取前件为3-项集,后件为1-项集的规则,若置信度满足要求,才继续提取22形式的规则,否则向下剪枝;如果22形式的规则满足要求,才继续提取13形式的规则。18【例】购物篮分析支持度计数≥4置信度≥0.8519{I1,I2,I3,I7}{I1,I2,I3}→{I7}{I1,I2,I7}→{I3}{I1,I3,I7}→{I2}{I2,I3,I7}→{I1}{I3,I7}→{I1,I2}{I2,I7}→{I1,I3}{I1,I7}→{I2,I3}{I2,I3}→{I1,I7}{I1,I3}→{I2,I7}{I1,I2}→{I3,I7}{I7}→{I1,I2,I3}{I3}→{I1,I2,I7}{I2}→{I1,I2,I7}{I1}→{I2,I3,I7}
在格结构中,由这些关联规则向下衍生出来的规则,需要进行置信度阈值检验;【例】购物篮分析支持度计数≥4置信度≥0.85关联规则:
{I7}{I1},1.0
{I7}{I2},1.0{I1I2I3}
{I7},1.0{I1I3I7}{I2},1.0{I3I7}{I1I2},1.0{I2I3I7}{I1},1.0{I1I7}
{I2},1.0{I7}
{I1I2},1.0{I2I7}
{I1},1.0{I3I7}
{I1},1.0{I3I7}
{I2},1.020【例】购物篮分析WEKA运行结果1.I7/5==>I1/5<conf:(1)>lift:(1.38)lev:(0.12)[1]conv:(1.36)2.I7/5==>I2/5<conf:(1)>lift:(1.22)lev:(0.08)[0]conv:(0.91)3.I2/I7/5==>I1/5<conf:(1)>lift:(1.38)lev:(0.12)[1]conv:(1.36)4.I1/I7/5==>I2/5<conf:(1)>lift:(1.22)lev:(0.08)[0]conv:(0.91)5.I7/5==>I1/I2/5<conf:(1)>lift:(1.83)lev:(0.21)[2]conv:(2.27)6.I3/I7/4==>I1/4<conf:(1)>lift:(1.38)lev:(0.1)[1]conv:(1.09)7.I3/I7/4==>I2/4<conf:(1)>lift:(1.22)lev:(0.07)[0]conv:(0.73)8.I2/I3/I7/4==>I1/4<conf:(1)>lift:(1.38)lev:(0.1)[1]conv:(1.09)9.I1/I3/I7/4==>I2/4<conf:(1)>lift:(1.22)lev:(0.07)[0]conv:(0.73)10.I1/I2/I3/4==>I7/4<conf:(1)>lift:(2.2)lev:(0.2)[2]conv:(2.18)11.I3/I7/4==>I1/I2/4<conf:(1)>lift:(1.83)lev:(0.17)[1]conv
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026安徽第二医学院高层次人才招聘20人备考题库附参考答案详解(研优卷)
- 2026春季乐山市商业银行校园招聘100人备考题库含答案详解(培优b卷)
- 2026湖南益阳市市直医疗卫生单位招聘及引进紧缺(急需)专业人才39人备考题库及答案详解(夺冠)
- 2026浙江宁波市镇海区骆驼街道工作人员、行政村后备干部及农村社工招聘10人备考题库及参考答案详解(达标题)
- 2026湖南益阳市市直医疗卫生单位招聘及引进紧缺(急需)专业人才39人备考题库附参考答案详解(培优a卷)
- 2026内蒙古通辽市科尔沁左翼后旗招聘政府专职消防员29人备考题库及参考答案详解(预热题)
- 2026辽宁丹东市公安局招聘警务辅助人员282人备考题库含答案详解(达标题)
- 2026四川达州大竹县公安局招聘警务辅助人员18人备考题库参考答案详解
- 2026河南黄金叶投资管理有限公司所属企业大学生招聘29人备考题库(第一批次)附答案详解(培优b卷)
- 雨课堂学堂在线学堂云《食品研究生实验技能综合训练(江南)》单元测试考核答案
- 史上最全国家保安员资格考试复习题题库(十套)附答案
- 黑龙江省哈尔滨市哈工大附中2022-2023学年八年级物理第二学期期中经典模拟试题含解析
- 2023年大同煤炭职业技术学院单招考试职业技能考试模拟试题及答案解析
- 作者利益冲突公开声明
- 农药的环境毒理学案例
- 计算机网络性能指标
- SAS课件-第5讲-SAS的假设检验
- 《汽车专业英语图解教程》高职配套教学课件
- 尿素装置流程简述
- 工程保修期满通知书
- 增演易筋洗髓内功图说(校对勘误版)
评论
0/150
提交评论