大型超市购物篮问题

上传人：6*** IP属地：湖北上传时间：2022-03-09 格式：DOC 页数：20 大小：407.40KB 积分：30 举报 版权申诉

已阅读5页，还剩15页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、大型超市“购物篮”分析摘要本文通过对大型超市“购物篮”的分析，运用Apriori算法的思想，做出相应的改进，利用支持度和置信度的大小进行一定程度的筛选，结合商品的利润大小，引入促销系数，通过促销系数的比较，得到科学的商品组合情况，设计一定的商品促销手段，实现超市效益的进一步增大。对于问题一，我们参考了一种最有影响的挖掘布尔关联规则频繁项集的算法Apriori算法。用matlab编程，得到每两个商品同时出现的个数，并求得它们的支持度和相互的置信度，设定最低支持度为5%，得到符合的两种商品组合数为17组。设定最低置信度为20%，对17组数据进行筛选，得到12组商品组合。最后通过关联密切系数的大小

2、，得到了12组商品组合彼此关联关系的密切程度。对于问题二，仅考虑商品支持度的大小，求得在一定最小支持度下被频繁地同时购买的商品组合。用matlab编程，设置最小支持度为2.12%，筛选两个商品组合时，我们得到了1391种组合方式，在此基础上筛选三个商品组合时，我们得到了40种组合方式；再继续筛选四个商品组合得到35种，最后筛选五个商品得到一种组合，六个商品组合时则没有出现大于最小支持度的组合方式。因此，我们得到了尽可能多的商品被频繁同时购买的信息。对于问题三，在结合商品利润的条件下，引入促销系数H，考虑1391个两种商品组合中各商品的利润、支持度和置信度，分别计算出三者的乘积之和进行比较。选取

3、促销系数H较高的组合商品采取就近摆放、打折促销、消费送礼等捆绑销售方式得到一种促销方案，使得超市的效益进一步增大。关键词：购物篮分析、Apriori算法、促销系数一、问题重述作为超市的经理，经常关心的问题是顾客的购物习惯。他们想知道：“什么商品组或集合顾客多半会在一次购物时同时购买？”。现在假设你们是某超市的市场分析员，已经掌握了该超市近一个星期的所有顾客购买物品的清单和相应商品的价格，需要你们给超市经理一个合理的“购物篮”分析报告，并提供一个促销计划的初步方案。问题一：附件1中的表格数据显示了该超市在一个星期内的4717个顾客对999种商品的购买记录，对数据进行分析，试建立一种数学模型，使

4、该模型能定量表达超市中多种商品间的关联关系的密切程度。问题二：根据问题1建立的模型，通过一种快速有效的方法从附件1中的购买记录中分析出哪些商品是最频繁被同时购买的，找到的最频繁被同时购买的商品数量越多越好。问题三：附件2给出了这999中商品的对应的利润，根据在问题1、问题2中建立的模型，设定一种初步的促销方案，使超市的效益进一步增大。二、模型的假设1、假设各个商品的利润保持不变。2、假设表格中的数据能真实地反映当地消费者的购物情况。3、假设短时间内商品的销售情况维持稳定，不会出现大幅波动。三、符号说明符号解释说明si组合i的支持度c(A=>B)规则A=>B的置信度c(B=>A

5、)规则B=>A的置信度ci 组合i的平均置信度smin最小支持度cmin最小置信度关联密切系数H促销系数四、问题分析本题是关于大型超市“购物篮”的分析问题，涉及到数据挖掘、关联规则等相关问题。本题的三个问题是层层递进的关系，要求通过对商品购买数据的分析，找到关联程度较高且购买次数较高的商品，最后设计出合理的超市促销方案。问题一，由于购物篮分析是关联规则挖掘的一个典型案例，因此我们采用一种最有影响的挖掘布尔关联规则频繁项集的算法Apriori算法。利用其基本思想，进行了商品两种之间的支持度和置信度计算，在定义最小支持度和最小置信度后，进行筛选得到关联规则集。为定量地表达超市中多种商品间的关

6、联关系的密切程度，本文引入一个关联密切系数进行衡量分别对12个组合求解平均置信度,进而得到该组的关联密切系数。由此认为，关联密切系数越大的商品组合，其关联关系密切程度较高。问题二，在得到商品两种关联数据的基础上，仅考虑商品支持度的大小，求得在一定最小支持度下被频繁地同时购买的商品组合。同时为使商品数量尽量多，我们在两种组合的情况下延伸至三种组合，四种组合以此得到尽可能多的商品被频繁同时购买的信息，尽量靠近最频繁被同时购买且商品数量越多的双重目标。问题三，在结合商品利润的条件下，考虑两种组合中各商品的利润、支持度和置信度，分别计算出三者的乘积再求和，记为促销系数H，并以此作为衡量此组合商品是否进

7、行促销的标准。当结果较高时，我们就采取就近摆放、打折促销、消费送礼等捆绑销售方式式得到一种促销方案，在方便顾客的购买的同时，增加消费者对该超市的有好感和信任度，最终使得超市的效益进一步增大。五、模型的建立和求解模型一：基于Apriori算法的关联规则挖掘模型1. 模型的准备设: I= i1,i2.,im 是所有项目的集合. D是所有事务的集合(即数据库), 每个事务T是一些项目的集合, T包含在D中, 每个事务可以用唯一的标识符TID来标识.设X为某些项目的集合,如果X包含在T中,则称事务T包含X,关联规则则表示为如下形式(X包含在T)=>(Y包含在T)的蕴涵式,这里X包含在I中, Y

8、包含在I中,并且XY=.其意义在于一个事务中某些项的出现,可推导出另一些项在同一事务中也出现(为简单化,将(X包含在T)=>(Y包含在T)表示为X=>Y,这里,=> 称为关联操作，X称为关联规则的先决条件,Y称为关联规则的结果). 事务数据库D中的规则X=>Y是由支持度s（support）和置信度c(confidence)约束,置信度表示规则的强度, 支持度表示在规则中出现的频度。数据项集X的支持度s(X)是D中包含X的事务数量与D的总事务数量之比, 但为下文便于叙述, 数据项集X的支持度是用数据库D中包含X的数量来表示; 规则X=>Y的支持度s定义为: 在D中包

9、含XY的事务所占比例为s%, 表示同时包含X和Y的事务数量与D的总事务量之比。用该项集出现的次数除以TID总数即可得到，用如下公式表示：Support(X)=Count(X)/Count(TID) 规则X=>Y的置信度c定义为: 在D中,c%的事务包含X的同时也包含Y, 表示D中包含X的事务中有多大可能性包含Y. 依据所求的频繁项集，及所求得的支持度，运用如下公式求解：Confidence(X=>Y)=Support(XY)/Support(X) 最小支持度阈值minsupport表示数据项集在统计意义上的最低主要性. 最小置信度阈值mincontinence表示规则的最低可靠性.

10、如果数据项集X满足X.support>=minsupport, 则X是大数据项集. 一般由用户给定最小置信度阈值和最小支持度阈值.置信度和支持度大于相应阈值的规则称为强关联规则, 反之称为弱关联规则. 发现关联规则的任务就是从数据库中发现那些置信度、支持度大小等于给定值的强壮规则. 基于上述概念，我们可以很容易得到一些基本结论: (1) K维数据项集XK是频繁项集的必要条件是它所有K-1维子项集也为频繁项集，记为XK-1（2）如果K维数据项集XK的任意一个K-1维子集XK-1，不是频繁项集，则K维数据项集XK本身也不是最大数据项集。 (3) XK是K维频繁项集，如果所有K-1维频繁项

11、集集合XK-1中包含XK的K-1维子项集的个数小于K，则XK不可能是K维最大频繁数据项集。证明: 很明显，数据项集XK-1:的K-1维子项集的个数为K-1。如果高频繁数据项集XK-1，中包含XK的K-1.维子项集的个数小于K，则存在XK的K-1维子项集不是频繁数据项集，由结论(2)知K维数据项集本身也不是高频繁数据项集。 2、模型的建立（1）求关联规则集第一步：从事务数据库D中找出所有支持度不小于指定的最小支持度阈值的频繁项集。第二步：使用频繁项集产生所期望的关联规则，产生关联规则的基本原则是其置信度不小于指定的最小置信度阈值。第一步的任务是迅速高效地找出D中全部的频繁项集，这是关联规则挖

12、掘的核心问题，是衡量关联规则挖掘算法的标准。对此，我们运用Matlab进行编程得出计算结果。第二步的求解比较容易和直接，先分别计算出不小于最小支持度的商品组合对应的置信度，降序后进行筛选。最后只留下支持度和置信度都较高的商品组合。此建模过程可以表示为：图1 关联规则挖掘模型示意图（2）关联关系的密切程度表示对商品组合数据的挖掘结果进行整理，得到关联规则表格，再利用表格中各商品组合对应的支持度和平均置信度表示组合的关联关系。例如：在组合i中，有两个编号分别为、的两个商品，其支持度为，平均置信度为，则该组合的关联关系可以表示为（）.为定量表达超市中多种商品间的关联关系的密切程度，我们引入一个关

13、联密切系数来衡量，我们认为当支持度和置信度分别大于距离最低支持度和最低置信度时，其距离越远，关联程度越高，于是得到其公式为：其中，为组合i的支持度，为该组合的平均置信度,和分别为该类组合的最小支持度和最小置信度。用图表示为：图2 关联密切系数示意图将12组商品组合的支持度和平均置信度带入关联密切系数的公式中进行计算，将所得数据列表降序排列，关联系数越大的商品组合的关联关系的密切程度越大。3、模型的求解对于问题1：（1）将最小支持度设定为5%，从4717个原始数据项中得到个数为17的频繁项集。按支持度降序排列后，依次编号，整理得到表1：表1 两种组合频繁项集表组合i编号A编号B支持度1368

14、5290.07079270923688290.0663416732173680.06167867743684890.06167867753686820.06125476963684190.05701568573689370.05553200583686920.05532005193685100.055108097103689140.054896142115296920.054472234125298290.054048326133687200.0527766144385290.051716829152175290.051292921166928290.051080967174198290.05

15、023315对由上表得到的数据，分别计算各个组合相互的置信度，并将最小置信度设定为20%，剔除部分数据后得到关联规则集。再对数据列表的s(A=>B)进行降序处理，重新编号后得到表2：表2 关联规则表组合i编号A编号B支持度s置信度c(A=>B)置信度c(B=>A)12173680.0616786770.3112299470.21748878926928290.0510809670.2960687960.21849501434385290.0517168290.2867215040.2240587742175290.0512929210.2588235290.22222222

16、254198290.050233150.2513255570.2148685463685290.0707927090.2496263080.30670339875296920.0544722340.2359963270.31572481685298290.0540483260.234159780.2311876793688290.066341670.2339312410.283771532103684890.0616786770.2174887890.328442438113686820.0612547690.2159940210.352869353123684190.0570156850.2

17、010463380.285259809 最后留下的12个支持度和置信度都较高的商品组合即为关联规则集。（3）为定量地表达超市中多种商品间的关联关系的密切程度，分别对12个组合求解平均置信度,进而得到该组的关联密切系数。如表3所示：表3 关联密切评定表组合i编号A编号B支持度平均置信度关联密切系数12173680.0616786770.2643593680.06541039526928290.0510809670.2572819050.05729210334385290.0517168290.2553901370.05541673742175290.0512929210.2405228760.

18、04054349754198290.050233150.2330970490.0330978763685290.0707927090.2781648530.08088313175296920.0544722340.2758605710.07599228485298290.0540483260.2326737250.03292356793688290.066341670.2588513860.061078113103684890.0616786770.2729656140.073894332113686820.0612547690.2844316870.085178516123684190.05

19、70156850.2431530730.043719648对于问题2：本题要求最频繁被同时购买、商品数量越多越好的商品组合。由支持度的定义可知，某商品组合的支持度越高，表示该组合越频繁被同时购买。我们采用问题一中的数据，将所筛选出的商品种类选出，与上述两种商品的组合进行匹配，去掉重复项，得到三种商品组合，挑选出满足支持度support的组合。同样进行满足支持度的四种商品、五种商品、六种商品的选择依次循环直到没有符合最低支持度的组合程序结束。以此进行matlab编程，见附录。（1）我们设定support为2.12%，得到1391种组合，在问题一中我们列出了其中一些组合。（2）对于三种商品组合

20、符合support为2.12%的组合数为40个，由于版面限制，以下列出频繁项集为最高的15种组合：表4 三种组合频繁项集表组合i编号A编号B编号C次数支持度13684896821240.02628789524135389561220.02586389734245727971160.02459190244135387971150.02437990254135729561140.02416790364137979561140.02416790375387979561140.02416790384134249561130.02395590494138269561120.023743905104245

21、729561120.023743905115387978261110.023531906125388269561110.023531906135727979561110.023531906147978269561110.023531906154135727971100.023319907（3）四种商品组合有35种，以下频繁项集为前15种：表5 四种组合频繁项集表组合i编号A编号B编号C编号D次数支持度14134245729561070.02268390924135727979561070.02268390934245727979561070.0226839094413424797956106

22、0.02247191054135387978261060.02247191064135387979561060.02247191074137978269561060.02247191084134245387971050.02225991194134245727971050.022259911104134247978261050.022259911114135385729561050.022259911124135388269561050.022259911134135728269561050.022259911144245385727971050.02225991115538797826956

23、1050.022259911(5) 由编程得出的结果中，五种商品组合的结果只有一个。编号分别为413、424、538、572、797，重复次数为102，支持度为2.12%。六种商品组合没有符合的结果。从五种组合的数据来看，我们有理由认为表5中所列出的四种商品组合和编号分别为413、424、538、572、797的五种组合即为所求的最频繁被同时购买、商品数量多的商品组合。在实际应用中，对于不同的超市，其要求的支持度support不同，可自行设置。模型二：效益最大化模型1、模型的建立为使超市的效益尽可能增大，必须同时考虑两个因素：（1）频繁被同时购买的商品组合；（2）对应商品组合的利润是否最高

24、。由第一个基于Apriori算法的关联规则挖掘模型可以得到，频繁被同时购买的两种商品组合数据。为衡量这些组合的效益，本文引入了促销系数：其中，为组合i中商品的利润之和。对于问题3：第一步：利益最大化模型只考虑两种组合的情形，分别计算表1中17个组合的促销系数，并将得到的结果进行降序排列，得到表6：表6 两种组合促销系数表组合编号A编号B支持度置信度A=>B置信度B=>A利润和促销系数H13685290.0707927090.2496263080.306703398575.9522.683264925296920.0544722340.2359963270.31572481655

25、7.5616.756620133688290.066341670.2339312410.283771532479.6416.4733636443684190.0570156850.2010463380.285259809587.9316.3015810254385290.0517168290.2867215040.22405877559.8214.7881693466928290.0510809670.2960687960.218495014461.2512.1236873475298290.0540483260.234159780.23118767473.7711.9159080484198

26、290.050233150.2513255570.21486854485.7511.3754868393686820.0612547690.2159940210.352869353315.25910.9853873103684890.0616786770.2174887890.328442438296.11889.971005752112173680.0616786770.3112299470.217488789296.11889.656633102122175290.0512929210.2588235290.222222222290.24887.161669045 由上表可以得出，编号为5

27、29的商品可以和368,692,428,829,217摆放在一起，368可以和529,892，419,682,489,217摆放在一起。为了更好的说明商品的摆放顺序，作图2，其中方框中的数字表示商品编码，直线上的数字表示该直线两端商品组合的促销系数。图2 促销关系网络示意图由图2可直观看出，编号为368的商品应优先考虑和529摆放一起，再考虑和829一起。编号为529的商品再和692一起在实际情况中，即可操作为，将829,368,529,692放在同一货架上，其他的放在临近货架，并根据实际情况进行调整。第二步：打折促销由第一步可以获得利润高又频繁被同时购买的商品组合，为方便顾客选购同时提高超

28、市的利润值，我们决定将这些商品组合摆放在相同或相近货架上，采取“捆绑”销售的理念，进行打折促销。首先找出符合以下要求的组合：若一个商品组合中有一个利润较大，我们可以对此商品进行打折，其他商品价格不变。经过多次进行市场实践调查，得到当打折为f（i）的时候可以得到最大的利润，那么f（i）就是我们需要的打折数据。以表格X中组合（X,Y）为例，在促销过程中，我们可以对利润较高的编号为X商品打折f（i），保持Y商品价格不变。第三步：提高最低消费为降低部分顾客只购买打折商品的发生几率，超市可以先统计出该购物群体绝大多数的消费水平，将其上调部分后，配合同时期的打折活动推出购满上调后金额赠送小礼品的活动。例如

29、该购物群体每次消费在6080元之间占绝大多数，基于此信息采取购满88元返券、满88元加1元赠送抽纸一包的促销措施来提高销售量；基于大多数人贪小便宜的消费心理，很多消费者会选择购满88元。这些措施不仅使得顾客的交叉消费大为提高，还能提升顾客对超市的满意度，增加再次光临选购的几率。七、模型评价对于问题一的数据挖掘问题，通过分析每个数据，从大量数据中寻找其规律的技术，我们采用Apriori算法的思想，经过一定程度的改进，进行了运用。优点：（1）作为一个迭代算法，使用Apriori性质来生成候选项集的方法，得到所有大于等于最小支持度的频繁项目集，大大压缩了频繁集的大小，取得了很好的性能。最终得到

30、的程序解决所给问题只需40s，而且可以表示出满足条件的商品个数及其种类。有助于超市经理进行“购物篮”分析并做出相应的促销方案。（2）Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法，改进后的Apriori算法更适用于适合事务数据库的关联规则挖掘。（3）该算法结构简单,易于理解,没有复杂的推导。缺点：（1）对数据库的扫描次数过多。该算法需要在每进行一次迭代的时候扫描一次数据库,一般挖掘出的最大频繁项集的长度为N时,需要扫描N次数据库,而在实际应用中经常需要挖掘很长的模式,多次扫描数据库带来巨大开销，且效率较低。（2）Apriori 算法可能产生大量的侯选项集。Apri

31、ori算法在迭代过程中要在内存中产生,处理和保存候选频繁项集,这个数量有时候是非常巨大的,导致算法在广度和深度上的适应性很差。（3）程序不利于非编程人员的直接调用和使用。改进：可以将程序进行打包，增加其可视化的方面，利于非编程人员的直接使用对于问题一中关联密切程度系数公式的引入，我们认为它的优点是能够反映支持度越高、置信度越高，则关联密切程度越高。缺点是该公式缺乏一些实践检验。对于问题三的促销方案，我们引入的促销系数综合权衡了置信度、支持度和利润对促销方案的确定的影响。在一个商品存在和多种商品同时关联程度较高时，我们要对这多种方案进行比较。单独考虑其商品组合的利润大小是不合理的，可能消费者的

32、购买程度不频繁。同样的，单独考虑其商品组合的支持度也是不合理的，可能两件商品的购买次数都较频繁，但是其置信度又不够高，即购买其中一件商品后再购买另一件商品的人数不够多。若置信度、支持度和利润这三个因素中某一因素趋近于0，则方案不合适。只有三者乘积较高的方案可以考虑摆在一起进行促销。利用商品的合理摆放和某种利润较高商品适当降价等促销手段可以使商场的利润更大，效益更好。故引入促销系数使促销方案更合理更完善。八、参考文献1周涛，陆惠玲.关联规则挖掘算法研究N.齐齐哈尔大学学报，20049（3）.2Agrawal R，Srikant R.Fast algorithms for mining assoc

33、iation rulesCIn Proceeding of the 20th International Conference on Very Large Databases1994, 487-499.3李新征.一种新的高效Apriori算法.D：湖南：长沙理工大学通信与计算机学院，2007:14.4丁侃.Apriori算法改进及实现D.陕西汉中：陕西理工学院数学与计算机科学系，2005.5刘锡铃.关联规则挖掘算法及其在购物篮分析中的应用研究.D苏州：苏州大学计算机应用技术系，2009：3639.9、附录附录一：Matlab程序满足支持度的单商品、两种商品组合、三种商品组合、四种商品组合t

34、icdata1=textread('附件1.txt');Value_supt=100; %两商品支持度阙值data=zeros(4718,999); %0-1矩阵for i=1:4718 for j=1:72 if data1(i,j)=0 continue; end data(i,data1(i,j)=1; endend %C1满足置信度的组合B1=zeros(999,2);for i=1:999 B1(i,1)=i;endfor i=1:4718 for j=1:999 if data(i,j)=1 B1(j,2)=B1(j,2)+1; end endendt=1;for

35、i=1:999 if B1(i,2)>Value_supt C1(t,:)=B1(i,:); t=t+1; endend %B2满足置信度的单价商品所构成的两件商品组合n=size(C1,1);n2=0;t=1;n3=n*(n-1)/2;B2=zeros(n3,3);for j1=1:n-1 for j2=j1+1:n for i=1:4718 if data(i,C1(j1,1)=1&data(i,C1(j2,1)=1 n2=n2+1; end end B2(t,1)=C1(j1,1); B2(t,2)=C1(j2,1); B2(t,3)=n2; n2=0;t=t+1; end

36、end %C2满足置信度的2件商品组合a=find(B2(:,3)>Value_supt);n4=size(a,1);C2=zeros(n4,3);t=1;for i=1:n3 if B2(i,3)>Value_supt C2(t,1)=B2(i,1); C2(t,2)=B2(i,2); C2(t,3)=B2(i,3); t=t+1; endend %B3满足置信度的2件商品组合成的3件商品b=unique(C2(:,1,2);n=size(b,1);n1=size(C2,1);n2=0;t=1;n3=n1*n;B3=zeros(n3,4); for j1=1:n1 for j2=

37、1:n for i=1:4718 if data(i,C2(j1,1)=1&&data(i,C2(j1,2)=1&&data(i,b(j2)=1&&b(j2)=C2(j1,1)&&b(j2)=C2(j1,2) n2=n2+1; B3(t,1)=C2(j1,1); B3(t,2)=C2(j1,2); B3(t,3)=b(j2); end end B3(t,4)=n2; n2=0;t=t+1; endend %C3满足置信度的3件商品a=find(B3(:,4)>Value_supt);n4=size(a,1);C3=zeros

38、(n4,4);t=1;for i=1:n3 if B3(i,4)>Value_supt C3(t,1)=B3(i,1); C3(t,2)=B3(i,2); C3(t,3)=B3(i,3); C3(t,4)=B3(i,4); t=t+1; endend %B4满足置信度的3件商品组合成的4件商品b4=unique(C3(:,1,2,3);n=size(b4,1);n1=size(C3,1);n2=0;t=1;n3=n1*n;B4=zeros(n3,5); for j1=1:n1 for j2=1:n for i=1:4718 if data(i,C3(j1,1)=1&&da

39、ta(i,C3(j1,2)=1&&data(i,C3(j1,3)&&data(i,b4(j2)=1&&b4(j2)=C3(j1,1)&&b4(j2)=C3(j1,2)&&b4(j2)=C3(j1,3) n2=n2+1; B4(t,1)=C3(j1,1); B4(t,2)=C3(j1,2); B4(t,3)=C3(j1,3); B4(t,4)=b4(j2); end end B4(t,5)=n2; n2=0;t=t+1; endend %C4满足置信度的4件商品a=find(B4(:,5)>Value_supt

40、);n4=size(a,1);C4=zeros(n4,5);t=1;for i=1:n3 if B4(i,5)>Value_supt C4(t,1)=B4(i,1); C4(t,2)=B4(i,2); C4(t,3)=B4(i,3); C4(t,4)=B4(i,4); C4(t,5)=B4(i,5); t=t+1; endend toc附录二：将三种物品组合中重复情况筛选掉tic%将所需筛选的矩阵赋值给A A=Cn%3物品 1次数A=C3;k1=0;k2=0;k3=0;n3=120; %增添kn，修改n3值 %n3为矩阵的行数for i1=1:n3-1 for j=i1+1:n3 k1=

41、ismember(A(i1,1),A(j,1:3);% 扩展kn 1:n if k1=1 k2=ismember(A(i1,2),A(j,1:3); if k1=1&&k2=1 k3=ismember(A(i1,3),A(j,1:3); if k1=1&&k2=1&&k3=1 A(j,4)=0; %扩展时该项需修改 end end end k1=0;k2=0;k3=0;%增加kn endend toc %CCn筛选后的矩阵a=find(A(:,4)=0);n4=size(a,1); %A(:,n)C3=zeros(n4,4);t=1; %Cn 定

42、义矩阵大小for i=1:n3 if A(i,4)=0 C3(t,1)=A(i,1);%Cn 增添项 C3(t,2)=A(i,2); C3(t,3)=A(i,3); C3(t,4)=A(i,4); t=t+1; endend附录三：将四种物品组合中重复情况筛选掉tic%将所需筛选的矩阵赋值给A%4物品 1次数%n3为矩阵的行数 A=C4;%赋值C4k1=0;k2=0;k3=0;k4=0;n3=420; %增添kn,for i1=1:n3-1 for j=i1+1:n3 k1=ismember(A(i1,1),A(j,1:4);%1:n if k1=1 k2=ismember(A(i1,2),A

43、(j,1:4); if k1=1&&k2=1 k3=ismember(A(i1,3),A(j,1:4); if k1=1&&k2=1&&k3=1 k4=ismember(A(i1,4),A(j,1:4); if k1=1&&k2=1&&k3=1&&k4=1 A(j,5)=0; %扩展时该项需修改 end end end end k1=0;k2=0;k3=0;k4=0; endend toc %CCn筛选后的矩阵a=find(A(:,5)=0);n4=size(a,1);C4=zeros(n4,5);

44、t=1; for i=1:n3 if A(i,5)>Value_supt C4(t,1)=A(i,1); C4(t,2)=A(i,2); C4(t,3)=A(i,3); C4(t,4)=A(i,4); C4(t,5)=A(i,5); t=t+1; endend附录四：计算满足置信度的五种商品组合%B5满足置信度的4件商品组合成的5件商品ticb5=unique(C4(:,1,2,3,4);n=size(b5,1);n1=size(C4,1);n2=0;t=1;n3=n1*n;B5=zeros(n3,6); for j1=1:n1 for j2=1:n for i=1:4718 if da

45、ta(i,C4(j1,1)=1&&data(i,C4(j1,2)=1&&data(i,C4(j1,3)&&data(i,C4(j1,4)=1&&data(i,b5(j2)=1&&. b5(j2)=C4(j1,1)&&b5(j2)=C4(j1,2)&&b5(j2)=C4(j1,3)&&b5(j2)=C4(j1,4) n2=n2+1; B5(t,1)=C4(j1,1); B5(t,2)=C4(j1,2); B5(t,3)=C4(j1,3); B5(t,4)=C4(j1,4); B5(t,5)=b5(j2); end end B5(t,6)=n2; n2=0;t=t+1; endend %C5满足置信度的5件商品a=find(B5(:,6)>Value_supt);n4=size(a,1);C5=zeros(n4,6);t=1;for i=1:n3 if

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大型超市购物篮问题

文档简介

温馨提示

最新文档

评论

大型超市购物篮问题

文档简介

温馨提示

最新文档

评论

相关文档