SPSS关联模型步骤之欧阳与创编_第1页
SPSS关联模型步骤之欧阳与创编_第2页
SPSS关联模型步骤之欧阳与创编_第3页
SPSS关联模型步骤之欧阳与创编_第4页
SPSS关联模型步骤之欧阳与创编_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

欧阳与创编 欧阳与创编 2021.03.08欧阳与创编 欧阳与创编 2021.03.08SPSSClementines预测分析模型啤酒+尿片枚事的实现机理CT吏用11版本实现丿时间:2021.03.时间:2021.03.08创作:欧阳与SPSSClenmentines趕供次多的预测蟆熨,这便得它切可叹应用在多种商业领域中:如超市商品如何摆裁刁叹提高销量;分析商场菅销的打折方秦,叹制定新的更为有玫的方秦;保险公司分析叹注的理赔秦例,叹推曲新的保险品种等茅,具有很强的商业价值。超市典灵秦例如冋摆放超市的商品引导消费者购牛多从而提高銷量,这对大型连琐理市来说是〜个现实的菅销问题。灵联规则模灵目它诞主宅时为此类问题提供了〜种科学的解决方法。该模燹利用数据挖掘的技术,在海量数据中依据该模熨的独特算法发现数据內在的观律牲联菜,进而提供具有洞察力的分析解决方秦。通过—则超市销售商晶的秦洌,利用“灵联观则蟆熨:来分析商晶交易流水数据,叹具发现合理的商品摆魏规则,来帮助捉高销量。耒联规则简介关联规则的定义耒联观则表示不同数据项目在同〜事件中岀现的相关牲,就是从大量数据中挖掘岀灵联观则。有耒数据挖掘耒联规则的具体理论依据这里不做环细讲解,大家可叹参看韩家炜的数据挖掘概Y仑。为T更直观的理解灵联规则,费.切首先来看下面的场景。〜个市场分析人灵经常要考虑这样〜个问题:哪些商晶是频繁板顾客同时贝勾奚的?顾客1:牛奶+面包+谷类顾客2:牛奶+面包+糖+鸡蚕顾客3:牛奶+面包+黄油顾客4:糖+吗蚕叹上的情景类侬于当年沃尔玛做的市场调食:啤酒+尿岸摆放在同〜个货架上,銷售业绩激增的著名笑联观则应用。市场分析灵分析顾客贝勺买商品的场景,顾客朗奚面包同时迩会阳褰牛奶的朗牛多蟆玫就可用叹下的关联观则来描连:面包二>牛奶[支持度=2%,置愴度=60%]C玩1丿K1中面包是观则前项CAntecedent;,牛奶是观则Js^(Consequent)o实洌数fInstancesJ表示所有贝勾尖记录中包舍面包的记录的数量。支药度CSupport;表示贝勺尖面包的记录数占所有的购奚记录数的百分比。规则支扌守度CRuleSupport;表示同时阳與面包和牛奶的记录数占所有的胸买记录数的百分比。置信度CconfidenceJ表示同时贝勾與面包和牛奶的记录数占购奚面包记录数的百分尤。提升fLiftJ表乖置信度与巳知胸褰牛奶的百分比的坨值,提升大于1的规则才是有意义的。灵联规则K1的支苻度2%意味着,所分析的记录中的2%贝勺與T面包。置信度60%表明,翊奚面包的顾客中的60%也贝勾尖T牛奶。如果耒联满足最小支荷度阈值和最小置信度阈值,就疣秃联规则是有意义的。这些阈值可叹由用尸茨领域专家设定。就顾客胸牛多而言,根据叹注的胸奚记录,找凹满足最小支荷度岡值

和最小置信度風值的秃联规则,就找彩顾客经常同时此处迸行夷联观则应用巧叹茨用两种数据格天:1,交易数据格玩,2,表格格玫。交易数据格玩,2,表格格玫。CustomerlDITEMbreadjamjuicejammilkCustomerlDITEMbreadjamjuicejammilkCustomerlDbreadjamjuCustomerlDbreadjamjuicemilkice4 F F FT关联规则挖掘算法ApriorvCarma和序列节点是常用的关联规则挖掘算法,它切都可叹T更用交莎格玫和表格裕武:数据迸行挖掘处理。其中Aprior算法,处理速度快,对包舍的规则数坎有阻制,是〜种最有影响的挖掘耒联规则的方法。卒次试验将T更用SPSSClementine11自带的安装目录下的Demos文件夹下BASKETSIn据。希望分析岀哪些商品会和啤洒〜起翊奚,叹此来合理安排商晶的摆教,进而提高啤酒的销量。此数据属于表裕格玩数据,毎条记录表乖顾客的〜次购牛多。记录的字段包括卡号.顾客基本信息.疔款方玫和商晶名秫C参个商晶—个字段,该商晶字段TS为T,表示旳冥该商晶,值为F表示禾朗坯,具体可参考表2,表裕格玫数据丿。商晶名称fruitvegC水果蔬,菜丿,freshmeatC圭鲜肉丿,dairyC奶制晶丿,cannedvegC確装蔬菜丿,cannedmeatC確装肉丿,fozenmealC冻肉丿,beerC啤洒丿,wineC洒类丿,softdrink(钦坎丿,fishC鱼丿,confectioneryC舌甘食丿O首先打开Clementine,会岀现一张空白的流界面,这时用尸刁叹在里面角矍目己的流。弟一步,为流添力口〜个数据节点,这里逹撵Clementine自带的Demo数据。将界面下方逹项卡的“数据源''逹项中空r可变文件”扳放:彩空白界面中,双去打开,在文T牛逹项卡中Clementine自带的Demo数据BASKETSIn,如图所示。点去确定按麺,达时就庆功的创琨了数据节点。弟二步,为流添加类燹节点,类燹节点是显乖和设置数据每个字股的类燹.裕武:和角鱼。从界面下方的“字段逹项"卡中,将“类更"节庶抱放對界面中,接着将数据节点和类燹节点连接超来,茨者直接在“字股逹项”卡中双去“类熨''节庶,将两者连接起来。这时双去打开“类熨''节点,此时“类型"节鹿中显示了数据的字股和其类燹,庶去“类型"节点界面上的“读取负"按钮,这时会将数据节点中的数据读取过来。如下图所o接着可叹为参与購模的数据字段设置角匡,角鱼分“输入",“目标",“两看”和“无"。输入表示该字段可供矍模侯用,目标表示该字段为琨模的预测目标,两者表示该字段为布尔灵的输入字段,充表示该字段不参与燮複。Apriori节庶需要〜个茨多个输入字股和〜个茨多个目标字股,输入字段和输凹字股決须是符号熨字段。在此可叹逹撵—个更多个字段为目标字段,表明该複熨的预测目标字股;对于Apriori建模节点,乞可叹不设置目标字段,则霜要在矍模节点中设置“后项"。弟三步,为流添加邀滤节庶,密不参坊的字股排除在外。该步骤为可逹步骤。从“字段逹项"卡中逹撵“过滤"节点,养将其抱入彩界面中,将“邀滤"节点加入對流中。双去打开“IX滤"节点,在不参与琨模字股的爺买上点去,会曲现〜个红叉,表示该字段披葱滤掉T,不参与婕模,如图所乖。对于〜些与飓模笑菜不大的节鹿可叹将其过滤掉,兀如卡号"牲列.家乡和年龄字股。弟四步,有了这些前期的准备辽程,接下来就可叹开绐创疑耒联规则摟熨节点T,在此之前,让我芮先添加〜个图形节点 网络节点,婕云此节点的目的是为了让用尸首先可叹直观的看到商晶M间的耒联程度,有—个矮牲洪识。逹撵“图形"逹项卡中的“网络"节点,将此抱入界面,将“网络"节点加入流中,与“IX滤"节庶连接超来。双去打开网络节庶,在“字段"列表中逹撵添加字股,可叹将所有的商晶字段添加进来;也可叹鹿去“仅显示真值标志1将只显示那些“两者”的字段,如图所示。点去“逵项"卡,进入逹项设置,用尸可叹在此设置链接数量的显示纯围,不显乖一些链接数量低的链接,如图所乖。点去“运行"按麺,达时会圭庆〜个商品宅间耒联程度C链接数量丿的网络图,用尸可叹在下方的调节杆上调节链接数量的显示范围。上图中,线的粗细和漆炭代表联菜的强騎,刁叹直观的看對beer和frozenmeat,cannedeg联菜程度比较强。弟五步,添加“建模"节点彩流中,开始耒联观则蟆燹设置和侯用的篇章。首先点去界面下方“矍摟"逹项卡,再点去Apriori,节点抱放對界面中,连接该节点到辽滤节点上,茨者双去Apriori节点。接着段置Apriori节点的参数,飓云关联规则模型。双去打开Apriori节点,如下图所示。该“字段"逹项卡,是设置参坊燮模的字股和目标字段的,可叹看到基中包括两个逹项,“滾用类娶节庶设置"和“废用定制设置1这里将为用尸分列呈现两种逹项的废用方法。达里无7仑逹撵哪个逹项,都需要将市场分析员重庶灵注的商晶包括在其中,其他商晶刁叹不包括。如棗用尸逹撵“便用定制设置"逹顼,则霜要悟啤酒设置在“后顼”列表中,将其他重点笑注的商品设置在“前项”列表中,如下图所乖。这里,分区允许您废用指定字段将数据分割为几个不同的样茶,分列用于蟆燹构建辺程中的训练.测试和验证阶股。如棗设置了“分区",除了在此逹撵分区字段外,还需要在“模熨"逹项卡中,勾上“T更用分区数据"的逵撵框。耒于“分区"的擬念、年用和滾用方法,本文不做谆细介绍。除此,“便用事务处理格武/'逹撵框,是针对于事务性数据的,如棗数据为交易格武:,需要勾上此逹撵框,便茶示例的数据为表格格武:,欽充需逹撵。设置好了字段后,点去“摟型"逹项卡,进入模娶设置。如下图所示。用尸刁叹在“模熨名称"处为茶模燹设置〜个名字,如慕想废用分区功能,则需要勾上“T更用分区数据"逹项。用尸为观则摟峑设置〜个最低条件文持度,那么模熨将从所有规则中逹撵那些为真,养且其对应的记乗的百分坨大于此值的观则。如慕您荻得的观则适用于非常小的数据子集,请尝试增加此设置。接着,用尸需要为模熨设置—个最小规则置信度,M明正确预测的百分尤。置信度低于指定标准的规则将披放弃。如棗您获得的规则太多,请尝试增加此设置。如棗您获得的规则太少C甚至根卒无法获得规则丿,请尝试降低此设置。用尸还可叹为任阿规则指定“最大前项数"。达是一种用来阻制规则夏杂牲的方武:。如慕规则太夏杂夹者太具体,请尝试降低此瑕置。对于“仅包舍标志变量的真值"逹项,如果对于表格格玫的数据逹撵了此逵项,则在主庆的观则中只会岀现真值。达样T更得规则更容雾理解。该逹项不适用于事务格天的数据。为了提高燮複牲能,设置了“了尤丫匕"逵项供用尸逹撵。逹撵“速度''可指示第法从不便用磁盘溢岀,叹便提高牲能。逹撵“內存"可指示算法在合适的时候,叹牺牲某些速度为代价便用磁盘溢岀。接下来,进入“专家"逹项卡,对于〜般用尸,则逹撵“简单”逹项;而对于高级用尸,则可叹通辽此页面迸行微调,如下图所示。此时,我芮旦经创琨好了■秃联观则模燹的整个流,点去工具栏的绿鱼爺买,运行该流,会生庆〜个“模更"节点,该节鹿里包舍了模熨运行结棗。整个运行后的流图,如下图所示。弟六步,在得對了运行结棗后,费双去打开主庆的“模壑”节点,鹿去“显示/隐藏标准菜单"下扌丘框,逵撵“显示所有",结棗如下图所示。从结果刁叹看岀,通辽秃联观则模灵挖掘曲了三个规则,分別是规则―,朗奚了冻肉CfrozenmealJ和罐装蔬菜fcannedvegj的顾客都会贝勺奚啤洒fbeerj;其中,弟〜列T弋表结棗,而下—列代表条件,后面的列包舍观则信良,如置信度.支持度和提升等。旳冥了冻肉和罐装疏菜的顾客会贝勺與啤酒,此规则中贝勾與T冻肉和罐装疏菜的记录有173条,S17.3%。而在购奚T冻肉和罐装疏菜的顾客中会有84.393%的顾客会贝勾坯啤洒,养且提升为2.88,表明此规则的相笑性很强,郃署能力和置信度类侬,可叹不考虔。通过对规则信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论