组王越胡冠宇吴尚益2013数模训练2网络购物分析_第1页
组王越胡冠宇吴尚益2013数模训练2网络购物分析_第2页
组王越胡冠宇吴尚益2013数模训练2网络购物分析_第3页
组王越胡冠宇吴尚益2013数模训练2网络购物分析_第4页
组王越胡冠宇吴尚益2013数模训练2网络购物分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2013年数模训练1投资计划问题 组号:18 成员:王越 胡冠宇 吴尚益目录摘 要5一、问题重述5二、模型假设6三、符号说明6四、问题分析7五、模型的建立8(一)幼牛及产奶牛数量情况分析8(二)甜菜及粮食种植情况分析10(三)农场生产成本分析11(四)农场生产利润分析12(五)线性规划模型14六、单个变量灵敏度分析15六、模型优缺点及改进方向18(一)模型优势18(二)模型缺陷18(三)改进方向18七、参考文献18八、附 录192013年训练题1:投资计划问题摘 要 本文通过matlab软件对网购销售数据进行了处理以及分析,解决了网购网站销售产品的问题。 由于本题中的数据量极其庞大,本文先通过

2、excel对数据进行初步处理,然后运用matlab软件对数据进行了优化,得出了999件商品的01销售表。01销售表为本文分析的基础数据,本文的相关数据分析均给予基于商品销售0-1销售表。 第一问中,本文基于关联规则对相关性进行了阀值分析,然后通过枚举法对本文的两两关联度进行了分析,同时挑出了其中关联度以及被购买数较多的数据进行了聚类分析得出了相应的相似度的有关结果。 第二问中,本文基于第一问的结果以及特征商品对多个商品直接的关联度进行了分析,同样的运用matlab软件对数据进行枚举分析,得出相关度较高的组别。 最后,在第三问中,本文选取了前两问关联度分析中的二维、三维以及四维数据对不同商品组合

3、之间的利润进行了运算。同时运用相应的评价规则对商品的可行促销方案进行了分析,得出了相应可行且利润较优的促销方案. 总体而言,本文通过matlab以及spss等数学统计软件运用关联规则以及穷举法解决了网购网站商品购买关联度以及促销的问题,在一定程度上为网购网站的经营提出了一定的方案。一、问题重述如今,“网购”已成为人们生活的一部分。由此成就了一批优秀的购物网站,如天猫,京东,当当,亚马逊等。在购物的同时,人们的购物记录被保留在网站数据库内。网店老板经常关心的问题是顾客的购物习惯。他们想知道:“什么商品组或集合顾客会在一次购物时同时购买”。 他们可以把这些“同类商品”相互关联在网页内,以便于顾客浏

4、览商品,引导顾客消费,进而增加销量。已知某购物网站一段时期所有顾客购买物品的清单和相应商品的利润,需要你们给网店老板一个合理的顾客购物习惯分析报告,并提供一个促销计划的初步方案。问题1 附件 1 中的表格数据显示了该网站主要购物数据,一段时期内4625个顾客对999 种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的网站内部编号。试建立一种数学模型,该模型能定量表达网站中多种商品间的关联关系的密切程度。问题2 根据你们在问题1中建立的模型,寻找一种快速有效的方法能从附件 1 中数据分析出哪些商品是最频繁被同时购买的。网站老板希望得到尽可能多的商品被频繁同时购买的信息,

5、所以你们找到的最频繁被同时购买的商品数量越多越好。例如:如果商品 1、商品 2、商品 3,商品 4 在 4625 个购物记录中同时出现了 200 次,则可以认为这三个商品同时频繁出现了 200 次,商品数量是4。问题3 附件 2 给出了这 999 中商品的对应的利润,试根据你们在问题1、问题2中建立的模型,给出一种初步的促销方案,使购物网站的效益进一步增大。二、模型假设1题目给出的统计数据真实有效。4短时间内商品的销售情况不变。3表格中的数据能真实有效地反映当地消费者的购物情况。2问题三中,各个商品的利润保持不变。三、符号说明:(未列出符号将在文中进行进一步说明)n 消费者的数量人i是否购买了

6、商品j。1购买 0未购买对第i个消费者的消费行为的描述第j种商品被n个消费者购买的情况j、k两种商品的相关性(是对商品j 和k 有相同购买行为的消费者在总共n 个消费者中所占的比例)在购买了商品j 和k 中至少一种的消费者中,同时购买了两种产品的比例=1-差异性的距离度量包含了p 个不同的商品的第一小类包含了另外q个不同商品的第二小类小类AB之间的距离四、问题分析问题一:问题一本质为商品分类问题,本题中我们设定的商品分类标准为其关联度属性。本次试验,我们运用聚类分析与apriori算法相结合的方式,采用商品支持度来度量商品关联度。进而定义商品类别之间的距离,从而进行分组聚类,描述商品的关联度。

7、问题二:本题中,对问题一模型进行了简化和修改,利用穷举法对于两种商品组合、三种商品组合、四种商品组合购买人数进行筛选。其中在三种和四种商品购买人数测定过程中,设计阀值,利用两种商品组合购买人数额分析结论,确定频繁项组,以此减少循环次数,保证程序的可执行性。问题三:利用商品组合方案,计算商品组合利润,寻求利润最大、销量最大的最优商品组合。同时,结合单位商品利润,制定相关促销方案。5、 模型的建立问题一:基于0-1 变量的聚类方法apriori算法改良:本题中,我们将购物篮中商品的相关性予以分析,并根据其相关性的大小予以聚类。 1、数据优化 我们关注于p 种不同产品的相关性。我们用向量描述第i个消

8、费者某次购买行为。其中,若第i 位消费者购买第j 种商品,记=1;否则=0。若消费者总数为n,则定义向量刻画第j种商品被n个消费者购买的情况。若由大量的1 构成,j商品被消费者购买的频率很高。 为了刻画多种商品的关联度,我们定义支持度 及信度 支持度 :表示对商品j 和k 有相同购买行为的消费者在消费者总数中的占比。若值很大,说明商品j 和k 具有强相关性,应被聚为一类,否则说明相关性较弱。信度描述消费者i购买j或k的前提下同时购买j、k商品的条件概率。指标 度量消费者一旦决定购买商品j 或k后,购买j、k两种产品可能性的大小;若较大,则j、k两种商品的相关性很大,应被聚为一类;否则这两种商品

9、的相关性很小。根据关联度的度量,定义距离=1-来获得关于差异性的距离度量,即相关性越大,距离越小。上述的距离定义仅仅适用于两种具体的商品。在分层聚类的过程中,距离最近的,相似性最强的商品被首先聚为个各“小类”。在此基础上,再将相似的“小类”聚为“大类”。本题中,我组采用平均链接法定义“类”与“类”之间的距离。假设我们有两个“小类”,记为:和。即:第一个“小类”中总共包含了p 个不同的产品,而第二个“小类”中包含了另外q 种产品。平均链接法: 利用距离和关联度两个指标,建立模型得出数据,即可定量表达网站中多种商品间的关联关系的密切程度。第二问:利用matlab编程(程序见附录)对优化后的购买数据

10、进行聚类分析,结果如下:1、两种商品组合购买分析编号1编号2人数120368329145217329205368307217419289217368289217529286217829286362368280368413258368419256表一 两种商品组合购买记录表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中120与368商品的购买组合为最频繁购买组合,商品数2,频繁出现329次。2、三种商品组合购买分析商品1商品2商品3人数217368529101217368541792173684897721726636870217368692692176829146

11、921748952968217890914682173686906621765795666表二 两种商品组合购买记录表二截取了三种商品购买记录前10位的商品,有表二可以看出,三种商品的购买组合中商品217、商品368与商品529的购买组合为最频繁购买组合,商品数3,频繁出现101次。同时有表二,还可以发现,出现最频繁的商品组合均含217号商品,证明217号商品在所有商品中购买量较大。3、 四种商品组合购买记录商品编号1商品编号2商品编号3商品编号4购买人数2173685296905521736817669054217368266529532173681765295121736826669051

12、2173685295715121736869026651217368571690502173681762664921736817657149表三 四种商品组合购买记录表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中商品217、商品368、商品529、商品690的购买组合为最频繁购买组合,商品数4,频繁出现55次。问题三:编号1编号2人数利润总利润120368329502.02165164.58368419256587.93150510.08205368307479.64147249.48368529255575.95146867.25368692247587.93

13、145218.71368438256565.29144714.24368720247581.82143709.54368752246581.82143127.72419720227587.93133460.11368956236555.12131008.32表4 两种商品购买组合利润表4截取了两种商品购买记录利润前10位的商品,由表4可以看出,两种商品的购买组合中商品120、商品368的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.商品1商品2商品3人数组合利润总利润217368529101581.158858697.038821736869269568.638839236.077

14、221736854179484.848838303.055221736840163581.158836613.004421765795666554.458836594.280821714552961575.288835092.616821752969261562.768834328.896821736869066489.588832312.860821791436861489.588829864.916821736848977301.327623202.2252表5 三种商品购买组合利润表5截取了三种商品购买记录利润前10位的商品,由表5可以看出,三种商品的购买组合中商品217、商品368、商

15、品529的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.商品编号1商品编号2商品编号3商品编号4人数组合利润总利润21736817652951872.068844475.508821736852969055681.152837463.40421736817669054687.022837099.231221736817657149669.837832822.052221736826657148669.837832152.214421736826652953605.507832091.913421736817626649611.377829957.512221736854164242

16、678.318828489.389621736848952943586.367625213.806821736857169050478.921823946.09表6 四种商品购买组合利润表6截取了三种商品购买记录利润前10位的商品,由表6可以看出,四种商品的购买组合中商品217、商品368、商品529、商品176的购买组合利润最高,虽然此种组合购买人数并非最多,但考虑到超市利润最大化的经营目标,将此组合作为最优商品组合。 由以上购买组合利润分析得知,217和368号商品分别出现在三种及四种商品的最优销售组合中,同时在两种商品的购买组合中,217和368号商品组合也位于频繁购买的前十位。217号

17、商品单位利润5.2088,属于利润较低的商品。368号商品单位利润290.91,属于利润较高的产品。购买组合分析可知,217号商品与368号等其他商品关联度较高,217号商品销售量增加可带动其他商品销售量大幅上升。因此,商家可对利润较低的217商品采取一定的促销措施,利用217商品销量上升,带动368等高利润商品销量上升,进而促进销售额与总利润的增长。六、模型优缺点及改进方向聚类方法: (一)模型优点:1、 (1)问题一中聚类分析模型的优点为直观,结论形式简明。算法思路比较简单,以递归统计为基础,易于实现。引入关联规则中的支持度与信度计算商品关联度,设置最小支持度与最小信度的阀值,简化了计算,

18、使商品关联有了科学度量。 (2)问题二中,使用穷举法,程序设计简单易行。对穷举法进行简化,减少了循环次数,增强了程序的可执行性。 (二)模型缺点:(1)问题一中通过距离表达两者之间的相关程度的算法的一个共同特点是某个模式一旦划分到某一类之后,在后继的算法过程中就不改变了,而简单聚类算法中类心一旦选定后在后继算法过程中也不再改变了,这类方法效果一般会产生误差而使结果不会太理想。(2)问题二中,对于穷举法进行的简化和筛选,造成了高维计算的相关误差,使结果产生误差。 (三)改进方法:(1) 结合动态聚类方法。动态聚类的优点在于算法简单,运用收敛在数据点分类过程中按照某种准则动态调整数据点类型归属。该算法是能达到很好聚类结果的,能使各模式到其所判属类别中心距离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论