版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于粗糙集的关联规那么挖掘在餐饮信息化中的应用摘要关联规那么挖掘是数据挖掘中的一个重要问题,在最近几年被广泛研究。本文将粗糙集理论及方法引入顾客消费程度评价中,通过属性约简降低属性纬数,然后基于粗糙集理论进展关联规那么挖掘,得出了一些有益的结论,为拓展粗糙集的应用领域做出了有益的探究。关键词粗糙集;关联规那么;餐饮信息化;区分矩阵;属性约简粗糙集理论RughSet是由波兰数学家Z.Palak在80年代初提出的一种处理模糊和不准确性问题的新型数学工具。利用粗糙集理论进展数据挖掘,重要的一点就是基于粗糙集理论的属性约简。通过约简操作降低属性的纬数,总结出适用于决策支持的知识规那么,是粗糙集理论最重
2、要的应用之一。关联规那么挖掘是数据挖掘中的一个重要问题,随着全球范围内数据库中存储的数据量迅速增大,数据间的关联规那么往往过于庞大而难以分析,如何有效的得到有意义的关联规那么成为研究热点。本文以酒店行业为应用背景,将基于粗糙集理论的数据挖掘技术应用于餐饮部门顾客消费记录,通过属性约简方法,将餐饮信息数据库中杂乱、无序的原始数据,化简为对企业有用的信息,为企业的决策提供新的解决方法。2.1粗糙集理论的根本概念粗糙集理论将分类与知识联络在一起,认为知识源于有认知才能的主体的分类才能,并用等价关系形式化表示分类。定义1粗糙集理论中定义信息系统为一个如下四元组:S=(U,A,V,F),其中U=(x1,
3、x2,xn)是对象集,即论域;A是属性集合,A=D,且D=,其中为条件属性,D为决策属性;V为属性A的值域;F是UAV的映射,它为U中各对象的属性指定唯一值。S又被称为决策表。定义2在信息系统S中,对于一属性集IA,可构造对应的二元等价关系。IND(I)x,yUU|aI,有a(x)=a(y),称IND(I)为由I构造的不可分辨关系。不可分辨关系实际上就是I上的等价关系。因此,针对属性集I上的不可分辨关系,U可划分为几个等价类,用U/IND(I)表示。定义3约简定义为不含多余属性并保证分类正确的最小条件属性集。假设条件属性集的简约是的一个非空子集,和必须满足以下两个性质:(1)ind(,D)=i
4、nd(,D),不存在有ind(,D)=ind(,D)。(2)一个决策表可能同时存在几个约简,的简约的集合记作Red()。这些约简的交集定义为决策表的核(re),re()=Red()核中的属性是影响分类的重要属性。定义4信息系统S中关于属性集的区分矩阵=(ij)nn定义为()=(ij)nn是代表了区分xi,xj的完好信息。2.2关联规那么关联规那么是在交易数据、关系数据或其他信息载体中查找存在于工程集合或对象集合之间的频繁形式、关联、相关性、或因果构造,通过分析数据或记录间的关系,决定哪些事情将一起发生。定义6设I=i1,i2,in是项的集合。包含K个项的项集称作K项集。设D是数据库记录的集合,
5、其中每个事务T是项的集合,且TI。设X是一个项集,事务T包含X当且仅当XT。关联规那么是形如的蕴涵式,这里,且XY=。X称为规那么的左部或规那么的前提简记LHS,Y称为规那么的右部或结论简记RHS。度量规那么的参数是支持度Supprt与置信度(nfidene)。支持度是指数据集中的实例同时包含条件属性与决策属性的共同概率,支持度提醒了规那么的重要性。置信度表示实例在包含条件属性的前提下,也包含决策属性的条件概率,它提醒了规那么的可信度。在粗糙集理论中支持度与置信度可以表示为:其中P(X)表示是指X在数据D中出现的概率,其余雷同。Supprt()指X、Y在D中同时出现的概率;nfidene()表
6、示在X出现的前提下Y出现的条件概率。假如得到的规那么同时满足支持度部小于支持度阈值和置信度不小于置信度阈值,那么该规那么有意义。将基于粗糙集的关联规那么挖掘的算法应用于酒店顾客消费数据库,整个挖掘过程分为三步:即数据预处理,属性约简,关联规那么的挖掘,见图1。(1)数据预处理:通过对餐饮部门的初始数据进展清洗,缺失值处理,转换及数据选择,获取初始信息表,且初始表转换为粗糙集形式,并明确条件属性集和决策属性;(2)属性约简:对条件属性进展约简,删除多余属性,用分辨矩阵来完成约简和求核,在此根底上生成约简属性集,合并一样行,进展属性约简;(3)关联规那么挖掘:输入支持度阈值和置信度阈值,根据数据约
7、简结果,利用粗糙集理论文献6中的算法,进展关联规那么的挖掘。在全面信息化的21世纪,我国酒店业面临参加T带来的难得机遇与严峻挑战。酒店企业要在这一全新的竞争环境中生存与开展壮大,信息技术的作用举足轻重。而数据挖掘是企业信息化的灵魂所在,利用它能提升企业信息效劳的层次,实现企业信息共享,进而为决策者提供根据。4.1典型应用酒店是一种提供特殊效劳的企业,它出售的商品可以概括为“空间、“时间和“效劳。其中,最重要的经营产品就是客房和餐饮,餐饮信息化是酒店信息化的重要组成部分。数据挖掘技术在餐饮部门中的典型应用包括穿插销售和个性化营销等。1穿插销售。利用数据挖掘技术从数据库所存储的客户信息,尤其是以前
8、消费行为的信息中,寻找影响客户消费行为的关键因素,并建立预测模型对客户将来的消费行为进展预测分析,分析哪些客户最有可能对企业的产品感兴趣、会对哪些相关产品感兴趣、客户购置某些产品的可能性有多大等,以决定对哪些客户进展穿插销售,并向这些客户提供合适其需求的产品。数据挖掘中的关联分析经常被用来帮助企业发现一些隐含的、微妙的且极具商业价值的关系。这种挖掘过程一般分为两步:首先,发现所有的频繁项集,这些项集的频度要大于等于最小支持度,从而找出所有可能被一起购置的关联产品;其次,根据所获得的频繁项集产生相应的强关联规那么,这些规那么必须满足最小置信度阈值,从而找出一起购置可能性足够大的关联产品。2个性化
9、的市场营销近年来,餐饮营销成为现代餐饮管理的重中之重。餐饮营销就是以市场为起点,以顾客需求为焦点,寻求更屡次地与客户达成交易。餐饮专职销售作为新的营销理念正在被一些大型酒店所青睐。所谓餐饮专职销售指餐饮专职销售人员对自己的餐饮产品有着深入的理解,并且通过长期与客户打交道,拥有一批比拟固定的客户群。数据挖掘可以把大量的用户分成不同的类,每一类里的用户具有相似的属性,不同类里的客户属性也不同。成功的市场营销必须依赖于对客户的理解,让每次的营销活动都具有针对性,进展个性化营销,这样可以降低营销本钱,进步用户的效应率。数据挖掘的聚类分析技术、粗糙集理论等可以对数据库中搜集、加工和存储的大量客户信息进展
10、分析和处理,根据客户的消费心理、消费习惯、偏好程度、消费频率、收入程度等因素把大量的客户进展分类,酒店企业可以根据不同客户群的特征,提供差异化营销策略。下面本文就以人均消费程度评价为例,说明基于粗糙集的关联规那么挖掘的施行过程。4.2基于粗糙集的关联规那么挖掘在餐饮信息化中的应用根据上述构建的数据挖掘模型,利用启发式属性约简算法对餐饮数据进展约简,先进展数据预处理,再求出约简或近似约简,并在此根底上根据值约简等减少属性和个体数目,最终提取规那么应用于新对象的分类。1获取初始信息表通过数据提取和离散化,获取如表1的数据,表1是某大型酒楼餐饮部门有关高档型,较高档,中档,低档型四种人均消费类型的部
11、分调查记录。该表中论域U=1,2,19,条件属性=A1,A2,A3,A4,A5,决策属性DD1。其中,A1:班次,A2:餐厅地点,A3:客人数,A4:总金额,A5:付款方式,用D1表示决策属性人均消费程度档次。表1某酒楼餐饮部门消费者的部分记录A1班次值1、2、3分别表示早餐、午餐和晚餐;A2餐厅地点表示为10:美食广场,11:零点餐厅,12:包厢,15:西餐厅;把初始数据按照实际需要进展离散化处理和分类,将A3客人数分为四类,0:少,1:中,2:较多,3:多;A4总金额分为五个等级,0:低,1:较低,2:中,3:较高,4:高;A5付款方式表示为1:RB人民币现金,2:TA转前台帐户,3:TR
12、转AR帐。决策属性A6人均消费分为0:低,1:中,2:较高,3:高四个等级。2属性约简容易看出,该表是相容决策表。首先利用区分矩阵求出核,核为reA4,A5,然后计算其它属性的重要性分别为A1:0.25、A2:0.7、A3:0.35,将属性重要性最大的A2参加,得到约集R=A2,A4,A5,那么表1通过属性约简后的决策表如表2所示:表2属性约简后的决策表3关联规那么挖掘根据上面得到的约集,用属性A2、A4、A5之间的隐含关系来挖掘关联规那么,设支持度阈值30%,置信度阈值80%,可得到同时满足支持度阈值和置信度阈值的工程集生成的关联规那么有:rule1.(A4=0)(A5=2)=(D1=0);
13、rule2.(A4=2)=(D1=1);rule3.(A4=3)=(D1=2);rule4.(A2=12)(A4=4)(A5=1)=(D1=2);rule5.(A4=4)(A5=3)=(D1=3);rule6.(A4=1)(A5=2)=(D1=2).将A2,A4,A5的含义带入,那么得到完好的决策规那么,如:(总金额小于75元)and(付款方式为转前台帐户)(人均消费小于10元);(325=总金额800)(10=人均消费70);(800=总金额1600)(70=人均消费150);(餐厅地点在包厢)and(1600=总金额20000)(70=人均消费150);(1600=总金额20000)and
14、(付款方式为转AR帐)(150=人均消费1500);总金额75人均消费10。由以上规那么可以得出:总金额消费低时,人均消费低;当就餐地点在包厢,且消费额度较高时,人均消费程度为较高档次;而当总金额消费高,且其付款方式为转AR帐户时,其人均消费程度高,也就是说当消费者为单位消费时,其消费程度档次高。粗糙集以其独特的优势正得到越来越多研究者的关注,由于许多成功的应用,使得它的声望越来越高。属性约简是粗糙集理论的核心内容,本文采用基于粗糙集理论的关联规那么挖掘算法,使用粗糙集理论对数据进展预处理,然后再进展关联规那么挖掘,进步了关联规那么挖掘的效率;将粗糙集理论中属性约简的概念应用到关联规那么挖掘中,对规那么进展属性限制,得到实际可用的关联规那么集,从而有助该餐饮部门理解和熟悉顾客的消费动向,及时地根据消费资料分析潜在目的市场,预测消费趋势,评估消费倾向,对餐饮业具有一定的指导意义。1ANGJue,IADuqian.AnalysisinAttributeRedutinStrategiesfRughSetJ.JurnalfputersieneTehnlgy,1998,13(2):189-1932王国胤.Rugh集理论与知识获取.西安:西安交通大学出版社,20013HanJ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑答辩流程规范
- 创意线条画课件
- 私域运营活动方案
- 体育毕业设计教案
- 2026《胃内镜黏膜下剥离术围手术期指南》解读
- 精致的拼音课件
- 秘书接待流程标准化管理
- 教育创新创业实施路径
- 安全责任教育体系构建与实施
- 化学学科节活动策划与实施
- 第二类医疗器械经营备案全套企业质量管理制度及工作程序
- 冷库操作规程标准及安全注意事项
- 2019新人教版高中英语选择性必修四全册课文原文
- 卷烟公司考试题及答案大全
- 文学翻译风格迁移-洞察及研究
- 高铁后备车长考试题库(含答案)
- 2024年河南省西华县人民医院公开招聘医务工作人员试题带答案详解
- DB15∕T 970-2024 居住物业管理服务规范
- 2025届山东烟台中考历史真题试卷【含答案】
- 浙教版2025年八年级数学下学期期末总复习(知识梳理)专题05特殊的平行四边形(考点清单3考点16题型)(教师版)
- 电工防火防爆安全课件
评论
0/150
提交评论