版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖18在电子商务中的应用 摘要:在进人大数据时代后,机故型的电子商务时代已经无法适应当今社会 的发展,猜准塑的电子商务时代已经开始。电子商务在企业中应用时,企业信息 系貌会将产生大量的数据,数据挖掘枝术是数据分林的有效手段。运用数据挖掘 得到的信息可以对客户关系、网络营5B等管理,从而实现高效协同、 以人为本,満足毎一位用户的不同要求。 关谜词:蒂准型;细分类;数据挖掘;客户关系 Abstract: After entering the era of big data, extensive e-merce era has been unable to adapt to the develo
2、pment of todays society, the precise type of e-merce era has begun. When e-business applications in the enterprise, the enterprise information system will produce large amounts of data, data mining technology is an effective means of data analysis. Information obtained using data mining can be custo
3、mer relations, Internet marketing, precise management, in order to achieve efficient coordination, people-oriented, to meet the different requirements of each user. Key words: Precision ; Subdivisions ; Data Mining ; Customer Relationship 可修编 1. 引言 砸着国外电子商务的发展,电子商务越来越多,行业竞争越来越激烈,电子商务必须加 强客户关系管理,改善经营
4、理念,服务好客户,才能获得更多的客户资源。电子商务企业要 面对的客户髀和市场胡变得巨大而复杂,并且闻着电子商务的应用日益广泛,电子商务系就 中枳累了大量的侑息和数H,迪些数据正在呈现煤炸氏的赠长,给电子商务的应用帯来了一 定的挑故。因此,电子商务必须研究容户的兴也和愛好,对客户进行分类管理,针对不同的 容户髀推荐不同的商品。对干企业而言,数据挖掘有助干发现业务发展的茜势,帮助企业做 出正确的决策,便企业处于更有利的竞争位置。 2. 国外研究现状 在电子商务模直下,决莎的制定需耍依靠通过网络途径所获得的用户诉冋和交易数据, 因而数据挖搐作力一种数襦处理工具便拥有了其用武之地。数据挖掘应用技术之后
5、演变为 Web挖掘,用于在网络坏境中进行有价値信息的获取,通过各种网络文甘及在线,实现目标 信息的自动发现和荻取,从而帶助企业制定决策。目前,Web数稠挖掘技术在我国电子商 务中的应用王要集中干如下几个方面: (1) Web挖掘算法的研究它适用干电子商务环境,具在国的发展已经初步应熟,也得到 了比较广泛的应用。各领域的数据特点不同,电子商务系统所严生的数稠也必然有Mttt, 因而针对电子商务系躱,传蔬的釵摇挖掘算法必需要进行改进,从而才能适应电子商务数稠 挖抵的特点及需求叭 (2) 个性化服务及电子商务推荐系统的研究。该方向已经成力当前国学术界对于电子商 务坏境下Web数襦挖掘的研丸热点,具信
6、息的挖掘主1KIS Web服务器日志文件、用户 简介、注册信息、用户对话或交易信息、用户提间信息等asan,从而分析网络用户的刃 览行为及啊买行为,进行用户忠实度的辨折,并实现更有效的面向目标客户fiHtMUE导向 性的)R务,从而增加客户的剧买机僉与剧买行为。 (3) 电子商务环境下淄在客户的发现。在电子商务系统当中,少部分顾客会选择在站点 注册,而较多部分的顾客并不会iiflfl,而如何把揮住迪些未甘冊的顾客,成为电子商务条件 T Web数据挖掘的研究方向之一。 当前,在国外已经取得了用户兴趣模徒理论U系研究KtttW务研究的根大进展的情 况下,基于电子商务坏境,中国国的HI关领域对数据挖
7、掘应用技术的研究也开始逍行理沦与 实际应用的双向集中。然而柑对而言,貝起步的然较晚,连处于比较早期的研发阶段,无论 是严品方面还是应用方面勻国外1比都HI对滞后咒国沃局跚挖掘算法的设廿、分桥、改逍 为研究的車点,而很少研究数据挖掘系统自身的构建、开发模氏的神类等冋题。Web数据 挖牖的过桿必须进行与电子商务业务说桿的完美融合,迪样才能更好地服务商家及用户,这 也It现了生产容从提供商品到提供服务的传变,体现了市场正在向成熟与专业化的方向发 go在当前电子商务坏境下,分布氏Web数II挖18系鋭具有整lift,系统中的毎一部分郡 紧密联系,域技术頂目不仪册有良好的发展前景,对商家而言更意味着目大
8、的利益空间。 3.数据gI具及分类 数儘挖掘工具:从数据仓库的组成人手,分林数据仓库的11系结构。在数摇仓库的设廿 过样中必须注恿3个关说的冋題:选择数ffiftH的目标数稠库、数据抽取和转换工具及前端 釵据诉冋和分桥工具按照Web处理对象的不同,一凤将Web挖掘分力三类:Web容挖 掘,Web结构KSffWeb便用记录挖掘。 3.1容挖押 Web容挖掘是对Web页面容进行挖掘,是从大量的Web数据中发现信息、抽取知I识 ft il Web挖掘的Sig 有:服务器釵稠、査询数稠、在线市场数儘、Web贡而、Web页 面的超级关系、客户登记侑息等。 3.2结枸挖H Web结构挖掘是U网页上的组纽结
9、构和关系中推导知识。由于超文本文档间的关联关系 便得网页不仪仅可以鞫示文档中所包含的信息,同时也可以搦示文档冋的关联关系所代表的 信息。利用这些信息可以对页面进行排序,发现垂要的页而。挖掘Web结构的目的是发现 页面的结构和Web结构,在此星就上对页面JJ行分类和聚类,从而找到权威页面 3.3使用圮录挖押 Web便用记录挖掘的主要目标是U Web ffiInJid录中抽取感兴趣的模式。互联网中的 毎个服务器胡保STfflHQ志(Web access log),记录了关于用户诉冋和交互的信息o Sttfi 些数稠可以帮助理解用户的行为,从而改进站点的结构,或力用户梶旅个性化的服务。 4电子商务中
10、进行数据挖損的数据壕 4.1畏务 客户诉冋服务器就会在服务器上严生HI应的服务器数据,这些敛据可以分力日志文件和 1 询数儘。其中日志文件 Q 可以分为 server logs、error logs、cookie logs、server log、sserver logs有两种格式存昭,一种是普通日志文件Bit,另一种是扩展日志文件Kite普通日志 文件 tSSW MDate Client IP, User name, Bytes, Server, Request, Status, Service name Time, Protocol version, User agent, Cookie,
11、Referrer*1的18式存储关于客户连接的物理信息。 4.2客户登记信息 客户登记信息是常客户通过Web页在屏幕上输人的、电子商务活动起着非常亜要的作 用,特别是在安全方而,或者在对容户可两问信息的限制方而。在Web的数摇挖掘中,客 户登记18息必须和诉冋日志集成,以提高数稠挖掘的准确度,能更进一步的了醉客户。 5Web数据挖損的主耍技术 Web数据挖掘中常用的技术有路径分折技术、关联规则、序列模直、分类聚类技术等。 5.1关联ffiNsan术 该技术主要用于从学习者购问序列数摇際的If列项中挖掘出曲关的规则。在Web数据 挖押中,关联規!I挖掘就是要挖掘出学习者在一个购冋期间(Sessi
12、on) US务器冋的页面、文 件之同的联系,迪些页面之间可能并不存在頁接的参弓I (Reference)关系在网络日志数据 的预处理过程中,将学习者诉冋的页面路径构应了学习者会话事务集,可以通过关联规呱挖 掘得到大量的学习者廿ilHli青求的URL之间的联系,并將挖掘岀的规则按照不同的支持度和 置18度aii舍,从而保留一些有用的规JM进行应用。 5.2序列模弦損技术 序列模直数据挖尿就是要挖掘出交易集之间的有时间序列的模直。在服务器日志里,学 习者的诉冋是以一目时间为单位记我的。经过数据羽化和事件交易是一个间斷的时 冋序列,逹些序列反映了学习音一定的行为。在网络日志文件的预业理过程中,抽取了
13、学习 者对干每个URL浏览所耗用的时间,迪种元裁据从他面描绘出毎个学习者对干贞面上承我 的知识点的理解程度和思考难度,引用时同长的证削此页面承載的知识点比较难于理解。通 过分桥可以得岀学习者对特定知识点的拿捋程度。但由干网路线路的原因,致便学习者在1! 出URL请求后,很长时间才将相应的网页扌J开,所以这种由日志中记录的浏览时间所分桥 出的各种模式规则并不一定真实反映学习者的学习过S JliJUHJ利用用列模式挖掘方式预 測岀学习者后镇要诉冋的页面集,然后將此页面集中的URL预先下裁到本地it算Al的缓存 中去,U而PHKT页面的打开时间,也就便得浏览时间的旌确性和有效性得到了很大的梶高。 这
14、种Web贞面的预取技术是利用序列模氏挖掘方法来实现的。 5.3聚类分类技术 聚类技术可以將具有柑间特征的数据顶聚成一类。聚类分桥模直就是為数摇划分到不间 的组或者濮中,组之间的差别尽可能的大,组的差别尽可能的小,与一般从为通过学习者的 因定信息进行的分类分桥不同,聚类前并不)11道為要则分应几个组和什么样的组,完全依靠 服务器習能化的廿算得岀,因此聚类分桥也可1林为无监曾分类。通过聚类得出不冋的类后, 一旦某学习者的特征模衣符合杲个类后,推荐引单自朋將此学习者尚未爾冋的页面或者尚未 进行的測试与塚习推荐给学习者。迪样就可以習能化地垮处在不同学习阶段的学习者得到此 类应该获得的学习和測试8mo
15、5.4路径分林技术 用路径分析技术进行Web便用模式的数据挖掘时,最常用的是图。因为一个图代表了 定艾在上的页面之冋的联系。图最頁接的来澹是结构因,上的页面定义成节点,页面之间的 超定义成图中的边。耳他的各式各样的图也都是建立在页面和页面之间联系或者是一定数量 的学习者浏览页面顺序基础之上的。朋么,基T Web使用模衣的数摇挖掘,就是从图中前 定最盹繁的路gffiPO模衣或大的参引前冋序列。 6. Web数据挖損的过程 电子商务中的Web挖掘过椁一般由3彳、主要阶段组成:数据旌备、挖掘If作、给果表 达和解释。数摇准备。这个阶段艮可分成3个子步骤:数据集成、数II选择、数据预桃 Bo数据集成将
16、多文件或多数据库运行坏境中的数据怖合并处理,解决语义模#1准备,S 个阶段Q可分应为处理数据中的诡漏等。数据选择的目的是辨别出需要分析的数据集合,缩 小处理围,提高裁据挖尿的质量。预处理是力了克服数据挖掘工具的同限性。数据挖掘。 这个阶段进行实际的挖掘操作,色括的要点有:决定如何产生假设;选择合适的工具;发掘 知识的操作;fi实发现的知识。结果表述利解释。根襦最终用户的决策目的对提取的信 息进行分折,把最有价ii的18息区分开来,并且通过决策支持工具提交给决策者。因此,ii 一步骤的任务不仪是把结果表迖岀来,还要对信息进斤过滤处理,如果不能令决策者満恿, 需要車复上述过权。 7. 数据挖損技术
17、在电子商务的应用 7.1在客户关系管理中的应用 数齬挖掘技术可1应用在客户稱It细分、客户获得、客户保持、客户驻因和客户聚类等 方而。 (一)客户细分 厨着以客户为中心的经营理念不斷深入人心,分析客户、了解客户并引导容户的需求己 成力企业经营的iiffli。通过对电子商务系就收集的交易数据进行分折,可1按各种客户 指标(如自然属性、收人贡献交易额、价18度等)对客户分类,然后确定不间类里客户的行为 模式以便采取相应的曹第措施促便企业利刑的量大化。 (二)客户获得 通过裁据挖掘可1发现啊买某种商品的消皺者是性别,学历、收人、爱好、职业等。甚 至可以发规不同的人在购买垓种商品的H)关商品后多长时间
18、有可能啊买戏种商品,以及什么 样的人会啊买什么里号的该种商品等等。在采用了数据挖掘后,针对目标客户发送的广告的 有效it和is应率為得到大帽度的提畐,推角的成本将大大降on (三)客户保持 数齬挖掘可以把你大量的客户分成不同的类,在每个类里的客户册有iiaw属性,而不 间类里的客户的属性也不同。你完全可1做到给不同类的客户提供完全不同的服务来提高客 户的満意度。数摇挖掘连可以发观具有哪些特征的容户有可能浹失,这样挽国客户的帶葩将 具有针对性,挽因容户的皺用將下降。 (H)客户的驻国 对客户来说,传统客户与舗售商之间的空间距离在电子商务中已经不存在了,在网络上, 毎一个舗售商对于客户来说胡是一样
19、的,那么如冋便客户在自己的猜售站点上驼因更长的时 冋,对角售商来说将是一个拢战。为了便容户在自己的上驻因更长的时问,就应该了解客户 的浏览行为,知道容户的兴趣及需求所在,动态地期整Web页面,1満足客户的需要。通 过对客户肪冋侑息的挖掘,就能知道客户的洌览行为,从而了解客户的兴趣及需求。在 Internet上的电子商务中的一个典里的序列,恰好就代表了一个购物者以页面形衣在站点上 导前的行为,所以可运用数据挖擄中的序列模氏发现技术 (五)聚类容户 在电子商务中客户聚类是一个車要的方面。通过分组具有览行力的客户,并分桥 组中客户的共间特ffl, nJJlW组电子商务的组织者更好地了解自己的客户,向
20、客户提供更适 合、更面向客户的服务。例如,有一些客户邮花了一目时间浏览了同样的页面,经过分析泌 些客户被聚类应为一组。计售商根据分林出来的聚类信息,就可以ft对也m所进行的业务活 动,EWifl整页面及页面容,使商务活动能硏在一定禅度上满足客户的要求,便商务活动对 容户和舗售商来说更具意义。 7.2数据挖損技术在网络营箱中的应用 网络营Sf是企业通过电子商务逍行的一系列市场营舗活动。与貝他传貌营Sf方貳皿比, 网络营舗具有全球性、实时性、低应本以及客户参与的互朋性等爵点,这些特点便得网络营 踊备受Sfflo以下列举几种应用。 1. 交叉舗售 交叉博售是一种营角策略,虽然在很乡分林中胡将貝IH力
21、客户关系管理中的一彳、方而, 但本质上它是对客户感兴趣的、可能购买的商品的一种组合舗售策略。交叉舗售策略取得应 功的关建是要保证2H亍交叉的严品福是用户所感兴趣的,址种策13的实施能整帮助企业细持 与客户之冋良好持久的关系。交叉舗售中应用数摇挖掘主耍是借助逆种数据分析技术寻找商 品角售的最合理匹配。 2. 建立个性化服务系统 在竞争日喪激烈的今天,如何让容户满意,因任老客户和吸引更多的容户已成为网络营 角的首要任务。这就要求企业营舗站点能快速、准确地找到客户所需信息,能力不同容户提 供不同的服务,能允许客户根襦自己的需要定制页面,能为客户1!哄严品营舗策略信息等等。 客户在诉冋企业的站点时,貝
22、浏览信息被Web服务器自动收集,并保存在Web日志文件 中(,0,o fl用Web便用挖掘技术对这些日志文件进行有效的分析,不但可以充分了解容户的 喜好、啣买模直,设it SS足不同客户需要的彳、性化,还可以为企业制定有效的营舗策路提 供依据。 3. 建立营ifitfiffi系统 营是指与各类营舗坏境日常发展情况H1关的信息。市场营角活动是建立在对市场 的了解和分桥的基竄上,对市场的了解需要收集、整理大量的tffill息。市场tffill息具有 很强的时效性,处于不斷的更新变化之中,这就要求企业营角跚门必须不断地及时收集各种 fl息,以便不断拿摒新情况,研究新间題,取得市场营舗主劲权。 7.3
23、数据挖損技术在镇廿的应用 1. 优化站点结构 通过挖掘用户的Web日志文件,对Web站点的结构ft it ft可两方而来考虑:一 是发规用户诉问页面的相关性,对密切相关的网页之间emo二是发现用户的期里位置 咖果在期里位置的诉冋航率高于对实际位置的诉冋頰率,可考虎在期里位冒和实除位置之间 建立导航。通过对用户前冋频繁路径的分林改进柘扑结构,使结构更符合用户诉冋习嵋在 第一期里位置和实际位置之间增M导航,从而优化Web站点的结构。 2. 优化页面设廿 网页的容设置直接影响的前问效率。并且,的诉冋者所关心的容食随时变化。以上挖掘 工具的挖掘算进在网络的日志文件中挖掘用户诉冋页面的统it信息,发现用
24、户便用的模直, 可1为改良网页的容设置規供良好的建议。咖通过确定时间冈值,除了确定用户所诉冋的页 面是目标贡而迷是期里位置,用户在贡而停因时间的长短杲种样度上反映了用户对该页而容 的感兴1枳度。 3. 系貌改进 用户对服务的满意杈度还与系锐的性能相关,色枯服务器缓存、网络传输、负我平歯、 数据分布等。用户在页面上停因时冋较长,可能并不是对iOffi有较大兴趣,服务器狀态及 由于贞面容传输显示可能造成用户扑开网页的等侍时间较长。星干迪种原因,就需要根据代 理冊务器的爾问日志预测用户的靖求在时间和空冋的分布,迪种預测可以常助代理服务器选 择页面预取和缓存策略;U瞄务器的日志中挖思路径配置文件,作为创建动态HTML页面 的依稠,所以用户i青求动态页面之前已将将朋态页面生成,U而减少服务器的哨应址迟时间。 4. 网络安全 砸着Internet的毬速发猴,的安全It成为社会关诜的焦虎,同时也成为制约基于网络的 应用的主要因素。各种网络弃畅手段层岀不穷,便人IlliS行网络涓皺时心有余悸,迪对推动 电子商务的发展是机其不利的。由干登录系貌的代何诉冋者的便用记录那会被服务器日志自 动获取,所1利用Web日志挖掘技术可以用于监视非违登录,黑客人ft等。将We
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程管理领域职位晋升路径分析
- 零售业门店理财顾问服务流程安排
- 网络技术公司数据专员招聘分析
- 服务请求的响应与处理时效性提升计划
- 机构研究报告-小马智行-市场前景及投资研究报告:自动驾驶商业化Robotaxi未来可期
- 低血糖患者的护理
- 智能家居产品交互设计要点
- 房产销售面试准备攻略及话术
- 新兴企业客户管理岗的培训与工作技巧解读
- 酒店预订与接待员职位晋升手册
- 乳腺癌手术的麻醉方式
- 《社区康复》课件-第八章 视力障碍患者的社区康复实践
- 2022-2023学年杭州市七年级语文下学期期末考试卷附答案解析
- 2024年潍坊工程职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 初中学业规划-制定清晰学业目标与计划课件
- 《办公软件教程WPS》课件
- 项目式学习:教学设计与案例
- 特殊环境与运动能力
- 工程机械讲义
- 徐志摩简介专题知识
- 节约意识培训(公司版)讲课稿
评论
0/150
提交评论