




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘公司和产品以下介绍分别按:公司、数据挖掘工具及其特点、应用行业案例三个方面。1、ANGOSS软件公司KnowledgeSTUDIO平台:NT,Windows 9X功能:CHAID算法,支持PMML,留有与SAS、S-Plus的接口,能够灵活地导入外部模型和产生规则,包含神经网络建模的能力优点:响应快,模型、文档易于理解,决策树分析直观/性能良好,SDK中容易加入新的算法缺点:决策树不能编辑打印,SDK缺乏数据预处理阶段的函数,没有示例代码,不支持AIX应用行业案例1.Frost National银行CRM收益率、客户满意度、产品功效2.SASI公司利用SDK开发行业数据挖掘应用软件(零售行业)3.Montreal银行客户分片、越区销售模型、市场站的准备、抵押支付的预测、信用风险的分析2、Business Objects BusinessMiner 4.1平台:Windows平台,支持多数据源功能:直观的决策树技术,提供所有的分类数据挖掘功能,包括:建模、发现、可视化、假设分析和分片。支持RDB、DW、OLAP、文件。优点:易于使用,价格便宜5,文档齐全缺点:只具有决策树功能应用行业案例:D&J WADE ASSOCIATES是一个数据仓库和商业智能咨询公司,利用BO公司的产品做商业智能解决方案国际上大约有7000多公司在使用Business Objects 3、Cognos公司Cognos Scenario平台:Windows平台功能:Scenario是基于树的高度视图化的数据挖掘工具,决策树的基本功能是创立一系列标准,预测记录中目标市场的价值。Scenario的分类树分阶展现各种因素;最终用户通过挖掘或展开树的分支来探察数据。特点:Scenario的抽样技术可以用最少的处理开销和最短的响应应用行业案例:企业经理们可以利用Scenario的统计方法,深入挖掘影响商务趋势的因素的潜在含义,根据风险特性将个体与群体客户归类;将商务因素分门别类,辨清商务目标所受的主要影响;探察与通常数据模式不符的异常情况等。Northwood公司利用该产品发现影响树木死亡率的模式和因素。时间得出最精确的结果。给各种因素定级。4、Comshare,Inc.Comshare Decision and Decision Web Commander FDC/EIS Decision平台:LAN-客户端Windows 9X,服务器NT,Internet-Web服务器功能:具有强大的分析能力,包括:grids,钻入,旋转,图表,映射,特殊计算,等。内置引导分析功能,交互式分析多维数据。优点:易于使用,安装简单缺点:ICE(智能组件扩充)按钮在DecisionWeb中不可用,文档不全面应用行业案例:VDK冷冻食品公司利用COMSHARE DECISION AND DECISION WEB进行决策分析Welch Allyn公司利用FDC/EIS Decision进行金融决策分析5、DataMind Corporation DataCruncher平台:Pentium PC功能:特殊的报表优点:响应时间快,能将数据挖掘报表转化成HTML格式。缺点:图形界面不友好,难操作应用行业案例:ADP集团利用Data Cruncher分析客户定单及交易数据,提高客户满意程度。6、DBStar DBStar Migration Architect平台:Sun Sparc 20/Solaris,HP/UX IBM/AIX功能:数据分析工具,发现数据质量问题以及数据元素和其它内在的数据驱动的商业规则之间互相依赖的关系。在多个源数据与统一的目标数据之间建立映射。(数据仓库的数据抽取和转化功能)优点:可靠地决定数据质量,实时跟踪数据的改变并维持数据的一致性。不是使用元数据,而是利用实际数据进行细节数据分析。缺点:Motif用户界面使用不直观应用行业案例:某零售、投资、以及代理服务的金融服务公司利用DBStar的Migration Architect进行数据仓库项目的开发7、Group 1Software MODEL 1平台:Windows NT,Windows 9X Indiana大学的Kelley商学院使用MODEL1作为MBA数据挖掘教学软件。教学生如何分析客户数据库得出新的建议、保留老客户、最功能:灵活的数据抽取能力,数据编辑器能够创建新的数据变量,扫描无效数据。产生基本的线图、柱状图、稀疏图表、均值、和频率分布、以及lift图表。具有客户分片模型、响应模型、交叉销售分析和客户评估。适合多种预言模型包括:RFM,Bayes,线性和logistic回归,神经网络,CHAID and CART模型。优点:易于使用,广泛的模型。具有友好的wizard建模过程询问数据的格式和希望分析的层次。可以定制建模过程。非常适合直接市场应用。缺点:不适合纵向数据的时序分析,不能创建Script自动执行用户经常使用的一系列命令,价格昂贵,用户不能直接编辑报表,数据转化复杂,用户必须将外部数据转换为固定格式的文本文件才能进行挖掘应用行业案例:大化客户的生命周期价值,从而作出一对一的市场。学生分析人口统计数据、POS交易数据、商品目录和经常购买的数据。利用MODEL1做客户分片,分析过去推销的商品的有效性,定位将来的市场,增加交叉销售,标记最有价值的客户。Fort Worth Star-Telegram是新闻单位,利用MODEL1进行数据库营销DRG集团是出版公司,利用MODEL1进行MAIL战略8、Hitachi Data Systems(HDS)HDS 5780 Nucleus Exploration Series平台:64-bit UNIX,32-bit Windows NT,个人版本-Windows 9X功能:数据仓库建模优点:简化了数据仓库的逻辑和服务模型设置,性能高,能够查询压缩数据缺点:1小时装载1.5G数据,速率慢,可能由于压缩的原因First Citizens Bank利用该产品建设数据仓库应用行业案例:Canadian National Railway(CN)加拿大国家铁路局利用该软件产品构建数据仓库H 9、NC Software,Inc.Falcon Retail平台:IBM mainframe或UNIX功能:神经网络优点:减少人工分析的劳动力缺点:分析过程难以理解应用行业案例:Sears,Roebuck and Co.公司是大的服饰、家庭和汽车零售商,利用该产品分析其忠诚卡交易的欺诈行为10、IBM Intelligent Miner平台:AIX,Window NT,OS/390,Sun Solaris功能:自动实现数据选择、数据转换、数据发掘和结果呈现这一整套数据挖掘操作。具体算法包括:典型数据集自动生成、概念性分类、聚集(人口统计分析demographic、神经网络)、分类(树归纳和神经归纳)、估值、关联规Decision Edge for Finance-专门为金融行业设计的综合解决方案。Decision Edge for Finance不仅仅是简单的报告工具,它提供了行销经理所需的全部技术,以制定战略业务决策并开展行销活动。Decision Edge for Insurance-端到端的解决方案,包括硬件、软件、顾问和服务,其设计目的是帮助保险业行销经理制定战略业务决策并开展行销活动。则、序列模式、预言模型,以及结果可视化呈现。优点:Intelligent Miner for Text可以提供一定程度的定制,具有可扩展性,索引的速度很快,具有先进的语言分析能力、聚集和过滤能力。Intelligent Miner有强大的API函数库,可以创建定制的模型。能够处理巨大的数据量,同时支持并行处理,查询速度很快。缺点:Intelligent Miner for Text图形界面GUI不友好,spider和indexing管理需要对UNIX非常熟悉。对一个挖掘对象将多个挖掘操作一起执行(批处理)比较困难。元数据不开放,结构复杂。文档缺乏错误代码的详细解释。没有对算法的详细说明。IBM Discovery Series for Banking-为满足客户至上的银行业需求而设计的应用程序套件。IBM Discovery for telecommunications-为电信行业提供完美的客户服务的应用程序套件。Business Analysis Suite for SAP-适用于下列公司:已经安装SAP事务处理系统,并需要建立数据仓库,以充分利用日常运作中收集的所有事务数据。Surf-Aid-数据采集应用程序,用于分析Web站点利用率。Info Print Business Intelligence Solution-允许企业将自定义消息、姓名及地址同图形和条形码相结合,向客户提供有独特个性的行销资料。Global Services BI Offering-包含不同角度(行业、业务功能、技术)的战略和规划功能,以及帮助客户理解和解决业务困难、管理数据仓库项目、开发和实现先进分析功能的方法。Insurance Underwriting Profitability Analysis-将数据仓库和数据采集技术相结合,帮助保险业执行人员处理保险业过程。11、Information Discovery,Inc.PatternWarehouse Retail Sales Forecasting System平台:Solaris,Retail Sales Forecasting System运行在Intranet的Web服务器上功能:PatternWarehouse提供商业用户迅速访问已经获得的模式:客户行为,product usage affinities,生命周期,等等。PatternWarehouse提供PQL-模式查询语言,查询模式,就象用SQL语言查询数据一样。操作循环如下:数据挖掘在每周/月定时执行,发现的模式存储在模式库中,模式周期性增加组合和趋势分析,用户查询已经挖掘的模式库,而不是关系数据库。基于Java技术,在、查询通过Intranet的Web浏览器接口。优点:模式存储起来,对于紧迫的问题不需重新计算。数据挖掘是对整个数据库,不是抽样或抽取部分数据。模式存储在一个中心仓库,确保了统一的视图。报表用浅显的语言和图形自动产生。缺点:较难向用户解释PatternWarehouse和数据仓库框架的区别,在从事数据挖掘项目没有一个好的顶层的体系结构。应用行业案例:E*TRADE是一个网上投资服务公司,随着基于Web的金融服务竞争的加剧,数据挖掘技术构成了制胜的资本,E*TRADE利用patternwarehouse数据发现系统对客户行为进行分析,制定合适的市场策略。Deere&Company是农业工具零售公司,利用Retail Sales Forecasting System成功地预测了其拖拉机产品的第二年的销售。12、John Galt Solutions,Inc.ForecastX Wizard平台:Windows,UNIX,可以和Microsoft Web solutions,Windows 95,Windows NT and Arbor Essbase,SQL Server,Oracle等集成,开发工具:VB,Java.功能:ForecastX包括核心的预测技术和统计分析。有广泛的应用:金融计划、风险分析、销售预测、需求计划、生产计划,以及统计建模。ForecastX是一个分布式对象,可以和运行在UNIX或Windows上的应用程序集成。具有强大的预测引擎,包括30多个统计功能。优点:没有数据量的限制,量的大小处决于运行的计算机。即使没有统计知识也能进行复杂的分析。对象模型易于导航,性能显著。缺点:产品文献只有HTML格式,没有易于操作的帮助。对于同一个问题有多种解决方法,很难判断哪一种解决方法好。应用行业案例:HITechnologies公司是一个市场咨询公司,利用ForecastX的预测控件组件(ActiveX)开发HITools Enterprise Suite,该软件提供供需链管理,制定供需计划,增加管理one-to-one市场的能力。:GTE是一个电信公司,整个市场分为四个部分:无线、ISP、长途和本地电话,GTE利用ForecastX预测各项产品和服务的增长和收入。13、M PATTERN平台:Windows NT/9X功能:软件包括:数据预处理、预言建模、以及模型配置和打分。建模组件能够分析T级别的数据和支持多种数据挖掘算法。pattern能够将许多不同的模型的最好的因素连接成一个全体的模型。有特定行业的模型模板。模型配置和打分组件能够对模型进行修改,同时也能配置SAS和其他流行的建模工具构造的模型。优点:精确性高,能处理T级别的数据。缺点:GUI不友好,命令行接口比GUI容易使用。目前版本只支持Windows,今后会支持Unix。应用行业案例:Polk是一个多媒体智能信息解决方案提供商。有超过111 million个家庭的人口统计和生活方式的数据库,利用pattern预言对一个直接MAIL营销的响应。14、MapInfo Corporation TargetPro平台:Windows NT,Windows 9X功能:将人口统计(demographic)数据按照地图的格式可视化,Meineke是一个汽车销售和修理的连锁公司,利用TargetPro分析demographic数据,作市场决策。能够创建高质量的地图,帮助决策制定和增强报表和表达方式。优点:能够分析超过600个变量,响应速度很快。缺点:操作手册不详细。15、Market Miner(Formerly AbTech Corp.)ModelQuest Expert平台:Windows NT.功能:用C语言表达预言方程(equation),这些方程能够和数据仓库集成,用于计算预言值,然后用这些预言值来作为数据仓库选择数据的条件。优点:预言功能可靠性高,模型开发的速度快。缺点:预言变量类型的转换对用户是非常麻烦的。应用行业案例:ASC公司为客户提供数据库营销服务。开发和实现客户的预言模型,以提高其营销的效率。ASC公司需要一种快速有效的方式构建预言模型,并且已经运行神经网络很多年,在对ModelQuest Expert测试后,发现它缩短了预言模型开发的速度,并且其有效性在实际的营销策略得到了验证。16、MathSoft,Inc.StatServer S-PLUS 4.5 Professional for Windows S-Plus for Unix 5.1平台:StatServer只能运行在Windows NT,其它产品能够运行在UNIX、Windows NT/9X功能:StatServer是一个数据挖掘引擎和事务服务器,用户能够通过多种客户端(浏览器,MS Excel等等)进行统计分析和信息可视化。对于StatServer而言,客户统计模型和数据挖掘程序固定在S-PLUS语言内,存储在中心服务器上。分析通过S-PLUS引擎运行在服务器端,结果返回给客户端。StatServer能够通过多个数据源抽取数据,也能通过客户端上载数据。StatServer能够让组织开发、维护、配置定制统计分析和可视化方法。StatServer适合NT体系结构,提供了一个强壮的报表环境和MS ASP引擎相互补充。服务器端工具的组合(MS IIS,MS ASP,COM business objects,MS Transaction Server,StatServer,以及关系数据库,比如:MS SQL Server、Oracle)和简单的客户端构成了一个灵活的、强壮的、可扩展的远程数据挖掘和图形报表系统。S-PLUS是一个包括S语言、SQL和统计包混合的系统,能够用可视化的方式勘探数据。具有import/export的功Waratah公司提供统计、数据挖掘、数据仓库、以及软件开发服务。在为一个健康中心开发应用的时候,利用StatServer开发定制的基于浏览器的客户端应用,以分析和可视化病人的数据。另外也为一个制药公司分析其实验数据。Waratah主要利用StatServer进行二次开发,因为其客户端是浏览器或者MS Excel,用户能够方便地使用。Federal Communications Commission为了利用信息进行决策分析,该单位的经济学家利用S-Plus解决统计和经济分析问题。Maple Partners Financial Products利用S-PLUS创建和测试定量的贸易模型。应用行业案例:Cereals是一个食品公司,其基因研究利用S-PLUS软件的数据挖掘功能分析大米基因数据。使用了mapping和sequencing技术。Pillsbury是一个食品公司,利用StatServer和S-PLUS创建基于Web的数据分析环境。能。S-PLUS既具有基于Windows的图形接口,又有命令行接口。支持多种数据库的数据格式。S语言专门用于向量编程和分析,已经和Windows风格的界面集成。强大的图形功能包括:画刷brushing,旋转spinning,plotting amatrix of pairs,contour maps,heat maps、interpolated surfaces优点:StatServer COM对象模型是一个很好的编程接口。S-Plus非常精确。图形、数据对象、分析结果都能和微软的程序集成,比如:PowerPoint、Word、Excel。Import/export的功能缩短了数据移动的时间和开销。缺点:StatServer需要充分的资源和一台专门的服务器。StatServer不是一个service,需要登录进入StatServer这台计算机启动程序,有时会象NT一样出现问题,需要重新启动。S语言的灵活性使得有时很难指出如何写一个特定的程序。整个系统过于复杂,目前不支持Linux。17、Maximal Innovative Intelligence Ltd.Max平台:Microsoft NT,Microsoft SQL Server 7.0 OLAP Services.功能:可视化的多维分析功能。具有友好的wizards导航。优点:Max自动地汇总数据,易于使用。Find Similar分析特别有用,因为它能迅速地发现异常情况。缺点:MAX是一个客户端程序,客户端开销很大。报表能力应该被提高,2000年的产品和MS Office能够集成。应用行业案例:Afek Information System Engineering Ltd是一个计算机咨询公司。提供多方面的解决方案,包括:计算机系统分析,信息系统开发,ERP系统实施,以及物流项目管理和实施。利用Max进行图形化的多维分析,而不需要分析专家。Spiritus Trading Ltd.是PC机及外围设备贸易公司。利用Max分析客户和供应商的数据。18、Megaputer Intelligence,Inc PolyAnalyst Pro TextAnalyst平台:Windows NT功能:PolyAnalyst提供下列功能:数据访问、数据操纵和清洗、机器学习、可视化和报表。直接访问与ODBC兼容的各种数据源,数据和挖掘结果能够与MS Excel集成。提供构造数据子集和变量转换的功能。数据分析自学习引擎包括:PolyNet预言器,GMDH(Group Method Data Handling)和神经网络混合的方法,基于演化编程技术-Wisconsin-Madison大学UW Medical School和School of Nursing的Research Design and Statistics Unit(RDSU)为生物医药研究提供高层的统计和设计支持。典型的生物统计技术过于复杂,神经网络难于理解,所以利用PolyAnalyst Pro基于符号知识技术发现规则和结构。目前该软件在肾脏学nephrology,小儿科pediatrics以及phonology/communicative disorders运行的非常成功。Boeing公司是世界最大的航空公司。将多个复杂的系统集成在一起是其成功的基础之一,工程组希望找到一种工具,能够迅速地构建非线性过程的模型作为内置实时系统的一部分。传统的曲线配置curve发现规律,发现依赖关系的勘探引擎,分类引擎,聚集引擎,以及多参数线性回归以发现数据中的线性关系。PolyAnalyst具有集成的GUI环境。发现规律引擎,利用了符号知识获取技术(SKAT),自动化地发现数据中的依赖关系和规则,并且用清晰的数学语言表达。PolyAnalyst是一个多策略的数据挖掘解决方案。能够处理数字、种类、布尔型变量。任何一个引擎都能作为一个单独的COM组件,COM组件能够和其他软件集成。TextAnalyst在一个知识库上使用,包括问题的文本描述,内容分析、创建语义网络。优点:图形接口友好,各种建模技术易于掌握。发现的规则用一种标准符号表达,适合在其他平台编程,增加了产品的可用性。缺点:PolyAnalystPro 3.5缺乏将表达式剪切并且粘贴在其他软件中的能力。打印不方便、不灵活,需要增加数据和模型的编辑以及清洗的功能。基本的统计功能不够强大。TextAnalyst不能和其他软件集成。fitting和神经网络技术开发需要很多时间,并且代价昂贵。PolyAnalyst的符号知识获取技术发现规律算法提供了一种很好的性能和复杂性的平衡。LLC公司的仙人掌策略Cactus Strategies是一个咨询解决方案,该方案集中在创建启发式预言商业工具和模型、商业开发和电子商务解决方案和应用。Cactus Strategies提供的商业工具最关键的一个特点是能够从通常的人口信息和合同信息以及客户描述信息中精确地选择最有可能响应的客户。PolyAnalyst是工具启发能力的核心,它能周期性地从数据中建模和给记录打分。应用行业案例:BioVisioN是一个生物研发公司,目标是使药物发现和诊断方面的技术商业化,对标识peptides缩氨酸和蛋白质proteins有很高的技术,由研发产生了大量数据。BioVisioN利用PolyAnalyst分析各种疾病在人体血液和尿液中的模型发现疾病的关联,以寻找诊断方法。19、MIS America(formerly MIS AG)MIS Alea and MIS DeltaMiner平台:Windows功能:DeltaMiner是一个激活的搜索代理,专门用于异常报告、控制和分析。MIS Alea是一个多维应用/服务,在Microsoft Excel的环境内处理商业模型。优点:维度非常灵活,具有定制的功能。wizard和menu驱动非常友好。缺点:需要一定的专业技能才能掌握该工具的各种功能。应用行业案例:HP公司利用该软件发现对中小企业的销售趋势,发现问题,作出预测。20、Oracle Corporation/datawarehouse/products/datamining Darwin平台:Windows NT/95 client/server,UNIX:Sun Solaris,HP-UX支持单个或多处理器环境功能:通过ODBC访问ASCII和RDBMS数据。构造模型的过程有wizards引导。Darwin 3.5支持数据挖掘算法:神经网络,分类和回归树,K-最近邻居、遗传算法、基于记应用行业案例:Two Crows公司是专门的数据挖掘和数据仓库市场分析和咨询公司。Two Crows和财富1000强公司合作,帮助他们开发数据挖掘策略、选择产品和实施数据挖掘解决方案,同时也和数据挖掘软件商合作帮助他们理解客户需求。公司需要理解客户,使得能够有效地获取新的客户、在原有客户上获得更多赢利、防止客户流失。行业研究表明获得一个新的客户必须花费维持一个老客户的5-6倍开销,公司目前都想求助于数据挖掘来提升客户关系管理。海量数据和成百个变量忆的推理(memory-based reasoning)、聚集和贝叶斯算法。Darwin使用MS Excel作为可视化数据挖掘结果和基于MS IE在线帮助。Oracle选择TMC(Thinking Machines Company)最为合作伙伴。Darwin的模型探索器Model Seeker和关键领域导航Key Fields wizards,交互式的树显示interactive tree display,lift charts,灵敏度分析sensitivity analysis,ROI和margin graphs,error tables和决策树规则decision tree rules是非常直观和可靠的。模型能够作为C,C+and Java代码导出,从而将customer scoring,campaign management和real-timeintelligent agents与企业其他应用程序集成,比如:Call Center等。模型探索器能自动构建多个模型,并且为用户选择最好的一个。工作流Workflow和scripting的特点提供了一个数据挖掘步骤的可视化描述和自动的数据挖掘过程。优点:三个关键强势:高度的可扩展性,由于能够使数据挖掘算法并行实现,所以能够挖掘海量数据;第二,模型能够容易导出,和其他应用集成;第三是Windows风格的客户端易于使用。缺点:缺乏在数据挖掘之前对数据的可视化探索。工作流不能可视化编辑。对数据挖掘软件是一个挑战。Two Crows公司对Darwin进行测试,结果如左所示。Cabletron Systems(NYSE:CS)公司是提供基于intranet网络解决方案(LAN、ATM)和软件,SPECTRUM Enterprise Manager是该公司的网络管理平台软件,24小时收集网络数据:事件、警告、统计信息,然后上载到一个离线的数据仓库供分析使用,由于200个左右的应用软件收集数据,所以数据量非常大。利用Darwin发现各个网络端口的相关性以及事件相关性,以发现网络故障诊断模型,提高网络的有效性。Nautilus Systems,Inc.是数据仓库和数据挖掘咨询公司,构建1:1的市场和客户关系管理解决方案,针对行业包括:医疗健康、金融、电信、政府。应用Darwin作为数据挖掘软件。21、Pilot Software(acquired by Accrue Software)Pilot Decision Support Suite平台:Windows NT功能:基于Web的商业智能解决方案。PDSS能够执行时序分析,作假设(what-if)分析,通过建立地区、时间、产品和其他种类的维度获得详细的信息-多维分析工具。优点:公司不仅在技术上,在商业上也有很深入的理解。报表能够定制。缺点:多层次功能在第二层次上不能按条件排序。Combe公司是家用和宠物商品的生产销售商。为了理解客户购买模型,利用PDSS作时序分析。也有利于很好地管理库存,有助于定制生产计划。利用时序分析跟踪每年客户购买模型的改变。22、Quadstone,Inc.Decisionhouse平台:UNIX,NT功能:Decisionhouse是一个客户行为建模的软件集,能够发现关Liverpool Victoria Friendly Society是一个金融协会,对2百万个客户提供投资、存款和保险服务。利用Decisionhouse进行客户关系管理,使合适的客户购买他们需要的商品,一个结果是直接MAIL项目响应率比原先提高了35%。键的特征,比如标记可能有defect的客户、或者哪些客户有较高的可能性购买特定的商品。Decisionhouse是CRM策略的关键部分。功能包括:查询、报表、数据挖掘、OLAP和可视化。Decisionhouse将数据转换成易于理解的3-D图形表示。根据目标对象(比如响应率或预言值)可能值标记高的和低响应率的客户分组和客户定级。通过OLAP的功能,Decisionhouse提供一种机制报告在实际的响应之后标记和理解详细的行为模式的成功率和机会。功能还包括客户分片和定位,客户行为的多维可视化,交叉表格报表cross-tabulated reports,决策树分片和响应模型,mailing and control cell lists。优点:实时、高速的客户分片和描述。易于使用的可视化界面。缺点:没有使用神经网络技术,以避免黑盒问题。没有内置的方法协助执行典型的分析,比如:mailing response,campaign creation.Decisionhouse创建了大量文件,这些文件需要专门培训过的人员才能熟练掌握。C&A是欧洲出名的零售商,成立于1841,公司在12个欧洲国家有579个商店。C&A每年有两个主要的direct mail campaigns。使用Decisionhouse和Quadstone公司的应用行业案例:咨询,提高响应率。目前,响应率增加2倍左右,赢利率提高了20倍。California San Francisco的CustomerLinx是一个基于知识的市场服务公司,提供多模式的客户分析,包括:inbound and outbound fax,IVR and Internet response services。基于各个渠道的客户分析,为不同的行业提供以客户为中心的市场解决方案,包括:电信、零售和电子商务。为了定位客户获取和流失问题customer acquisition and churn,CustomerLinx开发了客户中心解决方案。面向客户市场的核心是:the ability to tailor the offer,message or channel to individual customer needs,这些需要有效的客户分片技术。利用Decisionhouse来解决上述问题,使得CustomerLinx近来campaign response rate从0.8增长到4%。23、Salford Systems CART Decision-Tree Suite平台:Windows NT,UNIX功能:桌面型CART和Unix版本两种。都能产生cut-and-paste模型的源代码。CART能够处理脏数据。TreeCoder自动产生SAS代码。优点:精确的模型能够迅速地开发和实施。缺点:分类问题涉及yes/no或A or Bor C的种类目标变量,回归定位连续型目标变量,比如:花费的金额等。CART或任何其他决策树在回归问题上都处理得不好。为了克服这个缺陷,Salford Systems近来开发了MARS,一个数据挖掘工具以解决回归问题。American Express是全球旅游、金融网络服务提供商。利用CART进行数据分类,构建决策树,以提高赢利。24、SAS Enterprise Miner平台:Windows NT功能:Enterprise Miner为所有的模型开发产生全部的记分代码,这些记分代码能够立即应用到新的数据中。一个评Vermont Country Store是一家面向家庭的零售公司。利用数据挖掘工具EM定位target-mail和marketing strategy。估工具将数据挖掘结果转换成商业术语,结果能够通过Web共享。SAS的数据挖掘方法论称作SEMMA(抽样、探索、修改、建模、评估)。SAS/EM集成了:数据获取工具;数据取样工具;数据筛选工具;数据变量转换工具;数据挖掘数据库;数据挖掘过程;多种形式的回归工具;为建立决策树的数据剖分工具;决策树浏览工具;人工神经元网络;数据挖掘的评价工具。可利用SAS/EM中具有明确代表意义的图形化的模块将这些数据挖掘的工具单元组成一个处理流程图,并依此来组织用户的数据挖掘的过程。这一过程在任何时候均可根据具体情况的需要进行修改、更新并将适合用户需要的模式存储起来,以便此后重新调出来使用。优点:图形化的界面,可视化的操作,可导引即使是数理统计经验不太多的使用者也能按照SEMMA的原则成功的进行数据挖掘。对于有经验的专家,SAS/EM也可让用户一展身手精细的调整分析处理过程。缺点:临时文件花费了许多空间,打印决策树比较困难。25、Seagate Software(division of Seagate Technology)Seagate Holos平台:Unix,Windows,RDB,MDB功能:将关系数据库中的数据转换成OLAP cubes,然后装载到Seagate Holos客户端分析。可以定制。支持ROLAP和non-ROLAP。数据可以周期性的装载到系统。有自己开发的语言,使得客户能构造和定制复杂的企业商业智能系统。优点:混合的OLAP结构缺点:培训该软件需要时间和专业技能应用行业案例:Charles Schwab利用该软件进行多维分析,创建报表和模型,预测趋势。26、Search Software America Data Clustering Engine平台:AIX,Unix功能:产生ASCII文件,可以定制开发。将输入文件增加clustering key然后输出,为其标记打分,然后产生报表。不管数据质量如何,该软件都能将记录分组。IBM Brazil是一个计算机公司,用IBM的产品构建解决方案。使用Data Clustering Engine将公司合同的副本转换成外部文件,导入marketing系统的数据库。优点:易于使用缺点:不能访问关系数据库,不能执行scrubbing.27、Silicon Graphics Inc.(SGI)MineSet平台:Unix,OpenGL功能:将可视化方法和数据挖掘技术联合起来。有灵活的定制可视化报表的功能,产生预言模型,将结果以可视化方式表示。优点:数据可视化将数据转换成易于理解的图形。图形用户接口非常优美。缺点:是一个通用的数据挖掘工具,没有针对特定行业定制的应用。对RAM非常敏感,至少需要1G的内存运行在多线程的模式。应用行业案例:Procter&Gamble是制药企业,用MineSet分析由临床药物试验产生的数据库,以理解药物和人类疾病之间的关系,提高药物试验的有效性。Incyte是一个生物软件公司,Incyte的基因数据库、生物分析软件、生物学试剂和microarray服务被全世界19家顶尖的制药和生物技术公司使用。为了挖掘基因数据库,以理解基因和疾病的关系,发现新的基因模式和克隆新的基因,将MineSet作为公司开发的LifeTools 3D的一部分。New York,RGI Informatics specializes使用MineSet分析各种healthcare数据集:claims-based encounter and drug data,hospital discharge data,data residing in aclinical information database.28、SLP InfoWare,Inc.Churn/CPS平台:HP,SUN,IBM RS 6000.OS:Windows 95,Windows NT,UNIX.功能:对客户分片和记分,构建模型预言客户流失,计算客户生命周期值,推荐最佳解决方法。Churn/CPS自动分析客户行为信息,决定在客户流失背后的原因,分析的结果用来创建最有可能流失的客户的行为模型。对这些客户提供更经济的服务或者cross-sell和upsell这一类附加服务。Churn/CPS标记最有价值的客户,输出有可能流失的客户列表,并说明最有可能的原因。优点:灵活地创建客户行为模型,易于使用。缺点:少量的bugse应用行业案例:Bouygues Telecom是电信公司,具有超过300,000个客户,利用Churn/CPS分析客户流失,作出相应的市场营销策略。Cellular One是cellular供应商,占有超过50%的市场。目前还经营:cellular,beeper,long distance,prepaid cellular,prepaid long distance和CAP services。Retention部门使用Churn/CPS作客户流失分析,以保留现有客户。29、Speedware(V)Visonyze Televyze平台:客户端:Win3.11,Win95,NT.服务器:AIX,HP-UX,Sun,NT.GTE公司是世界最大的电信公司之一,在28个洲有21 million电话客户。利用Televyze跟踪从部门到单个员工的(provisioning/maintenance activity)成绩。市场部门利用该软件为特功能:Televyze的图表和图形的格式称作a briefing board。在这种格式的图表或图形上可以钻入了解更细节的层次(drill-down)。可以定制个人的briefing board(简报板),并且有突出和自己相关的数据和模型的功能。优点:从多个数据源抽取数据,briefing board格式的结果易读,各种报表有标准的模板,用户可以自己定制简报板。缺点:遗留文件必须每天装载,不能实时处理。定的客户分片和区域定制offerings。30、SPSS,Inc.Clementine SPSS for Windows平台:Server:Windows NT,Novell,UNIX.Client:Windows 95,Windows NT.功能:SPSS是数据清洗、数据挖掘、统计分析工具。Missing Value Analysis分析大数据集内的模式和内部关系,然后估算遗失的值。在SPSS Base中实际的数据挖掘产品:AnswerTree,Clementine and GoldMiner。具体技术:Kohonen神经网络,回归,因子分析,决策树,聚集,关联规则,规则归纳,单调回归,OLAP环境。SPSS分析也产生数据库记分database scores。SPSS for Windows将多个数据源的数据迁移到一个通用的数据集用于分析,分析功能包括:basic frequency distributions to correlations,regression和the more advanced econometric modeling。SPSS能够创模型的图形描述,并导出到PowerPoint。Clementine发现的模型能够转换成C语言代码,方法论-数据挖掘流方法stream approach。优点:界面友好,不需要编程,统计功能强大。缺点:有两个环境:SPSS Data Editor是主要分析数据的电子数据表环境;SPSS Output Navigator是所有的输出的仓库。用户很难知道选择存储时存储的是什么信息,即存储输出和存储数据比较容易混淆。应用行业案例:American Century Investments(ACI)is多方位的金融服务商。客户数据:交易数据transactional data,人口统计数据demographic,从数据提供商购买的行为数据behavioral data purchased from data providers。先创建数据仓库,然后利用SPSS软件进行挖掘,分析客户行为,作出智能决策。Meridian Resource Corporation是一个多方位的健康咨询公司。利用SPSS分析healthcare数据。解决以下问题1)确保数据的正确完整;2)决定数据中是否存在关系3)决定这些关系是否有意义。美国HSBC Bank有多于1.4 million个人银行客户,另外还有商业和公司客户。使用SPSS的数据挖掘工具分析客户,发现模型。三年内增加了15%的销售量,50%的客户有cross-selling的机会,留住了更多的客户。GfK是欧洲最大的市场研究机构。四个策略商业单元:consumer shopping behavior,consumer media behavior,retail tracking and ad hoc research.最近提供数据挖掘服务称GfK ConsumerConsult,Clementine是核心软件。BT,英国电信使用Clementine作客户分析,定位direct mail campaign 31、SRA International KDD Explorer平台:Sun SparcStation workstations.功能:KDD Explorer工具集提供了一个构建欺诈检测和知识发纳斯达科(NASD)NASD Regulation analysts使用KDD Explorer作为for股票市场潜在欺诈的监督软件。现的环境。欺诈检测通过规则和序列匹配算法,检测数据库中的实例,匹配那些有可能是欺诈的模式。用Java开发,可以定制可视化界面。知识发现组件包括:决策树,关联规则。优点:在大数据集上高性能、可以定制的数据挖掘和欺诈检测能力。算法能够在并行机上运行。用户接口用Java开发,能够运行在多个平台上,模式用自然语言表达易于理解。缺点:不能嵌入其他应用程序,没有数据预处理的能力。32、thinkAnalytics Corporation K.Wiz平台:Windows NT 4.0功能:作为back-office关键工具。定期自动分析客户交易数据构建预言和商店的概要信息。这些信息和零售报表环境集成。基于Java的API。优点:可视化的编程环境,基于java的API。缺点:由于基于Java的解决方案,GUI响应较慢。Triversity公司是brick-and-mortar和click-and-mortar零售商,有400员工,32个国家的350个客户,25,000个商店,120,000 terminals和每年1忆笔交易。Retailers公司使用K.wiz理解和管理客户忠诚度程序,分析客户购买行为和人口统计信息。33、Unica Corporation Affinium Model(formerly Model 1)平台:Windows 9X/NT功能:包括4个模块:响应模型,交叉销售,客户评估,分片和概貌。算法的参数能够手工设置也能自动生成。记分wizard自动做所有的数据转换和预处理工作,能够对整个客户数据库迅速并且精确的记分。Model 1是一个为市场营销应用的数据挖掘软件Response Modeler模块基于客户历史响应结果预言客户响应,;Customer Segmenter将相似客户分成组,并且解释组间的不同;Customer Valuator预言一个客户的生命周期值;Cross-Seller预言客户可能会购买与定单上相关的商品。Model 1产生模型和分数,能以un-time library或C语言代码输出模型。优点:运行快速,界面直观,导
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论