![[硕士论文精品]网上售卡系统的设计与实现_第1页](http://file.renrendoc.com/FileRoot1/2017-12/8/74cc3953-80f1-48e5-9c74-d5f84982c17a/74cc3953-80f1-48e5-9c74-d5f84982c17a1.gif)
![[硕士论文精品]网上售卡系统的设计与实现_第2页](http://file.renrendoc.com/FileRoot1/2017-12/8/74cc3953-80f1-48e5-9c74-d5f84982c17a/74cc3953-80f1-48e5-9c74-d5f84982c17a2.gif)
![[硕士论文精品]网上售卡系统的设计与实现_第3页](http://file.renrendoc.com/FileRoot1/2017-12/8/74cc3953-80f1-48e5-9c74-d5f84982c17a/74cc3953-80f1-48e5-9c74-d5f84982c17a3.gif)
![[硕士论文精品]网上售卡系统的设计与实现_第4页](http://file.renrendoc.com/FileRoot1/2017-12/8/74cc3953-80f1-48e5-9c74-d5f84982c17a/74cc3953-80f1-48e5-9c74-d5f84982c17a4.gif)
![[硕士论文精品]网上售卡系统的设计与实现_第5页](http://file.renrendoc.com/FileRoot1/2017-12/8/74cc3953-80f1-48e5-9c74-d5f84982c17a/74cc3953-80f1-48e5-9c74-d5f84982c17a5.gif)
文档简介
V摘要随着信息技术的迅速发展,网上销售正越来越广泛地应用于经济贸易领域。人们己不满足现今的在购物场所的购物方式,更加热衷于网上购物,人们可以不受时间、空间的限制,足不出户就可以选到自己满意的商品。从长远看,这是发展的必然趋势,因此相关软件的研发技术也倍受重视。本文结合卡类商品在网上销售的实际课题,给出了一个具有数据挖掘功能的网上售卡系统的设计方案,并加以实现。将电子商务当中所涉及到的各种理论知识、相关技术以及数据挖掘知识融合到该系统中,体现了电子商务的内部运作机理以及数据挖掘理论在实际应用中的功效。系统的主要功能包括网上销售信息发布、客户浏览、订单管理、购物车等。该系统采用MVC设计模式,由模块MODEL、视图VIEW和控制器CONTROLER三部分组成,并且根据WEB应用和NET框架在MVC模式下,使控制器与模型交互抽取需要显示的数据并传递给视图,视图只负责处理数据表示,使得数据处理逻辑与它的表现形式分离,从而可以分清开发者的责任,后台开发人员可以专注业务的处理,前台开发人员专注于用户交互的界面,加快了开发的速度。该系统目前已经在网上运行,情况良好,客户对此销售系统也较为满意,系统运行稳定。关键词NET,数据挖掘,网上销售VIABSTRACTWITHTHERAPIDDEVELOPMENTOFINFORMATIONTECHNOLOGY,ONLINESALEISMOREWIDELYPUTTOTHEDOMAINOFECONOMYANDTRADETHESHOPPINGFASHIONINTODAYSSHOPPINGGROUNDSCANNOTMEETWITHTHEREQUIREMENTSOFBUYERS,WHOTURNOUTTOPREFERONLINESHOPPING,WHEREONECANRETRIEVEHISWANTSONANYSPOTATANYTIMEINTHELONGRUN,ONLINESALEISTHENECESSARYTRENDOFEVOLUTION,SOTHERESEARCHOFWHOSERELEVANTSOFTWAREISPAIDMOREATTENTIONTOTHETHESISPROVIDESADESIGNPROJECTOFONLINECARDSSELLINGSYSTEMWITHDATAMININGFUCTIONANDIMPLEMENTSITTHEMAINFUNCTIONINCLUDESSUBMITTINGSALEINFORMATION,BROWSINGCLIENTS,PLACINGORDERS,MANAGINGORDERFORMS,MANAGINGBUYINGCARTS,ANDSOFORTHTHESYSTEMTAKESMVCPATTERN,ANDISCOMPOSEDOFMODEL,VIEWANDCONTROLERINFRAMEWORK,MAKINGCONTROLERSINTERACTWITHMODELSINORDERTODRAWOUTDATANEEDEDTOBESENTTOVIEWS,WHICHISONLYINCHARGEOFDATAVISIONTHESTRUCTUREMAKESTHEDATAINTENTLYWORKONBUSINESSPROCESS,ANDTHECANINTENTLYWORKONUINOWADAYSTHESYSTEMHASBEENPUTTOUSEITGOESWELL,ANDCUSTOMERSARESATISFIEDWITHTHESALESYSTEMTHESYSTEMRUNSSTABLYKEYWORDSNETFRAMEWORK,DATAMINING,ONLINESALEIII上海交通大学学位论文原创性声明本人郑重声明所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名王少波日期2006年7月19日IV上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密,在年解密后适用本授权书。本学位论文属于不保密。(请在以上方框内打“”)学位论文作者签名王少波指导教师签名步丰林陈昊鹏日期2006年7月19日日期2006年7月19日淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第1章绪论1第1章绪论11研究背景仅仅20年前,还是大型机的时代,那时只有极少数人在使用计算机,而且只能通过临近的信息产业机构去使用。然而,个人电脑和图象化用户界面的出现却改变了这一切,将计算机普及到了千家万户,并使它真正成为一种大工业生产的商品。企业界意识到,由个人电脑联结起来的网络和基于个人电脑的服务器可能改变他们的商务模式,而个人电脑对消费者来说也迅速成为新兴的娱乐媒介。然后,因特网接踵而至并在全球范围内以一种不可阻挡的势头迅猛发展着,今天,全球有将近3亿人口正在使用因特网,据预测,全球上网人数将在3年内增至85亿。在这样一个网络时代中,人类的生存方式也迅速改变着,它革命性地改变了我们的交流方式,创造了丰富而新颖的信息和娱乐资源。“信息的DNA”正在取代原子而成为人类生活中的基本交换物。数字科技为我们的生活、工作、教育和娱乐带来各种意想不到的冲击。正如美国副总统戈尔1998年1月31日在加利福尼亚科学中心演讲时所说的那样“21世纪,我们将在数字地球上生存。”任何新事物都代表着一种趋势,那些符合人类进步的趋势必然会得到大家的认同。电子商务ELECTRONICCOMMERCE就是这样一种事物,它对人类社会进行着全方位的改造,在企业竞争、政府部门、公共研究机构、教育以及娱乐等方面改变着人类相互交往的方式,为人们展示了一个全新、璀璨的世界。由于电子商务的出现,传统的经营模式和经营理念将发生巨大的变化。电子商务将会创造巨大的效益和机会,会将市场的空间形态、时间形态和虚拟形态结合起来,将物流、资金流、信息流汇集成开放的、良性循环的环路,使经营者以市场为纽带,在市场上发挥最佳的作用,得到最大的效益。电子商务的发展,不仅将有力地推动INTERNET的发展,对社会的进步和经济的变革产生深远影响,更重要的,它本身的发展和成熟为我们提供了许许多多的机会。随着INTERNET的普及,越来越多的企业建立了自己的WWW网站,企业通过网站可以展示产品,发布最新动态,与用户进行交流和沟通,与合作伙伴建立联系,以及开展电子商务等。电子商务软件的需求量迅速增加,十分需要设计一种快速、有效地开发模式。同时,相关的信息数据却急剧膨胀。这些海量的、以不同形式存储的数据资料,表面上杂乱无章且缺乏组织的规整化,但事实上却包含了许多潜在的、有价值的知识和规则,如何从这些海量的数据中发现有用的知识是知识工程研究面临淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文2的新课题。具有数据挖掘(DATAMINING)功能的网上售卡系统就是为了满足这种要求而设计的,它将人工智能技术和数据库技术结合,让计算机帮助人们从庞大的数据中自动地抽取有价值的知识模式,提供给上层管理决策部门,以满足不同应用的需要,从而为电子商务企业带来更大的效益。为此论文设计并开发了一个具有数据挖掘功能的网上售卡系统,将电子商务当中所涉及到的各种理论知识、相关技术以及数据挖掘知识融合到该系统中,以期望体现电子商务的内部运作机理以及数据挖掘理论在实际应用中的功效。12研究现状总的来说,目前开发电子商务系统存在着以下几点不足之处1电子商务系统的开发,可复用性不强,不具有良好的可扩展性和可维护性。2没有重视和运用客户数据。目前的购物系统不重视保存在购物过程中留下客户的数据;对客户数据的分析处理不够;对客户数据在网上的营销中的应用不够。网上销售中的促销手段不够,难以吸引和留住客户。购物系统作为企业与客户之间联系的桥梁,在客户数据日益被重视的今天,购物系统中要充分重视客户数据的运用。卡类产品的销售,不同于其他商品,具有其自身的特点。现在,在网络上还没有一套专门销售卡类产品的系统,针对它们的销售一般都融入其他的电子商务网站中;也没有针对于收集到的用户和售卡信息进行数据挖掘,造成大量的数据资源浪费。因此,论文以网上售卡系统为例,采用MVC设计模式开发系统。实现了网上售卡系统担负着双层作用,一方面可以用来动态发布有关产品和服务、特别推荐或优惠项目,并及时向代理售卡客户公告经营业绩、技术与营销策划进展;另一方面又可以对收集到的用户和售卡信息进行数据挖掘,指导网站经营者调整经营策略,从而吸引顾客,扩大销售网络。13关键问题及技术路线1选择NET技术作为系统的开发平台,并设计一套针对电子商务系统的MVC设计模式,开发可复用性强,具有良好的可扩展性和可维护性的网上售卡系统。2对数据挖掘方法进行比较之后,选择一种合适的方法,对收集到的用户和售卡信息进行数据挖掘,指导网站经营者调整经营策略,从而吸引顾客,扩大销售网络。淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文3第2章基础理论介绍21电子商务系统概述211电子商务系统虽然电子商务形成和发展了多年,但到目前为止,国际上对电子商务尚无形成统一规范的定义。许多国际组织、企业和个人都根据自己的理解,从不同的角度提出了的对电子商务的各种定义。综合各方的观点,一般来讲,电子商务是指通过网络以电子技术和数据流通的方式在全世界范围内进行并完成的各种商务活动、交易活动、金融活动和相关的综合服务活动。它借助计算机技术、网络技术和现代通讯技术,通过电子交易手段为完成金融、物资、服务和信息等价值交换,快速而有效地从事各种商务活动的方法。它包括广义的电子商务,即泛指企业用电子技术手段实现商务及运作管理的整个过程,以及狭义的电子商务,即通过INTERNET或电子数据交换进行的交易活动。1电子商务系统最早产生于八十年代,当时是依附于专用的信息交换系统,交易范围限制在较封闭的系统中进行。进入九十年代以来,伴随INTERNET在全球范围内的迅速崛起和普及,电子商务成功地实现了从传统的基于专用网的发展模式向基于INTERNET的现代电子商务模式的质的飞跃,并借助因特网遍布全球。电子商务采用了基于开放标准上的INTERNET通信信道,与传统的商务活动通信方式相比较,其内容和内涵发生了很大变化。电子商务的交互性使单向的通信变成了双向的、互动的通信,扩大了信道的功能,不仅能传递信息,还能用于支付和传递服务。另外,电子商务还能够为企业提供虚拟的全球性贸易环境,能在商务运作的整个过程中实现无纸化、直接化和智能化,大大提高了商务活动的水平和服务质量。由于以上各种原因,电子商务开始迅猛地发展起来。212电子商务的框架一个完善的电子商务系统应该包括哪些部分,目前还没有权威的论述。从实践来看,由于电子商务覆盖的范围十分广泛,因此必须针对具体的应用才能描述清楚系统架构。从总体上来看,电子商务系统是三层框架结构。底层是网络平台,是信息传送的载体和用户接入的手段,它包括各种各样的物理传送平台和传送方淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文4式;中间是电子商务基础平台,包括CA(CERTIFICATEAUTHORITY)认证、支付网关PAYMENTGATEWAY和客户服务中心三个部分,其真正的核心是CA认证;而第三层就是各种各样的电子商务应用系统。其中电子商务基础平台是各种电子商务应用系统的基础。1)体系结构应用服务器应当具备的首要特性是至少三个层次的服务器端体系结构请求接收层、应用处理层、数据处理层。所有的应用请求,都将通过请求接收层(一般就是WEB服务器),然后转给应用处理层中的应用服务器处理。应用服务器是独立的进程,对业务进行处理,并进行事务管理,将其中的所有数据操作转给第三层(也就是数据处理层)的数据库服务器。在有些情况下,也可以转给后面的其他系统。应用服务器体系结构的核心在一般的WEB服务器和数据库服务器之间,增加专门的应用服务器来完成业务处理,而不像第二阶段的方法,直接从WEB服务器访问数据库服务器。2)负载均衡使用应用服务器体系结构,增加了一层,使系统的复杂度大大增加,但是这也带来很多的好处。最基本的好处就是给系统带来了可扩展的性能。当用户建立自己最初的系统时,无法精确预计未来的系统规模。如果一开始设计的系统规模很小,那么就无法适应可能出现的未来大规模发展。如果开始设计的规模很大,那么很有可能会造成投资的浪费。在这种情况下,用户的最佳选择是可以先建立一个小规模的系统,而在系统规模扩大时,可以方便地进行扩充,不需要进行应用的重新开发和调整等高风险性的操作。应用服务器体系结构就可以满足用户的这种要求。所有的应用服务器系统,都具有负载均衡的能力,即将用户发来的请求,恰当地分配给各个应用服务器,使大家可以分别负担系统的负载。通过使用负载均衡,用户在扩大系统时,只需增加几台新的服务器,安装应用服务器软件,再进行恰当的配置即可,无需对应用进行任何修改,这样就满足了可扩展性能的要求。应用服务器实现负载均衡的方法很多,但各有利弊。首先是负载分配算法。当前主要的负载分配算法有两种。一种是精确的负载分配,即系统存在一个分配器,在收到请求时,先询问分配器,找到一个合适的请求,再交给合适的应用服务器进行处理。另一种是基于统计的负载分配,即在收到请求时,根据预先设置的权值,按概率直接分配给后面的各个应用服务器。精确的算法可以保证不出现某些应用服务器很忙,而有些没事干的情况,但是每个请求需要两次通信才完成,所需的时间较长。基于统计的分配,由于需要预先对各个应用服务器的负载进行估计,很难做到非常准确,所以可能造成分配不均,但是其优点是只需一次通信,淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第2章基础理论介绍5处理速度较快。在应用服务器本身的实现上,又有基于进程和基于线程这两种方式。基于进程的方式是指预先生成所有的应用服务器进程,在收到请求时,由某个应用服务器进程来完成所有的处理。而基于线程的方式是指在每台计算机上只建立很少的应用服务器进程,在收到请求时,临时生成一个线程来完成处理。基于进程的方式由于不需要任何创建线程的操作,所以速度较快。但是由于每个进程所占用的资源比每个线程的要多,所以同样一台计算机上可以同时运行的进程数比线程数要少,因此其并行处理能力要弱于基于线程的方式。3)高可靠性应用服务器是一种特定形式的分布式系统,而分布式系统最重要的特征之一是建立高可靠性的系统。在应用服务器领域,一般说的可靠性是指错误容忍和错误恢复两个特性。错误容忍是指在发生一定的错误,包括硬件错误、软件错误和网络错误的情况下,系统对外仍然可以正常工作。这里所说的“一定的错误”,对于大多数应用服务器系统,是指至少还有一台应用服务器还在工作。错误容忍有两个等级,一个比较初步的等级是发生错误时正在处理的请求将不能被正确处理,当然用户可以重发请求,此外可能由另一个正常的服务器处理完成。比较完善的等级是将这些处理了一部分的请求转给其他服务器来继续处理,用户端感觉不到任何区别。当然,这个等级提供的服务较好,但是一般是以性能和复杂度为代价的,各个应用可以根据自己的特点,选择某个错误容忍等级。在发现错误和容忍错误的前提下,更加完善的应用服务器还可以进行错误恢复,即错误发生后,如果经过自动或手工的处理,错误被排除了,那么这些应用服务器应当可以恢复工作,继续为用户提供服务。这方面的技术与提供高可用性的技术相关。4)数据库连接池数据库处理往往是整个业务处理中最耗时的步骤。而在各种数据库操作的步骤中,数据库的连接和释放往往又特别耗时。在应用服务器系统中,一般都采用数据库连接池(CONNECTIONPOOL)技术,即在系统初启,或者初次使用时,完成数据库的连接,而后不再释放此连接,而是在处理后面的请求时,反复使用这些已经建立的连接。这种方式可以大大减少数据库的处理时间,有利于提高系统的整体性能,因此被广泛地应用在各种应用服务器产品中。5)分布会话管理由于标准的HTTP请求是每个请求一个连接的,为了方便用户使用,系统一般都会利用COOKIE、SESSION、IP地址识别等技术来实现会话管理。例如在用户登录后,记住用户的基本信息等。在单服务器的情况下,会话管理是比较容易实现的,但是在多服务器时,存在会话信息的存放地点问题。当前一般的解决方法有两种。淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文6一种是在每个服务器上保存自己的会话信息,这样,进行负载分配时,必须是基于会话的,而不是基于请求的,不然会造成会话信息的不一致。另一种是专门建立一个会话服务器,利用它进行会话信息的保存。这样做可以方便负载分配算法,易于进行错误容忍。但其缺点是增加了一次网络通信的时间,使处理速度减慢。6)嵌入对象在应用服务器中,一般都提供嵌入对象,以便完成各种底层的功能,并实现与其他系统的连接。但是各个应用服务器之间在嵌入对象方面的差别很大。主要在对象放置的位置和对象接口上。应用服务器中的嵌入对象,一般可以放置在应用服务器上,也可以放置在应用服务器后端。放在应用服务器上,可以使对象访问成为本地的访问,不需要进行任何网络通信,性能较好,但是这些对象在各个应用服务器上会同时存在,因此,不能实现对象的长期内部状态。放置在应用服务器上时,又有两种实现,一种是全对称的,即各个应用服务器上都安装所有的对象,另一种是非对称的,有些对象只安装于某些服务器上,这样做还需要负载分配程序的配合。如果将嵌入对象放在应用服务器后端,实际上就又增加了一个层次,即嵌入对象层,使整个系统变成四层。这样做会增加网络通信,降低性能,但是对象的设计将比较灵活,而且可以使用各种现有的对象连接接口。7)开发方法应用服务器的开发方法和前面所说的第二阶段的开发方法类似,一般都是以某种服务器端脚本语言为主要的开发语言。这些语言一般都是将经常使用的某种语言,或某些语言的特性,以嵌入页面的方式使用。为了便于开发,有些应用服务器还提供开发版的服务器,以便进行各种调试工作。为了能够最好地方便用户的开发,各个应用服务器一般还提供自己的集成开发环境,将本地编辑、上传、项目管理和调试工具等集中在一起,使开发工作在一个界面内全部完成。还有一些开发环境同时提供后台系统的开发环境,以便同时进行开发管理。此外,还有一些产品内置一些代码的自动生成器,数据库设计辅助工具。8)高速缓存机制为了达到最佳的性能,许多应用服务器都采用了高速缓存机制。在应用服务器中使用高速缓存一般包括两个地方,即页面的缓存和数据库的缓存。页面的缓存是指将特定的URL对应的页面在缓存中予以记录,以便在将来再次访问同一个URL时,直接使用。这里的缓存可以达到最佳的缓存性能,任何后面的操作都不需要进行了,只需将缓存读出,然后输出即可。但是,由于大多数URL对应的页面中,往往都有少量需要变动的信息,这些页面不能使用这种方法进行缓存。数据库的缓存是指系统对数据库的访问结果进行缓存,这样,相同的SQL再次去访问淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第2章基础理论介绍7数据库时,就不需要进行真正的数据库操作,而只需读取缓存即可。这种缓存能够达到良好效果的前提是系统的主要开销在于数据库访问。由于系统依然需要进行有关页面生成等工作,所以缓存效果不如页面缓存,但是适用面比较广。上述所有的解决方法都不能简单地判断优劣,而是适用于不同类型的系统。例如可靠性和高性能之间总是存在一定的矛盾,如果要建立的是一般的面向大众的商业系统,那么高性能的重要性大大增加,可以采用某些初步的可靠性策略,而如果建立的是电子银行系统,那么可靠性的要求就会超过高性能的要求,就需要采用更加完善的可靠性策略。因此,用户在选购应用服务器产品时,需要先充分了解自己的需求到底是什么,然后确定各个主要技术问题上,自己合适的解决方法,最后寻找使用这些解决方法的产品来完成自己的系统。213电子商务的特点电子商务具有以下几个主要特点系统性、动态关联性、经济性、竞争性。系统性电子商务的实施是一个复杂的系统工程,它需要商品交易中应用网络技术、通信技术;需要变革传统的商品和资金流转方式;需要获得法律的认可和保障等等。只有各个子系统协调运作,才能最终实现商品交易的电子化。动态关联性一方面,电子商务交易网络内部的信息、资金、商品在不停流动,买卖双方也在不断变更,不能人为阻止数据的传输,具有动态性的特点;另一方面,电子商务的不同参与者,如厂商、银行、消费者、运输部门之间存在着有机的关联,正是各参与者的相互作用、相互依赖,才保证了电子商务的正常运转。经济性传统商务活动,特别是全球范围内的商务活动,其先期投入和运营成本通常都十分巨大,相比之下,电子商务的投资和运营成本非常低廉,通常只有传统方式的百分之几,这也是电子商务能在短短几年中迅速席卷全球的重要原因。竞争性信息己成为信息时代最重要的战略资源,电子商务则是最好的获取手段,利用电子商务方式,企业可以构筑覆盖全球的商业营销体系,实施全球性的营销战略,加强全球性竞争能力。214电子商务的流程商务流程对于电子商务系统是十分重要的。商务流程是指企业在具体从事一淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文8个商贸交易过程中的实际操作步骤和处理过程。这一过程按照组织内部处理活动的方式又可细分为物流,即商品的流动过程;资金流,即交易过程中资金在双方单位包括银行中的流动过程;信息流,即商品基本信息和商务活动信息的流动过程。电子商务的交易流程可简单表述如下企业将商品信息通过WWW服务器展示给客户,客户通过浏览器访问WWW服务器,选择希望购买的商品,并下载厂商的表格,填写订单,厂商通过订单确认反馈客户,告知收费方法。同时厂商通知自己的应用系统组织货源程序,客户通过电子付款软件与金融部门交互,执行资金转移,金融部门通过电子邮件或其他方式通知客户和厂商资金转移的结果,厂商委托专人或运输部门将货物送至客户。215电子商务相关技术及体系结构的发展二十世纪八十年代出现了CLIENT/SERVER的计算模式,在这种模式下,应用被分为客户端和服务器端,客户端会向服务器端提交请求,而服务器端收到请求后会执行相关程序,并将结果返回给客户端,这时的CLIENT/SERVER是两层结构。它的优点是运算负载由客户机和服务器双方共同承担,但是它要求所有的应用逻辑都驻留在客户端,对客户端上多个应用的维护和更新相当困难,而且客户端的增加易造成网络瓶颈。为了解决上述问题,三层CLIENT/SERVER系统发展起来,它把应用分为表示层、应用逻辑层和数据访问层。在应用逻辑层可以实现通用的被不同客户应用共享的商业规则,大大提高代码的可复用程度,不仅维护方便,而且增加了系统的可伸缩性,提高了系统资源的利用率。由此,又提出了多层结构,就是有多个中间功能层。随着INTERNET的普及,WEB方式得到了很大的发展,从CLIENT/SERVER上发展起来的BROWSER/SERVER(浏览器服务器)结构获得了广泛的应用,它易于维护和升级,同时有良好的开放性和可扩展性。电子商务作为网上应用,其体系结构也是使用BROWER/SERVER来实现的。在INTERNETINTRANET技术飞速发展的时代,为完成日益复杂的企业应用,微软公司发展了传统的客户朋良务器模式,提出了完整的三层多层客户服务器分布式解决方案,于1997年9月正式发布了WINDOWSDNA体系结构。WINDOWSDNADISTRIBUTEDINTERNETARCHITECTURE是基于WINDOWS平台的互联网络分布式应用体系结构。微软WINDOWSDNA也是第一种把INTERNET,客户机、服务器以及PC计算模式集成为一体的应用体系结构,为广大用户提供了新的分布式计算解决方案。淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第2章基础理论介绍9WINDOWSDNA的核心是通过COM/DCOM把WEB和多种客户和以服务器应用开发模式集成为一体,以满足开发各种多层结构的现代分布式应用的需求。用户只须专注于开发自身需要的业务解决方案而无须关注系统集成,使开发人员可以集中考虑解决业务问题而不必处理各种技术细节。2WINDOWSDNA完全支持WEB计算。它对于所有INTERNET开放的协议和公布的接口的支持,使得这一体系结构与现有各种体系之间具有很好的互操作性,很容易与其它厂商的解决方案集成。同时,它是一个与编程语言无关的体系结构。可以支持多种开发工具。多层结构分布式对象计算技术还有对象管理组织的CORBA和SUN公司EJB等。22数据挖掘的概念与技术近十几年,随着科学技术飞速的发展,经济和社会都取得了极大的进步,与此同时,在各个领域产生了大量的数据,如电子商务每天收集的巨额交易数据。显然在这些数据中丰富的信息,如何处理这些数据得到有益的信息,人们进行了有益的探索。计算机技术的迅速发展使得处理数据成为可能,这就推动了数据库技术的极大发展,但是面对不断增加如潮水般的数据,人们不再满足于数据库的查询功能,提出了深层次问题能不能从数据中提取信息或者知识为决策服务。就数据库技术而言已经显得无能为力了,同样,传统的统计技术也面临了极大的挑战。这就急需有新的方法来处理这些海量般的数据。于是,人们结合统计学、数据库、机器学习等技术,提出数据挖掘来解决这一难题。231数据挖掘的基本概念数据挖掘DATAMINING是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计算,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术,是知识发现KNOWLEDGEDISCOVERYINDATABASE的关键步骤。1数据挖掘的任务数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。(1)关联分析ASSOCIATIONANALYSIS关联规则挖掘是由RAKESHAPWAL等人首先提出的。两个或两个以上变量的取淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文10值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。(2)聚类分析CLUSTERING聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。(3)分类CLASSIFICATION分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。(4)预测PREDICATION预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。(5)时序模式TIMESERIESPATTERN时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。(6)偏差分析DEVIATION在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。2数据挖掘对象根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及INTERNET等。3数据挖掘流程(1)定义问题清晰地定义出业务问题,确定数据挖掘的目的。(2)数据准备数据准备包括选择数据在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等。(3)数据挖掘根据数据功能的类型和和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。(4)结果分析对数据挖掘的结果进行解释和评价,转换成为能够最终被用淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第2章基础理论介绍11户理解的知识。(5)知识的运用将分析所得到的知识集成到业务信息系统的组织结构中去。4评价数据挖掘软件需要考虑的问题越来越多的软件供应商加入了数据挖掘这一领域的竞争。用户如何正确评价一个商业软件,选择合适的软件成为数据挖掘成功应用的关键。评价一个数据挖掘软件主要应从以下四个主要方面(1)计算性能如该软件能否在不同的商业平台运行;软件的架构;能否连接不同的数据源;操作大数据集时,性能变化是线性的还是指数的;算的效率;是否基于组件结构易于扩展;运行的稳定性等;(2)功能性如软件是否提供足够多样的算法;能否避免挖掘过程黑箱化;软件提供的算法能否应用于多种类型的数据;用户能否调整算法和算法的参数;软件能否从数据集随机抽取数据建立预挖掘模型;能否以不同的形式表现挖掘结果等;(3)可用性如用户界面是否友好;软件是否易学易用;软件面对的用户初学者,高级用户还是专家错误报告对用户调试是否有很大帮助;软件应用的领域是专攻某一专业领域还是适用多个领域等(4)辅助功能如是否允许用户更改数据集中的错误值或进行数据清洗;是否允许值的全局替代;能否将连续数据离散化;能否根据用户制定的规则从数据集中提取子集;能否将数据中的空值用某一适当均值或用户指定的值代替;能否将一次分析的结果反馈到另一次分析中,等等。数据挖掘技术是一个年轻且充满希望的研究领域,商业利益的强大驱动力将会不停地促进它的发展每年都有新的数据挖掘方法和模型问世,人们对它的研究正日益广泛和深入。232关联规则的基本概念和问题描述关联规则是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构,通过分析数据或记录间的关系,决定哪些事情将一起发生。设II1,I2,IN是项的集合,其中的元素称为项,S为T的集合,这里T是项的集合,并且TI。如果XT,那么称T包含X。一个关联规则是形如XY的蕴涵式,这里XI,YI,并且XY。规则XY在集合S中的支持度(SUPPORT)是S集中包含X和Y的数与所有项数之比,记为SUPPORTXY,即SUPPORTXYTXYT,TS/S规则XY的可信度是指包含X和Y的数与包含X的数之比,记为淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文12CONFIDENCEXY,即CONFIDENCEXYTXYT,TS/TXT,TS关联规则挖掘的任务是给定一个集S,求出所有满足最小支持度和最小可信度的关联规则。关联规则发现交易数据库中不同商品(项)之间的联系,这些规则找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。发现这样的规则可以应用于商品货架设计、货存安排以及根据购买模式对用户进行分类。AGRAWAL等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;对关联规则的应用进行推广。233关联规则挖掘的算法1经典频集方法AGRAWAL等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,其核心方法是基于频集理论的递推方法发现规则地过程分成两个步骤。第一步,发现所有的大项集,也就是支持度大于给定最小支持度的项集(ITEMSET),这些项集称为频集(FREQUENTITEMSET);第二步,从频集中产生相关规则,使用第一步找到的频集产生期望的规则。而且挖掘的性能主要由于第一步决定,当确定了大项集后,相关规则就可以很容易直观得到。所以挖掘的工作也主要着重于发现大项集。RAGRAWAL等人首先提出规则发现算法之后,该方法在国际上得到研究者的广泛研究,提出了许多形形色色的算法。RAGRAWAL在后来提出一个改进方法修剪技术,该方法是基于这个一个事实频繁项目集的任何子集必定也是频繁的。这样,如果某项目集I中存在一个不属于LK1的(K1)子集,那么该项目集I就不可能是频繁的,因而可以从候选项目集中删除。于是不用算该项目集I的支持度。为了提高频繁项目集的发现效率,PARK等人提出了直接哈希修剪DHP算法。该得法指出在生成和发现频繁2项目集上耗费的时间十分可观。DHP算法通过直接哈希修剪技术快速发现频繁2项目集,借以提高关联规则发现的效率。2频集算法的几种优化方法虽然APRIORI算法自身已经进行了一定的优化,但是在实际的应用中,还是存在不令人满意的地方,它的主要问题还是在于频繁集的构造效率问题。当交易数据库的数据量非常巨大时,APRIORI的经典算法的计算量还是非常大。于是人们相继提出了一些优化的方法。(1)基于划分的方法。SAVASERE等设计了一个基于划分PARTITION的算法,淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城第2章基础理论介绍13这个算法先把数据库从逻辑上分成几个互不相交的块,每次单独考虑一个分块并对它生成所有的频集,然后把产生的频集合并,用来生成所有可能的频集,最后计算这些项集的支持度。这里分块的大小选择要使得每个分块可以被放入主存,每个阶段只需被扫描一次。而算法的正确性是由每一个可能的频集至少在某一个分块中是频集保证的。上面所讨论的算法是可以高度并行的,可以把每一分块分别分配给某一个处理器生成频集。产生频集的每一个循环结束后,处理器之间进行通信来产生全局的候选K项集。通常这里的通信过程是算法执行时间的主要瓶颈;而另一方面,每个独立的处理器生成频集的时间也是一个瓶颈。其他的方法还有在多处理器之间共享一个杂凑树来产生频集。(2)基于HASH的方法。一个高效地产生频集的基于杂凑HASH的算法由PARK等提出来。通过实验我们可以发现寻找频集主要的计算是在生成频繁2项集上,PARK等就是利用了这个性质引入杂凑技术来改进产生频繁2项集的方法。(3)减少交易的个数。减少用于未来扫描的事务集的大小。一个基本的原理就是当一个事务不包含长度为K的大项集,则必然不包含长度为K1的大项集。从而我们就可以将这些事务移去,这样在下一遍的扫描中就可以要进行扫描的事务集的个数。这个就是APRIORITID的基本思想。3关联规则的相关研究课题(1)基于规则中处理的变量的类别为数值型的关联规则的挖掘。经典的算法是基于布尔型数据类型的关联规则的,它显示了这些变量之间的关系;而数值型关联规则可以和多维关联或多层关联规则结合起来,对数值型字段进行处理,将其进行动态的分割,或者直接对原始的数据进行处理,当然数值型关联规则中也可以包含种类变量。对于数值型规则的挖掘要对数据进行预处理,分割数据段来处理。例如性别“女”职业“秘书”,是布尔型关联规则;性别“女”TAVG(收入)尿布,这条规则只涉及到用户的购买的物品;而在多维的关联规则中,要处理的数据将会涉及多个维。换成另一句话,单维关联规则是处理单个属性中的一些关系;淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文14多维关联规则是处理各个属性之间的某些关系。例如,性别“女”职业“秘书”,这条规则就涉及到两个字段的信息,是两个维上的一条关联规则,这就产生一个面对多维数据的关联规则挖掘课题。淘宝网购物HTTP/WWW521TAOBAOCOM/淘宝网购物商城上海交通大学工程硕士论文15第3章网上售卡系统需求分析31系统可行性分析311网上售卡系统可行性分析可行性分析(FEASIBILITYANALYSIS)也称为可行性研究,是在系统调查的基础上,针对新系统的开发是否具备必要性和可能性,对新系统的开发从技术、经济、社会的方面进行分析和研究,以避免投资失误,保证新系统的开发成功。可行性研究的目的就是用最小的代价在尽可能短的时间内确定问题是否能够解决。该系统的可行性分析包括以下几个方面的内容。1经济可行性主要是对项目的经济效益进行评价,本系统开发经费对于卡类商品销售商在经济上是可以接受的,系统运营成本很少,并且本系统实施后可以显著提高售卡数量;数据挖掘后,有助于对以后的经营策略进行调整,提高销售额。所以本系统在经济上是可行的。2技术上的可行性技术上的可行性分析主要分析技术条件能否顺利完成开发工作,硬、软件能否满足开发者的需要等。该管理系统采用了当前新兴的BROWSER/SERVER模式进行开发。三层的BROWSER/SERVER体系结构具有许多传统CLIENT/SERVER体系结构不具备的优点,而且又紧密的结合了INTERNET/INTRANET技术,是技术发展的大势所趋,它把应用系统带入了一个崭新的发展时代。数据库服务器选用SQLSERVER数据库,它能够处理大量数据,同时保持数据的完整性并提供许多高级管理功能。它的灵活性、安全性和易用性为数据库编程提供了良好的条件。因此,系统的软件开发平台已成熟可行。硬件方面,科技飞速发展的今天,硬件更新的速度越来越快,容量越来越大,可靠性越来越高,价格越来越低,其硬件平台完全能满足此系统的需要。3时机可行性目前,INTERNET的兴起和网民数量的迅速增长以及各种卡类商品的消费量的急剧上升,为网上销售提供了巨大的利益空间。4管理上的可行性网上售卡系统建立以后,为卡类销售商提供便捷的统计分析功能,避免了以前人工核算的繁杂工作。综上所述,此系统开发目标已明确,在技术和经济等方面都可行,并且投入少、见效快。因此系统的开发是完全可行的。上海交通大学工程硕士论文16312网上售卡的优势随着INTERNET的兴起和网民数量的迅速增长,电子商务作为信息社会的商务模式正以超人预料的速度向前发展,越来越多的企业为了在市场激烈竞争中处于不败之地,更加注重各种网上新型营销手段的开展。它撇开了广告宣传,通过电话传真进行联系,数次当面的洽谈,最后签约付款和供货等在传统的商务活动中必不可少的复杂环节。消费者可以随时浏览网站,查看商品,购买时通过网上银行支付,方便、快捷地完成交易。信息技术的发展,电话卡、上网卡、游戏币值卡等卡类商品消费量日益上升。这种卡类商品以卡号和密码的形式存在,消费者知道卡号和密码后便可消费。不像其他实物商品,需要通过邮寄等方式送达购买者手中。所以,卡类商品的销售商可以开发一套网上售卡系统,使消费者以低廉的价格在网上购卡,以邮件形式返回卡号、密码,减少现实运营中的成本。为了提高网上售卡的销售量,系统如果存在于一个网站中,访问网民的数量有限。比较好的解决办法是开发一个可嵌入到其他网站的接口。其他网站通过页面挂接接口,来显示系统全部或部分售卡信息,使网民可以在其他网站上进行购卡操作,提高售卡系统的访问量。系统记录从其他网站售卡的信息,并对其销售量进行统计,给予提成。由于卡类产品的销售具有其自身的特点,而现在网络上还没有一套专门销售卡类产品的系统,针对收集到的用户和售卡信息进行数据挖掘,复杂度增加。分析整理网上售卡系统的需求,把它从电子商务其他系统中分离出来,并对其后台数据进行挖掘,再增加其个性服务,会为以后的经营、决策提供很好的基础。32系统总体要求系统基本功能是浏览卡商品目录、卡商品搜索、卡商品展示、新商品推荐、卡销售排行榜、会员注册和管理、添加删除购物车、填写删除订单、商品评论。系统采用关系型数据库以便与数据处理相结合,同时也要能适应不同操作系统环境和不同厂商的数据库管理系统环境等方面的系统无关性,增强信息系统的安全性、灵活性。数据处理实现分级管理,二级管理员售卡代理商只能操作、查询、统计,实现报表数据的分级统计,可以按时间段、代理商生成统计数据,并提供多种表现形式报表、图表等及其打印、导出功能。第3章网上售卡系统的总体规划与设计1733软硬件设施331运行环境1服务器操作系统WINDOWS2000ADVANCEDSERVER2应用服务器系统IIS50以上版本MICROSOFTNETFRAMEWORK113客户端操作系统WINDOWS98,WINDOWS2000PROFESSIONAL等4客户端办公软件MICROSOFTOFFICE2000以上版本5客户端浏览器MICROSOFTIE50以上版本332开发环境1建模工具MICROSOFTVISIO20032集成开发环境MICROSOFTVISUALSTUDIONET20033开发语言VBA,NET,SQL4性能测试工具MICROSOFTAPPLICATIONCENTERTEST5文档和软件版本管理MICROSOFTVISUALSOURCESAFE34功能需求当用户登录系统之后,用户可以进行添加删除购物车,添加删除订单等操作。本模块主要有以下功能1安全登录。2在线进行添加购物车。3在线进行删除购物车。4在线申请提交订单的办理。5在线撤消订单的办理。6查询申请人的详细信息7安全退出。接下来将对每个功能的细节和逻辑流程,以文档的形式描述出来,在文档中主要从以下几个内容对功能进行描述1前置条件开始使用这个功能之前必须满足的条件。2主事件流功能的正常流程。3其他事件流功能的非正常流程,如错误处理等等上海交通大学工程硕士论文18341安全登录1前置条件无。2主事件流用户输入正确的用户名和密码,安全登录到应用界面中,向用户返回主操作菜单界面。3其他事件流1如果用户未输入用户名或密码,则显示错误提示信息用户名或密码不允许为空。4其他事件流2如果用户输入非法的用户名或者密码,则显示错误提示信息用户名或密码不正确。342在线进行添加购物车1前置条件用户己经安全登录到应用中。2主事件流用户可以查询的所要购买的卡商品或者直接浏览商品,点击确认按钮。进入购物车进行操作。3其他事件流1如果用户所要查询的商品不存在,则显示错误提示信息;请用户重新确认填写。343在线进行删除购物车1前置条件用户已经安全登入到应用中。2主事件流用户点击确认按钮,进入到购物车进行操作。344在线申请提交订单的办理1前置条件用户已经安全登入到应用中,并且已经进行商品的选购确认。2主事件流用户输入姓名、电子邮箱、地址等相关信息,点击确认按钮。进入订单的提交。3其他事件流1如果用户姓名没有填写,则显示错误信息请填写用户的姓名。4其他事件流2如果用户电子邮箱没有填写,则显示错误信息,请填写用户的电子邮箱。345在线撤销提交订单的办
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生严谨治学决心书3篇
- 会计账目清晰承诺书提升审计效率3篇
- 公积金授权委托办理3篇
- 学生不穿校服的谅解书3篇
- 交通违章委托办理协议3篇
- 农村地基买卖合同无效的情形3篇
- 多元文化市场拓展策略改进承诺3篇
- 委托生产代销合同书3篇
- 工程变更与施工合同的关系3篇
- 借用别人公司经营协议3篇
- 培训行业用户思维分析
- 星巴克消费者数据分析报告
- 实时数据采集系统方案
- PMC-651T配电变压器保护测控装置使用说明书V1.2
- 中国红色革命故事英文版文章
- 《体育保健学》课件-第三章 运动性病症
- 雷雨话剧第四幕雷雨第四幕剧本范文1
- 办公设备维保服务投标方案
- 服装终端店铺淡旺场管理课件
- PQR-按ASME要求填写的焊接工艺评定报告
- 医院中央空调维保合同范本
评论
0/150
提交评论