(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf_第1页
(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf_第2页
(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf_第3页
(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf_第4页
(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(系统工程专业论文)信息门户VOISP中在线客服系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着人类社会的发展,服务业在社会经济中的地位和作用与日俱增,并取代 制造业成为最大的经济部门,人类社会正从一个由工业主导的社会向一个由服 务业主导的社会演进。因此,如何改善服务质量提高服务效率在很大程度上关 系到企业生死存亡。服务是为客户服务,了解客户并且迎合客户需求是必不可 少的。在当今信息化时代,互联网的发展改变了人们的工作、生活方式,也同 时影响到人们对客户服务方式的需求,越来越多的人选择通过互联网来获得所 需信息。因此,客户服务方式进入网络在线客服时代。所谓在线客服是指通过 利用互联网络技术来实现对客户的服务和支持。它具备实时高效、便捷廉价、 交互性强、集成度高等特点。 在面向参观者的信息服务门户v o i s p ( v i s i t o ro r i e n t e di n f o r m a t i o n s e r v i c ep o r t a l ) 中,由于信息种类繁多,信息来源广泛,信息服务错综复杂, 为了给客户更方便、更优质的服务,我们需要研究一个集实时、便捷、高效等 多种传统在线客服的优点于一身的新型在线客户服务系统。 本文首先提出了一种基于b s 架构的在线客户服务体系,并作了相关分析, 对其中涉及到的一些关键问题做了初步的介绍;然后,详细阐述了此在线客服 系统的设计思想、关键技术、系统架构、模块划分、算法策略优化等,并在此 基础上予以实现。 关键词:客户服务,排队论,自然语言处理,b s 架构,j 2 e e a b s t r a c t a b s t r a c t a l o n gw i t ht h ed e v e l o p m e n to f h u m a ns o c i e t y ,t h es e r v i c ep l a ya n i n c r e a s i n g l yi m p o r t a n tr o l e i ns o c i o e c o n o m i cs t a t u s ,a n dr e p l a c e m a n u f a c t u r i n ga st h el a r g e s ts e c t o ro f t h ee c o n o m y n o w a d a y s ,h u m a n s o c i e t yi sg r a d u a l l ye v o l v i n g f r o ma ni n d u s t r y d r i v e ns o c i e t yt oa s e r v i c e d r i v e ns o c i e t y t h e r e f o r e ,t oal a r g ee x t e n t ,h o wt oi m p r o v e s e r v i c e sa n dt h eq u a l i t yo fs e r v i c ee f f i c i e n c y r e l a t e dt oc o r p o r a t e s u r v i v a l s e r v i c ei sp r o v i d e dt oc u s t o m e rs e r v i c e ,u n d e r s t a n dc u s t o m e r s a n dc a t e rt oc u s t o m e rn e e d si se s s e n t i a l i nt o d a y si n f o r m a t i o ne r a , t h ed e v e l o p m e n to ft h ei n t e r n e th a sc h a n g e dp e o p l e sw o r k ,l i f e s t y l e , a n da l s oa f f e c tt h ew a yp e o p l e o nt h ec u s t o m e rs e r v i c en e e d s a n i n c r e a s i n gn u m b e ro fp e o p l ec h o o s et h ei n t e r n e tt oo b t a i nt h en e c e s s a r y i n f o r m a t i o n s ot h ec u s t o m e rs e r v i c ea p p r o a c he n t e r e di n t ot h en e t w o r k e r a o n l i n ec u s t o m e rs e r v i c ei st h r o u g ht h eu s eo fi n t e r n e tt e c h n o l o g y t oa c h i e v ec u s t o m e rs e r v i c ea n ds u p p o r t ,w h i c hh a sal o to fg o o df e a t u r e s , s u c ha sr e a l - t i m ee f f i c i e n t ,c o n v e n i e n tl o w c o s t ,i n t e r a c t i v es t r o n g , a n dh i g hi n t e g r a t i o ne t c i nt h ev i s i t o ro r i e n t e di n f o r m a t i o ns e r v i c ep o r t a l ( v o i s p ) ,b e c a u s e o ft h ew i d er a n g eo fi n f o r m a t i o n ,e x t e n s i v es o u r c eo fi n f o r m a t i o na n d t h ec o m p l e xi n f o r m a ti o ns e r v i c e s ,s oi no r d e rt og i v ec u s t o m e r sg r e a t e r c o n v e n i e n c ea n db e t t e rs e r v i c e ,w ew il ln e e dt os t u d yas e tr e a l t i m e , c o n v e n i e n ta n de f f i c i e n t ,a n do t h e rt r a d i t i o n a lo n l i n ec u s t o m e rs e r v i c e t ot h em e r i t so fan e wo n l i n ec u s t o m e rs e r v i c es y s t e m t h i sp a p e rp r e s e n t saf r a m e w o r ko fo n l i n ec u s t o m e rs e r v i c es y s t e m b a s e do nb s ,a n dm a k e sac o r r e l a t i o na n a l y s i s ,w h i c hi n v o l v e s s o m eo f t h ek e vi s s u e st oap r e l i m i n a r yb r i e f i n g t h e n ,e l a b o r a t e do nt h eo n l i n e c u s t o m e rs e r v i c es y s t e md e s i g nc o n c e p t s , k e yt e c h n o l o g y , s y s t e m a r c h i t e c t u r e ,m o d u l ed i v i s i o n ,a l g o r i t h mo p t i m i z a t i o ns t r a t e g ye t c ,a n d i i a b s t r a c t o nt h i sb a s i s ,b ea c h i e v e d k e yw o r d s :c u s t o m e rs e r v i c e ,q u e u i n gt h e o r y ,n a t u r a ll a n g u a g ep r o c e s s i n g , b s ,j 2 e e i i i 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务:学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: y 谬年;月i1 日 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名: 杏够 渺莎年多月f 1 日 第1 章绪论 1 1 论文的背景 第1 章绪论 随着人类社会的发展,服务业在社会经济中的地位和作用与日俱增。第二 次世界大战之后,西方国家逐渐进入服务社会,服务业取代制造业成为最大的 经济部门,人类社会正从一个由工业主导的社会向一个由服务主导的社会演进。 克拉克( c o l i nc l a r k ) 在深入研究了经济社会演进后,提出了著名的 c l a r k - f i s h e r 假说,即在个国家的工业化过程中,就业从一个部门向另一个 部门转移是经济和社会发展的必然要求,而随着某一产业生产能力的增加,劳 动力自然会转向另一个领域。在发达国家中,服务业占总就业人数的比例和占 国民经济的比重均在6 0 以上,个别国家接近8 0 ,服务业成为新增就业机会 的重要来源,服务无处不在,并迅速增长【4 j 1 1 1 】。 现代企业客户服务一般以客服呼叫中心( c a l lc e n t e r ) 为载体,传统的呼叫 中心采用电话、传真服务为主。但随着企业业务的拓展,地域覆盖面积扩大, 客户群体膨胀并呈多样化,且现代通信技术日新月异,客户对于企业的客服水 平要求不断增长,传统的呼叫中心已经很难适应时代发展的需求。因此必须加 速变革的步伐,改变以往的客服模式,不断提高客户服务水平和质量,从而带 给客户最快捷、最优质的服务。 互联网的发展改变了人们的工作、生活方式,也同时影响到人们对客户服 务方式的需求,越来越多的入选择通过互联网来获得所需信息。因此,呼叫中 心更新换代,进入网络在线客服时代。所谓在线客服是指通过利用互联网络技 术来实现对客户的服务和支持。传统的在线客服方式主要有电子邮件、自助服 务、在线聊天工具、常见问题解答等。尤其是电子邮件,几乎是伴随着互联网 的成长而迅速普及,成为除电话之外最重要的客户服务方式。自助服务通过其 全面丰富的业务服务深受客户亲睐。在线聊天工具也凭借其实时交互的优点, 被越来越多的运用到不少企业的在线客服体系当中。常问问题解答一般是直接 的文字表白方式,由于缺乏交互性,在客服体系中始终扮演的是一种客串角色。 传统的在线客服方式虽各有优点,但其缺点也是显而易见的。电子邮件缺 第1 章绪论 乏一种实时性,且其安全性也一直让人担忧。自服务业务对问题答案的搜索通 常会使得客户感觉到很茫然。在线聊天工具虽具有良好的实时性,然而种类繁 多的各种聊天工具互不相通,且其繁琐的安装注册手续成为其致命硬伤,这大 大阻止了客户的热情。常问问题解答更是先天性“致残 ,至多是个配角,成不 了气候。 随着互联网在社会生活中的日益普及、发展,客户对在线客服的方式和质 量提出越来越高的要求,传统的在线客服体系面临着严峻的挑战,客服部门急 需要一个实时高效、便捷廉价、交互性强、集成度高的客服方式,来及时、准 确的满足期望值愈来愈高的客户需求。 因此,在信息门户v o i s p ( v i s i t o ro r i e n t e di n f o r m a t i o ns e r v i c ep o r t a l 一面向参观者的信息服务门户) 中,由于信息种类繁多,信息来源广泛,信息 服务错综复杂,为了给客户更方便、更优质的服务,我们需要研究一个集实时、 便捷、高效等多种传统在线客服的优点于一身的新型在线客户服务系统。 1 2 在线客服系统国内外发展现状 对于实时性高,交互性强的在线客服的研究,日前,由广东融合通信有限 责任公司开发的一款名为i m 8 0 0 的新在线客服系统正式发布,它是基于国际标 准通信协议的在线客服系统,综合了多种传统在线客服方式的优点,并首次提 出实时在线客服管理、在线客服质量监控等概念,树立了一套全新的在线客服 标准体系;成都金铠甲科技有限公司自主研发的基于互联网网站的l i v e s 0 0 网 站在线客服实时交流系统,采用先进的技术手段,秉承一流的服务体系,打造 中国最专业的实时沟通平台。 下面以成都金铠甲科技有限公司自主研发的基于互联网网站的l i v e 8 0 0 网 站在线客服实时交流系统为例,l i v e s 0 0 系统广泛适用于政府、金融、旅游、教 育等行业,让在线营销和咨询的专业化功能得到了充分体现,同时在扩大用户 市场和空间上也起到了事半功倍的效果。同时为企业发掘更多的潜在客户,降 低运行成本,提高工作效率,提升客户满意度,是企业进行在线咨询、在线营 销、在线客服的有力工具。 l i v e 8 0 0 系统结构 l i v e 8 0 0 系统是一个松散耦合的系统( 如图1 1 所示) 。系统主要有四个模块: 2 第l 章绪论 l i v e 8 0 0 对话服务中心、客服模块、访客对话模块、数据统计分析模块 幽11l ir e 8 0 0 系统结构 当访客访问用户网站时,该网站的后台客服人员便能实时查看到,而访客 也能实时知晓客服是否在线,因此l i r e 8 0 0 起到了一个桥粱作用,将用户网站 的客服和访客联系起来。独特的结构使得l i v e s 0 0 系统具有极强的可靠性和可 伸缩性,可适用于任何网站。 从l i v e 8 0 0 系统本身来看,l i v e 8 0 0 是一个三层结构的分布式系统( 如图1 2 所示) 。由服务器、客服客户端、访客客户端构成。服务器采用j 2 e e 技术,负 责处理系统所有的对话中转功能,为所有的用户网站提供实时对话服务;客服 客户端采用c + + 实现,具有极高的运行效率,该客户端的使用者为网站的后台客 服人员,其中集成了便捷的实时对话系统和功能强劲的数据分析统计系统:访 客客户端采用j a v a s c r i p t 技术在用户网站中生成实时对话的图标,该技术最大 的特定就是网站访客无需下载任何软件或插件即可运行。 第1 章绪论 图i2l i v e 8 0 0 三层结构的分布式系统 l i v e 8 0 0 服务器特性 l i v e 8 0 0 服务器负责处理系统所有的对话中转功能,为所有的用户网站提供 实时对话服务,困此,服务器是整个系统的中心枢纽。这就决定服务器必须全 天2 4 小时不问断运行并提供高效服务。l i v e 8 0 0 服务器采用了先进的j 2 e e 技术, 先进良好的系统结构为服务器的稳定性、高效性、可伸缩性打下了坚实的基础, l i v e 8 0 0 客服客户端特性 l i v e s 0 0 为客服提供许多客户端特性,如实时监控网站访问情况、被动接受 对话、对话转接、太规模访客队列管理、管理员对客服的全程监控与管理、内 部客服对话、强大的消息提示系统、全面的数据统计与分析系统、智能升级系 统等。 l i v e 8 0 0 访客客户端特性 l i v e 8 0 0 为访客提供多样的客户端特性,如简洁通用、访客无需下载任何插 件、支持多种浏览器、强大的实时对话功能、留言系统、网页快捷导航、可自 定义的对话窗口界面等。 i 3v o l s p 中在线客服系统的功能与特征 面向参观者的信息服务门户( v o i s p v i s i t o ro r i e n t e d i n f o r m a t i o n 4 第1 章绪论 s e r v i c ep o r t a l ) 是一个支持可视化、动态调度、可配置的数据服务中心,以 支持世博会内部各应用系统之间以及与上海城市信息基础设施之间的数据交 换,为参观者查询各种信息服务提供方便,同时也为世博会的管理、指挥、调 度、决策和服务提供全面、统一的数据服务。 v o i s p 的总体结构从功能上分为资源管理模块与资源调用模块两个主要部 分,还包括一些公共的功能模块,如审计支持、单点登录、在线客服等模块。 资源管理与资源调用模块由于基于门户组件的协作通信机制,可以协同处理w e b 资源的集成与调用功能;单点登录解决了异构应用系统间繁琐的重复注册认证 问题,提高了用户访问的效率;审计支持针对应用集成特别是单点登录机制所 带来的访问痕迹审计问题提供了安全健壮的功能;在线客服作为信息门户的一 个辅助模块,为用户带来更优质更便捷的服务。 在本文研究的信息门户v o i s p 中的在线客服系统,是信息门户的首要辅助 工具,在客户通过网页信息和自助服务无法得到满足时,在线客服就能发挥它 的作用,其主要功能是为了使参观者、参展者得到实时有效的沟通与交流。其 主要功能如下: 在线即时沟通:用户可以实时地向客服提问并得到解答的平台。当客户 浏览器发出咨询请求,中央调度器负责响应并触发客服浏览器,使得客 户和客服间建立起实时通信。 同步双向翻译:通过双向翻译器,实现使用两种不同语言客户与客服间 的顺利沟通。 自动应答器:当无客服人员在线或者客服人员忙碌的时候,系统会根据 用户问题,匹配数据库常问问题集,找出最佳答案。并具有收集更新问 题集的功能。 1 4 论文的组织 本文其后的组织结构如下。 第二章介绍了该在线客服系统的体系结构和涉及到的一些关键理论和攻关 难点。 第三章主要描述在信息门户v o i s p 中,在线客服系统的实现模型。分三个 主要模块分别阐述了该客服系统的一些数学模型和实现算法,并提出了一些可 5 第1 章绪论 能的优化方案。 第四章在第三章的基础上,利用现有的技术实现本系统。在对总体框架的 各部分进行设计与实现后,就部分核心模块算法的实现作了详细的阐述。 最后对论文工作进行了总结,并提出了其中有待进一步深入研究的工作。 6 第2 章v o i s p 中在线客服系统的体系结构和关键问题 第2 章v o i s p 中在线客服系统的体系结构和关键问题 2 1 基于b s 架构的体系结构 在面向参观者的信息服务门户( v o i s p ) 中,参观者包括参加世博会的众多参 展商和普通参观者。因此,基于客户服务的宗旨和理念,通过对客户服务过程、 客户服务内容以及客户服务方式的分析,设计了该系统的体系结构,如图2 1 所示。系统由客户端、中央调度器、自动应答器、双向翻译器等部分构成。 请 图2 1 系统总体框架 应 本系统客户端采用浏览器来实现功能,包括客户浏览器和客服浏览器。客 户通过客户浏览器来向服务器发送请求,服务器中由中央调度器根据请求信息 最优化地调度客服来为客户服务。中央调度器是系统核心,负责所有事务流转 控制和交互双方信息的存储与转发。中央调度器采用类似多线程服务器 ( m u l t i t h r e a d e ds e r v e r ) 体系结构,一个或多个客户应用程序共享一组服务器 进程,以此达到效率最优。同时,双向翻译器为交互双方构建起沟通的桥梁: 自动应答器保证系统在无客服响应的情况下自动、智能地为客户提供服务。下 面将分别介绍该系统设计和实现中遇到的关键问题和难点。 7 第2 章v o i s p 中在线客服系统的体系结构和关键问题 2 2 调度中的排队问题 2 2 1 问题的提出 1 调度问题的描述 客户在门户网站上发出客户服务请求的同时,系统根据客服人员的不同状 态采取不同策略。负责这一工作的模块称为中央调度器,它是本系统的核心模 块。如果有客服人员在线并处于空闲状态,则客户马上接受该客服人员的服务; 如果所有客服人员都处于忙碌状态,则客户在系统中接受排队,直到有客服人 员空闲,则得到服务;如果无客服人员在线,则系统通过自动应答器来为客户 服务。调度服务流程如下图2 1 所示。考虑到一般门户网站客户数量巨大,排 队问题是一个必须去优化的问题,因此也成为该系统中的一个关键问题。 i 一一j 捧队规则 服务规则 顾客离去 i 。一一一一一一j 图2 1 调度服务系统 2 最优化问题 此服务系统主要由客户和客服组成,面对排队现象,一方面,客户总希望 等待时间越短越好,因而希望客服人数越多、服务效率越高越好。系统中的客 服人数过多,可以减少排队等待时间,提高客户的满意程度,客户遭受的损失 较小,赢得更多的商机,但同时也会增加企业的服务成本。而且还会发生客服 人员闲置,造成人员浪费。当然客服人员过少,不但不能满足客户的需要。还 会使服务质量降低,甚至造成损失。 调度问题是约束满足问题的子类。中央调度器需要满足以下两个约束条件: 客户等待时间最少; 企业服务成本最低f 1 7 1 。 从双方利益出发,如何做到既保证客户的服务满意度又使服务设施成本经 济合理恰当地协调客户和企业需求上的矛盾。这是随机服务系统理论排队 论研究解决的问题。 8 第2 章v o i s p 中在线客服系统的体系结构和关键问题 由此可见,该问题的实质是一个排队问题。 2 2 2 排队论的提出 排队是我们在日常生活和生产中经常遇到的现象。例如,上、下班搭乘公 共汽车;顾客到商店购买物品:病员到医院看病;旅客到售票处购买车票;学 生去食堂就餐等就常常出现排队和等待现象。除了上述有形的排队之外,还有 大量的所谓“无形 排队现象,如几个顾客打电话到出租汽车站要求派车,如 果出租汽车站无足够车辆、则部分顾客只得在各自的要车处等待,他们分散在 不同地方,却形成了一个无形队列在等待派车。 排队的不一定是人,也可以是物:例如,通讯卫星与地面若干待传递的信 息;生产线上的原料、半成品等待加工;因故障停止运转的机器等待工人修理; 码头的船只等待装卸货物:要降落的飞机因跑道不空而在空中盘旋等等。显然, 上述各种问题虽互不相同,但却都有要求得到某种服务的人或物和提供服务的 人或机构。排队论里把要求服务的对象统称为“顾客 ,而把提供服务的人或机 构称为“服务台 或“服务员”。不同的顾客与服务组成了各式各样的服务系 统。顾客为了得到某种服务而到达系统、若不能立即获得服务而又允许排队等 待,则加入等待队伍,待获得服务后离开系统,一般的排队过程可由上图2 1 加以描述。 排队论( q u e u i n gt h e o r y ) ,又称随机服务系统理论( r a n d o ms e r v i c es y s t e m t h e o r y ) ,是一门研究拥挤现象( 排队、等待) 的科学【l 训。排队论是1 9 0 9 年由丹麦 工程师爱尔朗( a k 。e r l a n g ) 在研究电活系统时创立的,几十年来排队论的应用 领域越来越广泛,理论也日渐完善。特别是自二十世纪6 0 年代以来,由于计算 机的飞速发展,更为排队论的应用开拓了宽阔的前景。具体地说,它是在研究 各种排队系统概率规律性的基础上,解决相应排队系统的最优设计和最优控制 问题。 2 2 3 排队系统服务的分类与组成 1 排队系统服务的分类 排队系统服务种类一般分为三类: ( 1 ) 损失制系统。当客户到达这种服务系统时,若遇到服务系统忙,则客户 9 第2 章v o i s p 中在线客服系统的体系结构和关键问题 即时离去,不排队。因为这种服务机制会失掉许多客户,故称损失制系统。 ( 2 ) 等待制系统。客户到达该服务系统时服务员都在为先到的顾客服务,后 到的顾客只好排队等候服务。 ( 3 ) 混合制系统。在现实生活中,很多服务系统介于损失制和等待制之间。 当客户到达时,若客服人员都不空但有排队位置,就排队,若客服人员都不空 且排队位置已满,顾客就立即离去。一般是指允许排队,但又不允许队列无限 长下去。具体来说,大致有以下三种: 队长有限。当排队等待服务的顾客人数超过规定数量时,后来的顾客就 自动离去,另求服务,即系统的等待空间是有限的。例如最多只能容纳 k 个顾客在系统中,当新顾客到达时,若系统中的顾客数( 又称为队长) 小于k ,则可进入系统排队或接受服务;否则,便离开系统,并不再回 来。如水库的库容是有限的,旅馆的床位是有限的。 等待时间有限。即顾客在系统中的等待时间不超过某一给定的长度t , 当等待时间超过t 时,顾客将自动离去,并不再回来。如易损坏的电子 元器件的库存问题,超过一定存储时间的元器件被自动认为失效。又如 顾客到饭馆就餐,等了一定时间后不愿再等而自动离去另找饭店用餐。 逗留时间( 等待时间与服务时间之和) 有限。例如用高射炮射击敌机,当 敌机飞越高射炮射击有效区域的时间为t 时,若在这个时间内未被击 落,也就不可能再被击落了。 不难注意到,损失制和等待制可看成是混合制的特殊情形,如记s 为系统 中服务台的个数,则当k = s 时,混合制即成为损失制;当k - 时,混合制即成 为等待制i l 引。 2 排队系统的组成 虽然各种服务系统的情况各异,但它们都具有下列共同的组成部分: ( 1 ) 输入过程 系统的输入过程是指顾客的到达过程。由于到达规律不同,所以有各种不 同的输入过程。一般可从两个方面来描述输入过程: ( a ) 顾客相继到达的时间是确定型的还是随机型的。如在火车站列车到站 的时刻是确定型的。而一般说来,在各种交通服务系统中,顾客到达都是随机 的。 ( b ) 顾客的总体即顾客源的组成是无限的还是有限的。例如,在道路交叉 l o 第2 章v o i s p 中在线客服系统的体系结构和关键问题 口,车辆的总体可以看成是无限的;而工厂内停机待修的机器显然是有限的。 ( 2 ) 排队规则 在损失制系统中,不存在排队问题,这里的排队规则是相对于等待制和混 合制系统而言的。 排队规则有以下几种: 先到先服务( f c f s ) ; 后到先服务( l c f s ) ; 优先服务( p r ) :分轻重缓急给予服务; 随机服务( r s s ) :一个客户被服务完以后,客服人员从排队的客户中任 、取一个客户给予服务。 ( 3 ) 服务机构 服务机构包括为每个顾客服务所需时间的概率分布、服务台数量及构成形 式。从数量上说,服务台有单服务台和多服务台之分;从排列方式上有串联和 并联之分 2 0 1 。 具体排队过程见下图2 2 - 2 5 骂o 坠扎 n 、7 v 正在接受服务的顾客 图2 2 单服务台排队系统 顾客到达 队列 一 oo 图2 3 单队列_ s 个服务台并联的排队系统 擎擎 成一 成一 完一 完一 竺 竺 曰母 么 第2 章v o i s p 中在线客服系统的体系结构和关键问题 o 队批oo 匝掣 o 燃o0 囤脑完骺离妻 ; o 队戮o 0 囤服务完成后离p 垄 图2 4s 个队列叫个服务台并联的排队系统 图2 5 单队列多服务台串联的排队系统 2 3 自然语言处理中的人工智能理论 在本系统中,有些模块的设计是与人工智能理论分不开的,如自动应答器、 双向翻译器等。它们的输入都是人类的自然语言,计算机首先需要先理解这些 语言,才能为参观者作出相应的答复。因此,自然语言处理是我们研究的一个 重点和难点。本节首先对人工智能作一个简要的介绍,然后介绍了自然语言处 理的概念和研究现状。 2 3 1 人工智能简介 人工智能( a r t i f i c i a li n t e l l i g e n c e ) ,英文缩写为a i 。它是研究、开发 用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技 术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产 出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括 机器人、语言识别、图像识别、自然语言处理和专家系统等。“人工智能”一 词最初是在1 9 5 6 年d a r t m o u t h 学会上提出的。从那以后,研究者们发展了众多 理论和原理,人工智能的概念也随之扩展。人工智能是一门极富挑战性的科学, 从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分 1 2 第2 章v o i s p 中在线客服系统的体系结构和关键问题 广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来, 人工智能研究的l 个主要目标是使机器能够胜任一些通常需要人类智能才能完 成的复杂工作。但不同的时代、不同的人对这种“复杂工作 的理解是不同的。 例如繁重的科学和工程计算本来是要人脑来承担的,现在计算机不但能完成这 种计算,而且能够比人脑做得更快、更准确,因之当代人已不再把这种计算看 作是“需要人类智能才能完成的复杂任务 ,可见复杂工作的定义是随着时代 的发展和技术的进步而变化的,人工智能这门科学的具体目标也自然随着时代 的变化而发展。它一方面不断获得新的进展,一方面又转向更有意义、更加困 难的目标。目前能够用来研究人工智能的主要物质手段以及能够实现人工智能 技术的机器就是计算机。人工智能的发展历史是和计算机科学与技术的发展史 联系在一起的。除了计算机科学以外,人工智能还涉及信息论、控制论、自动 化、仿生学、生物学、心理学、数理逻辑、语言学、医学和哲学等多门学科。 人工智能学科研究的主要内容包括:知识表示、自动推理和搜索方法、机器学 习和知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自 动程序设计等方面j 。 2 3 2 人工智能的应用领域 l 、问题求解。 人工智能的第一大成就是下棋程序,在下棋程度中应用的某些技术,如向 前看几步,把困难的问题分解成一些较容易的子问题,发展成为搜索和问题归 纳这样的人工智能基本技术。今天的计算机程序已能够达到下各种方盘棋和国 际象棋的锦标赛水平。但是,尚未解决包括人类棋手具有的但尚不能明确表达 的能力。如国际象棋大师们洞察棋局的能力。另一个问题是涉及问题的原概念, 在人工智能中叫问题表示的选择,人们常能找到某种思考问题的方法,从而使 求解变易而解决该问题。到目前为止,人工智能程序已能知道如何考虑它们要 解决的问题,即搜索解答空间,寻找较优解答。 2 、逻辑推理与定理证明。 逻辑推理是人工智能研究中最持久的领域之一,其中特别重要的是要找到 一些方法,只把注意力集中在一个大型的数据库中的有关事实上,留意可信的 证明,并在出现新信息时适时修正这些证明。对数学中臆测的题。定理寻找一 个证明或反证,不仅需要有根据假设进行演绎的能力,而且许多非形式的工作, 1 3 第2 章v o i s p 中在线客服系统的体系结构和关键问题 包括医疗诊断和信息检索都可以和定理证明问题一样加以形式化,因此,在人 工智能方法的研究中定理证明是一个极其重要的论题。 3 、自然语言处理。 自然语言的处理是人工智能技术应用于实际领域的典型范例,经过多年艰 苦努力,这一领域已获得了大量令人注目的成果。目前该领域的主要课题是: 计算机系统如何以主题和对话情境为基础,注重大量的常识世界知识和期 望作用,生成和理解自然语言。这是一个极其复杂的编码和解码问题。 4 、智能信息检索技术。 受网络技术迅猛发展的影响,信息获取和精化技术已成为当代计算机科学 与技术研究中迫切需要研究的课题,将人工智能技术应用于这一领域的研究是 人工智能走向广泛实际应用的契机与突破口。 5 、专家系统。 专家系统是目前人工智能中最活跃、最有成效的一个研究领域,它是一种具 有特定领域内大量知识与经验的程序系统。近年来,在“专家系统”或“知 识工程”的研究中已出现了成功和有效应用人工智能技术的趋势。人类专家由 于具有丰富的知识,所以才能达到优异的解决闷题的能力。那么计算机程序如 果能体现和应用这些知识,也应该能解决人类专家所解决的问题,而且能帮助 人类专家发现推理过程中出现的差错,现在这一点已被证实。如在矿物勘测、 化学分析、规划和医学诊断方面,专家系统已经达到了人类专家的水平。成功 的例子如:p r o s p e c t o r 系统发现了一个钼矿沉积,价值超过1 亿美元。d e n d r l 系统的性能已超过一般专家的水平,可供数百人在化学结构分析方面的使用。 m 1 c i n 系统可以对血液传染病的诊断治疗方案提供咨询意见。经正式鉴定结果, 对患有细菌血液病、脑膜炎方面的诊断和提供治疗方案已超过了这方面的专家。 2 3 3 自然语言处理 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研 究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语 言处理是一门融语言学、计算机科学、数学于一体的科学。 因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,包括中 文、英文、俄文、日文、德文、法文等等,所以它与语言学的研究有着密切的 联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于 1 4 第2 章v o i s p 中在线客服系统的体系结构和关键问题 研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而 它是计算机科学的一部分。 语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语 言能力。人类的多种智能都与语言有着密切的关系。人类的逻辑思维以语言为 形式,人类的绝大部分知识也是以语言文字的形式记载和流传下来的。因而, 它也是人工智能的一个重要,甚至核心部分。 用自然语言与计算机进行通信,这是人们长期以来所追求的。因为它既有 明显的实际意义,同时也有重要的理论意义:人们可以用自己最习惯的语言来 使用计算机,而无需再花大量的时间和精力去学习不很自然和习惯的各种计算 机语言;人们也可通过它进一步了解人类的语言能力和智能的机制。 实现人机问自然语言通信意味着要使计算机既能理解自然语言文本的意 义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解, 后者称为自然语言生成。因此,自然语言处理大体包括了自然语言理解和自然 语言生成两个部分。历史上对自然语言理解研究得较多,而对自然语言生成研 究得较少。但这种状况近年来已有所改变。 无论实现自然语言理解,还是自然语言生成,都远不如人们原来想象的那 么简单,而是十分困难的。从目前的理论和技术现状看,通用的、高质量的自 然语言处理系统,仍然是较长期的努力目标,但是针对一定应用,具有相当自 然语言处理能力的实用系统已经出现,有些已商品化,甚至开始产业化。典型 的例子有:种数据库和专家系统的自然语言接口、各种机器翻译系统、全文信 息检索系统、自动文摘系统等。 自然语言处理,即实现人机间自然语言通信,或实现自然语言理解和自然 语言生成是十分困难的。造成困难的根本原因是自然语言文本和对话的各个层 次上广泛存在的各种各样的歧义性或多义性( a m b i g u i t y ) 。 一个中文文本从形式上看是由汉字( 包括标点符号等) 组成的一个字符串。 由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段、 节、章、篇。无论在上述的各种层次:字( 符) 、词、词组、句子、段,还 是在下一层次向上一层次转变中都存在着歧义和多义现象,即形式上一样的一 段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串等, 并有不同的意义。一般情况下,它们中的大多数都是可以根据相应的语境和场 景的规定而得到解决的。也就是说,从总体上说,并不存在歧义。这也就是我 们平时并不感到自然语言歧义,和能用自然语言进行正确交流的原因。但是一 1 5 第2 章v o i s p 中在线客服系统的体系结构和关键问题 方面,我们也看到,为了消解歧义,是需要极其大量的知识和进行推理的。如 何将这些知识较完整地加以收集和整理出来;又如何找到合适的形式,将它们 存入计算机系统中去;以及如何有效地利用它们来消除歧义,都是工作量极大 且十分困难的工作。这不是少数人短时期内可以完成的,还有待长期的、系统 的工作。 以上说的是,一个中文文本或一个汉字( 含标点符号等) 串可能有多个含 义。它是自然语言理解中的主要困难和障碍。反过来,一个相同或相近的意义 同样可以用多个中文文本或多个汉字串来表示。 因此,自然语言的形式( 字符串) 与其意义之间是一种多对多的关系。其 实这也正是自然语言的魅力所在。但从计算机处理的角度看,我们必须消除歧 义,而且有人认为它正是自然语言理解中的中心问题,即要把带有潜在歧义的 自然语言输入转换成某种无歧义的计算机内部表示。 歧义现象的广泛存在使得消除它们需要大量的知识和推理,这就给基于语 言学的方法、基于知识的方法带来了巨大的困难,因而以这些方法为主流的自 然语言处理研究几十年来一方面在理论和方法方面取得了很多成就,但在能处 理大规模真实文本的系统研制方面,成绩并不显著。研制的一些系统大多数是 小规模的、研究性的演示系统。 大约9 0 年代开始,自然语言处理领域发生了巨大的变化。这种变化的两个 明显的特征是: ( 1 ) 对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本, 而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样, 研制的系统才有真正的实用价值。 ( 2 ) 对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不 要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。例如, 对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进 行自动摘要等等。 同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础 性工作也得到了重视和加强。 ( 1 ) 大规模真实语料库的研制。大规模的经过不同深度加工的真实文本的 语料库,是研究自然语言统计性质的基础。没有它们,统计方法只能是无源之 水。 ( 2 ) 大规模、信息丰富的词典的编制工作。规模为几万,十几万,甚至几 1 6 第2 章v o i s p 中在线客服系统的体系结构和关键问题 十万词,含有丰富的信息( 如包含词的搭配信息) 的计算机可用词典对自然语 言处理的重要性是很明显的。 虽然上述新趋势给自然语言处理领域带来了成果,但从理论方法的角度看, 由于采集、整理、表示和有效应用大量知识的困难,这些系统更依赖于统计学 的方法和其他“简单 的方法或技巧。而这些统计学的方法和其他“简单 的 方法似乎也快达到它们的极限了,因此,目前在自然语言处理界广泛争论的一 个问题便是:要取得新的更大的进展,主要有待于理论上的突破呢,还是可由 目前已有的方法的完善和优化实现? 答案还不清楚。大致上,更多的语言学家 倾向于前一种意见,而更多的工程师则倾向于后一种意见。回答或许在“中 间 ,即应将基于知识和推理的深层方法与基于统计等“浅层 方法结合起来 【3 6 】。 1 7 第3 章v o i s p 中在线客服系统模型与算法策略研究 第3 章v 0 ls p 中在线客服系统模型与算法策略研究 3 1 中央调度器 在大部分企业门户网站的应用中,包括该面向参观者的信息服务门户 ( v o i s p ) 中,客户数是巨大的,也就是说同一时间有出现大量客户同时请求服务 的可能,远远大于客服数量,客户必须服从排队。因此,建立一个性能优越、 可靠性高的模型是至关重要的。 3 1 i 马尔可夫数学模型的建立 i 基本模型的假设 根据多数资料提出一下假设: 1 ) 由于企业网站的访客繁多,远远大于客服人员,在客服人员工作时间内, 客户源是无限的而且客户单独发出请求,相互独立。客户的输入流基本 满足平稳性、无后效性及普遍性,因而可以假设客户流为柏松( p o i s s o n ) 流。 2 ) 每个客户对客服人员没有特别偏好,每个客服人员对客户来说都是一样 的。 3 ) 每个客服工作人员最多可以同时服务b 个客户,以a 表示相同的客服数。 客服的服务时间具有无记忆性,即服从负指数分布,且每个客户的服务 时间独立。 4 ) 采用等待制系统,没有客户因为队长而被丢弃,可认为是单一队列,当 客户点击发出服务请求时,若客服人员有空闲马上得到服务,反之,自 动为客户跳转到自动应答界面。 5 ) 系统实行先到先服务原则,即按客户发出服务请求的先后顺序接受服 务。客户可以在队列间进行移动【2 l 】。 2 。 基本模型的性能指标 1 8 第3 章v o i s p 中在线客服系统模型与算法策略研究 基本模型的主要性能指标 主要性能指标有四项,这四项主要性能指标( 又称主要工作指标) 的值越小, 说明系统排队越少,等待时间越少,因而系统性能越好。显然,它们是客户与 服务系统的管理者都很关注的。 系统中的平均排队长度厶; 系统中的平均顾客数厶; 顾客在系统中的平均等候时间形; 顾客在系统中的平均逗留时间形; 平均顾客数和排队长度一般都是随机变量。我们希望能确定它们的分布, 或至少能确定它们的平均值( 即平均队长和平均排队长) 及有关的矩( 如方差 等) 。平均顾客数的分布是客户和客服人员都关心的,特别是对系统设计人员来 说,如果能知道平均顾客数的分布,就能确定平均顾客数超过某个数的概率, 从而确定合理的等待空间。 从顾客到达时刻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论