




已阅读5页,还剩60页未读, 继续免费阅读
(计算机软件与理论专业论文)基于bp神经网络的呼叫中心呼叫放弃率预测模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河海大学硕士学位论文摘要 摘要 随着呼叫中心突飞猛进的发展,越来越多的企业用它来发展业务,扩大客户群,树 立企业形象。- 呼叫中心的服务质量直接关系到企业形象和经济效益。呼叫放弃率是用来 衡量呼叫中心服务质量的最重要的指标之一。对呼叫放弃率的精确预测有利于管理者进 行科学排班,提高服务效率和质量。 目前,呼叫中心的呼叫放弃率预测问题一般采用基于排队论的预测等方法来解决。 这些方法在使用时有许多限制条件,而这些条件又往往不完全符合呼叫中心提供呼叫服 务的实际情况。实践证明,对于呼叫中心这类复杂的非线性系统,使用统计学方法预测 的效果并不理想。针对这种现状,本文在分析研究呼叫中心运行机制和现有的呼叫放弃 率预测技术的基础上,提出了一种基于b p 神经网络的呼叫放弃率预测模型,并用实际 数据对模型进行了验证和对比实验。 本文的主要工作如下: 1 对基于统计学的回归预测、基于排队论的e r t a n g 模型预测、基于数据挖掘的时 间序列预测等现有呼叫放弃率预测技术进行分析和比较,归纳出这些方法各自的优缺点 和它们在实际应用中存在的不足。 2 综合考虑时序因素和因果因素对呼叫放弃率的影响,结合人工神经网络的特点, 研究提出一种基于b p 神经网络的呼叫放弃率预测模型,并给出了具体的建模过程。 3 设计实验方案,给出了基于b p 神经网络的呼叫放弃率预测模型在呼叫中心的实 现过程,并应用某呼叫中心的历史数据,对呼叫放弃率进行预测实验。通过与其它两种 不同预测方法的预测结果进行对比分析,说明了本文提出的模型具有一定程度上的实用 性和优越性。 关键词:b p 神经网络、呼叫中心、呼叫放弃率、预测模型 河海大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to f t h ec a l lc e n t e r s ,m o r ea n dm o r ec o m p a n i e su s et h e mt oe x p a n d m a r k e t s t h eq u a l i t yo fs e r v i c eo ft h ec a l lc e n t e r sa f f e c t sd i r e c t l yt h eb e n e f i c eo fac o m p a n y t h ea b a n d o nr a t ei so n eo f t h em o s ti m p o r t a n tc r i t e r i af o re v a l u a t i n gac a l lc e n t e r a na c c u r a t e p r e d i c t i o no f t h ea b a n d o nr a t ei sv e r yh e l p f u lf o rt h em a n a g e r st op l a nt h ew o r kf o r c ea n dt o i m p r o v e t h ee f f i c i e n c ya n dt h eq u a l i t yo fs e r v i c e r e c e n t l y ,q u e u e i n gt h e o r yb a s e dm e t h o d sa r eu s e df o rp r e d i c t i v ei s s u e si nc a l lc e n t e r s b u tt h e s em e t h o d sh a v em a n yt h e o r e t i ch y p o t h e s e st h a td on o tu s u a l l yc o n f o r mt ot h er e a l i t y o ft h ec a l lc e n t e r s p r a c t i c eh a sp r o v e dt h a tt h ep r e d i c t i v er e s u l t so ft h e s e sm e t h o d sa r en o t i d e a lf o rt h ec o m p l i c a t en o n l i n e a rs y s t e m ss u c ha sc a l lc e n t e r s i nt h el i g h to ft h i ss i t u a t i o n , t h i sp a p e rm a k e sas t u d yo ft h em e c h a n i s mo fc a l lc e n t e r sa n dt h ee x i s t i n gp r e d i c t i v e t e c h n o l o g i e s ;p r o p o s e sa na b a n d o nr a t ep r e d i c t i o nm o d e lb a s e do nb pn e u r a ln e t w o r k ; m a k e st h em o d e lv a l i d a t i o na n dc o m p a r i s o nu s i n gt h ea c t u a ld a t ao f ac a l lc e n t e r t h em a i nc o n t r i b u t i o no f t h i sp a p e ri sa sf o l l o w s : 1 a n a l y z ea n dc o m p a r et h ee x i s t i n gp r e d i c t i v em e t h o d si n c l u d i n g :s t a t i s t i cb a s e d r e g r e s s i o n s ,q u e u i n gt h e o r yb a s e de r l a n gm o d e l s ,a n dd a t am i n i n gb a s e dt i m es e r i e s f o r e c a s t s u m m eu pt h er e s p e c t i v ea d v a n t a g e sa n dd i s a d v a n t a g e so ft h e s em e t h o d s a n dt h e i rp r a c t i c a la p p l i c a t i o nd e f i c i e n c i e s 2 c o n s i d e r i n gt h ei m p a c to ft h et i m es e r i e sf a c t o ra n dt h ec a u s a lf a c t o rf o ra b a n d o n r a t e s ,t a k i n ga d v a n t a g eo f t h ec h a r a c t e r i s t i c so fa r t i f i c i a ln e u r a ln e t w o r k s ,p r o p o s ea n a b a n d o nr a t ep r e d i c t i o nm o d e lb a s e do nb pn e u r a ln e t w o r ka n dg i v et h es p e c i f i c m o d e l l i n gp r o c e s s 3 d e s i g nt h ee x p e r i m e n t a lp r o g r a m m e ;i l l u s t r a t et h er e a l i z a t i o np r o c e s so ft h i sm o d e l a n dp r e d i c tt h ea b a n d o nr a t ew i t ht h eh i s t o r i c a ld a t ao fac a l lc e n t e r c o m p a r et h e e x p e r i m e n t a lr e s u l t sw i t ht h er e s u l t so ft h eo t h e rt w op r e d i c t i v em e t h o d s ,d e s c r i b e t h a tt h ep r o p o s e dm o d e lh a sac e r t a i nd e g r e eo fp r a c t i c a l i t ya n ds u p e r i o r i t y k e y w o r d s :b pn e u r a ln e t w o r k ,c a l lc e n t e r ,a b a n d o nr a t e ,p r e d i c t i o nm o d e l 河海大学硕士学位论文 第一章绪论 第一章绪论 1 1 选题依据 呼叫放弃率是用来衡量呼叫中心服务质量最重要的指标。对呼叫放弃率的精确预 测,是采用技术管理措施来降低呼叫放弃率的重要前提。影响呼叫放弃率的因素较多, 如呼叫流量的大小,话务员的多少,通话时间的长短等等。对这些因素的预测,既要参 照它们的历史记录,又要充分考虑到未来的实际情况。传统的预测方法往往不能做到顾 此及彼,在实际应用中存在较多问题。利用人工神经网络来进行呼叫放弃率的预测,能 够利用不同性质影响因素之间复杂的非线性映射关系,进行自我学习,并且能够在不断 变化的环境中进行自我调节,从而提高预测精度,便于实现呼叫中心的科学管理,合理 安排话务员班次,使呼叫中心能够为客户提供高效、快捷、优质的服务,树立企业形象, 提高企业竞争力。 所谓呼叫中心( 又称客户服务中心) ,就是采用电话网络、因特网等作为多媒体接 入手段,快速、正确、亲切、友好地对各类大规模的电话呼叫、因特网业务请求、电子 邮件进行信息分配和事件处理的客户服务中心 1 。它是一种基于c t i ( 计算机电话集成 系统) 技术、充分利用通信网和计算机网的多项功能集成,并与企业连为一体的完整的 综合信息服务系统。它是企业和客户之间的一座桥梁,为企业增加市场份额,提高老客 户满意度和发展新客户奠定基础。 呼叫中心源于零售行业,最初设计是为了更方便地向顾客提供咨询服务和有效处理 顾客投诉,以热线电话为主要模式。这一阶段可以被称为“人工应答阶段”,技术含量 低。随着交互应答系统( i v r ) 的产生,大部分常见问题的应答由机器处理,这种人工应 答与自动语音应答结合的呼叫中心称为第二代呼叫中心。在此基础上,引入c t i 加以集 成管理后,出现了人工应答、自动语音应答与c t i 管理相结合的第三代呼叫中心。因特 网兴起后,又增加了通过i n t e r n e t 为客户提供服务的功能。客户可以通过电话、传真、 e m a i 】、w e b 等方式从客户服务中心得到满意的服务,形成了所谓第四代呼叫中心。近几 年,随着新技术的发展,呼叫中心又开始融入v o i p ( i p 网络电话) 、m s ( 手机短消息) 、 g p r s ( 通用无线分组协议) 、视频等多种交互手段。未来的呼叫中心将成为多媒体的、 可移动的、智能化的呼叫中心 2 。 飞速发展的呼叫中心为众多商家进行商业运作提供了成熟的条件和理想的环境。在 美国和欧洲,呼叫中心提供的服务已经成为人们日常生活的一部分。例如,电话银行、保 险、电信、旅游预订、产品售后服务,以及邮购等业务都可以通过呼叫中心来完成。呼 叫中心被引入中国后,在短短的几年内表现出强劲的发展势头,己被越来越多的行业及 用户所接受和应用。截止到2 0 0 1 年,中国呼叫中心座席总数达到9 6 2 0 0 个,市场规模 河海大学硕士学位论文 第一章绪论 1 2 2 呼叫中心 近年来,在计算机和通讯两大高新科技的推动下,基于c t i 技术的呼叫中心得到蓬 勃发展。呼叫中心集成了当今世界上的先进技术,体现出崭新的、严谨的、全方位的面 向客户的多元化服务和巨大的经济效益。 按照呼叫中心的规模,大致可以将其分为三类 1 4 : 大型呼叫中心:超过1 0 0 个座席代表,有时座席高达上千人,这种呼叫中心一般配 置庞大,投资很高,它至少需要有足够容量的大型交换机、自动呼叫分配器( a c d ) 、 自动语音应答系统、c t i 系统、呼叫管理系统、业务代表座席和终端、数据仓库或数据 库等。 中型呼叫中心:座席代表在5 0 到1 0 0 之间。这种系统结构相对简单,投资也少, 容易被中、小企业所接受。它可以省掉大型交换机的投资,而利用专用分组交换机( p b x ) 与c t i 服务器相连,客户资料也保存在应用服务器中,可实时地将接入电话的客户姓名 自动在计算机屏幕上弹出。c t i 服务器一般由c t i 硬件开发商的板卡和p c 组成,其扩容 和增加功能也比较方便,成本也低,因此是一种投资小、见效快、升级也灵活的系统。 小型呼叫中心:座席数目在5 0 个以下。这种系统结构与第二种类似,主要几个部 分如p b x 、c t i 服务器、业务代表座席、应用服务器和数据库大小在数量上均作相应减 少,主要适合业务量不大的中、小型企业。 不论呼叫中心具有何种规模,一个典型的呼叫中心系统应至少满足:业务受理、自 动语音应答、计算机与电话同步、个性化服务、智能化的呼叫分配等要求 1 5 。 1 业务受理 客户对业务的请求与企业系统有关,因而呼叫中心系统应具有与企业业务主机 等相连的功能,连接协议一般采用t c p i p 或s n a 。 2 自动语音应答 i v r 设备应满足客户每周7 天、每天2 4 小时不问断的交互式请求。当座席全忙( 或 下班) 或客户选择语音自动服务时,客户可以通过电话键盘上的按键获取所需 的信息,同时应具有留言、接受图文、传真、企业终端等请求的多元化功能。 3 计算机与电话同步 呼叫中心与一般电话服务中心不同,其特点是计算机与电话同步。当座席人员 接听、拨出和转移一个电话的同时,有关的数据信息应在屏幕上弹出,实现计 算机与电话同步。 4 个性化服务 对采用呼叫中心的企业来说,最大的益处就是为客户提供恰当而且专业化的服 务。呼叫中心一般应具有主叫弓码识别、呼叫引导利呼叫语音提示功能,使特 定需求的客户或大客户被引导到最适合此需要的座席。 5 智能化的呼叫分配 河海大学硕士学位论文 第一章绪论 呼叫中心行业研究报告中对呼叫中心核心竞争能力态势分析显示,数据分析能力是 呼叫中心各项能力中关注度最高而成熟性最低的一项能力。呼叫中心管理者所关心的问 题从最初对呼叫中心的硬件平台及相关技术的关注逐步转到运营管理方面。的确,目前 国内呼叫中心在硬件平台、c t i 及相关技术的应用等方面与欧美发达国家相比毫不逊色, 在某些方面甚至更优一些,但在其运营管理等方面却仍然存在巨大的差距 1 8 。如何更 好地利用呼叫中心日益积累起来的大量历史数据来支持管理者进行决策,是一个有待深 入研究的问题。 在国外,呼叫中心的数据分析问题已经得到了重视并产生了一些研究成果,主要是 基于统计学中的排队论,对呼叫中心的各项数据进行分析和建模,其中e r l a n g 模型是到 目前为止使用最为广泛的一类模型。 对于呼叫放弃率的预测和排班这类数据分析问题,早期通常是用运算表来进行测 算,但是当呼叫中心规模足够大时,这种手工测算可能要花费大量的时间。于是自动排 班系统被引入呼叫中心,这种系统可包含多达五个模块:预测、排班、追踪、座席效率 及实时排班吻合度 1 9 。自动排班系统只用几分钟就可完成原来冗长的手工劳动。 目前,呼叫中心管理系统产品主要有: g e n e s y s 客服人力资源管理( g e n e s y sw o r k f o r c em a n a g e m e n ts 0 1 u t i o n ) :该系统 支持管理者进行规划、预测、安排和分析呼叫中心的资源应用,帮助实现管理的最佳化 2 0 。 威思系统公司端到端排班劳动力资源优化解决方案:该方案包括四个功能领域的组 合:质量监控呼叫中心录音、劳动力资源管理、绩效管理和电子学习 2 1 。 科胜通软件的p l a n n e r :主要用于预测呼叫中心的外呼需求。p l a n n e r 根据外呼数 据产生每小时的座席的需求预测,帮助企业配置座席排班计划,同时p l a n n e r 也可以对 突发情况进行预测,分析突发情况对业务和财务产生的影响 2 2 。 朗讯科技呼叫管理系统:利用基本呼叫管理系统( b c m s ) 和c e n t r e v u 呼叫管理系 统( c s m ) 来支持呼叫中心管理。c e n t r e v u 可提供标准报告,实时报告,历史报告和常 规报告等 2 3 。 上海富雅的v c c a l l m a n a g e m e n t 呼叫中心管理系统:该系统采用先进的软件和数据 库技术,可以进行呼叫流量统计,对a c d 中呼叫排队以及中继线占用的状况进行系统的 统计,为呼叫中心管理者提供决策依据。还提供任务流程定制,监听、打分等功能 2 4 。 c i s c o 公司的c i s c oi pc o n t a c tc e n t e re n t e r p r i s ee d i t i o n ( s r n d ) 2 5 :该系 统包括了基于e r l a n g b 和e r l a n g c 模型的计算器,通过输入数据,计算出所需座席数 等数据。该系统一方面利用e r l a n g c 模型,计算座席数,其前提假设是:呼叫是随机 的并且来电在队伍中等待且不被阻j 卜。输入参数有:高峰时间段内的来电数丫均电话 处理时问,服务水平( 包括需等待的电话的百分数,等待时间) 。输出结果有:根据输 入条件所需的座席数,因缺少座席而导致的需等待的电话的百分比,平均等待时问等。 另一方面利用e r a n g b 模型,计算中继数,其假发是:呼叫是随机的,且被堵塞的用 河海大学硕士学位论文 第一章绪论 户不再立即重新呼叫。在这样的假设之下,如果我们有了堵塞率、呼叫流量、座席数, 其中的任意两个数据,就可以计算出其中的第三个。 分析上述系统中应用的数学模型,其前提假设是理想化的统计学模型,和实际统计 数据有一定差距。把真实的复杂数据应用到这些理想化的模型中,预测结果往往不符实 际。从应用的角度,随着市场的扩大和细分,各类呼叫中心之间存在着很大的差异,呼 叫中心已不再满足于这些套路化的系统,它们迫切需要的是“贴身化”的应用系统和灵 活可变的中间件。即使在同样的呼叫中心,传统的预测方法也己不能跟上呼叫中心日新 月异的发展速度,很难适应不断变化的新需求。 因此,为了解决呼叫中心的预测问题,我们需要设计出一种更加实用、更加灵活的 预测方法,针对不同的呼叫中心,在不同的发展阶段,自动地从实际数据中分析得出相 应的预测结果,为管理者进行科学化的排班提供主要依据。 1 3 本文的工作 1 3 1 研究思路及主要内容 预测的精度是模型的最重要的特征之一。用传统的统计方法在呼叫中心中进行放弃 率预测时,往往精确度不高,适用性差。在这种情况下,我们把目光转向了高度参数化 的模型人工神经网络,主要依据以下考虑: 1 人工神经网络的高度参数化特征使它特别灵活,以至于它可以精确地模拟出函 数中非常小的不规则性。这正适应于描述呼叫中心各项数据的随机性和复杂性。 2 人工神经网络的吸引力还在于它进行自我学习的能力。1 9 6 2 年,r o s e n b l a t t 曾 给出人工神经网络著名的学习定理:人工神经网络可以学会它可以表达的任何 东西。由于呼叫中心是不断发展变化的,比如规模的扩大,设备的更新等,这 就需要预测模型随之而变,具有根据环境自我学习的能力。神经网络能自我学 习的特点正符合呼叫中心的这要求。 3 人工神经网络的学习和训练需要庞大的数据集。呼叫中心的各类技术飞速发展, 特别是数据库技术的使用,为我们积累了越来越多的数据,这正为网络训练提 供了优越条件。 综上所述,我们有理由把人工神经网络应用到呼叫中心的放弃率预测中来。人工神 经网络具有许多不同的网络结构,各类算法和改进算法更是不计其数。在确定了使用人 工神经网络技术以后,我们还需要根据呼叫中心的实际需要,进一步确定具体的训练算 法和网络结构。根据实际需要设计合理的网络结构和算法是人工神经网络应用的难点之 呼叫中心的各项数据具有它的特殊性,它们不仅具有时变性、随机性、复杂性,还 具有很强的相关性。这种相关性既存在于时序相关因素,又同时来自于因果相关因素。 因此,我们进行预测的时候,要同时考虑这两方面的因素来建立综合预测模型。采用单 7 河海大学硕士学位论文第一章绪论 一的预测建模方法往往得到的结果与实际情况有较大的偏差,对实践的指导效果不甚理 想。 本文对呼叫中心放弃率预测的各种方法进行研究和比较,包括基于统计学方法的 e r l a n g 模型预测、基于数据挖掘技术的时间序列预测、基于人工智能技术的人工神经网 络预测,总结出这些方法的优缺点,和它们在实际应用中的困难,在此基础上,研究提 出一种综合考虑时序因素和因果因素的,基于串联b p 神经网络的呼叫放弃率预测模型, 并用实际数据对模型进行了检验与对比分析。 本文的主要工作如下: 1 对呼叫中心的运行机制进行研究,特别是对排队模型深入研究,确定影响呼叫 放弃率大小的各项因素,并把它们分为时序相关因素和因果相关因素两大类。 2 对传统的预测方法进行分析和比较,找出各自的缺点和不足。根据呼叫中心的 实际需要,选择使用人工神经网络的方法来进行预测。 3 特别对b p 神经网络进行深入研究,提出一种串联的b p 神经网络,将基于时序因 素的预测网络和基于因果因素的预测网络进行串联,提高预测精度。 4 根据呼叫中心的领域特点,设计出相应的实验方案并进行模型实验,比较几种 预测方法在呼叫中心中的使用结果,得出本文结论。 l - 3 2 本文结构 本文的结构安排如下: 第一章介绍呼叫中心的发展现状,提出预测呼叫放弃率的重要性,简要介绍基于人 工神经网络的预测建模和呼叫中心的解决预测问题的现状,阐述本文的研究思路和主要 内容。 第二章简要介绍解决呼叫中心预测问题的相关技术,首先介绍经典的排队模型,据 此分析影响呼叫放弃率预测的因素并介绍传统的预测方法。其次,对数据挖掘技术进行 了概述,从组件的角度来分析数据挖掘的算法,介绍一般挖掘算法的组成部分。最后, 介绍人工神经网络和其中的一类前馈网络,重点介绍b p 神经网络,并确定以基于神经 网络的预测技术作为本文的研究重点,用来解决呼叫中心的预测问题。 第三章研究提出一种基于串联的b p 神经网络的呼叫放弃率预测模型,用来预测呼 叫中心管理者极其关心的呼叫放弃率这一数据,其扩展模型也是一种分步的预测方法, 是对复杂预测问题进行解决的一种新的尝试。 第四章根据第三章提出的预测模型,结合某呼叫中心的历史数据,给出了详细的实 验方案,并和其它两种预测方法进行比较,对预测结果给出详细的分柝和对比。 第五章对全文进行总结。 8 河海大学硕士学位论文 第二章相关理论与技术 第二章相关理论与技术 2 1 基于统计学的预测技术 2 1 1 回归预测 这种模型的最简单形式是线性回归模型,即用预报变量x 。的线性组合来表示响应变 量y 的预测值y 术:y 杠a 。+ a l x l + a z x 2 + 十a 。x 。+ + a 口x 口。 实际上我们通常不能完美地预测出响应变量,因此普遍的目标是预测出y 在预报变 量的每个向量位置处所取的均值,所以y 是我们对y 在x = ( x ”,x 。) 点的平均值的预 测性估计。在最简单的情况中仅有一个预报变量( 单一回归) ,这时在响应变量和预报 变量所跨越的空间中可以得到一条回归直线。更一般的情况是多重回归,这时是一个回 归平面。 线性回归模型是最古老、最重要而且应用最广泛的预测模型形式。之所以如此的一 个原因是这种模型具有明显的简洁性:简单的加权求和既易于计算又易于理解。另一个 非常有说服力的原因是它们在很多情况下都可以达到非常好的性能即使是对于我 们有足够把握认为预报变量和响应变量不是线性关系的情况。这是有道理的:如果我们 把连续的数学函数用泰勒级数展开,那么我们经常会发现次数最低的线性项是最重要 的,因此可以使用线性模型得到最好的简单近似 2 6 。 推广的线性模型在这里也值得一提。在线性模型中响应变量被分解为两个部分:预 报变量的加权求和及随机分量:y ( i ) = a ,x ,+ e ( i ) 。它是二十年来数据分析方面最重 要的成果之一,还可以被看作前馈神经网络的基本部分 2 6 。 除了线性回归以外,还有多项式回归,如y 杠a o + a x + a 2 x 2 + - 十a 。x ”。 当呼叫中心规模较小,数据相对简单,且对预测精度要求不很高时,可以采用回归 模型来进行大致预测。在更多的实际应用中,这些模型可以被来进行预测之前的初步数 据分析,发现各类变量之间隐藏的关系,为建立更合理的预测模型作好理论准备。比如, 呼叫放弃率和等待时间的正比关系,等待时间越长,呼叫放弃率越大。 2 1 2 排队论模型 排队论起源于二十世纪初,最初是丹麦数学家尔兰氏( e r l a n g ) 在利用数学方法研 究电话作业时,所发展出来的一套关于随机过程方面的理论 2 7 。排队论是研究拥挤现 象和排队现象的一门学科,已被广泛应用到呼叫中心的设计和管理中。排队是指需要得 到某种服务的对象加入等待的队列。需要得到服务的对象泛称为顾客,而从事服务的设 施或人等泛称为服务台。顾客与服务台构成个系统,称为服务系统。在个服务系统 中,若某一时刻顾客的数目超过服务台的数目,这时必然导致一些顾客不能立即得到服 务而需要等待,从而产生排队现象 2 8 。 9 河海大学硕士学位论文 第二章相关理论与技术 所有的呼叫中心都可以简单地抽象为如图2 1 所示的排队模型。一个呼叫到达后, 如果所有的通信线路都被占用,则该呼叫不能进入系统,产生呼叫损失;否则,它被连 接到一条通信线上。在该通信线上如果有空闲座席,则该呼叫立刻被分配到座席上,被 提供服务;否则,该呼叫被列入等待队列,直到有空闲座席可以提供服务为止。当然, 在等待过程中,也可能发生顾客不耐烦而放弃等待的情况,产生呼叫损失。 呼口q 到达 呼叫损失 呼叫损失服务完毕 图2 1 呼叫中心的基本排队模型 3 这样的过程还可以更抽象地被表示为图2 2 所示的排队模型,包括输入过程,排队 规则和服务机构三大部分。 排队系统 图2 ,2 呼u u 中心抽象排队模型 2 8 输入过程即顾客到达排队系统的随机分布,即到达间隔时间的概率分布。在一定时 期内每个呼叫中心都对应一个相对稳定的客户群体,这些客户的呼叫是一种随机事件, 但它们常常具有一定的规则。常见的输入分布有:定长输入,泊松输入,f f r l a n g 输入, 一般独立输入。 排队规则即顾客得到服务的次序,可以采取的常见规则有:先到先服务,后到先服 务,随机服务,有优先权的先服务。 服务机构可以没有服务员,也可以有一个或多个服务员。常见服务时间的分布有定 长服务,指数服务,e r l a n g 务,一般独立服务。 d g k e n d a l l 在1 9 5 3 年首先使用如下的缩写形式来描述一个排队模型:( a b c ) : ( d e f ) 2 8 ,其中: a :到达( 或到达间隔时间) 的分布。a 可以用m ,d ,b 或g 代替,分别表示:到 达为泊松分布( 或到达问隔时间为指数分布) ,到达间隔时间为定长,到达间隔时问是 参数为k 的e r l a n g 分布,到达为一股分布。 河海大学硕士学位论文第二章相关理论与技术 b :服务时间( 或离开) 的分布。b 可以用m ,d ,e k 或g 代替,分别表示:离开为 泊松分布( 或服务时间为指数分布) ,服务时间为定长,服务时间是参数为k 的e r l a n g 分布,服务时间为一般分布。 c :系统中平行服务通道的个数。c = l ,2 ,o o 。 d :服务规则。d 可以用f c f s ,l c f s ,r s s ,p r 或g d 来代替,分别表示先到先服务, 后到先服务,随机服务,优先服务,一般服务( 包括f c f s ,l c f s 和r s s ) 。 e :系统所允许的最大顾客数( 在服务中和在等待中的顾客总数) 。e = l ,2 , o o ,e 为n 时系统能力有限,e 为o 。时系统能力无限。 f :呼唤来源( 呼唤总体的大小) 。f = l ,2 ,o o ,f 为m 时( 总顾客数为m ) 系统能力有限,f 为一时系统能力无限。 根据这种缩写形式,常见的传统模型,如到达服从单位时间内平均速率为 的泊松 分布,服务时间服从平均服务率为u 的指数分布,s 台服务台,无限源,无限队长服务 系统,可以表示为( m m i s ) :( f c f s 一一) 模型。此外还有( m m s ) :( c d n o o ) 模型, ( m w o o ) :( g d o o o o ) 模型,( m t m s ) :( g d l m m ) ,s t ) = c ( n ,a ) e “”“,其中c ( n ,a ) 为等待概率: c ( n ,a ) = ( a n ! ) ( n ( n a ) ) ( ,。( a i i ! ) ) + ( a “n ! ) ( n ( n a ) ) 1 2 9 平均等待时问t = c ( n ,a ) ( 1 n u ( 1 一p ) ) ,其中,p = i n u 。 有了这些公式,我们可以根据相应参数计算系统的平均等待时间。但是文献 3 0 中 分析出e r l a n g c 模型具有以下缺陷:首先,从上述公式里不易提取直观的信息。比如, 当到达率加倍时需要增加多少座席数目? 用e r a n g c 模型我们只能重新计算。其次, e r l a n g c 模型应用的两个前提假设不满足时,我们会发现预测结果跟实际结果相差很 远。例如,当座席的服务时间不满足指数分布时,排队模型变为m g u o o ,在这种模型 下的预测需要重新计算 3 。 河海大学硕士学位论文第二章相关理论与技术 2 1 2 2e r l a n g b 模型 如果在e r l a n g c 模型中不设置等待队列,当呼叫到达而没有空闲座席的时候,放 弃顾客的呼叫,这样就构成了e r l a n g b 模型,相应的排队模型是( m m n ) :( f c f s n 一) 或简记为m m n n 。所有进入呼叫中一l i , 的呼叫都没有延时,立即得到服务。跟e r l a n g c 模型相比,e r l a n g - b 模型在呼叫等待和阻塞之间做了权衡。e r l a n g c 模型中通过增加 队列来减少到达系统的呼叫阻塞的概率,而e r l a n g - b 模型中没有任何队列等待,在增 加呼叫阻塞率的同时,消除了系统中的呼叫延迟 3 。 在设计呼叫中心系统的时候,如何在阻塞和延迟之间作好权衡是个难题。仿真研究 的结果表明,在通信链路( 队列容量) 比座席数大1 0 的时候,系统可以得到足够好的 性能 3 1 。通信链路过多导致过长的等待时间,通信链路过少导致放弃率增加。 2 1 2 - 3e r l a n g - a 模型 考虑到顾客会失去耐心而在呼叫等待时主动放弃,后来又出现了m m n k + g 模型, 也称e r l a n g a 模型。+ g 表示这种放弃的概率分布是在顾客之间独立的通用分布。 m m n k + m 是这种模型的经典情况,假定放弃的可能性服从指数分布。l a w r e n c eb r o w n 等人以某银行呼叫中心在一段时间内的详细电话数据为基础,通过统计分析证明:在所 需的各种经验参数都很准确且满足到达、服务持续时间的分布符合假设前提的情况下, e r a n g a 模型对系统性能参数的估计比其它两种模型更精确 3 2 。而这些前提假设只适 用于轻负载、小规模呼叫中心的性能分析。对于重负载、大规模呼叫中心来说,由于服 务持续时间的分布特性影响了顾客平均等待时间,且服务持续时间不顺应指数分布状 况,因此它并不适用于e r l a n g a 模型。另外,和e r l a n g c 、e r l a n g b 模型一样,e r l a n g a 模型同样不支持多优先级呼叫中心的性能分析。 总结起来,目前用于解决呼叫中心数据分析问题的e r a n g 模型具有以下一些缺点: 1 对于符合泊松分布的呼叫到达,预测方法采用点估计的办法,这往往容易造成 排班时的人力过剩或不足。 2 当呼叫到达不服从泊松分布或服务时间不服从指数分布时,使用e r l a n g 模型预 测得到的结果与实际情况往往不符。l a u r e n c eb r o w n 等人通过实验发现,仅用泊松分布 函数来表示呼叫到达率是不够的 3 3 。 3 对于顾客放弃后立即重新拨号的情况,e r l a n g 模型没有很好的解决办法。 4 排队模型中没有考虑到员工的中途休息时间,多中继排队,多技能话务员工作 等因素,由此产生的误差是传统的e r l a n g 模型所不能避免的。 2 1 2 4 排队论模型在呼叫中心的应用 目前最经典的也是最被广泛使用的是e r l a n g b 和e r l a n g c 模型 3 4 。目前已有不少 利用此类模型设计的小型计算器,本文将在第四章据此进行对比实验。这些小型计算工 具简单易操作,多数采用e r l a n g 模型。三种e r l a n g 模型都有各自的前提假设,其中包 河海大学硕士学位论文第二章相关理论与技术 含两种共有的前提假设:到达服从泊松分布,服务时间服从指数分布。这些都是理想化的 情况,在实际情况不符合假设时,应用模型分析出来的结果离实际统计结果相差甚远。 因此,应用排队模型来解决呼叫中心的预测问题有其自身难以避免的局限性,为实际应 用带来许多问题。 在实际中,排队模型可以与优化决策方法联合使用。l i n g o 软件就可以实现排队模 型的计算 2 8 。这类方法的理论基础仍然是经典的排队模型,有着同样的局限性。 近年来,呼叫中心的排队模型有了新进展。l a u r e n c eb r o w n 等人对某银行呼叫中心 1 9 9 9 年全部呼叫的统计数据,经过分析得到不同于传统假设的结果 3 : 1 呼叫到达:呼叫到达的p o i s s o n 混合模型是具有未知变化到达率的p o i s s o n 到 达的排队模型 3 5 ,是呼叫中心可分析的模型中呼叫到达最新的建模方式。采用p o i s s o n 混合模型进行排队分析,能更好地逼近实际系统。 2 服务时间:长时间以来,呼叫中心排队模型的服务持续时间一向被认为服从指 数分布。这是由于缺乏试验数据,且假定为指数分布的服务时间便于分析。w h i t t 在文 献 3 0 中给出,在m g n ( 泊松到达,通过分布的服务时间,n 个座席) 前提下,平均等 待时间为:e ( m g n ) 。e ( m m n ) 十( 1 + c 2 ) 2 ,其中c 为变化系数,即服务时间的标准差 除| 三c 平均服务时间。由此可见,在确定服务持续时间的系统中,c = o ,等待时间只有用 指数服务时间假设系统的i 2 。l a w r e n c eb r o w n 等人在对1 9 9 9 年底两个月的数据进行 分析研究后发现,除去服务时间特别短的影响,服务持续时间服从对数正态分布 3 1 。 3 等待时间:呼叫中心的科学排队理论应该考虑到顾客等待的耐心和放弃行为等 因素。b r o w n 提出用耐心指数来研究顾客耐心程度的研究者。从统计数据来看,平均愿 意等待时间并不满足指数分布,平均实际等待时间只是近似指数分布,顾客愿意等待时 间与呼叫业务有关,呼叫业务不同,顾客等待的耐心程度也不同 3 6 。 由以上分析可见,排队模型为我们进行放弃率的预测提供了理论基础,但在实际应 用中仍存在不足:因为它们描述的均是一种理想状态,而实际情况往往比这更加复杂。 对于堵塞少、队列短的系统来说,这些假设不会引起太大的问题,但是当呼叫中心的服 务水平不高的时候,引入这些假设就会造成一些容易令人误解的计算结果。呼叫中心本 身体系结构的复杂性给数学建模带来了很大的困难。 此外,从数据分析的角度,排队模型中使用了些历史数据的统计平均值,如呼叫 到达率、服务时间等,以此来估计呼叫放弃率等其他数值。这样做的前提是:呼叫中心 未来的数据也符合历史的总体平均规律。这样的假设显然不符实际。所以,使用基于排 队论的预测方法,不能充分利用历史数据的变化规律来得出下一个时刻预测变量的数 值,而只是做出一种大致的平均估计,精确度很低,不能适应飞速发展的呼叫中心的实 际需求。因此我们有必要引入其它的技术,建立更符合实际情况的模型,从另一个角度 来研究和解决呼叫中心里复杂的预测问题。 河海大学硕士学位论文第二章相关理论与技术 2 2 数据挖掘 随着计算机和数据采集与存贮技术的飞速发展,人们积累了越来越多的数据,这些 海量的数据中可能包含了很有价值的信息。如何把这些信息从数据中提取出来是当前研 究的热点课题之一。数据挖掘也因此而产生。 2 2 1 定义和任务 数据挖掘是从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的 和可能有用的模式或知识 3 7 】。它汇集了统计学、机器学习、数据库、模式识别、人工 智能、信息提取、高性能计算等诸多学科领域,是一门应用性的交叉学科。基于数据挖 掘的定义,有两点值得说明: 首先,进行数据挖掘的前提条件是“大量的数据”。对于一般的统计员来说,成百 上千条记录可能已经算是很多了,但是数据挖掘能够处理的是包含g 字节甚至是t 字 节的庞大数据集合。在技术发展趋于成熟的呼叫中心里,系统堆积了大量的历史数据, 如a c d 里面的通话记录等。面i 临如此庞大的数据集,利用传统的分析方法很难从中找 出全部有用的信息。因此,将数据挖掘技术引入呼叫中心管理是呼叫中心的一大发展方 向。 其次,数据挖掘的结果是有用的、隐含的、先前未知的。与基于推理和证明的统计 学方法不同,数据挖掘是一种实验性的方法,其结果有时会出人意料。对于难以用理论 来解释或建模的复杂系统呼叫中心,我们不妨用实验性的方法来重新研究它,以期 待得到更多新的有用的知识。 根据数据分析的不同目标,可将数据挖掘任务分为以下几类:探索性数据分析 ( e x p l o r a t o r yd a t aa n a l y s i s ,e d a ) ,描述建模( d i s c r i p t i v em o d e l i n g ) ,预测建模( p r e d i c t i v e m o d e l i n g ) ,寻找模式和规则,根据内容检索 2 6 1 。 本文所研究的问题属于预测建模中的定量预测。预测建模的目的是建立一个模型, 这个模型允许我们根据己知的变量值来预测其他某个变量值。预测和描述问的关键区别 是预测的目标是唯一的变量,而描述问题的模型中并不以任何单一的变量为中心。本文 的任务是利用呼叫中心的历史数据,包括来电的数目,通话时间,处理时间,话务员人 数等,来预测未来呼叫放弃率的具体数值,为管理者在排班时提供决策支持。 2 2 2 工作流程 从数据中挖掘知识的这一过程可以被概括为以下三个步骤: 1 数据预处理过程: 在数据挖掘之前应首先进行需求分析,明确数钳挖掘的目标,从而确定原 始数据集。其次,现实世界的数据是不完整的、含噪声的、不一致的,因此要 对数据集中的数据进行数据清理、数据集成、数据变换、数据规约、数据离散 河海大学硕士学位论文第二章相关理论与技术 化等预处理把它们存储到数据库或数据仓库服务器中,为挖掘过程做好准备。 有了高质量的数据才能挖掘出高质量的结果。 2 数据挖掘过程: 即综合利用各种数据挖掘技术,通过数据挖掘引擎从大量的数据中得出模 式或知识。这一步是数据挖掘的关键步骤,包括多种算法,涉及到许多方面的 技术,人工神经网络就是其中的一种用于预测的有效方法。 3 模式评估: 对得出的模式或知识进行评价和优化,并直观地将其反映给用户。 典型数据挖掘系统的体系结构如图2 3 所示。 数据清理、 图2 3 数据挖掘系统的体系结构 3 7 1 数据挖掘不是简单的一次性操作,以上流程应该是一个不断优化、循环往复的过程。 随着时间的推进,我们可以不断发现新的结果。传统的统计预测方法是模型驱动的,模 型一旦确立,以后需要改动时必须重新分析,重新建模。而数据驱动的数据挖掘方法比 传统统计方法更灵活,更适用于飞速发展的呼叫中心。本文将以此体系结构作为预测建 模的基础之一。 2 2 3 常用方法 前两节已经列出了数据挖掘的任务和步骤,为了完成这些任务,至今人们己找到了 许多有效的数据挖掘方法,常用的方法有关联规则挖掘、决策树方法、粗集方法、遗传 算法、统计分析方法、支持向量机和神经网络方法等 3 8 1 1 3 9 4 0 4 1 】 4 2 。 神经网络是由大量的简单神经元,通过极其丰富和完善的连接而构成的自适应非 线性动态系统,并具有分布存储、联想记忆、大规模并行处理、白组织、自学习、自适 应等功能 4 3 。神经网络能够模拟人类大脑的结构和功能,采用某种学习算法从训练样 1 5 河海大学硕士学位论文第二章相关理论与技术 本中学习,并将获取的知识存储于网络各单元
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年环境监测工程师职业水平测验试题及答案解析
- 2025年绿化主管招聘面试问题集
- 2025年护理学专业技能考试试题及答案解析
- 2025年安全用电知识竞赛题及答案
- 2025年初创企业高管职位面试指南与预测题集萃
- 2025年机械伤害应急处理手册及测试题
- 2025年物业安保主管面试常见问题集锦
- 2025年工程设计师执业能力评价试卷及答案解析
- 2025年财务管理主管实战面试题集
- 2025年建筑员笔试高频题解析
- 保安员在岗培训法律-2
- 初中英语中考专题训练阅读理解-应用文篇
- 《古文观止 上下 》读书笔记思维导图PPT模板下载
- YC/T 210.2-2006烟叶代码第2部分:烟叶形态代码
- GB/T 20671.1-2006非金属垫片材料分类体系及试验方法第1部分:非金属垫片材料分类体系
- 熵权法教学讲解课件
- 医师病理知识定期考核试题与答案
- 课堂因“融错·容错·溶措”而精彩
- 阳光晾衣房钢结构专项施工方案
- 安宁疗护服务流程
- 热分析DSC培训new
评论
0/150
提交评论