




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大地保险智能语音回访系统项目技术评审介绍(正本)编制部门保险事业部当前版本V1.0编制/修改人张仲成编制/修改日期2018-7-15审核人 张金燕审核日期2018-7-16审批人 审批日期北京灵伴即时智能科技有限公司2018年7月修订表版本号发布日期修改页号备注V1.02018-07-16创建目录1应用系统名称12系统关系描述12.1系统接口12.2内外部系统调用关系13系统技术架构23.1主要技术框架23.2总体架构设计23.2.1设计原则23.2.2设计综述23.3逻辑架构24技术解决方案55系统部署架构106网络需求117存储需求118服务器需求129中间件需求1210数据库需求与涉及1311应用安全13大地保险电销承保智能语音回访系统1 应用系统名称大地保险智能语音回访系统2 系统关系描述2.1 系统接口经过前期需求分析,确认本次上线的四个流程可以共用一套接口文档。经沟通,大地保险会为机器人自动外呼提供任务池,并将每个任务根据机器人ID进行区分,智能语音回访系统自动向任务池提取外呼任务,并判断,之后分配给响应的机器人进行外呼。实现上述功能主要需要两个接口: 1、 提取并创建外呼任务 ,智能回访系统作为客户端向大地业务系统提取外呼数据;2、 任务结果反馈 ,大地系统作为客户端,接收回传结果;接口详细内容需要等大地业务系统接口设计完成后设计并提供。频率:以当天实际任务池实际任务数为准。回传调用分为实时回传。数据量:以当天实际任务池实际任务数为准。响应时间:预估响应时间0.8s,平均时间约0.5s,峰值时间约1s。可用性:服务运行期均可用。2.2 内外部系统调用关系智能语音回访系统大地业务系统提供的接口,按获取任务数据的时间点进行拨打,每天由大地业务系统指派外呼任务。在智能语音回访系统在结束任务之后,根据需求侧的约定,将业务系统所需要的信息,按照实际需要的信息,进行出参回传(需求分析完成后确定),回传方式可参考我司最终输出的接口文档。交互过程中涉及下发短信的,再调用相关接口进行短信下发;线路方面,我司支持两种对接方案,目前还未确定。1. 通过协议转换网关,直接对接机器人系统与大地E1线路,不涉及系统层面对接。2. 通过软件换与大地话务平台进行SIP TRUNK组网对接,不需借助第三方硬件设备。3 系统技术架构3.1 主要技术框架SpringCloud、SpringBoot、OAuth2、MyBatis、Durid3.2 总体架构设计3.2.1设计原则业务前瞻性,技术先进性,需求实用性,业界标准级。3.2.2设计综述在全面分析当前开发平台特点的基础上,结合未来业务发展趋势,分析潜在业务支撑需求,从技术架构、数据模型、集成手段等各个维度充分借鉴并吸收行业先进经验和技术,提供面向软件产品线模式,从需求、设计、开发、测试、部署到运维全生命周期支撑的企业应用开发平台,帮助用户实现业务模式的创新与变革。3.3 逻辑架构一、 基础通讯层本系统采用软交换功能系统,由于既能执行与基于硬件的传统电话交换机相同的功能,既一款基于软件的交换设备,是一个跨平台的开源电话交换平台,又能同时处理IP通信,软交换技术承诺可提供许多优势,如轻松整合电路交换和分组交换、降低网络成本等。二、 核心技术层1. 基于深度学习神经网络的大词汇连续语音识别技术自动语音识别(AutomaticSpeechRecognition)是通过计算机将人类语音转化为相应的可读文本的技术。语音识别技术在智能计算机系统中扮演着重要的角色,在智能人机交互、信息获取、反恐安全等领域有着广泛的应用。在传统的基于统计模型的语音识别技术中,识别系统主要包含声学模型建模、语言模型建模与识别解码三个主要的技术环节,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。在语音识别领域有着深厚的研究基础,在消化吸收当前先进技术水平的基础上,研发团队结合自身优势,实现了基于深度学习神经网络声学建模的大词汇量连续语音识别技术。我司的科研人员,全球首创将LSTM的方法应用于深度神经网络的训练,该项技术可在保持模型可推广性的同时大幅度提高识别的准确率。与此同时,语音识别系统还引入了基于语义的自然语言建模等领先技术。该识别引擎已在多个在线运行系统中投入使用,其优越性能已得到了充分的验证。2. 基于统计模型的高自然度的语音合成技术语音合成,又称文语转换(TexttoSpeech)主要研究如何将文字信息转化为音质清晰、自然流畅的可听声音信息。TTS核心包括语言处理、韵律分析和语音合成三个环节,涉及声学、语音学、语言学、数字信号处理、计算机科学、模式识别等多种前沿的高新科技。目前,从产业化的角度来看,语音合成技术已经有了较大规模的应用,在声讯服务、有声读物、智能导航、盲人辅助阅读等领域发挥着巨大的作用。通过自主地研究和开发,在中文语音合成技术的多个领域都有独创性的技术成果。以统计模型为基础,以提高合成语音自然度为目标,语音合成系统中集成了高效语料库收集与设计、高鲁棒性的智能文本分析、韵律标注分层体系、海量数据的多机并行训练、可定制语音合成等技术特色,在语音合成自然度等性能指标上具有显著的优势。3. 基于统计的高性能自然语言处理技术自然语言处理(naturallanguageprocessing,NLP)是利用计算机对人类特有的书面形式和口头形式的语言进行各种类型处理和加工的技术,对自动语音合成和语音识别的性能有着很大的影响:在自动语音合成中,它提供了文本的正确读音,并提供词法、句法等信息来预测基频、时长和能量等韵律参数。在自动语音识别中,它为声学建模和语言建模提供了正确的训练数据来提高模型的性能。在自动语音合成和语音识别的应用中,通常都需要文本规范化、自动分词、词性标注、句法分析以及字音转换等技术环节。我司针对应用技术的需要,发展研发了一系列具有独创性的技术成果,其中最具代表性的技术包括:采用一体化方法对各层信息逐层建模,统一解码,实现了统一框架下的文本规范化,有效地减少规则转换错误和分词错误带来的影响;基于字序列对词法、句法进行一体化分析,从而避免了级联错误;在句法分析中引入了非标准词的信息,从而实现文本规范化和句法分析的联合分析;在音字转换中,融合多语言线索对多音字进行消歧。这些技术的实现和引入,有效提高了自然语言处理的准确性和可靠性,并为语音合成和语音识别等上级语音处理任务带来了可观的性能提升。4. 对话模块基于对三大语音识别、合成与自然语言处理模块的高效整合,打造出可以对说话人角色有效区分,对说话内容高度理解且快速应答的智能对话模块。三、 对话业务层系统包含的机器人管理、流程设计器、工单等必要对话涉及到的模块。4 技术解决方案概述:我司为大地保险提供智能语音回访服务,采用与大地保险业务系统对接的方式实现,所有数据均在大地保险内网进行交互。其次,我司采用Sping Cloud架构搭建管理系统,能够保证大地保险要求的大数据量查询/下载/处理、高并发。该架构只涉及智能回访管理系统的内部服务,不涉及大地系统及第三方系统对接。在第八章-“服务器需求”章节,我司为智能回访项目设计了满足该架构功能并能确保所谈需求能够顺畅运行的服务器资源配置。1. 智能语音回访系统健壮性系统对于大数据量的查询、下载、处理等任务主要是通过Spring Cloud架构下的Zuul、Eureka和Ribbon模块实现。智能语音回访系统架构中的Zuul 可以提供动态路由,监控,弹性,安全等边缘服务的框架。Zuul 相当于是设备和 Netflix 流应用的 Web 网站后端所有请求的前门。Zuul的主要功能如下: 验证与安全保障: 识别面向各类资源的验证要求并拒绝那些与要求不符的请求。 审查与监控: 在边缘位置追踪有意义数据及统计结果,从而为我们带来准确的生产状态结论。 动态路由: 以动态方式根据需要将请求路由至不同后端集群处。 压力测试: 逐渐增加指向集群的负载流量,从而计算性能水平。 负载分配: 为每一种负载类型分配对应容量,并弃用超出限定值的请求。 静态响应处理: 在边缘位置直接建立部分响应,从而避免其流入内部集群。 多区域弹性: 跨越AWS区域进行请求路由,旨在实现ELB使用多样化并保证边缘位置与使用者尽可能接近。 Netflix公司还利用Zuul的功能通过金丝雀版本实现精确路由与压力测试。Eureka具有高可用性,全天候7*24小时的提供服务,一般最少三个生产者,来提供服务。会通注册中提供的服务提供者的列表来复制其他生产者的数据,一旦生产者不能够连接或是产生问题,通过心跳机制不能连接的话,会从其他的生产者中提供服务,如果心跳峰值低于阈值的话,会启动自我保护模式,暂时保留现有的服务提供的数据,这样就不用担心所有的生产者有问题。Eureka服务器用作服务注册服务器。Eureka客户端是一个java客户端,用来简化与服务器的交互、作为轮询负载均衡器,并提供服务的故障切换支持。Netflix在其生产环境中使用的是另外的客户端,它提供基于流量、资源利用率以及出错状态的加权负载均衡。Ribbon,提供客户端负载均衡服务。具备完善的配置选项,比如连接超时、重试、重试算法等。Ribbon内置可插拔、可定制的负载均衡组件。下面是用到的一些负载均衡策略: 简单轮询负载均衡 加权响应时间负载均衡 区域感知轮询负载均衡 随机负载均衡2. 高并发数据稳定性根据前期沟通,当前电销部门上线承保回访单智能回访流程,预计并发路数20路左右。通过接口对接的形式进行数据交换。数据交换策略由业务指定,需要人工回访的需要实时回传交互,此处并发数据可以忽略不计,不涉及高并发数据的稳定性。不需要人工回访的滞后在北京时间零时,统一进行数据回传。相比于实时回传的数据量稍大。业务层接口对接数据传输,使用http协议进行数据传递。http协议建立在TCP协议之上的一种应用,能够确保数据传递的稳定性和安全性和准确性。http协议的底层是在应用层里,是一个特殊处理的socket,建立在TCP/IP协议之上的一种广泛应用,服务器先初始化一个socket,与端口绑定,对端口进行监听,调用阻塞,等待客户端的连接,初始化客户端的socket,与服务器的socket连接,需要经过三次握手。客户端向服务器发送数据请求,很多情况下,需要服务器端主动向客户端推送数据,保持客户端与服务器数据的实时与同步。此时若双方建立的是Socket连接,服务器就可以直接将数据传送给客户端;若双方建立的是http连接,则服务器需要等到客户端发送一次请求后才能将数据传回给客户端,因此,客户端定时向服务器端发送连接请求,不仅可以保持在线,同时也是在“询问”服务器是否有新的数据,如果有就将数据传给客户端。服务器将数据返回给客户端,客户端读取数据,显示在界面上,数据传递后,客户端断开连接需要经过四次握手断开连接。在不保证实时性的情况下,http协议对高并发的数据可靠性有着更大的优势。其次,http协议传输的 body 部分大小没有上限,也就意味着对大数据的传输也是没有大小限制的,能够充分满足大地保险对机器人系统的要求。可参考第二节提供的接口描述,智能语音回访系统与过河兵系统的数据调用与回推采用的是“GET”和“POST”方式。首先是GET方式通过URL提交的数据多达1024字节,而实际上,URL不存在参数上限的问题,http协议规范没有对URL长度进行限制。理论上讲,POST是没有大小限制的,http协议规范也没有进行大小限制,所以在数据传输上,能够保证大量数据的传输稳定性。3. 互联网安全问题整个智能语音回访系统部署到大地机房,直接与大地现有业务系统在内网进行业务对接,完全部署在大地F5及防火墙内部,整个数据流不出内网。不需要接入互联网,不涉及高危互联网接入操作及风险问题。5 系统部署架构初步部署方案:建议提供两台服务器【分别部署机器人系统和管理系统】,使用大地内网防火墙即可。如下:整个智能外呼系统包括三个模块:管理系统、机器人系统、协议转换网关/软交换(如果采用软交换,则软交换与机器人系统合设)。其中机器人系统和管理系统需要部署在服务器上,服务器可以为物理服务器也可以为虚拟机。具体配置需要根据实际外呼情况进行评估,可以支持根据后续外呼量的增加进行服务器扩容。服务器配置规格要求请参考第八章-“服务器需求”章节,我司为智能回访项目设计了满足该架构功能并能确保所谈需求能够顺畅运行的服务器资源配置。服务器配置组网图如下:6 网络需求因此系统偏后台维护,对网络要求较为简单,无代理服务器要求;使用大地内网防火墙,不涉及负载均衡。预估系统占用网络带宽大小:1Mbit/10路。7 存储需求数据库存储:数据容量:10K x 10000W x 365 = 36G (一通电话数据10K,1天10000通电话任务,365天数据容量约36G)录音文件存储:(按20,50,100路并发预估,一路并发可以理解一个座席拨打电话)第一阶段:20路并发20(路并发)*365天*9小时*60分*120K,约为450G/年第二阶段:50路并发50(路并发)*365天*9小时*60分*120K,约为1125G/年第三阶段:100路并发1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年社区团购市场用户留存与社区团购平台用户增长策略研究报告
- 2025年工业互联网平台TEE在工业设备智能故障诊断与修复的应用案例
- 江苏省淮安市淮阴中学、姜堰中学2026届化学高一第一学期期中质量跟踪监视模拟试题含解析
- 2026届云南省文山州马关县一中化学高二第一学期期末质量跟踪监视试题含答案
- 广东大埔华侨二中2026届化学高三第一学期期末监测模拟试题含解析
- 2026届安徽省亳州市第十八中学化学高二上期中联考模拟试题含解析
- 2025年注册会计师(CPA)考试 会计科目押题冲刺试卷及解析
- 新中国人口政策的变迁
- 河南省安阳市林州一中2026届高三化学第一学期期末检测试题含解析
- 2026届黑龙江省大兴安岭漠河县一中化学高一第一学期期末调研模拟试题含解析
- “三重一大”决策 标准化流程图 20131017
- Cpk 计算标准模板
- 信息科技课程标准新课标学习心得分享
- 小学生元宵中秋猜谜语竞赛题目
- 环保与物业公司合作协议
- FZ/T 01057.2-2007纺织纤维鉴别试验方法 第2部分:燃烧法
- 面条制品-课件
- 2023年重庆市社区工作者考试试题
- 四上科学第一单元《多样的动物》知识梳理
- 微观经济学-范里安varian中级
- 《印章移交登记表》
评论
0/150
提交评论