市民诉求数据分析系统建设项目需求_第1页
市民诉求数据分析系统建设项目需求_第2页
市民诉求数据分析系统建设项目需求_第3页
市民诉求数据分析系统建设项目需求_第4页
市民诉求数据分析系统建设项目需求_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市民诉求数据分析系统建设项目需求一、项目绩效目标2023年市民诉求数据分析系统的建设目标是,综合运用云计算、大数据技术,统一归集共享全区热线电话市民诉求工单数据、信访工单数据,形成统一集中的诉求工单大数据中心;建立智能分析模型,提高诉求工单的数据挖掘能力,定期发布市民诉求分析报告,加强对重点关注事件的管控力度、对未知矛盾的预防预测能力,及时把控社会矛盾热点,高效协同化解社会矛盾。具体实现以下目标:1.构建智能分析模型,深化数据应用价值;2.打造“智慧中枢”,高效辅助治理决策;系统绩效指标序号一级指标二级指标三级指标指标说明及测算1效益指标业务核心指标系统分析信访和热线电话数据的规模:不少于40万。2AI深度语义分析与理解模型、多维度信息融合和智能比对模型的整体准确率:不低于90%。3智能分流模型的准确率:不低于90%。4全国热线电话系统子账号上工单自动办结率:不低于98%。5全国平台热线电话工单自动分流准确率:不低于90%。6系统生成报告数量:每年不少于18份。包括月度、季度、半年度和年度7数据库里所采集到的数据与原业务系统(热线电话/信访系统)数据的一致性:不低于99%。8系统用户数(个):不少于100个。9系统用户活跃度:不少于90%。10数据治理分析报告数量:不少于8份。11系统质量系统性能系统并发数(个):不少于50个。系统支持最大的用户并发数12系统吞吐量:不少于300qps。单位时间的业务处理数量13数据共享与开放新增信息资源目录数(个):2个。新增总信息资源目录数14应用效果用户满意度用户满意度不低于95%。系统服务对象对系统的满意度情况15用户活跃度系统用户活跃度:不少于90%。16建设质量业务支持度业务支持度:不低于95%。由业务部门针对业务支撑情况进行百分制打分17资源利用率资源利用率:不低于98%。18项目管理规范性项目管理规范性:不低于98%。19网络安全安全指标等级保护(分级保护)级别:三级。20备份能力备份策略:增量备份,每日进行一次备份。二、项目建设内容本项目建设内容主要包括以下:序号系统名称功能模块功能说明1市民诉求数据分析系统信访工单数据分析信访系统诉求工单数据资源库建设、热点话题/热词诉求分析、重点关注领域专项分析、难点复杂事件分析、效能分析、信访工单风险提醒、可视化展示。热线电话工单数据分析热线电话系统诉求工单数据资源库建设、总体概况、承办量全市排名情况、全区投诉热点分析、集中诉求统计分析、重复投诉统计分析、各街道及职能部门办理统计分析、热线电话工单风险提醒、热线电话工单可视化展示。诉求工单数据关联分析关联事件、内容分类重新分层归类、源头压减比对。报告工单数据展示板块数据展示模块、操作界面模块、展示管理模块。热线电话和热线电话系统工单自动化流程全国热线电话系统子账号上工单自动办结、全国平台热线电话工单自动分流、热线电话系统工单重办承接、热线电话系统工单自动延期审批。人工智能学习优化模型智能实体信息抽取引擎。AI深度语义分析与理解模型。多维度信息融合与智能比对模型。智能分流模型。数据采集数据导入导出、自动化采集。系统管理首页、任务管理、资源管理、报表中心、权限管理。2数据治理数据采集数据采集、适用性确认。数据处理数据清洗、数据加工。数据分析多维度分析、多部门分析、多图表展示。三、建设需求3.1应用架构以信访和热线电话工单数据采集为核心,在整合利用全区业务信息资源基础上,利用大数据、人工智能等新技术,构建市民诉求数据分析系统,为用户提供信访工单数据分析、热线电话工单数据分析、工单数据比对分析、诉求工单智能分析等功能,为部门提前防范、快速处置提供精准可靠的辅助决策支撑。3.2网络架构本系统部署在区业务云平台,通过电子业务外网连接市、区、镇各级管理部门。3.3技术路线3.3.1采用RPA技术机器人流程自动化是一种新兴的程序软件工具,使用自动化软件的技术来模拟流程的步骤,不会影响现有的IT基础设施,可以加快后端任务,可以自动化识别系统登录的验证码。通过RPA(RoboticProcessAutomation机器人流程自动化)自动化的方式,可以更快速辅助完成业务数据服务相关的工作,完美地辅助甚至取代基层业务人员的大量机械投入,高效完成重复性高但却有逻辑性的业务数据服务相关工作。RPA工作流程如下图所示:RPA工作流程图设计器:提供便捷的功能组件和界面,设计完成整套流程的指令,支持将指令发布于“机器人客户端”或上传于“机器人控制台”。机器人:部署与执行具体任务到计算机终端中,支持实体/虚拟化部署,与具体执行的业务及流程进行交互。控制台:支持通过共享的服务端体验完整的管理功能,并提供服务端管理功能,支持用户管理私有隔离。3.3.2采用OCR技术本项目拟通过OCR技术应用,主要是应用在可以自动识别登录系统时需要的验证码。OCR技术通过选取的项目开发服务方自研实现。OCR(OpticalCharacterRecognition)是指通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,采用光学的方式将文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。OCR处理流程如下图所示:OCR处理流程3.3.3采用NLP技术本项目拟通过NLP技术应用,有效提升非结构化数据的解读能力,实现对业务场景中非结构化数据的智能分析。计算机信息化系统中的数据分为结构化数据和非结构化数据。其中,非结构化数据是指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。非结构化数据包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音频/视频信息等。NLP(NaturalLanguageProcessing,自然语言处理),是指机器理解并解释人类写作、说话方式的能力,是计算机科学领域以及人工智能领域的一个重要的研究方向。NLP能够让机器在理解语言上像人类一样智能,最终弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距,搭建机器语言和人类语言之间沟通的桥梁。从自然语言的角度出发,NLP基本可以分为两个部分,自然语言处理以及自然语言生成,演化为理解和生成文本的任务,如下图所示:自然语言处理逻辑图例如本系统建设所涉及到的工单数据的“市民诉求”字段包含大量的文本内容,即“希望相关部门介入,要求施工方降低装修施工噪音,尽量缩短装修施工时长。”通过NLP技术,可以将该段文本内容进行准确的理解,即可以理解为本段内容描述的是关于“施工噪音问题”。在比对信访工单和热线电话工单的相似工单分析时,便可以利用NLP技术去确定不同文本描述的内容是否一致,从而确定是否为相似工单。3.3.4采用WebService技术本项目建设系统将通过RPA与API接口等多种方式,构建系统所需的数据资源池。本次采用的WebService标准可以解决同构、异构应用互访。其使用XML的消息处理作为基本的数据通讯方式,消除使用不同组件模型、操作系统和编程语言的系统之间存在的差异,为系统与其他异构系统直接的自由通讯提供支撑。WebService采用HTTP协议传输数据,采用XML格式封装数据(即XML中说明调用远程服务对象、传递的参数以及服务对象的返回结果)。XML是WebService平台中表示数据的格式,易于建立和易于分析。本项目建设系统使用WebService技术,能够实现以下优势:(1)跨防火墙的通信:缩短系统开发周期,减少了代码复杂度,并能够增强应用程序的可维护性。(2)应用程序集成:应用程序可以用标准的方法把功能和数据“暴露”出来,供其它应用程序使用。XMLWebservices提供在松耦合环境中使用标准协议(HTTP、XML、SOAP和WSDL)交换消息的能力。3.4建设需求3.4.1信访工单数据分析信访系统诉求工单数据资源库建设支持提供信访系统已有数据及后续新增数据的入库、清洗、搜索和导出功能。热点话题/热词诉求分析支持从多维度对热点话题/热词诉求进行分析。热点话题分析包括按照诉求的事项分类情况进行梳理统计,分析内容包括数量排名、增长趋势、诉求内容、分布地址、处理部门/街道维度。通过饼图、条形图、柱状图展示分析结果。支持通过地图展示诉求事项的热点问题、热点地址的空间分布情况。热词分析支持对某个时间段内出现频率较高的词汇进行分析,以了解该时间段内的热点话题和关注点。重点关注领域专项分析支持对金融、物业纠纷、劳资纠纷、学位纠纷等重点关注领域的专项分析。支持发生时间的趋势分析、数量的增减分析、关联事件的分析。通过饼图、条形图、柱状图展示分析结果。支持通过地图展示诉求事项的空间分布情况。难点复杂事件分析支持疑难复杂事件进行多维度的分析,疑难复杂事项是指:同一件诉求被集中群体投诉、同一个人多次进行投诉、满意率低的诉求事项类型等。分析的维度包括发生时间的趋势分析、数量的增减分析、关联事件的分析。通过饼图、条形图、柱状图展示分析结果。支持通过地图展示诉求事项的空间分布情况。效能分析支持实时监测分析各承办单位的处理情况,包括区各项事项的平均处理时长、各承办单位的处理时长排名、各承办单位处理结果的满意情况的排名。支持通过丰富的图表展示效能分析的各项情况。信访工单风险提醒支持指定风险提醒功能,通过信息管理(上报)人员选取的信息接收单位,系统将信息自动推送至相关单位对接人员的账户,同时后台可以实时查看风险提醒信息接收的状态,以便更好的进行提醒通知。支持短信提醒功能,可以对接短信平台,实现推送风险提醒短信至用户手机。信访工单可视化展示支持通过大数据技术与GIS技术的结合,在电子地图上落点标注;展示工单数量排名前10的类别、工单数量增长排名的类别、某类别工单的分布地址、某类别工单的分布时间、承办单位数量排名和占比、承办单位处理时长排名、承办单位满意度排名、集体诉求工单统计、重复诉求工单统计、热词频次统计、跨系统相同事件统计。支持热力图、散点图、柱状图、折线图、饼图的呈现。支持按对应模板生成数据报告,主要可以提供的报告范围如常规月报、半年报、年报的统计报告。支持在移动端应用端实现查看统计分析的数据结果。能够根据职责权限推送不同的统计分析的数据结果到移动端账号上,进而可以查看不同权限内容的数据结果。移动端端的对接和接口由项目单位按相关管理办法协调相关部门提供。3.4.2热线电话工单数据分析热线电话系统诉求工单数据资源库建设支持热线电话工单系统的数据入库、清洗、搜索和导出功能。总体概况支持将热线电话工单分析的总体概况展示在系统界面上。展示的内容包括事项总件数、各类型的占比、办理满意率等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。承办量全市排名情况支持将热线电话工单分析的承办量全市排名情况展示在系统界面上。展示的内容包括排名的情况、承办量占比、满意度、满意度排名等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。全区投诉热点分析支持将热线电话工单分析的全区投诉热点分析情况展示在系统界面上。展示的内容包括全区总承办量、全区投诉热点前三承办事项及占比、类型分布情况等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。集中诉求统计分析支持将热线电话工单分析的集中诉求统计分析情况展示在系统界面上。展示的内容包括集中诉求总数量、集中诉求占比、具体的事件内容等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。重复投诉统计分析支持将热线电话工单分析的重复投诉统计分析情况展示在系统界面上。展示的内容包括重复来电号码数量及占比、围绕的问题、排名前五的情况、时间段等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。各街道及职能部门办理统计分析支持将热线电话工单分析的各街道及职能部门办理统计分析情况展示在系统界面上。展示的内容包括各街道承办的热点事项数量及满意率、各职能部门承办的热点事项数量及满意率等。同时,支持统计数据的明细表查询、支持统计数据的饼图和柱状图展示。热线电话工单风险提醒支持指定风险提醒功能,通过信息管理(上报)人员选取的信息接收单位,系统将信息自动推送至相关单位对接人员的账户,同时后台可以实时查看风险提醒信息接收的状态,以便更好的进行提醒通知,及时介入处理事件。支持短信提醒功能,可以对接短信平台,实现推送风险提醒短信至用户手机。热线电话工单可视化展示支持通过大数据技术与GIS技术的结合,在电子地图上落点标注;展示工单类型维度组合与时间分布、诉求问题分类、承办单位统计、地址分布、办理情况。支持热力图、散点图、柱状图、折线图、饼图的呈现。支持提供报告上传和下载界面。可以在线预览报告的内容,用户可以导出分析报告,以方便脱离网络使用。支持在移动端应用端实现查看统计分析的数据结果。能够根据职责权限推送不同的统计分析的数据结果到移动端账号上,进而可以查看不同权限内容的数据结果。移动端端的对接和接口由项目单位按相关管理办法协调相关部门提供。3.4.3诉求工单数据关联分析关联事件支持热线电话系统与信访部门系统关联事件的比对,关联事件是指同一个人或者同一个事件同时存在于热线电话系统和信访部门系统中。内容分类重新分层归类支持在系统界面查看梳理完毕的重新分层归类对应关系表。并且会按照季度优化更新内容分类重新分层归类,从而使数据的比对更加精确。源头压减比对将已经在热线电话系统提交诉求且未来可能形成信访件的诉求事项进行风险提醒,让这些可能形成信访件的诉求在热线电话系统接到诉求工单时,就重视解决使得信访件从源头上进行压减。系统可将需要提醒的事件自动推送至相关单位对接人员的账户,同时后台可以实时查看事件提醒的接收状态,以便更好的进行提醒通知。支持短信提醒功能,可以对接短信平台,实现推送风险提醒短信至用户手机。报告工单数据展示板块报告工单数据展示板块开发原则:1.遵循HTML5和CSS3的标准规范,确保页面内容的可访问性和可维护性。2.使用交互式的数据展示方式,让用户可以自行选择和探索数据。3.使用H5页面的API接口,将H5页面的数据和功能与客户端、APP进行对接,实现跨平台的数据交互和应用。4.采用响应式设计,确保页面在不同设备和屏幕尺寸上都能够良好呈现。(一)数据展示模块常规报告展示模块该模块主要展示内容包括区局、街道等经办单位提供可视化的工单类型、问题分类、地理空间、集中诉求、重复诉求、办理情况等数据展示服务,提升基层单位的整体办理效能。并可根据预设规则,对异常数据进行告警。(1)业务数据查询:用户可以按区局、街道、工单类型、时间等维度选择数据展示范围,输出指定时间周期内的事项、服务类别、反映业务、咨询内容等工单信息。(2)可视化图表展现:通过表格、饼图和趋势图等图表,用户可以轻松获得业务办理情况的实时数据,以及业务工作量的趋势变化。并可通过高亮、色块等方式标识异常数据。(3)同比和环比分析:使用同比和环比分析,用户可以更深入地了解经办单位的业务办理情况发生的改变和趋势。(4)经办单位效能对比:通过使用雷达图等方式,用户可以同时查看多个经办单位处理任务的速度和任务质量的关键指标,并进行横向对比,这可以帮助优化处理过程和提高业务质量。(5)数据操作:提供多种过滤方式、数据下载、数据导出等功能,便于各级经办单位操作数据。报告工单热点洞察展示模块(1)工单聚类分析:结合RPA和NLP技术,在业务工单中识别工单诉求内容后,抽取工单的实体信息、事项等信息、按关键字、同义词、实体、事项等不同维度进行聚类分析,形成数据分类、问题分类等数据集。数据集生成:可设定根据事项分类、队列等维度的生成条件,通过NLP识别工单内容中的实体和关键字,生成对应数据集。数据集查询:提供关键字、实体、事项等查询项,查询所需数据集合和报表。数据集更新:提供手动或自动的方式,更新数据集。(2)热点分析:将工单内容中的地址、主体、事项等信息,以时间、地点、频率等维度,进行集中诉求、重复诉求等热点分析,并以热力图,直方图等可视化图表方式进行展现。集中诉求看板根据主体、地址、诉求内容等信息,对诉求进行分类及统计,显示集中爆发的诉求。重复诉求看板根据诉求人、事项、历史工单处理情况等条件,标识业务隐患。热点图看板将工单地址进行逆地址转换,根据范围阈值、行政区域边界的坐标进行分布计算,展示高频、集中的地点、事项等信息.(二)操作界面模块(1)展示用户中心:提供展示用户登录、历史查询记录、收藏等功能。(2)报告查询:提供用户报告查询界面,按时间段、事项等查找报告功能。(三)展示管理模块(1)数据同步模块:提供RPA和API方式从业务系统中获取报告所需数据,以及文件上传、人工导入等方式采集、同步数据。数据源管理RPA机器人、API地址、鉴权等自动化数据抓取配置。文件上传提供数据表选择、数据模板下载、数据文件上传等功能。(2)展示账号管理:提供用户账号管理,新增、修改用户等功能,并提供区局、街道等多级权限数据配置功能。(3)展示权限管理:提供用户组织层级、部门层级,人员分配等管理功能。3.4.4热线电话和热线电话系统工单自动化流程全国热线电话系统子账号上工单自动办结本功能需要根据热线电话系统工单状态信息更新,智能将热线电话投诉举报工单下派处所、退单、办结操作等同步到热线电话系统。智能将热线电话投诉举报工单办结信息同步到热线电话平台对应工单进行办结更新。全国平台热线电话工单自动分流实现全国平台热线电话工单实现自动分流至处所,选择向下分流,按照地址选择处所自动分流。由于每个处所有对应的管辖区域,工单向下分流主要依据地址所属的辖区判断工单所属的处所。因此,本功能需要通过利用AI模型构建,智能识别工单的地址字段,并判断所属的辖区,再实现自动向下分流。热线电话系统工单重办承接支持通过机器人自动化流程完成自动化智能重办承接派单:通过自动判断所属二级处理单位,自动将工单退回对应的处理部门。热线电话系统工单自动延期审批支持通过机器人自动化方式,实现全自动化处理,能够自动检测是否有新增的待延期审批的工单,一旦检测发现有需要延期审批的工单,则自动完成延期审批。实现消委账号下,延期审批申请工单剩余办理时间为0-1天的工单自动通过;热线电话系统账号:实现2天内工单延期自动审批。3.4.5人工智能学习优化模型本项目包括一个抽取引擎和三个模型。分别是智能实体信息抽取引擎,AI深度语义分析与理解模型,多维度信息融合与智能比对模型,智能分流模型。智能实体信息抽取引擎的作用是信息筛选,将长文本中的无效信息去除,为后续模型的输入数据进行初步的加工。AI深度语义分析与理解模型、多维度信息融合与智能比对模型连接在一起,共同处理数据,用于对信访部门与热线电话数据进行交叉比对。智能分流模型专门用于处理市场监管管理部门的热线电话数据。人工智能学习优化模型支持按季度进行模型训练和修正,提升业务准确性。智能实体信息抽取引擎利用智能实体信息抽取引擎,将诉求工单文本中的实体信息自动化地提取出来,以便进行进一步的诉求工单分析和应用。AI深度语义分析与理解模型AI深度语义分析与理解模型通过深度学习算法来实现对文本或语音的理解和分析,让机器能够像人类一样理解文本的含义,并能够从中提取出有用的信息。多维度信息融合与智能比对模型利用多维度信息融合与智能比对模型,将所收集到的热线电话和信访工单系统中多元维度的诉求工单数据,通过融合和智能比对不同维度的数据,发现并关联相关的工单。智能分流模型利用智能分流模型,根据工单类型、内容和历史数据等因素,实现热线电话工单的智能分流,该模型需要具备持续优化和API调用的分析输出功能,确保结果的准确性和时效性。3.4.6系统管理可用于管理所有运行流程的自动化终端、管理流程、管理用户、管理任务机制、负载容灾,采用B/S架构,可通过浏览器进行访问,是所有自动化终端的管理和存储中心,对开发工具上传的自动化终端进行审核及分发。同时具备自动化终端管理、自动化终端工作台管理、用户管理、系统管理、任务管理、报表统计、安全审计等功能。具体的功能如下:(1)首页:展示设备详情、任务详情、自动化终端详情等。(2)任务管理:任务的相关状态的管理,包括流程名称、启动方式、任务状态等。(3)日志与告警:可以查看日志,以及可以配置告警规则,对告警规则进行管理,自行对监听目标进行巡检,便于发现异常数据。(4)资源管理:包含流程管理、授权许可管理、开发者接口管理、任务数据和任务变量管理等。(5)报表中心:提供任务运行相关的数据报表。(6)权限管理:将用户及权限进行分权分域管理。3.4.7已建或在建信息系统对接系统需对接的系统为已建成的热线电话系统、热线电话系统和信访系统,对接方式可通过数据接口和RPA的方式对接等方式进行对接。系统需对接的系统为统一短信平台。需要调用统一短信平台的短信接口完成短信发送。系统需对接的系统为区业务大数据平台。需要利用区业务大数据平台进行移动端数据看板功能的实现。3.4.8数据治理服务采用分析数据集为热线电话业务系统数据,需将数据集进行处理,通过将缺失值、重复值、异常值等进行数据清理,调整成符合分析需求的数据,同时需通过使用数据筛选、数据转换、文本预处理等方式对数据进行加工,提升数据分析的效率和分析结果的有效性。因业务部门所需及关注重点主要为工单类型、问题分类、地址信息、办理情况等维度信息,以及各类痛点难点堵点事项及重点事项,所开展治理分析需结合上述标准及业务进行。服务期内输出不少于8份研究报告,含3份热点专题分析报告、4份季度及1份年度阶段性分析报告。每份专题报告需选取5个维度、1个部门进行分析,且输出不少于5个图表;每份阶段性报告(年报、季报)需选取8个维度、8个部门进行分析,且输出不少于8个图表;通过数据分析报告为源头化解城市治理难题提供数据信息支撑,找出履职中的不足和堵点,反映治理中的各类问题和需求,为解决普遍诉求、改善部门履职效果、提高决策科学性等提供强有力支撑。数据治理的对象和范围数据治理服务对象(信息系统)及数据规模表序号对应信息系统数据规模说明1热线电话业务系统40万数据内容包括:城管、工单编号、市民姓名、来电号码、联系电话、市民身份、证件类型、证件号码、当事人姓名、当事人证件类型、当事人证件号码、诉求标题、涉事主体、主体地址、事发地点、事项分类一级、事项分类二级、事项分类三级、对象分类一级、对象分类二级、所属部门、所在区域、影响情况、业务点选、标签组、关键字、市民诉求、补充信息、是否无效、是否保密、是否突发类工单、突发类型、是否领导接电、转派回复方式、受理人、受理人工号、监察状态、剩余天数、退单次数、工单类型、受理时间、处理时间、工单状态、来源渠道、派单员、话务员满意度、办案满意度、承办时间、办理期限、提交办结时间、工单处理人、当前处理部门、办理部门一级、办理部门二级、办理部门三级、最后退回时间、办理时间、具体经办单位、具体经办人、咨询要点、核查情况、实际情况、回复时间、回复方式、回复内容、回复备注、处理情况、办理结果、是否立案、立案决定书编号、法律依据、理由、是否无法联系诉求人、联系时间、分类管理、诉求人是否撤诉、回访时间、回访意见、归档原因、回访结果、市民原始诉求、退单原因、提交方式等。数据治理工作方法或步骤:1.数据采集2.确认需求拟定分析主题及主要内容,拟定的主题需经过多方审核,保证主题具有一定的专业性和针对性,并能通过系列的分析形成规范。3.数据提供由本项目建成系统采集数据。4.确认数据适用性检查确认提供数据是否符合分析需求、是否完整、是否出现差错等情况,主要从以下方面进行确认:(1)时间周期是否符合需求;(2)数据数量是否有所缺失;(3)数据字段是否完整且符合分析需求,如提供数据未有事项分类该字段;(4)数据内容是否有明显缺失项,如承办时间字段里内容多数为空白,则该项存在问题。5.数据处理6.数据深度清洗初始数据在进行分析之前需要经过一定的处理,对原始数据进行清理、校正、格式化和整理,调整成符合分析需求的数据,提高数据质量,以便更准确地提取有用的信息。主要进行以下处理:(1)缺失值处理对缺失值进行填充或忽略不处理,如需填充可使用简单替换法、插值、平均值、中位数、众数等方法进行处理,根据实际情况选择所需方法。(2)重复值处理对影响分析结果的重复值进行删除处理。需去除数据集中的重复记录,可以通过比较记录中的唯一标识符或关键字段来实现,根据实际情况选择所需方法。(3)异常值处理在数据集中存在的不合理的值,若将对结果造成偏差需进行处理。可以通过删除或替换为可接受的值,异常值可通过绘制箱型图、直方图等来检测,根据实际情况选择所需方法。(4)不一致数据处理对工单登记时在没有进行逻辑判断的前提下直接记录的错误信息,比如日期格式不正确,日期越界等不一致数据,需进行删除、转换。7.数据加工对数据进行加工,提升数据分析的效率和分析结果的有效性。主要进行以下处理:(1)数据筛选在样本中通过条件抽取、过滤、筛选等手段将有问题或不需要的数据剔除或转换,保留符合条件的数据,可以使用条件筛选、关联规则、分类分析等方法,因热线数据量相对不大且筛选条件可明确,建议使用条件筛选进行处理。(2)数据转换通过类型转换、字段拆分、字段合并、日期转换、算术运算、去重、标识等提高数据质量,根据实际情况选择所需方法。(3)文本预处理对文本中将影响最终分析效果的信息进行清洗,如去除数字、链接地址、停用词、标点符号、空白符、特殊字符以及删除一些无意义文本的数据。8.数据处理数据项清单将数据清洗、加工后的数据进行数据项清单输出,输出以下三类数据项清单:(1)每个分析维度对应成果数据表;(2)每个分析部门对应成果数据表;(3)每个分析图表对应成果数据表。输出数据项清单需达到以下标准:(1)数据内容要求同“表三-3数据治理服务对象(信息系统)及数据规模表”说明中数据内容一致;(2)各数据表数量需同报告内容提及数量一致;(3)各数据表需按内容区分输出。9.数据分析报告因部门业务所需及关注重点主要为工单类型、问题分类、地址信息、办理情况等维度信息,需通过对海量工单信息的捕捉、甄别、分类、筛选、处理,统计所需分析问题的环比、同比增幅等数据情况,结合所需分析维度及内容,对时空分布进行可视化呈现,形成对相关问题系统化、深层性、关联性的分析并编制分析报告,输出8份研究报告,含3份热点专题分析报告、4份季度及1份年度阶段性分析报告。各项数据分析维度、部门及图表需进行关联分析,一是分析部门相关情况,需从工单类型、问题分类、集中诉求等维度进行分析,且需对应输出相关图表;二是分析维度需进行结合,如进行问题分类分析时,可结合地址数据、工单类型、办理情况等维度进行综合分析。10.报告编制流程制定报告编制流程,规范数据报告的编制与审核发布。数据分析报告原则(1)规范性分析报告中所使用的性名词术语一定要规范,标准统一,前后一致,要与业内公认的术语一致。(2)重要性分析报告一定要体现数据分析的重点,在各项数据分析中,应该重点选取关键指标,科学专业进行分析。此外,针对同一类问题,其分析结果也应当按照问题重要性的高低来分级阐述。(3)严谨性分析报告的编制过程一定要严谨,基础数据必须真实、完整,分析过程必须科学、合理,分析结果要可靠,内容要实事求是。(4)时效性分析报告必须具有时效性,与时俱进,应当在分析时间范围结束后,迅速做出报告撰写安排,采编最新数据,收集各项相关资料和说明依据,并根据现实情况不断更新补充信息。(5)创新性分析报告应当具有创新性,分析内容和结构应当适当引入行业进步成果以及科学技术发展下的分析工具和方法手段,使报告具有独特的价值和发现。11.数据分析维度因部门业务所需及关注重点主要为工单类型、问题分类、地址信息、办理情况等维度信息,数据分析应选取适用的方法进行分析应用统计,可采用以下维度及对应规则进行分析,或使用其他合适方法。工单类型分析通过各类指标,以工单类型维度自由组合统计分析。工单类型包括咨询、投诉、举报、求助、建议和表扬6大类,针对每个工单类型的不同,结合历史数据,针对不同的时间周期进行分析展示。分析规则可参考使用以下示例进行分析。问题分类分析对于市民反馈的问题类别进行分析,问题分类的维度可结合事项分类,结合业务部门关注点,划分为城市管理、消费维权、劳动保障等,展示各类业务领域主要诉求内容、周期变化趋势、分布区域、主要涉及单位等信息。地址数据分析通过对标准化、结构化的地址对应事项进行分析,结合部门关注所需,定位市民关注度高、反复出现频率高的黑点难点问题以及所属区域。分析规则可参考使用以下两种方法:地址定位地址定性(4)集中诉求分析集中性诉求不同于单人诉求,因处置过程要更加严谨,需多方考量、精准分析造成诉求集中的原因,故需分析各主要集中诉求的事项、数量、时间分布以及区域分布等,以定位市民关注高、短频高发的重点难点问题,聚焦事项类别及所属区域。分析规则为:主体:可以是同一市民也可以是不同市民反映同一事项;事项:具备同一被诉主体、同一涉事地址或同一诉求事由等特征;诉求:应为同一诉求,但围绕同一诉求事由提出的相似诉求内容或不同解决措施均纳入同一诉求范围。(5)重复诉求分析主要针对同一市民多次反映同一事项,结合部门业务重点,分析研判重复投诉的分布特点、产生原因、反映问题、化解难点等,定位疑难问题,辅助解决堵点问题,为辅助提出完善政策、解决问题的建议提供数据支撑。重复投诉通常产生原因为以下:诉求有一定合理性没有解决到位、初次投诉办理答复不规范、群众对答复意见不满意、长期大量重复投诉等。(6)办理情况分析①结合部门关注要点,针对工单的办理时长、承办部门、满意度等情况进行分析,挖掘城市治理中的堵点难点问题。主要分析内容可参考以下维度:②承办部门:指工单实际的经办单位。可从承办部门的流转情况和数量反映工单承办难易程度、事项归属权、主要承办事项类型等情况。③办理时长:指承办部门自确认承办至办结所用时间。可从办理时长反映承办部门及不同事项的处理效能等情况。④满意度:指工单办结后,市民对办理情况的评价,包含“非常满意、满意、不满意、非常不满意、基本满意、未评价”,可从满意度反映办理结果能否为民众排忧解难,充分分析挖掘满意度数据有利于及时归纳发现堵点难点,分析研判企业群众的诉求和期盼,找准服务企业群众的切入点和着力点。12.数据图表展示数据分析报告需借助合适的图形方式展示热点受理发展趋势、规律和变化的方法,常用图表为以下:比较、分布、占比、区间、趋势、时间。(1)比较显示值与值之间的不同和相似之处。使用图形的长度、宽度、位置、面积、角度和颜色来比较数值的大小,通常用于展示不同分类间的数值对比,不同时间点的数据对比。(2)分布显示频率,数据分散在一个区间或分组。使用图形的位置、大小、颜色的渐变程度来表现数据的分布,通常用于展示连续数据上数值的分布情况。(3)占比显示同一维度上占比关系;(4)区间显示同一维度上值的上限和下限之间的差异。使用图形的大少和位置表示数值的上限和下限,通常用于表示数据在某一个分类(时间点)上的最大值和最少值。(5)趋势分析数据的变化趋势。使用图形的位置表现出数据在连续区域上的分布,通常展示数据在连续区域上的大小变化的规律。(6)时间显示以时间为特定维度的数据。使用图形的位置表现出数据在时间上的分布,通常用于各类型中作为一个维度表现数据在时间维度上的趋势和变化。13.交付成果及确认(验证)方法数据治理服务交付成果如下表所示。序号数据治理主要交付成果备注服务内容形式数量1数据分析应用(专题报告)输出专题分析报告3每份专题报告需选取5个维度、1个部门进行分析,且输出不少于5个图表。2输出每个分析维度对应成果数据表15每份专题报告从不少于5个维度展开分析,成果数=所需报告份数*5个维度,各数据表数量需同报告内容提及数量一致。3输出每个分析部门对应成果数据表3每份专题报告展开分析1个主要特定主题部门,模块份数=所需报告份数*1个部门,各数据表数量需同报告内容提及数量一致。4输出每个分析图表对应成果数据表15每份专题报告展开不少于5个图表,模块份数=所需报告份数*5个图表,各数据表数量需同报告内容提及数量一致。5数据分析应用(阶段性报告)输出季度分析报告4每份季报需选取8个维度、8个部门进行分析,且输出不少于8个图表。6输出年度分析专刊1每份年报需选取8个维度、8个部门进行分析,且输出不少于8个图表。7输出每个分析维度对应成果数据表40每份阶段性报告(年报、季报)需选取8个维度、8个部门进行分析,且输出不少于8个图表,模块份数=1份报告*8个维度,各数据表数量需同报告内容提及数量一致。8输出每个分析部门对应成果数据表409输出每个分析图表对应成果数据表40数据治理服务交付成果通过用户单位验收,符合业务要求视为成果通过确认(验证)。14.云资源租赁服务期为16个月。配置两台32G内存、16核服务器,其中,1台用于运行智能分流模型;1台用于运行工单数据比对和验证码识别。配置三台16G内存、8核服务器,其中,1台用于运行web系统(部署web系统、人大金仓数据库、中间件东方通Tongweb7.0),1台用于运行数据处理与分析,1台用于运行机器人和流程自动化。配置两台16GB内存、4核服务器,两项500GBFC-SAN。其中,1台服务器用于日志审计,1台服务器用于数据库审计,1项500GBFC-SAN用于日志审计,1项500GBFC-SAN用于数据库审计。并按等级保护三级要求选用云资源平台应用层防火墙、web防篡改服务、主机漏洞检测服务、主机防病毒服务、数据库审计、日志审计、同城异地备份等服务。云资源租赁清单如下表所示。序号服务名称服务参数单位服务数量服务期限(月)备注1定制化虚拟机服务1vCPU≥2.0GHz/单位元/vCPU/月32162台,16核、主频≥2.0GHzvCPU、32GB内存定制化虚拟机服务1G内存/单位元/1G/月64162定制化虚拟机服务1vCPU≥2.0GHz/单位元/vCPU/月24163台,8核、主频≥2.0GHzvCPU、16GB内存定制化虚拟机服务1G内存/单位元/1G/月48163定制化虚拟机服务1vCPU≥2.0GHz/单位元/vCPU/月8162台,4核、主频≥2.0GHzvCPU、16GB内存定制化虚拟机服务1G内存/单位元/1G/月32164存储IP-SAN(裸容量100GB)元/100GB/月1816用于应用系统数据存储5存储FC-SAN(裸容量100GB)元/100GB/月1016用于数据库审计6操作系统操作系统许可元/许可5-一次性费用7商业版关系型数据库关系型数据库许可元/许可1-一次性费用8商业版中间件(应用中间件或消息中间件)中间件许可元/许可1-一次性费用9应用层防火墙支持识别恶意请求含:跨站脚本(XSS)、注入式攻击(包括SQL注入、命令注入、Cookie注入等)、跨站请求伪造等应用攻击行为;支持识别服务端响应内容导致的缺陷:敏感信息泄露、已有的网页后门、错误配置、目录浏览等缺陷;支持基于访问行为特征进行分析,能识别盗链、爬虫攻击的能力;支持识别网站中的网页木马程序,通过策略可防止木马网页被用户访问;支持Cookie防篡改、防劫持。元/域名/月或元/web主机/月11610web防篡改服务篡改检测功能:通过在网页被访问时进行完整性检查杜绝网站向外发送被篡改的页面内容、支持外挂轮询、核心内嵌及文件驱动过滤三种篡改检测技术支持对指定网页文件的恢复;支持断线续传和失败重传,并支持从失败任务的日志文件导入任务、支持自动恢复机制;篡改检测时间:访问时实时检测。元/web主机/月11611主机防病毒服务支持智能识别蠕虫或者木马软件。采用智能型扫描机制,能够以文件真正格式作扫描。支持提供病毒隔离系统,将染毒文件安全隔离并备份。支持压缩文件查毒、清毒,压缩层次不少于50层,支持的压缩格式不少于15种。支持的加壳种类不少于80种。防(杀)病毒软件能够自动隔离感染而暂时无法修复的文件。邮件病毒检测及清除能力:采用宏指纹识别技术更有效的查杀OFFICE宏病毒。支持共享文件的病毒查杀。具有未知病毒检测、清除能力。元/月/客户端5165个客户端12数据库审计基于数据库通讯协议准确分析和SQL完全解析技术的数据库安全审计系统。面向数据库运维和安全管理人员,实现了对数据库操作、访问用户,及外部应用用户的审计。全面、准确、高效的数据库监控告警和审计追踪能力,专业、主动、实时地监控数据库通讯信息包。智能化的协议识别、可视化的操作和监控界面、可交互可下钻的风险追踪能力。元/3个数据库实例/月11613日志审计支持国产主流操作系统、支持网络设备(交换机、路由器、UTM等)、安全设备(防火墙、VPN、IPS、IDS、防毒墙、安全网关等)、中间件、应用系统(Web服务器、邮件服务器、OA、CRM等)日志集中管理与审计分析。元/20个日志源/月11614同城异地备份备份一体机元/1TB/月11615.项目实施周期6.1工期确保项目按时、按预算完成,合理规划项目目标、范围、时间表、资源分配和风险管理,明确里程碑和交付物,确保团队成员对项目目标和进度有清晰的认识,进行科学的项目监督、进度跟踪、变更控制和及时沟通协调。本项目计划周期为23个月。2023年市民诉求数据分析系统建设项目工作分为:合同签定、建设实施、云资源租赁、系统上线验收。具体如下:项目完成合同签定时间为T。项目建设实施工作从T开始,T+7个月完成。包括项目开工、系统开发、系统测试、安全评估等。云资源租赁期计划从T+8个月开始至T+23个月结束(租期16个月);系统上线试运行及验收工作从T+8个月开始,T+11个月完成。包括完成所有系统上线试运行、完成验收测评、完成合同验收、项目终验等项目验收事项。如因供应商原因导致试运行延期、验收延期等项目延期,由承建方承担云资源的延期费用,直至16个月租期结束。3.4.9项目建设期的管理需求.组织机构为使工程按质、按量、按时及有序实施,服务单位对本项目必须建立一个完善和稳定的管理组织机构。管理组织机构由采购人和服务单位双方项目负责人为主,对项目建设进度进行整体把控,对项目建设质量进行监督。.服务单位人员要求(1)本项目项目经理项目经理负责项目总体实施方案策划、项目实施组织、项目实施进度和质量控制、项目实施计划和执行情况的汇报和交流,对整个项目保质、如期交付负责。项目经理具有数据库系统工程师证书、软件设计师证书且具有与计算类专业相关的研究生学历优先。(2)本项目技术负责人提供整个项目的技术支持,包括方案论证、疑难处理、专业测试等工作,具有信息系统项目管理师证书。系统规划与管理师证书、与计算类专业相关的研究生学历优先。(3)本项目团队人员负责用户支持、用户端问题协调、用户业务需求上报等,具有系统分析师证书、网络工程师证书、软件设计师证书优先。.管理需求本项目涉及大量数据分析和软件开发工作,为确保项目质量和效率,服务单位需具备成熟的软件开发或数据分析项目管理经验,并拥有完善的质量管理体系、职业健康安全管理体系和环境管理体系。确保系统的开发、实施和运维过程规范、高效、可控;保障项目实施人员的职业健康安全;确保项目实施过程中满足系统对环境的要求。本项目需要进行复杂的算法模型构建和数据分析工作,服务单位需具备符合行业标准的质量控制体系。本项目维保服务需要服务单位提供长期的技术支持,服务单位需具备专业的技术团队和完善的服务体系。.调整原则本项目的项目经理必须具体负责项目的实施,在系统建设期内,供应商承诺的项目经理和开发实施的主要人员未经用户同意不得调整;供应商如中途更换项目经理和主要开发技术人员,必须征得用户同意。验收要求项目验收应符合投资信息化项目管理办法进行验收的要求,同时应符合下列要求:1.满足合同和招标文件中列举的全部要求。2.实现合同和招标文件中列举的全部功能和非功能要求。3.达到合同和招标文件中列举的全部指标。4.系统建设应严格按照国家软件工程规范进行,服务单位必须根据建设进度及时提供有关技术文档,包括但不限于以下文档:需求阶段:《需求规格说明书》。设计阶段:《概要设计说明书》、《详细设计说明书》、《数据库设计说明书》。测试阶段:《测试报告》(含功能测试和性能测试)。试运行阶段:《上线试运行报告》、《用户操作手册》、《系统安装维护手册》。项目文档以采购人和项目监理(视情况看是否需求)审核确认的文档清单为准。验收项目包括按照合同和招标文件中所标明的项目功能,及相关的技术维护文档、培训教材、使用说明书等。项目验收以采购人和服务单位双方签字认可的本项目《项目需求说明书》为验收依据。《项目需求说明书》的内容自动包括但不限于招标文件所要求的所有系统功能需求,如有减少或降低,须有专门说明,并经采购人和服务单位双方书面确认才能生效。本项目需按照信息系统等级保护测评三级的标准建设,服务单位需要按质量,按时间完成建设。系统测试:通过系统测试,验证软件功能是否符合需求和预期,测试计划应详细列出测试用例、测试环境和预期结果,确保没有缺陷或问题影响用户体验。质量保证:确保软件产品达到预定质量标准,包括代码审查、持续集成、性能监控等,质量保证团队应定期评估开发过程和产品,确保遵循最佳实践,并在问题发生前进行预防。开发过程管理及电子文档管理:确保开发活动有序进行,包括需求管理、设计、编码、构建和部署。电子文档管理包括需求文档、设计文档、用户手册和操作手册等,确保所有文档及时更

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论