ICT产业数据库功能需求_第1页
ICT产业数据库功能需求_第2页
ICT产业数据库功能需求_第3页
ICT产业数据库功能需求_第4页
ICT产业数据库功能需求_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICT产业数据库功能需求数据研究中心2016年5月

基本情况目标项目目标是围绕我院建设“国家高端专业智库,行业创新发展平台”目标,建设ICT行业权威的数据库和数据分析研究平台:建立ICT产业数据库,全面支撑科研:建立全球ICT产业权威数据库,实现数据共享,统一数据口径,全面支撑电信、互联网、信息化、两化融合领域的研究。挖掘自有数据,实现价值提升:对院各业务信息系统、软科学和咨询成果库等各种平台产生的自有数据资源进行整合,实现院知识资产的统一、协同管理利用,深入挖掘其价值所在,实现价值最大化。提供探索平台,开放数据分析:提供开放性的大数据分析探索平台,为全院业务部门提供数据存储、建模、分析等功能和工具。建立权威的第三方平台,提供数据信息,支撑政府相关决策,汇聚政府监管数据并进一步挖掘分析,助力日常监管工作。汇聚企业和政府公开数据,为行业创新提供支撑。预期平台建设完成之后将具有如下特点:1. 动态:数据动态更新,功能快速迭代;2. 开放:开放存储,开放工具,开放能力。数据资源的统建、协同、共享;3. 敏捷:贯彻敏捷BI的理念,实时响应用户查询和分析需求;4. 智能:数据采集、交换功能的自动化和智能化,数据呈现的关联化;5. 全景:利用先进的可视化技术,呈现全院核心数据资源的全景视图,兼顾需保密资源需求。项目规划系统计划采用大数据架构,Hadoop、Spark等大数据架构具有可使整个数据库能耗降低、硬件利用率提升、系统性能提升等方面特点。保证数据库能够满足高并发、快速响应等方面的需求,并且在指标管理上,做到易用性强、包容性好等。避免传统数据库采用结构化数据存储方式,以小型机为主,且价格高、性能拓展性差,对高并发、大吞吐等需求难满足的情况。提供一站式大数据支撑平台,覆盖数据集成、数据管理和数据使用等功能。数据集成可以快速的从各种异构数据源采集数据,并能够快速从传统数据仓库迁移。提供批量离线数据、实时流数据、网页数据的统一采集能力,快速集成企业各种数据源。可实现交换的数据源包括Oracle\DB2\Mysql\SqlServer\HDFS\Vertica等,并可扩展数据源。可视化的数据集成流程设计界面。通过工具配置即可实现网页数据的采集、自动分类。开放性设计,支持多种存储计算架构。内置多种常见数据处理作业模板,用户只需根据模板定义相关作业信息即可实现快速的数据处理。向导式数据处理作业配置。灵活的时间调度规则。支持调度Hadoop、Spark、关系型SQL等多种任务类型。完善详尽的数据处理监控分析能力。数据管理通过分布式计算数据能够得到快速的运算和汇总。解决数据采集、数据存储、数据处理和数据管理问题,包括数据采集ETL组件,作业调度组件、元数据管理组件、数据质量组件以及运维监控组件,能够无缝整合Hadoop、Spark、MPP、RDB等多种存储和计算架构,让用户通过可视化配置的方式快速构建底层大数据处理平台。提供运维监控、元数据、数据质量管理等工具,实现对Hadoop、Spark、应用等统一管理和运维。数据使用能够提供多种分析工具,提升用户自助分析能力及数据使用效率,并提供数据可视化定制开发框架,提升定制数据应用的开发效率。提供仪表盘、报表、数据地图、自助分析等多种分析工具。异构数据源的接入能力及多数据源的管理能力,保障对复杂数据应用环境下混合型数据仓库的支持。提供分析模型的可视化设计。在PC端配置出来的数据表、数据图表、分析报表等,可以在移动终端方便的查看。由于平台建设工程量大,初步计划安排三期建成一个完善的系统。本着重要的功能优先上线的原则,具体安排如下:一期:搭建基础数据平台环境,建成敏捷BI平台、数据指标体系和维护好基础数据资源。二期:进一步整合数据资源,拓展云计算云存储技术在整个系统中的应用,形成统一数据资源池,增强数据探索平台功能。三期:根据工程技术的新进展、实践中发现的新问题,进行系统升级优化,重点提升大数据分析能力。数据资源规划数据资源总体框架数据资源总体框架设计包括数据源、数据存储、数据应用、展示分析四个层面,如下图。其中,数据源主要考虑院内科研需求,数据存储实现多种数据形式的存储,数据应用面向不同用户实现数据聚类,展示分析部分实现数据的可视化分析与展现。数据资源既包括结构化数据,也包括非结构化数据。数据源规划需求分析2015年研究院开始布局电信业、互联网、信息化、两化融合四大领域,提出“456”新布局,要求数据资源更好覆盖ICT产业。例如,电信业要关注运营业/制造业、信息经济/数字经济、宽带/无线、服务/监管/基础设施等,互联网要关注产业/应用/技术、大数据/云计算、物联网、治理/监管等,信息化要关注互联网+、智慧城市、电子政务、行业信息化等,两化融合要关注工业互联网、智能制造、软件/集成电路、车联网等。见下图。内部数据经过长年科研工作开展,研究院内部积累了较多的数据资源,如下表,其中电信业、互联网领域数据资源相对多一些。所有内部数据资源均将纳入ICT产业数据库。领域数据资源电信业国内电信业运行统计数据固定宽带接入、网间测速数据增值电信企业许可证和年检数据电信设备进网管理数据码号资源和号码携带数据通信建设工程招投标数据电信用户申诉和服务质量数据频谱数据库电信企业网络和信息安全数据电信资费数据移动网络质量数据检测认证数据上市运营商数据垃圾短信平台数据国际海陆缆数据互联网互联网企业财务和市值数据移动互联网应用数据域名和IP地址数据IDC运行安全评测数据互联网舆情数据大数据产业数据信息化双创平台数据信息经济数据两化融合国内生产力布局平台数据工业经济数据国内软件和信息服务业数据综合软科学成果库全球ICT监测库标准研究国际/国内会议公开数据依托于系统平台,对互联网上ICT相关资源实现自动化抓取入库。其中主要难点是不同网站信息列表的模板配置以及数据格式的读取。从具体内容来看,涉及政府、企业、国际组织、行业协会、智库等,如下表。来源分类范围数据内容政府以国内地方政府、发达国家政府、金砖国家政府为重点,尽量全面覆盖。监管机构数据发布网站,主要来自行业企业上报统计机构数据发布网站,主要来自各部门汇总和调查统计政府研究报告数据政府数据开放门户,涉及各行业数据企业包括领先电信企业、互联网企业、通信设备制造企业企业财报数据企业研究报告数据企业证券市场数据国际组织包括联合国统计局、ITU、WTO、WB、IMF、3GPP、IEEE、IETF等ICT行业统计数据、预测数据宏观经济统计数据、预测数据行业协会包括工业互联网联盟等各领域行业协会行业调查数据、行业研究数据智库包括布鲁金斯、哈佛商学院、兰德公司、麦肯锡、埃森哲等综合智库,以及Gartner、GSMA、TeleGeography、Ovum、IDC等ICT领域智库调查统计数据预测数据外购数据目前研究院外购数据已初步完成全球电信业指标布局,涉及行业总体、移动、宽带、国际业务、设备制造等主要领域。未来,将进一步根据科研需求,合理考虑通过外购方式完善互联网、信息化、两化融合领域的数据指标布局。数据应用数据体系ICT产业数据库采用多维数据管理的方式,分维度进行管理与编码体系,每一数据编码唯一,可实现指标间横纵向长跨度对标。在应用上主要基于主题库形式,建立指标体系(见下图),面向不同的用户提供有针对性的数据应用,例如面向政府可提供经济运行、宽带速率、信息化指数等数据,面向企业可提供产业热点、行业发展、IDC布局等数据,面向院内研究人员可提供涉及四大领域的“基础科研数据库”或“信通科研常用指标库”。五个基础主题库指标框架如下:多库结构系统包括原始库、管理库和发布库三层库结构。其中原始库用于存储原始数据,管理库是将数据按领域进行分类管理,发布库是根据使用目标和对象选取指定数据进行分库管理和使用。系统功能需求建设原则项目规划要统一设计、统一标准、统一规范,项目建设要统一规划、分层建设、逐步完善。因此系统在功能设计过程中除考虑满足当前项目建设要求外,还应当满足后续系统平滑扩展升级要求,方案设计需符合以下建设原则。标准性借鉴业界领先的主流数据仓库实施案例,规划支持未来几年业务发展的数据应用基础架构。采用分层、分布式、数据与应用解耦的开放共享技术架构。建设涵盖完整ICT数据生命周期的应用解决方案。实现标准统一、扩展灵活、功能完善、应用便捷的数据产品。开放性引入业界开放的、成熟的标准,从而保证系统成为符合标准又不失灵活性的开放平台,为未来的系统的灵活开放奠定基础。需要支持业界开放的标准接口,同时完全兼容开源的标准。先进性基于统一的整体架构,采用先进的、成熟的、可靠的技术与软硬件平台,保证基础数据平台系统易扩展、易升级、易操作、易维护等特性。可扩展性整体数据架构、基础数据平台、基础数据模型、应用分析模型、前端应用能够支撑业务需求的扩展;支持在不影响系统整体架构、系统性能、现有数据加载任务的情况下,实现服务器、存储、I/O、应用功能等可扩展性。可靠性制定并实施基础数据平台高可用性方案、运行管理监控制度、运行维护制度、故障处理预案等,保证本期系统在多用户、多节点等复杂环境下的可靠性。高效性高效性包含两方面内容,一方面系统需要在规定时间内完成数据写入操作,并将数据写入对数据分析的影响降到最低;另一方面系统需要实现规划要求的数据查询和统计分析速度。正确性数据质量贯穿基础数据平台系统建设的每个环节,基础数据平台系统通过合理的数据质量管理解决方案保证数据质量。安全性按国家标准、行业标准、安全规范等实现数据安全管理。可维护性系统要有统一的管理平台,管理基础数据平台系统的各个环节,能对系统进行相应的性能管理和日志监控。易用性有良好的人机接口和灵活多样的展现方式,需要对最终用户提供适当的培训就可以方便地使用新的分析工具,从而减少IT人员的工作量,同时加强了集群监管的时效性。主要功能要求指标体系指标管理指标是指数据是什么的描述,可从名称、定义、版本等方面进行管理。名称:可设置指标名称,同时支持中、英文名称。定义:可对指标的定义进行描述,说明指标的详细含义,支持中、英文。版本:能够对指标进行版本管理,即一个指标随时间推移可能会产生名称或定义的变化。异名同义:允许同一指标具有不同名称,但定义相同,即视两个或多个不同名称的指标为同一指标。衍生指标:支持将两个或多个指标进行简单四则运算,衍生计算得出新的指标。维度管理可对指标的多种维度进行管理,包括主体、地区、时间等维度。主体:可管理运营商或公司的品牌、地区、总/子/母公司等信息,并可按时间序列管理,解决运营商变更等问题。一个数据可能存在两个主体,并存在方向性,例如中国移动向中国联通的通话数据。地区:可管理大洲、区域、国家、省市县等地区信息,兼容多种区域划分规则,包括东中西、OECD等灵活区域划分。一个数据可能存在两个地区,并存在方向性,例如亚洲至欧洲的光缆数据。时间:可对时间进行管理,包括年、季、月、旬、日等。时间类型:可对时间类型进行管理,即对数据的具体统计方法进行说明,如当期值、期末值、累计值、增长率等。技术:可对技术进行管理,包括技术的代别、技术类型、版本和频率等信息。网络状态:可对网络状态进行管理,包括仍在运营和已经关闭等。用户属性:可对用户属性进行管理,包括批发和零售等。数据来源:可对数据来源进行管理,包括来源名称、释义等。货币:支持人民币、美元、欧元、英镑等多种货币,可按时间设置汇率,并可根据预设汇率进行换算。单位:可对数据的度量单位进行管理,并对单位之间的换算关系进行管理,在数据展示时可方便换算。除以上维度外,也可增加和管理新的指标维度。体系管理可对指标进行体系化管理,指标体系详见“3.3数据应用”。可对指标体系进行分级分类管理,并可方便调整。数据指标可以按分类进行归属,分类可以维护管理和添加。可以通过分类查询各类数据指标。可以筛选指标,筛选条件主要包括各类维度。指标本身有层级关系,可以构建层级关系指标。可灵活调整指标和分类上下级关系。分类级别层数不设限制。同一指标可同时属于多个指标分类。各类数据在上传和导入时,可以选择多个指标域(通过勾选的方式),支持对一份数据的多处或多指标域的检索。支持对指标、数据源以及各种维度的条件筛选设置映射关系,进行映射时支持一对多和多对一的灵活映射。数据导入支持海量、多源、异构数据的采集、导入和录入,方式包括文件导入、爬虫抓取、对接导入、手工录入和预测录入等,并可对数据导入进行模板定制、数据校验、审核入库等全过程管理。文件导入文件导入是指对xls、csv、txt、doc和PDF等文件类数据的导入,具体要求如下:要求尽量不对原始数据和文件进行修改和调整,减少导入用户的工作量,避免产生错误。导入模板定制需方便、灵活,尽量采用拖拽方式定制模板,不能有任何程序语言的代码开发。支持对csv、xml、xls、xlsx、doc、docx、txt、PDF等多种格式。对Excel文件的导入,需要支持2003、2010等各种版本,并支持目录、文件名、表名(sheet)、单元格的识别,例如可从文件名、表名或单元格中提取时间、地区、主体等信息。支持导入单个文件,同时支持批量导入多个文件。批量导入时可选择同一目录下的指定多个文件,也可选择目录,导入该目录下的所有文件和各子目录下的文件。在批量导入过程中,如遇到个别文件存在格式错误或者文件损坏等情况,支持“跳过”功能,将所有能导入的文件一次性导入。提供未成功导入文件的列表和详细报错信息(包含文件位置和错误描述)。支持手工选择导入文件,同时支持将文件上传至指定位置,由系统定期扫描自动导入。数据导入后系统提供界面实现简单的数据清洗、数据模型重定义、创建衍生数据集等功能。导入数据需要进行同义指标和新增指标处理,要求在导入时,新数据表导入时如果本模板历史导入数据的指标名称有所不同,需要在页面中给出历史指标(可能多个)的类似名称和各维度信息(选最新的2-3个指标数值),供评判参考。可以新增为新指标,也可以选择与某个历史指标同义,可以增加备注说明对指标名称变化或新增指标进行说明。查询时,如果有备注说明,需要可以查询结果中有明确标示显示。可以通过分析数据字典、元数据等,梳理数据之间的关系,并进行修正和补充,例如根据省市名称补充国家和国际区域等。支持数据的全量导入、增量导入、差异导入。导入后的数据表格,要求能够查询表格名称、时间、指标名称等,能够进行原表查询(即按照原表格式查看导入的数据表)。文件导入的主要功能包括:模板定制、数据导入、数据校验、数据预览、数据审核和结果确认等。模板定制:模板的定制需要以原始文件为基础,要求不需改动原始文件。即让模板适配原始文件,而不是调整原始文件适配模板。模板的定制过程要以拖拽等操作为主,不需要任何程序代码的编写。模板一方面配置了数据,另一方面也可配置各项数据的检验规则。支持模板的保存、下载和修改。对于导入模板,需要可以对导入历史进行查询、历史模板的重复应用和查看,能够方便的调用历史模板进行导入。数据导入:选择模板后,选择需要导入的文件,同时可设置该文件数据的一些统一属性,如主体、时间等。数据检验:文件选择后,需对导入的数据进行检验。根据检验规则对问题数据进行标识,并允许手工更改。更改的内容将被记录,并供日后查询或数据回滚。数据预览:支持对导入数据的预览,提供表格或图形方式。数据审核:支持数据审核,可根据预先选择的审核角色对数据进行审核。也支持不审核的选择。结果确认:显示导入数据的统计信息,例如数据的导入数量、未导入数量、错误数量等。爬虫抓取可根据用户提供的网站信息,使用网络爬虫抓取网页和文件,并可将网页上的数据进行识别入库。网页数据:可直接识别网页上的数据,定期爬取,并按规则入库。文件数据:可将网站上的文件爬取下载,并自动按配置的模板导入数据。登录检索:支持需要用户和密码登录的网站,并能够配置查询参数,导出、下载并导入数据。说明信息:支持对网页上数据说明信息的抓取,例如类似excel的标注,将鼠标移动至数据上会显示说明信息,可对说明信息或文件进行抓取。模板配置:提供交互式的网站爬取模板配置页面,支持通过配制管理页面,实现新网页的爬取模板创建及修改现有数据爬取模板。对接导入对接导入既包括与Oracle、MySQL等数据库直接对接导入,也包括通过API、WebService等接口对接导入。支持的数据库包括Oracle、DB2、SQLServer、MySQL、Postgre、Informix等数据库。支持定期从其它信息系统中主动抽取相关的数据,或被动从其它系统接收数据。支持对导入数据进行检验和筛选。手工录入手工录入是指在系统中以网页形式手工填报数据,支持对一些零散数据的灵活录入,以及一些在线问卷的填报等。方便性:可灵活方便设计网页录入模板,录入数据时支持Tab、Arrow、Enter和Esc等键盘操作。自动完成:手工录入的内容有时两次内容非常相似或相关。此时可以由用户选择自动复制上一月(或上一年)数据,然后再对复制的结果进行修改。此外,有些数据是有缺省值(或是常用值),对于这类数据,在填报时如果使用Tab键跳过单元格,系统应该可以为跳过的单元格自动填写缺省值。总之,应尽量减少用户的操作。必填提示:对于必填项要有“*”标识,并在适当位置提示有该标志的项为必填项。对于可以为空的项,用户可以不填报。选择项:对于可以穷举的数据,比如:高、中、低,或是优、良、中、差等,为了减少用户填写时的错误,尽量使用下拉列表让用户进行选择,而不是手工填写。对于日期型数据,可以使用日期控件的方式录入数据,避免不规范的日期数据产生。数据检验:支持对手工录入数据的检验,根据预先设定规则进行检验。对于可以方便地判断正确与否的数据,在填写中,或是填写完成提交时,自动给用户以提示。提示其纠正可能的错误,尽可能保证录入数据的准确性。录入权限:支持权限设置,哪些用户录入能够哪些数据,可灵活且严格的权限控制。预测录入预测录入是为了补全某些没有准确数值的数据。例如,时间序列某个时间点的数据存在遗失或遗漏的情形。预测数据:支持对单一数据对行预测,也可对一个或多个指标的进行批量预测。预测算法:可预先设置预测算法,包括插值、回归、平均+随机数、理论上的逻辑关系等。数据覆盖:预测数据的可信度较低,在以导入或手工录入等其它方式有同样数据时,可直接覆盖预测数据。数据审核可选择是否需要对录入的数据进行审核,并要灵活设置审核角色。可根据导入或录入方式设置审核过程。可根据数据内容设置是否需要审核。可灵活设置数据审核角色和审核流程。任务管理可对导入工作进行任务管理,并可对任务进展和完成情况进行统计分析。可增加、修订和删除导入任务。可编制任务计划,并根据计划对任务进行监控,在任务时间前提醒,在任务时间后报警。可按时间、分类等维度统计任务情况,包括各阶段任务数量、任务完成的数据导入成败数量等信息。多用户可同时进行导入操作。报表查询报表查询是指以二维表格形式展示数据结果的查询使用方式。搜索查询提供类似全文检索的关键词查询方式,对系统中数据体系结构不了解的用户,可通过输入关键词的方式,显示相关数据列表,方便查询所需数据。搜索的范围可选择是仅指标,也可对数据属性的全部内容进行搜索。在结果界面,为避免结果数量过多不方便使用,只显示同一指标的最新两个数据。在结果界面,可点击指标名称,下钻显示该指标下的所有数据。并可继续筛选维度选择部分数据生成新的数据表格。预定义报表预定义报表是指按照预先设置的主题,并预设数据维度条件,由用户对维度条件进行筛选,可快速获得需要查询的数据。报表按领域、业务、技术等类型进行主题数据查询。可查询数据受预先设置的主题限制。支持数据的上钻、下钻。自定义报表自定义报表是指用户可根据需求灵活设置查询条件,临时产生报表。该方式比预定义报告更加灵活,能够满足用户查询任意数据的需求。支持友好的向导方式自定义指标和维度等条件。通过拖拽等操作完成各项设置,不需要任何程序语言的代码编程。在条目太多时,可通过关键词搜索或分类查询等方式方便设置。例如选择指标时,可查询指标名称,也可按指标分类逐级查找。自定义报表可进行保存,供日后使用。也可共享给其它用户,或发布为预定义报表。可以按照指标名称、维度、时间等内容进行检索,生成检索结果表。表中数据可以选择后保存到一张临时表(可以建立临时表名称)中,供后面分析使用。重复检索指标,选择需要的指标加入的临时表中,最后生成一张汇总所需指标的临时表(可以删除和重复加入新搜索的指标),供分析使用。把系统的指标进行分组展示,能在系统中都展现出来,通过维度和指标动态组合的方式展现,进行搜索。已搜索指标,可建立关联,形成可视化搜索条件库,供下次调用。条件筛选在数据查询时涉及到多种维度条件的筛选,支持在某个维度条件选择后,可以自动对其它维度条件选项进行筛选和自动刷新,保证未选择的维度条件仅显示有数据的条件范围。这样可以最大程度的避免在选择了大量维度条件之后,最终出现的结果没有数据或数据量太少,加强用户的使用体验。报表展示分色显示查询结果可以不同颜色文字或底纹区分不同数据,例如原始数据、汇总数据、预测数据等。排序可基于查询出来的结果对数值、时间、区域等各种维度进行升序、降序和自定义排序。选择了排序方式,数据会根据所选排序方式自动排序。使用各种排序和TopN功能的组合可以简单直观的分析重点的局部数据。维度选择支持选择维度选择是否显示,可对单个或多个维度设置显示或关闭。衍生可根据查询结果数据计算产生衍生数据,例如汇总、占比、环比、同比等。图形转换报表查询的结果数据可方便转换为各种图形进行可视化展现。可视化展现可视化展现是指将数据转换成图形,并支持交互式处理的数据使用方式。模板设计和数据套用自定义可视化图形展示,支持易用的拖拽方式生成图表和筛选器的操作。可视化展示模板可保存和共享,方便使用。通过替换模板的数据的方式,简化操作,生成所需的数据图表。支持筛选器,实现交互式分析,筛选器样式包括单选框、多选框、下拉列表、文本输入框、滚动条、日历等。支持同比、环比、排名计算、累计总计、合计百分比等动态计算。支持灵活的报表自由布局,通过界面配置调整颜色、字体、字号等。支持JavaScript扩展。可以将系统或其他用户做好或共享的分析图表转换为图表模板供用户使用。图表模板可以查看本图表使用的数据内容及维度信息。提供示例图表,示例图表来源可能为系统自带、管理员上传、员工利用平台数据资源生成的图表。用户使用时,可以选择所需要的图表式样,打开图表、筛选选项、数据源等。用户可以同时查看图表示例,拖拽自己所需的数据至对应位置,设置相关信息,生成新的图表(类似参考示例图表,通过替换数据,生成所需图表)。图形样式基础图形支持柱图、堆积柱图、饼图、线图、环形图、面积图、雷达图、瀑布图、气泡图等基础图形展示。高级图形支持散点图、仪表盘、弦图、漏斗图、脑图、热力图等高级图形展示。地图支持地图、地球形式的数据展示,可与百度和谷歌等在线地图结合,也可与专业GIS系统结合。其它动画:支持图形的动画效果,支持时序数据动画。3D:支持图形的3D效果展示。主题风格:支持多种一键切换的主题风格。条件筛选在图形展现时,可进一步对数据筛选条件进行调整,在时间、主体、地域等众多条件中选择最需要的数据。钻取支持数据的向上和向下钻取展示。通过钻取功能了解与某些数据相关的数据或其它信息。数据钻取分为:单路径钻取,多路径钻取和浮动钻取等多种方式。单路径钻取:采用鼠标左键的操作方式。即在相应的数据上点击鼠标左键,然后弹出相关数据的窗口。多路径钻取:多路径是指数据钻取有多个分支。实现多路径钻取可以采用右键弹出菜单或是浮动菜单的方式。浮动钻取:在需要钻取的信息量不多时,使用浮动钻取功能非常方便。浮动钻取可以支持在鼠标停留的瞬间,自动将底层信息或是关联信息,以浮动窗口的方式自动展现给用户。联动钻取:在同一页面进行钻取,即占页面中的一部分数据,页面中的另一部分根据点击数据进行联动。多终端展示支持PC、大屏、手机等众多终端,并可根据终端屏幕分辨率进行友好适配,最优化展示数据内容。PC端展示在PC电脑端进行展示,是最常用的一种终端。大屏展示支持对大屏的展示,在大屏中展示更多更详细内容,可动态自动更新数据,以及数据选择联动展示。手机端展示手机端包括手机和平板电脑等移动端的展示,功能与PC上保持基本一致,包括更改数据过滤条件、自由切换维度和指标、钻取联动等功能。移动端模板自适应布局,无需任何操作。移动端支持内容分享,可通过邮件、微信、微博等方式进行分享。展示样例以下数据的展示需求仅为可视化展示的部分样例。全球电信业总体收入、增速,全球GDP增速对比组合图:柱状图显示“全球电信业总体收入”;折线图显示“增速”和“全球GDP增速”对比。或者多图联动,柱状图显示电信收入,折线图显示电信收入增速和GDP增速:(通过拖动栏,显示不同时间区域)时间序列默认“最近6年”数据,但需要提供列表供用户从页面选择时间区间。全球不同国家地区(电信业收入增长率/人均电信业支出/电信业收入占GDP比重)分布情况地图显示各地理区域数据;可以通过点选框选择所需展示指标。地理位置钻取至最小单位(可能是地区,如数据支持国家则需钻取至国家数据);时间序列默认“最新”数据,但需要提供列表供用户从页面选择时间区。我国基础电信业务收入结构组合图:百分比堆积柱状图显示“移动话音”、“固定话音”、“移动数据”、“固定数据”等子领域的收入占比。折线图显示非话业务占比增长率。时间序列默认“近6年”数据,但需要提供列表供用户从页面选择时间区间。我国电信投资结构复合饼图:主饼图显示当前各领域投资在电信总体投资中的占比。次饼图对投资占比最大的领域,进行进一步细分。时间序列默认“最新季度”数据,但需要提供列表供用户从页面选择时间区。全球各地区移动网络月均流量、增长率和平均网速气泡图从三个维度描述各地区移动网络月均流量、增长率和该地区移动网络平均网速情况。默认显示最新一期数据。全球PC/手机/超移动终端市场四个图表展示市场发展情况。其中,组合图显示全球“PC/手机/超移动终端”出货量和年增长率;饼图用于显示全球“PC/手机/超移动终端”出货量TOP10厂商市场份额情况;折线图显示TOP10厂商“PC/手机/超移动终端”出货量同比增速;地图显示各国家地区“PC/手机/超移动终端”出货量TOP10厂商各自的出货量和当年出货量的同比增速。默认展示最新一期数据,页面提供时间区间选择。我国终端手机出货量结构图表分别从“智能(3G、4G)/功能机”、“技术制式”、“国内/国外品牌”和“智能手机操作系统”等方面展示我国终端出货量情况。默认选择最新一期数据,提供下拉列表,可以选择其他时间周期。分析挖掘自定义算法支持预置各类常用的数据挖掘算法,包括分类预测、回归预测、聚类分析、关联分析等。支持用户直接选用预置算法对数据进行分析。各类数据挖掘算法要进行封装,使用户无需进行代码上的修改。提供友好方便的数据选择和参数调节功能,支持对参数的检验。支持参数调整后,即时展示分析结果,方便调整参数。支持一次选择多种数据挖掘方法对同一组数据进行分析,并一次给出各个方法的分析结果,以便节省逐个试用不同方法的对比时间。可方便、友好增加新的算法。预测支持灵活定制预测算法,设计算法时可动态了解参数变化后预测结果变化情况。预测算法可保存后供日后使用,也可共享给其它用户或在权限许可的情况下应用至系统数据预测。预警按照预先设定的算法,通过对设定数据的定期或手动扫描,自动发现异常趋势并预警。通过数字颜色的变化、标记的变化,以直观的方式标记了当前数据的特征。并根据预先设定的配置,以邮件或系统消息等方式,向用户推送相关信息的功能,包括信息、数据、预警结果等。综合指数综合指数是指从某一项具体的统计分析或者挖掘工作出发,构建针对具体问题的一系列指标,并按权重进行汇总计算得出。可方便、友好设置指标和权重。支持实时计算结果,并能够动态调整指标和权重,对模型进行优化。R语言嵌入支持嵌入R语言软件,实现高级统计分析和挖掘功能。提供通用的R语言数据挖掘和机器学习能力,可以直接通过RStudio或者R编程接口访问存放在平台中的数据。提供常用R语言算法的并行化版本,从而能够处理大数据集,包括但不限于:贝叶斯网络、向量支持机分类、逻辑回归、线性回归、K-means聚类分析、广义线性模型、决策树(随机森林决策树)、协同过滤等。集成多种数据可视化R软件包,便于实现多样化的数据可视化效果。提供R接口包,支持标准的SQL语言查询接口(JDBC和ODBC),支持Hadoop/Spark计算环境作业任务调度和输入输出交互。分析软件数据交换提供对SPSS、SAS等分析软件的数据交换能力,支持数据和模型的导入和导出。数据输出数据导出所有查询结果数据均可导出,导出文件以excel文件为主,图形数据也可导出为图片格式。生成报告通过预设的分析成果和报告模版,系统支持报告的自动化生成,能够自动生成核心框架、分析图表和部分结论,作为初步报告提升研究分析效率。报告可以是WORD、EXCEL、PPT或PDF等形式。报告模板设计支持拖拽方式,操作方式友好。报告生成快捷,选择必要的模板和时间等选项即可快速生成报告。支持在线编辑,也可将报告导出后完善。分享发布在系统内部,数据、图表、报告、模板等均可与其它用户分享,具有一定的社交功能。同时,系统中数据支持在其它系统发布和交换,可将需发布的数据、图表或报告方便按权限设置发布至网站或微信、微博等社交平台。保存:支持数据、图表、报告、模板等页面进行保存,分类保存后续可供继续进行编辑和查看。分享:保存后的所有数据、图表、报告、模板等可通过系统内部消息共享给其它用户,数据、图表、报告等最终结果还可以通过微信、微博等社交方式进行分享。发布:在权限允许的条件下,保存后的数据、图表、报告、模板等可在权限范围内进行发布,供其它用户查看和使用。发布范围既可是该系统内部,也可通过接口在其它系统发布,例如网站或微信、微博等。数据管理数据检验数据检验是保证数据的正确性、完整性、相关性等质量指标。检验目标包含两方面,一是对多源数据的数据质量有一个较全面的了解;二是防范衍生汇总数据加载过程发生的错误,提高整体数据质量。建设过程中,数据质量的检验需要从源数据开始,自始至终贯串全程。数据检验支持对录入数据和历史数据的检验。检验时点在数据导入过程中,必须对数据进行检验。在数据入库后,将根据计划进行定期校验,或根据临时需要进行手动检验。检验内容支持对所有数据进行检验,也支持按条件筛选部分数据进行检验。检验方法完整性检验:检验数据是否完整,是否存在空值或必有内容。属性检验:检验数据的属性,例如数字、文字等。数值检验:绝对值检验:根据数据数值的绝对值大小,设置门限值进行检验。相对值检验:根据数据数值变化的相对值即变化大小,对变化率设置门限值进行检验。时间检验:对时间格式进行检验。维度检验:对地区、主体、技术等维度进行检验,在出现新的数据时,需要将该新的数据增加至现有维度。检验规则配置支持检验规则、加载任务对应、检验机制(加载时、加载后)、触发机制、数据字段等内容进行检验,输出检验记录。数据修改数据可以进行修改,但数据的修改设有严格的权限。数据修改的过程会被记录,用于跟踪哪个用户在什么时候进行了哪些数据修改,必要的时候可以进行数据的回滚,即撤消修改。简单修改:通过选择数据种类和过滤条件,以列表的形式展现数据内容。选择所要修改的数据,对数据进行修改。批量修改:支持批量数据修改,主要目的是对已有数据进行微调,例如增加或减少统一数值或设定范围的随机值。数据删除数据删除支持严格的权限和流程控制,并设有详细的删除记录。单个数据删除:在查询结果中选择单个数据进行删除操作。级联删除:删除某一数据时,同时删除与其关联的数据。批量删除:批量删除是指一次删除多个数据。逻辑删除和物理删除:在所有数据库表中都设计有删除标志列,用于记录数据的逻辑删除标记。当某一数据被删除时只是逻辑删除,而非实际的物理删除。但在必要的时候,系统管理员有权进行数据的物理删除。删除操作日志和取消删除:所有删除操作都要进行逐一记录,包括记录删除的内容、删除时间和用户。必要的时候可以进行数据的回滚,即撤消删除。数据说明为方便用户使用数据,支持在数据查询、展示等界面方便的查看数据说明,包括指标含义、来源文件,以及指标变化、时间变化、主体变化和地区变化等变化的历史情况。数据管理员可根据权限直接下载原始导入文件,方便核实数据问题。数据订阅与提醒支持用户进行数据订阅,可对订阅数据进行分类管理,并可修改和删除。支持最近更新的数据进行提醒,一是提醒订阅了相关数据的用户,二是在数据查询使用时有明显的“新”数据展示。数据问题沟通用户在使用过程中如果对数据产生疑问,可方便了解数据的指标定义、来源、录入时间等详细信息。同时提供方便的提问手段,可将质疑问题反馈给数据管理人员。数据管理人员可对问题进行反馈,其它用户在查询质疑过的数据时,也可了解沟通过程和处理结果。数据量统计支持对系统中数据从以下维度进行数据量统计:指标:可按某类或某种指标进行统计数据量。时间:可按年、季、月进行时间维度的数据量统计。来源:可按不同来源统计数据量。系统管理用户组织管理支持用户和组织的管理,既可独立管理,也可与LDAP统一认证系统进行对接,同时支持两者的混合管理。用户管理:对用户的名称、密码、邮件等信息进行管理。组织管理:根据组织架构进行管理。门户管理支持自定义门户,可设置个人门户、组织门户和组织门户等多种门户,个性化进行展示。个人门户:用户可自定义数据内容、门户样式等个性化参数。组织门户部门或组织可设置个性化门户。不仅包括数据展示的门户,还可拥有独立的数据空间。通过权限设置,可让部门或组织能够独立管理和使用数据,包括数据的上传、查询、展现和权限设置等。主题门户领导门户:设立重点数据指标展示栏目,将能够反应行业发展或领导关注的重点数据或最新数据进行展示。行业门户:以行业为主题的门户,例如电信业门户、信息化门户等。领域门户:以业务或技术为主题的门户,例如无线门户、终端门户等。日志和统计分析通过日志记录,支持对用户使用情况的统计、分析。日志系统需要记录用户登录和退出系统的时间,以及在登录系统中所进行的各种操作,还需对其加以统计分析。日志系统需要记录系统管理员对数据做的增加、修改和删除等操作。日志系统需要记录系统管理员对用户的添加、删除,用户的锁定和解锁,用户密码的修改和权限的修改等操作。系统管理员可以按照时间、日志的类别对日志进行查询。日志可以导出为其它格式的文件。权限管理数据管理和维护中的权限管理包括两个部分:对操作的权限设定和对内容的权限设定。对操作的权限设定主要是指对数据的增、删、改、查、下载、审核、发布、共享等操作方式的权限的设置。对内容的权限设定主要是指对数据操作范围的限定。支持基于用户、角色、组的权限控制。提供对数据的精细权限管理,能够进行行列级别数据权限控制。支持报表、模型的权限控制。角色可以继承,一个用户可以同时属于多个角色。可设置“拒绝”权限。支持根据使用PC、手机等终端类型进行权限设置,例如使用手机时无法访问某些数据。支持和第三方认证系统集成实现单点登录。支持集成第三方权限系统。非功能性需求扩展性要求扩展性要求能够满足业务需求的长远目标。扩展性原则规定本系统的系统容量、处理能力和业务范围具有良好的扩展能力;规定应用软件设计应满足今后业务的增长,保护投资,避免重复建设。必须具有良好的可复用性,通过组件化设计,实现业务过程组件与业务流程的分离,实现业务过程组件的复用。具备高横向扩展性,满足业务数据量增大时的系统扩展要求,增加或减少物理资源时,原有应用可以不受影响,平滑扩容,无需应用的修改。数据自动在集群中进行数据并行计算,以提供具有高扩展性和高性能的大型数据库架构。可用性要求平台必须考虑容错处理,能够对操作人员的误操作进行提示。并可以监控系统的运行情况,提高平台的可靠性,从而提高业务运营的水平,保证服务质量。平台必须保证稳定可靠的运行,并保证数据的安全与完整,在系统出现问题时,必须保证数据的完整、可恢复。平台应满足采用多种平台容错手段,在数据丢失的情况下,可利用备份的数据在较短时间内进行恢复。开放性要求系统总体技术架

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论