版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
某大学数据中心平台系统建设项目需求一、项目背景1.现状大学数据中心平台是为学校内部提供数据共享、数据服务应用及数据管理的信息化基础设施。数据中心建设经历“以技术为导向”到“以应用为导向”,再到“以服务为导向”的发展历程,目前完成了2期的项目建设,已建设内容如下:(1)数据中心(一期)根据“以技术为导向”的指导原则,数据中心(一期)主要围绕“数据共享”和“数据治理”两个方面进行基础技术平台的建设。建设内容包括建立数据仓库、数据共享交换平台、支持数据治理活动的元数据管理系统和数据标准管理系统;同时,基于平台进行业务系统的数据集成和数据标准的制定工作。(2)数据中心(二期)根据“以应用为导向”的指导原则,数据中心(二期)主要围绕“数据服务应用”进行项目建设,同时通过“完善基础技术平台功能”和“深化数据治理活动”两个方面的项目建设,提高数据共享能力和数据质量,推动数据服务应用的建设目标的实现。建设内容包括:建立数据服务应用(高基表应用、领导驾驶舱、个人数据门户、业务报表管理系统、学生宿舍智慧管理);完善基础技术平台功能(数据共享门户和数据服务生态平台),建设自助式、丰富接口方式的、数据资源丰富可视化的数据共享以及增加数据质量、数据安全、数据模型,数据资产等数据治理领域的辅助技术工具;建立数据治理制度体系(制定了数据标准管理、数据质量管理、元数据管理、数据集成管理等制度。随着学校高质量发展以及信息化建设的不断深入,对数据服务提出了更高的要求,现有基于ETL的定时数据采集与交换服务已无法满足“互联网+校务”服务需求,尤其是数据中心缺乏对实时数据计算能力和非结构化数据处理能力,无法满足业务系统对实时计算、非结构化数据利用及融合数据价值挖掘与数据服务等日益增加的需求。2.存在问题经过前面两期的建设,学校数据质量大幅提升,数据资产作为学校的战略性资产地位不断得到强化,数据中心建设是一项基础工作繁、技术要求高、建设周期长和影响面广的系统化、持续性的基础工程,目前数据中心仍存在以下问题:(1)缺少对复杂业务数据实时共享及实时数据分析支持能力。目前学校数据中心已建成基于ETL等技术的定时采集、汇聚和交互平台,基本满足了非实时性的数据服务场景,比如报表服务、业务系统数据交互服务、领导驾驶舱等;但尚不能满足基于实时性的数据服务场景,比如一网通办、自助打印、迎新离校等场景,以及财务、校园卡等涉及金融业务的应用场景。比如目前在毕业季办理学生批量离校业务时,其中“欠费清缴”、“图书归还”等业务中的数据同步需要30分钟以上,极大影响了办事效率和用户体验。(2)缺少对半结构化及非结构化数据的统一存储计算分析能力。近年来学校分批次建设了200余间智慧教室、并启动了新一代校园安防体系建设。现有数据中心无法满足对来自于这些系统或场景的学习日志、教学视频录播、视频监控等半结构化、非结构化数据的存储、分析、利用。从多个维度开展基于多模态的学生学业评价改革。”采集在线学习、课堂交互、教学录播、图书借阅、校园等多场景行为数据,纵向采集学生从入学到毕业全过程学业数据,为学生学习质量监测提供可视化表征。因此,需要建设湖仓管理底座,实现对日志数据源、电子文件数据源、API数据源、声像文件数据源等多种数据源类型的实时数据采集。(3)数据应用场景数量较少,提供师生数据服务能力有待提高。经过前面两期的持续数据治理,学校的数据质量大幅提升,学校数据资产基础形成,推出了广受教职工欢迎的智能表格填报等数据服务,极大减轻了教师的指尖负担。但目前数据应用场景还太少,数据效能发挥不足,如何基于已有数据治理成果,以服务化视角重新组织数据信息,实现数据变现及数据业务化,强化面向师生个人的数据服务能力,提升师生获得感,是学校数据中心建设亟需解决的问题。二、项目概况1.建设目标项目建设将推动由数据战略驱动的业务及管理变革,挖掘数据服务应用场景,提升教育决策科学化、管理精准化和服务个性化水平,推进教育治理方式改革和学校的高质量发展,具体实现绩效目标如下:1.增加实时数据共享和分析功能,提升计算时间颗粒度从分钟级到毫秒级,满足智慧校园迎新、离校、自助打印服务等互联网+校务体系实时数据服务场景,提高数据计算吞吐量,增强数据计算稳定性,完善数据共享功能,提升对数据共享服务场景的支持水平。2.增加非结构化及结构化数据的统一存储、加工、处理,及价值挖掘能力,构建湖仓一体化数据架构,提升对全域数据的管理水平。3.增加“学生综合预警系统”、“学生精准资助系统”、“学生学业画像”、“部门全息画像”、“自助取数服务系统”5个数字校园数据服务场景,进一步为科学决策、精准管理、个性化服务提供支持。2.总体设计本项目应用架构图如上所示,建设内容按照“项目建设内容表“的序号在架构图中进行对应标识。图中数字文字标识的湖仓管理底座、实时计算平台、数据协同管理平台、学生综合预警系统、学生精准资助系统、学生学业画像、部门全息画像、自助取数服务系统是本期项目的软件建设内容。3.基本要求(一)信息标准要求(1)本项目系统建设应遵循《大学信息标准与规范-数据标准》、《大学信息标准与规范-信息系统建设规范》和《大学信息标准与规范-数据集成管理规范》进行开发,若系统与学校信息标准与规范不一致,供应商应提出解决方案并实施完成。(2)供应商须提供项目建设系统的数据字典文档,并把数据字典内容部署到数据库的注释字段。(二)数据安全要求(1)根据国家对教育行业信息安全等级保护工作的要求,供应商需要使本系统符合信息安全等级保护相应等级要求相关技术标准。采购人可选择符合《信息安全等级保护管理办法》规定条件的测评机构,依据《信息系统安全等级保护测评要求》等技术标准,对本系统开展等级测评,供应商需根据测评机构的整改意见(报告)免费对本系统做好整改修复并使之通过测评提供承诺函,格式自拟。(2)在本项目实施和售后服务期间,本项目合同标的物(定作物)之应用系统(含应用系统部署所需的操作系统,中间件,数据库)如果自身存在安全性问题,并被采购人或者主管部门扫描出存在的漏洞,供应商应积极配合安全漏洞修复并在采购人指定的时间内完成。(三)技术路线要求(1)项目技术路线符合信创技术路线要求,项目验收须获得信创适配符合性报告。三、建设内容序号功能模块单位数量1湖仓管理底座套12实时计算平台套13数据协同管理平台套14学生综合预警系统套15学生精准资助系统套16学生学业画像套17部门全息画像套18自助取数服务系统套11.湖仓管理底座面向智慧校园(如智慧教室录播、校园安防等)半结构化、非结构化及结构化的多模态数据的存储与集成,实现多类型数据容器融合,包括PostgreSQL、MYSQL、人大金仓、达梦、Minio、clickhouse等,实现支撑校级全量全域全场景数据服务业务建设目标,并支持信创技术路线。序号模块具体技术(参数)要求1总体要求为确保湖仓管理底座能基于学校现有校本数据中心规范体系切实落地,并与学校数据管理整体战略保持高度一致,本次湖仓管理底座建设须充分考虑学校现有数据的类型分布,并针对性提供采集、存储、分析与管理能力及策略,服务单位需承担湖仓管理底座建设过程中可能产生的所有费用,包括但不限于底层数据库优化费用、数据迁移费用等。(性能安全评分项)性能满足:单节点最高离线抽取速率≥45Mb/s,最大平均速率≥18万条/秒;单点可处理峰值数据≥1亿条/h,处理峰值数据量≥35/h;单节点并发任务最大数据量≥80G,提供单节点任务最大并发≥70条/s;单节点提供创建共享API服务个数≥450个。安全满足:软件架构有保障系统运行的安全策略和机制,至少包括标识和鉴别、访问控制、安全审计、数据完整性、数据保密性、会话管理等相关安全功能和机制。2数据底座平台规划和部署服务单位需根据本项目实际情况,按照“湖仓一体”的建设目标完成数据底座平台的设计、规划、部署。需根据待处理数据的体量规模、增长趋势、形态格式等因素,充分考一体化管理、容量扩展、处理性能、异构兼容性等方面的要求,选用成熟稳定、架构先进、性能优异的数据库、文件系统等产品构建数据底座平台,并对数据底座平台的运行架构和配置参数进行合理规划设计,保障数据底座能够完全满足我校数据资源管理的长期要求。服务单位案中详细说明数据底座的具体产品选型、功能作用、技术特点、存储对象、适用场景,并说明数据底座与数据资源之间的对应关系,数据资源在数据底座内流转方式设计。服务单位需完成数据底座的实际部署、配置,并进行必要的性能调优,基于该底座架构完成本项目交付,保障各项功能和性能要求的达成。3分布式数据库构建构建高性能OLAP的分布式数据库,支撑湖仓一体的物理架构,支持以下特性:1、支持列式存储。2、支持数据压缩。3、支持向量引擎操作。4、支持OLAP场景下的数据实时处理。5、支持数据高吞吐的方式批量并发写入。6、支持多核和多服务器分布式部署和处理的方式,提高查询的速度。7、支持包括MergeTree、ReplicatedMergeTree、Log、Memory、Distributed、Kafka、Buffer、MaterializedView、URL、HDFS、S3等在内的多种表引擎,基于不同场景选择合适的表引擎存储和使用数据。8、大数据集群支持Multi-Master的多主架构,集群中每个节点角色对等,客户端访问任一节点均能获取相同数据,避免单点故障。9、大数据集群支持数据分片语分布式查询,分片数量取决于节点数量,支撑TB级以上数据查询的高性能响应。10、支持关系型数据、JSON、XML等数据的存储,支持NoSQL数据库的外部数据注册,基于sql实现NoSQL+SQL的实时关联查询。11、支持ACL的方式对于数据表的访问及操作权限进行控制,字段细化到行级和列级,以保护敏感数据不被未授权访问。12、支持海量数据查询和计算的秒级返回,实际操作500G单张大宽表的数据聚合,返回时间在3秒以内。13、支持数据实时关联计算能力,基于同一个数据开发界面进行数据实时关联任务配置,可通过标准sql方式对多张数据表进行实时动态捕获,至少包括支持根据数据关联逻辑完成数据实时推送,支持按过滤条件取最新的数据,支持增量无侵入,可在数据实时关联过程中引用数据清洗转换组件,清洗转换组件至少包括加密、替换、切割。4分布式文件系统构建构建可扩展、高性能的分布式文件系统,对数据湖、数据仓库中的非结构化文件进行统一存储和对象化管理,提供高性能检索、文件共享、访问控制、高可靠运行等能力,支持以下特性:1、支持分布式架构:支持水平横向扩展,通过增加节点来提高存储容量和性能,满足大规模数据存储需求。2、支持对象存储,所有数据包括文件本身、文件名、文件的描述信息等都以对象的方式进行存储。提供高性能的对象存储服务,能够满足各种大规模数据存储和处理的需求,提高数据传输速度和访问响应时间。3、针对数据的访问频度和热度不同,提供多种存储类别,满足不用的使用场景和成本管理需求。4、具有高度容错性,支持数据冗余,能够在节点故障、磁盘损坏或文件出现坏块时保证数据的可靠性。支持采用纠删码(ErasureCoding)和复制(Replication)等技术来保护数据免受硬件故障的影响。5、采用SSL/TLS的加密通信协议,确保数据在传输过程中的安全。6、支持通过RESTAPI对存储的对象进行检索和操作,降低文件对象数据操作的门槛,提高与第三方应用对接的效率。7、提供多种安全特性,包括访问控制、身份验证等,以保护存储在其中的数据不受未经授权的访问和攻击。8、提供全面的监控和管理功能,可实时监控存储资源的利用率和访问情况,可以集成到第三方监控平台如zabbix中。5数据源连接适配1、支持连接关系型、大数据类型、MPP型、NoSQL型、时序型等多种不同类型的数据库,支持包括但不限于MySQL、Oracle、SQLServer、PostgreSQL、KingBase(人大金仓)、DaMeng(达梦)、华为DWS、华为GaussDB、ClickHouse、Hive、Impala、MongoDB、Redis、TDengine等数据库。2、支持连接消息队列、API接口等数据源类型作为数据采集来源。3、支持对连接的数据库定义其承担的角色,包括作为数据采集的来源库、作为ETL推送的目标库、作为数据仓库的承载库等不同的角色。完成角色定义后,管理界面中应显示该数据库的角色,并在各种的数据管理场景中自动按照其角色承担相应的功能。4、支持将数据库与数据的来源部门、业务系统建立对应关系,并基于该对应关系,对来自该数据库的数据表自动标注来源属性,标注的明细程度要求达到字段级。如果这种自动标注的来源属性不够准确或不符合实际管理要求,支持手工修改数据来源信息。2.实时计算平台提供湖仓实时数据共享和分析功能;实现分布式集群架构,具备高性能和高可靠性。实现数据交互从分钟级到毫秒级颗粒度,满足智慧校园迎新、离校、自动打印服务等互联网+校务体系实时数据服务,并支持信创技术路线。序号模块具体技术(参数)要求1总体要求为满足学校实时业务场景的数据需求,本次须基于湖仓管理底座的架构设计与实时计算平台的数据开发要求,提供对非结构化数据与实时数据的对接采集能力。2批流一体数据开发引擎1、要求内置数据开发引擎,支持全域数据的批流一体开发。支持不少于20种数据源类型的对接,包括各种关系型数据库、API接口数据源、消息接口数据源、HDFS文件系统、Hive、S3对象存储系统、图数据库、时序数据库等。2、要求批流一体引擎可连接上述各种数据源完成数据的读写和处理操作;支持向S3、OSS等多种云存储写入数据。3、要求批流一体引擎支持新增插件来适配新的数据源类型;支持自定义开发插件,包括source,transfer,sink等。用户可根据实际业务场景开发相关插件,提高封装性,简化数据开发的操作使用难度。4、要求批流一体数据开发引擎既支持调用内置引擎,也支持调用Flink、Spark等外部执行引擎。要求在投标文件中明确说明支持的Flink和Spark的版本类型。5、要求批流一体数据开发引擎自带API开发组件,可引用API接口作为数据源与其他数据源进行混合嵌套编排完成数据开发。6、要求具备开发任务流编排能力,基于同一个数据开发界面进行数据开发任务配置,可通过平台拖拽式操作进行数据开发任务配置,可在同一个任务中同时引用多种异构数据源,至少包括关系型数据库、Hive、CSV文件、API接口,可通过低代码或零代码形式进行异构数据源的数据关联和转换映射。7、支持在同一个任务流执行多个处理步骤,支持基于条件判的多分支处理逻辑,满足复杂的业务场景任务开发需求。8、支持任务控制,包括启动/停止/重置接口,查看接口运行日志和历史记录。9、要求可输出数据处理过程中各个运行步骤的详细监控信息,可监测任务中数据吞吐量、QPS等指标。10、要求支持与数据管理平台中的安全相关功能进行联动,在数据集成处理过程中根据安全策略执行加密存储、脱敏、水印等处理动作。11、数据采集性能要求单节点离线抽取速率最高可达50Mb/s,最大平均速率不少于20W条/秒,实时抽取效率可实现秒级同步,实时抽取单节点最高可支撑20M的峰值流量。3批处理数据开发1、针对学校数据集成的场景,产品需支持普通接口、集成接口两种类型接口的创建;普通接口针对日常的数据采集和转换,集成接口针对数据治理过程中的批量快速集成和数据库迁移场景。2、集成接口要求支持一次性完成多个接口的配置工作,方便用户一键进行数据的1:1入湖操作,同时要求根据管理需要支持相关功能的选配,包括但是不限于字符类型字段长度扩充倍数、Char类型是否转换成varchar类型、源表为空是否继续执行。3、接口命名可根据学校业务需求进行自定义配置,方便系统管理员日常维护及操作。4、数据抽取方式需至少支持全量抽取和增量抽取两种类型。5、为防止因源表数据库故障导致数据丢失的情况,创建接口时可对源表数据是否为空进行判断,根据判断结果选择是否继续执行数据同步操作。6、支持创建接口时设置判断条件,接口执行前可选择清空或不清空目标表。7、接口任务运行过程中出现个别数据错误时,支持自动跳过并继续执行(避免整个接口运行失败),在接口执行成功后支持查看同步失败数据,只需重新对有错误记录的数据进行抽取即可。8、支持将一个接口任务切分成多个数据块分批提交执行,提高接口任务执行成功率。9、为保障数据治理的质量,创建多表批量同步任务时,支持字段注释率的自动检测,当单表注释率不达标时,系统应自动禁止创建任务。10、支持拉链表模式向目标数据对象同步数据,实现目标数据的内容只增不减,保存数据行级颗粒度的历史版本。11、支持批处理任务的并发执行,可在创建任务时指定任务执行的最大并发数,系统自动限制其不可超过CPU的核数。12、支持跨数据源的开发任务,可在一个数据开发任务中选择多个异构数据源作为数据输入,基于sql语句的开发方式进行数据预处理和关联。4流处理数据开发1、提供可视化图形界面实现流式数据开发,实现跨数据库、消息组件、SYSLOG协议的秒级数据同步,满足实时跨系统业务协同的需求。2、实现在可视化界面以无代码的方式创建实时同步任务,实现跨数据库的实时数据同步。当源库数据发生变化时,实时同步接口可实时感知该变化,并将变化数据立刻同步到目标表。要求支持源表的插入、更新、删除三种数据变化模式的完整同步,保持目标表与源表内容一致。数据同步延迟(从源库数据发生变化的时刻到该数据在目标库完成写入的时刻)不高于1秒。3、支持数据实时同步,可在线完成数据实时同步任务创建配置,可通过平台创建实时同步任务,实时同步任务至少包括接口型(Http、Socket)、日志型(Mysql、Oracle、Sqlserver),可通过图形化界面进行数据映射配置,支持完成数据自动映射操作,自动映射规则至少包括同名映射、同位置配置,可通过测试报告及图形化界面验证数据传输效率达到秒级(1秒内)。4、支持在可视化界面中,对实时同步任务的运行状态进行管理。需支持用户手工停止/启动/重置同步任务,支持查看任务的运行状态,支持查看每天同步的数据变化量(分别展示读取、新增、修改、删除的数据量)。当同步异常时,可自动统计错误记录数。当源和目标表的记录数不一致时,系统需主动予以提示,提醒管理员进行处理。5、支持对实时同步任务进行数据血缘管理和数值追踪。在元数据管的数据血缘管理中,可识别实时同步任务的源表和目标表,正确展示表之间的血缘关系和字段之间映射关系。可对字段的取值进行关键字检索,系统可自动根据血缘关系追溯上下游表的数据情况,从而帮助排查可能存在的数据差异。6、支持基于CDC的实时数据同步模式中,支持MySQL-CDC、MongoDB-CDC、SQLServer-CDC、等多种类型的数据库。7、支持不依赖CDC的实时数据同步模式。该模式下,要求在数据库侧未开启CDC机制的情况下也支持实时数据同步,对数据库类型无特殊要求。8、实时数据同步过程中,要求支持各种数据处理逻辑,包括拷贝、加密、连接、正则表达式、过滤、替换、切割等。9、支持亿级规模数据的实时同步,支持对单个数据同步任务进行多进程并发执行,并可以根据我校硬件资源的升级扩充增加任务并发数量。5第三方API接口集成开发1、针对第三方API接口数据,提供界面化的配置,实现对API接口中的数据以增量、全量的机制进行数据捕获和存储,同时提供预制鉴权模板库适配第三方API的鉴权。要求具备简单易用、可视化配置、管理和运维的特性。2、支持通过低代码图形化界面配置API调用的各项参数,包括API的URL、请求方式、鉴权方式,请求参数、返回数据的字段结构、解析路径、分页方式、存储方式等,支持对配置参数的正确性进行即时校验,支持对API接口实现增量和全量两种数据调用模式,支持根据API的返回数据内容配置目标表的数据机构,实现API数据自动写入数据库进行持久化存储。3、具备完善的API数据采集管理功能,支持监控API数据采集任务进行,可查看API接口的运行状态、交换类型、执行失败数、任务状态、采集启动时间等,全面管控API数据的采集情况。4、支持查看API接口的运行日志明细,可显示运行失败的接口的详细报错信息,方便管理人员进行故障排查。5、API鉴权模板扩充时,新增的鉴权参数需自动对相关联的数据源添加秘钥信息,确保API对接时无需重复输入秘钥。6、服务单位需要具备API数据采集相关的充分知识储备,可提供常见API的鉴权规则库,并内置在产品功能中以便自动化匹配调用。可基于API鉴权规则库快速完成高校常见的应用平台(例如企业微信、海康及雨课堂等)的API接口数据对接。要求内置的API鉴权规则不少于20个,并支持自定义扩充功能。6非结构化数据集成开发一、日志数据集成开发1、针对日志类非结构化数据提供采集、存储、结构化、检索、计算、可视化、输出等功能,支持syslog、FTP多种日志源。要求实现日志数据的资产化管理和自定义分析,具备图形化监控、多副本存储、高比率压缩、自动匹配实时解析、高性能检索计算、数据输出等特性,支持应用程序对日志数据进行预处理,降低应用开发难度。2、要求支持日志数据与其他数据的关联计算。要求数据开发平台中的流批一体引擎可以直接调用日志数据和其他任何结构化数据完成算法开发并输出计算结果,支持流式处理和批处理两种不同的处理模式,要求计算过程符合“湖仓一体”的特点,即无需在不同数据容器之间进行任何数据复制或迁移即可直接完成关联和计算处理。3、要求日志数据处理模块具备高效率的数据查询检索性能,针对1亿条左右规模的日志数据进行关键字检索,要求输出结果的平均时间不超过10秒。二、文件数据集成开发1、针对图片文件(如JPG、PNG、BMP等)、文本文件(如TXT、DOC、DOCX等)、表格文件(如XLS、XLSX、CSV等)、文稿文件(如PPT、PPTX等)、图片文件(如JPG、PNG、BMP等)以及音视频流数据等文档类对象进行自动化批量采集,存储到S3文件系统中,并进行元数据提取和分类编目,支持将文档对象与数据仓库中的结构化数据进行关联,提供按类目检索和关键字检索等功能。用于实现非结构化文档对象的持久化存储、资产化管理和对外开放服务,帮助应用程序获取文档对象支撑其业务运行。2、要求具备访问鉴权功能,确保获取的文档下载链接仅在指定授权时段有效。三、非结构化数据集成数据范围支持非结构化数据的自动与实时更新,包括但不限于自网办中心、网站群系统、协同办文系统,上网管理系统等系统中自动采集文档数据,且支持全量更新以及周期性的增量更新。四、非结构化数据集成数据模式支持多种采集模式,包括但不限于本地上传、FTP、API接口、自定义脚本等。7统一调度中心实现数据开发任务的统一管理与高效调度,确保数据安全与业务需求的精准匹配,为数据的高效管理与业务决策分析提供强大支撑。1、支持基于web界面的调度任务创建,为降低使用门槛,支持通过拖拽的方式实现同步任务、异步任务、串行、并行、任务流的创建,可根据我校数据的业务属性创建不同的执行频率或周期,支持单次或者周期性任务创建。2、支持基于Web界面的画布功能快速进行调度任务的创建,包括批量导入调度任务(接口、存储过程、Shell脚本)、自动连接接口、一键格式化、调度任务保存(调度任务名称、调度任务分类、任务类型、执行频率、执行时间、任务有效期等信息的配置)。3、管理员将调度任务删除后支持暂时存放至回收站,便于用户误删后的恢复、弃用任务的重新启用及已删除调度任务的批量管理功能。4、支持同一个调度中的前后两个任务或任务组通过条件判断、数值输入的方式进行判断执行,如前面任务执行失败则触发后续的分支任务执行,前面任务执行后返回的数据条目数少于xx条则停止整个调度执行等灵活的配置。5、提供可视化监控看板,可对同一个时间段的调度并发情况进行提示和告警,避免因同一时间段执行任务过多导致任务大面积等待或执行失败的情况出现。8数据开放共享提供面对业务系统的数据开放共享服务。具体包括:1.数据资源目录管理。提供友好的数据中心共享业务数据管理功能,方便用户共享使用数据中心数据。(1)支持数据资源的分类目录管理,生成数据资源目录。(2)数字资源目录实现多方式查询功能。(3)数据资源属性包括资源名称,资源描述,资源维度明细,资源更新频率,资源大小,资源来源部门,资源示例。2.接口模块管理。管理平台接口信息,包括:(1)实现多种交换场景:包括但是不限于定时共享场景,准实时共享场景,移动应用共享场景,BI分析场景等。(2)实现多种接口形式:API,ETL接口,数据库,离线下载。(3)实现将注册平台数据源的数据对象转换为API接口的形式,并实现接口查看、编辑、删除等功能。(4)实现选择数据源、多表级联、自定义设置查询条件和显示列生成接口。(5)实现接口的测试,停止和发布等功能。(6)实现接口的申请和审核流程。(7)实现多种API接口数据形式,包括:JSON、TXT等。(8)实现线下电子文档转换为接口功能。(9)实现接口数据全量和增量获取方式。(10)实现接口分类管理。(11)实现接口的多重安全认证方式,包括不限于:密钥验证、token认证等。(12)实现接口访问时效控制。(13)实现接口加密功能。实现敏感数据进行加密传输。(14)实现增量申请,例如开发者在同一张表提交多个字段申请,能够识别之前申请的字段,仅给管理人员显示需求变更的字段内容,在审核时实现选择字段进行批量通过或退回。(15)实现文本数据的在线申请、审核功能,例如业务部门可在线获取最权威的数据,审核通过后可直接下载为Excel文件或者CSV格式文件,无需编程解析。3数据共享开发管理。(1)实现业务系统的注册功能,注册信息包括系统名称、IP地址和系统描述等。(2)实现业务系统的接口的申请、修、查看、删除和测试功能。(3)提供申请接口API信息及API使用示例在线查看的功能,包括API的访问地址、调用方法、参数命名、错误代码和示例代码。(4)实现接口开发规范和开发DEMO在线查看的功能。(5)提供平台使用帮助在线查看的功能。9平台监控1.实现对平台运行健康情况的监控,包括查看系统负载,查看系统异常信息,查看接口异常告警,查看黑名单信息,可自定义时间段统计业务系统访问平台系统信息,接口信息,查看使用平台的应用和没使用平台但已经注册的应用统计信息,并且所有统计信息实现下钻查看。实现以业务系统为视角,查看系统的接口使用健康情况。实现接口调用日志查看。根据接口名称、接入系统、时间段进行查询,查看日志详情。实现用户的平台操作日志查看。3.数据协同管理平台实现基于数据标准、数据质量、元数据、数据建模,数据安全,数据资产等方面进行湖仓一体化的数据协同与融合管理,辅助数据治理整体服务过程,建立跨部门、跨业务域的数据协同管理(OA)平台和流程体系。序号模块具体技术(参数)要求1总体要求为满足学校一体化协同管理要求,本次数据协同管理平台须架构于湖仓管理底座之上,充分运用湖仓管理底座的底层数据库能力,并完成与相关数据库的兼容对接适配工作,这些适配费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。2数据标准管理1、可在线管理标准数据元素,定义标准数据元素的英文名称、中文注释、数据类型、数据长度等属性。2、支持将标准数据元素与代码表、编码规则、安全级别进行绑定。绑定后,当在数据模型中引用该数据元素时,绑定的要素应自动跟随数据元素在数据模型中生效。3、针对某个数据元素,可查看引用了该元素的所有数据模型的名称。4、可自动生成标准数据元素的链接图谱,显示该数据元素的各项属性、各种绑定要素、引用该数据元素的各个数据模型。5、支持对标准数据元素集合进行版本管理,指定主版本作为生效版本。6、支持批量导入、导出标准数据元素。7、可在线管理标准代码表,定义代码表的英文名、中文注释、代码项、代码值。8、支持将标准代码表与标准数据元进行绑定。9、可查看所有引用了该代码表的表名称和字段名。10、支持对单个代码表的内容变化进行版本跟踪,每当内容发生变化时,自动生成新的版本,并留存历史版本的内容。11、支持对标准代码表的集合进行版本管理,指定主版本作为生效版本。可对不同版本进行内容差异比对,比对后可显示存在差异的代码表名称、代码项名称等详细信息。12、支持批量导入、导出标准代码表。3数据质量管理1、要求具备数据质量规则管理功能。可定义数据质量规则以描述数据质量不合规的形态。要求可从完整性、准确性、一致性、唯一性、及时性五种维度进行质量规则的配置。要求可以通过质量规则的定义,既能够描述数据形态格式方面的显性问题,例如数据缺失、数据重复、数值超限、格式错误、长度错误等情况,也能够描述需要通过表间校验才能发现的复杂性、隐藏性问题,例如代码错误、枚举错误、表间数据不一致、数据不符合正常业务逻辑等情况,还能够描述数据流转过程方面的问题,例如数据同步间隔不符合业务要求,等等。2、服务单位需要具备对数据质量规则的充分储备积累,可提供常用的数据质量规则库并内置在产品功能中以便自动化匹配调用。要求系统内置的质量规则模版数量不少于50个,可覆盖全部五类质量维度,并支持自定义新的规则以扩充质量规则库。3、支持将数据质量规则绑定到指定的表及字段上,作为数据质量检查的依据。支持在一张表中指定多个检查字段,支持对一个字段绑定多个规则。质量检查时,要求针对每一对“字段-规则”绑定关系分别输出对应的问题数据。4、对于已经绑定了代码表的字段,支持一键生成代码有效性规则,并自动将代码有效规则绑定到该字段上。5、要求系统可基于数据对象上绑定的质量规则,执行数据质量检查动作,从而完成质量检查,输出数据质量报告,揭示具体的数据问题。须支持定期自动化检查,定期输出各个时点的数据质量报告。检查的间隔周期要求可自定义配置。6、支持不配置调度即刻执行检查,以便尽快输出检查结果。7、为了实现对数据仓库的不同层级进行数据质量检查,系统需支持将对下游数据绑定的规则根据数据加工链路关系自动回溯绑定到上游的数据对象上,而无需重复绑定操作。8、支持自定义数据质量的量化评分规则,可通过调整各个质量维度的权重生成不同的量化评价规则。支持预置多套不同的评价规则,可在不同的质量报告可应用不同的量化评价规则,以满足对数据质量的个性化评价要求。9、支持将数据质量检查的结果按照检查的数据对象所对应的部门、业务系统口径进行自动归集,生成以部门、业务系统为单位的数据质量报告。10、要求数据质量报告给出各个质量维度的分值及质量综合评分,统计各个规则对应的问题数量,并针对一张表的各个字段下绑定的每一条规则,分别输出问题数据的比例、数量,并支持查看每一类问题数据的详细列表,以便启动数据纠错工作。11、支持将质量报告导出为其他格式供线下查阅,支持的格式包括电子表格、PDF、网页等。12、支持将质量报告通过电子邮件、即时消息等形式通知到相关人员,并支持部门针对数据质量报告所体现的问题进行线上反馈。13、为满足数据质量报告的灵活管理需求,须支持生成自定义的质量报告。可手工指定数据表的范围、质量规则的范围、应用的范围作为自定义质量报告的内容组成,并可自定义指定报告的接收人。14、要求基于不同时期的数据质量检查情况,对各部门、各系统的数据质量情况进行排名,对变化趋势进行持续跟踪,通过可视化界面进行展示,以便了解各个部门提升数据质量的动作和成效。支持选择不同的时间跨度查看各部门、各系统数据质量的变化趋势情况。15、要求从全局对我校数据质量情况进行持续跟踪检测,对数据检查的范围、规则、分数、检测次数、问题数据量、合格率等指标进行全局统计分析,并通过趋势图进行动态展示。支持选择不同的时间跨度查看全局数据质量的变化趋势情况。4元数据管理1、可以对表、视图、存储过程等各种数据对象进行分类和管理。支持自定义分类名称、分类层级,不限分类层级数。2、可对每个数据对象的详细元数据信息进行管理,包括字段组成、字段属性、字段含义注释、数据充实度(字段级)、数据来源(字段级)。3、可对每个字段进行绑定代码表、设置数据来源(字段级)等操作。4、对字段设置数据来源信息后,对应的表对象数据来源信息应自动同步更新。如果一个表中不同字段有不同的来源信息,表的来源信息应完整显示多个来源信息。5、支持对每个数据实体的表结构变化进行自动跟踪,每当表结构发生变化时,自动生成新的版本,并留存历史版本的内容。可随时查看每个版本的时间和具体内容。6、可自动构建生成整个数据仓库的全局数据流向图,以呈现整个数据仓库的数据上行、下行流动信息。7、流向图中,应可呈现从每个部门、每个业务系统采集到数据仓库的数据量、数据内容和接口方式,以及数据仓库向每个部门、每个业务系统提供数据服务的数据量、数据内容和接口方式。8、流向图中,可以对从各部门、各业务系统采集的数据内容进行下钻显示详情,包括每个采集接口的运行状态、源库/表、目标库/表、最近执行时间、最后一次数据变化量等信息,并可以直接定位到每个ETL接口的管理界面。9、流向图中,可以对数据服务的内容进行下钻显示详情,包括每个服务接口的运行状态、数据清单名称、源库/表、目标库/表、最后执行时间、最后一次数据变化量等信息,并可以直接定位到该数据清单或ETL接口的管理界面。10、可自动构建生成每个数据实体的全链分析图。全链分析需揭示每个数据实体的血缘分析(上游加工来源)和影响分析(下游服务去向)。11、全链分析图可进一步展开到字段级详情,自动显示数据对象在全链路上的字段映射关系。12、全链分析图中,要求在所有节点上提供字段名称检索框以便快速定位到特定字段,需支持模糊匹配。13、在全链分析图上,要求在所有节点上提供数据明细内容的预览和查询。14、要求通过血缘分析图展现数据对象的上游加工来源。血缘分析图需完整展示用来生成该数据对象的所有上游表,包括表名、所属部门、所属系统。可进一步展开到字段级详情,自动显示整个加工过程中字段的映射关系。15、要求通过影响分析图展现数据对象的下游服务去向。影响分析图需完整展示该数据对象生成的各个数据清单,以及各个数据清单服务的各个下游应用,包括每个应用的名称、所属部门、调用的字段范围。可进一步展开到字段级详情,自动显示整个数据服务过程中字段的映射关系。16、为帮助管理员精准定位数据处理故障,要求支持基于数据明细内容的跟踪分析。支持在数据全链分析中,对字段取值内容进行跟踪检查。用户可针对指定字段输入查询关键字,系统需自动在全链分析图的所有节点进行查找,显示匹配的结。管理员可基于匹配结果判断数据内容在加工过程中是否发生异常或故障,以及故障的具体发生点。17、提供元数据全局检索功能。可通过支持精确匹配和模糊匹配对输入的查询关键字进行匹配,显示查询出的数据库、表、字段、注释、部门等不同类型的对象清单,显示清单中各个对象的元数据信息,并支持下钻至该对象的详情管理界面。5数据建模管理1、可在线查看及编辑标准数据模型,定义数据模型的字段组成、英文名称、中文注释、相关联的实体表、版本数量等信息。2、可按照数据标准的主题分类对标准数据模型进行分类管理。支持自定义分类,不限分类层级。3、支持对单个标准数据模型管理的内容变化进行自动跟踪,每当内容发生变化时,自动生成新的版本,并留存历史版本的内容。可随时查看每个版本的时间和具体内容。4、可基于标准数据模型直接在数据库中自动生成对应的实体表,也可以生成SQL脚本以便手工建表。要求生成实体表的操作既支持针对单个模型,也支持一次性针对多个模型批量生成实体表。5、基于数据模型自动生成实体表时,系统应自动记录模型与实体表的关联关系。支持手工断开模型与实体表的关联关系,断开关联关系后,允许利用同一个模型重新生成另外的实体表。6、支持对模型与实体表各自的版本变化进行动态跟踪。当模型与实体表出现差异时,系统应自动予以提示,并给出具体的差异详情。7、支持对单个标准数据模型管理的内容变化进行版本跟踪,每当内容发生变化时,自动生成新的版本,并留存历史版本的内容。8、可对单个数据模型的不同版本进行内容差异比对,比对后可显示存在差异的字段名称、字段定义等详细信息。9、支持对标准数据模型的集合进行版本管理,指定主版本作为生效版本。可对标准数据模型集合的不同版本的进行内容差异比对,比对后可显示存在差异的模型名称、字段定义等详细信息,可批量导出差异信息。10、可在线管理所有由标准数据模型生成的实体表对象,查看实体表的字段组成、英文名称、中文注释、存储位置等信息。11、可显示每个实体表与其对应模型的一致性,存在差异时,系统应自动予以提示,并给出具体的差异详情。12、可在线编辑实体表,进行字段的新增、删除、修改。13、在数据模型编辑过程中,要求系统自动进行约束,保证标准数据模型中仅允许引用已经实现定义过的标准数据元素,并自动继承标准数据元素的各项属性、各种绑定要素,从而保证所有标准数据模型中的字段定义具备全局一致性。14、要求系统自动对数据模型与实体表的一致性进行动态跟踪。当出现差异时,系统应自动予以提示,并给出具体的差异详情。15、支持一键操作完成模型与实体表的同步,既支持修改模型以匹配实体表,也支持修改实体表以匹配模型,从而保证标准数据模型与对应的实体表保持一致。16、在实体表编辑过程中,支持一键操作将实体表的字段变更同步应用到对应的模型上,从而维持模型与实体表的一致性。17、在数据模型与实体表的双向同步过程中,新生成的字段定义须自动扩充到标准数据元素集合中,从保持标准数据元素、标准数据模型、实体表三者的一致性。6数据安全管理1、要求内置不少于5种加密算法,至少包括AES、MD5、国密SM2-4。支持在数据发布或审核阶段针对特定字段,调用指定的加密算法对数据进行加密。2、要求内置不少于5种脱敏规则,至少包括遮盖脱敏、随机脱敏、仿真脱敏等不同规则。支持在数据发布或审核阶段针对特定字段,调用指定的脱敏算法对数据进行脱敏。3、支持新建新的遮盖脱敏,自定义遮盖内容及覆盖规则。4、支持通过https加密通道提供数据服务,支持动态Https证书管理,可管理多份Https证书,并根据需求随时应用新证书。5、支持自定义各种安全等级,将安全等级绑定到数据对象上。基于不同的安全级别,系统对数据对象的共享策略、审核流程、审计日志等方面进行差异化处理。7数据资产管理1、数据资源建设情况提供一个看板界面,对数据资源的建设进展、变化趋势进行跟踪展示。2、要求看板中可以显示当前数据资源建设进度的主要指标,包括业务部门数量业务系统、厂商、数据表、数据项、数据记录数、数据占用的存储空间、空值率、表和字段的注释、接受数据服务的业务部门、业务系统的数量等。3、要求所有指标均可以按照数据加工环节的不同层级分别查看,所有指标均可以以变化趋势图的方式进行可视化呈现,并可选不同的时间跨度。4、数据资源共享情况要求看板中可以显示当前数据共享情况的主要指标,包括接受数据服务的业务部门、业务系统的数量,用于服务的各种不同服务类型的数据资源的数量。所有的指标要求均可以以变化趋势图的方式进行可视化呈现,并可选不同的时间跨度。8数据协同管理一、数据标准与元数据联动1、在数据模型设计中,对于在元数据管理中绑定了代码表的字段,支持自动对该模型对应的实体表的字段自动继承该绑定关系。二、元数据信息与数据质量联动1、对于元数据中已经绑定了代码表的字段,在数据质量管理中支持基于代码表一键生成代码检验规则,并自动将该规则绑定到相应的字段上,用于检验该字段取值是否符合代码表定义。三、“一数一源”全局一体化管理要求在数据管理全流程落实“一数一源”的一体化管理。包括如下内容:1、在数据采集阶段,系统应自动根据数据采集的物理来源,自动判断该数据的来源部门,在元数据管理中注册为数据的默认来源部门,据此自动生成全局数据交换关系和微观数据血缘关系。2、在数据质量管理中,基于数据来源信息,自动将数据检查的结果按照部门进行归集,生成相应部门的数据质量报告,供部门查阅整改,并支持部门针对数据质量进行线上反馈。3、在数据开放管理中,基于数据来源信息,将各项数据资源按照部门进行自动归集,无需手工配置即可生成每个部门的数据资源、数据标准模型、标准代码清单。4、在数据申请审核中,基于数据来源信息,自动将各个字段的审核权限呈现在其对应来源部门的审核界面中,无需一一人工指定。如果在一次审核中涉及多个来源部门时,系统支持自动将流程平行投送到多个部门。5、在数据资产门户的部门管理界面下,可查看各部门与其他部门进行数据共享的总体情况,包括该部门向其他部门提供了哪些数据,其他部门从该部门获取了哪些数据,以及这些数据分别被用于哪些信息系统。4.学生综合预警系统基于数据中心全域数据,建立学生安全、学业等告警模型,采集学生安全相关数据进行加工处理计算,提供全局的、可视化的及自动的技术支撑,提供安全、学业等告警功能,实现数据驱动学生精细化管理工作。序号模块具体技术(参数)要求1总体要求为确保学生综合预警系统建设工作的顺利进行,本项目具备一定的功能开发与数据开发要求,服务单位须承诺,在系统建设全过程中,严格遵循学校的信息系统建设规范与数据管理规范,确保系统建设的规范性和数据的准确性。同时,服务单位还需负责提供系统建设所需数据的采集、治理和对接服务,确保系统数据的完整性和可用性。此外,服务单位应明确承担系统建设过程中可能产生的所有费用,包括但不限于系统对接费用、数据对接费用、数据治理费用等,这些费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。具备数据应用场景的指标管理维护能力,基于同一个指标管理平台进行指标管理,无须跳转或访问其他平台,包括学生综合预警平台应用场景管理;包括指标描述、指标呈现、指标开发的场景指标管理。2学业告警对接教务系统已有学业预警模型,实现相关告警信息的综合呈现。3考勤洞察1、建立学业行为观察模型,通过对接教务系统课表数据,与学生校园内刷卡消费、上网认证、门禁进出等行为数据进行综合比对,洞察学生旷课、迟到等现象,针对存在学风学纪问题的学生及时推送告警。2、支持从院系、辅导员等管理视角可视化统计分析学生考勤数据。3、实现查询考勤异动学生名单,对告警信息进行反馈和白名单操作。4早出晚归告警对接学生宿舍门禁管理系统已有预警模型,实现相关告警信息的综合呈现。5失联告警1、建立失联告警模型,对接监测学生校园内刷卡消费、上网认证、门禁进出等行为数据,综合分析研判学生在校状态,对状态异常(疑似失联)的学生及时推送告警,保障学生人身安全。2、支持从院系、辅导员等管理视角可视化统计分析学生安全态势。3、实现查询疑似不在校学生名单;实现对告警信息进行反馈和白名单操作;实现关联当日校内轨迹排查学生最后去向。6告警模型集成建设1、要求依托本项目建设的实时计算平台作为数据采集工具。实现对系统建设所缺数据的补充采集工作,完成对结构化数据、半结构化数据和非结构化数据的统一采集,并根据不同数据的时效性要求针对性完成数据同步频率设置,实现对数据的快速汇聚。2、要求依托本项目建设的湖仓管理底座作为数据支撑。实现对系统所需数据的统一存储、管理和分析。将结构化数据和非结构化数据进行整合,形成统一的数据视图,为告警模型的构建提供坚实的数据基础。3、基于湖仓管理底座和实时计算平台提供的数据支持,基于学生的学业成绩、考勤记录、出入校园时间等信息进行综合分析,构建学业告警、考勤告警、早出晚归告警和失联告警等多个数据模型与告警模型,以便管理员依托数据变换情况及时采取措施进行干预和处理。5.学生精准资助系统基于数据中心全域数据,对学生一卡通消费数据进行多维度的可视化统计分析,实现对消费金额或频次异常、无食堂消费等行为消费行为异常消费的学生进行告警管理,辅助发现困难生。序号模块具体技术(参数)要求1总体要求为确保学生精准资助系统建设工作的顺利进行,本项目具备一定的功能开发与数据开发要求,服务单位须承诺,在系统建设全过程中,严格遵循学校的信息系统建设规范与数据管理规范,确保系统建设的规范性和数据的准确性。同时,服务单位还需负责提供系统建设所需数据的采集、治理和对接服务,确保系统数据的完整性和可用性。此外,服务单位应明确承担系统建设过程中可能产生的所有费用,包括但不限于系统对接费用、数据对接费用、数据治理费用等,这些费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。2群体消费分析1、当前在校生消费整体概况:消费人数及比例、消费总金额及人均。2、消费趋势图。3、消费区间统计柱状图。4、男女进餐消费比例。5、各学院消费统计。6、各年级消费统计。7、各年级消费比例。8、各生源地消费统计。9、高消费生源地TOP。10、低消费生源地TOP。11、低消费告警。12、高消费告警。3个人消费分析1、当前在校生消费整体概况:困难因子分值、食堂月均消费、食堂就餐率、恩格尔系数。2、近6个月三餐消费额度分布。3、个人消费明细。4困难等级配置1、实现对困难等级进行设置,根据困难生认定的标准,从量化分值排名设置贫困等级,如“特别困难”、“中等困难”、“一般困难”。5困难因子配置因难因子数据抽取:落实到学生在校期间的消费情况、家庭条件、奖助学金、特殊人群等信息。配置每个因子的分值以及权重的比例。6困难生识别管理1、通过学生在校一卡通消费流水、奖助学金、家庭情况等信息系统,选取困难因子建立数学模型,生成困难指数,将困难指数从高到低排序,按照配置的比例,生成疑似困难生和异常困难生名单。2、根据困难生认定的标准,在初始困难生中识别出“伪因难生,形成疑似(非)困难生名单,由辅导员查看名单后,自行移除(非)困难生。3、实现留存历史移除的名单,可供查询。4、针对“疑似困难生’的学生,实现配置审核流程,可设置一级审核或者多层级审核,审核通过后列入正式困难生名。5、实现对正式困难生进行认定,数据来源于两个方面1通过学校管理考导入的初始困难生库、经过审核疑似困难生,通过后纳入正式困难生名单中。6、实现正式困难生名单批次留存,对每个学期的正式困难生名单能做保存,实现按批次查询。7资助模型集成建设1、要求依托本项目建设的实时计算平台作为数据采集工具。实现对系统建设所缺数据的补充采集工作,完成对结构化数据、半结构化数据和非结构化数据的统一采集,并根据不同数据的时效性要求针对性完成数据同步频率设置,实现对数据的快速汇聚。2、要求依托本项目建设的湖仓管理底座作为数据支撑。实现对系统所需数据的统一存储、管理和分析。将结构化数据和非结构化数据进行整合,形成统一的数据视图,为资助模型的构建提供坚实的数据基础。3、基于湖仓管理底座和实时计算平台提供的数据支持,基于学生的一卡通消费流水、奖助学金、家庭情况等信息进行综合分析,构建困难标准模型、困难因子模型及资助模型等多个数据模型,以便管理员依托数据进行困难生识别管理,辅助精准资助。6.学生学业画像基于数据中心全域数据,通过多模态数据驱动,包括结构化数据、文本、图片、音频、视频非结构化数据,从学生基本信息、学习、消费、阅读、生活习惯等方面,采集学生基本信息、学业成绩、第二课堂,在线学习、课堂交互、教学录播、图书借阅、校园生活等多场景行为数据,对学生行为特征进行分析,进行数字化的学生学业评价,实施数据驱动的精准教学及管理。序号模块具体技术(参数)要求1总体要求为确保学生学业画像建设工作的顺利进行,本项目具备一定的功能开发与数据开发要求,服务单位须承诺,在系统建设全过程中,严格遵循学校的信息系统建设规范与数据管理规范,确保系统建设的规范性和数据的准确性。同时,服务单位还需负责提供系统建设所需数据的采集、治理和对接服务,确保系统数据的完整性和可用性。此外,服务单位应明确承担系统建设过程中可能产生的所有费用,包括但不限于系统对接费用、数据对接费用、数据治理费用等,这些费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。具备学生学业画像的一体化管理能力,以下要求须基于同一个平台进行可视化图表呈现,无须跳转或访问其他平台,支持部门视角下按年级划分的学生群体管理;支持饼状图、时光轴、关系图谱的可视化图表呈现;支持明细数据报表的明细数据呈现;支持个人数据自主纠错。2学生一张表通过学生一张表展示学生从入校到毕业整个生命周期学生在校学习、图书借阅、生活消费、奖勤助贷、荣誉信息、社会实践经历、体育信息、校内关系、心理健康、毕业信息、就业信息等的数据报告,具体应该包含但不限于以下信息集模块及相关数据项信息:1、基本信息:1.1基本信息:姓名、性别、出生日期、籍贯、民族、政治面貌、生源地、入学日期、所在学院、学生类别、学籍状态等。1.2家庭成员信息:姓名、称谓、所在单位、家庭住址、电话等。1.3学籍注册信息:学年、学期、注册日期、报到日期等。1.4学籍异动信息:学年、学期、异动类别、异动时间、异动文号等。1.5公寓住宿信息:楼栋名称、楼层名称、房间名称、入住方式、床位号等。2、学习信息:2.1选课信息:课程类别代码、学期、课程代码、课程属性代码、选课日期。2.2学习成绩信息:学年、学期、课程名称、课程类别、学分、成绩、绩点等。2.3第二课堂学分:项目名称、项目年度、项目级别、项目类别、项目排名、成绩、学分、是否集体项目、获奖名称。2.4综合测评成绩:学号、测评成绩、学院排名、专业排名、班级排名等。3、图书借阅信息:3.1图书借阅信息:书籍名称、图书编码、作者、出版社、借阅日期、应还日期等。4、生活消费信息:4.1一卡通消费信息:一卡通卡号、交易时间、记账时间、交易金额、商户名称、交易名称。4.2上网信息:套餐、用户IPV4、上线时间、下线时间、在线时长、下线原因。5、奖勤助贷信息:5.1奖学金信息:奖学金名称、申请时间、审批时间、审批意见等。5.2助学金信息:助学金名称、申请时间、审批时间、审批意见等。5.3勤工助学信息:工资月份、用人单位、勤工助学岗位等。5.4困难生认定信息:认定周期、量化指标得分、困难等级、认定周期等。6、荣誉信息:6.1十佳学生:获奖名称、学年度名称、申请时间、审批时间等。6.2优秀学生:评选季节、学年度名称、申请时间、审批时间。6.3单项奖励金:奖励名称、申报级别、申报性质、申报类别等。7、社会实践经历7.1专利发明:专利名称、证书号、授权公告日等。7.2论文发表:论文名称、发表日期、发表刊物名称、期刊号、申请日期。7.3竞赛信息:竞赛名称、竞赛类型、获奖时间、获奖级别等。7.4互联网+创新创业大赛:赛道、参赛组别、赛事名称、获奖年度、获奖级别等。8、毕业信息:8.1毕业信息:毕业年份、毕业日期、毕业学院、毕业专业、毕业证书号、毕业结论、学位类型等。8.2毕业论文信息:题目、指导教师、评阅教师、答辩教师、指导成绩、评阅成绩、是否为毕业论文创新奖。8.3离校信息:年度、离校状态、离校时间等。3学生个体画像学生个体画像展示了学生从进校到毕业整个过程的数据收集,提供学习、生活、成长过程的数据可视化展示,收集学生学习成绩、参加活动与奖惩情况、生活消费情况、饮食作息以及重要社交信息等指标,分析学生成长路线是否健康,具体从下面几方面描述:1.个人标签对接学生综合预警系统,结合学生个人生涯信息对比分析,增加学生个体标签标识,如三餐规律(基于消费数据)、优秀学生(基于成绩数据)、图书达人(介于图书借阅数据)、是否有学业预警、是否是困难生、是否有晚归预警、是否有违规行为,是否心理健康(基于大学生心理测评分重点关注和普通关注)等。2.个人经历包括学生入学之前的成长经历,主要是小学、初中、高中,硕士研究生包含大学本科教育经历,博士研究生包含大学本科和硕士研究生教育经历。包括新生入学、报到注册、学籍异动、辅修等在校成长经历;新生入学主要关注新生成绩、报到注册主要关注是否注册,学籍异动主要关注是否因为一些变故申请异动,辅修主要关注学生是否跨学科学习。3.第一课堂包括学分完成情况,主要关心学生培养计划中课程的完成情况,主要以要求学分和学分完成度对比。包括学生学习成绩概览,主要关心学生的学习效果中的GPA和挂科情况。4.借阅行为包括借阅图书类别分布,主要关心学生借阅偏好,关心学生是否通过借阅图书充实自己的精神世界。包括图书馆进出分析,主要关心学生的学习热情,通过学生进入图书馆的频率可以反映学生学习自习的时长与学习的投入。5.消费行为消费水平分析,主要关心学生的消费水平,用于学生资助的业务场景。就餐规律分析,主要关心学生的作息规律,学生生活健康发展;早餐[6:00,1:00)、午餐[11:00,14:00)、晚餐[17:00,19:00)。6.社交关系社交关系图谱:主要关心学生失联情况,可及时联系到与学生亲近的人或者监护人,做好干预措施。家庭关系主要是直系亲属或者监护人等,舍友关系是指一个宿舍的同学,师门关系主要是在同一个导师门下的师兄弟姐妹,师生关系主要是导师、辅导员、班主任等。7.“个人年度成长报告”结合学生课程表、成绩及学分、图书借阅、学校生活、兴趣爱好、课外活动及课题小组等各方面的数据信息,形成“个人年度”成长报告。8.学生个体画像支持移动端展示。4学生群体画像基于学生年龄、性别、学科、学院等个人基础数据信息,聚类学生群体,以更细致地刻画群体在学生属性、学习行为、兴趣爱好、消费习惯以及地理位置等多个维度的画像特征:1.基础信息参数:性别、年龄、专业/学科等。2.学术表现参数:学业成绩、学习习惯、学术参与度等。3.行为特征参数:出勤率、社交行为、课外活动、消费习惯等。4.阅读偏好:书籍类型、阅读习惯等。5.地理位置参数:常住地、校园活动区域等5学生学业数据集成建设1.要求依托本项目建设的实时计算平台作为数据采集工具。实现对系统建设所缺数据的补充采集工作,完成对结构化数据、半结构化数据和非结构化数据的统一采集,并根据不同数据的时效性要求针对性完成数据同步频率设置,实现对数据的快速汇聚。2.要求依托本项目建设的湖仓管理底座作为数据支撑。实现对系统所需数据的统一存储、管理和分析。将结构化数据和非结构化数据进行整合,形成统一的数据视图,为学生学业画像的构建提供坚实的数据基础。3.基于湖仓管理底座和实时计算平台提供的数据支持,基于学生的教务数据、学工数据、告警数据、图书数据等多类信息进行综合分析,构建学生学业数据模型,以便管理员依托数据进行学生画像查询。7.部门全息画像根据学校组织机构的分类,主要分为学院和管理职能部门两大类,学院画像以“服务”为主旨,基于学校学科数据治理成果,把分散在各业务系统的学科数据进行采集、存储、加工、处理、计算,建立以学院学科为中心的数字档案,最终将学院整体学科的学科建设、学术科研、人才培养、师资队伍、招生就业等信息进行可视化输出,形成以学院为主题的学院数据中心;管理职能部门画像以职能部门“管理”为主旨,制定不少于5个职能部门画像。序号模块具体技术(参数)要求1总体要求为确保部门全息画像建设工作的顺利进行,本项目具备一定的功能开发与数据开发要求,服务单位须承诺,在系统建设全过程中,严格遵循学校的信息系统建设规范与数据管理规范,确保系统建设的规范性和数据的准确性。同时,服务单位还需负责提供系统建设所需数据的采集、治理和对接服务,确保系统数据的完整性和可用性。此外,服务单位应明确承担系统建设过程中可能产生的所有费用,包括但不限于系统对接费用、数据对接费用、数据治理费用等,这些费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。2学院人员结构学院人员结构主要从学院教职工,本科生和研究生三个视角分析学院的人员结构。1.教职工维度可以从编制类别、民族、性别、政治面貌等指标可视化分析展示,其中专任教师可以从来校年份、年龄、职称、学历、学位等指标可视化展示,并且展示后可以下钻详情。2.本科生维度可以从本科生招生、专业分布,成绩、绩点、就业信息等指标可视化分析展示。3.研究生维度可以从研究生招生、专业分布,学术成绩、就业信息等指标可视化分析展示。3学院学科分析从学科建设、学术科研、人才培养,师资队伍,招生就业等维度以图表的形式分析全校数据情况,通过学校与学院两种维度将分析结果展示给校领导和学院领导,便于校领导增强对学院的了解,院系领导更为直观的对整体院系的各个维度的汇总统计、数据趋势的走向进行把控。4学院成果分析从教学分析项目分析,论文分析三大类数据分析,通过图表的形式展示本学院学科成果,通过筛选条件可多角度的展示对比度。教学分析以教师本学院教师与其他同类学院往年课时时数统计,以及本学院内部教师授课时数对比;项目分析,以本学院科研项目经费与其他同类学院往年项目经费到账统计,以及本学院内部教师项目经费到账对比;论文分析以本学院论文发表总数与其他同类学院往年论文发表数量统计,以及本学院内部教师发布论文数量对比。5学院项目信息按学院横向项目和纵向项目相关信息进行展示。学院科研成果信息按学院科研论文、学术著作、专利、著作权、获奖等信息进行展示。6学院招生信息按学院招生总人数、各专业人数等信息进行展示。7学院就业信息按年度毕业人数、就业率等信息进行展示。8学院人才培养学院人才培养。按照学院学生总人数、专业、班级等信息进行展示。9学院师资队伍按照学院教师人数、职称、年龄等信息进行展示。10职能部门画像管理职能部门画像以职能部门“管理”为主旨,制定不少于5个职能部门画像,例如教务处、人事处、科研处、发展规划处等。11学科数据集成建设1.要求依托本项目建设的实时计算平台作为数据采集工具。实现对系统建设所缺数据的补充采集工作,完成对结构化数据、半结构化数据和非结构化数据的统一采集,并根据不同数据的时效性要求针对性完成数据同步频率设置,实现对数据的快速汇聚。2.要求依托本项目建设的湖仓管理底座作为数据支撑。实现对系统所需数据的统一存储、管理和分析。将学院学科数据进行整合,形成统一的数据视图,为学院部门全息画像的构建提供坚实的数据基础。3.基于湖仓管理底座和实时计算平台提供的数据支持,基于学院的学科数据进行综合分析,构建学院学科数据模型,以便管理员依托数据进行部门全息画像查询。8.自助取数服务系统基于数据中心,融合湖仓全域数据,满足业务部门及师生提供对数字校园数据的使用需求,进一步变现数据价值,将数据要素转换为生产力,为教学、科研、管理及生活服务。序号模块具体技术(参数)要求1总体要求为确保自助取数系统所提供数据的完整性与一致性,服务单位需基于湖仓管理底座完成数据资源的发布与呈现,服务单位需承担系统建设过程中可能产生的所有费用,包括但不限于数据对接费用、湖仓底座兼容费用等,这些费用应被合理计入投标成本中,不得再向学校或第三方机构收取费用。为确保自助取数系统的安全性。产品开发架构应充分考虑整个系统运行的安全策略和机制;需具备防止用户非法登录;控制未授权人员无法阅读或者修改相应权限的信息和数据的能力。2数据资源目录1.应提供数据资源目录,目录中呈现所有已发布的数据资源。可现实数据资源的所属部门、所属业务系统、数据接口格式、字段说明、申请总数、更新频率、字段数、调用次数、数据量等信息。可进行数据预览,预览时自动对数据进行脱敏显示。3申请数据资源1.数据用户可在数据资源目录中自选数据资源,在线提交使用申请。申请时可指定所需的字段范围,并可在线进行数据使用保密协议的签订。提供购物车模式,可进行批量申请。支持对数据资源进行收藏,对API接口进行数据测试验证连通性和有效性。4审批数据申请1.当数据用户发起数据资源申请后,系统应根据预定义的审核流程模式自动生成相应的审核流程,并在相关审核人的界面中予以提示,提醒尽快进行审核处理。2.为落实“一数一源”管理要求,在审核流程流转过程中,系统应根据申请的各个字段的不同来源部门,自动将各个字段的审核权限呈现在其对应来源部门的审核界面中,无需一一人工指定。如果在一次审核中涉及多个来源部门时,系统支持自动将流程平行投送到多个部门。3.在审核流程流转过程中,某个审核节点完成审核动作后,系统应根据预选设计的审核流程模式,自动将审核事项流转到下一个审核节点,直至整个审核流程执行完成。4.审核时,支持审核者对申请者提交的字段范围进行筛选,以控制申请者可访问数据的字段范围;支持设置数据的筛选条件,以控制申请者可访问数据的内容范围,并支持多条件逻辑组合;支持设置数据资源的有效访问时段,以控制申请者可访问数据的时间范围,时间段的颗粒度可精细到一天;支持对特定字段启用加密和脱敏策略,以限制申请者查看信息明文。5管理和使用已申请的数据资源1.数据用户完成数据资源申请后,可查看所有已经发起的申请事项、已经办结(包括通过和拒绝)的申请事项。对于已经申请通过的数据申请,可每个数据资源的具体连接参数,以便连接和使用数据。2.只有流程全部通过并结束后,申请者才能获得数据资源的连接参数,使用数据时,系统应基于审核时获批的字段范围、筛选条件、访问时段、加密脱敏、有效源地址等策略,确保申请者在受控情况下连接并访问数据资源。6以部门视角管理数据资源1.针对各个职能部门,数据服务门户应提供特定部门的视角,展示本部门名下数据资源、数据标准等信息,可下钻查看具体详情,可查看数据溯源信息、包含的字段、数据预览、数据质量报告。2.可查看本部门与其他部门进行数据共享的总体情况,包括本部门向其他部门提供了哪些数据,其他部门从本部门获取了哪些数据,以及这些数据分别被用于哪些信息系统。3.对于需要本部门确认的数据标准内容,页面中应显示各项数据标准、数据模型的内容,部门管理员可以进行数据标准的在线确认。7以信息化主管视角监控数据整体运营状态1.针对信息化主管领导,数据服务门户应提供全校数据资产整体的运营服务状态监控界面。可从全局的角度查看当前数据仓库的建设情况:2.可展示全局数据资源概况,包括各项数据的来源部门、业务系统、数据体量、数据模型、代码表、编码规则、数据仓库的规模和数据体量、资源清单、累计申请次数等统计信息。3.可展示全局数据交换地图,显示每个部门提供数据和使用数据的情况及详情。4.可展示全局数据质量情况,显示全局数据质量的合格率,数据检查涉及的部门、正常/异常数据项、质量规则数量、监测的表对象数量、有问题的表、字段和数据项数量,并根据检测情况对各部门总体质量检测进行排序展示。5.具备“知识图谱”在线管理能力,基于同一个“知识图谱”管理界面进行全局数据资源的呈现、管理与查询,“知识图谱”可通过“星座模型”的表现形式展现数据资源以及上下游关系链路,至少包括数据资源来源部门、数据流向、使用部门、字段信息内容,可进行不少于三级的数据下钻,以获取关键更多的维度信息,如通过数据资源关联数据表,数据表关联数据字段、数据接口等信息,可在线进行数据资源查询,查询对象至少包括业务系统、数据表、部门,查询内容可基于“星座模型”进行联动更新。四、项目实施要求自项目启动开始至初验合格期间,项目经理、技术负责人必须驻场开发及实施。在项目实施期间,服务单位承诺的项目经理和关键技术人员未经用户同意不得随意调整,服务单位如中途更换项目经理,必须征得用户同意。服务单位必须无条件接受招标人的监督检查,并承担人员不足、不到位所导致的相关质量、进度等违约责任,采购人不支付项目经理等人的人工费等一切费用,由服务单位自行承担。(一)项目实施计划提供针对本项目的进实施计划,并满足以下要求:1、工期要求服务单位应按采购人的工期要求,完成系统的应用软件开发,系统的安装调测,系统初验,系统终验等。服务单位应提供详细的软件开发、安装调测等工期计划表,并经采购人认可。2、工程实施计划(1)服务单位应在技术建议书中,详细说明工程的组织及计划(包括详细的人员情况、组织、安排及工程实施方案)。(2)服务单位应列出详细的工程实施计划表,服务单位的工程实施计划表可采用电子表格形式,也可采用MSProject等图表方式补充表达。3、项目成员要求(1)项目团队组成要求项目团队人员配置科学合理、分工明确,至少应包括项目经理、技术负责人、需求人员、系统分析师、软件开发人员、测试人员、用户培训人员、实施人员、运行维护人员等角色,并按项目各阶段的实施进度情况配足团队人员,确保项目保质保量的完成建设。(2)项目组团队需保持稳定服务单位应承诺项目经理必须专职承担本项目工作,未经建设单位许可不得更换。服务单位应提出具体管理措施,以确保该承诺得到落实。在项目实施过程中,服务单位须按照建设单位的要求更换建设单位认为不合适的人员。(3)项目经理和技术负责人的要求服务单位应明确项目经理和技术负责人在本项目中的岗位职责,并明确项目经理和技术负责人调动相关资源的权力,以确保工程顺利实施。服务单位需承诺项目经理自始自终专职承担本项目,且具有高等学校信息系统软件项目经理从业经历,提供相关证明文件。根据项目建设工作的业务性质,服务单位应分别配备经验丰富的项目经理、技术负责人承担本项目工作。投标文件中指定的承担本项目的项目经理、技术负责人需在服务单位单位工作。(4)项目团队驻场人数要求服务单位在项目实施中应不少于3名人员驻场实施至项目验收。在建设期内,项目管理负责人应在接到学校通知2小时内到达学校现场处理问题或交流情况。(二)项目实施方案提供针对本项目的进度、质量、风险、例会制度等管理方案,由于本次招标是在现有实际运行的生产系统上进行软件功能优化与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省公务员考试试题及答案
- 2026年摩托车科目一测试题库附完整答案【夺冠系列】
- 2025年烟台黄金职业学院单招职业技能考试模拟测试卷附答案
- 2026年一级建造师之一建水利水电工程实务考试题库500道附完整答案【网校专用】
- 慢性肾炎患者的紧急情况应对
- 2026年口腔正畸学考试题库及完整答案(有一套)
- 2025年大学思想道德修养与法律基础期末考试题含完整答案【网校专用】
- 2026年国际商务英语一级考试练习题及参考答案【黄金题型】
- 宫颈癌的护理研究与创新实践
- 2026年哈尔滨应用职业技术学院单招(计算机)考试备考题库附答案
- 2026陕西省森林资源管理局局属企业招聘(55人)参考考试题库及答案解析
- 生物安全培训班课件
- 2025年南京市卫生健康委员会、南京市机关事务管理局部分事业单位公开招聘卫技人员备考题库附答案详解
- 2025年贵州省贵阳市检察院书记员考试试题及答案
- 2026年江苏医药职业学院单招职业技能测试题库及答案详解一套
- 2026届上海市六校生物高一上期末达标检测模拟试题含解析
- 2025年12月嘉兴海宁水务集团下属企业公开招聘工作人员3人笔试备考重点试题及答案解析
- 2025年卫生管理(副高)考试题库及答案
- 《战后资本主义的新变化》优教课件
- 人员罢工应急预案
- 小学道德与法治-认识居民身份证教学课件设计
评论
0/150
提交评论