版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DB15内蒙古自治区市场监督管理局发布I 1 1 1 2 2 3 3 5 6 7 9 科技有限公司、内蒙古跃晨科技有限公司、内蒙古纵横云技术有限大数据平台接入技术要求本标准规定了大数据平台与各数据提供单位管理支撑系统进行数据接入的技术要求及数据采GB/T29262信息技术面向服务的体系结构(SOA)术语GB/T35274信息安全技术大数据服务安全能GB/T37973信息安全技术大数据安全管理b)多样性variety:数据可能来自1FTP:标准的文件传输协议(FileTransferProJDBC:java数据库连接(JavaDataBaseConneHTTPS:超文本传输安全协议(HyperTextTransferProtocoloverSecureSocketLayer或HypertextTransferProtocolSecu2b)服务网关服务;数据源管理信息FTP服务流数据关系数据库接口数据管理信息大数据平台数据源管理信息FTP服务流数据关系数据库接口数据管理信息数据接入服务数据仓库关系数据库抽取服务网关服务结构化数据存储半结构化数据存储非结构化数据存储文件接收FTP服务文件拉取FTP服务实时消息队列直报系统关系数据库抽取应提供管理信息系统关系数据库中的结构化数据到大数据平台数据存储的定时批b)支持“全量”和“增量”两种数据抽取模式;“全量”模式是指一次性将关系数据库中物理c)支持关系数据库中结构化数据抽取到大数据平台,包含结构化数据存储、半结构数据存储、非3固定时间间隔运行、指定时间点运行、指定时h)应提供完善的监控机制,运行过程中出现异常可快速的定位及解决。b)数据抽取吞吐量:在千兆带宽的网络条件关系数据库大数据平台关系数据库大数据平台大数据平台关系数据库抽取a)抽取元数据信息b)配置数据传输任务c)配置数据传输任务运行策略d)平台运行数据传输任务,数据抽取应用场景描述如下:d)关系数据库抽取服务运行数据传输任务,从数据源的数据库抽取数据到平台4a)关系数据库抽取服务适用于关系数据库定时批量抽取场景,详细说明参见b)数据源须提供关系数据库的访问链接c)数据源提供的数据库访问用户应具备数据库的元数据信息定义a)支持接入Webservice、RESTfu管理信息系统大数据平台管理信息系统大数据平台大数据平台服务网关服务a)提供接口信息b)接口编排c)配置数据传输任务运行策略d)平台运行数据传输任务,数据抽取5应用场景描述如下:c)服务网关服务配置数据传输任务运行策略,包括运行的开始时间、结束时间d)服务网关服务运行数据传输任务,从a)应提供分布式消息队列的管理功能,支持消息主题的创建g)具备完善的日志审计能力,可以记录消息发送和消费时6大数据平台实时消息队列大数据平台大数据平台实时消息队列大数据平台管理信息系统a)申请实时消息队列服务b)创建消息主题返回消息配置信息c)业务系统开发业务处理程序,发送或接收消息c)管理信息系统应依照大数据平台提供的实时消息队列采集接口完成自身数据发送或接收接口文件接收FTP服务应提供外部系统文件数据的接收并存入到大数据平台数据仓库的功能。文件采集f)支持图形管理功能,支持认证配置、文件目标位置7管理信息系统大数据平台文件接收FTP服务a)分配业务系统ftp账号e)业务系统发送数据到大数据平台g)业务系统发送数据校验文件f)大数据平台接收文件数据g)大数据平台接收校验文件h)大数据平台校验内容i)数据平台按配置的规则存储接收到的数据文件j)大数据平台回写数据存储状态管理信息系统大数据平台文件接收FTP服务a)分配业务系统ftp账号e)业务系统发送数据到大数据平台g)业务系统发送数据校验文件f)大数据平台接收文件数据g)大数据平台接收校验文件h)大数据平台校验内容i)数据平台按配置的规则存储接收到的数据文件j)大数据平台回写数据存储状态大数据平台b)业务系统通过标准FTP协议连接大数据平台服务c)业务系统检查目标临时文件是否存在d)业务系统发起全量或续传命令k)业务系统获取数据存储状态8a)管理信息系统须在大数据平台注册并b)管理信息系统须按平台协议规范开发上传功能;c)管理信息系统生成文件数据时须同时生成对应的d)具体文件接收FTP服务API接口参见附录D.1,具体实现逻a)支持顺序型断点续传功能,支持外部文件存储断点续传能力的自动识别f)支持指定目标文件存储位置、文件名,提供文件类型转换规则,支h)支持定时轮询文件采集,采集新增的文件,支持文i)支持图形管理功能,支持FTP连接配置、文件源配置、文件目传输规则配置、文件同步/异步传输规则配置、文件传输并行度配置、文件定时及实时策略配9管理信息系统大数据平台文件拉取FTP服务管理信息系统大数据平台文件拉取FTP服务大数据平台a)将业务数据写入指定的文件区域b)分配ftp账号c)配置FTP协议的数据采集服务d)运行基于FTP协议的数据采集服务据平台数据仓库a)管理信息系统应提供初始文件存储位置并将业务数据写入到文b)管理信息系统搭建FTP服务并为大数据平台分配FTP账号c)大数据平台全量文件采集提供基于FTP协议的采集任务配置,包括:存储文件位置、采集文件、列表方式、是否文件校验、存储目标位置及文件存储命名规c)管理信息系统生成文件数据时须同时生成对应的d)具体文件拉取FTP服务API接口参见附录E.1,具体实现逻b)支持用户仅能同时登录一次功能;c)支持模板管理功能,应具备模板的新增、删除、修改f)应具备熔断管理机制,保证服务整体可用,是直报系统访问异常情况下的数据接入单位大数据平台数据接入单位大数据平台大数据平台a)打开浏览器b)访问直报系统在线注册c)用户审批d)分配权限及下发模板下载模板e)根据模板填写数据f)上传数据文件d)审批通过后为注册用户分配权限并根据业务需求数据接入单位用户上传请求后进行数据格式校验,a)对信息化建设较弱且有计算机基本操作知识的数据接入单位安全要求须满足GB/T35274规范中“数据服务安全要求”。2.配置数据源3.配置任务开始2.配置数据源3.配置任务开始1.配置执行器是否立即执行否是否立即执行否4.配置作业5.立即执行传输6.作业调度配置与执行结束5.立即执行传输6.作业调度配置与执行结束7.执行日志查看a)大数据平台配置执行器,用于作业调度执g)配置数据源,分别配置源数据库及目标数据库。根据业务源端的数据库的IP、端口、实例i)配置作业,根据抽取任务执行的先后顺序配置成作业;j)立即执行传输,手动开启作业输立即执行;l)执行日志查看,提供作业执行结果信息查看,包括作业开始执行时间、结束时间、运行时长、2.服务编排开始通过大数据平台的服务网关服务提供的Web界面进行操作。首先服务网关通过服务编排进行接口的编排,生成新的数据接口进行调度发布。服务网关服务应用流程见图2.服务编排开始1.登记接口信息3.调度发布2.大数据平台创建相应的消息队列主题开始管理信息系统通过Java代码开发方式调用大数据平台提供的实时消息队列API接口,往消息队列主2.大数据平台创建相应的消息队列主题开始1.大数据平台与管理信息系统方约定消费队列主题名称3.管理信息系统应用方开发程序调用大数据平台实时消息队列API,封装数据发送消息3.管理信息系统开发程序调用大数据平台实时消息队列API,封装数据往消息队列主题中发送消1Integerport,Stringusern2publicbooleanupload3publicbooleanCreateDirecroty(String管理信息系统在生成好文件后,编写代码实现上传文件到大数据平台的FTP服务中,调用服务示例publicvoidinitFtpClient(Stringhostname,Integerport,Stringusername,StringpaftpClient.setControlEncoding("ftpClient.connect(hostnftpClient.login(username,intreplyCode=ftpClSystem.out.println("connectfailed...ftp服务器:"+this.hostnam}}publicbooleanuploadFile(Stringpathname,StringfileNamSystem.out.println("开始上ftpClient.setFileType(FTP.BINARY_CreateDirecroty(patftpClient.makeDirectoryftpClient.changeWorkingDirectorftpClient.storeFile(fileName,iSystem.out.println("上传文System.out.println("上传文}}}}}publicbooleanCreateDirecroty(Stringremote)throwsIOE//如果远程目录不存在,则递归创建远}Stringpaths="";StringsubDirectory=newString(remote.substring(start,end).getBytes("GBK"),"iso-8859-1"changeWorkingDirectory(suSystem.out.println("创建目录["+schangeWorkingDirectory(su}changeWorkingDirectory(su}}}}}1username,Stringpass23CreateDirecroty(StringrpublicvoidinitFtpClient(Stringhostname,Integerport,Stringusername,StringpaftpClient.setControlEncoding("ftpClient.connect(hostnftpClient.login(username,intreplyCode=ftpClSystem.out.println("connectfailed...ftp服务器:"+this.hostnam}}publicbooleandownloadFile(Stringpathname,StringfbooleanchangeFlag=ftpClient.changeWorkingDirectory(patSystem.err.println("changeFlag=="+chftpClient.enterLocalPasftpClient.setRemoteVerificationEnabledString[]a=ftpClient.lisFTPFile[]ftpFiles=ftpClient.listFios=newFileOutputStream(lftpClient.retrieveFile(file.get}}System.out.println("下载文System.out.println("下载文}}}}}}publicbooleanCreateDirecroty(Stringremote)throwsIOExcep//如果远程目录不存在,则递归创建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 无欲无求心态的神经科学基础-洞察与解读
- 基于AI的文化差异感知与受众心理分析-洞察与解读
- 印堂穴与面部健康的关系研究-洞察与解读
- 生物成像药物的临床前评估-洞察与解读
- 资源受限环境下自适应DTN路由算法的创新与实践
- 社交化健身与心理健康研究-洞察与解读
- 三维可视化技术在扁桃体异物检测中的创新应用-洞察与解读
- 环境因素驱动的金融风险评估与应对机制-洞察与解读
- 桥梁施工绿色施工标准制定与实施-洞察与解读
- 数据科学与人工智能结合的人才需求预测-洞察与解读
- 建筑节能工程质量检测
- 工程钢筋工管理制度
- 第11课 依法从事民事活动
- 防化兵基础知识
- (下)开关电源42项测试之-白盒测试类常规测试类
- ERP知识手册可编辑范本
- IEC 62368-1标准解读-中文
- 绿色废弃资源分类回收
- DBJ04∕T 253-2021 建筑工程施工安全管理标准
- 新生儿肺炎诊疗及护理考核试题
- MOOC 互联网创新创业中知识产权素养培养-福州大学 中国大学慕课答案
评论
0/150
提交评论