大数据中心考核草案_第1页
大数据中心考核草案_第2页
大数据中心考核草案_第3页
大数据中心考核草案_第4页
大数据中心考核草案_第5页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融大数据中心考核草案一、数据开发部1.数据定义有逻辑模型和物理模型,并有建模说明,建模按照建模规范进行,模型标准和规范进行考核。建模规范、考核标准2.数据分类数据按照数据仓库行业标准并结合金融大数据中心实际内容指定标准分类,数据严格按照分类进行划分(例如:数据归类可划分当事人、产品、渠道、合约、机构、事件、活动、账务等)分类标准、考核标准3.元数据管理从以下几点进行考核:1)对数据仓库中的数据(包含来源以及数据仓库中产生的数据)进行描述,为了更好的推进和保证金融大数据中心建设和对外支持工作,特编写金融大数据中心考核草案,草案主要涉及到金融大数据中心数据开发部、应用开发部、 数据挖掘部, 各部门要明确相关部门主要的目标、策略、责任及考核最终落实到人;草案涉及到两部分,一部分是要求类,另一部分是考核类,要求类是日常设 计、开发或运维等工作中需要遵守且对中心内部比较重要的指标或事项,考核类主要是影响业务正常开展的相关指标,系统的不可用、 不及时、 不准确等对业务部门的工作造成了一定的影响,都属于本中心考核范畴;考核草案详情如下:精品资料相关人员可以查看。2) 统一记录好 etl 中调度时间、依赖、抽取内容、方式、方法等。3) 记录并检测系统数据的一致性,并能记录执行情况。4) 记录好 etl 数据清洗模型、转换模型、加载模型,相关信息入库。4. 数据标准主要针对指标的业务标准、技术标准。业务标准:对指标有明确的统计逻辑。技术标准:表、视图、索引、分区、文件、脚本、字段等符合规范,相同指标需要有统一的定义。业务标准、技术标准 (有了,看看是否需要完善)5. 数据质量1) 根据不同的业务需求和规则验证数据是否被正确地转化。2) 确保所有预期的数据加载到数据仓库中没有任何数据丢失和截断。3) 确保数据在规定和预计的时间框架内被加载到数据仓库中,以确认改进的性能和可扩展性。4) 预期数据被添加到目标系统5) 确认所有的数据库字段,字段数据加载没有任何截断6) 记录计数匹配的数据校验7) 被拒绝的数据的错误日志都有详细记录8) null 值字段9) 重复数据未加载10) 数据的完整性缺少数据质量衡量标准。6. 稳定性:每天 etl 调度的出错率需要在总任务量的10% 以内,出错要找出出错原因(例如:没有顺序执行、时间延迟、程序错误等),并上报给规划管理部进行记录备案,并纳入季度及年度部门及个人考核。7. 其它1) 脚本编写等需要有良好的数据库移植性,不适用特定数据库的特殊函数(使用 sql9.2 标准),便于后期不同的平台、系统、数据的移植。2) 安全性:系统的安全性要首先考虑,系统或数据仓库的设计要从网络安全、系统安全、数据安全方面充分考虑,对外数据支持需要走流程,规划管理部要进行审核。3) 数据分散与集中相结合:所有数据集中存储,数据仓库根据需要对外系统(中心外或中心内的应用系统)管理分别设置权限,不同的用户维护不同数据。二、应用开发部应用开发部主要涉及到应用程序或接口服务程序的设计、开发、优化、监控、运维等(例如 web 、app 、接口程序等 )工作,下面提出针对系统设计、开发或运维时需要考虑的部分指标,指标有待大家进行扩充和完善。1. 事务( transaction )在 web 中一个事务表示一个“从用户发送请求 -web server 接受到请求, 进行处理 - web server 向 db 获取数据 -生成用户的 object( 页面),返回给用户” 的过程,一般的响应时间都是针对事务而言的。支持事物个数:?2. 请求响应时间请求响应时间指的是从客户端发起的一个请求开始,到客户端接收到从服务器端返回的响应结束, 这个过程所耗费的时间, 在某些工具中, 响应通常会称为“ttlb ”,即timetolastbyte ,意思是从发起一个请求开始,到客户端接收到 最后一个字节的响应所耗费的时间,响应时间的单位一般为“秒”或者“毫秒”。公式为:响应时间网络响应时间+应用程序响应时间。标准可参考国外的3/5/10 原则:(1) )在 3 秒钟之内,页面给予用户响应并有所显示,可认为是“很不错的”;(2) )在 35 秒钟内,页面给予用户响应并有所显示,可认为是“好的”;(3) )在 510 秒钟内,页面给予用户响应并有所显示,可认为是“勉强接受的”;(4) )超过 10 秒就让人有点不耐烦了,用户很可能不会继续等待下去;3. 事务响应时间事务可能由一系列请求组成,事务的响应时间主要是针对用户而言,属于宏观上的概念,是为了向用户说明业务响应时间而提出的。各系统事物响应时间?4. 并发用户数并发一般分为 2 种情况。一种是严格意义上的并发,即所有的用户在同一时刻做同一件事情或者操作,这种操作一般指做同一类型的业务;还有一种特例, 即所有用户进行完全一样操作。各系统的并发用户数?5. 吞吐量指的是在一次性能测试过程中网络上传输的数据量的总和.吞吐量/传输时间 ,就是吞吐率 .6. tps (transactionpersecond )每秒钟系统能够处理的交易或者事务的数量.它是衡量系统处理能力的重要指标.7. 宕机率主要系统全年宕机时间=?8. 点击率每秒钟用户向web 服务器提交的 http请求数.这个指标是 web 应用特有的一个指标 :web应用是请求-响应模式, 用户发出一次申请 ,服务器就要处理一次,所以点击是web应用能够处理的交易的最小单位.如果把每次点击定义为一个交易 ,点击率和 tps 就是一个概念 .容易看出 ,点击率越大 ,对服务器的压力越大.9. 资源利用率1) 通用指标(指 web 应用服务器、数据库服务器必需测试项)指标说明processortime服务器 cpu 占用率,一般平均达到70% 时,服务就接近饱和memoryavailablembyte可用内存数,如果测试时发现内存有变化情况也要注意,如果是内存泄露则比较严重physicsdisktime物理磁盘读写时间情况2) web 服务器指标指标说明requestsper second ( avg rps )平均每秒钟响应次数总请求时间/ 秒数avgtime to last byteper terstion( mstes )平均每秒业务脚本的迭代次数, 有人会把上面那个混淆successfulrounds成功的请求failedrequests失败的请求successfulhits成功的点击次数failedhits失败的点击次数hitsper second每秒点击次数successfulhits per second每秒成功的点击次数failedhitsper second每秒失败的点击次数attemptedconnections尝试链接数3) 数据库服务器性能指标指标说明user0 connections用户连接数,也就是数据库的连接数量numberof deadlocks数据库死锁buttercachehit数据库 cache 的命中情况4) 系统的瓶颈定义性能项命令指标cpu 限制vmstat当%user+%sys超过 80% 时磁盘 i/o 限制vmstat当%iowait 超过 40%(aix4.3.3或更高版本 )时应用磁盘限制iostat当%tm_act 超过 70% 时虚存空间少lsps , -a当分页空间的活动率超过70% 时换页限制iostat,stat虚存逻辑卷 %tm_act 超过 i/o(iostat) 的 30% ,激活的虚存率超过cpu 数量 (vmstat) 的 10 倍时系统失效vmstat,sar页交换增大、 cpu 等待并运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论