数据脱敏解决方案介绍_第1页
数据脱敏解决方案介绍_第2页
数据脱敏解决方案介绍_第3页
数据脱敏解决方案介绍_第4页
数据脱敏解决方案介绍_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据脱敏解决方案介绍目 录010203040506背景介绍数据脱敏介绍数据脱敏产品脱敏方案介绍产品演示互动答疑安全事件回顾2018年6月 暗网有195万用户求职简历被叫卖,前程无忧确认部分用户账户密码被撞库。2018年6月 圆通有近10亿条用户信息以1比特比的价格在暗网上兜售2018年8月 华住有2.4亿入住记录泄露,泄漏数据还包含了身份证号、家庭住址、银行卡号2018年8月 顺丰有3亿条用户信息以2比特比的价格在暗网上兜售2018年6月 AcFun弹幕视频网发出公告称,有800-1000万左右的用户数据被黑客窃取行业监管要求4第二十四条(数据安全)银行业金融机构应当 建立数据安全策略与标准,

2、依法合规采集、应 用数据,依法保护客户隐私,划分数据安全等 级,明确访问权限,监控访问行为,完善数据 安全技术,定期审计数据安全。第二十八条(自我评估机制)银行业金融机构应当建立数 据治理自我评估机制,明确评估周期、流程、结果应用、 组织保障等要素的相关要求。评估内容应覆盖数据治理架 构、数据管理、数据安全、数据质量和数据价值实现等方 面,并按年度向银行业监督管理机构报送。商业银行内部控制 指引第一百零二条, 要求严格保护客户隐 私信息。关于应用安全可控 信息技术加强银行业 网络安全和信息化建 设的指导意见加强银行卡信息安 全防护工作的通知做好个人金融信息 保护工作的通知中国银监会办公厅 关于

3、银行业金融机构 客户个人信息泄漏案 件风险提示的通知银行业金融机构数据治理指引 2017年发布证券/期货/基金行业法律法规第十五条核心机构和经营机构应当具有防范木 马、病毒等恶意代码的能力,防止恶意代码对信息系 统造成破坏,防止信息泄露或者被篡改。第三十条核心机构和经营机构应当加强信 息安全保密管理,保障投资者信息安全。证券期货业信息安全保障管理办法证券基金经营机构信息技术管理办法2018年发布第二十一条 证券基金经营机构应当建立独立于生产 环境的专用开发测试环境,避免风险传导;开发测 试环境使用未脱敏数据的,应当采取与生产环境同 等的安全控制措施第三十一条 证券基金经营机构应当完善网络隔离、

4、 用户认证、访问控制、数据加密、数据备份、数据 销毁、日志记录、病毒防范和非法入侵检测等安全 保障措施,保护经营数据和客户信息安全,防范信 息泄露与损毁。目 录010203040506背景介绍数据脱敏介绍数据脱敏产品脱敏方案介绍产品演示互动答疑数据安全保护有哪些方式?数据库防水坝数据库准入数据库审计数据库防火墙数据脱敏数据加密敏感数据数据加密数据脱敏三权分立数据分类分级离线 敏感数据开发测试 数据什么是数据脱敏?假身份无敏感关键信息个人信息关联信息特定规则数据脱敏是数据安全技术之一;脱敏后的数据呈现形式是:克隆一份“真实”的假数据Data Masking数据脱敏是指对某些敏感信息通过脱敏规则进

5、行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户 安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用, 如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。数据脱敏应用场景04.数据共享当我们需要利用第三方机构的数据分 析和处理能力来增加数据的价值时, 需要满足监管机构的要求03.数据交换交易处于边界的交换系统直接接触生产数 据风险巨大数据上报过程很可能涉及隐私数据数据交易的过程中对隐私数据脱敏从 而合规01.开发、测试使用数据最频繁的场景每次对数据都有不同的需求对数据原始特征和数据之间的逻辑关 系非常敏感02.大数据平台大数据平台接

6、入的数据中一般包括很 多用户的隐私和敏感信息由于大数据业务的特殊性,无法通过 传统的加密或权限控制来保护数据有哪些敏感数据?客户资料商务合同信贷记录银行卡号北京市朝阳区康乐新村26幢 1单元202010-60641508186 0581 个人身份信息隐私敏感信息2015别克英朗白色北极项目报价99万行业数据帐号密码账户资金买入卖出机构帐号交易记录银行关联号传统方式如何做数据脱敏?生产数据生产数据副本数据脱敏的关键点数据源关系型数据库大数据平台文件消息队列脱敏规则丰富的算法数据处理粒度仿真保持数据原始业务特征保持数据之间的关联性保持数据之间逻辑一致性业务依赖数据对象同步处理效率单台设备性能最大化

7、支持分布式目 录010203040506背景介绍数据脱敏介绍数据脱敏产品脱敏方案介绍产品演示互动答疑数据源适配能力数据库数据仓库文件大数据分布式平台Oracle,Mysql,SqlTeradataTxtHdfs(orc)server,DB2、GreenplumExcelHiveSybase、InformixGbase 8ACsvImpalaOracle rdb,PostgreSQL,达梦数据库南大通用GBASE 8T、 KingbaseEs ,JsonDICOM文件Dbf格式文件Dmp备份文件Del备份文件KafkaMariadb ,intersystems CacheDMP文件脱敏备份生产数

8、据DMP文件抽取分发目标端脱敏过程中 数据不落地DMP获取方式:通过选择ftp远程获取dmp文件;本地通过ftp上传到脱敏服务器;直接页面上传方式加载dmp文件优势:1、隔离生产系统、确保生产安全隔离脱敏平台访问生产数据库账户密码变更问题作业消耗海量生产资源2、无需改变日常工作模式3、安全完备的数据分发4、适应非现场测试DICOM文件脱敏医学影像文件中除图片信息外,还包括患者信息(拼音姓名、出生年月、ID)及图片信息(图像宽、高、 数据传输格式等),其中患者信息为敏感信息,需要经过脱敏处理。数据脱敏脱敏算法:遮盖/随机数据仿真能力:保持数据原始业务特征姓名类型证件李军0133050119840

9、9130816张磊02北1501270王宏03G32732811姓名类型证件张三01330105198201011517李四02京01068435王五03G18774611脱敏后姓名证件李磊北1501270王宏G32732811姓名证件张四京01068435王五G18774611脱敏后特征脱敏一个字段内包括身份证、军官证和护照等数据集合时,支持按照不同的数据特征采取不同的 脱敏规则进行脱敏。依赖脱敏支持有依赖字段的敏感信息脱敏(如字段“用户证件”的值包含身份证、军官证、护照等, 通过依赖字段“证件类型”可进行判断)

10、。数据仿真能力:保持数据原始业务特征姓名备注李浙江省杭州市西湖区丰潭路508号张北京海淀区丰台小区2幢2单元508室王上海市浦东新区南京路3203号姓名备注张北京丰台区祥云小区13幢5单元304室李上海市徐汇区丽水路38号王江苏南京朝阳街道幸福里小区12幢脱敏后支持多域类型的敏感信息脱敏(将多种类型的敏感数据拼装成一个字符串进行存储,例如:联系方式中的手机号码 与固定电话。混合列处理数据仿真能力:保持数据之间的关联性常见的数据关联性包括两表

11、数据关联性和跨库数据关联性,该类敏感信息经过脱敏处理后,其关联性仍旧 保留。编号身份证号出生日期姓名100133052119870217462619870217张一山100237078219650816137x19650816王小雨100311036319780421342219780421张驰身份证交易日期金额330521198702174626201503057200.0037078219650816137x201508144000.00110363197804213422201412239000.00表1:用户信息表表2:用户交易信息表表2:用户交易信息表表1:用户信息表脱敏前数据脱敏后

12、数据脱敏后编号身份证号出生日期姓名100141082519880412293819880412李雄100233048119790119121x19790119汪明全100342081719880910283119880910吴祥身份证交易日期金额410825198804122938201503057200.0033048119790119121x201508144000.00420817198809102831201412239000.00数据仿真能力:保持数据间逻辑一致性姓名身份证号出生日期李军3305211984091308161984/09/13张磊3306211991101007161

13、991/10/10王宏3304041988011317011988/01/13脱敏前数据脱敏后数据不同数据之前可能存在逻辑一致性,常见的如身份证信息中的出生年月和用户的生日信息保持一致、省份 信息和城市信息的一致性等。该类信息脱敏后,其逻辑一致性保留,能够支持业务应用的数据使用和操作。脱敏后姓名身份证号出生日期张三3301051982010115171982/01/01李四3422211990050320811990/05/03王五3301051991052523271991/05/25数据仿真能力:业务依赖数据对象同步表结构数据库对象主/外键索引约束触发器存储过程同步OracleSQL Se

14、rverMySQL脱敏规则适配能力:丰富的算法算法名称算法说明示例固定映射通过设置映射种子,在映射种子不变的情况下,相同原数据脱敏后结 果相同,并保留原始业务特征映射种子:111 原数据:张三一次脱敏结果:李四 二次脱敏结果:李四随机映射对数值、字符或字符串进行随机,并保留原业务特征原数据:19841222 脱敏结果:19900211遮盖通过设置遮盖符,对原数据全部或部分进行遮盖处理遮盖符:*原数据敏结果:135*5678范围内随机对日期或金额,在一个指定的范围内进行随机,并保留原业务特征范围1000至9999原数据:38472.00 脱敏结果:8394.00浮动对日

15、期或金额,上浮或下降固定值或百分比,并保留原业务特征上浮、下降5% 原数据:1000.00脱敏结果:1049.00归零对于数值,清空并置为0.00原数据:381.38 脱敏结果:0.00截取对字符串按照起始位置进行截取开始位置:2,结束位置6 原数据:abcdefghijk脱敏结果:bcdef截断对字符串保留除起始位置意外的内容开始位置:2,结束位置6 原数据:abcdefghijk脱敏结果:aghijk脱敏规则适配能力:数据处理粒度姓名证件李军先磊先生北1501270王宏女士G32732811复杂数据预处理:对于复杂数据进行分段预处理,从而将敏感信息识

16、别出来并进行脱敏,最后将其余部分 进行还原脱敏前数据脱敏后数据脱敏后姓名证件张三先四先生京01068435王五女士G18774611敏感数据支持最小分段脱敏:对于敏感数据的脱敏,往往需要根据实际场景做不同的处理,以常见的姓名 脱敏为例,在测试场景,用户不关心数据的真实性,往往整体随机生成一个姓名;而在个人身份识别场景, 会对姓名的中间字或名进行遮盖处理(张*)。因此系统是否支持对于敏感数据进行最小化分段就显得尤为重要。例如:身份证可以分为地址码(省)、地址码(市)、地址码(区)、出生日期码(年)、出生日期码(月)、出生日期码(日)、顺序码。脱敏处理效率:

17、单台设备处理性能最大化数据源数据库json文本文件固定宽度文件备份文件HIVE数据目标数据库json文本文件固定宽度文件备份文件HIVE源 适 配 层通 用 处 理 层目 标 适 配 层流式处理引擎脱敏处理效率:支持分布式支持集群方式服务器集中进行数据脱敏服务,在客户端看来就像是只有一个 服务器。集群可以利用多个计算机进行并行计算从而获得很高的计 算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了 整个系统还是能正常运行。支持多台单机部署方式多台单机部署按照业务不同需求,配置不同数据脱敏设 备进行脱敏设备,保证脱敏保证业务独立性。目 录010203040506背景介绍数据脱敏介绍数据脱敏产品脱敏方案介绍产品演示互动答疑招商证券数据脱敏安全案例数据量较大,脱敏速度较慢招商证券现有核心系统数据量达到了10T以上,采用传统 的方式脱敏,速度非常缓慢。生产与开发测试平台隔离数据安全合规需求符合网络安全法,证券期货业信息系统运维管理规 范、证券公司网上证券信息系统技术指引以及证券 基金经营机构信息技术管理办法生产网与开发测试网隔离,无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论