版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
37Publicdataopening—Part2:DataprocessingguidI 2 2 2 2 2 2 3 3 3 4 4 4 4 4 6 7本文件按照GB/T1.1—2020《标准化本文件是DB37/T3523《公共数据开放》的第2部分。DB37/T3523已经请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。——2019年首次发布为DB37/T35印发《山东省公共数据开放办法》(省政府令第344号)、《山东省公共数据开放工作细则》(鲁数发一系列政策文件,对全省公共数据的开放和使放评价指标、核心元数据、开放数据使用等工作中存在的问题,结合本省实际,制定DB37/T——第4部分:核心元数据。目的在于规范公共数据开放中核心元数1公共数据开放第2部分:数据处理指南GB/T36344信息技术数据质量评价GB/T45574数据安全技术敏感个人信息处理安全要求DB37/T3523.1公共数据开放第1部分:基DB37/T3523.3公共数据开放第3部分:开放DB37/T4646.2公共数据数据治理规范第2部分:数据清洗数据脱敏datadesensit从原始环境向目标环境进行敏感数据(3.1)交换时,通过一定的方法向数据中植入水印标记,同隐私保护计算privacy-preservin注:隐私保护计算的数据在产生、存储、计算、应用、销毁等24总则4.1宜确保数据处理后的安全可控性,经数据处理后,公共数据利用主体获取满足使用需求的原始数据信息,且原始数据中敏感信息已被移除,无法还原敏感数g)保持唯一性。4.3宜确保数据处理工作的高效经济性,通过程序自动化实现数4.5宜确保数据处理工作的可配置性和灵活性,按照输入条件不同生成不同的处理结果,按照数据使用场景选择数据处理方法,为公共数据利用主体提供不同公共数据开放中数据清洗比对是对开放数据进行数据探查、a)数据探查:对开放数据的数据库表结构、数据字典等进行探查,形成数据探查清单。b)数据质量检查:按照GB/T36344中数据质量评价指标制定数据检查规则,并根据数据质量检d)数据转换:对通过数据质量检查和问题数据修正的开放数据进行数据格式转换和代码转换等。公共数据开放中数据清洗比对的处理规则宜参考DB37公共数据开放中数据脱敏是在开放数据中移除敏感数据,并且确保移除敏感数据后的开放数据无33)识别开放数据在汇聚、关联分析等操作过程中可能产生的敏感数1)根据公共数据分类分级情况,标识开放数据中敏2)开放数据中敏感数据识别方法不宜删除和篡d)选择脱敏方法:依据开放数据脱敏场景和处据脱敏规则,并对常用开放数据脱敏规则进行固化,避免重复定2)脱敏规则制定降低对业务系统的影响,且不存储原始数据。等相关法规、行业监管规范或标准,个人敏感信息安全符4)数据结构和统计特征是否存在敏感性;c)执行水印操作:根据已确定的开放数据水印规则执行添加水印操作。47.2处理规则7.2.1公共数据开放中开放数据水印主要包括以下处理规则。a)无痕:在开放数据中随机嵌入不可见字符,改变数据形态,不影响开放数据的展示。b)改行:对符合敏感类型的一行或多行进行数据更改,更改后的开放数据保持与原开放数据同样的类型和格式。c)伪行:在开放数据库表增加非真实数据元组,即增加的行数是伪造出来的,与原始开放数据类似的数据,并在增加的数据元组中嵌入可提取的水印规则信息。d)伪列:伪造新的属性列,包括数据属性列和类型属性列,生成的伪列宜和该关系表的其他属性相关,不易被察觉,然后将水印规则嵌入至伪造新列中。7.2.2对于发生泄露的开放数据,宜通过导入泄漏的开放数据样本或者文件到水印系统,解析出水印信息并确定泄露源,进行溯源定责。8隐私保护计算8.1处理流程数据可用不可见”的效果,宜按照如下流程开展隐私保护计算。a)数据对接:公共数据开放主体对接开放数据需求,明确提供数据的开放属性,识别确认不予开放数据。b)节点分配:公共数据开放主体选择隐私保护计算数据技术框架(见8.2),按照确定的隐私保护计算节点软件部署方案部署隐私保护计算节点。c)数据接入:公共数据开放主管部门通过隐私保护计算平台接入开放数据资源,公共数据利用主体通过隐私保护计算平台接入内部数据资源。d)模型部署:公共数据利用主体在隐私保护计算节点创建部署开放数据隐私保护计算模型,并发布服务模型。e)计算实施:公共数据利用主体根据已发布服务模型实施计算并获取相应结果。f)效果评估:公共数据利用主体定期反馈数据利用中发现的各类数据安全风险和质量问题等情况、数据利用成果与效益产出情况至公共数据开放主管部门和公共数据开放主体,公共数据开放主体根据反馈情况持续优化开放数据隐私保护计算规划。8.2技术框架公共数据开放中隐私保护计算主要包括以下技术框架。a)多方安全计算:利用隐私数据参与保密计算,在参与者在不泄露各自隐私数据情况下,共同完成某项计算任务,适用于性能和规模要求都较高的建模场景。b)联邦学习:实现在本地原始数据不出库的情况下,通过对中间加密数据的流通与处理来完成多方联合的机器学习训练,适用于安全性要求高的场景。c)可信执行环境:通过软硬件方法在中央处理器中构建一个安全的区域,保证其内部加载的程序和数据在机密性和完整性上得到保护,适用于有复杂计算需求的场景。9数据处理评价改进9.1宜定期开展开放数据处理评价,评价过程主要包括:5a)组建开放数据评价团队,制定开放数据处理评价总体要求;b)明确评价范围,包括但不限于应用场景、技术应用、工具技术、执行人员等;宜根据数据处理评价结果,对公共数据开放
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络服务优化质量保障承诺书6篇
- 市场营销活动策划及执行指南
- 电力设施故障紧急抢修预案供电公司预案
- 金融业务保障承诺书9篇
- 协同团队默契保证承诺书7篇范文
- 雨课堂学堂在线学堂云《教育定量研究方法(北京师范)》单元测试考核答案
- 企业内审自查清单模板及使用说明
- 家庭服务保证内容承诺函4篇
- 鼻音口腔市场部工作要求制度
- 企业固定资产盘点与验收操作手册
- 2026广东茂名市化州市村(社区)后备干部选聘321人笔试备考题库及答案解析
- 2026年江西省行政执法人员综合法律知识考试题库及答案
- 2025年浙江长征职业技术学院单招职业适应性考试题库带答案解析
- 2026年经济学专业知识考试试题及答案
- 2025年河北省邯郸市检察院书记员考试试题及答案
- 二次设备基本知识课件
- 陪玩内部制度规范要求
- 2026年时事政治测试题库100道附答案【满分必刷】
- 2026年销售精英招聘面试问题集
- 国家安全政治安全课件
- 义务教育道德与法治课程标准日常修订版(2022年版2025年修订)
评论
0/150
提交评论