数据脱敏工程师考试试卷及答案_第1页
数据脱敏工程师考试试卷及答案_第2页
数据脱敏工程师考试试卷及答案_第3页
数据脱敏工程师考试试卷及答案_第4页
数据脱敏工程师考试试卷及答案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据脱敏工程师考试试卷及答案一、填空题(每题1分,共10分)1.数据脱敏的核心目标是在保留数据______的同时,防止敏感信息泄露。2.常用静态脱敏技术包括替换、______、加密等。3.动态脱敏是在______过程中对敏感数据实时脱敏。4.个人身份信息(PII)属于______数据。5.脱敏后的数据需保持______一致性,避免影响业务测试。6.差分隐私通过添加______保护个体数据。7.脱敏规则制定需参考相关______,如GDPR、个人信息保护法。8.手机号脱敏通常保留前3位和后4位,中间用______代替。9.结构化数据脱敏常针对______、视图等对象。10.脱敏效果验证需检查敏感数据是否被替换及______是否正常。二、单项选择题(每题2分,共20分)1.以下属于静态脱敏的是?A.脱敏后数据存储到新表B.实时查询时脱敏C.脱敏后数据可还原D.仅针对非结构化数据2.差分隐私中ε越小,隐私保护程度?A.越高B.越低C.不变D.无关3.以下不属于敏感数据的是?A.身份证号B.银行卡号C.住址D.商品价格4.动态脱敏的适用场景是?A.数据备份B.实时业务查询C.数据归档D.测试数据生成5.脱敏中“屏蔽”技术通常用于?A.替换敏感值B.添加噪声C.隐藏部分字符D.打乱数据顺序6.处理敏感个人信息需取得个人______同意?A.一般B.明示C.默示D.口头7.可保留数据分布特征的脱敏方法是?A.差分隐私B.完全替换C.屏蔽D.删除8.姓名脱敏常用方法是?A.加密B.替换为假名C.删除D.屏蔽前2字9.脱敏规则管理不包括?A.规则创建B.规则生效C.规则审计D.数据加密10.属于非结构化数据脱敏的是?A.数据库表脱敏B.身份证号替换C.PDF中文本脱敏D.视图脱敏三、多项选择题(每题2分,共20分)1.数据脱敏基本原则包括?A.可用性B.隐私性C.一致性D.可还原性2.常用敏感数据类型有?A.生物识别信息B.健康信息C.金融信息D.个人联系方式3.静态脱敏特点是?A.脱敏后数据不可还原(部分)B.适用于测试数据C.实时处理D.存储前脱敏4.动态脱敏优势是?A.脱敏后长期存储B.不改变原始数据C.实时响应D.无需规则配置5.脱敏效果验证维度包括?A.敏感数据泄露检测B.业务逻辑一致性C.数据格式有效性D.性能影响6.属于脱敏技术的有?A.替换B.不可逆加密C.差分隐私D.数据压缩7.处理敏感个人信息的合法情形包括?A.取得明示同意B.公共利益新闻报道C.仅内部统计D.法规规定的其他情形8.非结构化数据脱敏难点是?A.格式多样B.规则简单C.语义识别难D.分布不规则9.脱敏项目实施步骤包括?A.需求分析B.规则设计C.脱敏执行D.效果验证10.需要数据脱敏的场景是?A.数据共享B.测试环境数据C.数据分析D.原始数据存储四、判断题(每题2分,共20分)1.数据脱敏等同于数据加密。(×)2.静态脱敏后的数据可直接用于生产环境。(×)3.差分隐私ε值越大,隐私保护越好。(×)4.脱敏规则需随业务和法规调整。(√)5.非结构化数据脱敏无需考虑语义。(×)6.动态脱敏不改变原始数据存储。(√)7.所有敏感数据都需完全删除。(×)8.脱敏验证仅需检查敏感数据是否被替换。(×)9.脱敏后的数据需符合业务需求。(√)10.脱敏技术仅适用于结构化数据。(×)五、简答题(每题5分,共20分)1.简述数据脱敏的核心目标。答案:平衡数据可用性与隐私保护:①保留业务价值(格式、统计分布),满足测试、分析需求;②防止敏感信息(PII、金融数据)泄露,符合法规(GDPR、个人信息保护法);③避免合规风险、商业损失及个人权益侵害。2.静态脱敏与动态脱敏的主要区别?答案:①处理时机:静态在存储前,动态在访问时;②存储:静态生成副本,动态不改变原始数据;③场景:静态适用于非实时(测试、归档),动态适用于实时查询;④可逆性:静态通常不可逆,动态依赖原始数据可恢复。3.简述差分隐私的基本原理。答案:通过向数据添加随机噪声,使攻击者无法区分单个个体数据变化。满足“ε-差分隐私”:任意两个仅差一个个体的数据集,同一查询输出的概率差异≤ε(ε越小,保护越强)。如统计患病人数时加噪声,无法定位具体个体。4.如何设计脱敏规则?答案:①需求分析:明确业务场景、敏感数据类型、法规;②数据分类:识别结构化/非结构化敏感字段;③规则匹配:针对字段选技术(身份证替换、手机号屏蔽);④一致性验证:确保格式、业务逻辑一致;⑤规则审计:记录变更,满足合规。六、讨论题(每题5分,共10分)1.大数据分析中如何平衡脱敏与分析准确性?答案:①选差分隐私(可控噪声,不破坏分布)或k-匿名(分组泛化);②差异化规则:核心统计字段(年龄范围、消费区间)减少脱敏强度;③验证:对比原始与脱敏数据的统计指标,控制偏差;④优先保护高敏感数据(身份信息),非敏感统计数据适度脱敏。2.非结构化数据脱敏的难点及解决思路?答案:难点:格式多样(PDF、文本)、语义识别难、结构不规则。思路:①用NLP(NER)识别敏感实体;②开发专用工具(PDF脱敏器、文本解析模块);③建敏感实体库;④脱敏后语义验证,确保可读性;⑤补充人工审核未识别的敏感信息。答案汇总一、填空题答案1.可用性2.屏蔽3.数据访问4.敏感5.格式/业务逻辑6.噪声7.法规8.星号/9.表10.业务流程二、单项选择题答案1.A2.A3.D4.B5.C6.B7.A8.B9.D10.C三、多项选择题答案1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论