版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年数据脱敏加密培训试卷及答案解析一、单项选择题(每题2分,共30分)1.某金融机构在测试环境中使用生产数据,以下哪种做法最符合《个人信息保护法》对“最小必要”原则的要求?A.直接复制全量生产库,仅对姓名做简单掩码B.仅抽取10%样本,并对身份证号、手机号、地址实施可逆加密C.仅抽取10%样本,并对身份证号、手机号、地址实施不可逆脱敏D.将生产库完整复制到测试库,再通过防火墙隔离访问答案:C解析:最小必要原则要求“最少数据+最强脱敏”。不可逆脱敏确保测试环境无法还原真实信息,10%样本进一步降低风险。2.在K-匿名模型中,当K=5时,以下哪条记录会导致隐私泄露?A.等价组大小为6,敏感属性值完全相同B.等价组大小为5,敏感属性值均不同C.等价组大小为4,敏感属性值均不同D.等价组大小为5,敏感属性值出现2种,其中一种占比80%答案:C解析:K=5要求每个等价组至少5条记录,大小为4即不满足K-匿名,攻击者可直接定位。3.使用格式保持加密(FPE)对16位银行卡号加密,密文长度应为:A.8字节B.16字节C.32字节D.与明文长度相同答案:D解析:FPE核心特性是“格式不变”,密文长度与明文严格一致。4.差分隐私中,对同一查询连续添加独立随机噪声,隐私预算ε的消耗规律是:A.线性累加B.指数累加C.平方累加D.不消耗答案:A解析:差分隐私的组合定理指出,多次查询的ε线性累加,总隐私损失为各次ε之和。5.在数据脱敏项目中,以下哪项不属于“可逆脱敏”技术?A.基于AES-256的格式保持加密B.基于RSA的确定性加密C.基于token映射的静态替换表D.基于SHA-256的哈希加盐答案:D解析:SHA-256为单向哈希,不可逆;其余三项均可通过密钥或映射表还原。6.某医院将患者出生日期“1990-07-15”脱敏为“1990-07-XX”,该策略主要破坏了数据的:A.可用性B.完整性C.唯一性D.关联性答案:A解析:日粒度丢失导致年龄计算误差增大,直接影响数据分析可用性。7.在数据分类分级标准中,以下哪项通常被划为“核心数据”?A.已公开的企业年报B.个人网购记录C.国家传染病监测原始个案D.匿名化后的气象数据答案:C解析:核心数据指一旦泄露可能危及国家安全或公共利益的数据,传染病原始个案符合定义。8.使用同态加密对两个32位整数做加法,其计算开销相对明文计算约增加:A.1–5倍B.10–50倍C.100–1000倍D.10000倍以上答案:C解析:全同态加密目前仍需大量Bootstrapping操作,实测开销在百倍至千倍量级。9.在数据共享场景中,采用“行级安全标签+动态脱敏”方案,当用户标签为“L2”且列敏感度为“高”时,系统返回:A.明文B.部分掩码C.全掩码D.拒绝查询答案:C解析:动态脱敏策略通常定义“高敏感度+低等级用户=全掩码”。10.以下关于“伪匿名化”与“匿名化”区别的描述,正确的是:A.伪匿名化可还原,匿名化不可还原B.伪匿名化不删除直接标识符C.匿名化需获得数据主体同意D.二者在法律上无区别答案:A解析:GDPR明确区分:伪匿名化仍属个人数据,可逆;匿名化不可逆,不再受个人数据条款约束。11.在加密数据库索引方案中,OPE(保序加密)最致命的弱点是:A.密文膨胀B.无法支持范围查询C.泄露顺序关系D.密钥管理复杂答案:C解析:OPE密文保留明文顺序,攻击者可通过顺序攻击推测原始分布。12.某电商采用“k-匿名+l-多样性”脱敏用户订单表,当l=3时,以下等价组满足要求的是:A.等价组大小10,敏感属性“疾病”值仅“感冒”B.等价组大小10,敏感属性“疾病”值有2种,比例7:3C.等价组大小10,敏感属性“疾病”值有3种,比例4:3:3D.等价组大小10,敏感属性“疾病”值有4种,比例5:2:2:1答案:C解析:l-多样性要求敏感属性至少l种不同值,且最高频值占比不超过1/l,即不超过33.3%,C符合。13.在数据脱敏效果评估中,最常用的“记录链接率”指标定义为:A.脱敏后记录被正确链接到原记录的比例B.脱敏后记录被错误链接到原记录的比例C.脱敏后记录无法被链接的比例D.脱敏后记录被链接到外部数据源的比例答案:A解析:记录链接率越高,说明脱敏越失败,攻击者越容易重识别。14.使用RSA-2048对对称密钥进行加密,再使用该对称密钥加密数据,此模式称为:A.ECBB.CTRC.KEMD.EnvelopeEncryption答案:D解析:信封加密先使用非对称算法加密对称密钥,再用对称密钥加密数据,兼顾效率与安全。15.在数据脱敏生命周期中,以下哪项活动应在“效果验证”阶段完成?A.制定脱敏策略B.执行脱敏脚本C.抽样重识别攻击测试D.归档原始数据答案:C解析:效果验证需通过模拟攻击评估剩余风险,抽样重识别测试是核心手段。二、多项选择题(每题3分,共30分)16.以下哪些技术可有效抵御“背景知识攻击”?A.差分隐私B.t-closenessC.同态加密D.伪随机置换答案:A、B解析:差分隐私通过噪声限制背景知识影响;t-closeness要求敏感属性分布与全局分布距离小于阈值,降低背景知识推断成功率。17.在实施动态数据脱敏时,需重点考虑哪些因素?A.用户身份与权限B.查询语句复杂度C.网络带宽D.应用端缓存答案:A、B、D解析:动态脱敏需实时判断用户权限与SQL语义,同时防止应用端缓存明文。18.以下哪些属于格式保持加密(FPE)的典型应用场景?A.加密16位银行卡号B.加密IPv4地址C.加密JPEG图片D.加密11位手机号答案:A、B、D解析:FPE适用于固定格式、有限字符集数据;JPEG为二进制大对象,格式复杂,不适合FPE。19.关于“隐私计算”与“数据脱敏”的对比,正确的是:A.隐私计算不泄露原始数据B.数据脱敏可能降低数据效用C.隐私计算无需可信第三方D.数据脱敏无法支持联合建模答案:A、B、D解析:隐私计算在密文态计算,原始数据不流出;脱敏通过失真降低风险,效用必然受损;脱敏数据因信息丢失,难以直接联合建模。20.以下哪些措施可降低哈希脱敏的彩虹表攻击风险?A.增加salt长度至128位B.采用bcrypt慢哈希C.使用SHA-1替代MD5D.对哈希结果再次加密答案:A、B、D解析:SHA-1与MD5均属于快速哈希,无法抵御暴力破解;增加salt、慢哈希、二次加密均有效。21.在数据脱敏项目中,需对“地址”字段脱敏,以下策略满足可用性与隐私平衡的是:A.将“北京市海淀区中关村南大街5号”脱敏为“北京市海淀区XXXX”B.将地址经纬度偏移500米C.将地址映射至同一街道的随机门牌D.直接删除地址字段答案:A、B、C解析:A保留区域统计价值;B、C保持地理分析可用性;D完全丢失信息,不符合平衡原则。22.以下哪些算法属于可逆脱敏算法?A.FF1模式AESB.RSA-OAEPC.HMAC-SHA256D.Format-PreservingFeistel答案:A、B、D解析:HMAC为消息认证码,不可逆;其余均可解密。23.在差分隐私实现中,以下哪些操作会消耗隐私预算?A.查询计数B.查询求和C.查询最大值D.对同一查询结果做二次可视化答案:A、B、C解析:任何聚合查询均需加噪,消耗ε;可视化若直接使用已加噪结果,不额外消耗。24.以下关于“数据脱敏”与“数据加密”在合规要求上的差异,正确的是:A.加密数据仍被认定为个人数据B.脱敏数据可能不再受个人信息保护法约束C.加密需向数据主体告知密钥D.脱敏需记录风险评估报告答案:A、B、D解析:加密可逆,仍属个人数据;不可逆脱敏且不可识别后,可豁免;告知密钥无法律依据;脱敏需留存评估报告备查。25.在实施基于角色的脱敏策略时,以下哪些信息应作为策略输入?A.用户角色B.数据列敏感度标签C.查询返回行数D.数据血缘关系答案:A、B、D解析:行数通常不影响掩码规则;血缘关系决定列间一致性脱敏需求。三、判断题(每题1分,共10分)26.采用确定性加密对手机号加密后,相同明文始终产生相同密文,因此无法防范频率攻击。答案:正确解析:确定性加密泄露频率,攻击者可结合外部数据源重识别。27.K-匿名化后的数据集一定满足差分隐私。答案:错误解析:K-匿名无噪声机制,无法提供ε-差分隐私保证。28.在数据脱敏中,删除所有直接标识符即可达到匿名化。答案:错误解析:剩余属性仍可能通过链接攻击重识别,需综合评估。29.使用同态加密技术,云服务器可在不解密的情况下完成数据求和。答案:正确解析:加法同态加密支持密文加法,结果解密后等于明文和。30.数据脱敏项目的最终输出必须包括“重识别风险评估报告”。答案:正确解析:国标GB/T37918-2019明确要求脱敏后需评估剩余风险。31.格式保持加密输出的字符集必须与输入完全一致。答案:正确解析:FPE核心要求即密文格式与明文一致,包括字符集。32.对姓名实施哈希脱敏时,加入全局salt可防止彩虹表攻击,但无法防止撞库攻击。答案:正确解析:全局salt无法阻止攻击者用同一哈希库撞库,需配合慢哈希与独立salt。33.差分隐私中,隐私预算ε越小,数据效用越高。答案:错误解析:ε越小,添加噪声越大,效用越低。34.数据脱敏策略一旦发布,在数据生命周期内不可调整。答案:错误解析:业务变化、法规更新均需动态调整策略。35.采用伪随机置换对银行卡号脱敏,可保证加密前后长度一致且可逆。答案:正确解析:伪随机置换是FPE的一种实现,满足长度一致与可逆。四、填空题(每空2分,共20分)36.在差分隐私中,对计数查询添加噪声通常采用________分布,其概率密度函数为f答案:拉普拉斯37.若某数据集采用3-匿名,且某等价组准标识符为{[25-30],男,北京},则该组至少包含________条记录。答案:338.格式保持加密FF3-1算法的核心结构为________网络,其轮数建议为________轮。答案:Feistel;839.在数据脱敏效果评估中,若重识别概率为0.8%,则剩余风险等级可标记为________级(低/中/高)。答案:低40.使用AES-256-GCM加密数据时,推荐的初始化向量(IV)长度为________位。答案:9641.对手机施掩码规则“保留前三后四,中间段用替换”,输出结果为________。41.对手机施掩码规则“保留前三后四,中间段用替换”,输出结果为________。答案:138****5678答案:138****567842.在K-匿名中,若将“出生日期”泛化到“出生年月”,则该操作称为________泛化。答案:层次43.数据脱敏的生命周期包括:识别、________、实施、验证、监控。答案:策略设计44.若某差分隐私机制消耗隐私预算ε=0.1,连续查询100次,则总隐私预算为________。答案:1045.在数据分类分级中,国家标准将数据分为________级、________级、________级三个安全级别。答案:核心;重要;一般五、简答题(每题10分,共30分)46.简述“可逆脱敏”与“不可逆脱敏”在应用场景上的差异,并各举一例说明其优缺点。答案:可逆脱敏适用于生产数据向可信第三方共享且需支持回溯的场景,如银行将加密卡号提供给催收机构,违约还清后需还原卡号解除冻结。优点:保持业务连续性;缺点:密钥泄露即数据泄露。不可逆脱敏适用于测试、分析、对外开放场景,如医院将患者主索引号哈希后供科研单位统计。优点:无密钥管理风险;缺点:无法还原,若分析需真实值则无法满足。47.说明差分隐私中“隐私预算”耗尽的含义及企业应如何避免提前耗尽。答案:隐私预算ε耗尽指累计查询消耗的ε达到预设上限,继续查询将违反隐私保证。企业可采取:1.预分配:按部门、时间段分配子预算;2.查询合并:将多个相似查询合并为一次;3.采用组合定理优化,如使用高级组合或矩组合降低累加速度;4.引入无预算消耗的公开统计结果,减少重复查询;5.对历史查询结果建立缓存,避免重复消耗。48.某电商平台拟开放用户评论数据供高校科研,需脱敏字段包括:用户ID、手机号、收货地址、评论内容。请给出整体脱敏方案并说明理由。答案:1.用户ID:采用基于HMAC的tokenization,全局独立salt,不可逆,保证跨表关联一致。2.手机号:格式保持加密FF1,保留前三后四,支持科研方按号段分析地域分布,同时可逆供内部审计需要。3.收货地址:采用层次泛化+噪声,省市区保留,街道名随机置换至同城区不同街道,门牌号随机化,经纬度偏移500米,保证地理统计可用。4.评论内容:采用命名实体识别,抽取出人名、地址、手机号、订单号后,用占位符[PII]替换,再使用差分隐私添加评论长度噪声,防止长度侧漏。整体流程:数据抽取→脱敏→重识别风险评估(抽样链接外部数据,重识别率<0.5%)→签订数据使用协议→每季度复评。六、综合计算题(共40分)49.某医疗数据集包含年龄、性别、邮编、疾病四字段,需发布用于统计研究。已知:年龄∈[20,80]整数性别∈{男,女}邮编为6位数字,前2位代表省份,共34种疾病共200种现采用K-匿名(K=5)与l-多样性(l=3)策略。(1)计算仅使用“年龄+性别+邮编前2位”作为准标识符时,最大可能的等价组大小(理论上限)。(2)若实际数据集含100万条记录,求满足K=5的最小泛化粒度(年龄按5岁分段,邮编保留前2位),并估算此时最大等价组记录数。(3)在上述最小泛化粒度下,验证是否一定满足l=3,并给出不满足时的调整方案。答案与解析:(1)理论上限:年龄区间数=(80-20+1)=61,性别=2,邮编前2位=34,总组合数=61×2×34=4148。最大等价组大小即数据集大小,100万条时,理论上限为100万(所有记录落入同一组合)。(2)年龄按5岁分段:段数=ceil(61/5)=13,组合数=13×2×34=884。100万条均匀分布时,平均每组记录数=1000000/884≈1131,远大于5,故最小泛化粒度即为“5岁段+性别+邮编前2位”。(3)l-多样性要求每组疾病至少3种。若某组疾病种类<3,需进一步泛化:将年龄段扩大至10岁,减少组合数,增加每组记录数,提高疾病多样性概率;或引入“疾病顶层分类”泛化,如将“Ⅱ型糖尿病”泛化为“内分泌疾病”,直至每组顶层疾病≥3类;或采用“敏感属性扰动”,对低频疾病随机替换为同层级的其他疾病,保证l=3。50.使用拉普拉斯机制对某数据集计数查询添加噪声,真实计数Q=5000,隐私预算ε=0.5,灵敏度Δ=1。(1)写出噪声概率密度函数,并计算噪声标准差。(2)求加噪结果落在[4990,5010]的概率。(3)若需将误差绝对值控制在10以内的概率不低于95%,求所需最小ε。答案与解析:(1)拉普拉斯噪声尺度参数b概率密度函数f标准差σ(2)设加噪结果Y=Q+X,X~Lap(0,2),求P=(3)设误差绝对值≤10的概率≥95%,即P1−又b故最小ε≈0.30。七、案例分析题(共40分)51.背景:某省政务数据开放平台拟发布“企业工商注册”数据集,包含字段:统一社会信用代码、企业名称、注册地址、法定代表人姓名、注册资本、成立日期、行业分类、股东及出资信息。平台需兼顾商业分析与隐私保护。要求:(1)识别直接标识符与准标识符;(2)为每个字段设计脱敏或加密方案,说明理由;(3)给出数据发布后的风险监控指标与阈值;(4)设计一套数据使用申请与审核流程,确保高校、企业等第三方合规使用。答案:(1)直接标识符:统一社会
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河南兴华生物工作制度
- 河长制扶贫工作制度
- 治疗室工作制度及流程
- 法国员工工作制度规定
- 2025安徽亳州市利辛县开源水务有限公司招聘专业技术人员人员拟聘笔试历年参考题库附带答案详解
- 法院大调解工作制度
- 2025四川雅安市荥经县县属国有企业招聘笔试及人员笔试历年参考题库附带答案详解
- 法院家事审工作制度
- 法院报刊征订工作制度
- 2025中铁站城融合投资发展有限公司招聘21名项目专班人员笔试历年参考题库附带答案详解
- 头疗课件培训
- 2025年中国华能集团蒙东公司招聘笔试参考题库含答案解析
- 2025年河南省高考化学试卷真题(含答案及解析)
- 国家中医药管理局《中医药事业发展“十五五”规划》全文
- 职场沟通课件
- 马里体育场施工组织设计
- 第三单元:长方体和正方体的表面积增减变化问题“一般型”专项练习-2023-2024学年五年级数学下册典型例题系列(解析版)人教版
- cnc品质管理制度
- 安徽省历年中考作文题(2006-2024)
- 2025届湖北省荆、荆、襄、宜四地七校考试联盟高三4月联考物理试题含解析
- 2025锂离子电池生产企业消防安全管理
评论
0/150
提交评论