版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年网络安全工程师(数据脱敏)专业技能培训试卷1.单项选择题(每题2分,共20分)1.1在数据脱敏流程中,下列哪一项最能直接降低“重识别风险”?A.对敏感字段做MD5哈希B.将出生日期偏移±30天并统一格式C.用业务无关UUID替换主键D.对姓名做Base64编码1.2某电商公司需对订单表中的“收货地址”进行脱敏,要求保留城市级别粒度以供后续区域分析,下列方案合规且信息损失最小的是:A.直接删除地址字段B.保留前两级行政区划,后续用“”替代B.保留前两级行政区划,后续用“”替代C.用k-匿名(k=5)泛化到“省”级D.用同态加密后存入数据库1.3差分隐私中,对同一查询连续添加独立同分布的拉普拉斯噪声,隐私预算ε的累积方式应使用:A.线性累加B.平方和累加C.高级组合定理D.无需累加,噪声独立1.4在动态数据脱敏(DynamicMasking)架构里,下列哪一项最可能成为性能瓶颈?A.解析器对SQL的语法树重写B.元数据库存储脱敏规则C.审计日志落盘D.客户端SSL握手1.5某医疗数据库采用格式保持加密(FPE)对“身份证号”脱敏,若密文仍需满足数据库唯一约束,下列说法正确的是:A.FPE本身保证唯一性,无需额外索引B.需再建哈希索引防止碰撞C.应关闭唯一约束,改用应用层校验D.必须改用确定性AES-SIV模式1.6当使用正则表达式对日志脱敏时,表达式`(?<=\D)\d{4}(?=\D)`匹配并替换为“****”,下列哪组数字会被误伤?1.6当使用正则表达式对日志脱敏时,表达式`(?<=\D)\d{4}(?=\D)`匹配并替换为“****”,下列哪组数字会被误伤?A.订单号“ABC123456DEF”B.手机号C.银行卡“6222021234567890”D.固定电话1.7在基于深度学习的合成数据生成中,为抑制模型记忆训练集,下列技术最有效的是:A.Dropout=0.9B.梯度惩罚(GradientPenalty)C.提前停止(EarlyStopping)D.权重衰减(WeightDecay)1.8某银行使用假名化(Pseudonymization)技术,将客户号映射为随机字符串并单独存储映射表。若攻击者获得映射表与部分明文,则再识别风险主要来源于:A.哈希碰撞B.背景知识攻击C.频率分析D.差分攻击1.9对一条包含100个字段的记录实施“可逆脱敏”,若要求任意10个字段可联合还原原始数据,应采用的密码学原语是:A.秘密共享(Shamir’sSecretSharing)B.对称加密(AES-256)C.同态加密(BGN方案)D.格式保持哈希1.10在数据脱敏效果评估指标中,下列哪一项最能反映“业务可用性”?A.KL散度B.重识别率C.查询结果相对误差D.隐私预算ε2.多项选择题(每题3分,共15分;多选少选均不得分)2.1以下哪些做法可有效防止“彩虹表”对哈希脱敏字段的破解?A.加盐(Salt)B.使用bcrypt迭代10次C.采用HMAC-SHA256D.增加pepper(全局密钥)E.限制哈希输出长度≤8字节2.2在GDPR场景下,以下哪些情形可被视为“匿名化信息”而不再受约束?A.使用ε=0.1的差分隐私发布统计表B.删除直接标识符且k>10,l-diversity≥3C.对数据施加FPE且密钥已销毁D.生成合成数据,并通过T-Closeness检验E.仅做假名化但保留映射表2.3对实时流数据实施脱敏时,需重点考虑:A.低延迟B.消息顺序性C.状态一致性D.乱序窗口E.端到端Exactly-Once语义2.4以下哪些攻击方式可能降低k-匿名模型的防护效果?A.一致性攻击(HomogeneityAttack)B.背景知识攻击C.合成连接攻击(SyntheticLinkage)D.差分攻击E.频率推理攻击2.5在零信任架构中,对脱敏网关的访问控制应同时基于:A.用户身份B.设备健康度C.网络位置D.数据分级标签E.当前会话风险评分3.判断题(每题1分,共10分;正确打“√”,错误打“×”)3.1采用同态加密后的数据可直接在密文域做任意运算且性能与明文相当。3.2差分隐私的隐私预算ε越小,数据可用性越高。3.3对姓名做Tokenization后,若令牌与外部系统共享,则不再满足GDPR匿名化要求。3.4数据脱敏规则一旦上线,无需再做周期性重评估。3.5在加密数据库中建立OPE(顺序保持加密)索引会泄露数值顺序信息。3.6使用生成对抗网络(GAN)合成数据时,判别器损失越低代表隐私风险一定越低。3.7对日志脱敏时,必须保留原始时间戳以供审计。3.8假名化技术中,若使用HMAC代替简单哈希,可提高抗彩虹表能力。3.9对高维稀疏数据做k-匿名,常需采用维度规约或聚类预处理。3.10在数据脱敏项目中,PIA(隐私影响评估)只需在上线前执行一次即可。4.填空题(每空2分,共20分)4.1在差分隐私中,对计数查询添加拉普拉斯噪声,其尺度参数b=________。4.2若采用Shamir秘密共享方案,要求5人中任意3人可还原密钥,则该方案记作________。4.3对手机号实施掩码保留前三后四,中间四位用“”表示,结果为________。4.3对手机号实施掩码保留前三后四,中间四位用“”表示,结果为________。4.4格式保持加密FF1算法所依据的NIST标准编号为________。4.5在数据脱敏规则引擎中,常用________表达式匹配敏感字段。4.6对数值型字段做分桶泛化,若桶宽为10,则数值37落入桶区间________。4.7对日志中的银行卡号脱敏,常用Luhn算法先检验________位。4.8在合成数据评估中,若合成样本与真实样本的JS散度为0,说明________。4.9对高敏感级别数据实施“可逆脱敏”,密钥应托管在________系统。4.10对数据脱敏后的表做JOIN操作,若需保持关联性,应使用________映射。5.简答题(每题8分,共24分)5.1简述k-匿名与差分隐私在保护原理、适用场景及主要缺陷上的三点区别。5.2说明在医疗大数据共享项目中,如何结合“假名化+合成数据+差分隐私”三层防护,兼顾合规与可用性。5.3列举四种常见的“重识别攻击”手段,并给出对应缓解策略。6.计算与方案设计题(共31分)6.1(10分)某公司对“年龄”字段实施差分隐私统计,需发布计数查询Q1:年龄≥30且≤40的用户数。已知全局敏感度Δ=1,隐私预算ε=0.5。(1)写出添加拉普拉斯噪声的概率密度函数,并计算噪声标准差。(2)若真实计数为120,求发布值落在区间[115,125]的概率。6.2(10分)表A包含字段{用户ID,姓名,手机号,疾病编码},需对外提供研究数据集,要求:①无法直接识别个人;②疾病分布误差≤5%;③支持同一人多记录关联分析。请设计一套脱敏流程,说明每步采用的技术、参数及理由。6.3(11分)某日志样例:`2026-03-1514:23:45|user123|action=pay|card=6222021234567890|amount=9999.99`要求:(1)用正则提取并脱敏card字段,保持前六后四,中间用“”填充;(1)用正则提取并脱敏card字段,保持前六后四,中间用“”填充;(2)对amount做分桶泛化,桶宽1000元;(3)写出脱敏后日志,并评估信息损失率(假设amount原始熵H₀=13.2bit,脱敏后熵H₁=9.8bit)。7.答案与解析1.单项选择1.1B解析:偏移后分布保持近似,降低重识别且信息损失小。1.2B解析:保留城市粒度,星号替代细粒度,满足分析且合规。1.3C解析:高级组合定理处理多次查询的ε累积。1.4A解析:SQL重写需实时解析,最易成为瓶颈。1.5A解析:FPE确定性映射,天然保持唯一性。1.6A解析:订单号中的4位数字会被误匹配。1.7B解析:梯度惩罚直接抑制记忆。1.8B解析:攻击者利用背景知识关联。1.9A解析:秘密共享支持门限还原。1.10C解析:查询误差直接体现业务可用性。2.多项选择2.1ABD解析:Salt、迭代、pepper均抗彩虹表,短输出反而弱。2.2AB解析:ε=0.1且k>10、l≥3可视为匿名,其余仍属假名化。2.3ABCDE解析:流处理需全链路低延迟与一致性。2.6ABCE解析:差分攻击针对差分隐私,不直接降k-匿名。2.7ABDE解析:零信任不再依赖网络位置。3.判断3.1×解析:同态性能远低于明文。3.2×解析:ε越小,噪声越大,可用性越低。3.3√解析:令牌可逆,仍属假名化。3.4×解析:需周期性重评估。3.5√解析:OPE泄露顺序。3.6×解析:损失低可能过拟合,隐私风险反而高。3.7×解析:可脱敏时间戳或偏移。3.8√解析:HMAC带密钥,抗彩虹表。3.9√解析:高维稀疏需降维。3.10×解析:PIA需持续更新。4.填空4.1Δf/ε4.2(3,5)-threshold4.3138****56784.3138****56784.4NISTSP800-38G4.5正则/Regex4.6[30,40)4.7校验位4.8合成分布与真实完全一致4.9KMS/HSM4.10一致/保序5.简答(要点示例)5.1k-匿名:基于组indistinguishability,需准标识符,抗链接攻击;缺陷:无法防背景知识、同质攻击。差分隐私:添加噪声,提供ε-隐私保证;场景:统计发布;缺陷:单点查询精度低,预算累积。5.2第一层假名化:移除直接标识,映射表存HSM;第二层合成数据:GAN生成,疾病分布KL<0.05;第三层差分隐私:对统计结果加噪,ε=0.1。三层组合,映射表不对外,合成数据供研究,差分隐私保统计,兼顾合规与可用。5.31)链接攻击——假名化+背景知识,缓解:高维泛化+噪声;2)频率推理——罕见疾病,缓解:l-diversity;3)合成连接——合成数据与公开库比对,缓解:加入足够噪声;4)差分攻击——多次查询相减,缓解:差分隐私预算管理。6.计算与方案6.1(1)概率密度函数:f标准差σ=(2)发布值=120+X,X~Lap(0,2)。求P(115≤120+X≤125)=P(−5≤X≤5)=6.2流程:Step1假名化:用户ID→UUID,映射表加密存KMS;Step2姓名手机号:手机号掩码保留前三后四,姓名用Tokenization;Step3疾病编码:采用合成数据,GAN训练,损失函数加“疾病分布MSE<0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 九江学院《第二语言习得》2025-2026学年期末试卷
- 泉州经贸职业技术学院《档案学》2025-2026学年期末试卷
- 河南教招试题及答案
- 六安应用科技职业学院《中医保健推拿学》2025-2026学年期末试卷
- 安庆职业技术学院《工程地质》2025-2026学年期末试卷
- 池州职业技术学院《中药调剂学》2025-2026学年期末试卷
- 福建生物工程职业技术学院《中医护理》2025-2026学年期末试卷
- 泉州经贸职业技术学院《传播研究方法》2025-2026学年期末试卷
- 杭电国际商务试题及答案
- 鱼粉制作工安全检查能力考核试卷含答案
- MOOC 思辨式英文写作-南开大学 中国大学慕课答案
- 急危重症患者静脉通路的建立与管理课件
- 个人保险合同解除申请书
- 新视野大学英语(第四版)读写教程2(思政智慧版)课件 Unit 4 Mission and exploration of our time Section A
- 试生产管理程序
- 体育社会学课件第三章社会结构中的体育运动
- 肺楔形切除术后护理查房
- 劳动仲裁申请书范本
- 《人文地理学》4 文化与人文地理学
- 血小板血浆(PRP)课件
- 伊索寓言好书推荐演讲稿
评论
0/150
提交评论