2026年网络安全工程师(数据脱敏)水平模拟卷_第1页
2026年网络安全工程师(数据脱敏)水平模拟卷_第2页
2026年网络安全工程师(数据脱敏)水平模拟卷_第3页
2026年网络安全工程师(数据脱敏)水平模拟卷_第4页
2026年网络安全工程师(数据脱敏)水平模拟卷_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年网络安全工程师(数据脱敏)水平模拟卷1.单选题(每题2分,共20分)1.1某金融公司需对生产库中的身份证号字段实施脱敏,要求保留前6位与后4位,中间9位用固定字符“”替换。下列算法中,最适合在应用层实时查询时动态完成该操作的是1.1某金融公司需对生产库中的身份证号字段实施脱敏,要求保留前6位与后4位,中间9位用固定字符“”替换。下列算法中,最适合在应用层实时查询时动态完成该操作的是A.基于K-匿名的一般化B.基于正则表达式的掩码C.基于差分隐私的噪声注入D.基于同态加密的密文计算1.2在GDPR框架下,数据控制者采用假名化(Pseudonymisation)技术后,下列说法正确的是A.假名化数据不再属于个人数据B.假名化数据可自由跨境传输无需额外评估C.若附加信息分开保存且技术与管理措施得当,可显著降低风险D.假名化等同于匿名化,可直接用于公开发布1.3某日志系统需对金额字段做可逆脱敏,以便审计时还原。以下密钥管理策略最符合“密钥与数据分离”原则的是A.将AES密钥硬编码在脱敏脚本中B.将密钥存入与日志相同的MongoDB集合C.使用HSM生成并托管密钥,脱敏服务通过KMIP接口调用D.将密钥拆分为两段分别写入两台服务器的/etc/passwd1.4在Oracle数据库中,利用DBMS_REDACT实现“随机脱敏”时,下列参数可控制随机值范围的是A.FUNCTION_TYPEB.EXPRESSIONC.RANDOM_SEEDD.COLUMN_NAME1.5某医院对病历表做k-匿名,设置k=5。若quasi-identifier组合{年龄,性别,邮编}出现频率如下,则违反5-匿名的是A.(34,男,100081)出现6次B.(28,女,200120)出现5次C.(41,女,310000)出现4次D.(55,男,518000)出现7次1.6采用格式保持加密(FPE)对16位银行卡号脱敏时,若要求密文仍能通过Luhn校验,下列方案可行的是A.直接加密16位数字串,忽略LuhnB.先计算并保存原Luhn校验位,加密前15位后重新计算校验位并替换C.加密后若Luhn不通过,则循环递增末位直到通过D.对前6位与后4位不加密,仅加密中间6位并保证Luhn通过1.7在差分隐私中,对计数查询结果添加噪声,若隐私预算ε=0.1,则噪声量级与下列参数成正比的是A.1/εB.ε²C.ln(1/ε)D.e^ε1.8某系统采用静态脱敏,将生产库数据拷贝到测试库。下列哪项措施最能防止“残余数据”泄露A.脱敏后立即删除生产库B.对测试库开启透明数据加密(TDE)C.脱敏后运行数据一致性校验脚本D.脱敏完成后对测试库做全表置零1.9使用PythonFaker库生成假数据时,为保持“同一客户在不同表中的姓名一致”,应优先使用A.()B.faker.seed_instance()配合全局随机状态C.faker.add_provider()D.()1.10在数据脱敏效果评估中,下列指标最能反映“字段语义一致性”的是A.信息损失度(IL)B.可逆度(Reversibility)C.引用完整性(ReferentialIntegrity)D.唯一值占比(UniqueRatio)2.多选题(每题3分,共15分)2.1以下属于“动态脱敏”典型应用场景的有A.运维人员通过堡垒机查询生产库时,敏感字段实时掩码B.夜间ETL任务将生产库全量导出到测试库C.客服系统在坐席界面展示用户手机号时仅显示末四位D.大数据平台对Hive表做离线变形并写入新表2.2关于同态加密在脱敏中的局限,下列说法正确的有A.支持任意计算深度的同态加密目前计算开销仍然巨大B.可完全替代掩码技术,实现零信息损失C.密文长度通常远大于明文,导致存储膨胀D.无需密钥管理即可实现安全共享2.3以下技术可同时实现“可逆”与“格式保持”的有A.FF1-modeAESB.RSA-OAEPC.Format-preservingHashD.BPS(Brier-Peyrin-Stern)算法2.4在对日志中的用户代理(User-Agent)字段脱敏时,为保持字段长度与原文一致,可采取的策略有A.用等长随机字符串替换B.使用FPEC.截断后填充固定字符D.哈希后取固定长度前缀2.5以下关于k-匿名与l-多样性关系的描述,正确的有A.l-多样性可解决k-匿名面临的“同质性攻击”B.k-匿名要求每个等价类至少k条记录,l-多样性要求敏感属性至少l个不同值C.满足l-多样性一定满足k-匿名D.满足k-匿名一定满足l-多样性3.判断题(每题1分,共10分)3.1数据脱敏的最终目标是使数据完全无法被攻击者恢复,因此可逆脱敏没有存在价值。3.2在MySQL8.0中,使用函数CONCAT与REPEAT可实现任意长度的掩码脱敏。3.3差分隐私中的隐私预算ε越小,数据可用性越高。3.4若对手机号做哈希脱敏,且哈希算法未知,则攻击者无法通过彩虹表反推原手机号。3.5假名化技术中,若将标识符映射表删除,则假名化数据升级为匿名化数据。3.6静态脱敏过程中,若源库使用列级加密,则必须先解密再脱敏。3.7对高维数据做k-匿名会导致严重的数据可用性下降,此现象被称为“维度灾难”。3.8在OracleDataMaskingPack中,脱敏模板一旦创建便无法修改。3.9采用掩码方式脱敏时,若掩码规则公开,则无法防止字典攻击。3.10对日志中的IP字段脱敏,若仅保留/24前缀,则仍可能通过交叉验证重新识别用户。4.填空题(每空2分,共20分)4.1在PostgreSQL中,利用______扩展可对指定列实现动态脱敏,当用户不满足策略条件时返回掩码结果。4.2格式保持加密通常基于______模式,使用AES作为底层分组密码。4.3若对年龄字段做“区间一般化”,将0-100岁划分为10个等宽区间,则区间宽度为______。4.4差分隐私的敏感度(Sensitivity)定义为:对于相邻数据集D与D′,查询函数f的最大差异Δf=______。4.5在数据脱敏成熟度模型中,最高等级为______级,代表“自适应与可度量”。4.6当采用SHA-256对邮箱做脱敏时,若希望缩短至32字符,通常使用______编码。4.7对银行卡号做Luhn校验时,从右往左对偶数位乘2,若结果大于9则______。4.8在Kettle中,用于生成假数据的步骤名为______。4.9若对中文姓名脱敏,要求保留姓,用“”替换名,则“欧阳震华”脱敏后为______。4.9若对中文姓名脱敏,要求保留姓,用“”替换名,则“欧阳震华”脱敏后为______。4.10在数据脱敏项目中,DPIA是指______。5.简答题(每题10分,共20分)5.1简述“动态脱敏”与“静态脱敏”在实现机制、适用场景、安全风险三方面的主要差异,并给出各自一条最佳实践建议。5.2某电商公司需对订单表中的收货地址字段脱敏,要求:(1)保持省、市信息不变;(2)详细地址需脱敏但仍可看出同一用户多次下单;(3)支持可逆,以便客服纠纷时还原。请给出技术方案(含算法选型、密钥管理、性能优化三点)。6.综合应用题(15分)某银行核心系统每日产生1亿条交易流水,字段包括:交易ID、借方卡号、贷方卡号、金额、时间戳、商户号、身份证号、手机号。监管要求:A.测试库数据须脱敏;B.脱敏后仍支持按“商户号+日期”维度统计总笔数与总金额,误差<0.1%;C.脱敏后卡号、身份证号、手机号须保持格式与原长度一致;D.脱敏过程须在2小时内完成,使用10节点Spark集群,每节点16核64GB。请设计完整脱敏流程,涵盖:(1)脱敏策略表(字段级规则、算法、是否可逆);(2)并行化方案(分区键、资源调优、避免数据倾斜);(3)质量验证指标与脚本片段(Python或SQL均可);(4)安全加固措施(密钥、日志、审计)。若涉及公式,请用LaTeX书写,例如信息损失度:I其中H(M)7.计算题(10分)给定表T(quasi-identifier,sensitive),其中quasi-identifier为{年龄,性别,地区},sensitive为{疾病}。原始数据如下:年龄性别地区疾病28女海淀区糖尿病28女海淀区高血压28女海淀区糖尿病29男朝阳区高血压29男朝阳区高血压30男朝阳区糖尿病7.1计算该数据集的3-匿名最小一般化方案,给出一般化后的表。7.2在上述3-匿名结果上,验证是否满足2-多样性,若否,给出最小抑制记录数。8.答案与解析1.单选1.1B1.2C1.3C1.4C1.5C1.6D1.7A1.8C1.9B1.10C2.多选2.1AC2.2AC2.3AD2.4AB2.5ABC3.判断3.1×3.2√3.3×3.4×3.5√3.6√3.7√3.8×3.9√3.10√4.填空4.1pg_redact4.2FF1或FF34.3104.4\Deltaf=\max_{D,D'}|f(D)-f(D')|4.554.6Base644.7减94.8“生成记录”或“GenerateRows”4.9欧阳4.9欧阳4.10DataProtectionImpactAssessment5.简答(要点示例)5.1动态脱敏:在查询瞬间改写结果,不落地,适合生产环境即席访问;风险在于策略绕过与性能损耗;最佳实践:基于身份与上下文细粒度策略,结合缓存热点数据。静态脱敏:离线生成副本,适合测试、分析;风险在于副本泄露;最佳实践:脱敏后立即进行残余数据清理与加密存储,并加入水印追溯。5.2方案:(1)算法:FF1-AES256,保持中文长度;(2)密钥:HSM生成每日轮换密钥,客服系统通过KMIP获取解密;(3)性能:预生成Faker字典,Spark广播变量加载,避免每条调用加密;(4)同用户一致性:以user_id为关联键,建立可逆映射表,脱敏时先查缓存,未命中再调用加密。6.综合应用(核心要点)(1)策略表示例:借方卡号:FF1,可逆,格式保持,密钥ID=k1;身份证号:掩码保留前6后4,不可逆;手机号:FF1,可逆,密钥ID=k2;金额:不处理,满足误差要求;商户号:不处理。(2)并行化:按商户号+日期分区,避免shuffle;使用Sparksalting技术对热点商户二次分区;executor内存给足4GB堆外内存用于FF1缓存。(3)质量验证:```pythondf_masked=spark.table("tx_masked")df_orig=spark.table("tx_orig")err=df_masked.groupBy("merchant","date")\.agg(sum("amount").alias("a_m"))\.join(df_orig.groupBy("merchant","date")\.agg(sum("amount").alias("a_o")),["merchant","date"])\.agg(F.avg(F.abs(F.col("a_m")-F.col("a_o"))/F.col("a_o")).alias("e"))asserterr.first()["e"]<0.001```(4)安全加固:密钥存HSM,脱敏作业日志脱敏,审计记录写入WORM存储;使用Ker

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论