2026年征信数据治理与质量管理考试题库及答案_第1页
2026年征信数据治理与质量管理考试题库及答案_第2页
2026年征信数据治理与质量管理考试题库及答案_第3页
2026年征信数据治理与质量管理考试题库及答案_第4页
2026年征信数据治理与质量管理考试题库及答案_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年征信数据治理与质量管理考试题库及答案一、单项选择题(每题1分,共30分)1.2026年新版征信数据标准中,对“个人信贷账户状态”字段的枚举值由旧版的8项精简为5项,被合并的3项状态是A.正常、结清、销户B.逾期、呆账、核销C.部分逾期、展期、提前结清D.冻结、止付、冲正答案:C解析:2026版标准将“部分逾期”“展期”“提前结清”并入“其他”类,减少冗余,提升一致性。2.在征信数据质量评分卡中,对“关键字段缺失率”设置的红线阈值是A.0.1%B.0.3%C.0.5%D.1%答案:B解析:监管口径要求关键字段缺失率不得高于0.3%,触发即下发整改通知书。3.征信数据“七日波动率”指标用于监控A.数据延迟B.数据漂移C.数据重复D.数据泄露答案:B解析:七日波动率通过比对近7天数值分布与30天基准分布的KL散度,识别潜在漂移。4.当发现征信报文出现“同一客户三证号码不一致”时,首选的治理策略是A.直接拒绝入库B.标记可疑并下发核查C.以最新报文覆盖D.随机保留一条答案:B解析:三证号码冲突涉及身份唯一性,需人工核查后再决定合并或拆分,避免误杀。5.2026年征信数据质量考核中,对“高频更新字段”的时效性要求是A.T+0B.T+1C.T+2D.T+3答案:A解析:高频更新字段(如余额、还款状态)须当日23:59前完成入库,实现T+0。6.在数据血缘图谱里,征信“授信额度”字段的上游系统不包括A.信贷核心B.额度管理系统C.反欺诈引擎D.抵押登记系统答案:D解析:抵押登记系统仅产生担保信息,不直接输出授信额度。7.征信数据质量“四性”原则中,新增的一项是A.一致性B.可追溯性C.可审计性D.可解释性答案:D解析:2026版在原有“准确性、完整性、及时性、一致性”基础上新增“可解释性”,要求算法模型输出可解释报告。8.对公征信数据“行业分类”字段采用的国家标准是A.GB/T4754-2017B.GB/T4754-2021C.GB/T4754-2024D.GB/T4754-2025答案:C解析:2024版行业分类新增“数字货币挖矿”“碳中和服务”等类别,2026年正式落地。9.征信数据质量评分低于80分时,机构需在几个工作日内提交整改报告A.3B.5C.7D.10答案:C解析:监管要求7日内提交整改报告,14日内完成复核。10.征信数据“静默客户”定义中,连续无交易记录的时长为A.3个月B.6个月C.12个月D.24个月答案:B解析:连续6个月无主动还款、无授信变动即视为静默客户,触发抽样核查。11.在征信数据仓库中,用于保存历史快照的层级是A.ODSB.DWDC.DWSD.ADS答案:B解析:DWD(明细数据层)保存每日全量快照,支持时点回溯。12.征信数据质量“交叉验证”规则中,个人月收入与月还款额的比例上限为A.30%B.40%C.50%D.60%答案:C解析:收入偿债比超过50%触发高风险标记,需二次核验。13.征信数据“冷启动”场景下,优先采用的补全算法是A.KNN插补B.多重插补C.迁移学习D.随机森林答案:C解析:迁移学习可借助相似机构数据快速建立补全模型,缓解冷启动。14.征信数据质量报告中的“红灯指标”由谁最终确认A.数据提供部门B.数据治理委员会C.风险部D.稽核部答案:B解析:数据治理委员会拥有红灯指标最终认定权,确保跨部门公允。15.征信数据“分片键”选择时,不建议采用的字段是A.客户号哈希B.机构号+日期C.身份证号D.手机号答案:D解析:手机号变更频率高,作为分片键易造成数据倾斜。16.征信数据质量“双人复核”机制适用于A.字段映射变更B.枚举值新增C.规则版本上线D.以上全部答案:D解析:凡涉及标准变更、规则上线均需双人复核,降低操作风险。17.征信数据“一致性”校验中,对“未结清贷款余额”要求总分校验差额不超过A.0.01%B.0.05%C.0.1%D.0.5%答案:B解析:总分校验差额≤0.05%视为合格,超过即下发差错单。18.征信数据质量“可解释性”报告必须包含A.SHAP值排序B.特征重要性图C.决策路径D.以上全部答案:D解析:可解释性报告要求同时给出全局解释与局部解释,确保监管可读。19.征信数据“灰度发布”回滚阈值设定为错误率超过A.0.1%B.0.2%C.0.5%D.1%答案:C解析:灰度阶段错误率超0.5%即自动回滚,保障生产安全。20.征信数据质量“外部核验”首选的数据源是A.税务总局B.社保中心C.公积金中心D.电信运营商答案:A解析:税务数据覆盖率高、时效强,是收入类字段外部核验首选。21.征信数据“标签体系”中,属于“行为类”标签的是A.近12个月查询次数B.信用卡额度C.房贷剩余期限D.企业注册资本答案:A解析:查询次数反映客户行为,其余为属性或产品类标签。22.征信数据质量“实时拦截”规则部署在A.数据湖B.消息队列C.流计算引擎D.离线仓库答案:C解析:流计算引擎(如Flink)可在毫秒级拦截脏数据,防止落地。23.征信数据“主键冲突”解决策略中,优先级最高的是A.时间戳最新B.数据源权威等级C.数据完整度得分D.随机选择答案:B解析:权威等级高(如央行核发)的数据优先,确保源头可信。24.征信数据质量“月度考核”中,权重最高的维度是A.完整性B.准确性C.及时性D.一致性答案:B解析:准确性权重40%,其余各占20%,体现质量核心。25.征信数据“敏感字段”脱敏算法中,保留格式加密的是A.MD5B.SHA256C.FPED.AES答案:C解析:FPE(格式保持加密)加密后仍保留原始数据格式,利于下游测试。26.征信数据质量“知识图谱”用于识别A.关联欺诈B.字段缺失C.时效延迟D.数值溢出答案:A解析:知识图谱通过实体关系发现隐性关联,识别团伙欺诈。27.征信数据“版本控制”工具推荐采用A.SVNB.GitLabC.ApacheAtlasD.DataHub答案:B解析:GitLab支持脚本、配置、文档一体化版本管理,且权限颗粒度细。28.征信数据质量“异常值”检测默认采用的置信区间为A.90%B.95%C.99%D.99.9%答案:B解析:95%置信区间兼顾灵敏度与误报率,为行业默认。29.征信数据“生命周期”管理要求结清记录至少保存A.1年B.3年C.5年D.10年答案:C解析:监管规定结清记录保存5年,逾期记录自结清后5年删除。30.征信数据质量“自动修复”脚本变更前必须完成A.代码评审B.影子测试C.备份快照D.以上全部答案:D解析:自动修复影响面广,需评审、影子验证、快照回滚三重保障。二、多项选择题(每题2分,共20分)31.以下哪些属于2026版征信数据质量“七大约束”A.非空约束B.唯一约束C.范围约束D.格式约束E.外键约束答案:ABCDE解析:七大约束新增“业务约束”与“时序约束”,题干所列五项均包含在内。32.征信数据质量“实时dashboard”必须展示的指标有A.当日入库量B.错误率趋势C.红灯规则清单D.数据血缘拓扑E.客户投诉数答案:ABCD解析:客户投诉数属于运营指标,非质量dashboard必展。33.征信数据“冷备”策略包含A.每日全量导出B.增量binlog备份C.跨机房磁带归档D.快照存放到对象存储E.双活写入答案:ABCD解析:双活写入属于热备,冷备强调离线、延迟、低成本。34.征信数据质量“可观测性”三大支柱是A.日志B.指标C.追踪D.告警E.可视化答案:ABC解析:可观测性经典模型=日志+指标+追踪,告警与可视属于衍生。35.征信数据“分级分类”管理中,属于“核心级”的数据有A.授信额度B.还款表现C.查询记录D.客户姓名E.客户邮箱答案:AB解析:核心级指对风控评分影响权重>0.2的字段,查询记录、姓名、邮箱权重较低。36.征信数据质量“双人运维”要求以下操作必须双人A.主备切换B.密钥更换C.规则下线D.批量重跑E.指标口径变更答案:ABCE解析:批量重跑若已标准化、参数化,可单人执行。37.征信数据“隐私计算”场景可用技术A.联邦学习B.安全多方计算C.差分隐私D.同态加密E.区块链存证答案:ABCD解析:区块链存证解决溯源,不直接用于计算。38.征信数据质量“外部评审”机构需具备A.国家实验室认可B.信息安全等保三级C.征信机构备案D.数据治理成熟度五级E.ISO27001认证答案:ABE解析:备案与成熟度非强制门槛,但认可与等保、ISO是硬要求。39.征信数据“元数据”包含A.业务含义B.技术口径C.责任人D.更新频率E.安全等级答案:ABCDE解析:元数据是描述数据的数据,五项均属于核心元数据。40.征信数据质量“复盘五步”包括A.现象描述B.影响评估C.根因分析D.改进措施E.经验固化答案:ABCDE解析:五步闭环形成知识库,防止重复犯错。三、判断题(每题1分,共10分)41.征信数据质量评分一旦低于60分,机构将被暂停报文上报权限。答案:对解析:60分为监管“生死线”,触发即暂停。42.征信数据“实时修复”允许直接修改原始报文。答案:错解析:原始报文只读,修复需生成新补丁版本并留痕。43.征信数据质量“一致性”仅指同一系统内数据一致。答案:错解析:一致性包括跨系统、跨时段、跨粒度的一致。44.征信数据“灰度发布”期间,红灯规则错误率不计入考核。答案:错解析:灰度数据仍计入考核,防止机构借灰度逃避扣分。45.征信数据“可解释性”报告可替代模型验证报告。答案:错解析:可解释性是补充,不能替代传统验证。46.征信数据“静默客户”重新激活后,其历史不良记录不再展示。答案:错解析:不良记录保存期限不受静默影响,仍展示至期满。47.征信数据质量“双人复核”记录需保存至少3年。答案:对解析:满足审计追溯要求,3年为最低保存期。48.征信数据“分片键”变更属于重大变更,须走评审。答案:对解析:分片键变更涉及重分布,为高风险操作。49.征信数据“外部核验”失败后,可直接删除原字段。答案:错解析:删除需走审批,优先标记“待核验”而非物理删除。50.征信数据质量“知识图谱”更新频率不得低于月度。答案:对解析:关系网络动态变化,月度更新防止关系老化。四、填空题(每空1分,共20分)51.2026年征信数据质量“红线”指标由__________统一发布,任何机构不得私自调整。答案:央行征信管理局52.征信数据“七日波动率”采用__________散度衡量分布差异。答案:KL53.征信数据质量“可观测性”中,traceid建议在__________层注入。答案:网关54.征信数据“灰度发布”回滚窗口默认设定为__________小时。答案:2455.征信数据“冷备”磁带需存放于距主数据中心__________公里以上异地。答案:20056.征信数据质量“双人运维”操作日志应写入__________系统,防止篡改。答案:区块链57.征信数据“分级分类”最高安全等级为__________级。答案:五58.征信数据“实时拦截”规则采用__________表达式编写,降低语法错误。答案:DSL59.征信数据“静默客户”抽样比例不得低于__________%。答案:560.征信数据质量“复盘”报告须在事件解决后__________个工作日内提交。答案:561.征信数据“外部核验”调用税务接口需使用__________算法加密纳税人识别号。答案:SM262.征信数据“标签体系”中,行为类标签更新频率为__________。答案:日63.征信数据“主键冲突”裁决依据的数据源权威等级分为__________级。答案:三64.征信数据质量“红灯”指标触发后,机构需在__________小时内口头报告。答案:265.征信数据“FPE”加密需保证__________不变性。答案:格式66.征信数据“知识图谱”边权重计算采用__________算法。答案:Node2Vec67.征信数据质量“影子测试”环境需与生产保持__________版本一致。答案:代码68.征信数据“实时修复”脚本须通过__________测试后方可上线。答案:混沌69.征信数据质量“月度考核”结果分为__________档。答案:五70.征信数据“生命周期”管理遵循__________原则,即到期即毁。答案:最小保存五、简答题(每题10分,共30分)71.简述2026版征信数据质量“可解释性”建设的三大难点及解决思路。答案:(1)黑盒模型复杂度高:采用SHAP值拆解,提供全局与局部解释,输出特征贡献排序;(2)特征工程动态变化:建立特征版本库,每次变更自动生成diff报告,关联模型效果;(3)监管阅读习惯差异:提供图形化决策路径与双语报告,支持一键导出PDF,满足非技术审计需求。72.说明征信数据“灰度发布”完整流程,并给出回滚触发条件。答案:流程:①需求评审→②脚本开发→③影子测试→④小流量(5%)灰度→⑤监控对比→⑥全量发布。回滚触发:①错误率>0.5%;②关键字段缺失率>0.3%;③客户投诉>3例;④监管红灯告警。任一条件满足即自动回滚,24小时内完成数据订正。73.论述征信数据质量“外部核验”中税务数据源的优势与局限。答案:优势:①覆盖率高,企业纳税人登记率>99%;②时效强,月度更新;③权威性强,由国家税务总局统一维护;④字段丰富,含收入、纳税、行业等维度。局限:①个体纳税人数据不完整;②部分小微企业采用核定征收,收入字段缺失;③接口限流,高峰期需排队;④涉及隐私,需加密传输,增加调用成本。解决思路是与社保、公积金数据交叉补全,建立评分卡降低单一数据源依赖。六、案例分析题(共40分)74.某银行2026年4月征信数据质量评分降至78分,监管下发整改通知书。经排查发现,个人信贷“还款状态”字段缺失率0.8%,且近七日波动率KL散度达0.92,触发红灯。请回答:(1)给出根因分析步骤(10分)(2)制定整改方案,含技术、管理、流程三方面(15分)(3)说明如何验证整改效果,给出指标与阈值(10分)(4)若整改后评分仍低于80,银行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论