2025年烟草行业数据治理能力考试试题及答案_第1页
2025年烟草行业数据治理能力考试试题及答案_第2页
2025年烟草行业数据治理能力考试试题及答案_第3页
2025年烟草行业数据治理能力考试试题及答案_第4页
2025年烟草行业数据治理能力考试试题及答案_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年烟草行业数据治理能力考试试题及答案1.单项选择题(每题1分,共20分)1.12024年行业数据资源目录中,一级主题域“市场流通”下挂接的二级主题域数量是A.5B.6C.7D.8答案:C1.2在《烟草行业数据管理办法》(国烟办〔2023〕89号)中,数据分级保护级别最高为A.核心B.重要C.一般D.公开答案:A1.3下列哪一项不是行业数据中台“5大能力中心”的组成部分A.数据资产中心B.数据交换中心C.算法模型中心D.云原生中心答案:D1.42025版行业主数据标准中,“零售客户”主数据的唯一标识字段是A.cust_idB.retail_codeC.customer_noD.org_code答案:B1.5行业数据中台采用的元数据血缘采集协议是A.KafkaB.OpenLineageC.MQTTD.AMQP答案:B1.6在数据质量管理平台中,规则模板“空值率”默认的告警阈值是A.1%B.3%C.5%D.10%答案:C1.72024年行业数据共享负面清单最新版共列出禁止共享场景A.15类B.18类C.21类D.24类答案:B1.8下列哪张表存储了行业统一卷烟商品编码与GTIN14的映射关系A.dim_product_mapB.dim_gtin_relC.dim_cig_codeD.dim_barcode答案:A1.9行业数据资产目录的元数据编码规则中,第5—6位表示A.业务域B.系统编码C.版本年份D.数据类型答案:A1.102025年行业数据安全分类分级指南规定,零售户POS流水属于A.核心数据B.重要数据C.一般数据D.公开数据答案:B1.11在数据中台实施方法论中,完成“业务域盘点”后紧接着的阶段是A.数据建模B.数据接入C.资产编目D.场景验证答案:C1.12行业统一数据标准编码采用A.UUIDB.OIDC.SnowflakeD.MD5答案:B1.13下列哪一项不是行业数据治理考核指标“数据及时率”的统计维度A.T+1B.T+2C.T+3D.T+7答案:D1.142024年行业数据质量评分规则中,主数据一致性权重占A.10%B.20%C.30%D.40%答案:C1.15行业数据中台对Hive表生命周期超过多少天自动触发归档A.90B.180C.270D.360答案:B1.16在数据共享流程中,使用“敏感数据脱敏”策略时,默认的脱敏算法是A.SHA256B.AES128C.掩码替换D.令牌化答案:C1.17行业数据资产目录的检索协议基于A.RESTfulB.GraphQLC.gRPCD.WebService答案:B1.182025年行业数据治理专项稽核中,对“重复零售户”容忍度为A.0%B.0.5%C.1%D.2%答案:A1.19行业数据中台元数据采集频率默认是A.实时B.30分钟C.1小时D.24小时答案:C1.20下列哪一项不是行业数据资产估值模型中的成本因子A.存储成本B.人力成本C.带宽成本D.沉没成本答案:D2.多项选择题(每题2分,共20分;多选少选均不得分)2.1以下哪些属于行业数据中台核心存储组件A.HiveB.HudiC.ClickHouseD.OracleRACE.HBase答案:ABCE2.2依据《烟草行业个人信息保护实施细则》,处理零售户个人信息时应遵循的原则包括A.最小必要B.明示同意C.分类分级D.可携带权E.安全可控答案:ABCE2.3行业主数据“组织机构”包含的必填属性有A.org_codeB.org_nameC.parent_codeD.tax_codeE.province_code答案:ABCE2.4数据质量规则库中,属于“业务规则”子类的有A.值域约束B.格式约束C.同比波动D.环比波动E.外键依赖答案:CD2.5下列哪些场景必须走行业数据共享“绿色通道”审批A.国家局向公安部提供打假数据B.工业公司向零售户提供营销活动数据C.商业企业向银行提供零售户信用数据D.国家局向财政部提供税利数据E.省级公司之间提供边界市场数据答案:ACD2.6行业数据中台数据血缘解析支持的SQL方言包括A.MySQLB.PostgreSQLC.SparkSQLD.OracleE.FlinkSQL答案:ABCE2.72025年行业数据安全审计重点包括A.跨境流动B.算法歧视C.过度采集D.明文传输E.权限滥用答案:ACDE2.8以下哪些指标纳入行业数据治理年度评价“数据价值”维度A.数据调用次数B.数据变现收入C.数据成本占比D.决策支撑场景数E.数据创新大赛获奖数答案:ABD2.9行业数据中台数据沙箱提供的隔离手段有A.网络隔离B.存储加密C.权限白名单D.容器隔离E.时间隔离答案:ACDE2.10依据行业数据标准,下列字段采用GB/T22602007编码的有A.province_codeB.city_codeC.county_codeD.street_codeE.grid_code答案:ABC3.填空题(每空1分,共20分)3.12025年行业数据中台统一资源命名空间前缀为________。答案:cn.tobacco.data3.2行业数据质量评分公式:Score=(1–Σ(Wi×Ei))×100,其中Ei表示第i条规则的________。答案:误差率3.3国家局发布的《数据共享接口规范》要求,分页查询默认每页不超过________条记录。答案:20003.4行业数据中台对Oracle日志采集使用的CDC工具是________。答案:OGG3.52024年行业数据治理报告显示,全国零售户主数据完整率为________%。答案:99.73.6行业数据资产目录元数据版本号采用________位数字编码。答案:83.7依据《个人信息保护法》,行业APP收集用户位置信息需取得用户的________同意。答案:单独3.8行业数据中台元数据仓库默认保留________个历史版本。答案:53.9数据共享审批流程中,省级公司归口管理部门需在________个工作日内完成初审。答案:33.10行业统一卷烟商品编码长度为________位。答案:163.112025年行业数据安全技术要求规定,核心数据加密算法优先采用________。答案:SM43.12行业数据中台数据脱敏网关基于________引擎实现动态脱敏。答案:NIFI3.13行业数据治理考核指标“数据一致性”要求主数据跨系统差异率低于________‰。答案:0.53.14行业数据中台对KafkaTopic命名规范中,环境标识“生产”用字母________表示。答案:P3.152024年行业数据资源目录共收录逻辑数据模型________个。答案:3683.16行业数据中台数据资产估值模型中,数据稀缺性系数最大值为________。答案:23.17行业数据质量监控平台默认在每日________点启动离线校验任务。答案:02:003.18行业数据中台API网关限流策略,核心数据接口峰值QPS不超过________。答案:5003.19行业主数据“零售客户”状态码“02”表示________。答案:暂停营业3.202025年行业数据治理专项行动代号是________。答案:春风4.判断题(每题1分,共10分;正确打“√”,错误打“×”)4.1行业数据中台允许使用公网IP直接访问核心数据层。答案:×4.2数据质量报告一旦发布,可在7天内申请重算一次。答案:√4.3行业数据共享负面清单每年动态更新一次。答案:√4.4零售户POS流水数据属于行业核心数据。答案:×4.5行业数据中台元数据采集支持主动推送与被动拉取两种模式。答案:√4.6数据资产估值结果可直接作为公司无形资产入账依据。答案:×4.7省级公司可以自行制定与行业主数据标准不一致的扩展字段。答案:√4.8行业数据治理考核实行“一票否决”制,数据安全事件扣分无上限。答案:√4.9行业数据中台API网关支持GraphQL查询语言。答案:√4.102025年起,行业所有数据开放场景必须采用区块链技术留痕。答案:×5.简答题(封闭型,每题5分,共20分)5.1简述行业数据中台“5大能力中心”各自的核心功能。答案:(1)数据资产中心:提供资产目录、元数据、血缘、标签、估值等全生命周期管理;(2)数据交换中心:负责跨域、跨云、跨网络的安全高效数据交换;(3)算法模型中心:统一管理行业AI算法、机器学习模型及版本;(4)数据质量中心:提供规则引擎、评分、整改、监控闭环;(5)数据安全中心:实现分类分级、脱敏、加密、审计、权限管控。5.2写出行业数据质量评分规则中“主数据一致性”校验的SQL模板(以零售客户表为例)。答案:```sqlSELECTCOUNT()ASinconsistencyFROMretail_custaJOINorg_custbONa.cust_id=b.cust_idWHEREa.cust_name<>b.cust_nameORa.city_code<>b.city_code;```5.3说明行业数据共享流程中“负面清单命中”后的处置步骤。答案:(1)共享申请系统自动拦截并返回命中条款编号;(2)申请单位在3个工作日内提交专项说明;(3)国家局数据治理办组织专家评估,必要时召开听证会;(4)评估通过后进入绿色通道,未通过则终止流程并记录信用扣分。5.4列举行业数据中台对核心数据采取的4项加密措施。答案:(1)传输通道强制TLS1.3;(2)字段级SM4加密;(3)密钥托管在HSM;(4)落盘使用AES256XTS。6.简答题(开放型,每题10分,共20分)6.1结合实践,说明如何在不改变legacy系统的前提下实现主数据实时同步,并给出技术路线与风险点。答案:技术路线:(1)采用OGGforBigData实时捕获legacy系统redolog;(2)通过KafkaConnect写入行业数据中台ODS层;(3)使用FlinkCDC消费ODS,与金标主数据进行对比,差异入缓冲队列;(4)缓冲队列通过RESTful接口反向调用legacy系统API完成回写或提醒。风险点:(1)OGG解析大事务延迟;(2)Kafka分区不均导致消费堆积;(3)双向更新产生循环依赖;(4)字符集不一致造成乱码;(5)OGG许可到期导致服务中断。缓解措施:部署延迟监控告警,分区键采用主键哈希,开启Flink幂等写,统一UTF8,提前续签许可。6.2试论数据资产估值模型中“市场法”在行业落地的难点及改进思路。答案:难点:(1)缺少活跃交易市场,可比案例稀缺;(2)数据价值易逝,时效性远超无形资产评估基准日;(3)数据权属复杂,法律边界模糊;(4)会计口径未明确,无法入账。改进思路:(1)建立行业数据交易所,引入第三方评估机构发布weekly基准报价;(2)采用期权定价思维,引入BlackScholes改进模型,将数据时效性作为波动率因子;(3)推动《数据资产登记办法》烟草细则出台,明确权属登记与确权流程;(4)与财政部会计司联合试点“数据资产入表”TobaccoPilot,形成可摊销无形资产科目。7.应用题(计算类,每题10分,共20分)7.1某省级公司2024年存量数据共600TB,其中核心数据80TB、重要数据200TB、一般数据320TB。按照行业2025年数据安全技术要求,核心数据需做2份异地容灾,重要数据1份,一般数据0份;异地冷存储单价为0.12元/GB/月,本地热存储单价为0.8元/GB/月。若核心与重要数据各占其体量30%存于冷存,其余为热存,求全年存储总成本。答案:(1)核心数据:冷存=80×1024×0.3=24576GB,年费用=24576×0.12×12=35389.44元;热存=80×1024×0.7=57344GB,年费用=57344×0.8×12=550502.4元;异地容灾复制等量,故乘以2:冷存容灾费用=35389.44元,热存容灾费用=550502.4元;核心合计=35389.44+550502.4+35389.44+550502.4=1171783.68元。(2)重要数据:冷存=200×1024×0.3=61440GB,年费用=61440×0.12×12=88473.6元;热存=200×1024×0.7=143360GB,年费用=143360×0.8×12=1376256元;异地1份,冷容灾=88473.6元,热容灾=1376256元;重要合计=88473.6+1376256+88473.6+1376256=2929459.2元。(3)一般数据:仅本地热存=320×1024×0.8×12=3145728元。全年总成本=1171783.68+2929459.2+3145728=7246970.88元≈724.70万元。7.2某商业企业卷烟销量预测模型使用过去两年日粒度数据共730条,特征包括节假日标签、气温、价格指数、促销力度等20维。采用LSTM模型,隐藏层128单元,Dropout=0.2,Epoch=100,Batch=32。训练耗时T1=4.5小时,推理730条耗时T2=2.3分钟。若数据量扩大至5年历史数据(1825条),隐藏层扩大至256单元,Epoch保持100,Batch保持32,假设训练复杂度与参数×样本数成正比,推理复杂度与参数×样本数成正比,估算新的训练与推理耗时。答案:参数原规模≈20×128+128×128+128=20×128+128²+128=16384+128+2560=16544(简化)。新规模≈20×256+256×256+256=256×(20+256+1)=256×277=70848。训练耗时正比于参数×样本:T1’/T1=(70848/16544)×(1825/730)=4.28×2.5=10.7,T1’=4.5×10.7=48.15小时。推理耗时:T2’/T2=(70848/16544)×(1825/730)=10.7,T2’=2.3×10.7=24.61分钟≈24分37秒。8.应用题(分析类,每题10分,共20分)8.1给出血缘图谱中循环依赖的检测算法(伪代码),并说明如何切断循环保证DAG。答案:```functiondetectCycle(graphG):visited←∅recStack←∅fornodeinG.nodes:ifnodenotinvisited:ifdfs(node,visited,recStack):returnTruereturnFalsefunctiondfs(node,visited,recStack):visited.add(node)recStack.add(node)forneighborinG.adj(node):ifneighbornotinvisited:ifdfs(neighbor,visited,recStack):re

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论