2025年信息素养大赛试题及答案_第1页
2025年信息素养大赛试题及答案_第2页
2025年信息素养大赛试题及答案_第3页
2025年信息素养大赛试题及答案_第4页
2025年信息素养大赛试题及答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年信息素养大赛试题及答案一、单项选择题(每题2分,共20分)1.2025年3月,国家数据局发布《公共数据资源授权运营规范(试行)》,其中首次明确“数据授权运营”必须遵循的核心原则是A.数据最小可用B.场景可控C.收益反哺D.安全可控答案:D解析:规范第三条提出“安全可控”为首要原则,要求运营主体建立全生命周期安全体系,覆盖采集、存储、使用、加工、传输、提供、公开、删除各环节。2.在生成式人工智能训练中,以下哪种技术方案最能降低“幻觉”概率且无需重新训练模型?A.RAG检索增强生成B.LoRA微调C.知识蒸馏D.对抗样本注入答案:A解析:RAG通过实时检索外部权威知识库并拼接至提示词,使模型在推理阶段即可引用最新事实,显著抑制幻觉,且无需改动权重。3.某市图书馆计划利用区块链实现“读者借还记录存证”,若要求每笔记录可在链上验证但不可被普通读者追溯身份,应采用的链上数据结构是A.明文Merkle树B.零知识Merkle树C.公有链全明文D.私有链全明文答案:B解析:零知识Merkle树将用户身份哈希后上链,验证时通过zk-SNARK证明“某记录存在且属于某匿名身份”,既防篡改又保护隐私。4.2025年1月1日起施行的《未成年人网络保护条例》规定,平台向未成年人推送算法内容时,若单次推送时长超过多少分钟必须插入“强制休息”弹窗?A.15B.30C.45D.60答案:B解析:条例第十九条规定“连续推送时长达到30分钟”需触发休息提示,且每日22:00-次日6:00不得推送娱乐类内容。5.在OpenAIo1模型API调用中,若希望返回结果仅包含JSON且字段顺序固定,应在HTTP请求头中添加A.response_format={"type":"json_object"}B.response_format={"type":"text","schema":"strict"}C.seed=42&temperature=0D.response_format={"type":"json_object","schema":...}+seed固定值答案:D解析:o1从2025年4月起支持“schema+seed”双重锁定,既保证格式又保证字段顺序,仅A或C无法约束顺序。6.某高校使用国产开源模型“赤兔3.0”进行本地私有化部署,若要在推理阶段实现INT8量化且保持<1%的困惑度增幅,最佳校准数据集选择策略是A.随机抽取维基百科1000条B.领域语料+对抗样本C.训练集全量D.验证集全量答案:B解析:赤兔官方技术白皮书指出,领域语料保证分布一致,对抗样本可暴露量化误差,二者混合校准可将困惑度增幅压至0.7%。7.2025年5月,欧盟《人工智能法案》正式生效,其中将“用于生物识别的实时远程系统”划为A.极小风险B.有限风险C.高风险D.禁止类答案:C解析:法案附件三明确,除司法追逃等例外,公共场所实时生物识别属高风险,需履行合规评估、透明度报告、人工监督义务。8.在Python3.13中,新引入的“immortalobjects”机制主要解决A.GIL竞争B.小对象垃圾回收延迟C.跨解释器对象共享D.内存泄漏答案:C解析:immortalobjects通过引用位置计数器,使对象在多个子解释器间免拷贝共享,降低序列化开销,为PEP-703“no-GIL”铺路。9.某车企采集用户座舱语音用于优化降噪算法,根据《个人信息保护法》,其“单独同意”场景的最佳实现方式是A.购车时纸质一次同意B.车机首次弹窗+语音播报C.官网隐私政策更新D.4S店口头告知答案:B解析:法律第十三条要求“显著方式+易理解+可随时撤回”,车机弹窗配语音播报满足“显著”与“易理解”,且系统可记录时间戳与声纹,便于举证。10.2025年最新HTTP/3RFC9114修订版中,取消了对以下哪项的支持A.0-RTTB.serverpushC.QPACKD.连接迁移答案:B解析:serverpush在实际部署中利用率低且增加服务端复杂度,新修订版将其标记为“historic”,鼓励使用103EarlyHints替代。二、多项选择题(每题3分,共15分)11.以下哪些做法可有效降低大模型“提示词注入”风险?A.输入输出双重过滤B.使用系统级提示隔离C.随机化提示模板D.提升temperature答案:A、B、C解析:temperature升高会放大随机性,反而可能助长注入;双重过滤、系统提示、模板随机化均为OpenAI官方推荐防御手段。12.关于2025年发布的“数据元件”新型流通形态,下列描述正确的有A.可拆分权属B.可标准化定价C.可脱离场景独立存在D.可封装算法模型答案:A、B、D解析:中国信通院《数据元件白皮书》定义其“可确权、可定价、可封装”,但强调“场景绑定”,不可脱离业务语境。13.在IPv6+时代,以下哪些技术可实现“应用级网络切片”?A.SRv6B.Flex-AlgoC.G-SRv6D.VXLAN答案:A、B、C解析:VXLAN属于overlay技术,无法感知底层切片;SRv6及其压缩版G-SRv6、Flex-Algo均可基于SID实现应用级细粒度切片。14.关于“量子计算+AI”融合,2025年下列哪些场景已出现商业化试点?A.量子生成对抗网络B.量子强化学习C.量子大模型预训练D.量子优化求解物流答案:A、B、D解析:量子大模型预训练仍处实验室阶段;D-Wave与顺丰合作的量子物流调度、IBMQGAN生成药物分子、本源量子的量子强化学习炒股均已落地试点。15.在个人信息匿名化技术中,符合《GB/T42460-2023》“重识别风险低于0.05”要求的方法有A.差分隐私ε≤0.1B.K-匿名K≥20C.合成数据+隐私预算D.删除标识列答案:A、C解析:K≥20无法抵抗同质性攻击;删除标识列属去标识化,非匿名化;差分隐私ε≤0.1及合成数据在标准附录中风险估值<0.05。三、判断题(每题1分,共10分)16.2025年起,国内所有App如需使用第三方SDK,必须在备案系统“SDK公共服务平台”登记SDK数据出境情况。答案:正确解析:工信部2024年底发布的《SDK合规指引》要求,2025年1月起未登记SDK视为违规收集。17.“模型即服务”(MaaS)属于云计算服务形态,因此不受《人工智能法案》约束。答案:错误解析:法案第二条明确,无论部署在哪个层级,只要面向欧盟用户提供AI能力即需遵守。18.在Python中,使用“match”语句匹配字典时,键的顺序会影响匹配结果。答案:错误解析:字典匹配基于键值对内容,与顺序无关;CPython3.13虽保留插入序,但match语义不依赖顺序。19.2025年发布的Wi-Fi7标准中,MLO(多链路操作)允许终端同时关联2.4GHz与5GHz频段,从而将吞吐翻倍。答案:正确解析:MLO支持MAC层聚合,可将两频段视为独立链路,并行传输,实测可提升1.9倍。20.使用GitLFS存储大模型权重时,.gitattributes文件一旦提交便不可修改,否则历史版本会失效。答案:错误解析:.gitattributes可后续修改,GitLFS会按最新规则处理新提交,历史指针仍有效。21.“数字水印+区块链”方案中,若采用ERC-721存证,则水印哈希必须存储在链上元数据的image字段。答案:错误解析:image字段通常存URI,哈希可置于attributes或自定义字段,无强制要求。22.2025年,国家网信办发布《人脸识别支付安全要求》,规定人脸模板必须加密后分散存储于不同机房,且单机房泄露无法还原完整模板。答案:正确解析:要求采用Shamir秘密分享或同态加密分片,单份泄露无法获得可识别模板。23.在Linux内核6.8中,io_uring已支持自动回退至epoll,当内核内存不足时无需用户干预。答案:正确解析:6.8引入fallback机制,若注册buffer失败,自动切换至epoll路径,保证兼容性。24.使用Transformer架构进行时间序列预测时,将ReLU替换为GLU一定能降低RMSE。答案:错误解析:是否降低RMSE取决于数据分布与超参,GLU可能增加参数量导致过拟合。25.2025年起,所有在中国境内运营的生成式AI服务必须在“生成内容”字段添加隐式水印,水印强度≥30dB。答案:错误解析:国标仅推荐隐式水印,未规定强度;30dB为音频领域指标,不适用于文本图像。四、填空题(每空2分,共20分)26.2025年,国内首个“数据海关”试点落户________,其核心设施是“数据跨境流动监测塔”。答案:海南三亚解析:三亚崖州湾科技城搭建数据海关,实现跨境数据“事前评估、事中监管、事后溯源”。27.在PyTorch2.3中,pile默认后端为________,其采用________编译策略,首次编译耗时降低42%。答案:inductor;post-graffusion解析:inductor使用POST-GRAF融合pass,将多个小算子合并为Tritonkernel,减少Python回调。28.欧盟《人工智能法案》要求高风险AI系统必须建立“质量管理系统”,其中文档保存期限至少________年,且需支持________语言。答案:10;欧盟官方解析:法案第十七条,文档需保存十年,且随需提供任意欧盟官方语言版本。29.2025年,央行数字货币(CBDC)试点App新增“________”功能,可在离线状态下通过________芯片完成“碰一碰”双离线支付。答案:超级SIM;NFC-SWP解析:超级SIM集成SWP接口,支持断电0.3秒完成交易,上限500元。30.在Linux中,使用________命令可查看eBPF程序占用的JIT内存大小,单位为________。答案:bpftoolprogshow;bytes解析:bpftool输出中xlated_len即为JIT后字节数。31.2025年,国家数据局发布《“数据要素×”三年行动计划》,提出到2026年打造________个国家级数据交易所、________个行业数据枢纽。答案:10;50解析:计划明确“10+50”枢纽体系,覆盖工业、农业、交通、金融等八大领域。32.在Transformer中,位置编码RoPE的外推能力由________参数决定,2025年主流开源模型通常将其设为________。答案:theta;10000解析:RoPE通过θ控制波长,LLaMA3、Qwen2均沿用1e4。33.2025年,国内首个“隐私计算互联互通”国标编号为________,其定义了________层统一协议。答案:GB/T43697-2024;算法解析:标准规定算法层、通信层、管理层三统一,算法层优先。34.在IPv6地址中,前缀________被预留用于“数据元件”路由,其第二比特为________表示“可审计”。答案:2001:df8::/32;1解析:信通院草案将df8段第二比特置1表示审计属性,便于路由器识别。35.2025年,OpenAIo1模型API新增“________”参数,可强制返回可解析JSON且字段顺序固定,取值范围________。答案:seed;0-4294967295解析:seed为32位无符号整数,与temperature=0配合可完全复现输出。五、简答题(每题10分,共30分)36.场景:某三甲医院计划将50TB影像数据(含CT、MRI)用于训练肺结节检测大模型,数据分布于2007-2025年,涉及30万患者。请从“合规、技术、伦理”三个维度给出可落地的数据治理方案,需包含脱敏、授权、模型水印、审计四点细节。答案:合规:1.依据《个人信息保护法》第38条,影像属敏感个人信息,需取得“单独同意”。医院在PACS系统嵌入“电子知情屏”,患者扫码后触发语音播报,告知用途、保存期限、撤回方式,同意后生成哈希上链存证。2.数据出境评估:训练拟使用境外GPU云,需通过省级网信办“数据出境安全评估”,采用《GB/T37918-2019》进行风险自评,重点说明影像已脱敏、模型权重不含可识别信息。3.伦理审查:提交医院伦理委员会,附“重识别风险评估报告”,采用K-匿名≥100+差分隐私ε=0.05,模拟攻击者拥有50%外部知识,重识别概率<0.03,获批准号2025-IRB-05-078。技术:1.脱敏:使用“赤兔DICOM脱敏引擎”,自动擦除PatientName、PatientID,保留像素数据;对嵌私有标签(0x0019,0x0010)进行AES-256加密,密钥托管于医院HSM。2.训练:采用联邦学习+SwarmLearning混合架构,本地前置5台A800,每台缓存2TB缓存数据,使用Flower框架,聚合阶段加入DiffPriv噪声,噪声乘子0.7。3.模型水印:在UNet编码器第三层插入“幅度调制”水印,嵌入医院URN标识,触发条件为“结节置信度>0.9”,验证时提取BER<0.01即认定归属。4.审计:训练日志实时推送至“医疗AI审计链”,基于HyperledgerFabric,记录每批次MD5、时间戳、操作员证书,审计节点由卫健委、医院、律所三方维护,不可篡改。伦理:1.公平性:采样阶段按性别、年龄、地域分层,确保女性占比≥45%,农村患者≥20%,避免模型偏向城市男性。2.透明性:发布《肺结节AI白皮书》,公开模型架构、数据来源、评估指标,接受公众质询。3.撤回权:患者可在“健康山东”小程序一键申请“数据退出”,触发链上智能合约,48小时内完成模型重训练剔除,返还哈希证明。37.描述“数据元件”在跨省流通中的“三次加工、两次确权”模型,并给出技术实现示意图(文字描述)。答案:三次加工:第一次:原始数据→脱敏数据,由数据持有方在本地完成,采用可逆加密保留关联键,生成“数据指纹”上链。第二次:脱敏数据→特征元件,由省级数据枢纽运行“特征提取容器”,容器内嵌算法镜像,输出维度≤512维的向量元件,容器销毁后中间数据清零。第三次:特征元件→指标元件,由应用方(如银行)使用隐私求交+联邦统计,生成“逾期率预测元件”,元件为10KB大小、不可逆向。两次确权:首次确权:原始数据→数据持有方,颁发“数据资源登记证”,由国家发改委数据要素登记平台发放,确权内容包括数据名称、规模、更新频率、权利类型。二次确权:特征元件→数据枢纽与应用方共有,采用“可拆分NFT”,链上合约将所有权拆为70%(枢纽)+30%(应用方),收益按链上智能合约自动结算。技术实现示意图(文字):1.原始数据留在省A政务云,通过SRv6隧道加密传到省B枢纽,传输层使用IPSec+量子密钥,隧道ID写入数据元件元数据。2.枢纽侧启动TEE(IntelTDX),内部加载“特征提取镜像”,镜像哈希提前在联盟链公示,执行完成后返回结果签名。3.应用方在本地GPU节点调用“指标元件合约”,合约验证NFT份额后,释放计算权限,结果写入联盟链状态数据库,供审计。38.2025年,某市建成“城市级数字孪生操作系统”,需实时融合交通、气象、能源、社交四类数据,数据频率分别为1Hz、0.2Hz、0.5Hz、10Hz,总量每日新增80TB。请设计一套“流-批-图”一体化架构,满足毫秒级查询、分钟级更新、秒级容错,要求写出核心组件、数据流向、一致性策略。答案:核心组件:1.流层:ApacheFlink1.19,运行在城市边缘K8s,采用NiFi+SRv6ingress,按keyby(dataSource)分流,使用RockDB状态后端,checkpoint3s,exactly-once。2.批层:Spark3.5+DeltaLake3.0,部署在政务私有云,每日02:00触发增量MERGE,采用Z-Order排序,提升点查性能。3.图层:Neo4j5.x集群,存储道路、电网、社交关系,使用APOC触发器,当DeltaLake提交新版本时,自动调用storedprocedure更新图谱。4.统一元数据:PolarisCatalog,提供ACID语义,支持Flink、Spark、Neo4j三端同时查询,避免元数据漂移。5.查询层:PrestoDB0.289,通过Alluxio缓存热数据,SSD缓存温数据,冷数据下沉至HDD,P99延迟<50ms。数据流向:1.交通摄像头→5GMEC→Kafka→Flink→聚合为“路段速度”→写入DeltaLake+Redis缓存。2.气象站→LoRaWAN→Kafka→Flink→join交通数据→生成“湿滑指数”→写入Neo4j节点属性。3.电网负荷→MQTT→Flink→计算“区域负荷偏差”→触发图算法“最短供电路径”→结果写回Kafka供调度系统。4.社交签到→FlinkCEP→检测“人群异常聚集”→写入图关系“可能拥堵”→供交管部门app订阅。一致性策略:1.端到端exactly-once:Kafka开启幂等+事务,Flink两阶段提交,DeltaLake通过checkpoint+write-ahead-log。2.图库最终一致:Neo4j使用“异步只读副本”,DeltaLake提交后发送event至副本,副本在500ms内完成更新,允许短暂不一致,但提供“read-time-version”接口,用户可指定查询版本。3.故障恢复:Flinkcheckpoint保存在HDFS,K8s节点宕机时通过standbyscheduler在30s内重启,Neo4j副本自动晋升,RPO<30s,RTO<90s。六、综合设计题(25分)39.场景:2026年亚运会将在某市举行,组委会拟建设“亚运数字火炬”NFT发行平台,面向全球发行1万份动态火炬NFT,每份NFT可随比赛进程实时更新外观(颜色、特效),并支持“链上二次点火”社交互动。请完成以下设计:(1)技术选型:公链/联盟链选择、NFT标准、扩容方案;(2)数据架构:链上存储最小化、链下存储去中心化、缓存策略;(3)合规方案:KYC/AML、数据跨境、隐私保护;(4)安全设计:防盗刷、反女巫、智能合约审计;(5)运营策略:发行节奏、版税机制、碳中和方案。答案:(1)技术选型:采用“联盟链+公链”双轨:国内用户基于“长安链·亚运联盟链”,TPS≥5000,Gas为0;海外用户基于PolygonzkEVM,兼容ERC-721动态扩展(DynamicNFT)标准,使用ERC-6551为每个NFT绑定智能合约账户,实现“链上点火”社交。扩容:联盟链采用BFT-SMART,三阶段提交

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论