生成式人工智能政务服务应用管理规范(征求意见稿)_第1页
生成式人工智能政务服务应用管理规范(征求意见稿)_第2页
生成式人工智能政务服务应用管理规范(征求意见稿)_第3页
生成式人工智能政务服务应用管理规范(征求意见稿)_第4页
生成式人工智能政务服务应用管理规范(征求意见稿)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1T/ZSMXXXX—XXXX生成式人工智能政务服务应用管理规范本文件规定了生成式人工智能在知识问答、行政审批、公共服务政务服务应用中知识管理的基本原则、全生命周期知识管理、模型训练与优化、检索增强以及安全、合规伦理的要求。本文件适用于各级政务部门及相关机构在开展生成式人工智能政务服务应用中的知识获取、处理、存储、利用和更新等活动。典型生成式AI政务应用场景包括数据标注、AI问答、数字人、AI轮巡、风险分析等,其他相关应用场景和领域可参照执行。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T5271.28信息技术词汇第28部分:人工智能基本概念与专家系统GB/T5271.31信息技术词汇第31部分:人工智能机器学习GB/T41867—2022信息技术人工智能术语GB/T43697数据安全技术数据分类分级规则GB/T45652—2025网络安全技术生成式人工智能预训练和优化训练数据安全规范GB/T45654—2025网络安全技术生成式人工智能服务安全基本要求GB/T45958—2025网络安全技术人工智能计算平台安全框架3术语和定义GB/T5271.28、GB/T5271.31、GB/T41867—2022界定的以及下列术语和定义适用于本文件。3.1人工智能系统Artificialintelligencesystems(AI)针对人类定义的给定目标,产生诸如内容、预测、推荐或决策等输出的一类工程系统,简称AI。[来源:GB/T41867—2022,有修改]3.2生成式人工智能generativeartificialintelligence(GenerativeAI)能够生成文本、图片、音频、视频等多种形式内容的人工智能模型及其相关技术。3.3知识管理knowledgemanagement对知识的识别、获取、开发、存储、共享、应用和更新进行系统化、规范化管理的过程,旨在提升知识价值和组织效能。3.4提示工程promptengineering通过设计、优化输入文本(提示词)以引导生成式人工智能模型产生更准确、相关和有用输出的技术与实践。3.5数据标注dataannotation对政务数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的过程,是生成式AI政务应用训练数据准备的核心环节。3.6AI轮巡AIpatrol利用生成式AI技术对政务服务场景、数据、业务流程等进行自动化巡检、监测与分析的应用模式。T/ZSMXXXX—XXXX23.7政务知识问答governmentserviceknowledgeQ&A利用生成式AI整合政务知识库资源,为公众和企业提供在线政务咨询、问题解答的服务模式。4知识管理总则构建高质量、高可用、安全可控的政务知识体系,赋能生成式人工智能在知识问答、行政审批、公共服务及AI轮巡、风险分析、数字人等政务服务场景的应用,提升政务服务智能化水平、决策支持能力和公众满意度,同时确保全过程合法合规。4.2原则4.2.1合法合规:所有知识活动应严格遵守国家法律法规和标准规范,确保数据来源合法、处理合规。4.2.2安全可控:保障数据资产和AI应用的全链路安全,对敏感信息进行严格管控,应执行GB/T43697、GB/T45654等数据分级分类管理要求,确保输出的内容安全可靠。4.2.3质量至上:确保知识的准确性、时效性、一致性和权威性,应建立政务部门主导的严格质量审核机制,保障AI生成内容与政务业务要求的匹配。4.2.4场景导向:知识管理与政务服务具体场景深度结合,应针对知识问答、行政审批、公共服务等不同类型制定差异化的知识管理规范,符合实际业务需求。4.2.5以人为本:知识管理和AI应用设计应服务于公众和公务人员,流程便于理解和操作,畅通用户反馈渠道,并以用户满意度为核心优化知识体系和AI模型。4.2.6迭代演进:应建立知识与模型的持续评估、反馈和优化机制,将知识库预训练中的非核心内容纳入后续持续改进,动态适应政务业务发展和政策变化。5分场景知识全生命周期管理5.1知识规划与采集5.1.1通用要求:政务部门应基于具体政务服务场景需求,制定知识图谱规划,明确知识来源、类型和采集策略,建立知识采集台账,记录知识来源、采集日期、采集人等信息,确保全程可追溯。5.1.2分场景差异化采集:各个应用类型的核心知识需求、数据来源和采集要求详见表1。表1分类场景差异化采集表5.1.3数据标注采集:政务部门应按照《关于促进数据标注产业高质量发展的实施意见》(发改数据〔2024〕1822号)等要求,编制公共数据标注目录,针对AI问答、数字人、风险分析等场景的多模态T/ZSMXXXX—XXXX3数据(文本、语音、图像等),明确标注标准和要求,组织开展标注数据采集,确保标注数据与业务场景高度匹配。5.2知识整理与加工5.2.1对采集的知识进行去重、纠错、补全缺失信息、解决描述矛盾等处理,行政审批场景应重点校验审批要件、裁量标准的一致性;知识问答场景应确保答案与政策依据的对应性。5.2.2应进行常态化时效性检查,识别并剔除过期政策、流程、标准等内容,对具有明确时效性的知识进行显著标注;行政审批和公共服务场景的知识应与政策调整、事项变更同步更新,确保无过期知识入库。5.2.3应严格处理敏感个人信息,遵循最小必要原则,仅保留完成特定政务任务所需的最少量敏感信息;采用匿名化、去标识化等技术处理敏感个人信息,行政审批场景的历史审批案例应隐去企业和个人敏感信息,风险分析场景不得采集未脱敏的核心数据。5.2.4按照业务领域、应用场景、知识类型、使用频次等维度对知识进行科学分类和标签化,政务部门应制定统一的分类和标签规范,具体要求:——知识问答场景:按“业务领域-问题类型-政策层级”标签化;——行政审批场景:按“审批事项-办理环节-裁量标准”标签化;——公共服务场景:按“服务类型-办理渠道-受众群体”标签化;——数字人、AI轮巡等场景:增加“模态类型(文本/语音/图像)-应用终端”标签。5.2.5应进行多维度知识检查,涵盖包括但不限于:——标题完整性检查,如确保标题全面且准确等;——回答内容正确性检查,如核实信息无误,避免争议或模糊表述等;——回答内容完整性检查,如确保回答紧密围绕主题,防止偏离或答非所问等,——回答内容语法与逻辑性检查,如审查逻辑性和连贯性,保证描述流畅自然;数字人、AI问答场景的知识需符合口语化沟通规范等;——以及整体有效性检查,如关注时效性,确保引用的政策和数据均为最新。5.2.6知识入库前应经过正确性、合理性和一致性验证:——正确性验证,确保整理后的知识与原始内容一致无偏差;——合理性验证,评估知识在特定情境下的适用性和合理性;——一致性验证,全面检查知识库中的各项知识以确保彼此间不存在矛盾或冲突。5.3知识入库与储存5.3.1应设计结构化的知识库框架,支持高效存储和检索。5.3.2应建立知识库管理系统,实现知识的增、删、改、查、版本管理等功能。5.3.3应建支持多模态知识存储,针对数字人、AI轮巡等多模态应用场景,知识库应支持文本、语音、图像、视频等多种格式知识的存储,建立多模态知识关联机制,确保不同模态知识的一致性。5.4知识评估与更新5.4.1应建立定期审查制度(如每季度),及时更新和淘汰过时知识。5.4.2新知识融入时,应确保与现有知识关联融合,避免冲突。5.4.3应详细记录知识的版本变更历史,支持回溯和恢复。5.4.4应建立内部评审、外部评审、用户反馈三位一体的评价机制,畅通反馈渠道,收集各类意见用于知识优化:——内部评审:设立专职团队,实施多级审核,可利用自动化工具辅助检查;——外部评审:引入第三方机构、领域专家进行独立评估,通过公众平台收集意见;——用户反馈:在AI问答、数字人、政务服务网等渠道提供线上评分、反馈入口和人工客服渠道,收集用户日常反馈,建立用户反馈台账。5.4.5应建立持续改进计划,对反馈问题进行跟踪处理,定期回顾总结优化策略。6模型训练、优化与检索增强T/ZSMXXXX—XXXX46.1训练数据准备6.1.1应基于第5章处理后的高质量、结构化知识库,结合AI应用积累的用户交互数据、业务办理数据、反馈数据构建微调数据集,数据来源合法合规,确保可追溯。6.1.2应依据政务任务需求训练数据,组织开展微调数据标注工作,制定符合政务场景的标注标准,明确标注规则和质量要求,对标注数据进行质量检验,不合格数据不得用于模型微调;针对AI问答、数字人等场景的多模态数据,应进行跨模态一致性标注。6.2模型选择与微调6.2.1可根据业务需求选择通用大模型进行领域微调,或选用在金融、法律等严肃领域表现优异的行业模型,注入领域知识。6.2.2微调过程应重点提升模型的指令遵循能力和输出内容的合规性,确保其回答严谨、中立;针对数字人、AI轮巡等场景,应优化模型的多模态生成能力和实时分析能力。6.2.3应将知识库预训练内容进行拆分,核心政策、基础业务流程、法定审批要件等固定内容纳入初始微调,高频问题、场景化话术、风险分析模型参数、数字人交互规范等非核心、动态变化内容纳入后续持续改进,不纳入初始微调范围。6.3检索增强应应用检索增强生成技术,使生成式人工智能在回答时能优先检索并依据知识库中的最新、权威信息生成答案,提高准确性和可解释性。6.4提示工程6.4.1应设计和优化提示模板,引导模型生成更符合政务语境的回答。6.4.2应支持复杂问题拆分、上下文感知和多轮对话,提升用户体验。6.5运行监控与持续优化6.5.1应对模型运行状态进行实时监控,跟踪响应时间、准确率、召回率、用户满意度、错误率等关键指标,针对AI轮巡、风险分析场景,额外监控巡检覆盖率、风险识别准确率、处置及时率等指标;建立监控台账,发现指标异常及时触发优化流程。6.5.2应定期分析模型运行日志和用户反馈,发现潜在的知识盲区、模型偏差、场景适配不足等问题,及时触发知识更新或模型微调流程;行政审批场景重点识别模型对裁量标准的理解偏差,知识问答场景重点识别高频错误答案。7安全、合规与伦理要求7.1数据安全与隐私保护7.1.1数据分级分类管理7.1.1.1应按照GB/T43697建立数据分级分类制度,明确界定核心数据、重要数据、一般数据及个人信息的级别和处理规范。7.1.1.2应对不同级别的数据实施相应的访问控制、加密存储和传输安全策略。7.1.2全生命周期安全管控7.1.2.1应按照GB/T45652、GB/T45654、GB/T45958相关要求规范生成式人工智能的数据、服务和平台安全7.1.2.2在数据的采集、传输、存储、处理、销毁的全生命周期中,应采取与其安全级别相匹配的保护措施。7.1.2.3知识库访问应遵循最小权限原则,实行严格的权限管理,确保数据不被未授权访问或篡改。7.1.2.4系统操作日志应完整记录,应确保所有数据访问和处理行为可审计、可追溯。7.1.3敏感信息处理T/ZSMXXXX—XXXX57.1.3.1不应使用涉及国家秘密、工作秘密和未脱敏的个人敏感信息的数据进行模型训练和调试。7.1.3.2在业务必需时,应对无法避免的个人信息进行如替换、掩码等严格的脱敏或匿名化处理,处理后的信息应无法识别特定自然人且不可复原。注:个人敏感信息如身份证号、银行卡号、详细住址、生物特征、医疗健康信息等。7.2内容合规性控制7.2.1内容安全机制7.2.1.1应建立“内容安全过滤”模块,集成或采用敏感词库、内容风控模型等技术,在输出生成前或发布前对生成内容进行实时检测与过滤。7.2.1.2应重点防范和阻断生成虚假信息、错误政策、歧视性言论、商业广告、恶意代码及违反公序良俗的内容。7.2.2人工审核与复核7.2.2.1对于关键政务信息、重大政策解读等内容的生成,应建立AI初审+人工终审的双层审核机制,对于关键政务信息、重大政策解读、行政审批意见等内容的生成,必须进行人工审核复核。7.2.2.2对于模型处理不了或置信度低的复杂、敏感查询,应流畅地引导至人工客服渠道。7.2.3应急响应流程7.2.3.1应制定应急预案,明确在发现模型持续生成有害、不实信息或系统被恶意利用时的处置流程。7.2.3.2应建立与网信、公安等部门的信息上报与联动机制,确保对重大安全事件能快速响应。7.3算法公平性与透明度7.3.1公平性保障7.3.1.1在数据整理和模型训练阶段,应主动识别并修正数据中可能存在的样本偏差和标签偏见,防止模型放大现实偏见。7.3.1.2应定期使用包含不同群体特征的测试用例对模型进行公平性审计,评估其输出是否存在歧视性倾向,确保AI应用对所有用户公平公正。7.3.2透明度与可解释性7.3.2.1系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论