版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
工业大数据与人工智能HFUT12第三章
机器学习基础
3.4.1.可信人工智能的概述3.4.2,可信人工智能的框架3.4.3.可信人工智能的支撑技术3.4.可信人工智能人工智能系统稳定性技术人工智能可解释性增强技术人工智能隐私保护技术人工智能公平性技术3可信人工智能
人工智能的应用不断深入改变生产生活,成为了信息基础设施的重要组成部分。但在人工智能推动社会发展和提高工作效率的同时,也暴露出一些风险隐患。因此,发展可信人工智能已成当务之急。2019年6月,二十国集团(G20)提出“G20人工智能原则”,在其五项政府建议中明确提出“促进公共和私人对人工智能研发的投资力度,以促进可信赖的人工智能(TrustworthyArtificialIntelligence)的创新;需创建一个策略环境,为部署值得信赖的人工智能系统开辟道路。”4可信人工智能的概述可信人工智能需要抵抗多个方面的风险:安全风险:深度学习算法可能存在设计缺陷,易受外部攻击,例如对抗样本攻击可以误导模型做出错误的决策。隐私风险:在大规模数据驱动的人工智能应用中,数据的采集、存储和使用过程中,如果不加以适当管理,很容易造成个人隐私的泄露。5可信人工智能的概述公平风险:人工智能系统在学习和决策过程中可能复制并放大社会偏见,导致不公平的对待某些人群。因此,需要在算法开发阶段就考虑公平性问题,监测和消除数据集中的歧视性因素。可解释风险:复杂的深度学习模型往往被视为“黑箱”,其决策过程难以被人理解和解释,这不仅影响公众对人工智能的信任,也制约了其在监管严格的行业(如医疗、金融等)中的应用。6可信人工智能的框架对人工智能要求的可信特征聚焦于五个方面:透明性要求人工智能决策过程可见并可理解;安全性需要系统应具备抵御攻击和故障的能力,确保稳定运行;公平性强调避免算法偏见和歧视,确保对所有用户或实体的公正对待;可问责性要求明确人工智能决策的责任归属;隐私保护则关注用户数据的保护和合法合规使用;7可信人工智能的框架8可信人工智能的支撑技术:人工智能系统稳定性技术随着技术的不断成熟,针对人工智能系统的攻击手段也在不断进化和多样化,其中包括但不限于中毒攻击、对抗攻击和后门攻击。中毒攻击(PoisoningAttack):这类攻击通常发生在模型训练阶段,攻击者故意向训练数据集中添加“中毒”样本,以诱导模型学习到错误的模式或偏向性。对抗攻击(AdversarialAttack):攻击者通过微小且针对性的扰动(对人眼几乎不可察觉)来欺骗模型,使原本可以正确识别的对象被误分类。。后门攻击(BackdoorAttack):一种更为隐蔽的攻击手段,攻击者通过在训练数据中植入后门触发器,使得模型在遇到特定触发条件下会产生预设的错误输出,从而操控AI系统的行为。9可信人工智能的支撑技术:人工智能系统稳定性技术
针对这些攻击,研究者们提出了多种防御策略:一些工作提出通过异常数据检测,检测和移除训练数据中的对抗样本、中毒样本和后门样本,净化训练数据集,以降低攻击的影响。通过在对抗样本上进行对抗训练,让模型学会抵抗轻微扰动,来抵抗对抗攻击。通过优化模型结构、剪除冗余或可疑的模型组件,以及检测并移除潜在的后门触发器,来强化模型的安全性的方法。10可信人工智能的支撑技术:人工智能可解释性增强技术
可解释性暂无数学上的确切定义,这里引用TimMiller的定义:可解释性是人们能够理解决策原因的程度。可解释人工智能的沟通需求可以分为三个层次:第一层可解释性,是智能体要有自省与自辩的能力,如何解析模型内部结构和参数。第二层可解释性是智能体要有对人类进行有效沟通和适应的能力,模型不仅应该能提供决策结果,还要能够用人类易于理解的语言或形式解释其决策理由。第三层可解释性要求智能体能够建立简洁明了的模型来解释复杂的决策过程。11可信人工智能的支撑技术:人工智能可解释性增强技术机器学习可解释性的方法可以从多个维度进行分类:1.本质的(Intrinsic)和事后的(Post-hoc)2.特定于模型还是模型无关3.局部(Local)和全局(Global)12可信人工智能的支撑技术:人工智能可解释性增强技术可解释性的评估则有三个层次:应用级评估:这是最贴近真实场景的评估方法,直接在实际应用环境中测试模型的可解释性。人员级评估:这种方法成本较低,更适合大规模试验,用于了解大众用户对模型解释的理解程度和接受度。功能级评估:侧重于模型自身特性和解释结构的量化分析,而不是通过用户主观反馈。13可信人工智能的支撑技术:人工智能隐私保护技术
在银行业务、电信服务、医疗健康等诸多领域,通过大数据分析和机器学习模型,可以为用户提供精准的服务,如信用评估、疾病诊断等。这些过程中产生的模型和数据隐私保护需求尤其不容忽视。模型隐私保护主要是为了避免具有商业价值的高质量模型被非法获取和滥用,保护企业知识产权和竞争优势。数据隐私保护则直接受法律法规约束,例如我国民法典和网络安全法对个人信息保护做出了明确规定,要求数据处理者在使用个人数据时必须遵循合法、正当、必要的原则,采取必要措施保护数据主体的隐私权益。14可信人工智能的支撑技术:人工智能隐私保护技术
针对隐私泄露问题,学界提出了多种隐私保护技术,其中差分隐私和联邦学习是两种主流策略。差分隐私:通过向数据添加
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中八年级英语下册Unit 5‘Green World’第四课时 综合技能与任务教学设计
- 初中物理八年级下册《弹力与重力》期中专题复习教案
- 小学五年级英语下册 Unit 1 My Day B Let's Learn 任务型语言教学导学案
- 小学五年级英语下册:日期询问与校园活动日程表达教学设计
- 2026山西晋中市寿阳县国有资本运营有限公司及下属公司中高层管理人员招聘12人备考题库带答案详解(完整版)
- 2026海南海口市秀英区疾病预防控制中心招聘事业编制人员9人备考题库附答案详解(轻巧夺冠)
- 2026年芜湖学院博士及高层次人才招聘备考题库及答案详解(名师系列)
- 2026山东济南市中心医院招聘博士研究生(控制总量)70人备考题库及参考答案详解(预热题)
- 2026四川泸州龙马潭区人民医院招聘3人备考题库附参考答案详解(综合卷)
- 2026山东潍坊市上半年政府专职消防员招录109人备考题库附参考答案详解(精练)
- 2025年天津春考真题及答案技术
- 饮料包装货品知识培训课件
- 门店2人合伙合同范本
- 血站院感培训课件
- 电商直播情境下消费者冲动购买行为研究
- T/CCMA 0133-2022高尔夫球车
- 国家电网有限公司输变电工程通 用设计(330~750kV输电线路绝缘子金具串通 用设计分册)2024版
- 异位妊娠失血性休克的护理
- 钱款赠与合同范例格式
- 亚硝酸钠的化学性质和应用考核试卷
- 小记者改稿培训
评论
0/150
提交评论