版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大模型平台与应用安全防护—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御目录—大模型安全攻防Re景二大模型安全威胁分析三平台与应用安全防御分享内容大模型发展大型语言模型(LLM)深度学习模型,属于NLP领域包含数干亿(或更多)参数目的是理解和生成自然语言大模型应用大模型平台大模型开源ChatGPT因应用漏洞泄漏1.2%用户聊天数据,当天下线修复,OpenAICEO致歉LLama-65B模型开源意外泄漏内部信息,
Huggingface
CEO声明禁止继续传播大模型企业等因为推理组件RAY漏洞被攻击者“劫持”平台算力,损失超10亿美元大模型风险—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御分享内容Hugging
Face组件漏洞(官方评级:严重)黑客通过窃取代码、模型和训练数据攻击大模型平台:供应链组件漏洞攻击大模型应用:恶意Prompt攻击攻击客户端黑客通过ChatGpt恶意Prompt钓鱼,窃取隐私攻击服务端通过恶意Prompt攻击大模型应用服务器新技术演进攻击技术随着功能发展而更新检索增强(RAG)思维链(COT)智能体架构(Agent
Server)终端助手(Computer
Use)MCP安全技术演进:利用智能体(Agent)风险利用Agent
Server缺陷利用OpenAI
Gpts沙箱的权限配置缺陷,窃取智能体预设Prompt工程和知识库Agent技术引入规划:预设Prompt工程(COT),拆解任务记忆:知识库,short-term
如多轮对话、long
term
如用户习惯工具:插件/接口,文档解析、代码执行技术演进:利用思维链(COT)风险利用COT缺陷在ChatGPT对话中污染COT,嵌入恶意行为COT技术引入牺牲时间提升准确:分步骤细分复杂问题为一系列更小、更简单的任务利用检索让攻击者也“意外”场景采纳搜索增强推荐“钓鱼网站”中的脚本网络钱包失窃RAG技术引入幻觉:模型受训练数据限制,提供虚假的信息新闻:模型受训练时间限制,提供过时的信息技术演进:利用搜索增强(RAG)风险利用Computer
Use给客户种马作恶不再“绕圈”终端控制技术引入移动端:如智能点餐PC端:如智能办公技术演进:智能助手(Computer
Use)风险技术演进:MCP安全风险工具投毒攻击示例投毒工具描述:人不会留意,但大模型会读取—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御分享内容应用:恶意Prompt防护大模型对话场景传统waf不适用误杀:正常对话往往包含攻击代码漏杀:恶意对话往往不包含攻击代码意图识别后使用安全子模型防护规则库安全子模型应用:恶意Prompt对抗方案基于大语言模型基于传统机器学习引擎基于正则引擎说明基于大模型知识底座,利用SFT、Prompt工程、知识库等进行恶意攻击场景识别。利用机器学习算法对大量的正常和恶意流量进行分析,对恶意流量分类基于专家经验针对各种攻击类型提炼的特征正则,对流量进行正则特征匹配检测。优点维护成本低有安全知识基础场景泛化能力极强无需规则维护一定程度泛化开发成本低更新成本低缺点幻觉消除成本高分析结论不稳定数据量和质量要求高不同攻击类型单独训练规则数量大维护难检测效果维护效率泛化能力安全对抗查杀分离:捕获尝试绕过防护的高水平对手运营提效:垂类大模型能力刻画攻击链路辅助研判服务端安全安全沙箱技术RCE:代码执行器、Agent
WorkFlow(LangChain)SSRF:文件解析、日历/地图(Tools)ChatGPT利用代码器
•
GPT4随之上线代码沙箱进行数学运算将有风险的插件在沙箱中安全运行服务端安全沙箱应用安全架构:K8s+容器+沙箱安全配置:网络隔离、用户隔离产品沙箱类型网络隔离敏感信息清理多用户隔离逃逸难度O*gVisor内核级D*pyodide进程级C*Bubblewrap进程级W*FC/FC
VS
SandBox
探讨优:解决了沙箱管理问题(ms级启动)劣:用户隔离(云SDK+云密钥,难以每一个用户分配独立的空间)服务端安全安全沙箱应用关注点安全配置网络隔离,简单插件直接禁网,复杂插件通过SideCar/Proxy白名单网络访问权限控制,非Root运行安全调度使用后还原(用户文件、环境变量)用户不同时占用同一个沙箱安全运维沙箱自身安全漏洞修复dify
sandbox安全沙箱逃逸
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026中国农业大学后勤保障处宿舍服务部(西区)合同聘用制C岗人员招聘4人备考题库及答案详解一套
- 2026四川绵阳科技城科技服务有限责任公司下属子公司招聘3人备考题库及答案详解1套
- 2026广州市花都建筑设计院有限公司第二次招聘1人备考题库及1套参考答案详解
- 2026四川广安市华蓥市定向招聘社区工作者4人备考题库及一套完整答案详解
- 2026江苏苏州市相城区引进教育管理人才和骨干教师8人备考题库及1套完整答案详解
- 2026湖北三峡航空学院辅导员岗、行政岗招聘16人备考题库含答案详解
- 广元市特种设备监督检验所2026年第二批检验检测人员招聘备考题库(6人)完整答案详解
- 2026广东广州市花都区行业工会联合会招聘工会社会工作者2人备考题库及完整答案详解一套
- 2026广西钦州市第四中学后勤工人招聘备考题库及一套答案详解
- 2026北京顺义区南彩社区卫生服务中心第二次招聘编外人员2人备考题库附答案详解
- 仁爱科普版(2024)八年级下册英语期末复习:Unit 7-12作文 专项测试卷(含答案范文)
- 广东省深圳市龙岗区2025-2026学年初三年级中考适应性考试语文试题卷(含答案)
- 教科版小学三年级科学下册第三单元《只有一个地球》每节课教案汇编(含九个教案)
- 肝脏肿瘤疾病科普
- 2026年国开电大会计信息系统(本)形考测试卷含答案详解【培优】
- 2026年河南洛阳市中考生物考试真题及答案
- 压强(教学课件)-2025-2026学年人教版物理八年级下学期
- 中国成人2型糖尿病合并心血管疾病患者降糖药物应用专家共识课件
- 西安市自来水公司招聘试题
- 雨课堂学堂在线学堂云《创新思维与创业实验(东南)》单元测试考核答案
- 胰腺癌手术期管理国际指南解读
评论
0/150
提交评论