




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大模型平台与应用安全防护—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御目录—大模型安全攻防Re景二大模型安全威胁分析三平台与应用安全防御分享内容大模型发展大型语言模型(LLM)深度学习模型,属于NLP领域包含数干亿(或更多)参数目的是理解和生成自然语言大模型应用大模型平台大模型开源ChatGPT因应用漏洞泄漏1.2%用户聊天数据,当天下线修复,OpenAICEO致歉LLama-65B模型开源意外泄漏内部信息,
Huggingface
CEO声明禁止继续传播大模型企业等因为推理组件RAY漏洞被攻击者“劫持”平台算力,损失超10亿美元大模型风险—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御分享内容Hugging
Face组件漏洞(官方评级:严重)黑客通过窃取代码、模型和训练数据攻击大模型平台:供应链组件漏洞攻击大模型应用:恶意Prompt攻击攻击客户端黑客通过ChatGpt恶意Prompt钓鱼,窃取隐私攻击服务端通过恶意Prompt攻击大模型应用服务器新技术演进攻击技术随着功能发展而更新检索增强(RAG)思维链(COT)智能体架构(Agent
Server)终端助手(Computer
Use)MCP安全技术演进:利用智能体(Agent)风险利用Agent
Server缺陷利用OpenAI
Gpts沙箱的权限配置缺陷,窃取智能体预设Prompt工程和知识库Agent技术引入规划:预设Prompt工程(COT),拆解任务记忆:知识库,short-term
如多轮对话、long
term
如用户习惯工具:插件/接口,文档解析、代码执行技术演进:利用思维链(COT)风险利用COT缺陷在ChatGPT对话中污染COT,嵌入恶意行为COT技术引入牺牲时间提升准确:分步骤细分复杂问题为一系列更小、更简单的任务利用检索让攻击者也“意外”场景采纳搜索增强推荐“钓鱼网站”中的脚本网络钱包失窃RAG技术引入幻觉:模型受训练数据限制,提供虚假的信息新闻:模型受训练时间限制,提供过时的信息技术演进:利用搜索增强(RAG)风险利用Computer
Use给客户种马作恶不再“绕圈”终端控制技术引入移动端:如智能点餐PC端:如智能办公技术演进:智能助手(Computer
Use)风险技术演进:MCP安全风险工具投毒攻击示例投毒工具描述:人不会留意,但大模型会读取—大模型安全攻防背景二大模型安全威胁分析三平台与应用安全防御分享内容应用:恶意Prompt防护大模型对话场景传统waf不适用误杀:正常对话往往包含攻击代码漏杀:恶意对话往往不包含攻击代码意图识别后使用安全子模型防护规则库安全子模型应用:恶意Prompt对抗方案基于大语言模型基于传统机器学习引擎基于正则引擎说明基于大模型知识底座,利用SFT、Prompt工程、知识库等进行恶意攻击场景识别。利用机器学习算法对大量的正常和恶意流量进行分析,对恶意流量分类基于专家经验针对各种攻击类型提炼的特征正则,对流量进行正则特征匹配检测。优点维护成本低有安全知识基础场景泛化能力极强无需规则维护一定程度泛化开发成本低更新成本低缺点幻觉消除成本高分析结论不稳定数据量和质量要求高不同攻击类型单独训练规则数量大维护难检测效果维护效率泛化能力安全对抗查杀分离:捕获尝试绕过防护的高水平对手运营提效:垂类大模型能力刻画攻击链路辅助研判服务端安全安全沙箱技术RCE:代码执行器、Agent
WorkFlow(LangChain)SSRF:文件解析、日历/地图(Tools)ChatGPT利用代码器
•
GPT4随之上线代码沙箱进行数学运算将有风险的插件在沙箱中安全运行服务端安全沙箱应用安全架构:K8s+容器+沙箱安全配置:网络隔离、用户隔离产品沙箱类型网络隔离敏感信息清理多用户隔离逃逸难度O*gVisor内核级D*pyodide进程级C*Bubblewrap进程级W*FC/FC
VS
SandBox
探讨优:解决了沙箱管理问题(ms级启动)劣:用户隔离(云SDK+云密钥,难以每一个用户分配独立的空间)服务端安全安全沙箱应用关注点安全配置网络隔离,简单插件直接禁网,复杂插件通过SideCar/Proxy白名单网络访问权限控制,非Root运行安全调度使用后还原(用户文件、环境变量)用户不同时占用同一个沙箱安全运维沙箱自身安全漏洞修复dify
sandbox安全沙箱逃逸
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届江苏省仪征市古井中学九年级化学第一学期期中质量检测试题含解析
- 课件上传后不显示问题解决
- 山西省朔州市右玉县2026届九年级化学第一学期期中调研模拟试题含解析
- 滴滴代驾安全知识培训课件
- 2026届浙江杭州西湖区四校联考化学九上期中调研模拟试题含解析
- 课件《鱼游到纸上来了》
- 课件《春潮》教学课件
- 湖北省武汉市求新联盟联考2026届化学九年级第一学期期中学业水平测试试题含解析
- 陕西省西安市碑林区西北工大附中2026届九年级化学第一学期期中联考试题含解析
- 安装工安全生产培训内容课件
- 开展VIP商务旅客服务的项目策划书
- 常见症状-抽搐与惊厥的诊断评估(诊断学课件)
- 影视剧摄制组财务管理制度
- 四年级下册英语人教PEP版课件Let's talk-Look,ask and answer
- 甘肃省地方课程四年级健康成长教案
- 防触电技术课件完整版
- 导游资格考试(导游业务)试题及答案
- 不对称高压脉冲轨道电路讲义课件
- 一年级上册数学10以内分成作业
- 第二单元 劳动最光荣 课件32张 统编版高中语文必修上册
- 教师资格证(高中英语)学科知识点归纳总结
评论
0/150
提交评论