Stable Diffusion AI绘画实战(微课版)-项目4 Stable Diffusion 模型_第1页
Stable Diffusion AI绘画实战(微课版)-项目4 Stable Diffusion 模型_第2页
Stable Diffusion AI绘画实战(微课版)-项目4 Stable Diffusion 模型_第3页
Stable Diffusion AI绘画实战(微课版)-项目4 Stable Diffusion 模型_第4页
Stable Diffusion AI绘画实战(微课版)-项目4 Stable Diffusion 模型_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Project4项目4StableDiffusion模型StableDiffusionAI绘画实战(微课版)掌握模型生态·提升创作能力高等院校艺术设计精品系列教材人民邮电出版社LEARNINGOBJECTIVES学习目标知识目标模型体系:了解StableDiffusion的模型生态与分层协作架构功能定位:理解Checkpoint、VAE、LoRA、Embedding模型的核心功能管理方法:掌握模型文件的下载、安装与科学管理策略能力目标Checkpoint应用:使用主模型确定生成图像的风格与质量VAE优化:配置外挂VAE模型优化色彩表现与细节清晰度LoRA微调:使用LoRA模型调整图像风格和细节表现Embedding修复:使用Embedding模型优化反向提示词避免缺陷素养目标版权意识:提高版权规范意识,尊重模型作者的劳动成果工作流思维:增强工作流意识,建立系统化创作流程生态观念:养成技术生态观念,理解模型间的协作关系理论与实践结合·培养综合能力项目4·StableDiffusion模型PROJECTINTRODUCTION项目引入:AI的雕刻艺术在AI的"雕刻"下,随机噪声逐渐显化为瑰丽图像,这离不开各类模型的作用。项目核心内容模型体系从基础的Checkpoint模型到微调工具链,全面解析不同类型模型的定位和功能选择策略掌握模型选择的核心原则,根据创作需求精准匹配最适合的模型组合使用方法通过实战演练掌握各类模型的使用方法和流程,提升操作熟练度能力提升逐步提升工业级AI创作能力,实现从入门到精通的跨越式进步AI生成艺术作品示例学习目标掌握StableDiffusion模型生态的完整知识体系,建立"主模型定基调、辅助模型增细节"的分层协作意识,培养系统化的模型选择与组合能力,为后续复杂AI绘画创作奠定坚实基础。SECTION4.1进一步了解StableDiffusion的模型模型生态的多样性是实现高效、高质量生成的核心01模型体系架构02模型下载安装03实践应用技巧4.1.1MODELSYSTEM模型体系:分层协作体系StableDiffusion模型生态是分层协作体系,模型通常按照功能角色分为三大类:主模型提供基础能力,辅助模型增强可控性与提高效率,专用模型满足垂直场景需求。主模型Checkpoint作为生成图像的基础框架,包含完整的扩散模型结构和权重参数,决定生成图像的核心风格与质量。anything-v5(二次元)majicmixRealistic_v7(写实)GuoFeng3(国风)辅助模型Fine-tuning在主模型基础上精细控制特定属性,增强可控性与提高效率。VAE-提升色彩饱和度LoRA-微调特定风格Embedding-优化提示词ControlNet-精准控制构图专用模型Specialized满足垂直场景需求,针对特定应用场景进行优化。Motion-动态效果Poses-3D骨骼控制ESRGAN-超分辨率修复Art-艺术创作分层协作架构主模型作为基础引擎,辅助模型进行精细化控制,专用模型满足特定场景需求,三者协同工作,构建完整的StableDiffusion模型生态系统。表4-1常用的辅助模型类型模型类型核心功能典型应用VAE提升色彩饱和度和细节清晰度,优化图像视觉效果修复模糊图像,增强质感,改善色彩发灰问题LoRA微调特定风格、人物特征或概念,轻量化快速适配定制人物特征(如发型、服饰)或画风转换LyCORIS增强版LoRA,精确控制细节(如手势、表情)角色表情微调、手势生成、精确姿态控制Embedding增强提示词理解能力,避免负面元素,打包复用提示词反向提示词优化,避免手部畸形、面部扭曲ControlNet精准控制构图与结构,基于边缘、深度、姿态等条件生成工业设计、姿势控制、线稿上色、建筑可视化模型协作辅助模型通常与Checkpoint模型配合使用,实现更精细的生成控制获取渠道可从Civitai、HuggingFace及国内模型社区获取高质量辅助模型灵活组合可同时使用多个辅助模型,实现更复杂和精细的生成效果4.1.2MODELMANAGEMENT模型的下载和安装在线下载秋葉aaaki整合包提供的AI绘世启动器的"模型管理"界面支持在线下载部分模型文件。1切换到不同类型的模型标签页2选择并下载相应的模型文件3下载的模型自动放到对应目录中4成功下载的模型会自动勾选"本地"手动安装从其他渠道获取模型文件,将模型文件手动复制到相应的模型目录中完成安装。Checkpoint:models\Stable-diffusionVAE:models\VAELoRA:models\LoraEmbedding:embeddings如果是在StableDiffusion运行状态下安装,需单击刷新按钮重新加载模型国内模型下载渠道推荐LiblibAI丰富的模型资源吐司国内热门模型站阿里魔搭官方模型库百度飞桨AIStudio星河哔哩哔哩B站模型分享SECTION4.2使用Checkpoint模型模型是通过大量训练使AI掌握各类图像特征信息的文件文件格式了解.ckpt与.safetensors格式的区别,优先使用.safetensors格式模型分类按架构、风格、应用场景多维度分类,精准选择适合的模型使用方法掌握模型选择、加载、管理的完整操作流程和最佳实践实战演练通过多个实战案例掌握不同风格图像的生成技巧4.2.1FILEFORMATS&NAMINGCheckpoint模型文件格式与命名模型文件格式Checkpoint模型主要有两种文件格式,优先使用.safetensors格式,安全性更高、加载速度更快。.ckptCheckpoint格式特点:保存完整训练状态(权重、优化器参数、训练步数)缺点:体积大,存在潜在安全风险(可能包含恶意代码)命名:通常包含训练步数/周期数(如checkpoint-500.ckpt).safetensors推荐格式特点:仅存储权重,体积小、加载快优势:无代码注入风险,安全性高命名:侧重模型用途描述(如realistic_vision_v6.safetensors)模型文件名中的特定字段模型文件名中可能包括多个用下划线或连字符分隔的字段,理解这些字段有助于快速识别模型特性。模型架构SD1.5-经典架构SD2.1-升级版本SDXL-高清生成精度指标FP32-全精度训练FP16-半精度推理FP8/INT8-量化压缩数据集/风格Anime-二次元Realistic-写实风GuoFeng-国风模型剪枝pruned-普通剪枝emaonly-EMA剪枝NiPruned-节点剪枝其他vae-内置VAEfix-修复优化版vX.X-版本号4.2.2CLASSIFICATIONCheckpoint模型的分类按StableDiffusion架构与迭代版本分类不同架构、版本的模型在容量、训练数据、对提示词的理解能力等方面有所不同,这些差异会影响其生成图像的质量、速度以及对不同场景和风格的适应性。SD1.5系列经典架构定位基于SD1.5架构的衍生模型,兼容性强,扩展生态成熟特点默认分辨率为512×512依赖扩展实现高清出图显存需求低(4~6GB),适合入门设备典型模型ChilloutMixCounterfeitV3AnythingV5SDXL系列新一代模型·主流趋势定位新一代模型,支持高分辨率与细节优化,逐渐成为主流特点原生支持1024×1024分辨率商业级画质,细节丰富显存要求高(不低于8GB)典型模型SDXL1.0官方版DreamShaperXLJuggernautXLSDXL架构说明SDXL1.0官方版包含Base和Refiner双模型结构,分别负责基础生成和细节优化。其他模型一般不需要额外搭配Refiner模型,例如DreamShaperXL训练时已整合了细节增强模块,通过单一模型实现高质量输出。表4-5相关SDXL系列SDXL系列技术说明生成特点硬件要求生态兼容性适用场景SDXL1.0属于基础架构,基于SDXL的完整扩散模型,U-Net实现多步去噪20~50步,速度慢,细节丰富,风格多样最低8GB,推荐不低于12GB全面支持ControlNet/LoRA高精度设计(如电影级场景、游戏原画设计)SDXLTurbo基于SDXL1.0的蒸馏版本,通过对抗扩散蒸馏技术将生成步骤压缩至1~4步1~4步,出图极快(1秒内),单步质量稍低最低6GB,推荐不低于8GB不支持LoRA,部分适配ControlNet实时交互(如直播、游戏角色生成)、快速原型设计SDXL-Lightning渐进式对抗蒸馏模型,支持1~8步生成,1步即可输出1024×1024高清图像1~8步,出图极快,1步约需0.5秒,4步效果接近SDXL1.0的50步最低6GB,推荐不低于8GB完整兼容ControlNet及LoRA(专用LoRA模型)商业级快速出图,如广告创意、数字人实时渲染加速趋势Turbo与Lightning在SDXL架构上通过蒸馏技术实现加速,正成为高效生成模型的核心发展方向性能提升未来版本可能进一步降低硬件门槛,目前已支持6GB显存设备,大幅提升生成效率权衡选择根据硬件配置和生成需求选择合适的SDXL系列模型,平衡速度与质量的关系表4-6Checkpoint模型按风格分类按风格分类并选择模型是提升图像风格掌控力的关键。输入同样的提示词,不同风格的模型会生成截然不同的视觉效果。类型特点典型模型写实擅长写实照片风格,细节逼真,适合人物肖像、风景等真实感强的场景ChilloutMix-写实人像标杆RealisticVision-欧美风写实majicmixRealistic-高泛化写实二次元以动漫、插画风格为主,适合生成平面化、卡通化的图像,色彩鲜明AnythingV5-万能通用型CounterfeitV3-精致插画风MeinaMix-角色还原优秀2.5D介于二次元与写实风格之间,适合半写实场景,如3D渲染效果RevAnimatedV1.2-全能型模型兼容性强,支持动漫、奇幻、风景生成通用型高自由度,泛化多风格适配,以写实为基底但可灵活切换至动漫、2.5D等风格DreamShaperV8-SD1.5架构DreamShaperXL-SDXL架构国风/东方美学融合传统元素(如水墨、工笔等),展现东方美学特色GuoFeng3-国风人物场景Ronghuav2.0-荣华系列升级版Checkpoint模型按场景分类按应用场景分类肖像生成:如MeinaMix优化面部细节场景生成:如DreamShaperV8擅长复杂场景与景观专业领域:如ArchitecturalDiffusion(建筑)选择建议根据创作需求选择合适的风格模型,同样的提示词在不同模型下会产生截然不同的视觉效果。建议多尝试不同模型,找到最适合自己创作风格的模型组合。4.2.2CLASSIFICATION4.2.3MODELMANAGEMENTCheckpoint模型的使用方法基本使用方法模型选择在SDWebUI中,从"StableDiffusion模型"下拉列表中选择要加载使用的Checkpoint模型也可以在参数设置区的"模型"选项卡中单击模型卡片来切换模型文件位置Checkpoint模型文件存放目录:SDWebUI主目录\models\Stable-diffusion加载新模型将下载的模型文件复制至该目录,如果在StableDiffusion运行状态下安装,需单击下拉列表框右侧的刷新按钮重新加载模型使用建议在使用Checkpoint模型之前,尽可能从模型社区与论坛查找模型介绍和推荐参数,或借助AI助手、搜索引擎等工具了解模型的相关信息大量模型的管理方法1管理模型文件名遵守英文名加标准化版本号的社区惯例,不要轻易更改,以免影响同步更新。建议采用英文命名,通过备注信息或预览图标注添加中文描述2添加备注信息通过编辑模型的外部元数据生成同名的.json文件,或在模型目录中添加与模型文件同名的.txt文件作为备注文件备注内容可包括模型描述、首选VAE、注意事项等3添加模型预览图将与模型同名的.jpg或.png图像文件放入模型所在目录,作为模型预览图显示在模型卡片中可从模型官网获取效果图,或利用模型本身生成图像并设置为预览图4分组管理模型如果模型很多,应考虑进行分组管理,将模型文件及其配套的备注文件和预览图分类放在不同的子目录下PRACTICALEXERCISE1【课堂演练1】管理大量的Checkpoint模型演练目标掌握科学管理Checkpoint模型的方法,提高模型选择效率,建立规范化的模型管理体系1.管理模型文件名遵守英文名加标准化版本号的社区惯例,不要轻易更改文件名,以免影响同步更新示例:majicmixRealistic_v7.safetensors2.添加备注信息通过编辑元数据生成.json文件,或添加同名.txt文件作为备注文件元数据文件model.json备注文件model.txt3.添加模型预览图放置与模型同名的.jpg或.png图像文件到模型目录,作为预览图显示在模型卡片中,便于快速识别模型风格和效果4.分组管理模型按架构和风格创建子目录进行分类管理,目录名尽量不使用中文models/└──Stable-diffusion/├──sd1.5/│├──realistic/│├──anime/│├──2.5D/│├──GuoFeng/│└──universal/└──sdxl1.0/├──base/├──refiner/├──integrated/└──derivs/管理效果快速定位所需模型清晰了解模型特性提高创作工作效率便于模型版本更新PRACTICALEXERCISE2【课堂演练2】生成2.5D风格的图像演练目标使用ReVAnimated模型生成奇幻森林自然场景,掌握2.5D风格图像的生成技巧。该模型在动漫、奇幻、半写实等风格方面表现出色,能生成具有一定立体感和空间感的图像。关键参数设置Checkpoint模型ReVAnimated_v122_V122(已集成优化后的VAE模块)正向提示词(masterpiece,bestquality,8K),isometricperspective,enchantedforest,glowingbluemushrooms,luminescentvines,crystalriver,ancientoaktreeswithtwistedroots,softvolumetricfog,sunsetrays,pastelcolorpalette,(unrealenginerendering:1.1),magicalatmosphere反向提示词blurry,lowquality,text,signature,human,animal,photorealistic,over-saturated,deformedplants采样方法DPM++2MSDE调度类型Karras迭代步数28提示词引导系数7.5高分辨率修复放大算法:R-ESRGAN4x+|高分迭代步数:18|重绘幅度:0.4|放大倍数:2(1536×1024)生成效果示例:奇幻森林蘑菇散发蓝光,河流反射夕阳光,呈现童话绘本般的2.5D世界关键提示词解析isometricperspective等距视角,锚定2.5D视觉风格glowingbluemushrooms发光的蓝色蘑菇,描述材质特征softvolumetricfog柔和的体积雾,营造光影氛围unrealenginerendering虚幻引擎渲染风格,提升质感PRACTICALEXERCISE3【课堂演练3】基于国风模型生成古风人物肖像演练目标使用GuoFeng3模型生成极具古风韵味的高品质人物肖像。该模型擅长生成古风图像,能创造具有2.5D质感的角色,适应游戏角色设计、插画创作等多种应用场景。关键参数设置Checkpoint模型GuoFeng3.4(此版本可生成全身图)外挂VAE模型vae-ft-mse-840000-ema-pruned正向提示词(部分)bestquality,masterpiece,highres,cg,dynamicangle,1girl,solofocus,elegantposture,Chinadresswithexquisiteembroidery,peonypatternsonthehem,flowingsilksleeves,delicatehairaccessorieswithjadependants,redtasselsswaying,longblackhairstyledintraditionalbun,Beautifulface,softskin,almondeyeswithgentlegaze,standinginamistyancientgarden,stonelanternsglowingfaintly,plumblossomsinfullbloomnearby,willowbranchesflutteringinthebreeze,inkwashpaintingstyle,richtraditionalcolors...采样方法DPM++2MSDE迭代步数35图像尺寸512×768提示词引导系数7高分辨率修复放大算法:R-ESRGAN4x+|重绘幅度:0.4|放大倍数:1.5(768×1152)生成效果示例:古风人物肖像身着精美服饰的女子,背景是薄雾缭绕的古园林古风元素要点服饰细节Chinadress,exquisiteembroidery,peonypatterns,flowingsilksleeves发饰妆容delicatehairaccessorieswithjadependants,redtassels,traditionalbun场景氛围mistyancientgarden,stonelanterns,plumblossoms,willowbranches艺术风格inkwashpaintingstyle,traditionalcolors,goldenratiocompositionEXTENDEDEXERCISE1【拓展演练1】使用SDXL加速版快速生成高清图像(一)DreamShaperXLTurbo基于SDXL1.0架构的高速蒸馏模型,用4~8步生成接近原版20步以上的画质,支持高分辨率修复,不需要使用Refiner功能。使用注意事项提示词引导系数2.0~3.0,过低易偏离提示词采样参数必须使用DPM++SDE和Karras模型准备主模型DreamShaperXL_turbo放大算法模型4x-UltraSharp.pth复制到models\ESRGAN目录关键参数采样方法DPM++SDE迭代步数7步提示词引导系数2.2图像尺寸1024×768生成效果生成速度几十秒(含高分辨率修复)质量对比7步≈传统模型20步效果艺术效果充分刻画花瓣纹路,展现中国玉雕艺术的独特魅力生成示例:中国玉雕工艺品正向提示词Artwork,Chinesejadecarving,palebluenephritelotusflower,meticulouslycarvedpetalridgesshowingnaturalveining,translucentjadetexture,luminousglowfromwithin,purewhitebackground,softambientlighting,shallowdepthoffield莲花玉雕图像高清细节·艺术感染力EXTENDEDEXERCISE1【拓展演练1】使用SDXL加速版快速生成高清图像(一)DreamShaperXLTurbo基于SDXL1.0架构的高速蒸馏模型,用4~8步生成接近原版20步以上的画质,支持高分辨率修复,不需要使用Refiner功能。生成示例:中国玉雕工艺品正向提示词Artwork,Chinesejadecarving,palebluenephritelotusflower,meticulouslycarvedpetalridgesshowingnaturalveining,translucentjadetexture,luminousglowfromwithin,purewhitebackground,softambientlighting,shallowdepthoffield莲花玉雕图像高清细节·艺术感染力EXTENDEDEXERCISE1【拓展演练1】使用SDXL加速版快速生成高清图像(二)DreamShaperXLLightning基于字节跳动的SDXL-Lightning技术微调而成,通过对抗蒸馏技术将生成速度提升至传统SDXL模型的10倍以上,仅需3~6步即可输出高清图像。使用注意事项提示词引导系数1.5~2.5,过高易导致过曝采样参数必须使用DPM++SDE和Karras模型准备主模型DreamShaperXL_lightning关键参数迭代步数5步提示词引导系数2图像尺寸1024×768生成效果生成速度不到30秒(含修复)质量对比5步≈传统模型20步效果EXTENDEDEXERCISE1【拓展演练1】使用SDXL加速版快速生成高清图像(二)DreamShaperXLLightning基于字节跳动的SDXL-Lightning技术微调而成,通过对抗蒸馏技术将生成速度提升至传统SDXL模型的10倍以上,仅需3~6步即可输出高清图像。生成示例:金秋湿地中的丹顶鹤正向提示词officialart,expressivewatercolorpaintingwithvisiblebrushstrokes,sharpfocusonbirds,only2red-crownedcranesstandinginvastreedwetland,1malecranewithvibrantredcrown,1femalecranewithelegantwhiteplumage,intricatefeatherdetailsrenderedinwatercolorwashes,warmautumnsunlightcastingsoftshadows,blurredreedreflectionsinwatercolorstyle丹顶鹤水彩画自然和谐·静谧氛围SDXL提示词优势SDXL大幅降低了提示词复杂度,只需用日常短语描述需求(如"agirlwithredhairdoinghomework"),不再需要添加"masterpiece,bestquality,4K"等质量词,即可生成细节丰富的图像。提示词应优先用短句而非单词列表,还应避免冗余修饰词。SECTION4.3使用外挂VAE模型VAE是基于深度学习的生成模型,用于优化色彩表现与提升细节清晰度色彩优化提升色彩饱和度,修复发灰问题细节增强提升细节清晰度,优化纹理表现滤镜效果相当于智能滤镜,优化整体视觉4.3.1VAEOPTIMIZATION为什么选择外挂VAE模型默认VAE的问题Checkpoint模型自带VAE(默认VAE)一般能够保证基本图像生成功能,但可能存在以下问题:色彩偏灰生成的图像易发灰、饱和度低,尤其在光线复杂的场景下,整体视觉效果不够鲜艳细节模糊对眼睛、纹理、文字等精细部分还原能力弱,导致图像缺乏真实感和精致度兼容性差部分SD1.5模型的默认VAE对512×512以上高分辨率支持不佳,容易出现色块或失真不同架构模型(如SD1.5、SDXL)的默认VAE优化目标不同,SD1.5的一些默认VAE侧重整体结构,对眼睛的渲染较弱外挂VAE的优势外挂VAE模型就是用来针对性地解决这些问题,可以调整生成图像的色彩、纹理和细节表现,相当于一种"滤镜",优化生成的图像质量。色彩优化提升色彩饱和度和对比度,修复发灰问题,使图像色彩更加鲜艳生动细节增强提升细节清晰度,优化眼睛、纹理、文字等精细部分的还原能力风格赋予赋予图像不同的风格特征,如胶片质感、动漫风格等特定美学效果高清支持优化高分辨率生成的兼容性和稳定性,支持更大尺寸的图像生成外挂VAE的作用原理VAE(VariationalAutoencoder)负责在潜空间中编码和解码图像。一旦使用外挂VAE模型,Checkpoint模型本身带有的VAE则会完全失效,由外挂VAE接管图像的编码解码过程,从而改变生成图像的色彩、纹理和细节表现。4.3.2VAESELECTION如何选择外挂VAE模型判断是否需要外挂VAE1看模型发布说明有些模型会明确要求搭配特定VAE2看生成效果如果图像色彩不正常(如发灰发白),一般就需要外挂VAE需要外挂VAE的情形Counterfeit系列生成的图像易出现整体发灰、人像面部泛绿等问题,需搭配kl-f8-anime2.ckpt或ClearVAE提升饱和度和线条锐度DreamShaper8.0之前版本内置VAE未优化,外挂vae-ft-mse-840000-ema-pruned可增添胶片质感Aniflatmix需搭配动漫专用VAE(如animevae)解决生成图像扁平化问题官方通用VAEvae-ft-ema-560000-ema-pruned-更锐利vae-ft-mse-840000-ema-pruned-更平滑(推荐)无须外挂VAE的情形DreamShaperV8及以上版本已集成"BakedVAE",色彩自然,无须外挂VAE,外挂反而可能适得其反majicMIXrealistic系列内置VAE对人像肤色进行优化,外挂易导致面部偏黄RealisticVisionV6外挂易导致皮肤纹理失真,建议直接使用默认VAERevAnimatedV1.2.2内置VAE平衡二次元与写实色彩,无需额外外挂部分SDXL模型已集成优化版VAE,如DreamShaperXL、JuggernautXL,外挂会增加显存负担表4-7外挂VAE模型的典型场景场景问题特征推荐VAE色彩发灰/失真画面泛白、饱和度低、色彩失真,整体视觉效果暗淡vae-ft-mse-840000-ema-pruned平滑型VAE,适合修复色彩问题动漫风格适配线条模糊、色彩暗淡,二次元风格表现力不足kl-f8-anime2动漫专用VAE,增强线条锐度细节(眼/手/文本)修复局部模糊、结构错误,细节表现力不足vae-ft-ema-560000-ema-pruned锐利型VAE,适合细节增强Checkpoint模型内置VAE损坏色块堆积、紫边、图像解码异常模型指定VAE根据模型作者推荐选择高清放大与局部重绘过度锐化导致生硬、纹理断裂vae-ft-mse-840000-ema-pruned平滑型VAE,适合后期处理VAE选择原则根据具体问题和模型特性选择合适的VAE,不同VAE有不同的优化重点和适用场景SDXL注意事项对于SDXL模型,需避免误选普通VAE导致兼容性问题,应使用SDXL专用VAE实验验证建议使用X/Y/Z图表脚本对比测试不同VAE的效果,找到最适合的VAE配置4.3.3VAEUSAGE外挂VAE模型的用法文件位置与格式存放目录SDWebUI主目录\models\VAE支持格式.ckpt传统格式.safetensors推荐格式.ptPyTorch格式使用方法1手动选择在SDWebUI中,从"外挂VAE模型"下拉列表中选择要加载使用的VAE模型2自动模式选择"自动Automatic"模式时,系统会根据预设规则自动匹配或调用VAE模型优先匹配同名VAE若未找到,使用模型内置默认VAE常用VAE推荐vae-ft-mse-840000-ema-pruned推荐平滑型通用VAE,适合修复色彩发灰、高清放大与局部重绘,是最常用的外挂VAEkl-f8-anime2动漫专用VAE,适合二次元风格,增强线条锐度和色彩饱和度vae-ft-ema-560000-ema-pruned锐利型通用VAE,适合细节修复,如眼睛、手部、文本等精细部分使用建议并非所有模型都需要外挂VAE,应根据具体模型和生成效果判断一些稳定的Checkpoint模型自带优化VAE,外挂可能适得其反建议使用X/Y/Z图表脚本对比测试不同VAE的效果SDXL模型需使用专用VAE,避免兼容性问题PRACTICALEXERCISE4【课堂演练4】使用外挂VAE模型修复图像演练目标使用CounterfeitV3模型生成动漫图像,对比测试不同VAE的使用效果,掌握外挂VAE模型的实际应用方法。参数设置Checkpoint模型CounterfeitV3正向提示词(masterpiece,bestquality,highres,8Kresolution),2.5Danimestyle,cel-shadedrendering,stronglineart,thickoutlines,flatcolorshading,limitedgradients,semi-realisticfacialfeatures,1girl,bigeyes,shorthair,schooluniform,standinginacitystreetbackground,softfocusonbackground,animelighting,rimlighting,bywlopandartgerm采样方法Eulera迭代步数25图像尺寸512×768提示词引导系数6.5固定种子18889899(便于对比)X/Y/Z图表设置启用"X/Y/Z图表"脚本,对比测试三种VAE配置:1不使用VAE(默认VAE)2animevae(动漫专用)3kl-f8-anime2(二次元优化)对比测试结果不使用VAE出现色彩泛绿的情况,整体色调不自然外挂animevae解决泛绿问题,但背景过于模糊,细节丢失外挂kl-f8-anime2⭐最佳效果:实现色彩平衡和背景层次感,过渡更平滑,并强化了线条演练要点通过固定种子控制变量,确保对比测试的准确性,直观感受不同VAE对生成效果的影响PRACTICALEXERCISE4【课堂演练4】使用外挂VAE模型修复图像SECTION4.4使用LoRA模型LoRA是低秩适应技术,在不改变Checkpoint模型结构的前提下快速适配特定任务轻量化微调通过少量参数训练快速适配特定任务、风格或对象分层协作与Checkpoint模型结合使用,增强细节控制能力风格调整定制人物特征、画风转换、概念表达灵活组合可叠加多个LoRA实现复杂的微调效果4.4.1LORAOVERVIEW了解LoRA模型LoRA模型比喻Checkpoint模型就像房子的主体结构,LoRA模型相当于一套装修方案,可以是北欧风,也可以是现代轻奢风。装修不改变房子的主体结构(Checkpoint模型),只是通过家具、装饰(参数)调整视觉效果,且可以低成本快速更换风格。依赖关系LoRA模型不能单独使用,它必须与先前训练的Checkpoint模型结合起来。由于LoRA通常在有限的训练数据下进行训练(如仅使用上百个图像),因此其模型体积相对较小轻量化特点体积小:几十到几百MB训练快:成本低、效率高易获取:社区资源丰富灵活组合:可叠加使用社区生态社区中存在大量优质的LoRA模型,其流行程度甚至不亚于Checkpoint模型,用户可以轻易获取自己想要的LoRA模型。人像画风概念服饰物品场景触发词(TriggerWords)大部分LoRA模型需要在提示词中添加特定的词来激活,这些特定的词就是触发词,相当于LoRA的"开关口令"。示例:一个LoRA触发词包含"古风人物、山水背景、工笔画风"等标签,如果只想生成古风人物图像,则输入"古风人物"标签来调用该LoRA模型多LoRA组合可以叠加多个LoRA,对生成的图像进行多种微调。例如,在电商设计中通过产品LoRA和场景LoRA组合生成商品海报。建议组合使用不超过3个LoRA,权重总和控制在1.5以内,避免效果混乱4.4.2LORAUSAGE使用LoRA模型的方法1.获取并安装安装方式使用AI绘世启动器"模型管理"在线下载从其他渠道下载后手动复制存放目录SDWebUI主目录\models\Lora文件格式.safetensors.ckpt.pt2.管理LoRA模型文件命名文件名尽量不要用中文,使用英文命名分类整理按功能用途分类,如character、style、pose、scene、object等备注信息提供备注信息和预览图,方便快速定位SDXL分类如果用于SDXL的LoRA模型不多,直接归到sdxl类3.使用LoRA模型查看文档了解模型的功能用途、推荐Checkpoint、触发词添加LoRA单击LoRA模型卡片,自动添加标签到提示词调整权重默认权重为1,通常调到1以内(如0.8)组合限制建议不超过3个LoRA,权重总和控制在1.5以内LoRA标签格式基本格式示例:

<lora:模型名:权重>权重调整降低权重至0.8,效果更柔和多LoRA组合,权重总和控制在1.5以内PRACTICALEXERCISE5【课堂演练5】使用LoRA模型创作盲盒风格作品演练目标使用blindbox_v1_mixLoRA模型生成二头身(Q版)盲盒风格图像,适用于潮流玩具设计和IP形象开发。LoRA模型信息触发词fullbody,chibi权重建议设为1推荐CheckpointRevAnimated_v122关键参数采样方法Eulera迭代步数28图像尺寸512×768提示词引导系数7生成效果:泡泡玛特盲盒风格圆润可爱的二头身比例与潮流元素融合关键提示词风格定义popmartblindboxstyle,minifigure,cutesmile,innocentexpression细节强化(beautifuldetailedface:1.3),(sparklingeyes:1.2),softstudiolighting材质表现mattetexturefinish,solidcolorbackgroundLoRA使用方法切换到"Lora"选项卡,找到模型卡片并单击,自动添加LoRA标签和触发词到提示词中AIPRACTICE1【AI实战1】组合使用LoRA模型绘制水墨国画实战目标组合使用墨心1.0和疏可走马1.1两个LoRA模型生成国色天香牡丹题材的数字水墨国画。墨心用于创作水墨画、写意画和工笔画,疏可走马采用大面积留白的构图风格。模型准备CheckpointChilloutmix-Ni-pruned-fp32-fix专为亚洲人像设计,也可用来画花鸟LoRA1墨心1.0(MoXinV1)吴昌硕、郑板桥等大师作品训练LoRA2疏可走马1.1大面积留白构图风格参数设置提示词引导系数3.5(工笔风格)图像尺寸640×1024竖版立轴适合国画采样参数DPM++SDE|Karras|28步正向提示词negativespace,peonyflower,traditionalchineseinkpainting...LoRA配置墨心权重0.7疏可走马权重0.8保留风格词wuchangshuo突出吴昌硕花鸟画风格组合效果水墨+留白构图,新国风数字画作生成效果:牡丹水墨画抓住国画审美逻辑与核心符号AIPRACTICE1【AI实战1】组合使用LoRA模型绘制水墨国画实战目标组合使用墨心1.0和疏可走马1.1两个LoRA模型生成国色天香牡丹题材的数字水墨国画。墨心用于创作水墨画、写意画和工笔画,疏可走马采用大面积留白的构图风格。生成效果:牡丹水墨画抓住国画审美逻辑与核心符号风格控制技巧提示词引导系数1~3用于写意风格,3~7逐渐显现工笔风格LoRA权重搭配墨心0.7+疏可走马0.8,总和1.5以内艺术效果抓住国画的审美逻辑与核心符号(水墨、留白、牡丹题材),是典型的新国风数字画作EXTENDEDEXERCISE2【拓展演练2】使用SDXL架构的LoRA模型制作国风山水画SDXLLoRA特点SDXL模型与旧版LoRA模型不兼容,必须使用专门为SDXL训练的LoRA模型。SDXL模型需要8GB以上显存,这意味着用户应该有较好的硬件配置才能使用SDXL模型和相关的LoRA模型。模型准备Checkpoint模型Counterfeit_XL_V2.5高质量动漫风格作品的SDXL二次元模型LoRA模型国风插画SDXL线条感强烈,受提示词影响较大关键参数触发词guofengLoRA权重0.85→0.8采样方法DPM++2M迭代步数25图像尺寸1024×1024提示词引导系数7生成效果:国风山水画线条感强烈,高清出图关键提示词自然景观majesticlandscape,steepmountainsinmist,wispyclouds,flowingriverwithwaterfalls人文元素bridgeandpavilion,serenewithnegativespace艺术风格inkwashtexture,lyricalimpressionism兼容性提醒SDXL与SD1.5的LoRA模型不通用,使用前要确认LoRA模型的架构版本SECTION4.5使用Embedding模型Embedding用于在文本编码空间嵌入自定义概念,主要作用是优化反向提示词提示词打包将多个提示词整合成一个向量,提升生成稳定性缺陷修复优化反向提示词,避免手部、面部畸形一键复用打包常用反向提示词,便于快速调用4.5.1EMBEDDINGOVERVIEW了解Embedding模型Embedding技术原理Embedding又被称为文本反转(TextualInversion)技术,通过嵌入技术将多个提示词整合成一个向量,进而提升图像生成的稳定性和精确度。可以将Embedding看作一堆提示词的集合,将多个提示词汇总到一个文件里,调用Embedding文件就等同于输入多个提示词。提示词集合Embedding可以看作一堆提示词的集合,将多个提示词汇总到一个文件里,调用Embedding文件就等同于输入多个提示词。示例:一个Embedding文件可能包含上百个负面提示词,用户只需使用一个标签即可调用双向应用正向提示词用于增强特定风格或特征反向提示词⭐最常用,避免负面元素,优化生成质量轻量化优势体积小:几十KB到几MB调用灵活:可同时调用多个效果可调:可调整权重复用方便:一键调用反向提示词优化(最常用)Embedding大多数情况下用于反向提示词,因为反向提示词数量多且通用性强,复用性比较高。手部优化示例:malformedfingers,deformedfingers,extrafingers,missingfingers,polydactyly,adactyly,fingerswithabnormalproportions使用一个Embedding标签即可替代提升生成质量通过Embedding模型,用户只需使用一个标签,就能达到上百个标签的效果,省去输入大量反向提示词的麻烦。典型应用:避免手部畸形防止面部扭曲优化人体结构提升画面精细度表4-8常用的Embedding模型模型功能适用模型EasyNegative提升画面的精细度,避免模糊、灰色调、面部扭曲等常见问题,优化整体生成质量二次元或动漫风格适合动漫类Checkpoint模型badhandv4对手部进行优化,避免手部残缺、手指数量不对、出现多余手臂等手部问题二次元或动漫风格适合人物生成场景ng_deepnegative_v1_75t优化图像的构图和色彩,减少扭曲的面部、错误的人体结构、颠倒的空间结构等情况的出现写实风格或二次元风格适合建筑和肖像生成初学者建议建议从EasyNegative和badhandv4入手,逐步探索Embedding模型的使用方法以及优化生成效果组合使用可同时调用多个Embedding文件,EasyNegative+badhandv4组合使用效果互补架构兼容性SD1.5与SDXL架构的Embedding模型不兼容,SDXL需使用专用模型4.5.2EMBEDDINGUSAGE使用Embedding模型的方法文件位置与格式存放目录SDWebUI主目录\embeddings支持格式.safetensors推荐格式.ptPyTorch格式秋葉aaaki整合包预装了常用的几种Embedding模型,可直接使用使用方法1切换到Embedding选项卡在SDWebUI中,切换到"嵌入式(T.I.Embedding)"选项卡2单击模型卡片以卡片形式列出已安装的Embedding模型,单击要应用的模型卡片3自动添加到提示词模型名称以普通标签的形式自动添加到提示词中,用半角逗号与其他提示词隔开重要注意事项架构兼容性SD1.5与SDXL架构的Embedding模型本质不兼容,必须按Checkpoint模型版本选择对应的Embedding模型SDXL专用模型SDXL架构需使用NegativeXL、UnaestheticXL等专用模型,以发挥高分辨率生成与复杂语义控制的优势使用场景区分用于反向提示词的Embedding模型不能用于正向提示词,需要根据模型说明正确使用学习建议建议初学者从EasyNegative和badhandv4入手,逐步探索Embedding模型的使用方法通过组合使用多个Embedding模型,可以实现更全面的效果优化注意权重调整和位置安排,以达到最佳优化效果AIPRACTICE2【AI实战2】使用Embedding模型修复和微调图像实战目标使用anything-v5模型生成校园萌系风格的少女图像,对比测试不同Embedding模型的修复效果,掌握Embedding模型在反向提示词优化中的实际应用。基础参数设置Chec

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论