Stable Diffusion本地安装教程:Windows系统零基础到专家级

Stable Diffusion本地安装教程对于想要实现离线AI绘画创作自由的用户至关重要。本文提供一套从硬件选型到环境配置、模型部署再到优化调试的全流程Stable Diffusion本地安装教程,涵盖官方手动部署与秋叶整合包两种方案,并附显卡选型对比、启动参数详解及高频问题解决方案,帮助你在个人电脑上搭建高效稳定的AI绘画创作环境。

第一部分:认识Stable Diffusion——为什么需要本地部署
第一节:什么是Stable Diffusion及其核心价值
Stable Diffusion是一种开源的深度学习文本到图像生成模型,由Stability AI在2022年首次发布。与Midjourney、DALL·E等闭源云服务不同,Stable Diffusion完全开源免费,用户可以将其部署在自己的电脑上,实现离线生成图像。
本地部署Stable Diffusion的核心价值体现在三个维度。第一,隐私保护。所有创作数据都在本地处理,无需上传至云端服务器,这对于涉及商业机密或未发布设计的创作场景至关重要。第二,无使用限制。云服务通常按生成次数收费或有每日生成上限,而本地部署后可以无限制生成,长期使用成本趋近于零。第三,完全可控。用户可以自由更换模型、训练LoRA、安装插件扩展功能,不受平台功能限制。
第二节:谁适合本地部署Stable Diffusion
Stable Diffusion本地安装并非适合所有人。以下人群最能从本地部署中获益:
- 数字艺术创作者:需要频繁生成图像用于作品集或商业项目
- 电商设计师:需要批量生成产品场景图、模特换装等营销素材
- 独立游戏开发者:需要生成概念图、角色立绘、场景原画
- AI技术研究者:需要测试不同模型、调试参数或进行二次开发
- 对隐私敏感的创作者:不愿将创作内容上传至任何云端服务
而对AI绘画兴趣不大、电脑配置较低或不具备基础技术操作能力的用户,建议优先尝试在线AI绘画平台。
第三节:Stable Diffusion的版本演进
截至2026年6月,Stable Diffusion家族经历了多个重要版本迭代:
| 版本 | 发布时间 | 核心特点 | 硬件要求 |
|---|---|---|---|
| SD 1.5 | 2022年10月 | 最稳定的基础模型,生态最完善 | 4GB显存 |
| SD 2.1 | 2022年12月 | 改进图像质量,增加深度估计 | 6GB显存 |
| SDXL 1.0 | 2023年7月 | 1024px原生分辨率,画质大幅提升 | 8GB显存 |
| SD 3.5 Medium | 2024年10月 | 轻量级部署,4GB显存起步 | 4GB显存 |
| SD 3.5 Large | 2024年10月 | 80B参数,百万分辨率 | 16GB显存 |
| SD 3.5 Turbo | 2025年 | 出图速度提升40% | 8GB显存 |
截至2026年6月,SDXL 1.0和SD 3.5系列是主流选择。对于新手,建议从SDXL 1.0开始,它在画质和硬件需求之间取得了较好的平衡。
第二部分:硬件选型指南——你的电脑能跑Stable Diffusion吗
第一节:显卡是核心——显存决定一切
在Stable Diffusion本地安装教程中,显卡是最关键的硬件,没有之一。AI图像生成的核心计算都在GPU上完成,显存大小直接决定了你能生成多大分辨率的图像、能否加载大型模型。
以下是最新显卡选型建议:
| 显卡等级 | 代表型号 | 显存容量 | 适用场景 |
|---|---|---|---|
| 入门级 | GTX 1060/1660 | 4-6GB | SD1.5基础生成,512px图像,启动–lowvram参数 |
| 进阶级 | RTX 2060/3050 | 6-8GB | SDXL基础生成,使用–medvram优化参数 |
| 推荐级 | RTX 3060/4060 | 12GB | SDXL流畅运行,支持ControlNet,1024px图像 |
| 专业级 | RTX 4070/4080 | 16GB | SD3.5 Large运行,批量生成,模型训练 |
| 旗舰级 | RTX 4090 | 24GB | 所有模型通吃,高分辨率图像,同时训练多个模型 |
实测数据显示,RTX 3060 12GB可在约5-8秒内生成一张1024×1024的SDXL图像,而RTX 4090仅需2-3秒。如果预算有限,二手RTX 3060 12GB是目前性价比最高的选择。
第二节:其他硬件配置参考
除了显卡,以下组件也需要留意:
- 内存:最低16GB,推荐32GB。模型加载和图像生成过程中会占用大量系统内存
- 硬盘:推荐512GB以上SSD。一个基础模型约5-7GB,加上ControlNet、LoRA等扩展模型,总占用可达100GB以上
- CPU:对生成速度影响较小,主流的Intel i5或AMD R5即可满足需求
- 电源:根据显卡功耗选择,RTX 3060建议500W以上,RTX 4090建议850W以上
第三节:AMD显卡和Mac用户怎么办
Stable Diffusion对NVIDIA显卡的CUDA加速支持最好。AMD显卡需要额外配置DirectML或ROCm,生成速度约为同级别NVIDIA显卡的60-70%,且某些插件可能不兼容。Mac用户可以使用MPS加速(Apple Silicon芯片),M1/M2/M3芯片的MacBook Pro也能运行,但生成速度较NVIDIA独显有差距。
如果你的电脑不满足上述配置,建议考虑使用云端GPU服务,如AutoDL、揽睿星舟等,按小时租用即可。
第三部分:两种部署方案对比——选官方手动还是秋叶整合包
对于Stable Diffusion本地安装,目前主流有两种方案:官方手动部署和秋叶整合包。以下从多个维度进行横向对比:
| 对比维度 | 官方手动部署 | 秋叶整合包 |
|---|---|---|
| 技术门槛 | 较高,需熟悉命令行和Python环境 | 极低,解压即用 |
| 安装耗时 | 30-60分钟(视网络状况) | 10-15分钟 |
| 可控程度 | 完全可控,可自定义每个组件 | 较高,但预置了常用插件 |
| 更新维护 | 手动git pull更新 | 等待作者发布新版本 |
| 排错难度 | 较难,需自行排查依赖问题 | 简单,有详细教程和社区支持 |
| 适合人群 | 开发者、技术爱好者 | 零基础新手、追求效率的用户 |
基于此,如果你是AI绘画新手或追求快速上手,强烈推荐选择秋叶整合包方案。如果你有技术背景或希望完全掌控环境,可以选择官方手动部署方案。本文将详细讲解这两种方案。
第四部分:方案一——秋叶整合包(新手推荐)
第一节:下载与解压
秋叶整合包是B站UP主秋葉aaaki发布的Stable Diffusion WebUI一键安装包,整合了主程序、常用插件和ControlNet模型,解压即可使用。
截至2026年6月,最新版本为v4.10(WebUI版)和ComfyUI V3(工作流版)。下载渠道包括:
- 官方网站:stablediffusion.cn
- 网盘备份:夸克网盘、百度网盘(具体链接见官网)
下载前请确认硬盘剩余空间至少60GB。建议将整合包解压到SSD硬盘的根目录,路径避免中文或特殊字符,例如D:\sd-webui-aki-v4.8。
解压步骤如下:
- 右键压缩包选择“解压到当前文件夹”
- 如果同时下载了ControlNet模型包,同样解压
- 将解压后的文件夹移动到D盘或E盘根目录
第二节:依赖环境安装
进入解压后的文件夹,找到并运行“启动器运行依赖安装程序.exe”。该程序会自动检测并安装Stable Diffusion运行所需的依赖环境,包括Python、Git、Visual C++运行库等。
安装过程约5-10分钟,期间可能弹出多个安装窗口。建议勾选“安装完某个程序后自动关闭窗口”,全程保持默认选项即可。如果安装过程中被杀毒软件拦截,请临时关闭杀毒软件或添加信任。
第三节:模型文件导入
模型(Checkpoint)是Stable Diffusion的核心,决定了生成图像的风格和质量。默认整合包会预装1-2个基础模型,你可以自行下载更多模型:
模型下载渠道:
- Civitai(全球最大的AI模型社区)
- Hugging Face(官方模型仓库)
- 哩布哩布(国内模型站)
模型存放路径:
- 主模型(.ckpt或.safetensors):
models\Stable-diffusion\ - LoRA模型:
models\Lora\ - VAE模型:
models\VAE\ - ControlNet模型:
models\ControlNet\
推荐新手先下载以下模型:
- 写实风格:Realistic Vision、ChilloutMix
- 二次元风格:Anything V5、Counterfeit
- 通用风格:DreamShaper、RevAnimated
第四节:启动与基础验证
双击“A启动器.exe”打开管理界面。首次启动时建议进行基础设置:
- 显存优化:根据显卡显存选择(8GB选“中等显存”,12GB+可选“无优化”)
- 跨插件优化:勾选“xFormers”显存优化
- 启动参数:保持默认即可
点击右下角“一键启动”,等待控制台加载完成。控制台显示“Running on local URL: http://127.0.0.1:7860”后,浏览器会自动打开WebUI界面。
验证安装是否成功:在文生图页面的提示词输入框中输入“a beautiful landscape, 8K”,点击生成,若能正常输出图像即表示部署成功。
第五部分:方案二——官方手动部署(进阶玩家)
第一节:基础环境准备
官方手动部署需要自行配置Python环境、Git以及深度学习框架。这种方式虽然步骤较多,但可以让你完全掌控每一个组件,方便后续二次开发和调试。
第一步:安装Python 3.10.6
Stable Diffusion WebUI对Python版本有严格要求,实测Python 3.11及以上版本可能存在兼容性问题。推荐使用Python 3.10.6版本。
安装注意事项:
- 从Python官网下载3.10.6版本的安装包
- 安装时必须勾选“Add Python to PATH”
- 安装路径建议使用默认路径,避免空格和中文字符
- 安装完成后,打开命令提示符输入
python --version确认版本为3.10.6
第二步:安装Git
Git用于从GitHub克隆WebUI代码仓库。从Git官网下载最新版安装包,全程默认选项安装即可。安装完成后,在命令提示符输入git --version确认安装成功。
第三步:配置镜像源加速
由于默认源在国外,下载速度很慢甚至超时失败,建议配置国内镜像源加速:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
第二节:获取代码与创建虚拟环境
克隆WebUI代码仓库:
打开命令提示符,切换到计划存放项目的目录(如D:\),执行:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
如果GitHub访问缓慢,可使用国内镜像加速:
git clone https://gitee.com/mirrors/stable-diffusion-webui.git
创建Python虚拟环境:
虚拟环境可以隔离项目依赖,避免与其他Python项目发生版本冲突:
python -m venv venv
venv\Scripts\activate
激活成功后,命令行前缀会显示(venv)。
第三节:安装PyTorch与依赖
在激活的虚拟环境中,首先升级pip:
python -m pip install --upgrade pip
然后根据显卡类型安装PyTorch。NVIDIA显卡用户使用以下命令:
pip install torch==2.1.2 torchvision==0.16.2 --index-url https://download.pytorch.org/whl/cu121
注意CUDA版本要与显卡驱动兼容。可通过nvidia-smi查看支持的CUDA版本。例如驱动支持CUDA 12.1,则安装cu121版本。
安装完成后验证PyTorch是否可用:
python -c "import torch; print(torch.cuda.is_available())"
返回True表示GPU可用,False表示未检测到CUDA。
第四节:安装WebUI依赖并启动
在stable-diffusion-webui目录下,Windows用户双击运行webui-user.bat,该脚本会自动安装剩余的Python依赖包,包括transformers、diffusers、xFormers等。
首次启动时间较长,需下载约2-3GB的依赖文件。如果启动过程中报错“pkg_resources模块缺失”,说明setuptools版本问题,执行以下命令修复:
python -m pip install --force-reinstall setuptools
启动成功后,控制台会显示:
Running on local URL: http://127.0.0.1:7860
在浏览器中打开该地址即可进入WebUI界面。
第五节:启动参数优化
编辑webui-user.bat文件,修改COMMANDLINE_ARGS参数可以优化性能和兼容性:
set COMMANDLINE_ARGS=--xformers --medvram --opt-sdp-no-mem-attention
常用参数说明:
| 参数 | 作用 |
|---|---|
--xformers |
启用显存优化,显著降低显存占用 |
--medvram |
中等显存优化(6-8GB显卡推荐) |
--lowvram |
激进显存优化(4GB显卡推荐) |
--opt-sdp-no-mem-attention |
进一步优化注意力计算 |
--listen |
允许局域网访问 |
--port 7860 |
指定访问端口 |
第六部分:模型获取与导入
第一节:模型文件类型详解
Stable Diffusion的模型生态非常丰富,了解不同模型类型的用途是高效创作的前提。
| 模型类型 | 文件后缀 | 存放路径 | 用途说明 |
|---|---|---|---|
| Checkpoint(主模型) | .ckpt/.safetensors | models/Stable-diffusion/ | 核心模型,决定整体画风和画质,约2-7GB |
| LoRA | .safetensors | models/Lora/ | 轻量微调模型,约10-200MB,用于特定角色/风格 |
| VAE | .ckpt/.safetensors | models/VAE/ | 改善色彩饱和度和细节,约300-500MB |
| ControlNet | .pth/.safetensors | models/ControlNet/ | 条件控制生成(边缘/深度/姿态等),约1-5GB |
| Textual Inversion | .pt/.bin | models/embeddings/ | 文本反演,用于固定特定概念,约几十KB |
| Hypernetwork | .pt | models/Hypernetworks/ | 超网络,用于风格迁移,约几十MB |
第二节:主流模型推荐
写实风格推荐Realistic Vision、ChilloutMix、MajicMix Realistic;二次元风格推荐Anything V5、Counterfeit、Pastel Mix;通用风格推荐DreamShaper、RevAnimated、GhostMix。
下载后直接放入对应目录即可,无需额外配置。在WebUI界面的左上角下拉菜单中可以看到已添加的模型。
第三节:VAE的重要性
VAE(Variational Autoencoder)是经常被新手忽略但至关重要的组件。没有VAE时,生成的图像色彩会偏灰、饱和度不足。SDXL模型通常内置了VAE,而SD1.5/2.1模型需要单独下载VAE文件。
推荐VAE:vae-ft-mse-840000-ema-pruned(通用最佳选择)。下载后放入models/VAE/目录,在WebUI设置的“Stable Diffusion”选项中勾选“自动加载匹配的VAE”。
第七部分:基础功能使用与参数说明
第一节:文生图核心参数
安装完成后,需要了解WebUI核心参数的含义:
| 参数 | 作用 | 推荐值 |
|---|---|---|
| 提示词(Prompt) | 描述想要生成的内容 | 越具体越好 |
| 反向提示词(Negative Prompt) | 描述不想出现的内容 | 基础词汇加特定负面 |
| 采样步数(Steps) | 去噪迭代次数 | 20-30步 |
| 采样方法(Sampler) | 去噪算法 | DPM++ 2M Karras |
| 宽度/高度 | 图像分辨率 | 512x512(SD1.5)/ 1024x1024(SDXL) |
| 提示词引导系数(CFG Scale) | 提示词影响程度 | 7-9 |
| 随机种子(Seed) | 随机数种子 | -1(随机) |
反向提示词通用模板:worst quality, low quality, normal quality, bad anatomy, deformed, watermark, text, blurry
第二节:首次生成测试
在提示词框中输入以下测试提示词:
a beautiful landscape, mountain, lake, sunset, golden hour, 8K, highly detailed
建议新手先用SD1.5模型进行测试,因其速度较快、资源消耗低。待熟悉后再切换到SDXL模型体验更高画质。
第三节:高分辨率修复
直接生成1024px以上图像对显存要求很高,更经济的做法是先生成512px图像,再使用“高分辨率修复”功能放大。开启“Hires.fix”复选框,设置放大倍数为2,放大算法选择R-ESRGAN 4x+。使用该功能后,512px图像可放大至1024px并增加细节。
第八部分:常见问题解决方案
第一节:启动相关问题
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
| 启动时卡在“Loading weights” | 网络问题导致模型下载失败 | 手动下载模型放入models目录 |
| CUDA out of memory报错 | 显存不足 | 降低分辨率或增加–lowvram参数 |
| pkg_resources模块缺失 | setuptools版本问题 | 执行pip install --force-reinstall setuptools |
| Python版本不兼容 | 使用了Python 3.11+ | 切换回Python 3.10.6 |
| 端口7860被占用 | 其他程序占用了该端口 | 修改webui-user.bat中的–port参数 |
第二节:生成相关问题
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
| 生成图像全黑 | VAE缺失或不兼容 | 下载标准VAE文件放入models/VAE/ |
| 人脸畸形 | 模型限制或分辨率过低 | 使用面部修复插件或提高分辨率 |
| 提示词不生效 | 权重分配不合理 | 使用(keyword:1.2)格式提高权重 |
| 生成速度慢 | 未启用xFormers | 启动参数中添加–xformers |
第三节:模型加载失败的处理
如果模型加载失败,首先确认模型文件是否完整,可通过对比文件大小与官网信息确认。其次检查模型是否放在正确的目录,主模型应放在models/Stable-diffusion/而非其他文件夹。最后查看控制台报错信息,根据具体错误进行针对性排查。
第九部分:性能优化与扩展推荐
第一节:显存优化参数组合
根据显卡显存选择合适的启动参数组合:
- 4GB显存:
--lowvram --xformers --opt-sdp-no-mem-attention - 6-8GB显存:
--medvram --xformers --opt-sdp-no-mem-attention - 10-12GB显存:
--xformers --opt-sdp-no-mem-attention - 16GB+显存:无需优化参数,追求最高速度
第二节:必装扩展插件推荐
Stable Diffusion的强大之处在于丰富的插件生态:
- ControlNet:通过边缘、深度、姿态等条件精确控制图像生成
- After Detailer:自动修复人脸、手部细节
- Cutoff:精准控制颜色分布
- Tiled Diffusion:低显存生成高分辨率图像
- Image Browser:增强的图像管理浏览
ControlNet的安装:在WebUI“扩展”选项卡中选择“从网址安装”,输入GitHub地址后点击安装,重启WebUI即可。14个预训练模型约12GB,按需下载。
第三节:日常维护建议
- 定期执行git pull更新代码获取最新功能
- 定期清理outputs目录下的生成缓存
- 备份models和embeddings目录,防止模型文件丢失
- 在WebUI设置中导出配置文件,方便重装后恢复
第十部分:常见问题解答
问:Stable Diffusion本地安装需要什么样的电脑配置?
最低配置要求:NVIDIA显卡(4GB显存)、16GB内存、60GB SSD硬盘。推荐配置:RTX 3060 12GB显卡、32GB内存、256GB SSD硬盘。4GB显存只能运行SD1.5模型生成512px图像,建议至少6GB显存以获得较好体验。
问:为什么我启动后一直是空白页面?
通常是端口被占用或浏览器缓存问题。可以尝试修改端口参数(添加--port 7861),或清除浏览器缓存后重启。也有可能是控制台报错但页面未显示,请仔细查看控制台输出信息。
问:秋叶整合包和官方手动部署哪个更好?
没有绝对的答案。新手强烈推荐秋叶整合包,解压即用,省去配置环境的麻烦。技术爱好者或需要深度定制的用户可以选择官方手动部署,可以精确控制每个组件版本。
问:生成的图像总是不符合提示词怎么办?
可以使用权重语法强化关键词,例如(关键词:1.2)。也可以尝试调整CFG Scale值(7-9之间)。另外,模型选择也很关键——写实内容用写实模型,二次元用二次元模型。
问:如何解决显存不足的问题?
首先在启动参数中加入--medvram或--lowvram。其次降低生成分辨率,先出小图再用Hires.fix放大。最后关闭其他占用显存的程序。如果以上方法都不行,说明显卡确实不足以支持当前配置,需要考虑升级硬件或使用云端GPU。
问:生成的图像有彩色噪点是什么原因?
通常是VAE文件缺失或加载失败。下载vae-ft-mse-840000-ema-pruned.ckpt放入models/VAE/目录,在设置中勾选“自动加载匹配的VAE”即可解决。
问:SDXL模型和SD1.5模型有什么区别?
SDXL原生支持1024×1024分辨率,画面细节和构图明显优于SD1.5,但需要8GB以上显存,生成速度较慢。SD1.5生态更成熟,插件兼容性好,4GB显存即可运行。
问:模型从哪里下载?
Civitai是全球最大的AI模型社区,几乎所有模型都可以在这里找到。国内用户可以使用哩布哩布,访问速度更快。下载时建议选择.safetensors格式,安全性更高且加载速度更快。
问:如何让AI生成指定人物的脸?
有两种方法:使用LoRA训练特定人物的微调模型(需大量该人物图片);或使用IP-Adapter/InstantID插件,通过参考图直接迁移面部特征。前者效果更好但需要训练,后者更方便快捷。



