文章摘要
本文提供一套从硬件选型到环境配置、模型部署再到优化调试的全流程Stable Diffusion本地安装教程,涵盖官方手动部署与秋叶整合包两种方案,并附显卡选型对比、启动参数详解及高频问题解决方案,帮助你在个人电脑上搭建高效稳定的AI绘画创作环境。

Stable Diffusion本地安装教程对于想要实现离线AI绘画创作自由的用户至关重要。本文提供一套从硬件选型到环境配置、模型部署再到优化调试的全流程Stable Diffusion本地安装教程,涵盖官方手动部署与秋叶整合包两种方案,并附显卡选型对比、启动参数详解及高频问题解决方案,帮助你在个人电脑上搭建高效稳定的AI绘画创作环境。

Stable Diffusion本地安装教程

第一部分:认识Stable Diffusion——为什么需要本地部署

第一节:什么是Stable Diffusion及其核心价值

Stable Diffusion是一种开源的深度学习文本到图像生成模型,由Stability AI在2022年首次发布。与Midjourney、DALL·E等闭源云服务不同,Stable Diffusion完全开源免费,用户可以将其部署在自己的电脑上,实现离线生成图像。

本地部署Stable Diffusion的核心价值体现在三个维度。第一,隐私保护。所有创作数据都在本地处理,无需上传至云端服务器,这对于涉及商业机密或未发布设计的创作场景至关重要。第二,无使用限制。云服务通常按生成次数收费或有每日生成上限,而本地部署后可以无限制生成,长期使用成本趋近于零。第三,完全可控。用户可以自由更换模型、训练LoRA、安装插件扩展功能,不受平台功能限制。

第二节:谁适合本地部署Stable Diffusion

Stable Diffusion本地安装并非适合所有人。以下人群最能从本地部署中获益:

  • 数字艺术创作者:需要频繁生成图像用于作品集或商业项目
  • 电商设计师:需要批量生成产品场景图、模特换装等营销素材
  • 独立游戏开发者:需要生成概念图、角色立绘、场景原画
  • AI技术研究者:需要测试不同模型、调试参数或进行二次开发
  • 对隐私敏感的创作者:不愿将创作内容上传至任何云端服务

而对AI绘画兴趣不大、电脑配置较低或不具备基础技术操作能力的用户,建议优先尝试在线AI绘画平台。

第三节:Stable Diffusion的版本演进

截至2026年6月,Stable Diffusion家族经历了多个重要版本迭代:

版本 发布时间 核心特点 硬件要求
SD 1.5 2022年10月 最稳定的基础模型,生态最完善 4GB显存
SD 2.1 2022年12月 改进图像质量,增加深度估计 6GB显存
SDXL 1.0 2023年7月 1024px原生分辨率,画质大幅提升 8GB显存
SD 3.5 Medium 2024年10月 轻量级部署,4GB显存起步 4GB显存
SD 3.5 Large 2024年10月 80B参数,百万分辨率 16GB显存
SD 3.5 Turbo 2025年 出图速度提升40% 8GB显存

截至2026年6月,SDXL 1.0和SD 3.5系列是主流选择。对于新手,建议从SDXL 1.0开始,它在画质和硬件需求之间取得了较好的平衡。

第二部分:硬件选型指南——你的电脑能跑Stable Diffusion吗

第一节:显卡是核心——显存决定一切

在Stable Diffusion本地安装教程中,显卡是最关键的硬件,没有之一。AI图像生成的核心计算都在GPU上完成,显存大小直接决定了你能生成多大分辨率的图像、能否加载大型模型。

以下是最新显卡选型建议:

显卡等级 代表型号 显存容量 适用场景
入门级 GTX 1060/1660 4-6GB SD1.5基础生成,512px图像,启动–lowvram参数
进阶级 RTX 2060/3050 6-8GB SDXL基础生成,使用–medvram优化参数
推荐级 RTX 3060/4060 12GB SDXL流畅运行,支持ControlNet,1024px图像
专业级 RTX 4070/4080 16GB SD3.5 Large运行,批量生成,模型训练
旗舰级 RTX 4090 24GB 所有模型通吃,高分辨率图像,同时训练多个模型

实测数据显示,RTX 3060 12GB可在约5-8秒内生成一张1024×1024的SDXL图像,而RTX 4090仅需2-3秒。如果预算有限,二手RTX 3060 12GB是目前性价比最高的选择。

第二节:其他硬件配置参考

除了显卡,以下组件也需要留意:

  • 内存:最低16GB,推荐32GB。模型加载和图像生成过程中会占用大量系统内存
  • 硬盘:推荐512GB以上SSD。一个基础模型约5-7GB,加上ControlNet、LoRA等扩展模型,总占用可达100GB以上
  • CPU:对生成速度影响较小,主流的Intel i5或AMD R5即可满足需求
  • 电源:根据显卡功耗选择,RTX 3060建议500W以上,RTX 4090建议850W以上

第三节:AMD显卡和Mac用户怎么办

Stable Diffusion对NVIDIA显卡的CUDA加速支持最好。AMD显卡需要额外配置DirectML或ROCm,生成速度约为同级别NVIDIA显卡的60-70%,且某些插件可能不兼容。Mac用户可以使用MPS加速(Apple Silicon芯片),M1/M2/M3芯片的MacBook Pro也能运行,但生成速度较NVIDIA独显有差距。

如果你的电脑不满足上述配置,建议考虑使用云端GPU服务,如AutoDL、揽睿星舟等,按小时租用即可。

第三部分:两种部署方案对比——选官方手动还是秋叶整合包

对于Stable Diffusion本地安装,目前主流有两种方案:官方手动部署和秋叶整合包。以下从多个维度进行横向对比:

对比维度 官方手动部署 秋叶整合包
技术门槛 较高,需熟悉命令行和Python环境 极低,解压即用
安装耗时 30-60分钟(视网络状况) 10-15分钟
可控程度 完全可控,可自定义每个组件 较高,但预置了常用插件
更新维护 手动git pull更新 等待作者发布新版本
排错难度 较难,需自行排查依赖问题 简单,有详细教程和社区支持
适合人群 开发者、技术爱好者 零基础新手、追求效率的用户

基于此,如果你是AI绘画新手或追求快速上手,强烈推荐选择秋叶整合包方案。如果你有技术背景或希望完全掌控环境,可以选择官方手动部署方案。本文将详细讲解这两种方案。

第四部分:方案一——秋叶整合包(新手推荐)

第一节:下载与解压

秋叶整合包是B站UP主秋葉aaaki发布的Stable Diffusion WebUI一键安装包,整合了主程序、常用插件和ControlNet模型,解压即可使用。

截至2026年6月,最新版本为v4.10(WebUI版)和ComfyUI V3(工作流版)。下载渠道包括:

  • 官方网站:stablediffusion.cn
  • 网盘备份:夸克网盘、百度网盘(具体链接见官网)

下载前请确认硬盘剩余空间至少60GB。建议将整合包解压到SSD硬盘的根目录,路径避免中文或特殊字符,例如D:\sd-webui-aki-v4.8。

解压步骤如下:

  1. 右键压缩包选择“解压到当前文件夹”
  2. 如果同时下载了ControlNet模型包,同样解压
  3. 将解压后的文件夹移动到D盘或E盘根目录

第二节:依赖环境安装

进入解压后的文件夹,找到并运行“启动器运行依赖安装程序.exe”。该程序会自动检测并安装Stable Diffusion运行所需的依赖环境,包括Python、Git、Visual C++运行库等。

安装过程约5-10分钟,期间可能弹出多个安装窗口。建议勾选“安装完某个程序后自动关闭窗口”,全程保持默认选项即可。如果安装过程中被杀毒软件拦截,请临时关闭杀毒软件或添加信任。

第三节:模型文件导入

模型(Checkpoint)是Stable Diffusion的核心,决定了生成图像的风格和质量。默认整合包会预装1-2个基础模型,你可以自行下载更多模型:

模型下载渠道

  • Civitai(全球最大的AI模型社区)
  • Hugging Face(官方模型仓库)
  • 哩布哩布(国内模型站)

模型存放路径

  • 主模型(.ckpt或.safetensors):models\Stable-diffusion\
  • LoRA模型:models\Lora\
  • VAE模型:models\VAE\
  • ControlNet模型:models\ControlNet\

推荐新手先下载以下模型

  • 写实风格:Realistic Vision、ChilloutMix
  • 二次元风格:Anything V5、Counterfeit
  • 通用风格:DreamShaper、RevAnimated

第四节:启动与基础验证

双击“A启动器.exe”打开管理界面。首次启动时建议进行基础设置:

  • 显存优化:根据显卡显存选择(8GB选“中等显存”,12GB+可选“无优化”)
  • 跨插件优化:勾选“xFormers”显存优化
  • 启动参数:保持默认即可

点击右下角“一键启动”,等待控制台加载完成。控制台显示“Running on local URL: http://127.0.0.1:7860”后,浏览器会自动打开WebUI界面。

验证安装是否成功:在文生图页面的提示词输入框中输入“a beautiful landscape, 8K”,点击生成,若能正常输出图像即表示部署成功。

第五部分:方案二——官方手动部署(进阶玩家)

第一节:基础环境准备

官方手动部署需要自行配置Python环境、Git以及深度学习框架。这种方式虽然步骤较多,但可以让你完全掌控每一个组件,方便后续二次开发和调试。

第一步:安装Python 3.10.6

Stable Diffusion WebUI对Python版本有严格要求,实测Python 3.11及以上版本可能存在兼容性问题。推荐使用Python 3.10.6版本。

安装注意事项:

  • 从Python官网下载3.10.6版本的安装包
  • 安装时必须勾选“Add Python to PATH”
  • 安装路径建议使用默认路径,避免空格和中文字符
  • 安装完成后,打开命令提示符输入python --version确认版本为3.10.6

第二步:安装Git

Git用于从GitHub克隆WebUI代码仓库。从Git官网下载最新版安装包,全程默认选项安装即可。安装完成后,在命令提示符输入git --version确认安装成功。

第三步:配置镜像源加速

由于默认源在国外,下载速度很慢甚至超时失败,建议配置国内镜像源加速:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

第二节:获取代码与创建虚拟环境

克隆WebUI代码仓库

打开命令提示符,切换到计划存放项目的目录(如D:\),执行:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

如果GitHub访问缓慢,可使用国内镜像加速:

git clone https://gitee.com/mirrors/stable-diffusion-webui.git

创建Python虚拟环境

虚拟环境可以隔离项目依赖,避免与其他Python项目发生版本冲突:

python -m venv venv
venv\Scripts\activate

激活成功后,命令行前缀会显示(venv)。

第三节:安装PyTorch与依赖

在激活的虚拟环境中,首先升级pip:

python -m pip install --upgrade pip

然后根据显卡类型安装PyTorch。NVIDIA显卡用户使用以下命令:

pip install torch==2.1.2 torchvision==0.16.2 --index-url https://download.pytorch.org/whl/cu121

注意CUDA版本要与显卡驱动兼容。可通过nvidia-smi查看支持的CUDA版本。例如驱动支持CUDA 12.1,则安装cu121版本。

安装完成后验证PyTorch是否可用:

python -c "import torch; print(torch.cuda.is_available())"

返回True表示GPU可用,False表示未检测到CUDA。

第四节:安装WebUI依赖并启动

在stable-diffusion-webui目录下,Windows用户双击运行webui-user.bat,该脚本会自动安装剩余的Python依赖包,包括transformers、diffusers、xFormers等。

首次启动时间较长,需下载约2-3GB的依赖文件。如果启动过程中报错“pkg_resources模块缺失”,说明setuptools版本问题,执行以下命令修复:

python -m pip install --force-reinstall setuptools

启动成功后,控制台会显示:

Running on local URL:  http://127.0.0.1:7860

在浏览器中打开该地址即可进入WebUI界面。

第五节:启动参数优化

编辑webui-user.bat文件,修改COMMANDLINE_ARGS参数可以优化性能和兼容性:

set COMMANDLINE_ARGS=--xformers --medvram --opt-sdp-no-mem-attention

常用参数说明:

参数 作用
--xformers 启用显存优化,显著降低显存占用
--medvram 中等显存优化(6-8GB显卡推荐)
--lowvram 激进显存优化(4GB显卡推荐)
--opt-sdp-no-mem-attention 进一步优化注意力计算
--listen 允许局域网访问
--port 7860 指定访问端口

第六部分:模型获取与导入

第一节:模型文件类型详解

Stable Diffusion的模型生态非常丰富,了解不同模型类型的用途是高效创作的前提。

模型类型 文件后缀 存放路径 用途说明
Checkpoint(主模型) .ckpt/.safetensors models/Stable-diffusion/ 核心模型,决定整体画风和画质,约2-7GB
LoRA .safetensors models/Lora/ 轻量微调模型,约10-200MB,用于特定角色/风格
VAE .ckpt/.safetensors models/VAE/ 改善色彩饱和度和细节,约300-500MB
ControlNet .pth/.safetensors models/ControlNet/ 条件控制生成(边缘/深度/姿态等),约1-5GB
Textual Inversion .pt/.bin models/embeddings/ 文本反演,用于固定特定概念,约几十KB
Hypernetwork .pt models/Hypernetworks/ 超网络,用于风格迁移,约几十MB

第二节:主流模型推荐

写实风格推荐Realistic Vision、ChilloutMix、MajicMix Realistic;二次元风格推荐Anything V5、Counterfeit、Pastel Mix;通用风格推荐DreamShaper、RevAnimated、GhostMix。

下载后直接放入对应目录即可,无需额外配置。在WebUI界面的左上角下拉菜单中可以看到已添加的模型。

第三节:VAE的重要性

VAE(Variational Autoencoder)是经常被新手忽略但至关重要的组件。没有VAE时,生成的图像色彩会偏灰、饱和度不足。SDXL模型通常内置了VAE,而SD1.5/2.1模型需要单独下载VAE文件。

推荐VAE:vae-ft-mse-840000-ema-pruned(通用最佳选择)。下载后放入models/VAE/目录,在WebUI设置的“Stable Diffusion”选项中勾选“自动加载匹配的VAE”。

第七部分:基础功能使用与参数说明

第一节:文生图核心参数

安装完成后,需要了解WebUI核心参数的含义:

参数 作用 推荐值
提示词(Prompt) 描述想要生成的内容 越具体越好
反向提示词(Negative Prompt) 描述不想出现的内容 基础词汇加特定负面
采样步数(Steps) 去噪迭代次数 20-30步
采样方法(Sampler) 去噪算法 DPM++ 2M Karras
宽度/高度 图像分辨率 512x512(SD1.5)/ 1024x1024(SDXL)
提示词引导系数(CFG Scale) 提示词影响程度 7-9
随机种子(Seed) 随机数种子 -1(随机)

反向提示词通用模板:worst quality, low quality, normal quality, bad anatomy, deformed, watermark, text, blurry

第二节:首次生成测试

在提示词框中输入以下测试提示词:

a beautiful landscape, mountain, lake, sunset, golden hour, 8K, highly detailed

建议新手先用SD1.5模型进行测试,因其速度较快、资源消耗低。待熟悉后再切换到SDXL模型体验更高画质。

第三节:高分辨率修复

直接生成1024px以上图像对显存要求很高,更经济的做法是先生成512px图像,再使用“高分辨率修复”功能放大。开启“Hires.fix”复选框,设置放大倍数为2,放大算法选择R-ESRGAN 4x+。使用该功能后,512px图像可放大至1024px并增加细节。

第八部分:常见问题解决方案

第一节:启动相关问题

问题现象 可能原因 解决方案
启动时卡在“Loading weights” 网络问题导致模型下载失败 手动下载模型放入models目录
CUDA out of memory报错 显存不足 降低分辨率或增加–lowvram参数
pkg_resources模块缺失 setuptools版本问题 执行pip install --force-reinstall setuptools
Python版本不兼容 使用了Python 3.11+ 切换回Python 3.10.6
端口7860被占用 其他程序占用了该端口 修改webui-user.bat中的–port参数

第二节:生成相关问题

问题现象 可能原因 解决方案
生成图像全黑 VAE缺失或不兼容 下载标准VAE文件放入models/VAE/
人脸畸形 模型限制或分辨率过低 使用面部修复插件或提高分辨率
提示词不生效 权重分配不合理 使用(keyword:1.2)格式提高权重
生成速度慢 未启用xFormers 启动参数中添加–xformers

第三节:模型加载失败的处理

如果模型加载失败,首先确认模型文件是否完整,可通过对比文件大小与官网信息确认。其次检查模型是否放在正确的目录,主模型应放在models/Stable-diffusion/而非其他文件夹。最后查看控制台报错信息,根据具体错误进行针对性排查。

第九部分:性能优化与扩展推荐

第一节:显存优化参数组合

根据显卡显存选择合适的启动参数组合:

  • 4GB显存--lowvram --xformers --opt-sdp-no-mem-attention
  • 6-8GB显存--medvram --xformers --opt-sdp-no-mem-attention
  • 10-12GB显存--xformers --opt-sdp-no-mem-attention
  • 16GB+显存:无需优化参数,追求最高速度

第二节:必装扩展插件推荐

Stable Diffusion的强大之处在于丰富的插件生态:

  • ControlNet:通过边缘、深度、姿态等条件精确控制图像生成
  • After Detailer:自动修复人脸、手部细节
  • Cutoff:精准控制颜色分布
  • Tiled Diffusion:低显存生成高分辨率图像
  • Image Browser:增强的图像管理浏览

ControlNet的安装:在WebUI“扩展”选项卡中选择“从网址安装”,输入GitHub地址后点击安装,重启WebUI即可。14个预训练模型约12GB,按需下载。

第三节:日常维护建议

  • 定期执行git pull更新代码获取最新功能
  • 定期清理outputs目录下的生成缓存
  • 备份models和embeddings目录,防止模型文件丢失
  • 在WebUI设置中导出配置文件,方便重装后恢复

第十部分:常见问题解答

问:Stable Diffusion本地安装需要什么样的电脑配置?

最低配置要求:NVIDIA显卡(4GB显存)、16GB内存、60GB SSD硬盘。推荐配置:RTX 3060 12GB显卡、32GB内存、256GB SSD硬盘。4GB显存只能运行SD1.5模型生成512px图像,建议至少6GB显存以获得较好体验。

问:为什么我启动后一直是空白页面?

通常是端口被占用或浏览器缓存问题。可以尝试修改端口参数(添加--port 7861),或清除浏览器缓存后重启。也有可能是控制台报错但页面未显示,请仔细查看控制台输出信息。

问:秋叶整合包和官方手动部署哪个更好?

没有绝对的答案。新手强烈推荐秋叶整合包,解压即用,省去配置环境的麻烦。技术爱好者或需要深度定制的用户可以选择官方手动部署,可以精确控制每个组件版本。

问:生成的图像总是不符合提示词怎么办?

可以使用权重语法强化关键词,例如(关键词:1.2)。也可以尝试调整CFG Scale值(7-9之间)。另外,模型选择也很关键——写实内容用写实模型,二次元用二次元模型。

问:如何解决显存不足的问题?

首先在启动参数中加入--medvram--lowvram。其次降低生成分辨率,先出小图再用Hires.fix放大。最后关闭其他占用显存的程序。如果以上方法都不行,说明显卡确实不足以支持当前配置,需要考虑升级硬件或使用云端GPU。

问:生成的图像有彩色噪点是什么原因?

通常是VAE文件缺失或加载失败。下载vae-ft-mse-840000-ema-pruned.ckpt放入models/VAE/目录,在设置中勾选“自动加载匹配的VAE”即可解决。

问:SDXL模型和SD1.5模型有什么区别?

SDXL原生支持1024×1024分辨率,画面细节和构图明显优于SD1.5,但需要8GB以上显存,生成速度较慢。SD1.5生态更成熟,插件兼容性好,4GB显存即可运行。

问:模型从哪里下载?

Civitai是全球最大的AI模型社区,几乎所有模型都可以在这里找到。国内用户可以使用哩布哩布,访问速度更快。下载时建议选择.safetensors格式,安全性更高且加载速度更快。

问:如何让AI生成指定人物的脸?

有两种方法:使用LoRA训练特定人物的微调模型(需大量该人物图片);或使用IP-Adapter/InstantID插件,通过参考图直接迁移面部特征。前者效果更好但需要训练,后者更方便快捷。

以上内容不代表本平台立场,仅供读者参考