Stable Diffusion бесплатно: установка на ваш ПК для не-программистов в 2026
Stable Diffusion бесплатно: установка на ваш ПК для не-программистов в 2026
Если вы ретушируете товары для маркетплейсов или снимаете предметку, то уже наверняка слышали, как коллеги генерируют фоны, дорисовывают тени и собирают целые сцены без студии. Большинство сидит на пл
О чём статья
Если вы ретушируете товары для маркетплейсов или снимаете предметку, то уже наверняка слышали, как коллеги генерируют фоны, дорисовывают тени и собирают целые сцены без студии. Большинство сидит на платных сервисах: Midjourney, Adobe Firefly, Magnific. Подписка тикает каждый месяц, картинки уходят на чужие сервера, а ваши клиентские карточки лежат у кого-то в облаке.
Альтернатива есть, и она бесплатная. Stable Diffusion работает на вашем компьютере, без интернета и без подписок. Модель открытая, веса лежат на Hugging Face и Civitai, исходники A1111 на GitHub. Один раз поставили, дальше генерируете сколько угодно, хоть тысячу картинок в день.
В этой статье разберём установку с нуля. Без терминала на 200 команд, без Docker, без WSL. Только Python, Git и понятный интерфейс в браузере. Прошли путь сами на курсе AI PRO, повторим то же самое для вас. К концу статьи у вас будет работающий Stable Diffusion на компьютере и несколько проверенных моделей для предметки и ретуши.
Что такое Stable Diffusion и почему его ставят локально
Stable Diffusion - это нейросеть генерации изображений из текста. Stability AI выпустила первую версию в 2022 году с открытыми весами. С тех пор сообщество натренировало тысячи дочерних моделей: для портретов, аниме, предметки, архитектуры, fashion.
Принцип простой. Вы пишете промпт ("серебряное кольцо с сапфиром на белом фоне, мягкий свет, студийная съёмка"), модель прогоняет шум через сеть и постепенно превращает его в картинку. В отличие от Midjourney, где вы получаете результат на чужом сервере и не управляете деталями, локальный Stable Diffusion даёт вам полный контроль.
Stable Diffusion vs Midjourney vs DALL-E 3 vs Firefly
| Параметр | Stable Diffusion локально | Midjourney v7 | DALL-E 3 | Adobe Firefly 3 |
|---|---|---|---|---|
| Цена | Бесплатно | от 10$/мес | внутри ChatGPT Plus | внутри Creative Cloud |
| Приватность | Всё на вашем ПК | На серверах | На серверах OpenAI | На серверах Adobe |
| ControlNet, inpainting, LoRA | Да, всё | Нет | Нет | Частично |
| Свои модели и LoRA | Да | Нет | Нет | Нет |
| Коммерческое использование | Да (проверьте лицензию модели) | Только с paid | Да | Да |
| Кривая входа | Высокая | Низкая | Минимальная | Низкая |
Если вы делаете один пост в неделю, проще Midjourney. Если вы ретушёр, который генерирует фоны для 50 карточек в день, локальный Stable Diffusion окупится за месяц.
Требования к ПК: что нужно в 2026
Главный ресурс - видеопамять (VRAM) на видеокарте Nvidia. Это не оперативка и не объём SSD, это память именно на GPU. Без неё модель не загрузится. AMD и Intel Arc тоже работают, но через костыли (DirectML, ROCm под Linux), новичкам не рекомендуем.
Минимум для запуска
- GPU Nvidia с 6 ГБ VRAM (RTX 2060, RTX 3050, GTX 1660 Super)
- 16 ГБ оперативной памяти
- 100 ГБ свободного места на SSD (модели весят 2-7 ГБ каждая, быстро накапливается)
- Windows 10/11 или Linux
- Драйвер Nvidia Studio Driver свежий
На минимуме SDXL и Flux не запустятся, только базовая SD 1.5. Картинка 512x512 будет генериться 15-25 секунд.
Рекомендуемая конфигурация
- GPU Nvidia с 12-16 ГБ VRAM (RTX 4070, RTX 4070 Ti Super, RTX 5070, RTX 3090 б/у)
- 32 ГБ оперативной памяти
- NVMe SSD 1 ТБ под модели и кэш
- Хорошее охлаждение, генерация греет карту как майнинг
На RTX 4070 Super (12 ГБ) SDXL картинка 1024x1024 рендерится за 8-12 секунд, Flux dev - 30-40 секунд. Это рабочий темп для коммерческих задач.
Когда не стоит ставить локально
Если у вас ноутбук с интегрированной графикой, MacBook на M1/M2 без 32 ГБ unified memory, или старый ПК без дискретной GPU, не мучайтесь. Возьмите аренду GPU на runpod.io или vast.ai (от 0.30$/час за RTX 4090), либо используйте Google Colab. Для пробы хватит, для постоянной работы дешевле собрать ПК.
Установка пошагово: Python, Git, AUTOMATIC1111
A1111 (Automatic1111 WebUI) - самый популярный интерфейс к Stable Diffusion. Открывается в браузере, не требует знаний программирования после установки. Альтернативы: ComfyUI (мощнее, но сложнее), Forge (форк A1111, быстрее на новых GPU), Fooocus (упрощённый). Начинаем с A1111, потом разберётесь сами, что подходит.
Шаг 1. Установить Python 3.10.6
Именно 3.10.6, не 3.11, не 3.12. A1111 капризничает с новыми версиями.
- Качаете python-3.10.6-amd64.exe с python.org/downloads/release/python-3106
- При установке ОБЯЗАТЕЛЬНО ставите галку "Add Python to PATH" внизу первого окна
- Жмёте Install Now
- Проверка в командной строке:
python --versionдолжен показать 3.10.6
Если у вас уже стоит Python 3.11 или 3.12, не сносите его. Поставьте 3.10.6 рядом и пропишите путь в переменной окружения, либо используйте через py -3.10.
Шаг 2. Установить Git
Git нужен, чтобы скачать репозиторий A1111 и обновлять его одной командой.
- Качаете установщик с git-scm.com/download/win
- Ставите со всеми галками по умолчанию
- Проверка:
git --versionв командной строке
Шаг 3. Клонировать A1111
Создайте папку под нейросети, например D:\AI\ или C:\StableDiffusion\. Путь не должен содержать русских букв и пробелов.
Открываете командную строку (cmd) в этой папке (правый клик в проводнике, "Открыть в терминале" или Shift+правый клик, "Открыть окно команд"). Пишете:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Скачается папка stable-diffusion-webui примерно на 50 МБ. Это сам интерфейс, моделей внутри ещё нет.
Шаг 4. Первый запуск
Заходите в папку stable-diffusion-webui, находите файл webui-user.bat, запускаете двойным кликом. Откроется чёрное окно, начнётся загрузка зависимостей: torch, xformers, gradio и пр. Скачается 4-6 ГБ, займёт 10-30 минут на первом запуске.
Когда увидите строку Running on local URL: http://127.0.0.1:7860, открываете этот адрес в браузере. Перед вами интерфейс A1111.
Если упало с ошибкой про CUDA, торч или память, читайте раздел про ошибки ниже.
Бесплатные модели для фото и предметки
Базовая модель Stable Diffusion 1.5 умеет всё понемногу, но плохо. Для коммерческих фото нужны fine-tuned модели, обученные сообществом. Качаются с civitai.com (нужна регистрация, бесплатная). Файлы кладёте в stable-diffusion-webui/models/Stable-diffusion/.
Топ моделей для предметки и ретуши на 2026
| Модель | База | Размер | Для чего |
|---|---|---|---|
| Realistic Vision V6.0 B1 | SD 1.5 | 2 ГБ | Реалистичные люди, кожа, портреты |
| Juggernaut XL v11 | SDXL | 6.5 ГБ | Универсальный реализм, предметка, fashion |
| epiCRealism XL Last Hope | SDXL | 6.5 ГБ | Фотореализм, продакт-фото |
| RealVisXL V5.0 | SDXL | 6.5 ГБ | Детализированные текстуры, металл, стекло |
| Flux.1 dev | Flux | 23 ГБ | Топ-качество, но требует 16+ ГБ VRAM |
| DreamShaper XL Turbo | SDXL | 6.5 ГБ | Быстрая генерация за 4-8 шагов |
Для ювелирки и часов берёте Juggernaut XL или RealVisXL, они хорошо рисуют металлические поверхности и блики. Для одежды и текстиля - epiCRealism XL. Для лиц и моделей в кадре - Realistic Vision V6 на старте, потом переходите на SDXL.
Inpainting-версии: правим часть картинки
Inpainting - это режим, где вы закрашиваете часть изображения и говорите модели, что должно быть на этом месте. Незаменимо для ретуши: убрать ярлык с одежды, заменить фон, дорисовать тень от объекта.
Скачивайте inpaint-версии тех же моделей:
- Realistic Vision V6.0 B1 Inpainting
- Juggernaut XL Inpainting
- epiCRealism Inpainting
Кладёте в ту же папку models/Stable-diffusion. Переключаетесь в режим img2img → Inpaint в A1111, выбираете inpainting-чекпоинт, рисуете маску на проблемной зоне, пишете промпт. Это рабочий инструмент, который заменяет 80% задач Generative Fill в Photoshop, причём бесплатно и без подписки Adobe.
VAE: про насыщенность и контраст
VAE (variational autoencoder) - небольшой файл на 300-800 МБ, отвечающий за финальную обработку цветов. Без правильного VAE картинки выходят бледными и серыми. Скачайте:
- vae-ft-mse-840000-ema-pruned для SD 1.5
- sdxl_vae для SDXL
Кладёте в models/VAE, выбираете в Settings → Stable Diffusion → SD VAE.
ControlNet: контроль композиции
Голый промпт даёт случайный результат. Сегодня сгенерили красивое кольцо в центре, завтра то же кольцо ушло в угол и завалилось. ControlNet решает это.
ControlNet - набор моделей, которые добавляют к Stable Diffusion дополнительный вход: скетч, карту глубины, позу человека, контуры объекта, нормали поверхности. Вы скармливаете нейросети референс, и она рисует строго по нему.
Самые рабочие препроцессоры
- Canny: выделяет контуры. Удобно перерисовать объект в другом стиле, сохранив форму
- Depth: карта глубины. Сохраняет 3D-структуру сцены при смене материалов
- OpenPose: скелет человека. Точно повторяет позу модели на референсе
- Lineart: чистые линии для иллюстрации и concept-art
- IP-Adapter: переносит стиль референсного изображения целиком
- Tile: апскейл с восстановлением деталей
Для предметки чаще всего нужны Canny и Depth. Сняли украшение на сером фоне, прогнали через Canny, сгенерили то же украшение на мраморе с лепестками вокруг. Форма не поплывёт.
Установка ControlNet
- В A1111 идёте в Extensions → Install from URL
- Вставляете
https://github.com/Mikubill/sd-webui-controlnet - Жмёте Install, перезапускаете A1111
- Качаете модели ControlNet с huggingface.co/lllyasviel/sd_control_collection (для SDXL) или /lllyasviel/ControlNet-v1-1 (для SD 1.5)
- Кладёте в
extensions/sd-webui-controlnet/models/
После перезапуска внизу окна txt2img появится свёрнутая панель ControlNet. Загружаете туда референс, выбираете тип, генерите.
Типичные ошибки первого запуска
CUDA out of memory
Самая частая ошибка. VRAM закончилась. Решения по убыванию эффективности:
- Уменьшите разрешение. 1024x1024 на 6 ГБ не пойдёт, ставьте 512x768
- В webui-user.bat пропишите ключи:
set COMMANDLINE_ARGS=--xformers --medvram. Для совсем маленьких карт--lowvram - Закройте Chrome, Photoshop, Lightroom. Они едят VRAM фоном
- Снизьте batch size до 1
- Используйте модели SD 1.5 вместо SDXL, если карта меньше 8 ГБ
Чёрная картинка на выходе
Обычно это значит, что VAE не подгрузился, либо несовместим с моделью. Проверьте, что выбрали VAE под версию (SD 1.5 VAE для 1.5 моделей, SDXL VAE для SDXL). Если не помогает, добавьте в COMMANDLINE_ARGS флаг --no-half-vae.
Генерация идёт час за одну картинку
- Проверьте, что используется GPU, а не CPU. В консоли при запуске должно быть "device: cuda", а не "device: cpu". Если cpu, переустановите torch с поддержкой CUDA
- Установите xformers: добавьте
--xformersв COMMANDLINE_ARGS - Уберите ненужные расширения, они грузятся каждый запуск
- Убедитесь, что драйвер Nvidia свежий (через GeForce Experience)
"Torch is not able to use GPU"
Скорее всего, у вас встроенная Intel/AMD графика выбралась по умолчанию, либо торч поставился без CUDA. В webui-user.bat пропишите:
set COMMANDLINE_ARGS=--reinstall-torch
Запустите один раз, потом этот флаг уберите.
Расширения ломают интерфейс
После установки нового расширения интерфейс не открывается. Лечится удалением папки расширения из extensions/, либо запуском с флагом --disable-all-extensions.
Бесплатно vs Magnific, Topaz, Firefly: трезвое сравнение
Локальный Stable Diffusion - не серебряная пуля. Где он реально выигрывает у платных сервисов, а где проигрывает.
Где Stable Diffusion локально лучше
- Объём. Сгенерили 500 вариантов фона за вечер, никто не считает токены
- Приватность. Карточки клиента не уходят на сервера
- Кастомизация. LoRA на свой продукт, ControlNet, inpainting под пиксель
- Конечная стоимость. После окупаемости железа ноль за картинку
Где платные сервисы лучше
- Magnific и Topaz Gigapixel 8 на апскейле и восстановлении деталей до сих пор обыгрывают локальные апскейлеры (4x-UltraSharp, SUPIR в локальном варианте догоняют, но не везде)
- Firefly интегрирован в Photoshop и работает из коробки без установки
- Midjourney v7 даёт стабильно красивую картинку с одной строки промпта, локальный SD требует подбора модели и параметров
- DALL-E 3 лучше понимает сложные текстовые промпты на русском
Рабочая схема для коммерческого ретушёра в 2026: основной поток на локальном Stable Diffusion (фоны, инпейнт, варианты), финальный апскейл и шарпинг в Magnific или Topaz, ретушь в Photoshop. Подписки на Midjourney и Firefly при таком подходе не нужны.
Куда двигаться дальше
После того как вы поставили A1111, скачали 3-4 модели и сгенерили первые сто картинок, появятся вопросы посерьёзнее:
- Как обучить LoRA на свой товар, чтобы модель знала именно вашу серьгу
- Как настроить ControlNet с несколькими референсами одновременно
- Как собирать пайплайн в ComfyUI для пакетной обработки 200 карточек за ночь
- Как делать regional prompting (разные промпты на разные участки одной картинки)
- Как использовать SDXL Refiner и Hi-Res Fix для премиального качества
- Какие LoRA реально работают для ювелирки, и как их комбинировать
Сами по себе эти темы разбросаны по форумам Reddit, Civitai и Discord-серверам, по-русски почти ничего нет. Собрать систему из обрывков можно, но на это уйдут месяцы.
Готовы перейти от установки к коммерческой работе
В студии gdefoto мы три года снимаем и ретушируем предметку для маркетплейсов и собрали практику применения Stable Diffusion в реальном продакшене. Курс AI PRO разбирает именно тот рабочий контур, что описан выше: A1111 с нуля, ControlNet для ювелирки, обучение собственных LoRA на ваших товарах, инпейнт-сценарии под маркетплейсы, апскейл и финиш. Все уроки - на конкретных кейсах: кольца, серьги, цепи, реальные фотосъёмки.
Если вы дочитали до сюда и понимаете, что хотите делать это не на хобби-уровне, а зарабатывать ретушью с AI, посмотрите программу курса на странице /lk/ai-pro/. Там расписан полный план, примеры работ выпускников и формат обучения. Места ограничены группой, чтобы каждому давать обратную связь по работам.