WHATSAPP:
Звонок
часы работы:
понедельник - воскресенье: 24/7
выбор языка:

ControlNet для предметной фотографии: какой когда применять в 2026


статья gdefoto

ControlNet для предметной фотографии: какой когда применять в 2026

Если вы хоть раз пробовали догенерировать фон или поменять освещение для предметки через чистый Stable Diffusion, вы знаете эту боль. Берёте флакон духов с фирменной гранью, прогоняете через img2img,

О чём статья

Если вы хоть раз пробовали догенерировать фон или поменять освещение для предметки через чистый Stable Diffusion, вы знаете эту боль. Берёте флакон духов с фирменной гранью, прогоняете через img2img, и на выходе модель пересобирает геометрию по-своему. Грань поплыла, логотип превратился в иероглиф, крышечка стала чуть выше. Для портрета такие вольности можно простить. Для каталога маркетплейса, где клиент сравнивает товар с реальной фоткой производителя, это брак.

ControlNet решает ровно эту задачу. Он подсказывает диффузии, какую структуру держать неизменной, а где разрешено фантазировать. На предметке это не один универсальный препроцессор, а зоопарк из десятка типов, каждый со своей сильной стороной. Canny идеален для ювелирки с резкими гранями, Depth выручает на скульптурных формах, Tile вытягивает текстуры на апскейле, IPAdapter держит единый стиль всего каталога. Путаться в них на старте легко, и большинство ретушёров либо застревают на одном Canny с дефолтным весом, либо включают сразу четыре блока и ловят кашу на выходе.

В этом материале разложим по полочкам, какой ControlNet под какую задачу брать в 2026 году, какие параметры выкручивать, как комбинировать два препроцессора одновременно и сколько VRAM это всё съест. Без воды, с конкретными цифрами для ювелирки, часов, упаковки, косметики и техники.

Что такое ControlNet и зачем он нужен на предметке

ControlNet это нейросеть-надстройка, которая запускается параллельно с основной диффузионной моделью и удерживает определённые признаки исходного изображения. Технически она получает на вход карту условий (контурную, глубинную, нормальную, цветовую) и в каждом шаге денойзинга подмешивает эту карту в латентное пространство SD. На выходе модель уже не может уйти от заданной геометрии, даже если промпт намекает на другое.

Для портретной генерации без ControlNet ещё можно жить. Лицо у модели и так получается анатомически правильным. На предметной фотографии всё иначе. Объект уникален, форма не поддаётся обобщению, любое отклонение от референса заметно. Без ControlNet нейросеть превратит вашу серёжку в нечто похожее на серёжку. С ControlNet вы получаете ту же серёжку, но в новом окружении, с новым светом, с новым фоном.

Ключевая идея: ControlNet это инструмент удержания, а не генерации. Промпт по-прежнему отвечает за стиль, материал и атмосферу. ControlNet отвечает только за то, что геометрия и пропорции останутся узнаваемыми.

Установка ControlNet в Automatic1111 за 5 минут

В A1111 (актуально для веток 1.10 и новее, проверено на свежих сборках 2026 года) ставится через вкладку Extensions. Идёте в Available, жмёте Load from, ищете sd-webui-controlnet от Mikubill, ставите. Перезапускаете интерфейс. Появляется вкладка ControlNet под промптом.

Модели не приходят с расширением, их надо тянуть отдельно. Для SD 1.5 базовый набор лежит на HuggingFace в репозитории lllyasviel/ControlNet-v1-1, файлы кладём в models/ControlNet/. Для SDXL берите версии от lllyasviel/sd_control_collection или xinsir, они тяжелее (по 2.5 ГБ каждая), но дают качество, недосягаемое для SD 1.5 на предметке.

Минимальный пакет для коммерческой работы: control_v11p_sd15_canny, control_v11f1p_sd15_depth, control_v11p_sd15_lineart, control_v11p_sd15_normalbae, control_v11f1e_sd15_tile, ip-adapter_sd15, reference-only (он не модель, а препроцессор, встроен).

В настройках расширения поставьте Allow other script to control this extension и Multi-ControlNet до 3 юнитов. Этого хватит для всех задач предметки.

Canny: рабочая лошадь ювелирки и упаковки

Canny строит карту по детектору контуров Canny edge. Получается чёрно-белая картинка с тонкими линиями там, где в исходнике резкие переходы яркости. Модель потом удерживает именно эти линии.

Что важно для предметки: Canny игнорирует мягкие тоновые переходы и работает только с резкими краями. Это идеально для:

  • ювелирных украшений со множеством граней (бриллиант, многогранные подвески)
  • часов (циферблат с цифрами и стрелками, шкала безеля)
  • упаковки с печатным текстом и логотипами
  • техники с явными корпусными швами и клавишами

Параметры, которые реально менять:

| Параметр | Дефолт | Для ювелирки | Для упаковки |

|---|---|---|---|

| Control Weight | 1.0 | 0.85 | 1.1 |

| Starting Control Step | 0 | 0 | 0 |

| Ending Control Step | 1.0 | 0.85 | 1.0 |

| Low Threshold | 100 | 50 | 100 |

| High Threshold | 200 | 150 | 200 |

Низкие пороги (50/150) ловят больше мелких граней, что критично для бриллиантов. Высокие (150/250) убирают шум на ровных поверхностях упаковки. Если поставите Ending Step на 0.85, последние шаги модель будет генерировать без жёсткого удержания, и блики получатся живыми, не плоскими. Это рабочий приём для всех металлов.

Типичная ошибка: ставить Weight 1.5 в надежде, что геометрия будет ещё точнее. На деле выше 1.2 модель начинает игнорировать промпт и выдаёт почти исходную картинку, без нового света и фона.

Depth: 3D-форма для скульптурных предметов

Depth выдаёт карту глубины, где ближние участки светлые, дальние тёмные. Модель удерживает объёмную форму, но позволяет фантазировать с поверхностью и материалом.

Когда брать Depth вместо Canny:

  • бутылки, флаконы духов (плавные изгибы без резких граней)
  • керамика, ваза, статуэтка
  • сумки и обувь (мягкая форма, складки)
  • мебель и аксессуары
  • косметика в тубах и баночках

Препроцессоры на выбор: depth_midas (классика, быстрый), depth_zoe (точнее на сложных формах), depth_anything_v2 (новый стандарт 2026 года, лучше всех по точности).

Параметры:

  • Control Weight 0.7-0.9 (depth любит мягкое удержание)
  • Ending Step 0.7-0.8 (отпускайте раньше, чтобы текстура материала проработалась свободно)
  • Resolution препроцессора 512 для SD 1.5, 768-1024 для SDXL

Главный лайфхак: если предмет на исходнике слишком близко к камере, midas путается с задним фоном. Перед прогоном вырежьте объект из фона (хоть в фотошопе, хоть через rembg) и подайте на чёрном поле. Карта глубины станет чище, удержание точнее.

Lineart: тонкие линии, гравировки, узоры

Lineart работает как Canny, но даёт более художественные, плавные линии вместо технических обводок. Для предметки полезен в трёх сценариях:

  1. Гравировки на металле (часы, портсигары, кольца с надписями)
  2. Сложные узоры на текстиле, керамике, обоях
  3. Иллюстративная подача каталога, когда хочется художественности

Препроцессоры: lineart_realistic (для фотореалистичной работы), lineart_anime (только для стилизованных каталогов), lineart_coarse (для упрощённого узора).

Для гравировок ставьте Weight 1.0, Ending Step 1.0. Без отпускания, иначе мелкие детали затрутся.

Lineart и Canny часто путают. Простое правило: Canny ловит границы (где темно встречается со светлым), Lineart ловит линии (где была нарисована или процарапана линия). Для штрих-кода берите Canny. Для гравированной надписи берите Lineart.

Как убрать круги под глазами на фото. Изображение 1

Normal Map: рельеф и фактура поверхности

Normal Map это RGB-карта, где каждый канал кодирует направление нормали поверхности в точке. Голубоватый цвет означает плоскость, смотрящую в камеру, красноватые и зеленоватые тона указывают наклон.

На предметке Normal Map незаменим там, где важна фактура без жёсткой геометрии:

  • кожа (сумки, обувь, мебель)
  • ткани с выраженной фактурой (бархат, шерсть, лён)
  • литьё, чеканка, рельефные эмблемы
  • 3D-логотипы на упаковке

Препроцессоры: normal_bae (стандарт), normal_midas (старая версия, иногда работает лучше на однотонных поверхностях).

Параметры:

  • Weight 0.6-0.8
  • Ending Step 0.9
  • Preprocessor Resolution 768 минимум

Normal любит, чтобы в промпте были упомянуты материалы. Если генерите кожаную сумку и пишете просто bag, модель может проигнорировать фактуру. Пишите grain leather, fine texture, soft matte finish, и Normal вытянет нюансы.

Tile: апскейл с подгрузкой деталей

Tile это особый ControlNet, который не удерживает структуру в обычном смысле, а позволяет догенерировать недостающие детали при увеличении. Работает по принципу: вы подаёте изображение, разбиваете его на тайлы (плитки), и каждый тайл обрабатывается с подсказкой Tile.

Это рабочий инструмент для финального апскейла каталожной картинки с 1024 до 4096-8192 пикселей. Без Tile апскейл размывает детали или плодит артефакты. С Tile появляются настоящие текстуры дерева, ниток, металла.

Связка для предметного апскейла:

  • Tile препроцессор tile_resample, Weight 0.5-0.7
  • Ending Step 1.0
  • Denoising strength 0.4-0.55 (важно: не выше, иначе модель уйдёт от исходника)
  • Скрипт SD Upscale или Ultimate SD Upscale
  • Масштаб 2x за один проход, лучше два прохода по 2x чем один на 4x

Tile часто комбинируют с моделями 4x-UltraSharp или ESRGAN на этапе предварительного увеличения, а ControlNet уже добавляет натуральные детали поверх.

IPAdapter: согласование стиля по эталону

IPAdapter переносит визуальный стиль с одной картинки на другую. Не геометрию, а именно стиль: цвета, свет, настроение, общий look. Для каталога это золото.

Реальный кейс: вы сняли 200 товаров маркетплейса в разные дни, при разном свете. Через IPAdapter берёте одну эталонную картинку (правильно снятую, с фирменным фоном и светом) и приводите все остальные к её стилю. На выходе серия выглядит цельно, как будто снимали в один присест.

Версии IPAdapter в 2026:

| Версия | Под что | Особенность |

|---|---|---|

| ip-adapter_sd15 | SD 1.5 общая | Базовая, шустрая |

| ip-adapter-plus_sd15 | SD 1.5 точная | Лучше держит детали стиля |

| ip-adapter_sdxl | SDXL общая | Тяжелее, качественнее |

| ip-adapter-plus_sdxl_vit-h | SDXL премиум | Стандарт для коммерческой работы |

| ip-adapter_faceid | портреты | На предметке не нужен |

Параметры:

  • Control Weight 0.5-0.8 (выше 1.0 убивает промпт)
  • Ending Step 0.7-0.9
  • Type Style only для стиля без геометрии (важно!)

Комбинируйте IPAdapter с Canny или Depth: первый держит стиль каталога, второй держит форму конкретного товара. Получаете серию, в которой каждый предмет узнаваем, а общая подача единая.

Reference-only: упрощённая альтернатива IPAdapter

Reference-only появился раньше IPAdapter и до сих пор живёт в расширении ControlNet. Препроцессор не использует отдельную модель, а инжектит фичи из референса прямо в self-attention слои SD.

Когда брать Reference вместо IPAdapter:

  • быстрый прототип, без скачивания моделей
  • работа на слабом железе (Reference легче)
  • референс и целевой объект очень похожи по форме

Препроцессоры: reference_only, reference_adain, reference_adain+attn. На предметке стабильнее всего reference_only с Style Fidelity 0.5-0.7.

Reference не любит сильных промптов. Если в промпте много стилистических слов, он будет конфликтовать с референсом. Держите промпт коротким, опишите только сам предмет.

Softedge: мягкие границы для деликатных задач

Softedge даёт мягкие, размытые контуры. Используется там, где Canny слишком жёсткий, а Depth недостаточно структурный.

Реальные сценарии:

  • мягкие игрушки и плед
  • хлеб, выпечка, кондитерка (объект с неровной органической формой)
  • салфетки, складки тканей
  • цветы, букеты

Препроцессоры: softedge_pidinet (контрастнее), softedge_hed (мягче), softedge_pidisafe (более точный), softedge_hedsafe (самый деликатный).

Weight 0.7-0.9, Ending Step 0.85. Чем мягче объект, тем ниже Weight.

Связки двух ControlNet одновременно

Реальная коммерческая работа на предметке почти всегда использует два юнита ControlNet. Один держит структуру, второй стиль или дополнительное измерение.

Canny + Depth. Базовая связка для ювелирки и упаковки. Canny удерживает грани и текст, Depth добавляет понимание объёма. Веса: Canny 0.9 + Depth 0.5. Результат: пропорции и надписи не плывут, при этом блики и тени реалистичны.

Canny + IPAdapter. Для каталогов с единым стилем. Canny держит форму конкретного товара, IPAdapter подтягивает общий look. Веса: Canny 1.0 + IPAdapter 0.6. Берёте эталонную картинку каталога и тиражируете её стиль на все товары.

Lineart + Normal. Для деталей с гравировками и фактурой. Lineart удерживает гравировку, Normal оживляет металл вокруг. Веса: Lineart 1.0 + Normal 0.6. Идеально для часов премиум-сегмента и портсигаров.

Depth + Tile. Для апскейла сложных форм. Depth не даёт развалиться силуэту на больших масштабах, Tile подсказывает детали. Веса: Depth 0.5 + Tile 0.6.

IPAdapter + Reference. Двойной перенос стиля. Один задаёт цветовую гамму, второй композицию. Редкая связка, но работает на сложных каталогах с двойными требованиями. Веса: оба по 0.5.

Три ControlNet одновременно почти никогда не нужно. На третьем юните модель начинает игнорировать промпт. Если кажется, что нужно три, скорее всего у вас неправильно подобраны веса первых двух.

Сколько VRAM ест каждая связка

Расчёты для SD 1.5 на разрешении 768x768 и SDXL на 1024x1024. С батчем 1, без xformers/sdp оптимизаций.

| Связка | SD 1.5 | SDXL |

|---|---|---|

| Только SD без CN | 4 ГБ | 8 ГБ |

| 1 ControlNet (Canny/Depth/etc) | 5.5 ГБ | 10 ГБ |

| 2 ControlNet | 7 ГБ | 12.5 ГБ |

| 2 CN + IPAdapter | 7.5 ГБ | 13.5 ГБ |

| 2 CN + Tile (апскейл) | 8 ГБ | 15 ГБ |

| 3 ControlNet | 9 ГБ | 16+ ГБ |

С xformers и medvram-флагом цифры можно урезать на 25-35%. На картах 8 ГБ работает SD 1.5 с двумя ControlNet нормально, SDXL только с одним и обязательно --medvram. На 12 ГБ комфортно тянется SDXL с двумя CN. На 16 ГБ и выше можно собирать любые связки без оглядки.

В 2026 году рабочая конфигурация для коммерческой предметки это видеокарта от 12 ГБ. Всё, что ниже, требует компромиссов по разрешению или количеству юнитов.

Типичные ошибки настройки

Веса по дефолту на всех юнитах. Когда стоит два ControlNet с Weight 1.0, они дерутся друг с другом. Один тянет одеяло, другой тоже. Промпт игнорируется. Правило: сумма весов всех ControlNet не должна сильно превышать 1.2-1.5.

Неправильный препроцессор для исходника. Подаёте уже готовую карту Canny на вход, но оставляете препроцессор canny. Расширение пытается ещё раз обработать готовую карту, получается ерунда. Если у вас на руках готовая карта, ставьте препроцессор none.

Resolution препроцессора ниже разрешения генерации. Если генерите 1024x1024, а препроцессор стоит 512, ControlNet работает по огрублённой карте и теряет мелкие детали. Ставьте Preprocessor Resolution равным или близким к большей стороне холста.

Игнорирование Ending Step. 90% ретушёров оставляют Ending Step на 1.0 и недоумевают, почему блики получаются мёртвыми. Сбросьте на 0.8-0.85, последние шаги модель доработает свободно, и материалы заиграют.

Сильное удержание на слабом промпте. ControlNet это не магия. Если промпт описан в три слова, никакая связка ControlNet не сделает за вас красиво. Структура удержится, но качество света, материала и атмосферы зависит от промпта.

Использование одной связки на всём каталоге. Часы и плед не делаются одной и той же настройкой. Под каждый тип товара своя связка ControlNet. Серьёзная студия держит библиотеку пресетов на 10-15 типовых сценариев.

Что дальше

Разобраться с ControlNet это первый шаг к коммерческой работе с AI на предметке. Дальше идут LoRA, ComfyUI-пайплайны, inpainting, регионарные промпты. Сборка всего этого в рабочий процесс у самоучек занимает 8-14 месяцев, и большинство сдувается: форумы закрытые, видео устаревают за 3 месяца, каждая ошибка стоит часов.

Если хочется пройти этот путь за 3-4 месяца со структурой, обратной связью и реальными коммерческими задачами, посмотрите курс AI PRO от gdefoto. Полный цикл: от установки SD/ControlNet под предметку, через LoRA и IPAdapter, до сдачи каталога маркетплейса под ключ. Преподаватели практикующие ретушёры, разбор каждой работы лично, закрытый чат выпускников, обновляемая библиотека пресетов. Подробности и запись на ближайший поток: /lk/ai-pro/

ControlNet это инструмент, а не цель. Цель это коммерческая ретушь нового поколения, где серия снимается в десять раз быстрее и выглядит лучше, чем классический подход. Туда идёт рынок.

Войти в ЛК