Stable Diffusion gratuit: installation sur votre PC pour non-developpeurs en 2026


gdefoto article

Stable Diffusion gratuit: installation sur votre PC pour non-developpeurs en 2026

Si vous retouchez des photos produit pour Amazon, Cdiscount ou des boutiques Shopify, ou si vous faites du still life professionnel, vous avez sans doute vu des confreres generer des fonds, peindre de

Intro

Si vous retouchez des photos produit pour Amazon, Cdiscount ou des boutiques Shopify, ou si vous faites du still life professionnel, vous avez sans doute vu des confreres generer des fonds, peindre des ombres et monter des scenes entieres sans mettre les pieds dans un studio. La plupart paie un service en ligne: Midjourney, Adobe Firefly, Magnific. L'abonnement tourne tous les mois, les images vivent sur des serveurs etrangers et les fiches produit de vos clients atterrissent dans un cloud qui n'est pas le votre.

Une alternative gratuite existe. Stable Diffusion tourne sur votre propre ordinateur, sans internet et sans abonnement. Le modele est ouvert, les poids sont sur Hugging Face et Civitai, le code source d'A1111 est sur GitHub. Une seule installation et vous generez autant d'images que vous voulez, jusqu'a mille par jour.

Dans cet article nous deroulons l'installation depuis zero. Pas de session terminal de 200 commandes, pas de Docker, pas de WSL. Juste Python, Git et une interface claire dans le navigateur. Nous avons fait ce meme parcours dans le cours AI PRO et nous le repetons ici pour vous. A la fin de l'article vous aurez un Stable Diffusion fonctionnel sur l'ordinateur et plusieurs modeles eprouves pour la photo produit et la retouche.

Qu'est-ce que Stable Diffusion et pourquoi l'installer en local

Stable Diffusion est un reseau neuronal qui genere des images a partir de texte. Stability AI a publie la premiere version en 2022 avec des poids ouverts. Depuis, la communaute a entraine des milliers de modeles derives: pour le portrait, l'anime, la photo produit, l'architecture, la mode.

Le principe est simple. Vous ecrivez un prompt ("bague en argent avec saphir sur fond blanc, lumiere douce, prise en studio"), le modele fait passer du bruit dans le reseau et le transforme progressivement en image. Contrairement a Midjourney, ou vous recevez le resultat sur un serveur tiers et ne maitrisez pas les details, le Stable Diffusion local vous donne le controle complet.

Stable Diffusion vs Midjourney vs DALL-E 3 vs Firefly

| Parametre | Stable Diffusion local | Midjourney v7 | DALL-E 3 | Adobe Firefly 3 |

|---|---|---|---|---|

| Prix | Gratuit | a partir de 10 EUR/mois | dans ChatGPT Plus | dans Creative Cloud |

| Confidentialite | Tout sur votre PC | Sur serveurs | Sur serveurs OpenAI | Sur serveurs Adobe |

| ControlNet, inpainting, LoRA | Oui, l'integralite | Non | Non | Partiel |

| Modeles et LoRA personnels | Oui | Non | Non | Non |

| Usage commercial | Oui (verifier la licence du modele) | Plans payants seulement | Oui | Oui |

| Courbe d'apprentissage | Elevee | Faible | Minimale | Faible |

Si vous publiez un post par semaine, Midjourney est plus simple. Si vous retouchez 50 fiches produit par jour, le Stable Diffusion local est rentable en un mois.

Exigences materielles: ce qu'il faut en 2026

La ressource cle, c'est la memoire video (VRAM) sur une carte Nvidia. Ce n'est pas la RAM systeme, ce n'est pas l'espace SSD, c'est la memoire sur la GPU elle-meme. Sans elle, le modele ne se charge pas. AMD et Intel Arc fonctionnent aussi, mais via des contournements (DirectML, ROCm sous Linux), et nous ne le recommandons pas aux debutants.

Minimum pour demarrer

  • GPU Nvidia avec 6 Go de VRAM (RTX 2060, RTX 3050, GTX 1660 Super)
  • 16 Go de RAM systeme
  • 100 Go libres sur SSD (les modeles pesent de 2 a 7 Go chacun, le dossier se remplit vite)
  • Windows 10/11 ou Linux
  • Pilote Nvidia Studio a jour

Avec ce minimum, SDXL et Flux ne demarrent pas, seulement le SD 1.5 de base. Une image 512x512 prend de 15 a 25 secondes.

Configuration recommandee

  • GPU Nvidia avec 12 a 16 Go de VRAM (RTX 4070, RTX 4070 Ti Super, RTX 5070, RTX 3090 d'occasion)
  • 32 Go de RAM
  • SSD NVMe de 1 To pour les modeles et le cache
  • Bon refroidissement, la generation chauffe la carte comme du minage

Sur une RTX 4070 Super (12 Go), une image SDXL 1024x1024 se rend en 8 a 12 secondes, Flux dev en 30 a 40 secondes. C'est un rythme tenable pour des commandes pro.

Quand l'installation locale n'a pas de sens

Si vous avez un portable avec graphique integree, un MacBook M1/M2 sans 32 Go de unified memory ou un vieux PC sans GPU dediee, ne luttez pas. Louez une GPU sur runpod.io ou vast.ai (a partir de 0,30 EUR de l'heure pour une RTX 4090), ou utilisez Google Colab. Pour tester ca suffit, mais pour de la production reguliere, monter son propre PC reste moins cher.

Installation pas a pas: Python, Git, AUTOMATIC1111

A1111 (Automatic1111 WebUI) est le frontend le plus repandu pour Stable Diffusion. Il s'ouvre dans le navigateur et ne demande aucune competence en programmation une fois installe. Alternatives: ComfyUI (plus puissant mais plus complexe), Forge (fork d'A1111 plus rapide sur les GPU recentes), Fooocus (simplifie). On commence par A1111, vous choisirez ensuite ce qui vous convient.

Etape 1. Installer Python 3.10.6

Exactement 3.10.6, pas 3.11, pas 3.12. A1111 boude les versions plus recentes.

  1. Telechargez python-3.10.6-amd64.exe sur python.org/downloads/release/python-3106
  2. Pendant l'installation, cochez imperativement "Add Python to PATH" en bas de la premiere fenetre
  3. Cliquez sur Install Now
  4. Verification dans l'invite de commande: python --version doit afficher 3.10.6

Si vous avez deja Python 3.11 ou 3.12, ne le desinstallez pas. Installez 3.10.6 a cote et configurez le chemin via variable d'environnement, ou appelez-le avec py -3.10.

Etape 2. Installer Git

Git sert a cloner le depot d'A1111 et a le mettre a jour ensuite avec une commande.

  1. Telechargez l'installeur sur git-scm.com/download/win
  2. Installez avec toutes les cases cochees par defaut
  3. Verifiez avec git --version dans l'invite

Etape 3. Cloner A1111

Creez un dossier pour les reseaux neuronaux, par exemple D:\AI\ ou C:\StableDiffusion\. Le chemin ne doit pas contenir d'espaces ni de caracteres non latins.

Ouvrez l'invite de commande dans ce dossier (clic droit dans l'Explorateur, "Ouvrir dans le Terminal", ou Shift plus clic droit, "Ouvrir la fenetre de commande"). Tapez:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Le dossier stable-diffusion-webui se telecharge, environ 50 Mo. C'est l'interface elle-meme, encore sans modeles.

Etape 4. Premier lancement

Entrez dans le dossier stable-diffusion-webui, trouvez le fichier webui-user.bat, double-cliquez. Une fenetre noire s'ouvre, les dependances se telechargent: torch, xformers, gradio et autres. Il faut compter 4 a 6 Go au telechargement et de 10 a 30 minutes au premier lancement.

Quand vous voyez la ligne Running on local URL: http://127.0.0.1:7860, ouvrez cette adresse dans le navigateur. L'interface d'A1111 s'affiche.

S'il plante avec une erreur CUDA, torch ou memoire, lisez la section erreurs plus bas.

Modeles gratuits pour la photo et la photo produit

Le modele de base Stable Diffusion 1.5 fait un peu de tout, mais rien de bien. Pour de la photo commerciale, il vous faut des modeles fine-tunes par la communaute. On les telecharge sur civitai.com (inscription gratuite obligatoire). Les fichiers vont dans stable-diffusion-webui/models/Stable-diffusion/.

Top modeles pour la photo produit et la retouche en 2026

| Modele | Base | Taille | Pour quoi |

|---|---|---|---|

| Realistic Vision V6.0 B1 | SD 1.5 | 2 Go | Personnes realistes, peau, portraits |

| Juggernaut XL v11 | SDXL | 6,5 Go | Realisme universel, produit, mode |

| epiCRealism XL Last Hope | SDXL | 6,5 Go | Photorealisme, photo produit |

| RealVisXL V5.0 | SDXL | 6,5 Go | Textures detaillees, metal, verre |

| Flux.1 dev | Flux | 23 Go | Qualite haut de gamme, exige 16+ Go de VRAM |

| DreamShaper XL Turbo | SDXL | 6,5 Go | Generation rapide en 4 a 8 etapes |

Pour la bijouterie et l'horlogerie, prenez Juggernaut XL ou RealVisXL, ils gerent bien les surfaces metalliques et les reflets. Pour les vetements et le textile, epiCRealism XL. Pour les visages et les modeles en cadre, demarrez avec Realistic Vision V6 puis passez a SDXL.

Versions inpainting: corriger une partie de l'image

L'inpainting est le mode ou vous peignez par-dessus une partie de l'image et dites au modele ce qui doit s'y trouver. Indispensable en retouche: enlever une etiquette sur un vetement, changer un fond, ajouter l'ombre d'un objet.

Telechargez les versions inpaint des memes modeles:

  • Realistic Vision V6.0 B1 Inpainting
  • Juggernaut XL Inpainting
  • epiCRealism Inpainting

Mettez-les dans le meme dossier models/Stable-diffusion. Dans A1111 basculez en img2img puis Inpaint, choisissez le checkpoint inpainting, peignez le masque sur la zone problematique, ecrivez le prompt. C'est un outil reel qui couvre 80% des cas de Remplissage Generatif de Photoshop, gratuit et sans abonnement Adobe.

VAE: saturation et contraste

Le VAE (variational autoencoder) est un petit fichier de 300 a 800 Mo qui s'occupe du traitement final des couleurs. Sans le bon VAE, les images sortent pales et grises. Telechargez:

  • vae-ft-mse-840000-ema-pruned pour SD 1.5
  • sdxl_vae pour SDXL

Mettez-le dans models/VAE, selectionnez-le dans Settings, Stable Diffusion, SD VAE.

ControlNet: maitriser la composition

Un prompt brut donne un resultat aleatoire. Aujourd'hui vous generez une jolie bague au centre, demain la meme bague file dans un coin et bascule. ControlNet regle ce point.

ControlNet est une famille de modeles qui ajoutent a Stable Diffusion une entree supplementaire: un croquis, une carte de profondeur, une pose humaine, des contours d'objet, des normales de surface. Vous donnez une reference au reseau et il dessine strictement le long de ce guide.

Les preprocesseurs qui marchent vraiment

  • Canny: extrait les contours. Pratique pour repeindre un objet dans un autre style en conservant sa forme
  • Depth: carte de profondeur. Conserve la structure 3D de la scene en changeant les materiaux
  • OpenPose: squelette humain. Reproduit precisement la pose du modele de la reference
  • Lineart: lignes nettes pour l'illustration et le concept art
  • IP-Adapter: transfere le style d'une image de reference dans son ensemble
  • Tile: upscale avec restauration du detail

Pour la photo produit, vous aurez surtout besoin de Canny et Depth. Vous photographiez un bijou sur fond gris, vous le passez par Canny, vous generez le meme bijou sur du marbre avec des petales autour. La forme ne bouge pas.

Installation de ControlNet

  1. Dans A1111, allez sur Extensions, Install from URL
  2. Collez https://github.com/Mikubill/sd-webui-controlnet
  3. Cliquez sur Install, redemarrez A1111
  4. Telechargez les modeles ControlNet depuis huggingface.co/lllyasviel/sd_control_collection (pour SDXL) ou /lllyasviel/ControlNet-v1-1 (pour SD 1.5)
  5. Mettez-les dans extensions/sd-webui-controlnet/models/

Apres le redemarrage, un panneau ControlNet replie apparait sous la fenetre txt2img. Vous y chargez la reference, choisissez le type, generez.

Exemple de retouche photo

Erreurs typiques au premier lancement

CUDA out of memory

L'erreur la plus courante. La VRAM est epuisee. Solutions par ordre d'efficacite:

  1. Reduisez la resolution. 1024x1024 ne tient pas dans 6 Go, descendez a 512x768
  2. Dans webui-user.bat ajoutez les flags: set COMMANDLINE_ARGS=--xformers --medvram. Pour les tres petites cartes, --lowvram
  3. Fermez Chrome, Photoshop, Lightroom. Ils mangent de la VRAM en arriere-plan
  4. Baissez le batch size a 1
  5. Utilisez des modeles SD 1.5 plutot que SDXL si votre carte a moins de 8 Go

Image noire en sortie

Cela signifie en general que le VAE ne s'est pas charge ou qu'il est incompatible avec le modele. Verifiez que vous avez choisi le bon VAE pour la version (SD 1.5 VAE pour les modeles 1.5, SDXL VAE pour SDXL). Si ca ne suffit pas, ajoutez le flag --no-half-vae a COMMANDLINE_ARGS.

Une heure pour une image

  • Verifiez que la GPU est utilisee, pas le CPU. Au demarrage la console doit indiquer "device: cuda", pas "device: cpu". Si c'est cpu, reinstallez torch avec support CUDA
  • Installez xformers: ajoutez --xformers a COMMANDLINE_ARGS
  • Supprimez les extensions inutiles, elles se chargent a chaque demarrage
  • Assurez-vous que le pilote Nvidia est a jour (via GeForce Experience)

"Torch is not able to use GPU"

Le plus probable: la graphique integree Intel ou AMD a ete prise par defaut, ou torch a ete installe sans CUDA. Dans webui-user.bat ecrivez:

set COMMANDLINE_ARGS=--reinstall-torch

Lancez une fois, puis retirez ce flag.

Les extensions cassent l'interface

Apres avoir installe une nouvelle extension, l'interface ne s'ouvre plus. Solution: supprimer le dossier de l'extension dans extensions/, ou lancer avec --disable-all-extensions.

Gratuit vs Magnific, Topaz, Firefly: comparaison sans fard

Stable Diffusion local n'est pas une solution miracle. Voici ou il bat vraiment les services payants et ou il perd.

Ou Stable Diffusion local gagne

  • Volume. 500 variantes de fond dans une soiree, personne ne compte les tokens
  • Confidentialite. Les fiches client ne quittent pas votre poste
  • Personnalisation. LoRA entrainee sur votre produit, ControlNet, inpainting au pixel
  • Cout a long terme. Une fois le materiel amorti, zero par image

Ou les services payants gagnent

  • Magnific et Topaz Gigapixel 8 dominent encore les upscalers locaux pour la restauration du detail (4x-UltraSharp, SUPIR en local rattrapent mais pas partout)
  • Firefly est integre a Photoshop et fonctionne tout de suite sans installation
  • Midjourney v7 sort une belle image a partir d'une seule ligne de prompt, le SD local exige le bon modele et le bon parametrage
  • DALL-E 3 comprend mieux les prompts textuels complexes en francais

Schema de travail pour un retoucheur commercial en 2026: flux principal sur Stable Diffusion local (fonds, inpaint, variantes), upscale et nettete finale dans Magnific ou Topaz, retouche dans Photoshop. Avec cette approche, les abonnements a Midjourney et Firefly ne servent a rien.

Et apres

Une fois A1111 installe, trois ou quatre modeles telecharges et les cent premieres images generees, des questions plus serieuses arrivent:

  • Comment entrainer une LoRA sur votre propre produit pour que le modele connaisse exactement votre boucle d'oreille
  • Comment configurer ControlNet avec plusieurs references simultanees
  • Comment construire un pipeline dans ComfyUI pour traiter 200 fiches en une nuit
  • Comment faire du regional prompting (prompts differents pour differentes zones d'une meme image)
  • Comment utiliser SDXL Refiner et Hi-Res Fix pour une qualite premium
  • Quelles LoRA marchent vraiment pour la bijouterie et comment les combiner

Ces sujets sont eparpilles sur Reddit, Civitai et des serveurs Discord, et en francais il n'y a presque rien. Assembler le systeme a partir de bouts est possible mais prend des mois.

Pret a passer de l'installation au travail commercial

Au studio gdefoto nous photographions et retouchons des produits pour marketplaces depuis trois ans et nous avons construit une pratique reelle de Stable Diffusion en production. Le cours AI PRO couvre exactement le circuit decrit plus haut: A1111 de zero, ControlNet pour la bijouterie, entrainement de LoRA personnelles sur vos produits, scenarios d'inpaint pour marketplaces, upscale et finition. Toutes les lecons s'appuient sur des cas concrets: bagues, boucles d'oreilles, chaines, vraies sessions photo.

Si vous etes arrive jusqu'ici et que vous comprenez que vous voulez le faire serieusement, pas en hobby mais pour gagner votre vie en retouchant avec l'AI, regardez le programme du cours sur /lk/ai-pro/buy/. Vous y trouverez le plan complet, des exemples de travaux d'anciens eleves et le format d'apprentissage. Les places sont limitees par groupe afin de donner un retour personnel a chaque participant.