Stable Diffusion gratis: installazione sul PC per chi non programma nel 2026


gdefoto article

Stable Diffusion gratis: installazione sul PC per chi non programma nel 2026

Se ritocchi foto prodotto per Amazon, eBay o per e-commerce italiani, oppure scatti still life professionale, avrai gia visto colleghi generare sfondi, dipingere ombre e costruire intere scene senza m

Intro

Se ritocchi foto prodotto per Amazon, eBay o per e-commerce italiani, oppure scatti still life professionale, avrai gia visto colleghi generare sfondi, dipingere ombre e costruire intere scene senza mettere piede in studio. La maggior parte sta su servizi a pagamento: Midjourney, Adobe Firefly, Magnific. L'abbonamento gira ogni mese, le immagini stanno su server altrui e le schede dei tuoi clienti finiscono nel cloud di qualcun altro.

Un'alternativa gratuita c'e. Stable Diffusion gira sul tuo computer, senza connessione e senza abbonamento. Il modello e aperto, i pesi sono su Hugging Face e Civitai, il codice di A1111 sta su GitHub. Lo installi una volta, dopo generi quante immagini vuoi, anche mille al giorno.

In questo articolo ripercorriamo l'installazione da zero. Niente sessione da 200 comandi in terminale, niente Docker, niente WSL. Solo Python, Git e un'interfaccia pulita nel browser. Lo stesso percorso lo abbiamo fatto al corso AI PRO, lo ripetiamo qui con te. Alla fine dell'articolo avrai Stable Diffusion funzionante sul computer e alcuni modelli collaudati per still life e ritocco.

Cos'e Stable Diffusion e perche si installa in locale

Stable Diffusion e una rete neurale che genera immagini partendo da testo. Stability AI ha rilasciato la prima versione nel 2022 con pesi aperti. Da allora la community ha addestrato migliaia di modelli derivati: per ritratti, anime, still life, architettura, moda.

Il principio e semplice. Scrivi un prompt ("anello d'argento con zaffiro su sfondo bianco, luce morbida, scatto in studio"), il modello passa del rumore attraverso la rete e lo trasforma gradualmente in un'immagine. A differenza di Midjourney, dove ricevi il risultato su un server esterno e non controlli i dettagli, lo Stable Diffusion locale ti da pieno controllo.

Stable Diffusion vs Midjourney vs DALL-E 3 vs Firefly

| Parametro | Stable Diffusion locale | Midjourney v7 | DALL-E 3 | Adobe Firefly 3 |

|---|---|---|---|---|

| Prezzo | Gratis | da 10 EUR/mese | dentro ChatGPT Plus | dentro Creative Cloud |

| Privacy | Tutto sul tuo PC | Su server | Su server OpenAI | Su server Adobe |

| ControlNet, inpainting, LoRA | Si, tutto | No | No | Parziale |

| Modelli e LoRA personali | Si | No | No | No |

| Uso commerciale | Si (controlla la licenza del modello) | Solo piani a pagamento | Si | Si |

| Curva di ingresso | Alta | Bassa | Minima | Bassa |

Se pubblichi un post a settimana, Midjourney e piu comodo. Se sei un ritoccatore che genera 50 schede al giorno, lo Stable Diffusion locale si ripaga in un mese.

Requisiti del PC: cosa serve nel 2026

La risorsa principale e la memoria video (VRAM) su una scheda Nvidia. Non e la RAM di sistema e non e lo spazio SSD, e la memoria sulla GPU stessa. Senza, il modello non si carica. AMD e Intel Arc funzionano anche loro, ma con stratagemmi (DirectML, ROCm su Linux), e non lo consigliamo ai principianti.

Minimo per partire

  • GPU Nvidia con 6 GB di VRAM (RTX 2060, RTX 3050, GTX 1660 Super)
  • 16 GB di RAM di sistema
  • 100 GB liberi su SSD (i modelli pesano da 2 a 7 GB l'uno, la cartella si riempie in fretta)
  • Windows 10/11 o Linux
  • Driver Nvidia Studio aggiornato

A questo minimo SDXL e Flux non partono, solo l'SD 1.5 base. Un'immagine 512x512 impiega tra 15 e 25 secondi.

Configurazione consigliata

  • GPU Nvidia con 12-16 GB di VRAM (RTX 4070, RTX 4070 Ti Super, RTX 5070, RTX 3090 usata)
  • 32 GB di RAM
  • SSD NVMe da 1 TB per modelli e cache
  • Buon raffreddamento, la generazione scalda la scheda come il mining

Su una RTX 4070 Super (12 GB) un'immagine SDXL a 1024x1024 si renderizza in 8-12 secondi, Flux dev in 30-40 secondi. E un ritmo praticabile per lavori commerciali.

Quando non conviene installare in locale

Se hai un portatile con grafica integrata, un MacBook M1/M2 senza 32 GB di unified memory o un PC vecchio senza GPU dedicata, lascia stare. Affitta una GPU su runpod.io o vast.ai (da 0,30 EUR all'ora per una RTX 4090), oppure usa Google Colab. Per provare basta, per produzione continua conviene comunque assemblare un PC.

Installazione passo passo: Python, Git, AUTOMATIC1111

A1111 (Automatic1111 WebUI) e il frontend piu diffuso per Stable Diffusion. Si apre nel browser e, una volta installato, non richiede conoscenze di programmazione. Alternative: ComfyUI (piu potente ma piu complicato), Forge (fork di A1111 piu veloce su GPU nuove), Fooocus (semplificato). Partiamo da A1111, poi sceglierai tu cosa preferisci.

Passo 1. Installare Python 3.10.6

Proprio 3.10.6, non 3.11 e non 3.12. A1111 fa i capricci con le versioni nuove.

  1. Scarica python-3.10.6-amd64.exe da python.org/downloads/release/python-3106
  2. Durante l'installazione spunta obbligatoriamente "Add Python to PATH" in basso nella prima finestra
  3. Premi Install Now
  4. Verifica nel prompt dei comandi: python --version deve mostrare 3.10.6

Se hai gia Python 3.11 o 3.12, non disinstallarlo. Metti 3.10.6 accanto e configura il percorso in variabile d'ambiente, oppure usalo via py -3.10.

Passo 2. Installare Git

Git serve a clonare il repository di A1111 e ad aggiornarlo poi con un comando solo.

  1. Scarica l'installer da git-scm.com/download/win
  2. Installa con tutte le spunte di default
  3. Verifica con git --version nel prompt

Passo 3. Clonare A1111

Crea una cartella per le reti neurali, per esempio D:\AI\ o C:\StableDiffusion\. Il percorso non deve contenere spazi o caratteri non latini.

Apri il prompt in quella cartella (tasto destro in Esplora risorse, "Apri nel terminale", oppure Shift piu tasto destro, "Apri finestra di comando"). Digita:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Verra scaricata la cartella stable-diffusion-webui, circa 50 MB. E l'interfaccia, senza modelli al suo interno.

Passo 4. Primo avvio

Entra nella cartella stable-diffusion-webui, trova il file webui-user.bat e fai doppio clic. Si apre una finestra nera e parte il download delle dipendenze: torch, xformers, gradio e altre. Scaricherai 4-6 GB, ci vorranno 10-30 minuti al primo avvio.

Quando vedi la riga Running on local URL: http://127.0.0.1:7860, apri quell'indirizzo nel browser. Davanti a te c'e l'interfaccia di A1111.

Se si pianta con un errore CUDA, torch o memoria, leggi la sezione errori piu sotto.

Modelli gratuiti per foto e still life

Il modello base Stable Diffusion 1.5 fa un po' di tutto, ma niente bene. Per foto commerciale servono modelli fine-tuned addestrati dalla community. Si scaricano da civitai.com (registrazione gratuita obbligatoria). I file vanno in stable-diffusion-webui/models/Stable-diffusion/.

Top modelli per still life e ritocco nel 2026

| Modello | Base | Dimensione | A cosa serve |

|---|---|---|---|

| Realistic Vision V6.0 B1 | SD 1.5 | 2 GB | Persone realistiche, pelle, ritratti |

| Juggernaut XL v11 | SDXL | 6,5 GB | Realismo universale, prodotto, moda |

| epiCRealism XL Last Hope | SDXL | 6,5 GB | Fotorealismo, foto prodotto |

| RealVisXL V5.0 | SDXL | 6,5 GB | Texture dettagliate, metallo, vetro |

| Flux.1 dev | Flux | 23 GB | Qualita top, richiede 16+ GB di VRAM |

| DreamShaper XL Turbo | SDXL | 6,5 GB | Generazione rapida in 4-8 passi |

Per gioielli e orologi prendi Juggernaut XL o RealVisXL, gestiscono bene superfici metalliche e riflessi. Per abbigliamento e tessuti, epiCRealism XL. Per volti e modelle in scena parti con Realistic Vision V6 e poi passa a SDXL.

Versioni inpainting: correggere parte dell'immagine

Inpainting e la modalita dove dipingi sopra una porzione dell'immagine e dici al modello cosa deve esserci al suo posto. Indispensabile nel ritocco: togliere un cartellino da un capo, sostituire uno sfondo, aggiungere l'ombra di un oggetto.

Scarica le versioni inpaint degli stessi modelli:

  • Realistic Vision V6.0 B1 Inpainting
  • Juggernaut XL Inpainting
  • epiCRealism Inpainting

Mettile nella stessa cartella models/Stable-diffusion. In A1111 vai su img2img poi Inpaint, scegli il checkpoint inpainting, dipingi la maschera sulla zona da correggere, scrivi il prompt. E uno strumento concreto che copre l'80% dei casi di Riempimento Generativo di Photoshop, gratis e senza abbonamento Adobe.

VAE: saturazione e contrasto

VAE (variational autoencoder) e un file piccolo da 300-800 MB che gestisce la post-elaborazione finale del colore. Senza il VAE giusto le immagini escono pallide e grigie. Scarica:

  • vae-ft-mse-840000-ema-pruned per SD 1.5
  • sdxl_vae per SDXL

Mettilo in models/VAE, selezionalo in Settings, Stable Diffusion, SD VAE.

ControlNet: controllo della composizione

Un prompt nudo produce un risultato casuale. Oggi hai generato un bell'anello al centro, domani lo stesso anello sbanda in un angolo e si inclina. ControlNet risolve.

ControlNet e una famiglia di modelli che aggiungono a Stable Diffusion un ingresso extra: uno schizzo, una mappa di profondita, una posa umana, contorni di un oggetto, normali della superficie. Dai alla rete una referenza e la rete disegna rigorosamente lungo quella guida.

I preprocessori che funzionano davvero

  • Canny: estrae i contorni. Utile per ridipingere un oggetto in un altro stile mantenendone la forma
  • Depth: mappa di profondita. Mantiene la struttura 3D della scena al cambio di materiali
  • OpenPose: scheletro umano. Riproduce esattamente la posa del modello dalla referenza
  • Lineart: linee pulite per illustrazione e concept art
  • IP-Adapter: trasferisce lo stile di un'immagine di riferimento nel suo insieme
  • Tile: upscale con ricostruzione del dettaglio

Per still life servono soprattutto Canny e Depth. Scatti un gioiello su sfondo grigio, lo passi in Canny, generi lo stesso gioiello su marmo con petali intorno. La forma non si sposta.

Installazione di ControlNet

  1. In A1111 vai su Extensions, Install from URL
  2. Incolla https://github.com/Mikubill/sd-webui-controlnet
  3. Premi Install, riavvia A1111
  4. Scarica i modelli ControlNet da huggingface.co/lllyasviel/sd_control_collection (per SDXL) o /lllyasviel/ControlNet-v1-1 (per SD 1.5)
  5. Mettili in extensions/sd-webui-controlnet/models/

Dopo il riavvio sotto la finestra di txt2img compare un pannello ControlNet chiuso. Carichi li la referenza, scegli il tipo, generi.

Esempio di ritocco fotografico

Errori tipici al primo avvio

CUDA out of memory

L'errore piu frequente. La VRAM e finita. Soluzioni in ordine di efficacia:

  1. Abbassa la risoluzione. 1024x1024 non entra in 6 GB, metti 512x768
  2. In webui-user.bat scrivi i flag: set COMMANDLINE_ARGS=--xformers --medvram. Per schede molto piccole, --lowvram
  3. Chiudi Chrome, Photoshop, Lightroom. Mangiano VRAM in background
  4. Riduci batch size a 1
  5. Usa modelli SD 1.5 invece di SDXL se la scheda ha meno di 8 GB

Immagine nera in uscita

Di solito significa che il VAE non si e caricato o e incompatibile con il modello. Verifica di aver selezionato il VAE corretto (SD 1.5 VAE per modelli 1.5, SDXL VAE per SDXL). Se non basta, aggiungi --no-half-vae a COMMANDLINE_ARGS.

La generazione richiede un'ora per un'immagine

  • Verifica che venga usata la GPU e non la CPU. All'avvio in console deve apparire "device: cuda", non "device: cpu". Se appare cpu, reinstalla torch con supporto CUDA
  • Installa xformers: aggiungi --xformers a COMMANDLINE_ARGS
  • Rimuovi le estensioni inutili, vengono caricate a ogni avvio
  • Assicurati che il driver Nvidia sia aggiornato (via GeForce Experience)

"Torch is not able to use GPU"

Molto probabilmente la grafica integrata Intel o AMD e stata scelta come default, oppure torch e stato installato senza CUDA. In webui-user.bat scrivi:

set COMMANDLINE_ARGS=--reinstall-torch

Avvia una volta, poi togli il flag.

Le estensioni rompono l'interfaccia

Dopo aver installato una nuova estensione l'interfaccia non si apre. Si risolve eliminando la cartella dell'estensione da extensions/, oppure avviando con --disable-all-extensions.

Gratis vs Magnific, Topaz, Firefly: confronto onesto

Stable Diffusion locale non e una pallottola d'argento. Ecco dove batte davvero i servizi a pagamento e dove perde.

Dove vince Stable Diffusion locale

  • Volume. 500 varianti di sfondo in una sera, nessuno conta i token
  • Privacy. Le schede dei clienti non lasciano il tuo computer
  • Personalizzazione. LoRA addestrata sul tuo prodotto, ControlNet, inpainting al pixel
  • Costo finale. Dopo che l'hardware si e ammortizzato, zero per immagine

Dove vincono i servizi a pagamento

  • Magnific e Topaz Gigapixel 8 sull'upscale e la ricostruzione del dettaglio battono ancora gli upscaler locali (4x-UltraSharp, SUPIR locale recuperano ma non sempre)
  • Firefly e integrato in Photoshop e funziona out of the box senza installazione
  • Midjourney v7 sforna un'immagine bella da una riga di prompt, l'SD locale richiede scelta del modello e calibrazione dei parametri
  • DALL-E 3 capisce meglio i prompt complessi in italiano

Schema di lavoro per un ritoccatore commerciale nel 2026: flusso principale su Stable Diffusion locale (sfondi, inpaint, varianti), upscale finale e nitidezza in Magnific o Topaz, ritocco in Photoshop. Con questo approccio gli abbonamenti a Midjourney e Firefly non servono.

Dove andare dopo

Una volta installato A1111, scaricati tre o quattro modelli e generate le prime cento immagini, arrivano domande piu serie:

  • Come addestrare una LoRA sul tuo prodotto perche il modello conosca proprio il tuo orecchino
  • Come configurare ControlNet con piu referenze contemporaneamente
  • Come costruire una pipeline in ComfyUI per processare 200 schede in una notte
  • Come fare regional prompting (prompt diversi per zone diverse della stessa immagine)
  • Come usare SDXL Refiner e Hi-Res Fix per qualita premium
  • Quali LoRA funzionano davvero per la gioielleria e come si combinano

Questi temi sono sparsi tra Reddit, Civitai e server Discord, in italiano c'e pochissimo. Mettere insieme il sistema dai pezzi e possibile, ma porta via mesi.

Pronto a passare dall'installazione al lavoro commerciale

Allo studio gdefoto fotografiamo e ritocchiamo prodotti per marketplace da tre anni e abbiamo costruito una pratica concreta di Stable Diffusion in produzione. Il corso AI PRO copre proprio il ciclo descritto sopra: A1111 da zero, ControlNet per gioielleria, addestramento di LoRA personali sui tuoi prodotti, scenari di inpaint per marketplace, upscale e finitura. Tutte le lezioni si basano su casi concreti: anelli, orecchini, catenine, shooting reali.

Se sei arrivato fin qui e capisci che vuoi farlo non come hobby ma per guadagnare ritoccando con AI, dai un'occhiata al programma del corso su /lk/ai-pro/buy/. Trovi il piano completo, esempi di lavori dei diplomati e il formato del corso. I posti sono limitati per gruppo per poter dare feedback personale a ciascuno.