Miglior scheda video per Stable Diffusion nel 2026: classifica e confronto per ritocco e generazione con IA


gdefoto article

Miglior scheda video per Stable Diffusion nel 2026: classifica e confronto per ritocco e generazione con IA

Se ti occupi di ritocco di prodotto e hai gia iniziato a provare Stable Diffusion, ComfyUI o Forge, ti sarai scontrato subito con la domanda principale: quale scheda grafica regge davvero il lavoro e

Intro

Se ti occupi di ritocco di prodotto e hai gia iniziato a provare Stable Diffusion, ComfyUI o Forge, ti sarai scontrato subito con la domanda principale: quale scheda grafica regge davvero il lavoro e quale genera una sola immagine in tre minuti e si blocca a meta. La risposta breve e questa: per l'IA non conta la potenza gaming, conta la memoria video. Ed e proprio quel parametro che i produttori riducono ad ogni rilascio per venderti il modello di punta.

In questo articolo analizziamo il mercato del 2026 dal punto di vista del ritoccatore, non del gamer. Cosa comprare in base al budget, quanta VRAM serve davvero per SDXL, Flux e upscaler, perche NVIDIA resta inarrivabile per AMD, e dove conviene risparmiare contro dove risparmiare costera caro.

Se ti serve la risposta rapida: nel 2026 il miglior equilibrio prezzo capacita lo offrono la RTX 4070 Ti Super 16GB (nuova) e la RTX 3090 24GB (usata). Se il budget e davvero stretto, sul mercato dell'usato la RTX 3060 12GB si trova a cifre ridicole. Tutti i dettagli sotto.

Cosa conta in una GPU per Stable Diffusion: la VRAM decide tutto

La regola principale della generazione con IA e semplice: la VRAM e piu importante di tutte le altre caratteristiche messe insieme. La velocita di generazione dipende dai core tensor, dalle frequenze e dall'architettura, ma se la memoria non basta la generazione non parte nemmeno.

Quando apri Stable Diffusion XL a 1024 per 1024 con un paio di LoRA, un ControlNet e un upscaler, il modello carica in memoria i pesi del modello base (circa 7 GB per SDXL in FP16), VAE ed encoder testuali (2 o 3 GB), gli adattatori LoRA (da 100 MB a 1 GB ciascuno), ControlNet (1 o 2 GB ciascuno) e i latenti durante il sampling. Un flusso realistico mangia 10 o 12 GB, e Flux Dev in FP16 vola oltre i 24 GB. Una scheda con 8 GB o inizia a fare swap nella RAM di sistema (rallentando di 5 o 10 volte) o restituisce semplicemente un errore.

Il secondo parametro per importanza e la generazione dell'architettura. La RTX 30 (Ampere) calcola FP16 ma non ha supporto nativo per FP8. La RTX 40 (Ada Lovelace) e la RTX 50 (Blackwell) con FP8 accelerano Flux e SDXL di 1,5 volte a parita di memoria.

Quanta VRAM serve per ciascun compito

La domanda piu frequente del ritoccatore che non ha ancora scelto la scheda e: quanta memoria mi bastera. Ecco la corrispondenza con i compiti reali:

| VRAM | Cosa funziona | Cosa non funziona |

|------|---------------|-------------------|

| 4 GB | SD 1.5 a 512x512 con flag lowvram, inpainting base | SDXL, Flux, qualsiasi upscaler serio, training di LoRA |

| 6 GB | SD 1.5 normale, SDXL con medvram e Tiled VAE | SDXL comodo, Flux, training di modelli |

| 8 GB | SDXL base, un ControlNet, upscale semplice fino a 2048 | Flux a piena precisione, flussi pesanti con 2 o 3 ControlNet |

| 12 GB | SDXL comodo, due ControlNet, Flux con quantizzazione Q4 o Q5, training LoRA per SD 1.5 | Flux FP16, training LoRA SDXL con batch grandi |

| 16 GB | Flux in Q8, SDXL senza limiti, training LoRA SDXL, upscale a 4K | Flux FP16 con ControlNet, modelli video |

| 24 GB+ | Flux FP16 completo, modelli video (Wan, Hunyuan), Stable Diffusion 3.5 Large, training in batch | Solo i compiti piu esotici |

Per il ritoccatore pratico che intende integrare l'IA in produzione (generazione di sfondi, estensione del frame, transfer di stile, generazione di bg plate per il prodotto), il minimo reale per il 2026 e 12 GB. Con 8 GB sbatterai costantemente contro i limiti e perderai tempo in ottimizzazione invece che in lavoro.

Perche NVIDIA: CUDA e l'ecosistema

In breve, nella generazione con IA NVIDIA non ha concorrenti. Tutti i framework principali (PyTorch, xFormers, TensorRT) sono scritti per CUDA. Tutte le ottimizzazioni che escono il primo giorno dopo il rilascio di un nuovo modello sono scritte per CUDA. Tutti i nodi di ComfyUI, tutte le estensioni di Automatic1111 e Forge si testano su NVIDIA.

CUDA non e solo un driver, e un ecosistema a strati: cuDNN, cuBLAS, TensorRT, NCCL. Quando avvii SDXL su NVIDIA, la GPU sfrutta migliaia di anni uomo di ottimizzazioni. Su AMD le stesse operazioni passano per wrapper, piu lenti e con bug.

Numeri concreti: a parita di prestazioni teoriche tra una scheda AMD (per esempio RX 7900 XTX contro RTX 4080) NVIDIA vince nella generazione SDXL di 1,8 o 2,5 volte. Su Linux con ROCm il divario scende a 1,4 volte. Inoltre, comprando NVIDIA oggi, fra un anno avvii qualsiasi nuovo modello senza salti mortali. Con AMD aspetti che qualcuno porti il supporto.

AMD su Windows e Linux: quando ha senso

Se hai gia una scheda AMD, non buttarla via di fretta. Su Windows funziona DirectML (tramite Microsoft Olive o ComfyUI con provider DirectML), su Linux funziona ROCm 6.x con supporto nativo PyTorch.

Scenari reali in cui AMD ha senso:

  • Hai gia una RX 6800, 6900 o 7900 e non ci sono soldi per cambiare
  • Workstation solo Linux dove serve la massima VRAM per euro (la RX 7900 XTX 24GB costa piu o meno come una RTX 4070 Ti Super 16GB)
  • Avversione di principio a NVIDIA e disponibilita a investire tempo nella configurazione

Se compri una GPU specificamente per IA, AMD non e un'opzione. Il tempo speso nella configurazione di ROCm e nella ricerca di fork funzionanti ripaghera la differenza di prezzo con NVIDIA nelle prime due settimane.

Apple Silicon su M1, M2, M3 e M4 funziona tramite il backend MPS di PyTorch. SD 1.5 gira comodo, SDXL e 3 o 4 volte piu lento di una RTX 4060 Ti paragonabile. Flux funziona solo su M3 Max e M4 Max con 32 GB o piu di memoria unificata. Il vantaggio principale dei Mac e il pool di memoria, ma il prezzo e brutale. Per la maggior parte dei ritoccatori il MacBook resta il cavallo da lavoro per Photoshop, e un PC separato con NVIDIA e la stazione IA.

Classifica delle schede per budget

Prezzi indicativi a meta 2026, mercato nuovo al dettaglio in area euro.

Fino a 300 EUR: ingresso a budget

| Scheda | VRAM | SDXL 1024 | Verdetto |

|--------|------|-----------|----------|

| RTX 3050 8GB | 8 GB | circa 45 sec | Minimamente accettabile, senza margine |

| RTX 4060 8GB | 8 GB | circa 30 sec | Migliore nuova di fascia bassa |

La RTX 4060 e la scheda piu economica della serie 40 e ha FP8. Lo svantaggio: solo 8 GB, che per il 2026 sono gia al limite. Da prendere solo se il budget e bloccato e sei disposto a lavorare con compromessi (medvram, tiling degli upscaler).

300 a 550 EUR: minimo ragionevole

| Scheda | VRAM | SDXL 1024 | Verdetto |

|--------|------|-----------|----------|

| RTX 3060 12GB | 12 GB | circa 38 sec | Miglior rapporto VRAM prezzo nella fascia bassa |

| RTX 4060 Ti 16GB | 16 GB | circa 28 sec | Ingresso ideale al lavoro con IA |

La RTX 4060 Ti 16GB e la nuova scheda piu sensata per l'IA nel 2026 in questa fascia. 16 GB di VRAM, FP8, Ada Lovelace, bus a 128 bit (un punto a sfavore per il gaming, ma irrilevante per l'IA). Per circa 520 EUR ottieni una scheda che regge tutto tranne Flux FP16.

La RTX 3060 12GB resta attuale, specie sull'usato a 190 o 240 EUR. Niente FP8, ma 12 GB di VRAM risolvono molto.

550 a 1000 EUR: cavallo da lavoro

| Scheda | VRAM | SDXL 1024 | Verdetto |

|--------|------|-----------|----------|

| RTX 4070 12GB | 12 GB | circa 18 sec | Veloce, ma poca memoria |

| RTX 4070 Super 12GB | 12 GB | circa 16 sec | Analogo, un filo piu veloce |

In questa fascia c'e un dilemma. La RTX 4070 e la 4070 Super sono piu veloci della 4060 Ti 16GB come chip, ma hanno solo 12 GB. Per il classico lavoro di ritocco con SDXL e un ControlNet basta. Ma se pensi di entrare in Flux o nel training, meglio aggiungere e salire al gradino successivo.

1000 a 1650 EUR: produzione seria

| Scheda | VRAM | SDXL 1024 | Verdetto |

|--------|------|-----------|----------|

| RTX 4070 Ti Super 16GB | 16 GB | circa 14 sec | Sweet spot del 2026 |

| RTX 4080 Super 16GB | 16 GB | circa 12 sec | Piu veloce, ma il prezzo morde |

La RTX 4070 Ti Super 16GB e il miglior acquisto per un ritoccatore che fa sul serio con l'IA. 16 GB di VRAM, bus a 256 bit, FP8, velocita vicina alla 4080. Regge Flux in Q8, SDXL con qualsiasi impostazione, allena LoRA. Questa scheda copre i tuoi carichi IA per i prossimi 2 o 3 anni.

2200 EUR e oltre: ammiraglie

| Scheda | VRAM | SDXL 1024 | Verdetto |

|--------|------|-----------|----------|

| RTX 4090 24GB | 24 GB | circa 12 sec | Re dell'IA fino al 2025 |

| RTX 5090 32GB | 32 GB | circa 8 sec | Nuovo re, se la trovi |

La RTX 4090 e lo standard del settore. Se il budget lo consente e vuoi una scheda che fra 3 anni sia ancora attuale, e la scelta giusta. 24 GB di VRAM reggono Flux FP16, modelli video, training SDXL.

La RTX 5090 con 32 GB e supporto FP4 per l'inferenza in Blackwell e il nuovo soffitto. Se la scheda e disponibile e c'e budget, per produzione IA seria non ha senso prendere qualcosa di piu piccolo.

Esempio di ritocco fotografico

Mercato dell'usato: 3060 12GB e 3090 24GB

Se il budget e stretto ma vuoi il massimo della memoria, l'usato salva la giornata. In area euro eBay e i mercatini locali tra privati sono i canali naturali.

La RTX 3060 12GB sull'usato costa 180 o 230 EUR. Per quei soldi prendi 12 GB di VRAM, sufficienti per il 90 per cento dei compiti IA. Piu lenta della 4060 Ti, ma se la scelta e tra una 3060 12GB usata e una 3050 8GB nuova, sempre la 3060.

La RTX 3090 24GB e il miglior acquisto usato per IA. Su eBay si trova a 650 o 870 EUR. Per memoria pareggia la 4090, in velocita SDXL e indietro del 40 per cento circa, ma a meta prezzo si accetta. 24 GB aprono Flux FP16, modelli video, training serio. Difetti: consuma 350 watt, scalda, richiede un alimentatore importante (minimo 850W) e buona ventilazione.

Cosa non comprare usato: tutto cio che ha minato. La serie RTX 30 dopo due anni di hashrate 24/7 e una lotteria. Controlla le temperature della memoria in HWInfo: se su una 3090 la memoria sale sopra i 100 gradi sotto carico, i pad termici sono andati.

Tempi reali di SDXL 1024 su schede diverse

I numeri qui sotto sono per SDXL 1024 per 1024 base, 30 passi DPM++ 2M Karras, senza upscale e senza ControlNet. Un compito reale con upscale e LoRA durera 2 o 3 volte di piu.

| Scheda | Tempo di generazione | Prezzo nuovo |

|--------|----------------------|--------------|

| RTX 3050 8GB | 45 sec | 250 EUR |

| RTX 4060 8GB | 30 sec | 305 EUR |

| RTX 3060 12GB | 38 sec | 295 EUR (o 215 usata) |

| RTX 4060 Ti 16GB | 28 sec | 520 EUR |

| RTX 4070 12GB | 18 sec | 705 EUR |

| RTX 4070 Super 12GB | 16 sec | 785 EUR |

| RTX 4070 Ti Super 16GB | 14 sec | 1035 EUR |

| RTX 4080 Super 16GB | 12 sec | 1470 EUR |

| RTX 3090 24GB | 17 sec | 760 EUR usata |

| RTX 4090 24GB | 12 sec | 2500 EUR |

| RTX 5090 32GB | 8 sec | 3480 EUR |

Nota: tra la 4060 Ti 16GB e la 4070 ci sono 1,5 volte di differenza in velocita, ma la 4060 Ti ha 16 GB contro 12 GB. Per i flussi pesanti vince la VRAM. Per la velocita pura della generazione semplice vince la 4070.

Consumi e raffreddamento

Le moderne schede per IA sono stufette. Non come i rig da mining, ma richiedono attenzione a case e alimentatore.

  • RTX 4060 e 4060 Ti: 115 a 160 W, alimentatore 550W basta
  • RTX 4070 e 4070 Super: 200 a 220 W, alimentatore 650W
  • RTX 4070 Ti Super e 4080 Super: 285 a 320 W, alimentatore 750W
  • RTX 4090: 450 W, alimentatore da 850 a 1000W
  • RTX 5090: 575 W, alimentatore da 1000W in su
  • RTX 3090 (usata): 350 W, alimentatore 850W obbligatorio

Sotto carico IA prolungato la scheda lavora alle frequenze di picco per ore. Un case gaming con una sola ventola in espulsione non basta. Minimo tre ventole: due in aspirazione, una in espulsione. Per 4090 e 5090 meglio un bench aperto o un case specializzato con flusso d'aria. Il rumore in studio stanca, quindi o liquido o PC dietro una parete sottile.

Cosa fare con budget limitato

Se non ci sono soldi per una scheda decente ma il lavoro IA va fatto, esistono tre livelli di compromesso.

Livello 1: ottimizzazione su una scheda media. Avvia Stable Diffusion con i flag --medvram (6 o 8 GB) o --lowvram (4 GB). Attiva Tiled VAE e Tiled Diffusion per gli upscale. Usa modelli quantizzati (Q4_K_S, Q5 GGUF per Flux). La velocita cala del 30 o 50 per cento, ma almeno la generazione parte.

Livello 2: servizi cloud. RunPod, Vast.ai e Massed Compute danno accesso a RTX 4090, A6000 o H100 per 0,30 o 2 EUR all'ora. Se fai 5 o 10 render a settimana, noleggiare costa meno che comprare.

Livello 3: API. Replicate, Fal.ai, Leonardo via API. Paghi a generazione e non pensi all'hardware. Bene per compiti occasionali, male per lavoro sistematico. Per un ritoccatore che integra IA nel flusso quotidiano, l'hardware proprio si ripaga in 3 o 6 mesi rispetto al cloud.

Cosa non comprare nel 2026

Per risparmiarti tempo:

  • GTX 1660, 1660 Ti, 1660 Super: solo 6 GB, niente core tensor, lente. Si puo lanciare SD 1.5, ma e una sofferenza. Per l'IA nel 2026 questa serie e morta.
  • GTX 1080 e 1080 Ti: anche con 11 GB sulla 1080 Ti, l'assenza di core tensor la rende 4 o 5 volte piu lenta di una 3060 12GB. Non vale nemmeno 80 EUR.
  • RTX 2060 6GB: poca VRAM, velocita bassa. Solo se la hai gia e non puoi sostituirla.
  • RTX 4060 Ti versione 8GB: confonderla con la versione 16GB e un errore classico. 8 GB per 430 EUR e pagare troppo.
  • AMD RX 580, 590, 5500: nessun supporto ROCm, DirectML traballa. Il tuo tempo vale piu del risparmio.
  • Intel Arc A770 16GB: sulla carta interessa, in pratica il supporto nei framework SD e acerbo. Fra un anno potrebbe diventare una buona opzione, oggi no.

CTA: corso AI PRO

Hai scelto la scheda, l'hai montata, hai avviato ComfyUI e ti sei scontrato con la domanda successiva: cosa fare con questo hardware. Quali modelli scaricare, come costruire un flusso per la fotografia di prodotto, come generare sfondi per abbigliamento da marketplace, come allenare una LoRA sui propri prodotti, come integrare l'IA in Photoshop.

Il corso AI PRO di gdefoto.com e un corso pratico per fotografi e ritoccatori che stanno portando Stable Diffusion e Flux in produzione. Non teoria sulle reti neurali, ma flussi concreti: generazione di bg plate per prodotto, estensione del frame, sostituzione dello sfondo, training di LoRA su brand identity, integrazione con Photoshop e Capture One.

Dopo il corso produci visual pubblicitari in 30 minuti invece che in due giorni e offri ai clienti servizi che i concorrenti non hanno ancora imparato.

Iscriviti ad AI PRO

In sintesi: cosa comprare nel 2026

Checklist breve per budget:

  • Fino a 300 EUR: RTX 4060 8GB nuova o RTX 3060 12GB usata.
  • 400 a 530 EUR: RTX 4060 Ti 16GB. Ingresso nell'IA seria.
  • 760 a 980 EUR: RTX 4070 Super 12GB nuova o RTX 3090 24GB usata.
  • 980 a 1650 EUR: RTX 4070 Ti Super 16GB. Scelta migliore per la maggior parte dei professionisti.
  • 2200 EUR e oltre: RTX 4090 24GB o RTX 5090 32GB. Vertice senza compromessi.

La cosa principale da ricordare: 8 GB di VRAM nel 2026 sono gia pochi. 12 GB sono il minimo per la comodita. 16 GB sono il tetto ragionevole per la maggior parte dei compiti. 24 GB e oltre sono per chi sbatte contro i 16 GB ogni giorno. Non risparmiare sulla memoria, risparmia sulla velocita. Tra due anni ti ringrazierai.