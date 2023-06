Stable Diffusion è un'AI per la generazione di immagini. Con un'installazione in locale è possibile utilizzarla gratuitamente per creare un numero illimitato di contenuti. Ecco come installarla su Windows e Mac e come usarla efficacemente [...]

Stable Diffusion è un’AI generativa creata dai laboratori di ricerca Midjourney, con sede a San Francisco. Generare immagini con l’AI richiede molte risorse di calcolo; per questa ragione, i tool di buona qualità che si trovano online sono spesso o molto costosi o molto complicati da utilizzare. Questo software si può installare gratis in locale, consentendo di creare immagini in alta risoluzione senza alcuna limitazione, a partire da messaggi di testo.

Il software si basa sul modello di diffusione, un modello generativo che crea immagini aggiungendo gradualmente dettagli a una immagine di rumore casuale. Stable Diffusion è stato addestrato su un enorme set di dati di immagini e testo, il che gli permette di generare immagini realistiche e creative.

Come funziona Stable Diffusion

Per utilizzare Stable Diffusion è necessario fornire un prompt di testo a propria scelta, come ad esempio la descrizione di una immagine, una scena o un oggetto. Stable Diffusion impiegherà il prompt fornito per creare una immagine corrispondente. La qualità dell’immagine generata dipenderà dalla qualità del prompt fornito.

L’installazione in locale di Stable Diffusion prevede dei requisiti minimi di sistema. La velocità con la quale Stable Diffusion sarà in grado di generare contenuti dipenderà dall’hardware a nostra disposizione, principalmente dalla potenza di elaborazione della CPU e della GPU.

In questa guida step-by-step, vedremo come installare gratis Stable Diffusion su Windows e su Mac, e come scrivere il primo prompt.

Come installare Stable Diffusion gratis su Windows

Solitamente, per usare le AI generative sul proprio computer è necessario installare il linguaggio di programmazione Python ed eseguire una serie di operazioni dalla riga di comando che non sono alla portata di tutti.

Easy Diffusion è una distribuzione di Stable Diffusion facile da installare e utilizzare gratis. Questo tool è open source e permette di installare gratuitamente e con pochi click tutti i componenti software necessari per eseguire Stable Diffusion dalla sua interfaccia web.

I requisiti hardware minimi per installare ed eseguire fluidamente Stable Diffusion su Windows sono:

GPU: Scheda grafica NVIDIA con 4 GB di VRAM o più

RAM: 8 GB o più

Spazio di archiviazione: 20 GB o più

Sistema Operativo: Windows 10/11

Gli step di installazione sono semplici da seguire:

Scarica l’eseguibile da qui Avvia l’installer e autorizzane l’esecuzione Premi su “Install” Scegli il percorso di installazione (se hai Windows 10, installa Easy Diffusion al livello superiore dell’unità, ad es. C:EasyDiffusion, per evitare problemi noti dovuti ai limiti di lunghezza del percorso) Accetta le condizioni del servizio dopo averle lette con attenzione Al termine dell’installazione premi su “Finish”

Dopo questa procedura, Stable Diffusion si avvierà automaticamente aprendo una finestra del tuo browser predefinito per farti accedere all’interfaccia grafica. Se il software non si avvia automaticamente, troverai anche un’icona per l’avvio rapido sul tuo desktop e all’interno del menu start.

Ora puoi passare direttamente al paragrafo "Come usare StableDiffusion".

Come installare Stable Diffusion gratis su Mac

Stable Diffusion funziona particolarmente bene sui Mac di ultima generazione. Per evitare di installare l’ambiente di sviluppo e di usare la riga di comando, è stato creato Diffusion Bee, un software open source che riduce le operazioni necessarie a un semplice click.

Prima di iniziare con l’installazione vera e propria, diamo un’occhiata ad alcuni dei requisiti minimi di sistema per eseguire Stable Diffusion senza problemi:

CHIP: Apple Silicon (tutte le versioni M1 e M2)

RAM: 8 GB o più

Spazio di archiviazione: 20 GB o più

Sistema Operativo: macOS 12.5.1 o versioni successive

Questi sono gli step per installare Stable Diffusion sul tuo Mac

Scarica DiffusionBee da qui. Apri il file scaricato Trascina il pacchetto nella tua cartella “Applicazioni” predefinita Avvia DiffusionBee e attendi il download dei modelli di default. Questa operazione richiede un tempo variabile, a seconda della velocità della tua connessione a internet.

Completati i download, puoi utilizzare l’app. Inizia dalla scheda “Text to Image”, inserisci il prompt nell’apposito campo testo e premi su “Genera”. L’app DiffusionBee genererà un’immagine in base alla tua descrizione. La generazione potrebbe richiedere diversi minuti, a seconda della configurazione hardware. Una volta generata l’immagine, puoi scegliere di salvarla, oppure di migliorarne la qualità con l’opzione di upscaling disponibile nel menù accessibile tramite le tre barre presenti alla sinistra dell’immagine.

Come usare Stable Diffusion

Se hai già provato a generare alcune immagini subito dopo l’installazione, avrai probabilmente notato che il risultato è lontano dalle fantastiche immagini che puoi trovare su lexica.art. Il motivo è semplice: dietro ogni buona immagine c’è un’analisi per scegliere il modello generativo più adatto e creare il prompt ideale.

In generale, più dettagli fornisci nel prompt, migliori saranno i risultati che il sistema genererà per te. Ma trovare il prompt giusto può rivelarsi complicato.

Un modo semplice per prendere dimestichezza con la creazione di prompt per Stable Diffusion è visitare il già citato lexica.art e copiare i prompt delle immagini che preferisci, magari mixandoli tra loro per trovare la giusta combinazione per ottenere l’immagine desiderata.

Di seguito sono riportati alcuni esempi di messaggi di testo che è possibile utilizzare con Stable Diffusion:

“An astronaut resting on mars in a beach chair, vibrant lighting, elegant, highly detailed, smooth, sharp focus, illustration, beautiful, geometric, trending on artstation, full body, cinematic”

“Motorcycle designed by teenage engineering+simon stalenhag, style of laurie greasley, studio ghibli, akira toriyama, james illeard, genshin impact, 8k resoultion, hyper realstic, dieter rams. detailed render. smooth cam de leon eric zener dramatic, mark ryden and pixar and hayao miyazaki”

“Vintage 90’s anime style. a lonely astronaut walking down the street; by Hajime Sorayama, Greg Tocchini, Virgil Finlay, sci-fi. line art. Environmental arcade art”

Se invii un prompt lungo e vuoi che l’AI si concentri su una parola specifica, puoi usare le parentesi per evidenziarle, così da modificarne il peso per l’AI. In questo modo si aumenta il controllo sul risultato finale, scegliendo direttamente quali saranno gli elementi chiave della composizione grafica.

Per automatizzare del tutto l’operazione di scrittura del prompt è possibile chiedere ad un’altra AI generativa testuale, come ChatGPT o Google Bard, di creare il prompt giusto.

Configurare i parametri della rete neurale

Dopo aver capito il meccanismo di generazione dei prompt, si può passare alla configurazione dei parametri avanzati della rete neurale. Per usare correttamente le impostazioni dell’AI è importante comprenderle a fondo. Esaminiamo quindi le principali:

Steps: pensa ai passi come a iterazioni del processo di creazione dell’immagine. Durante i primi passaggi, l’immagine sarà più simile a un rumore casuale sfocato. A ogni ciclo, l’AI modificherà l’immagine aggiungendo nuovi dettagli.

Size: per impostazione predefinita, Stable Diffusion genera immagini di 512 x 512 pixel. Puoi modificare le dimensioni per ottenere immagini più grandi, ma questo richiederà più potenza di calcolo e, quindi, più tempo.

CFG Scale: questa impostazione indica quanto Stable Diffusion si atterrà al tuo prompt. Ridurre la scala a zero significa che l’AI prenderà in considerazione solo alcune parti del prompt; sarà più creativa. Al contrario, portando la scala al valore massimo, il risultato si atterrà fedelmente alla descrizione.

MODES: oltre alla modalità Text2Image, che genera una immagine a partire da un prompt di testo, si possono usare altre funzionalità. Con img2img, per esempio, è possibile creare un’immagine a partire da un’altra immagine, magari uno schizzo approssimativo. Con la modalità inpainting si può “sovrascrivere” una parte dell’immagine, generandola nuovamente. Questa funzione è indispensabile per correggere piccoli difetti. Con outpainting, invece, l’AI completerà un’immagine parziale, generando un nuovo contenuto adiacente che sia coerente con quanto rappresentato nell’immagine fornita come input.

Conclusioni

Stable Diffusion è ancora in fase di sviluppo, ma rappresenta una classe di sistemi generativi che diventerà in futuro un potente strumento per artisti, designer e professionisti creativi. Con Stable diffusion, sarà possibile creare gratis immagini realistiche, che potranno essere utilizzate sia nell’ambito dell’intrattenimento che del marketing.

Naturalmente, non si tratta di un sistema perfetto: non sempre i risultati sono quelli desiderati, e la rifinitura di volti e mani può rappresentare ancora un problema in alcuni casi. Inoltre, a seconda dell’hardware utilizzato, la generazione di immagini può essere ancora particolarmente lenta. Ad ogni modo, rappresenta uno step fondamentale verso un futuro AI-Powered, dove sarà indispensabile comprendere e saper utilizzare gli strumenti in grado di automatizzare gran parte del nostro lavoro.

