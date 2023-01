Le creazioni di DALL-E, Midjourney e Stable Diffusion testate da una fotografa professionista. Nonostante si utilizzi un prompt chiaro e preciso, i risultati possono non rispecchiare le intenzioni di chi lo formula. E a prompt leggermente diversi possono corrispondere immagini molto differenti. Ecco come è andata [...]

Patrizia Savarese Fotografa professionista

Preoccupazione, se non panico, nel mondo della fotografia professionale, per l’esplosione quasi improvvisa di una nuova intelligenza artificiale (cosiddetta “Generativa) che, con algoritmi sofisticati e calcoli iper veloci, entra a gamba tesa nel mondo dell’immagine. Sul sito di una delle tre principali applicazioni – Dall-E, Midjourney e Stable Diffusion – si legge questa descrizione di AI: “Un laboratorio di ricerca indipendente. Esplorare nuovi mezzi di pensiero. Espandere i poteri immaginativi della specie umana”.

Eppure, tra i fotografi professionisti, al momento, questa tecnologia viene accolta con sospetto, come un concorrente che può rubarti il lavoro.

AI generativa: l’importanza di formulare un prompt chiaro

Sono una fotografa professionista da più di quarant’anni, e ho vissuto i tempi d’oro di questa professione come anche il successivo declino all’arrivo del digitale, con l’inflazione di centinaia di improvvisati fotografi e infine con i cellulari sempre più performanti in mano a giovanissimi e adulti che registrano la realtà al ritmo di miliardi di scatti al giorno… Perciò l’AI non mi ha colto impreparata dal punto di vista di “eventuale crisi di settore” o concorrenza con i professionisti, ma anzi, mi ha sbalordita per le immense potenzialità che offre e che in maniera inimmaginabile ci offrirà in futuro.

Potrebbe essere anche una via di uscita dalla crisi, una nuova strada, stiamo cercando di capire, di imparare a usarla. Credo che siamo all’inizio di una rivoluzione, e trovo la situazione piena di spunti e di sfide alla nostra sfera creativa. C’è chi dice il contrario, supponendo che l’AI si sostituisca alla nostra creatività, ma io non la penso così, perché dietro a ogni nuova tecnologia c’è comunque una mente umana che l’ha progettata, e qualcuno che poi riesce a utilizzarla al meglio dopo studi e ragionamenti.

Dobbiamo resettare una parte della nostra professionalità, lasciar perdere le definizioni classiche sulla fotografia, e cambiare punto di vista, una cosa che dovrebbe venire spontanea a un fotografo curioso. Non si tratta di dimenticarsi dello scatto fotografico, che sia da reflex o da cellulare, ma di integrarlo virtualmente e materialmente con l’AI. Possiamo anche chiedere a queste applicazioni di modificare o rimontare le nostre foto, cosa che già facciamo con un programma di fotoritocco… solo che questa novità va velocissima ed è spesso non facilmente controllabile come può sembrare. Metti una frase, un input, un “prompt” e l’AI crea l’immagine richiesta in meno di un minuto. Sì, vero, la velocità è straordinariamente quella, ma si deve formulare un prompt efficiente e chiaro (stiamo comunque parlando a una macchina), si devono poi studiare tutte le varianti e i settaggi del sistema, non è quindi facilissimo ottenere al 100% ciò che si vuole.

Ecco degli esempi delle mie prime prove.

DALL-E, cambia il prompt, cambia l’immagine

Ho chiesto all’applicazione DALL-E di produrre un’immagine con una ragazza con lunghi capelli seduta su una vecchia sedia in mezzo al vento, fotografata di spalle e da lontano.

Il risultato non è stato pessimo, anzi: ma la ragazza però era in primo piano…

È intervenuto un amico visual artist, che dopo diversi tentativi è riuscito a far produrre alla testarda AI un’immagine con la ragazza “fotografata” più da lontano, cambiando poche parole nel prompt. Guardate che differenza di qualità nella figura e nei capelli… perché? Non lo sappiamo con precisione.

Foto della sedia e ragazza con capelli al vento (due variazioni). Esperimento senza varianti né post-produzioni

A sinistra, il mio prompt: “long-haired girl sitting on an old chair, photographed from behind and from a distance, in the middle of a windstorm”

A destra, il prompt del visual artist: “extreme long shot photograph of windy desert. Far away in the distance a realistic long-haired girl sitting on an old chair photographed from behind, small in the frame”

AI: si tratta di fotografia o di grafica?

Io penso che le “definizioni” stiano strette oggi persino alla scienza… figuriamoci nel campo dell’arte. Cerco di rispondere in maniera sintetica: a distanza di circa un secolo, c’è ancora chi dice che la pittura astratta non sia pittura perché non rappresenta nulla… oppure chi dice che un pittore sia necessariamente solo chi usa il pennello e non chi “schizza” la tela alla maniera di Pollock, per esempio. La nascita della fotografia, inoltre, è stata vista malissimo ai suoi esordi perché con un semplice click di una scatola di ferro si poteva raffigurare il paesaggio che un pittore dipingeva con mano e pennello in ore di lavoro. Ma addirittura nel Rinascimento i pittori si dovevano preparare i colori da soli, altro che tubetti già pronti! Quindi, pensiamo a come si evolve la storia dell’arte e non alle definizioni.

La nostra memoria archivia tanti pezzi e poi li ricompone in un qualsiasi processo artistico, con intuito, sensibilità, creatività… con quello che volete, e l’intelligenza artificiale sta facendo lo stesso ma con velocità incredibile di super potenti algoritmi numerici. Più studiamo il cervello umano e il funzionamento del nostro corpo e più scopriamo in essi meccanismi matematici, e qui mi fermo… il passo verso la fantascienza è breve.

Ma tornando alla fotografia, oggi è considerato normale inserire, tramite Photoshop, elementi, persone, in una nostra foto, cosa che, tra l’altro, i più bravi facevano anche in camera oscura.

Quindi assembliamo pezzi di foto, modifichiamo un’immagine, né più né meno di come fa un’AI. Un altro dato: possiamo anche “comandare” a DALL-E o a Midjourney, di prendere un paio di nostre foto e unirle secondo le nostre istruzioni, cioè facciamo fare in pochi secondi ciò che noi faremmo in ore di lavoro.

Detto ciò, eventuali errori e distorsioni fanno parte di un processo che è davvero all’inizio e nessuno qui riesce nemmeno a immaginare dove potrà arrivare.

Perciò, attenzione, curiosità e sguardo verso il futuro servono sia per capire, sia per non essere travolti passivamente dalle nuove tecnologie. E se i fotografi sono in crisi, ragione di più per cercare nuove strade.

Midjourney e Stable Diffusion

Ecco altri tentativi, cercando di utilizzare elementi di un mio lavoro di ricerca di alcuni anni fa, con le foto acquatiche.

Prima prova con una nuotatrice tra veli colorati, ma Midjourney ha deciso che dovevano essere solo rossi… ok!

Foto con veli rossi

Poi il mio intento è stato quello di ottenere una ragazza che nuotava vestita con un costume a righe bianche e nere in mezzo a un branco di pesci rossi. Midjourney ha deciso che dovevano essere pesci a righe…!

Non è quindi semplicissimo ottenere ciò che si vuole.

Foto della ragazza con i pesci rossi

Terzo tentativo: faccio riferimento a una mia serie di foto del 2003, con sincronettes che nuotano in un surreale parco marino sott’acqua, tra le piante.

Abbiamo due immagini, una prodotta da Midjourney e una da Stable Diffusion.

Il prompt è: “sto sognano di camminare in un bosco di aceri sommersi…”

Foto: “ragazza tra gli aceri rossi” e “bosco di aceri sott’acqua”

Un’altra immagine con un viso tra le piante (Midjourney)

Conclusioni

Ecco, possiamo semplicemente dire “non m’interessa” il mondo dell’intelligenza artificiale, senza però addossarle colpe e lanciare anatemi sulla modernità che avanza. Viviamo un’epoca di profonde e velocissime trasformazioni, che ci piaccia o no, ed è essenziale essere ben informati prima di puntare i piedi contro i cambiamenti, proprio per non esserne sopraffatti.

Inoltre, la “registrazione del visibile” così importante nel ‘900, vessillo di chi si schiera contro l’AI nella fotografia, passa anche per i video e se per tutto il secolo scorso la fotografia è stata strumento indispensabile nelle mani dei fotografi per il racconto della Storia, oggi chiunque può descrivere, memorizzare, condividere ciò che accade a sé stesso e attorno a lui in ogni momento e con più mezzi. Se pensiamo che ogni minuto nel mondo si scattano milioni di immagini e si fanno milioni di video con i cellulari… possiamo fare un confronto con il passato, un passato nemmeno troppo lontano. D’altronde, un tempo c’erano gli scrivani a scrivere le lettere perché la gente non sapeva né scriverle né leggerle e oggi, almeno nei Paesi sviluppati, lo scrivano non esiste più. Ma resteranno sempre e comunque gli scrittori e i poeti. Stessa cosa sta accadendo nel mondo della fotografia, certi settori vengono spazzati via ma restano i più specializzati o i più creativi.

Infine, credo che prima di ogni critica bisognerebbe essere ben informati sull’argomento.

Personalmente sto cercando di capire e sono convinta che il metodo sia di lasciarsi ispirare dalle novità. Chissà che AI non ci faccia diventare più intelligenti. Ci sentiamo superiori, sì, ma la velocità di un complesso sistema digitale noi ce la sogniamo. Le percezioni umane cambiano nel corso dei secoli? Nella preistoria per avere una visione dall’alto gli uomini potevano solo salire su un albero o su una montagna… ora vediamo la Terra dallo spazio e il microscopio permette visioni inimmaginabili ai nostri occhi, credo che la nostra percezione dello spazio sia cambiata e possa cambiare ancora per merito delle tecnologie. Lo stesso cervello umano è territorio ancora non del tutto esplorato, perché soffermarsi sulle definizioni? È un ragionare forse poco utile, come un grosso sasso sulla strada che impedisce di andare avanti. La realtà è molto molto più “fluida”, credo.

Foto: persone che si tengono per mano e guardano il cielo – create con Dall-E e Midjourney