AI generativa: l’Ufficio per il copyright Usa detta regole restrittive

Lo scorso febbraio lo United States Copyright Office (USCO) ha emesso una decisione storica in materia di protezione tramite il diritto d’autore dei risultati realizzati tramite intelligenza artificiale, concludendo che questa tutela non possa essere riconosciuta a materiali realizzati dall’AI in modo non predittivo, ossia non controllabile nella sua forma espressiva da parte dell’autore

Pubblicato il 07 Mar 2023

Immagini di AI generativa

Il 25 febbraio 2023 lo United States Copyright Office (USCO) ha emesso una decisione storica in materia di protezione tramite il diritto d’autore dei risultati realizzati tramite l’AI, arrivando alla conclusione che questa tutela non possa essere riconosciuta a materiali realizzati dall’AI in modo non predittivo, ossia non controllabile nella sua forma espressiva da parte dell’utente/autore.

Nel giungere alla propria decisione, l’USCO analizza in modo molto approfondito e dettagliato i requisiti per il riconoscimento della protezione autoristica, esprimendo valutazioni di estremo interesse circa la nozione di “idea” (non proteggibile) e “forma espressiva” (al contrario tutelabile), la cui portata può ben oltrepassare i confini dell’AI, e riguardare invece l’intero sistema del diritto d’autore.

Il caso Kashtanova e Midjourney

Per comprendere al meglio la decisione dell’USCO, è importante avere ben presenti il tipo di opera dell’ingegno di cui si rivendicava la protezione (intitolata Zarya of the Dawn), nonché – soprattutto – il metodo di funzionamento dell’AI utilizzata per la sua realizzazione. Zarya of the Dawn è un fumetto, composto da diciotto pagine, di cui una di copertina. Nella copertina è riportata l’immagine di una giovane donna, nonché il titolo dell’opera e le parole ”Kashtanova” e ”Mid Mid” (rispettivamente riferite al nome della designer che intendeva registrare l’opera, Kristina Kashtanova, e alla denominazione dell’AI di cui quest’ultima si era servita, ossia Midjourney).

Le altre pagine di cui l’opera si componeva erano costituite da materiale misto, testuale e visivo (si trattava in altre parole di immagini grafiche accompagnate da didascalie: v. di seguito le immagini tratte dalla decisione dell’USCO).

Da quanto dichiarato dalla stessa richiedente, tutte le immagini utilizzate nell’opera erano state realizzate dalla Kashtanova tramite l’uso della tecnologia Midjourney, la quale consiste in un servizio in abbonamento che permette agli utenti di pagare per generare immagini, con piani di abbonamento che corrispondono al tempo di calcolo utilizzato per generare le immagini. In concreto, l’utente – una volta iscritto al servizio – genera un messaggio testuale in cui esprime i requisiti dell’immagine che l’AI deve generare. È possibile per gli utenti anche indicare una URL di una o più immagini per influenzare l’output generato dall’AI, oppure stabilire dei parametri che forniscano indicazioni funzionali. A seguito del prompt inserito dall’utente, Midjourney genera quattro immagini in risposta, che – tramite una griglia e dei pulsanti – possono essere in vario modo gestite, per esempio per ottenere una versione a più alta risoluzione di un’immagine, per crearne nuove varianti o addirittura per generare ex novo quattro nuove immagini.

Gli esempi di AI generativa forniti dall’USCO

Secondo gli esempi forniti dall’USCO, inserendo il comando ”/immagina un cucciolo di dinosauro Shakespeare che scrive una commedia viola” l’AI fornisce quattro immagini diverse, comunque riferibili a cuccioli, a dinosauri, al colore viola, a Shakespeare. Le immagini hanno tuttavia caratteristiche (espressive) diverse, in quanto il cucciolo ha forme, colori, proporzioni specifiche in ciascuna delle immagini (v. sotto l’immagine tratta dalla decisione dell’USCO).

In questo contesto l’USCO valorizza in particolare la circostanza che le istruzioni impartite dall’utente all’AI non concernono la realizzazione di un particolare risultato espressivo, ma semplicemente indicano in termini ampi l’obiettivo che si intende raggiungere. Del resto, il modo di operare di Midjourney è peculiare, dal momento che in concreto essa converte le parole e le frasi contenute nel prompt degli utenti ”in pezzi più piccoli, chiamati token, che possono essere confrontati con i dati di addestramento e quindi utilizzati per generare un’immagine”.

La generazione prevede che Midjourney parta da ”un campo di rumore visivo, come la statica televisiva, come punto di partenza per generare le griglie iniziali dell’immagine” e poi utilizzi un algoritmo per trasformarle in immagini riconoscibili dall’uomo, secondo i propri dati di training e il relativo matching con le caratteristiche indicate dall’utente. Quest’ultimo, tuttavia, non controlla il processo di creazione da parte dell’AI, perché non è possibile predire quale saranno le immagini effettivamente generate da Midjourney, dal punto di vista degli elementi espressivi. In pratica, certamente l’immagine sarà quella di un cucciolo di dinosauro che scrive una commedia, come avrebbe potuto fare Shakespeare, dove la connotazione visiva è quella del viola; ma nessuno può determinare se il cucciolo sarà alto o basso, magro o forte, sorridente o preoccupato (o inespressivo), con forme dolci o minacciose, etc.

Si tratta quindi di un modo di operare completamente diverso rispetto a quello creativo tipico dell’autore/artista, anche quando questo utilizza uno strumento, poiché in tutti questi casi è l’autore/artista a controllare lo strumento stesso, e a conoscere quali elementi utilizzare per realizzare l’opera che egli ha in mente.

Il caso Zarya of the Dawn

Nel caso specifico dell’opera Zarya of the Dawn, l’USCO conclude quindi limitando la registrazione del copyright alle parti testuali dell’opera stessa (le didascalie a commento delle immagini), e all’attività di selezione e ordinamento delle immagini utilizzate per la composizione del libro, ma nega la protezione alle singole immagini. Nel caso dei testi la decisione dell’USCO appare obbligata: la designer aveva infatti affermato (e non era stato da alcuno messo in dubbio) che i testi delle didascalie fossero stati realizzati direttamente da lei stessa. Per quanto concerne la selezione delle immagini, l’USCO accoglie le rivendicazioni della designer, secondo la quale il suo processo creativo era consistito nella generazione di una serie di immagini tramite l’AI, che poi erano state da lei stessa attentamente selezionate e organizzate in modo da creare l’insieme costituito dalla storia narrata nel fumetto. In entrambi i casi l’attività svolta dalla designer è considerata dall’USCO sufficiente per attribuire la protezione del diritto d’autore, poiché vi è creatività (ancorché minima), e l’autore è una persona fisica. La protezione viene invece negata alle singole immagini realizzate dalla designer tramite interazione con l’AI.

Secondo l’USCO, infatti, sebbene la designer sostenesse di aver ”guidato” la struttura e il contenuto di ogni immagine, il processo descritto chiariva invece che era stata l’AI – e non la designer – a dare origine agli ”elementi tradizionali di paternità” delle immagini. La circostanza che la designer avesse inserito i prompt per ottenere le immagini, e poi avesse scelto una o più di queste per ulteriori attività di sviluppo, modificando il prompt o gli altri input messi a disposizione dall’AI non costituiva per l’Ufficio elemento sufficiente a supportare la sussistenza di una sufficiente creatività dell’opera. Ciò perché il processo previsto dall’AI è dato da una serie di tentativi ed errori, fino a che, in modo casuale e randomico, l’immagine generata in modo indipendente dall’algoritmo non si avvicina alla visione originaria della designer. Secondo l’USCO, quindi, “piuttosto che uno strumento che la Kashtanova controllava e guidava per raggiungere l’immagine desiderata, Midjourney genera immagini in modo imprevedibile. Di conseguenza, gli utenti di Midjourney non sono gli ”autori”, ai fini del diritto d’autore, delle immagini generate dalla tecnologia. Come ha spiegato la Corte Suprema l’”autore” di un’opera protetta da diritto d’autore è colui ”che ha effettivamente formato l’immagine”, colui che agisce in qualità di ”mente inventiva”. La persona che fornisce suggerimenti testuali a Midjourney non ”forma effettivamente” le immagini generate e non è la ”mente”.

Le motivazioni dell’USCO

Nell’affrontare il tema specifico dei suggerimenti testuali della designer all’AI, per negarne la protezione, l’USCO affronta il tema della distinzione in concreto fra l'”idea” e l'”espressione” nell’opera dell’ingegno, giungendo a mio parere a risultati innovativi di particolare interesse che si estendono oltre l’ambito di applicazione dell’AI, per investire l’intero perimetro delle opere dell’ingegno protette dal diritto d’autore. L’Ufficio valuta infatti che i prompt impartiti dalla designer all’AI funzionino più come suggerimenti che come ordini. In questo (il paragone è dell’USCO) essi si avvicinano alla situazione in cui un cliente ingaggia un artista per creare un’immagine dando a quest’ultimo indicazioni generali sul risultato che si dovrebbe ottenere. In questi casi l’autore sarebbe l’artista visivo che ha ricevuto le istruzioni e ha autonomamente determinato il modo migliore per esprimerle. Dunque, il committente fornirebbe l’idea (non proteggibile), mentre è l’artista visivo a generare la forma espressiva dell’opera, e quindi a ricevere la protezione del diritto d’autore.

In concreto l’artista svolgerebbe l’attività che nel caso specifico considerato dall’USCO nella sua decisione del 25 febbraio 2023 è quella svolta dall’AI, la quale tuttavia – non essendo umana – non può aspirare alla qualifica di autore e quindi rimane senza protezione (quanto agli output, ben essendo proteggibile con i brevetti o con il segreto il sistema tecnologico di cui l’AI consiste).

Il caso Cattelan

È interessante notare come un tema simile sia stato recentemente affrontato anche dalla Corte di Parigi, nel caso che ha visto contrapposto il noto artista visuale Maurizio Cattelan e il suo ex-collaboratore Daniel Druet (Corte di Parigi, sentenza 8 luglio 2022). Druet è l’artigiano di cui Cattelan si è avvalso per realizzare alcune opere molto note, come la “Nona Ora” (una scultura in cera che raffigura Papa Giovanni Paolo II a terra, colpito da un meteorite). Druet ha affermato in giudizio di essere il coautore delle opere di Cattelan, perché quest’ultimo gli aveva fornito solo vaghe indicazioni, e del resto aveva pubblicamente dichiarato di non essere in grado di disegnare, dipingere o scolpire. Secondo Druet, quindi la concreta realizzazione espressiva dell’opera dell’ingegno era a lui prevalentemente attribuibile. Nel procedimento l’avvocato difensore di Cattelan aveva in particolare sostenuto la tesi secondo cui la realizzazione dell’opera dell’ingegno è secondaria rispetto al suo concepimento, in particolar modo nell’ambito dell’”arte concettuale”, nella quale accade di sovente che gli artisti immaginino le loro opere ma non le fabbrichino essi stessi.

Nel caso specifico la Corte – anche per ragioni processuali – ha negato la domanda di Druet, ritenendo che Cattelan avesse fornito indicazioni sufficientemente specifiche per la collocazione delle sue opere (in particolare, scelta dell’edificio e dimensione delle stanze che assecondano il carattere dell’opera, direzione dello sguardo, illuminazione, distruzione di un tetto in vetro o di un pavimento in parquet per rendere l’allestimento più realistico e suggestivo). Non si è tuttavia pronunciata ex professo sul tema principale, ossia quali siano le attività e le scelte che un soggetto deve compiere per potersi qualificare come autore, quando egli si avvalga di un terzo, o di uno strumento (fra cui anche l’AI), per realizzare l’opera dell’ingegno.

Conclusioni

Applicando le considerazioni svolte dall’USCO (e seguendo anche la tendenza indicata dalla decisione del Tribunale di Parigi nel caso Cattelan) la tesi sostenuta dal legale di Cattelan dovrebbe essere smentita. Non basterebbe infatti, neppure nel settore dell’arte concettuale, limitarsi a “concepire” un’opera, o – in altre parole “avere l’idea creativa”. È invece necessario intervenire nelle scelte espressive concrete, stabilendo le caratteristiche specifiche che l’opera deve avere, così che – se si tratta di un’opera visiva – si dovrà stabilire chiaramente quali devono esserne le dimensioni, le forme, le proporzioni, la collocazione, i colori, i materiali utilizzati e le varie componenti, e così via.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati