OpenAI, l’organizzazione ha realizzato ChatGPT e i modelli linguistici di grandi dimensioni (LLM) GPT-3.5 e GPT-4, ha presentato istanza di archiviazione in due cause per copyright intentate contro l’azienda per l’utilizzo di materiale protetto da copyright nei dati di addestramento dei modelli AI. I querelanti includono una coppia di autori statunitensi e un secondo gruppo che comprende l’attrice Sarah Silverman.
Nella documentazione presentata il 28 agosto 2023 alla Corte distrettuale degli Stati Uniti per il Distretto settentrionale della California, OpenAI ha chiesto l’archiviazione di cinque dei sei capi d’accusa presentati nelle cause. L’azienda ha difeso la natura trasformativa della sua tecnologia LLM, sottolineando la necessità di bilanciare la protezione del copyright e il progresso tecnologico. OpenAI ha inoltre dichiarato di voler contestare in tribunale il restante capo d’accusa di violazione diretta del copyright come questione di diritto.
OpenAI rivendica il potenziale di ChatGPT
Le mozioni riguardavano le rivendicazioni avanzate nelle cause sul copyright e miravano a chiarire i meriti del caso. OpenAI ha sottolineato il valore e il potenziale dell’AI, in particolare di ChatGPT, nel migliorare la produttività, aiutare nella codifica e semplificare le attività quotidiane. L’azienda ha paragonato l’impatto di ChatGPT a una significativa rivoluzione intellettuale, facendo un parallelo con l’invenzione della stampa.
“Si può iniziare a vedere la storia che stanno per raccontare, ovvero che il copyright ha dei limiti. Non si estende a fatti e idee”, ha dichiarato Gregory Leighton, esperto di diritto della privacy presso lo studio legale Polsinelli. “Anche se un’opera è coperta da copyright e un LLM la elabora o ne produce un riassunto o qualcosa di simile, non si tratta di un’opera derivata”.
OpenAI ha basato la sua difesa sui fatti fondamentali della tecnologia LLM: si tratta di un tipo di rete neurale addestrata su ampi dati testuali per comprendere efficacemente il linguaggio umano e consente agli utenti di inserire richieste di testo e di ricevere i contenuti generati corrispondenti. Secondo i documenti depositati, OpenAI sostiene che i suoi prodotti fondono le LLM con parametri che garantiscono l’accuratezza, la rilevanza, la sicurezza e l’utilità dei risultati prodotti.
Bilanciare la legge sul copyright e l’innovazione tecnologica
I querelanti hanno sostenuto che ChatGPT è stato formato senza autorizzazione utilizzando le loro opere protette da copyright. In risposta, OpenAI ha sostenuto che questa prospettiva trascura le implicazioni più ampie della legge sul copyright, comprese le eccezioni di fair use.
L’azienda ha affermato che il fair use può accogliere innovazioni trasformative come gli LLM ed è in linea con l’intento costituzionale della legge sul copyright di promuovere il progresso scientifico e artistico.
“Non si dovrebbe parlare di fair use in una mozione di archiviazione perché il fair use è una difesa affermativa. È qualcosa che l’imputato deve dichiarare e dimostrare”, ha affermato.
La mozione di OpenAI citava casi giudiziari in cui la dottrina del fair use proteggeva usi innovativi di materiali protetti da copyright. La mozione chiedeva il rigetto delle richieste secondarie dei querelanti, tra cui la violazione vicaria del copyright, le violazioni del Digital Millennium Copyright Act (DMCA), le violazioni della legge californiana sulla concorrenza sleale (UCL), la negligenza e l’arricchimento senza causa. OpenAI ha contestato la validità giuridica di queste richieste e ne ha chiesto la rimozione sulla base di un ragionamento giuridico errato.
“Probabilmente si trattava sempre di rivendicazioni accessorie e di accompagnamento, mentre il piatto forte è la violazione del copyright”, ha dichiarato Leighton.
La violazione vicaria del copyright si applica nei casi in cui una parte trae indirettamente vantaggio dalla violazione del copyright commessa da un’altra persona. OpenAI ha dichiarato che le accuse del querelante di violazione diretta non erano valide in termini di legge, né aveva alcun “diritto e capacità di supervisione” e non aveva alcun interesse finanziario diretto.
Gli argomenti di OpenAI
OpenAI ha offerto prove a confutazione delle varie teorie dei querelanti per cui ha violato le norme sulla violazione vicaria, il DMCA e l’UCL, tra cui affermazioni come: ogni output di ChatGPT è un’opera derivata in violazione dei loro libri protetti da copyright e la formazione LLM rimuove le “informazioni di gestione del copyright” dalle opere specificate.
OpenAI sostiene che i querelanti non hanno prove sufficienti per affermare che le LLM producono opere derivate e che, se questi standard fossero applicati su scala più ampia, i fotografi potrebbero citare in giudizio i pittori che fanno riferimento al loro materiale. Le prove offerte dai querelanti in merito alle informazioni sulla gestione del copyright sono contraddittorie e non dimostrano come siano state rimosse di proposito.
La società ha anche riscontrato carenze nelle richieste di negligenza e arricchimento senza causa, affermando che non c’erano motivi di negligenza in quanto OpenAI o i suoi utenti avrebbero compiuto atti intenzionali e OpenAI non doveva ai querelanti un dovere di cura.
Inoltre, secondo gli archivi, non c’è alcuna prova a sostegno dell’affermazione che OpenAI abbia trattenuto profitti o benefici dal materiale violato.
Infine, OpenAI ha sostenuto che sia le richieste di negligenza che quelle di arricchimento senza causa sono escluse dalla legge federale sul diritto d’autore.
“Potrebbe volerci un mese o sei settimane, ma i querelanti presenteranno una risposta in cui dovranno dire perché pensano che queste richieste debbano rimanere in vigore”, ha detto Leighton. “Potrebbe essere molto interessante per capire dove vogliono andare a parare”.
La richiesta di archiviazione di OpenAI e il percorso da seguire
La mozione di rigetto di OpenAI si basa sulla natura trasformativa di ChatGPT, sui principi del fair use e sulle carenze legali percepite nelle richieste accessorie dei querelanti.
Le mozioni hanno fornito una visione d’insieme della difesa di OpenAI sulle sue operazioni in corso, mentre naviga nella complessa intersezione tra la legge sul copyright e l’avanzamento della tecnologia AI.
Sebbene Leighton ritenga che questa particolare mozione di archiviazione possa non avere enormi effetti immediati, la posta in gioco nel caso generale rimane alta. Determinando la misura in cui i modelli linguistici di grandi dimensioni possono essere addestrati su opere protette da copyright senza violare il diritto d’autore, l’esito della causa potrebbe avere importanti implicazioni per i casi di utilizzo dell’AI, se venisse stabilito che l’ingestione di opere protette da copyright viola sempre il diritto d’autore.
“Stiamo avendo la prima vera visione di dove si andrà a parare”, ha detto Leighton. “Stanno presentando queste cose al giudice, non perché abbiano davvero a che fare con la mozione di archiviazione in sé e con ciò che stanno cercando di ottenere dal punto di vista procedurale, ma è l’introduzione tematica alla parte del caso [di OpenAI]”.
Con l’evolversi delle cause, questo conflitto legale definirà probabilmente il futuro della legge sul copyright e del progresso tecnologico.