L’utilizzo di contenuti protetti da copyright nei dati di addestramento dei grandi modelli linguistici (LLM) rientra nel “fair use”. Lo ha sostenuto la società di intelligenza artificiale generativa (GenAI) Anthropic davanti a un tribunale statunitense. “Gli strumenti AI di uso generale oggi semplicemente non potrebbero esistere” – sostiene Anthtopic – se le aziende dovessero pagare licenze per il materiale utilizzato.

Secondo la legge statunitense, il “fair use” consente l’uso limitato di materiale protetto da copyright senza permesso, per scopi come critica, reportage giornalistico, insegnamento e ricerca.

La causa degli editori musicali contro Anthropic

Nell’ottobre 2023, diversi editori musicali tra cui Concord, Universal Music Group e ABKCO hanno avviato un’azione legale contro Anthropic – sostenuta da Amazon e Google – richiedendo potenzialmente milioni in danni per la presunta “violazione sistematica e diffusa dei loro testi musicali protetti da copyright”. Nel documento presentato alla Corte Distrettuale del Tennessee, si sostiene che Anthropic, nella costruzione e gestione dei suoi modelli AI, “copia illegalmente e diffonde enormi quantità di opere protette da copyright – incluse le parole di innumerevoli composizioni musicali possedute o controllate dagli editori”.

Tuttavia, Anthropic ha ribattuto affermando che l’addestramento del suo modello AI Claude “rappresenta un uso legittimo dei materiali”, argomentando che “laddove le opere protette da copyright sono utilizzate nei dati di addestramento, è per un’analisi (di relazioni statistiche tra parole e concetti) che non ha nulla a che fare con qualsiasi scopo espressivo dell’opera”.

Sul potenziale di un regime di licenze per l’assimilazione dei contenuti protetti da copyright da parte degli LLM, Anthropic ha sostenuto che richiedere sempre licenze sarebbe inappropriato, poiché limiterebbe l’accesso alla maggior parte delle opere e avvantaggerebbe “solo le entità più ricche” in grado di pagare per la conformità.

Nel gennaio 2024, Anthropic ha presentato un documento di 40 pagine al tribunale, rispondendo specificamente a una “richiesta di ingiunzione preliminare” presentata dagli editori musicali nel novembre precedente. In esso sostiene che “non sarebbe possibile accumulare abbastanza contenuti per addestrare un LLM come Claude attraverso transazioni di licenza a prezzi equi”. Mentre gli editori musicali hanno sostenuto nella loro causa che Anthropic potrebbe facilmente escludere il loro materiale protetto da copyright dal suo corpus di addestramento, l’azienda ha dichiarato di aver già implementato una “vasta gamma di salvaguardie per prevenire quel tipo di riproduzione”, tra cui limiti non specificati su ciò che il modello può riprodurre e l’addestramento del modello per riconoscere il materiale protetto da copyright.

Altri casi simili

Casi simili sul diritto d’autore sono stati portati contro altre aziende per il loro uso di AI generativa, tra cui OpenAI e Stability AI, così come i giganti della tecnologia Microsoft, Google e Meta. Nessuna decisione è stata presa da alcun tribunale al momento della pubblicazione, ma gli esiti finali inizieranno a stabilire precedenti per il futuro della tecnologia.

Nel settembre 2023, appena un mese prima che gli editori musicali presentassero il loro reclamo legale, Anthropic ha annunciato che il gigante dell’eCommerce Amazon investirà fino a 4 miliardi di dollari nella società, oltre ad acquisire una partecipazione minoritaria.

Nel febbraio 2023, Google ha investito circa 300 milioni di sterline nella società, acquisendo una quota del 10%. Anche Sam Bankman-Fried, fondatore dell’FTX caduto in disgrazia, ha investito 500 milioni di dollari in Anthropic nell’aprile 2022 prima di dichiarare bancarotta nel novembre dello stesso anno.