Anthropic propone un salto di scala nella regolazione dei modelli di frontiera. Nel documento “Advanced AI Framework”, diffuso a giugno 2026, l’azienda sostiene che la sola trasparenza non basta più e che i governi debbano imporre obblighi precisi ai grandi sviluppatori: test sui rischi catastrofici, verifiche esterne, pubblicazione periodica dei risultati, segnalazione rapida degli incidenti critici e, nei casi estremi, poteri pubblici per bloccare o limitare il rilascio di modelli giudicati troppo pericolosi. È un passaggio politico rilevante perché arriva da una delle società che stanno costruendo i sistemi più avanzati e perché lega la governance dell’AI non solo alla tutela dei consumatori o del copyright, ma a rischi di sicurezza nazionale, biosecurity e cyberoffense.
Il testo ha due pilastri. Il primo riguarda i doveri dei “frontier developer”, cioè le aziende che addestrano modelli abbastanza potenti da generare rischi sistemici. Il secondo riguarda la resilienza pubblica: investimenti in biosorveglianza, contromisure mediche, sicurezza del software, patching, protezione delle infrastrutture critiche e capacità di risposta statale. La tesi di fondo è: anche con regole severe sui laboratori, il rischio non scende abbastanza se Stati, sanità e reti digitali restano vulnerabili.
Indice degli argomenti:
Che cosa c’è nel documento
Il framework fissa una soglia quantitativa per individuare i soggetti coperti: modelli addestrati con oltre 10^25 FLOP, sviluppati da aziende con oltre 500 milioni di dollari di ricavi annui legati all’AI oppure più di 1 miliardo di dollari l’anno di spesa in ricerca e sviluppo sull’AI.
È una scelta che punta a colpire un gruppo ristretto di operatori molto grandi, lasciando fuori gran parte del mercato applicativo e open source. Nel documento, Anthropic concentra l’attenzione su quattro categorie di rischio:
- armi biologiche,
- operazioni cyber offensive,
- perdita di controllo dei sistemi
- ricerca e sviluppo automatizzati in domini sensibili.
Sul piano operativo, la società chiede che ogni sviluppatore coperto pubblichi un safety framework, cioè un quadro di sicurezza che spieghi come valuta i rischi, quali standard usa, quali mitigazioni applica e quale dirigente ne risponde formalmente. Chiede poi risk report almeno semestrali, system card quando un nuovo modello alza in modo sostanziale le capacità o viene distribuito con salvaguardie più deboli, e notifica degli incidenti critici entro 15 giorni dalla scoperta. La logica è costruire un flusso continuo di informazioni verso governi, valutatori e pubblico, senza affidare tutto a dichiarazioni occasionali.
C’è un punto che merita attenzione. Anthropic scrive esplicitamente che la trasparenza, da sola, non è sufficiente. Per questo propone valutazioni indipendenti obbligatorie entro sei mesi dall’entrata in vigore delle regole, con accesso per gli evaluator a versioni non redatte dei report, ai modelli più capaci e alle informazioni sulle salvaguardie adottate. Il valutatore dovrebbe poi pubblicare una revisione autonoma del giudizio di rischio dell’azienda, compresa l’eventuale contestazione di conclusioni troppo ottimistiche.
La richiesta più politica: il potere di fermare i modelli
Il passaggio più netto è quello sui poteri dell’autorità pubblica. Il documento non si limita a chiedere reporting e audit. Propone che un’agenzia possa intervenire quando mancano valutazioni credibili, quando l’esaminatore indipendente non è davvero terzo, quando l’accesso ai dati è stato insufficiente o quando il modello, anche tenendo conto delle salvaguardie, continua a presentare un rischio significativo di danno catastrofico. In questi casi, secondo Anthropic, dovrebbero essere possibili multe, stop al dispiegamento di ulteriori modelli e, nelle situazioni estreme, restrizioni anche su sistemi già distribuiti.
È il punto che segna la distanza rispetto all’approccio volontario degli ultimi due anni. Anthropic stessa, nel febbraio 2026, ha aggiornato la propria Responsible Scaling Policy alla versione 3.0, cioè il quadro interno con cui dichiara di gestire i rischi catastrofici dei modelli. Ma con il nuovo documento l’azienda dice in sostanza che l’autoregolazione non basta più, e che servono strumenti legali capaci di produrre conseguenze reali.
Questo orientamento è stato ribadito anche nella presa di posizione pubblicata da Anthropic il 10 giugno 2026, “Policy on the AI Exponential”, dove l’azienda sostiene che i policymaker si muovono con tempi troppo lenti rispetto al progresso dei modelli e che le istituzioni devono prepararsi a poteri di interdizione verso i dispiegamenti più pericolosi. Nello stesso giorno, Axios ha sintetizzato la posizione di Dario Amodei in modo esplicito: il governo, secondo il ceo di Anthropic, dovrebbe poter bloccare l’AI pericolosa.
Perché Anthropic punta su bio e cyber
Nel documento, i due capitoli più sviluppati sul versante della resilienza pubblica riguardano minacce biologiche e informatiche. Non è una scelta casuale. Anthropic sostiene che qui i canali di danno sono più concreti e che esistono già politiche pubbliche su cui innestare investimenti aggiuntivi. Sul fronte bio, il framework propone standard aggiornati di biosicurezza e biosecurity, screening obbligatorio per la sintesi genica, sorveglianza “pathogen-agnostic”, stock strategici di dispositivi protettivi, sviluppo accelerato di antivirali e piattaforme produttive adattabili per vaccini e terapie.
Sul fronte cyber, chiede manutenzione e auditing del software open source e legacy, autenticazione resistente al phishing, supporto operativo agli enti più deboli, mappatura delle supply chain software, remediation rapida delle vulnerabilità e capacità di patching molto più veloce nelle infrastrutture critiche.
Questa parte dialoga con iniziative già in corso negli Stati Uniti. Il Center for AI Standards and Innovation, il centro NIST che ha raccolto l’eredità dell’U.S. AI Safety Institute, indica tra i rischi prioritari proprio cybersecurity, biosecurity e armi chimiche, e si propone come punto di contatto tra governo e industria per test e ricerca collaborativa sui sistemi commerciali più avanzati.
Il NIST, inoltre, il 7 aprile 2026 ha pubblicato una concept note per un profilo del proprio AI Risk Management Framework dedicato all’uso affidabile dell’AI nelle infrastrutture critiche.
Un pezzo del dibattito americano
Il testo di Anthropic è scritto pensando prima di tutto al governo federale degli Stati Uniti. Nel documento si legge anche un riferimento preciso al rapporto tra diritto federale e diritto statale: il Congresso, secondo la società, non dovrebbe neutralizzare le norme degli Stati finché non esista un regime federale robusto almeno quanto le misure più severe oggi sul tavolo. È un passaggio non secondario, perché negli Usa il confronto sulla regolazione dell’AI si è spesso incagliato proprio sul conflitto tra regole federali leggere e iniziative statali più stringenti.
Anthropic richiama, come riferimento definitorio per il “catastrophic risk”, la legge californiana SB 53. Il punto non è solo tecnico. Significa che l’azienda guarda a una regolazione mirata sui modelli più potenti, con obblighi proporzionati e focalizzati su rischi ad alto impatto, non a una disciplina generalista per ogni software che incorpori AI. La scelta è coerente con l’impostazione che molte grandi società del settore hanno preferito negli ultimi mesi: regole più dure sui frontier model, meno oneri sugli usi ordinari e sulle imprese che integrano modelli di terzi.
Il confronto con l’Europa
La proposta di Anthropic arriva mentre in Europa è già in vigore il segmento dell’AI Act dedicato ai modelli general purpose. La Commissione europea ricorda che gli obblighi per i provider di GPAI sono entrati in applicazione il 2 agosto 2025. Per i modelli a rischio sistemico, il quadro europeo prevede valutazione del modello, mitigazione del rischio, incident reporting e protezioni di cybersecurity, oltre a documentazione tecnica e sintesi pubblica dei contenuti di training. Bruxelles considera inoltre il GPAI Code of Practice come strumento volontario adeguato per dimostrare conformità.
Qui emerge la parte più interessante del confronto transatlantico. L’Europa si è già data una base giuridica vincolante, mentre Anthropic chiede agli Stati Uniti di costruirne una. Ma il documento americano spinge più a fondo sul punto dell’enforcement ex ante: non soltanto obblighi documentali e di reporting, bensì un potere esplicito di deterrenza o blocco sui modelli ritenuti insicuri. In altre parole, il framework prova a spostare la discussione da “quali informazioni devono pubblicare i laboratori” a “chi decide, e con quali poteri, quando un modello non deve uscire”.
È il nodo che probabilmente dominerà il confronto del prossimo anno anche in Europa, dove il tema dei modelli di frontiera continua a correre più veloce delle procedure regolatorie.
Le altre notizie che aiutano a leggere la mossa
La pubblicazione del framework non è un episodio isolato. Arriva in una settimana in cui Anthropic ha presentato anche una più ampia agenda di politica economica sull’AI. Associated Press ha riferito il 10 giugno 2026 che la società intende investire 200 milioni di dollari nella ricerca sull’impatto economico dell’intelligenza artificiale, con un focus particolare sul lavoro, mentre Amodei ha evocato misure come monitoraggio più preciso del mercato occupazionale, incentivi pro-occupazione e strumenti redistributivi nei casi di forte dislocazione.
Sul piano industriale, la scelta di premere per regole più severe convive con la corsa commerciale. Il 9 giugno 2026 Anthropic ha annunciato la nuova generazione dei suoi modelli, presentandoli come strumenti per i compiti di conoscenza e coding più difficili. Pochi giorni prima, la società aveva anche diffuso una ricerca sulla crescita delle capacità di Claude in attività aperte e investigative, con un tasso di successo che, secondo l’azienda, è salito in modo marcato nei primi mesi del 2026. È proprio questa accelerazione delle capacità che Anthropic usa come argomento per sostenere che l’architettura delle regole deve cambiare prima che i rischi diventino ingestibili.
C’è poi un altro elemento di contesto. Stanford HAI, nel 2026 AI Index Report, osserva che la “responsible AI” non sta tenendo il passo con il miglioramento delle capacità: quasi tutti i principali sviluppatori di frontiera pubblicano risultati sui benchmark di performance, mentre il reporting sui benchmark di sicurezza e responsabilità resta disomogeneo.
Il documento di Anthropic si inserisce esattamente qui: prova a trasformare un mosaico di promesse volontarie in un sistema di obblighi verificabili.
Un interesse pubblico, ma anche un interesse aziendale
La domanda inevitabile è se questa offensiva regolatoria serva solo all’interesse generale o anche alla strategia competitiva di Anthropic. Le due cose possono coesistere. Regole che richiedono audit, sicurezza avanzata, incident reporting, capacità di red teaming, relazioni con agenzie federali e valutatori indipendenti sono più facili da sostenere per gruppi con grandi risorse, grandi team legali e grandi budget di compliance. Una normativa molto impegnativa tende quindi a consolidare il vantaggio degli incumbent rispetto ai concorrenti più piccoli.
Anthropic cerca di anticipare questa obiezione in due modi. Primo: restringe il perimetro ai player che superano soglie alte di calcolo e spesa. Secondo: accompagna le regole sui laboratori con investimenti di resilienza pubblica che, almeno in teoria, producono benefici collettivi anche se il rischio non nasce da Anthropic, OpenAI o Google, ma da attori statali, criminali o modelli aperti. Resta però il fatto che l’idea di “governare i frontier model” è anche un modo per definire chi appartiene davvero al club dei soggetti rilevanti e chi no.
Il problema degli evaluator indipendenti
Uno dei punti più concreti del documento riguarda il mercato, ancora acerbo, dei valutatori indipendenti. Anthropic riconosce che oggi un ecosistema maturo non esiste. Per questo chiede standard pubblici, possibili licenze, fondi che garantiscano indipendenza economica dagli sviluppatori e perfino sistemi di rating o assegnazione casuale degli evaluator nei casi più delicati, per evitare che le aziende scelgano l’esaminatore più accomodante. È un passaggio poco spettacolare ma decisivo: senza soggetti terzi credibili, ogni impianto di audit rischia di ridursi a un bollino formale.
Anche qui il confronto con l’Europa è utile. Le linee guida della Commissione sui provider di GPAI e il Code of Practice provano a standardizzare documentazione, incident reporting e safety framework. Il problema, però, resta identico da entrambe le parti dell’Atlantico: chi misura davvero le capacità più pericolose dei modelli e con quali strumenti condivisi. Il ruolo crescente del NIST-CAISI nasce proprio da questa lacuna istituzionale.
Trasparenza, sicurezza e contraddizioni
La credibilità di questo tipo di proposta dipenderà anche dalla condotta concreta delle aziende che la sostengono. Nelle stesse ore in cui Anthropic chiedeva più regole pubbliche, Wired raccontava il dietrofront della società su una policy contestata dalla comunità di ricerca: una misura che avrebbe degradato in modo non trasparente le prestazioni di Claude per utenti sospettati di usarlo nello sviluppo di AI concorrenti. Dopo le critiche, l’azienda ha corretto l’approccio promettendo maggiore visibilità per gli utenti coinvolti. L’episodio non invalida il framework, ma ricorda che la parola “sicurezza” può coprire anche scelte aziendali opache, e che quindi la richiesta di accountability vale prima di tutto per chi la formula.
Che cosa cambia per governi e imprese
Per i governi, il documento offre un menu normativo già pronto: soglie dimensionali, tassonomia dei rischi, schema dei report, tempi di notifica, poteri dell’autorità e possibili salvaguardie contro l’eccesso di discrezionalità. Per le imprese che usano modelli di terzi, il messaggio è diverso: la compliance sull’AI di base si sposterà sempre più a monte, verso chi addestra i modelli, ma gli effetti a valle arriveranno comunque sotto forma di documentazione, controlli sugli incidenti, cybersecurity e limiti d’uso. Per investitori e mercati, infine, il framework dice che la governance dell’AI non è più un capitolo accessorio di relazioni istituzionali. Sta diventando parte del prodotto, del vantaggio competitivo e del rischio regolatorio.
La questione aperta non è se arriveranno più regole sui modelli di frontiera. Quelle regole stanno già prendendo forma, in modi diversi, tra Bruxelles e Washington. La questione è chi avrà il potere di dire no quando un sistema promette molto sul piano industriale ma presenta rischi che il suo sviluppatore non riesce a gestire in modo convincente. Anthropic ha scelto di mettere quella domanda al centro del dibattito, mentre continua a correre nella stessa gara tecnologica che chiede di sorvegliare più da vicino.



