scenari

CrowdStrike e Meta fissano nuovi standard per l’AI in cybersecurity

CyberSOCEval è una suite di benchmark open source che ridefinisce il modo in cui i modelli di intelligenza artificiale vengono valutati nel Security Operation Center (SOC). L’iniziativa misura l’efficacia degli LLM in scenari di minaccia reali, dall’analisi malware alla risposta agli incidenti, offrendo un nuovo standard di riferimento per l’AI nella difesa informatica

Pubblicato il 22 set 2025

Aggiungi tra i preferiti su Google

Pierluigi Sandonnini

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

CrowdStrike, in partnership con Meta, ha presentato CyberSOCEval, una suite di benchmark per testare le performance dei sistemi di intelligenza artificiale nelle operazioni di sicurezza. La piattaforma nasce dal framework CyberSecEval di Meta e dalla threat intelligence di CrowdStrike, con l’obiettivo di fornire un riferimento solido e open source per selezionare e implementare LLM nel SOC.

Indice degli argomenti:

La sfida dei team di sicurezza

Gli esperti di cybersecurity devono affrontare un flusso costante di allarmi e minacce in continua evoluzione. Molte organizzazioni sono ancora nelle fasi iniziali di adozione dell’AI e, senza criteri di valutazione chiari, diventa difficile capire quali sistemi offrano un reale vantaggio competitivo. I nuovi benchmark mirano a colmare questo vuoto, indicando come testare l’AI “sotto sforzo” e in scenari di attacco realistici.

CyberSOCEval: test su scenari reali

La suite valuta i modelli LLM in attività critiche come risposta agli incidenti, analisi del malware e threat intelligence. Attraverso simulazioni basate su tecniche avversarie realmente osservate, CyberSOCEval consente ai team di misurare l’efficacia dell’AI in situazioni operative concrete, aiutando a identificare i casi in cui l’automazione genera il massimo valore.

Accuratezza (% di risposte corrette) e punteggio Jaccard medio (sovrapposizione tra le risposte del modello e l’insieme delle risposte corrette) sul Threat Intelligence Reasoning Benchmark per i modelli quando viene fornito il contenuto del rapporto sotto forma di testo o immagini

Le dichiarazioni di Meta e CrowdStrike

“In Meta, siamo impegnati a far progredire e massimizzare i benefici dell’AI open source – specialmente ora che i LLM diventano strumenti potenti per organizzazioni di ogni dimensione”, ha detto Vincent Gonguet, director of product, GenAI at Superintelligence Labs di Meta.
“La nostra collaborazione con CrowdStrike introduce una nuova suite di benchmark open source per valutare le capacità dei modelli LLM in scenari di sicurezza del mondo reale… possiamo lavorare più rapidamente come industria, per sbloccare il potenziale dell’AI nel proteggere contro gli attacchi avanzati, incluse le minacce basate sull’AI”.

“Quando due leader come CrowdStrike e Meta si uniscono, il risultato è molto più che una collaborazione: si tratta di definire la direzione della cybersecurity per l’era dell’AI”, ha dichiarato Daniel Bernard, Chief Business Officer di CrowdStrike.
“Combinando l’adversary intelligence di CrowdStrike e la leadership nella cybersecurity AI-native, con l’esperienza nella ricerca AI di Meta e il vasto dataset, stiamo aiutando i clienti – e la cybersecurity come settore – ad adottare i sistemi di AI con fiducia”.

Disponibilità open source

La suite CyberSOCEval è disponibile alla community della sicurezza e dell’AI. I benchmark possono essere scaricati attraverso il framework CyberSecEval di Meta, con l’obiettivo di essere ulteriormente sviluppati dalla community e diventare un punto di riferimento per l’adozione dell’AI nella cybersecurity.

Per saperne di più, scarica il paper

@RIPRODUZIONE RISERVATA

Pierluigi Sandonnini

Senior web editor di Nextwork360. Oltre trent’anni di esperienza giornalistica, maturata in diversi settori della tecnologia: audio video, tv digitale, telecomunicazioni, internet, intelligenza artificiale.

Dal 2020 gestisce il sito Ai4business.it, coordinando la redazione, curandone i contenuti e scrivendo articoli.

Seguimi su