approfondimento

Certificazione dei dati per l’AI, servono standard nazionali ed europei



Indirizzo copiato

Un consorzio di aziende, denominato Data & Trust Alliance, di cui fanno parte aziende come American Express, Humana, IBM, Pfizer, UPS e Walmart, oltre a diverse start-up, ha sviluppato un sistema di etichettatura innovativo per i dati, per chiarirne l’origine, la storia e i diritti legali

Pubblicato il 6 dic 2023

Andrea Viliotti

B2B Data-Driven Lead Generation Specialist



dati sicurezza

Per realizzare un’intelligenza artificiale efficace, è cruciale disporre di dati certificati. Di recente, è stata avviata un’iniziativa per sviluppare standard che descrivano l’origine, la storia e i diritti legali dei dati. Tuttavia, questa sfida richiede un approccio collaborativo che va oltre le singole aziende, necessitando di una sinergia operativa ed economica tra le aziende, le associazioni di categoria e i ministeri a livello sia nazionale che europeo.

L’AI necessita di grandi quantità di dati per funzionare efficacemente. Tuttavia, le aziende sono spesso riluttanti ad abbracciare pienamente questa tecnologia senza una comprensione approfondita dei dati utilizzati per costruire i programmi AI. Questo ostacolo è noto come il “bottleneck dei dati”. Le preoccupazioni riguardano principalmente l’origine, la storia e i diritti legali dei dati utilizzati, elementi cruciali per garantire applicazioni AI sicure e conformi.

È cruciale riconoscere che la qualità e l’affidabilità dei dati sono fondamentali per il successo di qualsiasi applicazione AI. Dati scadenti o inesatti possono portare a risultati fuorvianti o addirittura dannosi. Inoltre, la quantità di dati necessari per l’addestramento di modelli AI sofisticati può essere enorme, rendendo la loro gestione e analisi una sfida significativa.

Un altro aspetto della sfida è garantire che i dati utilizzati rispettino i diritti di privacy e le normative. Con l’aumentare delle preoccupazioni riguardo alla privacy dei dati e alla sicurezza informatica, le aziende devono assicurarsi che i dati raccolti e utilizzati per l’AI siano ottenuti in modo etico e legale.

Inoltre, la necessità di dati diversificati per evitare bias nei modelli AI è un’altra questione cruciale. La diversità nei dati aiuta a garantire che le applicazioni AI siano equilibrate e non perpetuino pregiudizi esistenti, che possono avere conseguenze reali nella vita delle persone.

La nascita degli standard di etichettatura dei dati per l’AI

In risposta alla crescente necessità di dati affidabili per le applicazioni di intelligenza artificiale, un consorzio di aziende, denominato Data & Trust Alliance, ha sviluppato un sistema di etichettatura innovativo per i dati. Questi standard, nati dalla necessità di chiarire l’origine, la storia e i diritti legali dei dati, mirano a fornire informazioni dettagliate su dove, quando e come i dati sono stati raccolti e generati, nonché sul loro uso previsto e le relative restrizioni.

Il consorzio comprende grandi aziende come American Express, Humana, IBM, Pfizer, UPS e Walmart, oltre a diverse start-up. L’obiettivo è superare le reticenze delle grandi imprese a adottare pienamente le tecnologie AI, dovute alla mancanza di chiarezza sui dati utilizzati per costruire i programmi AI. Questi standard sono visti come un passo importante per gestire i dati come un vero e proprio asset aziendale, aumentando l’efficienza e riducendo il lavoro ripetitivo, contribuendo così a un uso più efficace dell’AI nelle aziende.

Dati  AI etichettatura

L’importanza di questi standard trascende la mera etichettatura. Forniscono un quadro per valutare la qualità e l’affidabilità dei dati, elementi cruciali per lo sviluppo di applicazioni AI efficaci e responsabili. Questi standard sono vitali in settori come la salute, la finanza e il commercio al dettaglio, dove l’accuratezza e l’affidabilità dei dati sono fondamentali. Nel settore sanitario, ad esempio, possono facilitare lo sviluppo di trattamenti più efficaci e personalizzati, mentre nel commercio al dettaglio possono migliorare l’esperienza del cliente e l’efficienza delle catene di approvvigionamento​​.

Inoltre, questi standard di etichettatura aiutano a tracciare la provenienza dei dati, un aspetto fondamentale per garantire che siano raccolti e trattati in conformità con le normative sulla privacy e il consenso informato. Questa trasparenza è essenziale per incrementare la fiducia aziendale nella tecnologia AI e per promuovere la sua adozione su larga scala. Si prevede che la diffusione di questi standard potrebbe accelerare l’uso di tecnologie significative, seguendo il modello di altre innovazioni come l’elettricità e internet​​.

Accuratezza e affidabilità dei dati migliorano le risposte generate dall’AI

I sondaggi indicano una forte necessità di maggiore fiducia ed efficienza nella gestione dei dati. La maggior parte dei dirigenti aziendali cita preoccupazioni riguardanti la linea di provenienza o l’origine dei dati come ostacolo principale all’adozione dell’AI. Inoltre, i data scientist spesso dedicano quasi il 40% del loro tempo a compiti di preparazione dei dati​​.

Un aspetto fondamentale di questo sistema è la sua applicazione ai dati aziendali utilizzati per creare programmi AI o alimentare sistemi AI di aziende come Google, OpenAI, Microsoft e Anthropic. L’accuratezza e l’affidabilità dei dati migliorano significativamente l’affidabilità delle risposte generate dall’AI​​.

Inoltre, il sistema include otto standard di base, come la linea di provenienza, la fonte, i diritti legali, il tipo di dati e il metodo di generazione. Vengono fornite descrizioni dettagliate per la maggior parte di questi standard, ad esempio specificando se i dati provengono da social media o sensori industriali​​.

Infine, il consorzio sottolinea che questi sono i primi standard dettagliati destinati a essere utilizzati in tutti i settori, un passo importante verso una maggiore standardizzazione e coerenza nella gestione dei dati in diversi ambiti​​. Questi standard promuovono un maggiore scambio di dati tra le aziende, migliorando la collaborazione e l’innovazione e permettendo alle aziende di prendere decisioni più informate e sviluppare soluzioni AI più efficaci​​.

dati Ai etichettatura

Impatti e benefici degli standard di dati per AI

Gli standard di etichettatura dei dati non solo aumentano la trasparenza e la qualità dei dati, ma portano anche vantaggi economici e operativi considerevoli. Aziende come UPS vedono questi standard come un passo avanti nella gestione dei dati come asset prezioso, permettendo una conoscenza approfondita dell’origine, dello scopo e della legalità del loro uso​​​​.

Con l’adozione di standard chiari e affidabili, le aziende possono ridurre significativamente il lavoro ripetitivo e le inefficienze legate alla gestione dei dati. Si stima che il tempo dedicato ai progetti di dati possa ridursi del 15-20%, un miglioramento notevole che può liberare risorse per altre iniziative innovative​​​​.

Questi standard facilitano anche il commercio di dati tra le aziende, incrementando la collaborazione e l’innovazione. Ciò permette di sfruttare dati provenienti da diverse fonti per sviluppare soluzioni AI più efficaci e personalizzate. La chiarezza fornita dagli standard aiuta le aziende a navigare nel complesso panorama normativo, riducendo il rischio di violazioni della privacy e di altre questioni legali​​.

La maggiore trasparenza nella catena di approvvigionamento dei dati è vantaggiosa per tutti gli attori coinvolti, dai contratti di assicurazione per l’accesso ai dati alle aziende start-up che sviluppano modelli predittivi​​.

Inoltre, questi standard promuovono la democratizzazione dei dati, rendendoli più accessibili e utilizzabili da un’ampia gamma di aziende, inclusi start-up e piccole e medie imprese livellando il campo di gioco.

La sfida delle aziende nell’introduzione degli standard di etichettatura dei dati per l’AI

Analizziamo ora le sfide che le aziende, sia grandi che piccole e medie imprese (PMI), incontrano nell’integrare questi standard nelle loro procedure aziendali.

PMI

Le Piccole e Medie Imprese spesso non dispongono di processi ben strutturati, rendendo la definizione di ruoli e responsabilità per l’adozione di standard di etichettatura dei dati un compito arduo. Le risorse limitate delle PMI non solo restringono la loro capacità di sfruttare i vantaggi degli standard avanzati ma pongono anche sfide significative nell’investimento richiesto per la formazione e l’adeguamento delle infrastrutture IT. Queste difficoltà possono rallentare l’adozione degli standard e limitare la loro capacità di creare valore dai dati.

Grandi Aziende

Le grandi aziende, di fronte all’immensa mole di dati da gestire, incontrano difficoltà nell’adozione di standard uniformi. Il consolidamento dei dati da sistemi diversi, spesso isolati in silos informativi, si rivela complesso, aumentando il costo e il tempo necessario per l’integrazione e la gestione dei dati. Inoltre, la sicurezza dei dati diventa un aspetto cruciale, richiedendo spesso una revisione e un potenziamento sostanziali delle infrastrutture di sicurezza per garantire la conformità agli standard.

Le strategie per l’adozione degli standard di etichettatura dei dati per l’AI

Per affrontare le complesse sfide associate all’adozione degli standard di etichettatura dei dati, è imperativo per le aziende adottare strategie che siano non solo adattabili, ma anche proattive. Diventa essenziale un investimento sostanziale nella formazione e nello sviluppo delle competenze, garantendo che i team aziendali siano opportunamente formati per implementare e gestire questi standard in modo efficace.

Un altro aspetto fondamentale è la collaborazione con partner esterni e fornitori di tecnologia, per superare le barriere tecniche e infrastrutturali. In questo contesto, assume particolare rilevanza la sinergia operativa ed economica tra aziende, associazioni di categoria ed enti governativi a livello nazionale ed europeo. Questa sinergia è cruciale per affrontare con successo la sfida dell’etichettatura dei dati. Solo attraverso un impegno congiunto e coordinato sarà possibile raggiungere gli obiettivi di standardizzazione e ottimizzare la gestione dei dati.

Conclusioni

L’adozione di standard di etichettatura dei dati rappresenta un passaggio cruciale per l’intelligenza artificiale (AI), arricchendo il settore non solo con maggiore trasparenza e affidabilità, ma anche accelerando lo sviluppo e l’adozione dell’AI in vari ambiti. Questi standard sottolineano il valore dei dati come asset imprescindibili, essenziali per il successo dell’AI nell’era digitale.

La standardizzazione dei dati trascende i benefici immediati, avendo implicazioni profonde per il futuro dell’AI e della società. Fornire dati affidabili ed etici non solo eleva la qualità delle applicazioni AI, ma è anche fondamentale per costruire fiducia pubblica in un campo in rapida espansione in molteplici aree della vita quotidiana.

Questi progressi costituiscono un passo significativo verso un ecosistema AI più inclusivo e diversificato. Democratizzare l’accesso a dati di qualità amplia la partecipazione al processo innovativo, assicurando una distribuzione più equa dei vantaggi dell’AI, il che può stimolare l’innovazione e generare soluzioni AI che rispecchiano e soddisfano meglio le esigenze di diverse comunità.

La sfida nell’etichettatura dei dati richiede più che un impegno autonomo da parte delle singole aziende; necessita di un approccio collaborativo e sistemico. Gli sforzi delle aziende devono essere integrati da azioni legislative ed economiche da parte degli enti pubblici, perché in gioco non vi è soltanto la competitività economica individuale, ma anche un impatto sistemico più ampio.

Nonostante l’entità della sfida, un’adozione efficace di questi standard non solo facilita lo sviluppo e l’implementazione di soluzioni AI, ma contribuisce anche significativamente al miglioramento della qualità, dell’efficacia e delle prestazioni complessive dell’economia nazionale a cui le aziende appartengono.

Articoli correlati

Articolo 1 di 4