Secondo Amazon, il percorso verso “l’intelligenza generale” (AGI) inizia con l’intelligenza ambientale. Rohit Prasad, vicepresidente senior e capo scienziato di Alexa di Amazon, ha parlato della potenziale evoluzione dall’intelligenza ambientale all‘intelligenza generale (AGI) a re:MARS, la conferenza di Amazon sull’apprendimento automatico (ML), l’automazione, la robotica e lo spazio.
“Viviamo nell’area d’oro dell’AI, dove i sogni e la fantascienza stanno diventando realtà”, ha dichiarato Prasad. La sua definizione di intelligenza generalizzabile non è un’intelligenza artificiale onnisciente e simile all’uomo. Gli agenti GI dovrebbero avere tre attributi chiave: avere la capacità di svolgere più compiti, evolversi rapidamente in ambienti in continua evoluzione e apprendere nuovi concetti e azioni con un input esterno minimo da parte degli umani.
L’intelligenza ambientale, ha detto Prasad, è quando l’intelligenza artificiale sottostante è disponibile ovunque, assiste le persone quando ne hanno bisogno – e impara anche ad anticipare i bisogni – quindi svanisce in secondo piano quando non è necessaria.
Un primo esempio e un passo significativo verso GI, ha detto Prasad, è Alexa di Amazon, “assistente personale, consulente, compagno”.
Intelligenza ambientale reattiva, proattiva, predittiva
Come ha spiegato Prasad, l’intelligenza ambientale è sia reattiva (rispondere alle richieste dirette) che proattiva (anticipare i bisogni). Ciò si ottiene attraverso l’uso di numerose tecnologie di rilevamento: visione, suono, ultrasuoni, profondità, sensori meccanici e atmosferici.
Tutto sommato, questa capacità richiede capacità di deep learning, nonché l’elaborazione del linguaggio naturale (NLP). Gli “agenti” dell’intelligenza ambientale sono anche auto-supervisione e autoapprendimento, che consentono loro di generalizzare ciò che apprendono e applicarlo a nuovi contesti. Il percorso “più pratico” verso la GI, o la capacità per le entità AI di comprendere e apprendere qualsiasi compito intellettuale che gli umani possono.
In definitiva, “ecco perché il percorso dell’intelligenza ambientale porta all’intelligenza generalizzata”, ha detto Prasad.
Amazon: AGI sempre più realizzabile
AGI è già in fase di realizzazione, ha sottolineato Prasad: i modelli linguistici di grandi dimensioni basati su trasformatori di base addestrati con l’auto-supervisione stanno alimentando molte attività con molti meno dati etichettati manualmente. Un esempio di questo è Alexa Teacher Model, che raccoglie conoscenze da NLU, riconoscimento vocale, previsione dei dialoghi e comprensione della scena visiva.
L’obiettivo è quello di portare il ragionamento automatizzato a nuovi livelli.
Lavorando in questo senso, Amazon ha rilasciato un set di dati per la conoscenza con oltre 11.000 dialoghi raccolti per aiutare la ricerca nella conversazione a dominio aperto.
L’azienda ha anche inventato un approccio generativo “pensare prima di parlare”. Ciò implica che l’agente AI impari a esternalizzare la conoscenza implicita del buon senso (“pensare”) e utilizzi un modello linguistico di grandi dimensioni (come la rete semantica liberamente disponibile ConceptNet) combinato con un grafico della conoscenza. Quindi usa quella conoscenza per generare risposte (“parlare”).
Amazon sta anche addestrando Alexa a rispondere a query complesse che richiedono più passaggi di inferenza e sta anche abilitando “esplorazioni conversazionali” su dispositivi ambientali in modo che gli utenti non debbano estrarre i loro telefoni o laptop per esplorare il web.
In definitiva, secondo Prasad l’AGI sta diventando sempre più realizzabile.