AI generativa

DolphinGemma: l’AI di Google che vuole parlare con i delfini



Indirizzo copiato

Si tratta di un modello linguistico sviluppato per decifrare la comunicazione dei delfini. Frutto della collaborazione con il Wild Dolphin Project e Georgia Tech, l’AI non si limita a interpretare i suoni emessi dai cetacei, ma è anche in grado di generarne di nuovi, aprendo la strada a un potenziale dialogo interspecie

Pubblicato il 15 apr 2025



A,Graceful,Dolphin,Leaps,From,The,Sparkling,Ocean,At,Sunset,

Per decenni, biologi e ricercatori hanno cercato di interpretare il linguaggio dei delfini, fatto di clic, fischi e sequenze di impulsi acustici. Un’impresa tanto affascinante quanto complessa, vista la natura articolata e sfuggente della loro comunicazione. Oggi, però, grazie alla collaborazione tra Google, Georgia Tech e il Wild Dolphin Project (WDP), la scienza fa un balzo in avanti. Il protagonista si chiama DolphinGemma, un modello AI progettato per comprendere e generare le vocalizzazioni dei delfini.

Exploring Wild Dolphin Communication with C.H.A.T. (Cetacean Hearing Augmented Telemetry)

Un archivio sonoro lungo quarant’anni

La base del progetto è il prezioso lavoro del Wild Dolphin Project, che dal 1985 studia le stenelle maculate atlantiche nelle acque delle Bahamas. Con un approccio non invasivo e immersivo, il WDP ha raccolto decenni di dati audio e video, associati a specifici comportamenti e identità individuali dei delfini. Questo archivio dettagliato rappresenta un patrimonio unico, essenziale per addestrare qualsiasi sistema di intelligenza artificiale con l’ambizione di comprendere il “linguaggio” di questi animali.

Tra i comportamenti sonori documentati troviamo:

  • Fischi firma: simili a nomi propri, usati per il riconoscimento tra madre e cucciolo.
  • Squawk intermittenti: spesso associati a conflitti tra individui.
  • Buzz ad alta frequenza: emessi durante il corteggiamento o l’inseguimento degli squali.
A sinistra: una stenella maculata adulta osserva il suo cucciolo mentre cerca cibo. Userà il suo fischio firma unico per richiamare il cucciolo quando avrà finito. A destra: uno spettrogramma per visualizzare il fischio.
DolphinGemma: How Google AI is helping decode dolphin communication

DolphinGemma: un LLM subacqueo

DolphinGemma è un modello audio-in/audio-out con circa 400 milioni di parametri, ottimizzato per operare anche su smartphone Pixel sul campo. Basato su Gemma, la famiglia di modelli linguistici leggeri di Google, DolphinGemma elabora le sequenze acustiche dei delfini per identificare schemi ricorrenti, anticipare suoni successivi e generare nuove vocalizzazioni compatibili con quelle naturali.

Come un modello linguistico umano, DolphinGemma “predice” ciò che viene dopo in una conversazione — solo che, in questo caso, la conversazione è fatta di onde sonore tra creature marine.

Cracking the Dolphin Communication Code | Denise Herzing | Talks at Google
Video

Tecnologia mobile al servizio della biologia marina

Una delle grandi innovazioni è l’uso degli smartphone Pixel per raccogliere e analizzare dati in tempo reale. I ricercatori sul campo possono utilizzare questi dispositivi per processare suoni subacquei con un’efficienza impensabile fino a pochi anni fa, riducendo drasticamente costi, consumi e ingombri.

Il sistema si arricchisce con CHAT (Cetacean Hearing Augmentation Telemetry), una tecnologia sviluppata da Georgia Tech per facilitare l’interazione diretta tra umani e delfini. CHAT non interpreta la comunicazione naturale, ma costruisce un vocabolario condiviso usando fischi sintetici associati a oggetti familiari ai delfini. Quando un cetaceo ripete uno di questi suoni, il sistema lo rileva e comunica al ricercatore quale oggetto è stato “richiesto”, creando un circuito di feedback positivo.


Verso un dizionario comune uomo-delfino

L’integrazione tra DolphinGemma e CHAT potrebbe essere la chiave per un’interazione più sofisticata: mentre l’uno decifra la lingua naturale, l’altro insegna un linguaggio comune. La capacità predittiva del modello AI può infatti aiutare i ricercatori a riconoscere in tempo reale le vocalizzazioni spontanee che potrebbero corrispondere a intenzioni specifiche, migliorando la prontezza nella risposta umana.


Open science per l’oceano

Il rilascio open source di DolphinGemma, previsto per l’estate 2025, apre la strada a un’intera comunità di ricerca. Anche se addestrato sulle stenelle maculate, il modello potrà essere adattato ad altre specie di cetacei. Con un ecosistema sempre più connesso e collaborativo, la scienza dei cetacei entra in una nuova era, in cui l’intelligenza artificiale diventa ponte tra mondi diversi.

A sinistra: la dott.ssa Denise Herzing indossa “Chat Senior, 2012”, a destra: lo studente di dottorato del Georgia Tech Charles Ramey indossa “Chat Junior, 2025”

Un dialogo che si fa realtà

Il cammino per comprendere davvero la complessità della comunicazione dei delfini è ancora lungo. Ma con strumenti come DolphinGemma e l’alleanza tra biologia marina e AI, non stiamo più solo ascoltando: stiamo cominciando a rispondere. In un futuro non troppo lontano, potremmo finalmente avere un dizionario interspecie. E tutto inizia con un clic – o forse un fischio.


Per approfondire: Wild Dolphin Project

Articoli correlati

Articolo 1 di 4