Per decenni, biologi e ricercatori hanno cercato di interpretare il linguaggio dei delfini, fatto di clic, fischi e sequenze di impulsi acustici. Un’impresa tanto affascinante quanto complessa, vista la natura articolata e sfuggente della loro comunicazione. Oggi, però, grazie alla collaborazione tra Google, Georgia Tech e il Wild Dolphin Project (WDP), la scienza fa un balzo in avanti. Il protagonista si chiama DolphinGemma, un modello AI progettato per comprendere e generare le vocalizzazioni dei delfini.
Indice degli argomenti:
Un archivio sonoro lungo quarant’anni
La base del progetto è il prezioso lavoro del Wild Dolphin Project, che dal 1985 studia le stenelle maculate atlantiche nelle acque delle Bahamas. Con un approccio non invasivo e immersivo, il WDP ha raccolto decenni di dati audio e video, associati a specifici comportamenti e identità individuali dei delfini. Questo archivio dettagliato rappresenta un patrimonio unico, essenziale per addestrare qualsiasi sistema di intelligenza artificiale con l’ambizione di comprendere il “linguaggio” di questi animali.
Tra i comportamenti sonori documentati troviamo:
- Fischi firma: simili a nomi propri, usati per il riconoscimento tra madre e cucciolo.
- Squawk intermittenti: spesso associati a conflitti tra individui.
- Buzz ad alta frequenza: emessi durante il corteggiamento o l’inseguimento degli squali.

DolphinGemma: un LLM subacqueo
DolphinGemma è un modello audio-in/audio-out con circa 400 milioni di parametri, ottimizzato per operare anche su smartphone Pixel sul campo. Basato su Gemma, la famiglia di modelli linguistici leggeri di Google, DolphinGemma elabora le sequenze acustiche dei delfini per identificare schemi ricorrenti, anticipare suoni successivi e generare nuove vocalizzazioni compatibili con quelle naturali.
Come un modello linguistico umano, DolphinGemma “predice” ciò che viene dopo in una conversazione — solo che, in questo caso, la conversazione è fatta di onde sonore tra creature marine.
Tecnologia mobile al servizio della biologia marina
Una delle grandi innovazioni è l’uso degli smartphone Pixel per raccogliere e analizzare dati in tempo reale. I ricercatori sul campo possono utilizzare questi dispositivi per processare suoni subacquei con un’efficienza impensabile fino a pochi anni fa, riducendo drasticamente costi, consumi e ingombri.

Il sistema si arricchisce con CHAT (Cetacean Hearing Augmentation Telemetry), una tecnologia sviluppata da Georgia Tech per facilitare l’interazione diretta tra umani e delfini. CHAT non interpreta la comunicazione naturale, ma costruisce un vocabolario condiviso usando fischi sintetici associati a oggetti familiari ai delfini. Quando un cetaceo ripete uno di questi suoni, il sistema lo rileva e comunica al ricercatore quale oggetto è stato “richiesto”, creando un circuito di feedback positivo.

Verso un dizionario comune uomo-delfino
L’integrazione tra DolphinGemma e CHAT potrebbe essere la chiave per un’interazione più sofisticata: mentre l’uno decifra la lingua naturale, l’altro insegna un linguaggio comune. La capacità predittiva del modello AI può infatti aiutare i ricercatori a riconoscere in tempo reale le vocalizzazioni spontanee che potrebbero corrispondere a intenzioni specifiche, migliorando la prontezza nella risposta umana.
Open science per l’oceano
Il rilascio open source di DolphinGemma, previsto per l’estate 2025, apre la strada a un’intera comunità di ricerca. Anche se addestrato sulle stenelle maculate, il modello potrà essere adattato ad altre specie di cetacei. Con un ecosistema sempre più connesso e collaborativo, la scienza dei cetacei entra in una nuova era, in cui l’intelligenza artificiale diventa ponte tra mondi diversi.

Un dialogo che si fa realtà
Il cammino per comprendere davvero la complessità della comunicazione dei delfini è ancora lungo. Ma con strumenti come DolphinGemma e l’alleanza tra biologia marina e AI, non stiamo più solo ascoltando: stiamo cominciando a rispondere. In un futuro non troppo lontano, potremmo finalmente avere un dizionario interspecie. E tutto inizia con un clic – o forse un fischio.
Per approfondire: Wild Dolphin Project