approfondimento

VLM, cosa sono i modelli di linguaggio visivo



Indirizzo copiato

Si tratta di modelli che combinano capacità di visione artificiale e di elaborazione del linguaggio naturale (NLP). Imparano a mappare le relazioni tra dati di testo e visivi, come immagini o video, consentendo a questi modelli di generare testo da input visivi o di comprendere richieste di linguaggio naturale nel contesto di informazioni visive

Pubblicato il 7 mar 2025



VLM

I modelli di linguaggio visivo (VLM) sono modelli di intelligenza artificiale che combinano capacità di visione artificiale e di elaborazione del linguaggio naturale (NLP). I VLM imparano a mappare le relazioni tra dati di testo e dati visivi come immagini o video, consentendo a questi modelli di generare testo da input visivi o di comprendere richieste di linguaggio naturale nel contesto di informazioni visive.

Continua a leggere questo articolo

Articoli correlati