Modelli linguistici: spunta DALL-E Mini, ma non è di OpenAI

Boris Dayma, consulente di Houston, ha creato una propria architettura open source che genera immagini in base al testo, imitando il modello di OpenAI. I risultati, però, sono molto diversi. E l’autore è stato costretto a cambiare il nome della sua creatura, che è diventata Craiyon [...]
Pierluigi Sandonnini

giornalista

DALL-E Mini
  1. Home
  2. News
  3. Modelli linguistici: spunta DALL-E Mini, ma non è di OpenAI

Nell’hype di DALL-E 2 di OpenAI, uno sviluppatore ha avuto l’idea di addestrare un proprio sistema e di chiamarlo come il modello linguistico più noto e più potente, con il quale però ha ben poco in comune: DALL-E Mini.

DALL-E Mini non è di OpenAI

DALL-E Mini non è stato sviluppato da OpenAI, quindi, ma da Boris Dayma, un consulente AI di Houston. Utilizza una propria architettura open source e molte meno immagini di training rispetto a DALL-E (circa 30 milioni). Dayma ha presentato la prima versione nell’estate del 2021 durante un hackathon ospitato dalla piattaforma di machine learning Hugging Face e Google.

Il sistema genera motivi abbastanza adatti per l’input di testo, ma la qualità visiva è molto peggiore rispetto a DALL-E. I motivi sono molto sfocati e hanno un aspetto onirico, sufficiente per far divertire le persone sui social media, ma non per essere considerato un serio concorrente di DALL-E 2 o, peggio ancora, di un artista.

Da DALL-E Mini a Craiyon

Come era lecito attendersi, OpenAI ha chiesto a Dayma di cambiare il nome del sistema. Quindi DALL-E Mini si chiama ora Craiyon, anche se sul sito web di Hugging Face si chiama ancora DALL-E Mini. Dayma prevede di continuare ad allenare l’AI e monetizzare il sito con pubblicità e offerte premium. Le immagini sono liberamente disponibili per uso privato; per uso commerciale occorre contattare lo sviluppatore.

WHITEPAPER
Come l'AI può rendere più performante ed efficace una strategia di Marketing?
CRM
Intelligenza Artificiale

Resta da vedere se Dayma potrà continuare ad avere successo con il suo approccio libero e senza restrizioni quando sistemi più potenti, come DALL-E 2, o alternative come Midjourney, diventeranno liberamente disponibili.

Craiyon inoltre non utilizza politiche di sicurezza come quelle di OpenAI. Di conseguenza, il sistema genera immagini esplicite con celebrità o bambini e riproduce stereotipi. Di questo è consapevole lo stesso Dayma, che sul sito web avverte: “Poiché il modello è stato addestrato su dati non filtrati da Internet, può generare immagini che contengono stereotipi dannosi. La portata e la natura dei pregiudizi del DALL-E mini devono essere ancora completamente documentati”.

Tuttavia, queste carenze non ostacolano il successo del sistema Dayma: secondo la piattaforma Hugging Face, il modello genera fino a 50mila immagini al giorno. Questo dimostra quanto sia grande l’interesse per tali sistemi. Anche OpenAI, infatti, sta avendo un numero record di registrazioni per DALL-E 2.

 

FacebookTwitterLinkedIn