Modelli linguistici: spunta DALL-E Mini, ma non è di OpenAI

Boris Dayma, consulente di Houston, ha creato una propria architettura open source che genera immagini in base al testo, imitando il modello di OpenAI. I risultati, però, sono molto diversi. E l’autore è stato costretto a cambiare il nome della sua creatura, che è diventata Craiyon

Pubblicato il 08 Lug 2022

Nell’hype di DALL-E 2 di OpenAI, uno sviluppatore ha avuto l’idea di addestrare un proprio sistema e di chiamarlo come il modello linguistico più noto e più potente, con il quale però ha ben poco in comune: DALL-E Mini.

Indice degli argomenti:

DALL-E Mini non è di OpenAI

DALL-E Mini non è stato sviluppato da OpenAI, quindi, ma da Boris Dayma, un consulente AI di Houston. Utilizza una propria architettura open source e molte meno immagini di training rispetto a DALL-E (circa 30 milioni). Dayma ha presentato la prima versione nell’estate del 2021 durante un hackathon ospitato dalla piattaforma di machine learning Hugging Face e Google.

Il sistema genera motivi abbastanza adatti per l’input di testo, ma la qualità visiva è molto peggiore rispetto a DALL-E. I motivi sono molto sfocati e hanno un aspetto onirico, sufficiente per far divertire le persone sui social media, ma non per essere considerato un serio concorrente di DALL-E 2 o, peggio ancora, di un artista.

Da DALL-E Mini a Craiyon

Come era lecito attendersi, OpenAI ha chiesto a Dayma di cambiare il nome del sistema. Quindi DALL-E Mini si chiama ora Craiyon, anche se sul sito web di Hugging Face si chiama ancora DALL-E Mini. Dayma prevede di continuare ad allenare l’AI e monetizzare il sito con pubblicità e offerte premium. Le immagini sono liberamente disponibili per uso privato; per uso commerciale occorre contattare lo sviluppatore.

Resta da vedere se Dayma potrà continuare ad avere successo con il suo approccio libero e senza restrizioni quando sistemi più potenti, come DALL-E 2, o alternative come Midjourney, diventeranno liberamente disponibili.

Craiyon inoltre non utilizza politiche di sicurezza come quelle di OpenAI. Di conseguenza, il sistema genera immagini esplicite con celebrità o bambini e riproduce stereotipi. Di questo è consapevole lo stesso Dayma, che sul sito web avverte: “Poiché il modello è stato addestrato su dati non filtrati da Internet, può generare immagini che contengono stereotipi dannosi. La portata e la natura dei pregiudizi del DALL-E mini devono essere ancora completamente documentati”.

Tuttavia, queste carenze non ostacolano il successo del sistema Dayma: secondo la piattaforma Hugging Face, il modello genera fino a 50mila immagini al giorno. Questo dimostra quanto sia grande l’interesse per tali sistemi. Anche OpenAI, infatti, sta avendo un numero record di registrazioni per DALL-E 2.

Modelli linguistici: spunta DALL-E Mini, ma non è di OpenAI

DALL-E Mini non è di OpenAI

Da DALL-E Mini a Craiyon

Articoli correlati

ChatGPT di OpenAI: tutto sul chatbot più famoso al mondo

Codice Rss

Codice Rss