ANALISI

eCommerce e AI generativa: come usare i tool di text to image nella personalizzazione dei contenuti



Indirizzo copiato

I brand possono integrare nei canali di comunicazione consolidati metodologie innovative come la produzione di immagini con l’AI generativa, inoltre progettare nuovi canali, che consentono ad esempio di espandere l’esperienza di fruizione di e-commerce con funzionalità immersive

Pubblicato il 9 lug 2024

Ivan Armentano

Product design Lead Orbyta Tech

Luca Fassero

General manager Orbyta Tech

Luca Vercellio

Tech lead Orbyta Tech



orbytatech_evy_virtual_influencer_02

I brand, ormai da anni, soprattutto nel retail, stanno sviluppando strategie di marketing orientate non tanto alla vendita di prodotti ma soprattutto alla costruzione di esperienze con le quali coinvolgere i clienti in una customer experience che li tiene ingaggiati attraverso diversi touch point. In questa evoluzione hanno un ruolo fondamentale le tecnologie e i canali di comunicazione emergenti: tanto più un brand riesce a implementare una nuova tecnologia per l’interazione con il suo target, tanto più il consumatore, affascinato dall’“effetto wow” che una nuova esperienza può generare, è indotto a percepire quel brand come innovativo e a fidelizzarsi.

La rivoluzione della customer experience: il ruolo di AI generativa e mixed reality

In particolare, l’AI generativa e i dispositivi di mixed reality offrono nuove opportunità ai brand per aumentare l’efficienza nella produzione di contenuti, per creare esperienze di interazione con la marca coinvolgenti e per offrire nuovi servizi che accompagnano l’utente nel percorso di acquisto. Da vetrine di prodotti interattive e avatar personalizzati a esperienze immersive di negozi virtuali e configuratori di prodotti virtuali, ogni passo nel percorso di acquisto del cliente può essere potenziato e personalizzato per fornire un’esperienza memorabile e coinvolgente. I brand possono quindi da un lato integrare nei canali di comunicazione consolidati metodologie innovative come, ad esempio, la produzione di immagini con l’AI generativa, dall’altro progettare nuovi canali, che consentono ad esempio di espandere l’esperienza di fruizione di e-commerce con funzionalità immersive.

AI generativa ed eCommerce, tra “effetto wow” e scalabilità

La produzione di immagini con l’AI generativa ha due principali vantaggi. Il primo vantaggio è l’“effetto wow! che genera sull’utente scoprire che un contenuto estremamente fotorealistico è stato generato in automatico. La viralità della diffusione di ChatGPT è il risultato di questo effetto: gli utenti, vedendo il realismo dell’interazione, sono stati incentivati a provarlo e a parlarne. Naturalmente l’effetto si esaurisce rapidamente dopo poche volte che l’utente prova l’esperienza o emerge una nuova tecnologia ancora più sorprendente. Per questo, i brand e le piattaforme stanno giocando alla rincorsa dell’ultima tecnologia: dalla generazione automatica di testo al fotorealismo delle immagini sintografiche (prodotte sinteticamente), fino ai video creati grazie ai tool di AI generativa text-to-video.

Il secondo vantaggio è invece legato alla possibilità di risparmiare notevolmente nei costi di produzione di contenuti visivi per le campagne di comunicazione e i contenuti presenti nell’e-commerce. Con l’attuale evoluzione delle tecnologie è realistico pensare che a breve interi shooting, che implicano costi di location, attrezzature e modelle, nonché limiti alla creatività, possano essere in parte o interamente sostituiti dalla produzione di campagne e asset visivi generati dall’AI.

I contenuti AI generated, oltre al risparmio dei costi degli shooting, aprono moltissime opportunità in termini di scalabilità, particolarmente rilevanti in contesti come i social media o come gli e-commerce nei quali è importante produrre moltissimi contenuti, in alcuni casi anche con minime variazioni. Questa opportunità di efficientare la produzione si combina con le possibilità di personalizzazione. Un esempio è la campagna di Carvana, azienda nel mondo automotive americana che per coinvolgere il proprio target ha creato una campagna video in cui ad ogni utente è stato inviato un video personalizzato. Un’opportunità resa possibile proprio dall’AI generativa.

Contenuti per i social: AI Generated Content (AGC) e virtual influencer

I canali social sono il contesto ideale per sperimentare nuove tecnologie come l’AI generativa per la creazione di asset visuali. I contenuti “AI generated” (AGC) possono infatti essere di supporto allo storytelling legato al brand, alla realizzazione di campagne e shooting di prodotto, ma anche alla creazione di veri e propri influencer virtuali che si fanno portavoce dei valori e dell’identità del brand, affiancando brand ambassador più tradizionali.

Lil Miquela

Gli esempi illustri sono ormai numerosi: si va dall’influencer virtuale nota come Lil Miquela (IG: @lilmiquela), che sul suo profilo Instagram condivide la sua vita di “robot diciannovenne di LA” e ha superato ampiamente i 2 milioni di follower; ma anche Daisy, la brand ambassador virtuale dell’e-commerce luxury YOOX, che appare regolarmente sul profilo Instagram del brand, agendo come volto del brand accanto a modelle e VIP in carne e ossa.

I vantaggi degli influencer virtuali sono molti, a partire dalle infinite possibilità di customizzazione: gli influencer virtuali possono infatti essere facilmente personalizzati per soddisfare le esigenze specifiche dei brand, mirando a pubblici o nicchie di mercato specifici. Inoltre, gli influencer virtuali offrono alle aziende l’opportunità di avere un’immagine controllata, limitando i rischi di possibile danno reputazionale associati agli influencer reali. Da notare che, secondo un report di HypeAuditor e Virtual Humans, i post degli influencer virtuali ottengono in media un Engagement Rate di 2,6 volte superiore ai post degli influencer “umani”.

Tecnologie e piattaforme per il text-to-image: Dall-e, Midjourney e Stable Diffusion

Con i tool di AI generativa text-to-image è possibile generare un’immagine statica a partire da un prompt: un messaggio di testo in linguaggio naturale più o meno dettagliato e specifico. Gli strumenti di text-to-image sono numerosissimi, ma qui citiamo quelli più rappresentativi dello spettro di opportunità che vanno da interfacce estremamente semplici con poco controllo, fino a modelli open source a partire dai quali la gamma di possibilità di personalizzazione è praticamente infinita.

DALL-E2

DALL-E 2, il modello di generazione immagini di Open AI, ha avuto un grande successo per le sue capacità avanzate, ma soprattutto perché è stato il primo generatore di immagini AI “mainstream”: sviluppato da OpenAI, è stato presentato il 5 gennaio 2021 e, più recentemente, è stato integrato nella suite Microsoft 365 diventando Image Creator di Microsoft Designer e inserito come tool di produzione di immagini di Copilot. Image Creator è una valida alternativa gratuita che bilancia buone capacità di generazione immagini con l’ampia accessibilità della piattaforma, data in primis dall’uso di prompt in linguaggio naturale.

Per saperne di più su DALL-E2

Midjourney

Il 12 luglio 2022 è stata aperta in open beta la piattaforma di generazione di immagini Midjourney. Midjourney si è posizionato fin da subito come uno strumento di generazione di immagini più avanzato e completo, accessibile su un server Discord dedicato. Inizialmente Midjourney offriva una prova gratuita attraverso la quale era possibile testare il servizio su un numero limitato di immagini. Attualmente, il servizio è disponibile solo previa sottoscrizione di uno dei piani di abbonamento a pagamento ed è stato arricchito anche da una piattaforma web che consente di generare immagini anche all’esterno di Discord.

Midjourney si è fin da subito caratterizzato per uno stile visivo distintivo e per una specifica sintassi dei prompt che consentono ampie possibilità di sperimentazione in termini di stili di fotografia, inquadrature, luci etc.

Stable Diffusion

Infine, un’ultima tecnologia da citare per le possibilità di personalizzazione e controllo è Stable Diffusion, modello di text-to-image open-source sviluppato da Stability.AI, che proprio grazie alla sua natura aperta consente di integrare e addestrare modelli, sia a partire da repository aperti come Hugging Face, sia a partire da database di immagini personali. In Stable Diffusion l’immagini è generata a partire da un prompt ma può essere affinata grazie a campi dedicati che consentono di controllare variabili come dimensioni, stile, prompt negativi, o integrare funzioni di inpainting, outpainting e generazione image-to-image.

Apertura e sofisticatezza dell’interfaccia rendono Stable Diffusion uno dei tool di generazione immagini da un lato più complessi, dall’altro più potenti in termini di possibilità di sperimentazione e controllo.

Per saperne di più su Stable Diffusion

Scenari futuri: l’AI per animare i digital human negli e-commerce immersivi

L’AI generativa mette a disposizione molte opportunità per aumentare l’efficienza di produzione per i contenuti per gli e-commerce. Al momento la tecnologia di text-to-image può essere utilizzata per creare immagini con maggiore efficienza per nuove collezioni da inserire nell’e-commerce e lanci di prodotto. In futuro, l’esperienza di navigazione e acquisto sugli e-commerce si evolverà verso ambienti immersivi di realtà mista.

In questo contesto l’AI generativa potrà essere utilizzata per personalizzare e animare non solo gli ambienti ma soprattutto i digital human; come Evy, la meta-ambassador con cui dal 2022 stiamo sperimentando nuove modalità di interazione che combinano AI generativa e modellazione 3D.

Conclusioni

Tra pochi anni negli store online saranno presenti assistenti virtuali digitali che, proprio come gli assistenti alla vendita negli store fisici, possano accogliere l’utente interagendo in modo personalizzato avendo a disposizione le informazioni personali come i dati anagrafici e le preferenze di acquisto. Naturalmente per rendere possibile questa esperienza saranno necessarie tecnologie che in tempo reale possano interagire con l’utente e che quindi avranno delle componenti di generazione del contenuto testuale, audio e 3D in tempo reale.

A noi piace definire questo scenario Spatial commerce. Con il lancio dei VisionPro, Apple ha di fatto dichiarato che la prossima rivoluzione della user experience sarà lo Spatial computing, un nuovo paradigma di utilizzo degli ambienti digitali che avrà un impatto in particolare dell’e-commerce (78,85%) e del fashion (77,08%) (Sortlist), consentendo ai brand di avere un incremento in termini di reputation, un aumento delle conversioni grazie alla possibilità di provare virtualmente i capi, un tasso di reso inferiore e una maggiore sostenibilità e trasparenza (Shopware).

Le immagini di accompagnamento di questo articolo sono state generate da Orbyta Tech attraverso una combinazione di diversi tool di AI generativa.

Articoli correlati

Articolo 1 di 4