Ologrammi: cosa si può fare con deep learning e reti neurali convoluzionali

Il termine indica una specifica tecnica di visualizzazione delle immagini in tre dimensioni, ossia la creazione di una immagine parallattica tramite l’utilizzo di fasci di luce laser. Ma è con l’intelligenza artificiale che l’olografia ha fatto un balzo in avanti [...]
Marina Rita Carbone

Consulente privacy

ologrammi
  1. Home
  2. Intelligenza Artificiale
  3. Ologrammi: cosa si può fare con deep learning e reti neurali convoluzionali

Quando si parla di ologrammi, nell’immaginario comune si pensa immediatamente all’iconico Data di Star Trek, impegnato a sconfiggere il professor Moriarty come un novello Sherlock Holmes all’interno del Ponte Ologrammi. Non è difficile pensare che, con l’avvento di tecnologie sempre più innovative, la creazione di ologrammi iperrealistici come quelli di Star Trek possa essere possibile, anche grazie all’ausilio dell’intelligenza artificiale, la quale permette di “dare vita” all’immagine, facendola interagire con l’ambiente.

Cos’è un ologramma e cosa significa il termine

Con il termine ologramma si intende indicare una specifica tecnica di visualizzazione delle immagini in tre dimensioni, o, in senso tecnico, la creazione di una immagine c.d. parallattica tramite l’utilizzo di fasci di luce laser. Più in generale, si identificano quali ologrammi le immagini tridimensionali stereoscopiche, che assumono prospettive diverse a seconda del punto in cui le si osserva.

I primi ologrammi furono inizialmente teorizzati e poi inventati dal fisico ungherese Dennis Gabor, tramite l’utilizzo di fasci di luce verde generati da una lampada di vapori di mercurio. Tale scoperta, che fece ottenere a Gabor il premio Nobel nel 1971, non fu valorizzata sino ai primi anni Sessanta, periodo nel quale iniziarono a fare la loro comparsa le sorgenti di luce laser c.d. altamente coerente, ossia dalla differenza di fase costante nel tempo (al contrario della luce naturale, che viene definita estremamente incoerente).

La caratteristica costanza della luce laser è quello che, infatti, permette di riprodurre con precisione un’immagine precedentemente registrata, mediante la combinazione di due fasci laser: il primo viene diffratto dall’oggetto, mentre il secondo viene riflesso da uno specchio; i due fasci laser, vengono poi fatti interferire tra di loro. È così che si genera un effetto fotografico tridimensionale che permette di percepire anche la terza dimensione, a differenza della semplice proiezione su una superficie di un’immagine.

Ulteriore peculiarità dell’ologramma è anche quella di contenere tutte le informazioni sull’oggetto che si intende riprodurre: anche nel caso in cui l’ologramma, infatti, dovesse essere tagliato in due parti, l’oggetto sarebbe rappresentato sempre nella sua interezza.

La costanza della fase della luce laser viene utilizzata anche nella chirurgia, in quante permette di compiere interventi microscopici ad alta precisione, limitando al massimo il grado di invasività dell’operazione.

Come si produce un ologramma

Come precedentemente anticipato, l’ologramma viene creato tramite un vero e proprio gioco di specchi:

  • nella fase di registrazione dell’immagine da riprodurre, si invia un fascio di luce laser verso l’oggetto da riprodurre;
  • il fascio di luce viene inviato anche verso una lastra di materiale sensibile;
  • la luce laser interferisce con quella riflessa dall’oggetto. Le lunghezze dei due percorsi ottici (quello che illumina direttamente alla lastra e quello che viene ad essa riflesso dall’oggetto) dovranno essere quanto più possibile simili tra loro, o la loro differenza essere molto inferiore alla lunghezza di coerenza della sorgente utilizzata;
  • sulla lastra di materiale sensibile vanno a formarsi delle linee, denominate frange di interferenza (assimilabili alle increspature che si formano su uno specchio d’acqua, o all’incontro tra più onde sonore);
  • l’immagine, così registrata, conterrà tutte le informazioni sull’oggetto che si intende riprodurre all’interno del c.d. pattern di interferenza, che registra l’intensità e la fase della luce proveniente dall’oggetto;
  • facendo passare attraverso le fenditure delle frange di interferenza un fascio di luce laser, quest’ultimo sarà diffratto, generando delle onde luminose che si andranno a sovrapporre l’una sull’altra, ricostruendo l’immagine tridimensionale dell’oggetto originariamente registrato.

Tramite tale processo, lo spettatore potrà, così, vedere in tre dimensioni l’immagine come se fosse fisicamente presente.

Grazie al progresso tecnologico è oggi possibile realizzare su larga scala degli ologrammi visibili anche tramite l’utilizzo di luce bianca o solare, e ologrammi stampati, simili a quelli presenti sulle banconote o sulle carte di credito, che riproducono un’immagine tramite la diffrazione della luce su un supporto di plastica trasparente, a sua volta collocato al di sopra di una superficie argentata.

Trattasi, in concreto, di una vera e propria illusione ottica.

ologramma
Foto di Prettysleepy da Pixabay

La ricerca di nuovi metodi di generazione

Sebbene, dunque, l’utilizzo degli ologrammi sia stato ormai ampiamente sdoganato (tant’è che vengono organizzati anche dei c.d. hologram tour, o “esibizioni” sul palco di star del passato come Tupac, Elvis Presley o Michael Jackson), gli scienziati non hanno mai smesso di ricercare nuovi metodi di generazione degli stessi, che consentano di posizionare l’ologramma liberamente nello spazio (facendo a meno, ad esempio, di visori) o di aumentarne la fedeltà.

A titolo esemplificativo, nel 2019, un gruppo di scienziati facenti parte di un gruppo di ricerca di un’università turca annunciavano di poter elaborare degli ologrammi privi di distorsioni, risolvendo le problematiche connesse al c.d. cross-talk, ovvero alle interferenze generate dall’elevato numero di immagini a due dimensioni necessarie per poter generare l’ologramma.

Al fine di poter generare un’immagine olografica realmente tridimensionale, infatti, secondo quanto riportato dai ricercatori, è necessario esercitare un controllo completo della profondità e della capacità di proiezione dinamica, le quali sono ostacolate, attualmente, dall’elevata diafonia della tecnica di riproduzione. La principale difficoltà sta nel memorizzare tutte le informazioni necessarie per rappresentare un’immagine 3D complessa, nella forma 2D di un ologramma, senza lasciare che le proiezioni generate a diverse profondità si contaminino a vicenda. Al fine di risolvere tale problematica, gli scienziati hanno provveduto a pre-modellare i fronti d’onda per, si cita testualmente, “ridurre localmente la diffrazione di Fresnel all’olografia di Fourier, che consente l’inclusione di una fase casuale per ogni profondità senza alterare la proiezione dell’immagine a quella particolare profondità, ma elimina la diafonia a causa della quasi ortogonalità di vettori casuali di grandi dimensioni”. In tal modo, è possibile riprodurre delle proiezioni 3d dinamiche ad alto volume ed alta densità, che utilizzano ben 1.000 piani di immagine contemporaneamente, aumentando drasticamente la qualità dell’immagine resa.

Ologrammi “ascoltabili”

WHITEPAPER
Scopri la roadmap per l’impresa connessa e intelligente

Sempre nel 2019, un gruppo di ricercatori dell’Università del Sussex ha pubblicato sulla rivista Nature uno studio che ha permesso di generare un ologramma che non solo può essere visto, ma anche ascoltato (come avviene per l’ologramma inviato dalla Principessa Leila nella serie cinematografica Star Wars), grazie all’ausilio di un dispositivo chiamato Multimodal Acoustic Trap Display (o MATD).

Nello studio, gli scienziati hanno potuto riprodurre l’immagine di una farfalla che sbatte le ali intrappolando una pallina di polistirolo tra più onde sonore; il rapido movimento della pallina permette di muovere il colore, creando l’illusione che vi sia un oggetto sospeso nello spazio. Più nel dettaglio, per poter realizzare tale ambizioso obiettivo, il MATD fa uso di 256 altoparlanti, posizionati sia sopra che sotto un modulo 3d, sul quale viene riprodotta l’immagine; gli altoparlanti emettono poi degli ultrasuoni che creano delle sacche di bassa pressione nell’aria che circonda la pallina di polistirolo; la manipolazione delle onde sonore permette così di spostare la pallina nello spazio, generando una figura tridimensionale la cui forma può cambiare nel tempo, permettendo di rilevare l’oggetto come in movimento e non solo in modo statico.

Video: Multimodal Acoustic Trap Display (MATD)

In Giappone, nel 2020, tramite l’utilizzo di nanomateriali appositamente realizzati dall’Università di Tokyo per l’Agricoltura e la Tecnologia, è stato possibile testare nuove tecniche di diffrazione della luce, che hanno permesso di generare un’immagine del globo terrestre che ruota su sé stesso come se fosse sospesa in aria, senza che sia necessario utilizzare alcun tipo di superficie riflettente o visore per poterne prendere visione.

L’animazione per un ologramma di metasuperficie è stata realizzata utilizzando un approccio cinematografico”, afferma il team di ricercatori. “Le immagini time-lapsed sono state ricostruite utilizzando fotogrammi di ologrammi di metasuperficie disposti in sequenza. Una nanoapertura rettangolare Au è stata adottata come pixel meta-atomo e disposta a riprodurre la distribuzione di fase basata sull’aiuto di una fase Pancharatnam-Berry. Abbiamo disposto 48 fotogrammi di ologrammi su un substrato di 2 cm2 e misurato e valutato il ritardo dei meta-atomi fabbricati per ricostruire l’immagine olografica, dimostrando con successo il filmato con un frame rate di 30 fotogrammi al secondo”.

All’Università di Tsukuba, invece, è stato possibile creare degli ologrammi interattivi, tramite l’utilizzo di un laser ad alta velocità (un laser a femtosecondi, che può sparare raffiche da 30-270 femtosecondi, ossia un milionesimo di miliardesimo di secondi) e di un complesso sistema di telecamere e specchi, con una risoluzione finale di 200mila punti al secondo.

In sintesi, i ricercatori del Digital Nature Group, tramite un c.d. modulatore spaziale di luce (che permette di controllare il raggio nello spazio) indirizzano il fascio laser verso una serie di lenti e di specchi che, in combinazione ad uno scanner 3d, consentono di generare l’ologramma finale. L’ologramma, così generato, può essere toccato e modificato dallo spettatore (a titolo esemplificativo, lo scienziato mostra come poter spuntare una casella nell’aria!).

Video: Digital Nature Group

Ologrammi 3d grazie all’intelligenza artificiale

Obiettivo della ricerca scientifica relativa agli ologrammi non è soltanto quello di migliorarne la visibilità, ma anche di poterne intersecare le funzioni con ulteriori tecnologie innovative, come la realtà aumentata (AR), la realtà virtuale (VR) e l’intelligenza artificiale.

In particolare, uno studio condotto dai ricercatori del Massachussets Institutes of Technology (MIT), cofinanziato da Sony e pubblicato sulla rivista scientifica Nature ha provato come, grazie ad un nuovo metodo di deep learning denominato olografia tensoriale, è possibile generare un video olografico in modo istantaneo, sfruttando la capacità computazionale presente su un semplice computer.

La peculiarità dell’intelligenza artificiale creata dal MIT è quella di essere composta da tensori addestrabili, che possono apprendere come elaborare le informazioni visive e di profondità in modo simile a quanto fatto dal cervello umano.

Diversamente da quanto avviene per le immagini olografiche “tradizionali”, che richiedono, al fine di poter essere generate da un computer, un’enorme capacità computazionale e di memoria (dovendo processare per ogni pixel la profondità dell’immagine in base alla posizione dello spettatore) i ricercatori hanno scoperto che l’olografia tensoriale era invece in grado di generare ologrammi 3D da tipiche immagini generate al computer con dati di profondità, calcolati da una configurazione multi-camera, in pochi millisecondi.

Ciò è reso possibile grazie ad una rete neurale che, come detto, imita il modo in cui il cervello umano processa tutte le informazioni visive; la rete neurale è stata poi addestrata tramite un database composto da oltre 4.000 immagini generate al computer, nelle quali si indicavano per ogni singolo pixel le informazioni relative a colore e profondità, con i relativi ologrammi. Analizzando il set di dati, la rete neurale ha imparato come calcolare il modo ottimale di generare gli ologrammi, riuscendo a produrli in pochi millisecondi e utilizzando meno di un megabyte di memoria.

Liang Shi, il ricercatore a capo dello studio, ha osservato che l’uso di simulazioni fisiche per l’olografia generata al computer comporta il calcolo dell’aspetto di molti pezzi di un ologramma e quindi la loro combinazione per ottenere l’ologramma finale. Usare le tabelle di ricerca è come memorizzare una serie di pezzi di ologramma usati di frequente, ma questo sacrifica la precisione e richiede ancora il passaggio di combinazione.

In un certo senso, aggiunge, l’olografia generata dal computer è un po’ come capire come tagliare una torta. L’uso di simulazioni fisiche per calcolare l’aspetto di ogni punto nello spazio è un processo che richiede tempo e che assomiglia all’utilizzo di otto tagli precisi per produrre otto fette di torta. L’uso di tabelle di ricerca per l’olografia generata al computer è come contrassegnare il limite di ogni fetta prima del taglio. Anche se questo consente di risparmiare un po’ di tempo eliminando la fase di calcolo di dove tagliare, l’esecuzione di tutti e otto i tagli richiede ancora molto tempo.

ologramma
Foto di Huwani Zulu da Pixabay

Deep learning e reti neurali convoluzionali per gli ologrammi

Al contrario, la nuova tecnica utilizza il deep learning per capire essenzialmente come tagliare una torta in otto fette usando solo tre tagli. La rete neurale convoluzionale (n.d.a. una rete nella quale i neuroni individuali sono disposti in modo tale da emulare l’organizzazione della corteccia visiva) impara le scorciatoie per generare un ologramma completo senza dover calcolare separatamente come appare ogni pezzo dello stesso, riducendo allo stesso tempo la memoria richiesta per generarlo.

Il nuovo sistema richiede meno di 620 kilobyte di memoria e può generare 60 ologrammi 3D a colori al secondo con una risoluzione di 1.920 per 1.080 pixel su una singola GPU di livello consumer. I ricercatori potrebbero eseguirlo con un iPhone 11 Pro a una velocità di 1,1 ologrammi al secondo e su un TPU di Google Edge a una velocità di 2 ologrammi al secondo: ne consegue che, ove tale tecnologia fosse diffusa su larga scala, sarebbe in futuro possibile generare ologrammi in tempo reale su visori mobili di realtà virtuale (VR) e realtà aumentata (AR).

L’olografia 3D in tempo reale potrebbe anche aiutare a migliorare le c.d. tecniche di stampa 3D volumetrica, che creano oggetti 3D proiettando immagini su vasche di liquido, generando strutture cave complesse. Non solo: potrebbe essere utilizzata anche nella creazione di pinzette ottiche e acustiche utili per manipolare la materia a livello microscopico, così come microscopi olografici in grado di analizzare cellule, e ologrammi statici convenzionali destinati ai settori dell’arte, della sicurezza, dell’archiviazione dei dati e altro.

Il team di ricercatori afferma persino che all’odierno sistema di generazione ologrammi, potrebbe essere aggiunta la tecnologia di tracciamento oculare, al fine di snellire il processo e creare ologrammi ad alta risoluzione esclusivamente nel punto in cui gli occhi stanno guardando. O ancora, si potrebbe migliorare il sistema al fine di consentire di generare degli ologrammi che possano essere visti anche da persone con problemi legati alla vista, senza che questi utilizzino gli occhiali o si dotino di speciali lenti VR graduate.

In campo medico, l’utilizzo della tecnologia di deep learning per la creazione di immagini tridimensionali potrebbe rivoluzionare la diagnostica per immagini, creando immagini estremamente precise in tempi molto ridotti (requisito necessario, nel settore medico, per la corretta e tempestiva diagnosi).

Ologrammi e medicina: i possibili sviluppi

Le ricerche condotte sugli ologrammi e sull’intelligenza artificiale possono portare incredibili benefici alla medicina e alla diagnostica in generale, riducendo i costi e aumentando il grado di affidabilità dell’immagine restituita. Non solo: permetterà anche di generare delle simulazioni prospettiche sui pazienti.

In tal senso, il National University Health System di Singapore sta lavorando a un algoritmo che preveda i rischi di caduta per i pazienti nei reparti, partendo dall’analisi di immagini olografiche in 3D. La valutazione di tali rischi è fondamentale per prevenire cadute e lesioni correlate alle cadute per i pazienti ospedalieri.

Il medesimo gruppo di ricercatori ha sviluppato una piattaforma per la gestione dei tumori gastroesofagei che permette la condivisione dei dati del paziente e dei referti in 3D della diagnostica per immagini, al fine di ottenere consulti da team multidisciplinari anche da remoto. Piattaforme come queste sono estremamente utili per le strutture ospedaliere più piccole e periferiche, che possono ricevere consulti rapidi e raccomandazioni aggiornate sul trattamento, semplicemente inserendo i dati clinici del paziente.

Non solo: partendo da referti olografici in 3D, un algoritmo di intelligenza artificiale può analizzare accuratamente la parte posteriore dell’occhio, rilevando con estrema precisione se il paziente ha una condizione che indica la presenza di un tumore al cervello o di altre condizioni che possono comportare la perdita della vista o risultare potenzialmente letali.

Si pensi, inoltre, al beneficio che trarrebbero i medici dalla possibilità di trasferire rapidamente diagnostiche, radiografie e altri tracciati su un rendering olografico 3D.

Conclusioni

E-Guide
Fashion e luxury retail: nuove strategie grazie ad AI e customer experience
Fashion
Intelligenza Artificiale

Sinora, la tecnologia olografica, a causa degli ingenti costi connessi al suo utilizzo, è stata appannaggio di pochi: tuttavia, gli ultimi sviluppi della ricerca lasciano presagire che, in un futuro non così remoto, grazie all’intelligenza artificiale e al crescente incremento della potenza di calcolo a livello mondiale, sarà possibile realizzare dei modelli tridimensionali sempre più accurati e alla portata di tutti, a beneficio di settori strategici come la medicina e la sicurezza.

FacebookTwitterLinkedIn