Calcolo ottico, qual è lo stato dell’arte e come viene impiegato nell'AI

L’elaborazione dei dati fotonici, senza il ricorso agli elettroni, è particolarmente indicata nell’era del deep learning; permette di ridurre drasticamente il consumo di energia delle reti neurali. Ecco alcuni studi attualmente in corso

La tecnologia dell’informazione si basa, attualmente, sulla divisione dei compiti: i fotoni trasportano i dati e gli elettroni li elaborano. Ma, prima dell’avvento delle fibre ottiche, gli elettroni facevano entrambe le cose e qualcuno spera di completare la transizione facendo in modo che i fotoni non solo trasportino i dati ma li elaborino anche. Il cosiddetto “calcolo ottico”.

A differenza degli elettroni, i fotoni (che sono elettricamente neutri) possono incrociarsi l’un l’altro senza interagire, quindi le fibre di vetro possono gestire molti segnali simultanei in un modo che i fili di rame non possono fare. Un computer ottico potrebbe anche fare molti calcoli allo stesso tempo. L’uso dei fotoni riduce anche il consumo energetico. La resistenza elettrica genera calore, che spreca energia. Il passaggio dei fotoni attraverso mezzi trasparenti è privo di resistenza.

Indice degli argomenti:

Cosa richiede il calcolo ottico

Perché il calcolo ottico avvenga, tuttavia, l’architettura consolidata dell’elaborazione elettronica digitale dovrebbe essere sostituita da componenti ottici equivalenti. O forse no. Si lavora su una nuova architettura ottica che utilizza il calcolo analogico anziché digitale (cioè, codifica i dati come un segnale continuo piuttosto che come “bit” discreti). Al momento, questa architettura è più adatta a risolvere una particolare classe di problemi, quelli di una branca della matematica chiamata algebra lineare. Ma questo è un mercato potenzialmente enorme, perché l’algebra lineare è fondamentale, tra le altre cose, per le reti neurali artificiali e, a loro volta, sono fondamentali per l’apprendimento automatico e quindi per l’intelligenza artificiale.

Reti neurali e potere della matrice

L’algebra lineare manipola le matrici. Queste sono griglie di numeri (che rappresentano coefficienti di equazioni simultanee) che possono essere sommate e moltiplicate un po’ come singoli numeri. Tra le cose che possono essere descritte dalle matrici ci sono le equazioni che governano il comportamento della radiazione elettromagnetica (come la luce), scoperte nel XIX secolo da James C. Maxwell. La sottostante natura maxwelliana della luce rende facile, utilizzando opportuni dispositivi di modulazione, codificare i dati della matrice in fasci di luce e quindi manipolare tali dati.

Le reti neurali artificiali sono programmi che rappresentano strati di nodi, le cui connessioni rappresentano numeri in matrici. I valori di questi cambiano in risposta ai segnali in arrivo in un modo che si traduce nella moltiplicazione della matrice. I risultati vengono passati al livello successivo per un altro ciclo di elaborazione, e così via, fino ad arrivare a un livello di output finale, che li sintetizza in una risposta. Il risultato è quello di consentire a una rete di riconoscere e conoscere i modelli nei dati di input.

L’idea di rendere ottiche le reti neurali non è nuova. Risale al 1990. Ma solo ora è nata la tecnologia per rendere il calcolo ottico commercialmente praticabile. Una delle persone che ha osservato questa transizione è Demetri Psaltis, ingegnere elettrico allora al California Institute of Technology (Caltech) e ora al Politecnico federale svizzero di Losanna. È stato tra i primi a utilizzare le reti neurali ottiche per il riconoscimento facciale.

Le reti neurali degli inizi di Psaltis erano poco profonde; avevano solo uno o due strati e poche migliaia di nodi. Oggi, le cosiddette reti di deep learning possono avere più di 100 livelli e miliardi di nodi. Nel frattempo, gli investimenti dell’industria delle telecomunicazioni – la parte che trasporta i dati attraverso le fibre ottiche – hanno reso possibile produrre e controllare sistemi ottici molto più complessi di quelli del passato.

Il calcolo ottico permette di ridurre drasticamente il consumo di energia delle reti neurali

Questa è la spinta tecnologica; l’attrazione finanziaria deriva dall’eliminazione del costo della grande quantità di elettricità consumata dalle reti moderne man mano che le quantità di dati che gestiscono diventano sempre più grandi.

La maggior parte degli sforzi per costruire reti neurali ottiche non hanno abbandonato completamente gli elettroni, ma conservano pragmaticamente l’elettronica dove appropriato. Ad esempio, Lightmatter e Lightelligence, due aziende di Boston, nel Massachusetts, stanno costruendo “modulatori” ibridi che moltiplicano le matrici insieme manipolando un segnale codificato otticamente in base ai numeri restituiti elettronicamente. Ciò ottiene il vantaggio del parallelismo per l’ingresso ottico (che può essere 100 volte quello che l’elettronica permetterebbe) mentre utilizza kit più convenzionali come quello che Nicholas Harris, fondatore di Lightmatter, descrive come il burattinaio.

I modulatori stessi sono fatti di silicio. Sebbene questo non sia il miglior materiale in assoluto per la modulazione della luce, è di gran lunga il migliore sviluppato per l’elettronica. L’uso del silicio consente di realizzare chip ibridi con apparecchiature progettate per quelli convenzionali, offrendo anche una nuova prospettiva di vita. Perché, come osserva Maurice Steinman, vicepresidente Ingegneria di Lightelligence, sebbene l’aumento decennale delle prestazioni dell’elettronica stia rallentando, “siamo solo all’inizio del ridimensionamento generazionale sull’ottica”.

Utilizzare una macchina completamente ottica

Ryan Hamerly e il suo team del Massachusetts Institute of Technology (l’organizzazione da cui Lightelligence e Lightmatter sono stati scorporati) cercano di sfruttare il basso consumo energetico dei dispositivi ottici ibridi per altoparlanti intelligenti, droni leggeri e persino auto a guida autonoma. Un altoparlante intelligente non ha le capacità computazionali ed energetiche per eseguire programmi di deep learning da solo. Invia quindi una versione digitalizzata di ciò che ha sentito su Internet a un server remoto, che esegue l’elaborazione. Il server restituisce quindi la risposta.

Tutto questo richiede tempo, però, ed è insicuro. Un chip ottico inserito in un tale altoparlante potrebbe eseguire l’algebra lineare necessaria lì e poi, con un basso consumo energetico e senza dover trasferire dati potenzialmente sensibili altrove.

Altri ricercatori, tra cui Ugur Tegin, al Caltech, ritengono che il vero vantaggio del calcolo ottico sia la sua capacità di gestire grandi set di dati. Al momento, ad esempio, i sistemi di riconoscimento delle immagini sono addestrati su immagini a bassa risoluzione, perché le versioni ad alta risoluzione sono troppo grandi per essere gestite in modo efficiente, se non del tutto. Finché c’è un componente elettronico nel processo, c’è una larghezza di banda limitata. La risposta di Tegin è di rinunciare del tutto all’elettronica e utilizzare una macchina completamente ottica.

Ciò si è tuttavia rivelato complicato, poiché ciò che consente alle reti neurali di apprendere abbastanza bene qualsiasi modello lanciato contro di loro è l’uso, oltre a tutta l’elaborazione lineare, di una funzione non lineare in ciascuno dei loro nodi. Impiegare solo funzioni lineari significherebbe che solo i modelli lineari potrebbero essere appresi.

Fortunatamente, sebbene la luce si comporti per lo più in modo lineare, c’è un’eccezione. Questo, spiega Tegin, avviene quando un impulso estremamente breve e intenso viene illuminato attraverso una cosiddetta fibra multimodale, che sfrutta molteplici proprietà della luce per migliorare la sua capacità di trasportare segnali paralleli. In queste circostanze, il passaggio dell’impulso modifica le proprietà del materiale stesso, alterando il comportamento della luce di passaggio in modo non lineare.

Tegin ha sfruttato questa caratteristica in quella che è, salvo il suo livello di output finale, una rete interamente ottica, “Scalable Optical Learning Operator – SOLO”. Lo descrive in un articolo pubblicato l’anno scorso su Nature Computational Science. È in grado di mantenere tutte le informazioni in forma ottica fino al loro arrivo all’ultimo livello, quello in cui emerge la risposta. Solo allora viene convertito in forma elettronica, per l’elaborazione da parte della rete elettronica più semplice e più piccola che costituisce questo strato.

Viene mostrata la dipendenza dai regimi di propagazione dell’impulso in un MMF GRIN, causata dall’aumento della potenza di picco ottica in ingresso. a, Risultati della regressione lineare misurata degli output SOLO per il set di dati sinc con etichette indicate. Ogni esempio sinc illustrato contiene 3.000 punti dati. b, Un’illustrazione della differenza di propagazione per casi lineari (bassa potenza di picco) e non lineari (alta potenza di picco) in un MMF GRIN con lunghezze del periodo di auto-imaging di dieci (10ρ).

Calcolo ottico: elaborare le matrici senza coinvolgere gli elettroni

Nel frattempo, presso l’Università della California, Los Angeles, Aydogan Ozcan sta adottando un altro approccio all’elaborazione di matrici completamente ottiche. In un articolo pubblicato su Science nel 2018, lui e i suoi collaboratori descrivono come creare dispositivi ottici che elaborano le matrici senza coinvolgere affatto gli elettroni.

La tecnica qui sta nell’uso di sottili fogli di vetro appositamente fabbricati, ciascuno delle dimensioni di un francobollo, disposti uno sopra l’altro in pile analoghe agli strati di una rete neurale artificiale. Insieme, questi fogli diffrangono la luce in entrata nel modo in cui una tale rete neurale elaborerebbe un’immagine digitale.

In questo caso, l’ottica funziona passivamente, come l’obiettivo di una fotocamera, piuttosto che ricevere un feedback attivo. Ozcan afferma che ciò offre vantaggi in termini di sicurezza; il sistema non acquisisce mai immagini o invia i dati grezzi, ma solo il risultato dedotto. C’è un compromesso, però: poiché i fogli non possono essere riconfigurati, se l’algoritmo di inferenza cambia, devono essere sostituiti.

Resta da vedere fino a che punto arriverà il calcolo ottico di questo tipo. Ma l’intelligenza artificiale basata sul deep learning si sta sviluppando rapidamente, come dimostra il recente ChatGPT, il programma che può produrre una prosa passabile (e persino poesia) con solo un piccolo suggerimento. È quindi probabile che l’hardware in grado di accelerare ulteriormente tale sviluppo trovi il favore. Quindi, dopo decenni di stasi, il futuro del calcolo ottico sembra ora piuttosto luminoso.

Calcolo ottico, qual è lo stato dell’arte e come viene impiegato nell’AI

Cosa richiede il calcolo ottico

Reti neurali e potere della matrice

Il calcolo ottico permette di ridurre drasticamente il consumo di energia delle reti neurali

Utilizzare una macchina completamente ottica

Calcolo ottico: elaborare le matrici senza coinvolgere gli elettroni

Articoli correlati

Calcolo ottico, qual è lo stato dell’arte e come viene impiegato nell’AI

Cosa richiede il calcolo ottico

Reti neurali e potere della matrice

Il calcolo ottico permette di ridurre drasticamente il consumo di energia delle reti neurali

Utilizzare una macchina completamente ottica

Calcolo ottico: elaborare le matrici senza coinvolgere gli elettroni

Articoli correlati

Deep Learning, cos’è l’apprendimento profondo, come funziona e quali sono i casi di applicazione

ChatGPT di OpenAI: tutto sul chatbot più famoso al mondo

Codice Rss

Codice Rss