Il binomio è tutt’altro che scontato e affiancare tematiche più “tradizionali” legate alle infrastrutture IT con quelle più di frontiera come Machine Learning e Intelligenza Artificiale non sempre è immediato e “sexy”. Ne abbiamo discusso con Alfredo Nulli, Emea Cloud Architect di Pure Storage, in un viaggio tra Intelligenza Artificiale e storage che non può non passare per il cloud e l’hybrid IT
«La necessità di avere sistemi in grado di “reggere” workload impegnativi, in particolare nel campo dei più moderni analytics (come le analisi predittive), dell’Intelligenza Artificiale e del Machine Learning ha contribuito a rendere poco appetibile l’NFS – Network File System, un protocollo lento e ormai “dimenticato” perché per lo storage nel mondo degli analytics mostrava pesanti limiti». Una premessa, quella di Alfredo Nulli, Emea Cloud Architect di Pure Storage, che va dritta al punto “critico” dei sistemi a supporto del dato, oggi ancora più sotto pressione rispetto al passato per via della forte accelerazione che stanno avendo applicazioni di Machine Learning e Intelligenza Artificiale.
Machine Learning: bisogna minimizzare lo spostamento dei dati
Situazione che Pure Storage ha risolto con soluzioni FlashBlade che hanno reso l’accesso al file semplice, adattivo e non condizionato dalle grandezze in gioco, una infrastruttura ideale per dati non strutturati che funziona come un data lake multiprotocollo che evita di spostare i dati rendendoli disponibili sempre (in tutte le fasi di Machine Learning, per esempio). «Minimizzare lo spostamento del dato è uno degli obiettivi principali per avere infrastrutture realmente in grado di reggere operazioni come quelle di Machine Learning e, più in generale, di Intelligenza artificiale», fa presente Nulli
La tecnologia Flash «è ciò che di fatto serviva per rendere le macchine adattive – puntualizza Nulli -. Possiamo vederlo come media necessario per rendere indipendente lo storage dalla distribuzione geometrica del dato; i dischi costringevano a fare delle scelte proprio di natura geometrica per modellare lo storage in funzione dell’utilizzo (cioè della lettura) del disco. La tecnologia Flash ha permesso di fatto di eliminare il problema della distribuzione del dato».
La soluzione FlashBlade di Pure Storage ad oggi risulta particolarmente performante nel settore dell’Automotive che oggi sta giocando una importante partita competitiva internazionale nell’ambito dei veicoli self-driving; di rilievo l’utilizzo dei FlashBlade anche nel mondo della ricerca scientifica e medica, in particolare quello degli studi di genomica (che richiedono analisi avanzate su grandissime moli di dati), così come nel settore finanziario, dove le soluzioni di Intelligenza Artificiale e Machine Learning stanno trasformando lo scenario delle analisi quantistiche finanziarie, dell’automazione delle transazioni e della gestione dei rischi.
Storage on premises ma “cloud like”, adattivo e intelligente per semplificare la via all’hybrid IT
E quando si parla di geometria del dato, spostamento, memorizzazione e utilizzo, non si può oggi non affrontare l’analisi anche dalla prospettiva legata al modello cloud. «Di cloud oggi si può parlare uscendo dalle mode e si può discutere con le aziende portando sul tavolo dell’analisi il bilanciamento costi-efficacia. La domanda fondamentale è costa meno memorizzare un dato o spostarlo?», si chiede Nulli.
Il costo dello spostamento dei dati (in continuità) per avere una strategia cloud “fluida” non sempre è vantaggioso; ad incidere è il costo della rete, non tanto del cloud in sé. «Ci sono diversi tipi di costi che devono essere calcolati e sommati a quello dell’utilizzo del servizio cloud: quello della rete di telecomunicazioni (inteso come servizio di connettività) e il “charge” del service provider sulle transazioni in/out. Se poi le applicazioni non sono state scritte nella maniera più efficiente per il cloud e utilizzano e spostano quantità di dati eccessive, ecco che allora il costo di una infrastruttura cloud può diventare smisurato rispetto alla reale necessità di spostamento dei dati», fa presente Nulli.
Partendo da queste considerazioni, il concetto di hybrid cloud va “rivisto”: «sicuramente ibrido non significa spostare in una logica in/out, da qui a là, i dati con quella promessa (spesso disattesa) di flessibilità che le offerte cloud millantavano qualche anno fa. Ibrido significa raggiungere la consapevolezza che certi dati devono stare in determinati ambienti e altri possono e devono essere spostati», è la puntualizzazione di Nulli.
In quest’ottica ad assumere valore di business non è l’infrastruttura o l’ambiente cloud in sé ma il sistema operativo software che deve consentire dimensionamento e configurazioni di ambienti in modo automatico. È qui che Pure Storage intende giocare la sua partita proponendo sistemi hardware e software on premises che però si configurano “cloud like”, cioè portando su sistemi in house le stesse semplicità e automazione che caratterizzano i servizi in cloud (dimenticando quindi design, configurazioni e tuning dei sistemi).
Hybrid Storage: è il software l’elemento distintivo e abilitante
Il cuore pulsante che permette di raggiungere on premises i paradigmi di semplicità del cloud è rappresentato dal software che per Pure Storage si sostanzia con funzionalità avanzate di telemetria e analytics attraverso le quali analizzare il comportamento dei dati da cui derivare il capacity planning automatizzato. Un insieme di funzionalità che evitano di sovradimensionare i sistemi, come avveniva tradizionalmente nei processi di acquisto delle infrastrutture hardware.
Il modello ibrido si configura inoltre anche nell’integrazione: Pure One è il pilastro della gestione, il punto (software) dove avviene l’orchestrazione del dato tra on premises e cloud (cui si aggiunge l’integrazione con i sistemi di provisioning, come quelli di VMware e Microsoft). «Un importante aspetto del modello ibrido riguarda il “volting” ossia l’utilizzo del cloud come ambiente per l’archiviazione – spiega Nulli -. Guardando a queste specifiche esigenze abbiamo sviluppato alcune funzionalità (CloudSnap) che consentono di creare una copia “semi-viva” del dato per trasportarlo nativamente dallo storage on premises dentro l’ambiente del cloud provider senza utilizzare tool ad hoc di terze parti».
Volendo quindi semplificare al massimo, ciò su cui Pure Storage sta puntando sono sistemi “software driven” guidati da un sistema operativo proprietario che permette di adattare i comportamenti dell’infrastruttura in funzione dei workload applicativi (senza ridisegnare la geometria dei sistemi grazie al completo disaccoppiamento tra il media – il sistema – e la gestione effettiva dei dati). In definitiva, tutta l’intelligenza sta nel sistema operativo che rende l’infrastruttura storage adattiva rispetto alle prestazioni e ai workload permettendo “l’esperienza del cloud” anche nei data center aziendali e semplificando la via verso l’integrazione verso l’hybrid IT.