Il successo delle applicazioni di intelligenza artificiale trascina la crescita di Vast Data, che chiude un nuovo round di finanziamento, supera i 9 miliardi di dollari di valutazione e apre la filiale italiana.
Continua a ritmo serrato la crescita di Vast Data, azienda specializzata nelle infrastrutture per l’intelligenza artificiale, e in particolare per la gestione dei dati in cloud nei sistemi AI. Dopo l’apertura della filiale italiana, avvenuta il mese scorso (peraltro già con clienti attivi nel nostro Paese) l’azienda ha annunciato la conclusione di un nuovo round di finanziamento da 118 milioni di dollari, che rafforza la sua capacità di realizzare la mission societaria: portare sul mercato una nuova categoria di infrastrutture che dia ai dati un ruolo centrale nel modo in cui i sistemi informativi pensano, reagiscono e scoprono. Vast Data ha già superato il miliardo di dollari di giro d’affari, e viene valutata intorno ai 9,1 miliardi di dollari.
La sua piattaforma dati per l’IA Vast Data Platform, basata sull’architettura DASE (Disaggregated, Shared-Everything Architecture) al momento non ha concorrenti diretti sul mercato e le ha permesso di stringere partnership di peso con nomi eccellenti nel mondo dell’IA e del supercalcolo, come per esempio Nvidia e HPE. Un punto di forza è la malleabilità della piattaforma, che si adatta facilmente a utilizzi data-intensive nei più diversi settori. “Con VAST Data Platform, stiamo sfruttando un grande potenziale innovativo in settori chiave come l’industria automobilistica e aerospaziale, la sfera agricola, la sanità e le scienze della vita, oltre al mondo accademico e all’ambito dei servizi finanziari” ha detto fra l’altro Renen Hallak, CEO di Vast, in occasione dell’apertura della sede italiana della società.
Tutto parte da un’intuizione
La storia di Vast Data inizia, come capita spesso per le aziende Usa, con una intuizione dei due fondatori, Renen Hallak (CEO) e Shachar Fienblit (VP), che già nel 2015 ipotizzarono un prossimo cambiamento delle esigenze di storage nei data center. Secondo loro, presto sarebbero cresciuti enormemente utilizzi che necessitavano di accesso estremamente veloce a enormi quantità di dati, spesso non strutturati. Per rispondere a queste future esigenze nel 2016 Hallak e Finblit fondarono Vast Data e iniziarono a creare le basi dell’architettura di gestione dati DASE, implementata nella Vast Data Platform. E questo nonostante nel 2016 non esistesse ancora, di fatto, l’hardware necessario per implementare concretamente quei concetti.
A distanza di qualche anno, l’emergere di tutta una serie di applicazioni con altissime richieste di traffico dati non strutturato ha dato loro ragione. Dall’analisi finanziaria per gli hedge found alle applicazioni healthcare di analisi radiografica e genomica, dall’esame dei dati IioT per la manutenzione predittiva di macchinari alla messa in linea di statistiche sportive, applicazioni che richiedono accesso intensivo ai dati da parte di multipli server cloud sono ormai la norma. Per non parlare dell’applicazione che ha di fatto rivoluzionato il mercato quest’anno, ovvero l’intelligenza artificiale generativa. Quest’ultima, da sola, ha spinto tutti gli analisti a rivedere verso l’alto le previsioni di mercato. Anche Lisa Su, Ceo di AMD, ha recentemente dichiarato che si aspettavano per gli acceleratori AI un mercato da 180 miliardi di dollari nel 2027, ma che avevano dovuto rivedere le stime portandole a 400 miliardi.
L’architettura della Vast Data Platform
Al centro dellaVast Data Platform c’è DASE, Disaggregated, Shared Everything Architetture. Fondamentalmente, l’idea di base della piattaforma (che potremmo definire una sorta di sistema operativo dedicato allo storage e al suo utilizzo) è di dare intelligenza ai dati e di metterli tutti a disposizione di tutti i sistemi di calcolo connessi. In pratica, man a mano che le informazioni non strutturate vengono inserite nel sistema (tramite uno qualsiasi dei protocolli industry standard supportati), DASE aggiunge uno strato contestuale che fornisce ai dati una struttura e un significato. Pensate a una sorta di indicizzazione intelligente, automatica e in real-time, che consente prestazioni elevatissime quando si tratta di effettuare analisi sui dati memorizzati.
Ma non c’è solo questo: la piattaforma ottiene prestazioni di prim’ordine anche nei dati strutturati, tipo i classici transazionali, fornendo la possibilità di effettuare query per colonne 20 volte più velocemente dei sistemi tradizionali. Il tutto anche per dati che fluiscono in real-time.
Da un punto di vista strutturale, tutti i dati fanno capo allo stesso namespace, ovunque si trovino, su cloud come on premise. Questo permette di accedere in tempo reale a qualsiasi dato memorizzato, ovunque si trovi e ovunque si trovi il computer di query. Sincronizzazione e locking sono gestiti automaticamente in modo granulare per assicurare la consistenza del data base.
Dal punto di vista dell’architettura, Vast Data Platform ha una struttura modulare che conta su un Data store per memorizzare i dati in modo ottimizzato, un Data base per effettuare query, un Data Space che gestisce la logica e un Data engine che supporta le applicazioni basate sui dati (un esempio potrebbe essere la guida autonoma).
Ovviamente, per ottenere un alto livello di prestazioni real-time su enormi quantità di dati in cloud è necessario un hardware adeguato. Per questo la piattaforma di Vast Data richiede dischi SSD, interfacce NVME e una rete di interconnessione multipunto-multipunto ad altissima velocità, tipicamente un data fabric come Infiniband (ma anche Ethernet 400G o similari) reso compatibile NVME tramite tecnologia NVMe-oF (NVMe Over Fabric).
Un case study italiano
L’apertura della filiale italiana, annunciata alla fine di novembre, è un ulteriore passo nello sviluppo di Vast Data sul mercato europeo. Dove, comunque, l’azienda contava già numerosi clienti. Per il nostro Paese, significativa è l’esperienza dell’Università di Pisa, che sta passando sulla piattaforma Vast Data i suoi 4 data center, con quasi 30mila core di calcolo e oltre 2 Petabyte di storage.
L’università sta aumentando gli investimenti su hardware per il deep learning e il machine learning, e ha recentemente ridisegnato la rete di interconnessione dei sistemi di calcolo scientifico sfruttando tecnologie Nvidia Mellanox da 200/400Gbps. La piattaforma Vast Data ha anche permesso di unire e rendere complementari due mondi, quello del cloud privato amministrativo e quello dell’High Performance Computing, prima completamente separati, con tempi di installazione e messa in produzione brevissimi.
Vast Data in Italia
Nonostante il successo, il nome Vast Data rimane conosciuto solo agli “addetti ai lavori”. Il fatto è che l’azienda lavora principalmente “dietro le quinte”, ovvero tramite partner che poi portano le soluzioni ai clienti. UniPisa, per esempio, è seguita dall’emiliana E4 Computer Engineering. E a livello globale, una partnership di peso riguarda HPE – il suo GreenLake for Data è, di fatto, una versione Oem della piattaforma Vast Data.
“La nostra presenza in Italia rappresenta la forte volontà dell’azienda di investire nel nostro mercato per costruire un ecosistema di partnership e collaborazioni che ci consentiranno di supportare al meglio l’innovazione, la competitività e il business dei nostri clienti – ha detto Roberto Dognini, Regional Sales Director Italy, VAST Data, in occasione dell’apertura della filiale italiana – Siamo qui per aiutare le aziende e le eccellenze della Ricerca e della Pubblica Amministrazione italiana a liberare il pieno potenziale dei loro dati”.
Nella foto di apertura, in ordine da sinistra verso destra: Christopher Huggins – Managing Director of Sales (Europe and Latin America) and Senior Director – International (EMEA & APJ) Alliances; Roberto Dognini – Regional Sales Director Italy; Renen Hallak – CEO e Co-Founder; Andrea Tosato – SR. Systems Engineer.