Database cloud, Oracle MySQL HeatWave supporta il machine learning

MySQL HeatWave ML automatizza il ciclo di vita del machine learning, mentre l'eliminazione di ETL riduce la complessità delle applicazioni database.

database

MySQL HeatWave, il servizio di database cloud di Oracle ora supporta il machine learning. Questa nuova funzionalità si va ad aggiungere all’elaborazione delle transazioni e alle funzioni analitiche precedentemente disponibili.

Ricordiamo che MySQL HeatWave ML automatizza il ciclo di vita dell’apprendimento automatico e memorizza tutti i modelli addestrati all’interno del database MySQL, eliminando la necessità di spostare i dati o il modello in uno strumento o in un servizio ad hoc. L’eliminazione di ETL riduce la complessità delle applicazioni, diminuisce i costi e migliora la sicurezza dei dati e del modello stesso. HeatWave ML automatizza completamente il processo di addestramento e crea un modello con l’algoritmo migliore, le funzioni ottimali e gli iperparametri ottimali per un determinato set di dati e un’attività specifica. Tutti i modelli generati da HeatWave ML possono fornire spiegazioni sul modello e sulle previsioni.

Le novità in dettaglio

Più in dettaglio, tutte le diverse fasi della creazione di un modello con HeatWave ML sono completamente automatizzate e non richiedono alcun intervento da parte degli sviluppatori. Ne risulta un modello ottimizzato e più accurato, che non richiede alcuna attività manuale e il cui processo di addestramento viene sempre completato. Addestramento completamente automatizzato sui modelli: tutte le diverse fasi della creazione di un modello con HeatWave ML sono completamente automatizzate e non richiedono alcun intervento da parte degli sviluppatori.

database

Ne risulta un modello ottimizzato e più accurato, che non richiede alcuna attività manuale e il cui processo di addestramento viene sempre completato. Altri servizi di database cloud come Amazon Redshift offrono l’integrazione con funzionalità di machine learning in servizi esterni, che richiedono molti input manuali da parte degli sviluppatori durante il processo di addestramento per l’apprendimento automatico.

La spiegazione del modello consente invece agli sviluppatori di comprendere il comportamento di un modello. HeatWave ML integra sia la spiegazione del modello sia le spiegazioni di previsione come parte del processo di addestramento del modello. Di conseguenza, tutti i modelli creati da HeatWave ML possono offrire spiegazioni del modello e delle inferenze senza che occorrano dati sull’addestramento al momento della spiegazione dell’inferenza. Oracle ha perfezionato le tecniche di spiegazione esistenti per migliorare le prestazioni, l’interpretabilità e la qualità.

L’ottimizzazione degli iperparametri

HeatWave ML implementa un nuovo algoritmo di riduzione basato sulla ricerca per l’ottimizzazione degli iperparametri. Ciò consente l’esecuzione parallela della ricerca con parametri ipertestuali senza compromettere l’accuratezza del modello. L’ottimizzazione degli iperparametri è la fase di addestramento del modello di machine learning più dispendiosa in termini di tempo.

Per determinare l’algoritmo di machine learning migliore per l’addestramento, HeatWave ML utilizza i modelli proxy, modelli semplici che mostrano le proprietà di un modello completo. Sfruttando un semplice modello proxy, la selezione degli algoritmi viene effettuata in modo molto efficiente senza perdita di accuratezza.

Durante l’addestramento del modello, HeatWave ML campiona una piccola percentuale di dati per migliorare le prestazioni. Questa campionatura viene eseguita in modo tale che tutti i datapoint rappresentativi vengano acquisiti nel set di dati di esempio.

La selezione delle funzioni consente infine di determinare gli attributi dei dati di addestramento che influenzano il funzionamento del modello di apprendimento automatico durante l’esecuzione delle previsioni. Le tecniche disponibili in HeatWave ML per la selezione delle funzioni sono state addestrate su un ampio numero di set di dati relativi a più domini e applicazioni. Dalle statistiche e meta informazioni raccolte, HeatWave ML è in grado di identificare in modo efficiente le funzioni pertinenti in un nuovo set di dati.

Oltre il machine learning

Oltre alle funzionalità di machine learning, Oracle ha lanciato altre innovazioni nel servizio MySQL HeatWave. L’elasticità in tempo reale consente di eseguire l’upsize e il downsize del cluster HeatWave su qualsiasi numero di nodi, senza tempi di inattività o di sola lettura e senza la necessità di ribilanciare manualmente il cluster. È inclusa anche la compressione dei dati, che permette di elaborare il doppio di dati per nodo e ridurre i costi di quasi il 50%, pur mantenendo lo stesso rapporto tra prezzo e prestazioni. Infine, la nuova funzionalità “pausa e ripresa” consente di sospendere HeatWave per risparmiare sui costi. Alla ripresa, i dati e le statistiche necessarie per MySQL Autopilot vengono ricaricati automaticamente in HeatWave.

HeatWave ML è incluso nel servizio cloud database MySQL HeatWave, in tutte le 37 region Oracle Cloud Infrastructure (OCI).