Prodotto e tecnologia

Le funzioni ML-Powered di Snowflake migliorano la velocità e la qualità delle decisioni

Le funzioni ML-Powered di Snowflake migliorano la velocità e la qualità delle decisioni

Il lavoro dei data analyst non è facile. Per stare al passo con la crescita esponenziale dei dati nella propria azienda, devono conciliare il lavoro necessario per ricavare insight accurati con la necessità di prendere decisioni rapide.

Analizzare in profondità i dati per capire e spiegare rapidamente le anomalie richiede impegno e tempo prezioso. Gli strumenti di analisi comunemente utilizzati, che dovrebbero semplificare il loro lavoro, non sempre sono in grado di gestire i volumi di dati quotidiani. Gli analisti faticano a svolgere i loro compiti e allo stesso tempo garantire che i dati utilizzati nelle analisi avanzate siano elaborati in modo sicuro.

Gli algoritmi di machine learning (ML) possono risolvere alcune di queste sfide. Tuttavia, la mancanza delle necessarie competenze di programmazione e data science e la complessità dell’infrastruttura di calcolo rallentano l’adozione del ML da parte degli analisti. 

Noi di Snowflake siamo convinti che gli analisti possano sfruttare i vantaggi del ML se riusciremo a eliminare parte della complessità dei framework ML.

È per questo che al Summit 2023 abbiamo annunciato varie funzioni di ML-Powered Analysis in public preview: queste familiari funzioni SQL utilizzano il ML per aiutare gli analisti a prendere più rapidamente decisioni migliori. In questo blog spiegheremo nei dettagli come queste funzioni ML-Powered semplificano il lavoro di analisi dei dati.

Previsione

Ora gli analisti possono usare la nuova funzione di Forecasting per produrre previsioni sulle serie temporali più accurate, con gestione automatica della stagionalità, della scalabilità e altro ancora.

Questa funzionalità consente di addestrare i modelli ML per produrre previsioni su base continuativa. Possono inoltre generare una stima prevista e una gamma di stime, ossia intervalli di previsione, entro cui è probabile che siano comprese le previsioni. 

Questa funzionalità semplifica, ad esempio, il lavoro dei data analyst che devono stimare le entrate future e vogliono prevedere in modo accurato i volumi di vendita per ogni punto vendita senza bisogno di chiedere aiuto al team di data science.

Con queste funzioni, gli analisti possono generare previsioni per una serie temporale o per più categorie all’interno di una serie temporale. Ad esempio, se lavori nel retail, invece di prevedere le vendite aggregate di un articolo in tutti i punti vendita puoi generare previsioni per ciascun punto vendita. Il Forecasting consente di ottenere maggiore granularità per ogni previsione, con solo una semplice riga di codice in più.

La qualità delle previsioni può essere ulteriormente migliorata includendo variabili esogene, sia quantitative che qualitative. Ad esempio, se sai che le festività hanno un forte impatto sul volume delle vendite retail dell’azienda, l’inclusione delle feste come variabile esogena dovrebbe migliorare l’accuratezza delle tue previsioni. 

La funzione consente anche di generare previsioni per orizzonti temporali personalizzati, ad esempio 4 ore, 1 giorno o 7 giorni. Questa flessibilità dovrebbe aiutarti a ottenere le previsioni che ti servono con tempistiche specifiche senza bisogno di coinvolgere il tuo team di data science. 

Rilevamento delle anomalie

Ora è possibile utilizzare il ML per identificare gli outlier e attivare gli avvisi con la nuova funzione Anomaly Detection. La funzione consente anche di trovare eventi outlier in cui cercare attività sospette o situazioni che hanno poche probabilità di ripetersi e devono essere escluse dalle analisi future.

Anomaly Detection prevede specificamente le anomalie per una singola serie temporale o per più categorie all’interno di una serie temporale. Questo metodo di rilevamento delle anomalie basato su ML è utile se vuoi sostituire le soglie statiche per l’identificazione degli outlier con un modello che crea una baseline intelligente e dinamica per i tuoi dati.

Per poter controllare il numero di falsi positivi generati dalla funzione, puoi regolare le dimensioni dell’intervallo di previsione utilizzato per identificare le anomalie. Potrai poi utilizzare task e avvisi di Snowflake per ricevere automaticamente una notifica quando viene identificata un’anomalia, come illustrato di seguito.

Esplorazione delle dimensioni

Ora gli analisti possono utilizzare il ML per identificare rapidamente le dimensioni che concorrono alla variazione di una determinata metrica in due diversi intervalli di tempo definiti dall’utente. Se compare un’anomalia in una metrica aziendale chiave, come le vendite o l’utilizzo, è importante conoscere i fattori che contribuiscono a produrla e trovare la causa principale. Contribution Explorer estrae milioni di combinazioni di dimensioni con i rispettivi valori per trovare le dimensioni e i valori (ossia i “segmenti”) che presentano il massimo livello di imprevedibilità, ad esempio, se ti accorgi che un determinato cliente in una certa regione ha improvvisamente smesso di utilizzare il tuo prodotto. 

In realtà puoi usare la funzione Contribution Explorer per tenere sotto controllo una metrica alla ricerca di tesori nascosti, anche se a livello aggregato non sono evidenti anomalie. Ad esempio, anche se le vendite risultano complessivamente nella norma, le vendite a due clienti diversi potrebbero essere rispettivamente aumentate e diminuite nello stesso periodo.

Che cosa rende uniche le funzioni ML-Powered di Snowflake?

Elasticità, automazione, governance dei dati e altro ancora

Quando si utilizzano le funzioni ML-Powered di Snowflake, è facile scalare da una a milioni di combinazioni dimensione-valore, grazie all’elasticità e all’automazione del motore Snowflake. Inoltre puoi integrare chiamate alle funzioni Forecasting, Anomaly Detection e Contribution Explorer nelle tue pipeline di dati come faresti con qualsiasi altra funzione SQL. Utilizzando queste funzioni con task e avvisi di Snowflake, puoi addestrare automaticamente nuovi modelli ogni settimana man mano che ricevi nuovi dati, generare previsioni ogni giorno o ogni ora (secondo necessità) e ricevere avvisi quando viene rilevata un’anomalia da investigare.

Indipendentemente dal modo in cui usi le funzioni ML-Powered, puoi contare sulla governance dei dati uniforme di Snowflake per tutti gli input e gli output di funzione. 

Gamma di funzionalità ML

Le funzioni ML-Powered completano le funzioni ML di Snowpark per i data scientist. Le prime si occupano dell’addestramento e della valutazione di modelli e altro, con un minimo sforzo per l’analista o il decision maker, mentre le seconde offrono al data scientist una serie di strumenti ricca e flessibile per costruire i propri modelli. 

Insieme offrono una gamma di scelte in base alla natura del problema e all’entità del lavoro di data science che vuoi dedicare alla sua soluzione.

Estrai insight per il machine learning da strumenti di BI come Sigma

Siamo orgogliosi della nostra partnership con Sigma, uno strumento di BI che supporta le funzioni di ML-Powered Analysis di Snowflake e fornisce agli utenti aziendali un’interfaccia facile da usare per estrarre insight dal ML. Fornisce un front end per le funzioni Time Series Forecasting e Contribution Explorer di Snowflake. 

Abilitando queste funzioni nel tuo account Snowflake e consentendo l’accesso al ruolo di Sigma, puoi utilizzare i data set Sigma come punto di partenza semplificato per l’analisi sia tabulare che visiva. Per utilizzare Time Series Forecasting o Contribution Explorer, identifica la tabella o il data set desiderato, raggruppa i dati al livello di granularità che preferisci e crea metriche aggregate da esplorare. Prepara la tabella, crea una vista warehouse, definisci un data set con CustomSQL in base a tale vista e applica la funzione corrispondente utilizzando la sintassi disponibile. 

Time Series Forecasting produce una serie di previsioni su base temporale. Contribution Explorer fornisce un elenco ordinato dei segmenti che hanno contribuito maggiormente alla crescita della metrica chiave. Entrambi i data set possono essere integrati in modo trasparente nelle cartelle di lavoro, consentendo la visualizzazione, l’esplorazione e l’unione con altre tabelle del warehouse. Per una maggiore interattività, sostituisci le variabili statiche in Custom SQL con parametri, per consentire agli utenti di modificare le funzioni all’interno della cartella di lavoro.

Previsione

Esplorazione delle dimensioni

Questo data set può essere utilizzato in modo trasparente in qualsiasi cartella di lavoro, consentendo di visualizzare, esplorare e unire facilmente i dati con altre tabelle nel tuo warehouse. Prova Sigma.

Il futuro

I feedback iniziali dei nostri clienti ci hanno aiutati a estendere le funzioni descritte sopra e ampliare il nostro set di funzionalità in direzioni nuove ed entusiasmanti. Il primo utilizzo delle funzioni Anomaly Detection e Contribution Explorer sono le serie temporali, ma non devi necessariamente fermarti lì. Puoi applicarle ad altri dati, ad esempio per trovare gli outlier tra i clienti o per confrontare coorti di utenti alla ricerca dei segmenti più interessanti che contribuiscono a differenziare le coorti. Al momento stiamo appunto lavorando all’ampliamento dei dati analizzabili con le funzioni ML-Powered. 

Nell’espandere ulteriormente queste funzionalità, stiamo cercando clienti che desiderino metterle alla prova e farci avere i loro feedback. Continua a seguire questo blog e parla con il tuo account team per accedere alle preview future quando saranno disponibili. E condividi qui i tuoi casi d’uso! Il potenziale futuro del ML è quasi illimitato: le nuove funzioni ML ti permetteranno di fare ancora di più per ottenere risultati aziendali migliori, senza dover stare al passo con i ritmi della ricerca nel campo del machine learning.

Per saperne di più sulle funzioni di ML-Powered Analysis, consulta la documentazione di Snowflake.

Condividi articolo

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Start your 30-DayFree Trial

Try Snowflake free for 30 days and experience the AI Data Cloud that helps eliminate the complexity, cost and constraints inherent with other solutions.