Certo, i dati in tempo reale sono ora ‘democratizzati’, ma è solo l’inizio

Certo, i dati in tempo reale sono ora 'democratizzati', ma questo è solo l'inizio

Concept di dati

I dati in tempo reale sembrano essere ovunque – nella realtà aumentata, nelle gemelle digitali, nel 5G, nell’IoT, nell’IA, nell’apprendimento automatico, nei dispositivi indossabili e nella tecnologia beacon. Si potrebbe perdonare chi pensa che le imprese odierne stiano trasmettendo dati in tempo reale in ogni area di attività vitale. Stiamo arrivando – grazie in gran parte a molte soluzioni open-source come Apache Flink, Kafka, Spark e Storm, nonché alle piattaforme basate su cloud. Tuttavia, c’è ancora molto lavoro da fare prima di raggiungere il punto in cui i dati si muovono attraverso e tra le organizzazioni alla velocità della luce o di qualcosa di simile.

Prima di tutto, una chiara definizione, grazie a John Rydning di IDC: “Spesso, i termini dati in streaming e dati in tempo reale vengono utilizzati insieme e talvolta in modo interscambiabile. Sebbene non tutti i dati in streaming creati siano in tempo reale e non tutti i dati in tempo reale siano trasmessi in streaming, le organizzazioni indicano che oltre i due terzi dei casi d’uso dello streaming richiedono dati ultra-real-time o in tempo reale.”

Anche: Ogni progetto di intelligenza artificiale inizia come un progetto sui dati, ma è una strada lunga e tortuosa

Ci sono persino dati ultra-real-time in uso – e le aziende sono ansiose di far funzionare tutto questo. “La comprensione del valore della cattura e dell’elaborazione dei dati in tempo reale sta crescendo al ritmo più veloce degli ultimi tempi”, afferma Avtar Raikmo, direttore dell’ingegneria presso Hazelcast. “Con le piattaforme che eliminano la complessità per l’utente o l’ingegnere individuale, si sta accelerando l’adozione in tutta l’industria. L’innovazione, come il supporto SQL, contribuisce a democratizzare l’accesso alla stragrande maggioranza, anziché solo a pochi selezionati.”

Ci sono molti casi d’uso, tra cui “calcolare in tempo reale al margine per lo streaming audio e video, elaborazione delle immagini per l’IA e l’apprendimento automatico o persino cuffie con annullamento attivo del rumore”, afferma Raikmo. Un altro caso d’uso emergente sono le gemelle digitali, specialmente per la mobilità. “Essere in grado di catturare dati in tempo reale e telemetria da auto, camion o razzi consente alle organizzazioni di modellare scenari mentre si sviluppano. Le gemelle digitali possono essere utilizzate per ottimizzare percorsi nel mondo reale, consumo di energia o miglioramenti della guida assistita. Nel mondo dello sport, gli strateghi della Formula 1 determinano il pit-stop ottimale e i composti delle gomme per massimizzare le prestazioni in gara.”

Tuttavia, ci sono molte questioni tecniche e organizzative che ostacolano la piena realizzazione dei dati in tempo reale o ultra-real-time. “Le implementazioni dei dati in tempo reale utilizzano tipicamente tecnologie ad alte prestazioni che soddisfano i grandi volumi e l’analisi rapida richiesta per prendere decisioni istantanee”, afferma Emma McGrattan, Senior VP di ingegneria e prodotto per Actian. “Per volumi molto grandi che alcune industrie verticali, come i servizi finanziari, tendono a generare, il passaggio al tempo reale richiederà investimenti in risorse aggiuntive per hardware, software e componenti di rete.”

Anche: Come l’IA ridisegna l’industria IT in modo ‘veloce e drammatico’

Sono necessari investimenti per “aumentare la disponibilità e l’affidabilità dell’infrastruttura e dei servizi dati”, afferma McGrattan. “Per volumi inferiori, l’infrastruttura esistente sarà probabilmente in grado di essere utilizzata, con modifiche alle applicazioni per l’analisi e l’implementazione in tempo reale.”

Il processo di cattura, visualizzazione e memorizzazione dei dati in tempo reale richiede “investimenti sostanziali in componenti di infrastruttura in grado di gestire flussi di dati pesanti e complessi”, afferma Rakesh Jayaprakash, responsabile della gestione prodotto presso ManageEngine e Zoho. “Questo vale in particolare quando i flussi di dati in tempo reale richiedono un certo livello di pre-elaborazione. Purtroppo, molte organizzazioni, in particolare le PMI, non dispongono dell’infrastruttura necessaria per gestire tali elaborazioni intensive.”

Molte infrastrutture aziendali non sono pronte, e nemmeno le organizzazioni stesse. “Alcune ancora devono capire o vedere il valore del tempo reale mentre altre sono completamente d’accordo, con soluzioni progettate per lo streaming in tutta l’organizzazione”, dice Raikmo. “Combinare i dataset in movimento con tecniche avanzate come il watermarking e il windowing non è una questione banale. Richiede di correlare più flussi, combinare i dati nella memoria e produrre insiemi di risultati di stato uniti, su scala e resilienza aziendale”.

Inoltre: La rivoluzione del tempo reale è qui, ma è distribuita in modo irregolare

La buona notizia è che non tutti i dati devono essere in streaming o consegnati in tempo reale. “Le organizzazioni spesso cadono nella trappola di investire risorse per rendere ogni punto dati che visualizzano in tempo reale, anche quando non è necessario”, fa notare Jayaprakash. “Tuttavia, questo approccio può comportare costi esorbitanti e diventare insostenibile”.

“Sebbene visualizzare dati in tempo reale sia più allettante che analizzare dati di qualche minuto fa, è necessario valutare attentamente il rapporto costo-beneficio e il ROI associato alla costruzione di flussi e visualizzazioni di dati in tempo reale”, afferma Jayaprakash. “Inoltre, le organizzazioni dovrebbero esercitare la dovuta diligenza nella selezione delle metriche che desiderano trasmettere in tempo reale”.

Amy Machado dell’IDC argomenta la necessità di considerare attentamente cosa deve essere consegnato in tempo reale: “Dico sempre, ‘Lascia che il caso d’uso guidi'”, scrive in un post sul blog. “Dovrebbe indirizzare il modo in cui pensi all’architettura in tempo reale, che idealmente è un’espansione del tuo framework esistente per evitare di creare silos di dati”.

Inoltre: I dirigenti d’azienda continuano ad avere difficoltà ad sfruttare il potere dei dati

Machado elenca le domande chiave da porre riguardo alla consegna dei dati in tempo reale:

  • “Quali vantaggi aziendali speriamo di ottenere?”
  • “Quali intuizioni abbiamo bisogno di ottenere per raggiungere quegli obiettivi?”
  • “Chi ha bisogno di quelle intuizioni e dove ne hanno bisogno?”
  • “Quali altri sistemi potremmo dover integrare per contestualizzare o rendere operative le intuizioni?”

Per ottimizzare gli investimenti nei dati in tempo reale, “seleziona attentamente le metriche che richiedono veramente una segnalazione in tempo reale”, consiglia Jayaprakash. “La complessità della struttura necessaria per operare e mantenere flussi di dati in tempo reale introduce possibili punti di fallimento, rendendo necessario un personale dedicato per la risoluzione dei problemi e la manutenzione. Per ridurre al minimo i problemi di continuità dei dati derivanti da interruzioni dei flussi, è necessario implementare meccanismi di protezione, il che comporta costi complessivi più elevati”.