7 modi per assicurarti che i tuoi dati siano pronti per l’IA generativa

7 modi per garantire che i tuoi dati siano adeguati per l'Intelligenza Artificiale generativa

Blocchi di dati AI impilati insieme

Tutti vogliono sfruttare il potere dell’intelligenza artificiale (AI) generativa e dei modelli linguistici complessi, ma c’è un problema. Raggiungere le aspettative elevate dell’AI richiede dati validi e di qualità – e qui molte organizzazioni falliscono.

Un recente rapporto di McKinsey, guidato dagli autori Joe Caserta e Kayvaun Rowshankish, sottolinea che c’è una pressione implacabile nel “fare qualcosa con l’AI generativo”. Tuttavia, questa pressione comporta altri problemi: “Se i tuoi dati non sono pronti per l’AI generativa, la tua azienda non è pronta per l’AI generativa.”

Inoltre: Se l’AI è il futuro della tua azienda, dovrebbe essere il CIO a comandare?

Gli autori del rapporto suggeriscono che i responsabili IT e i gestori dei dati “dovranno sviluppare una visione chiara delle implicazioni dei dati per l’AI generativa”. I dati potrebbero essere consumati tramite servizi preesistenti tramite interfacce di programmazione delle applicazioni o modelli aziendali, il che richiederà “una strategia sofisticata di etichettatura e classificazione dei dati, così come investimenti più significativi”.

Secondo Caserta e il suo team, la sfida più grande è la capacità dell’AI generativa di lavorare con dati non strutturati, come le chat, i video e il codice. “Le organizzazioni dei dati hanno tradizionalmente avuto capacità di lavorare solo con dati strutturati, come i dati nelle tabelle.”

Inoltre: Le aziende hanno bisogno di un nuovo modello operativo per competere in un’economia alimentata dall’AI

Questo cambiamento nella gestione dei dati significa che le organizzazioni devono ripensare l’architettura dei dati complessiva che supporta le iniziative di AI generativa. “Anche se potrebbe sembrare una notizia vecchia, le falle nel sistema che le aziende potevano permettersi in passato diventeranno grandi problemi con l’AI generativa. Molti dei vantaggi dell’AI generativa non saranno semplicemente possibili senza una solida base di dati”, avvertono.

In tutta l’industria, sempre più leader esprimono preoccupazione per la capacità delle aziende di gestire l’enorme flusso di dati necessario per gestire sfide emergenti come l’AI generativa. “Le trasformazioni digitali, guidate da un’innovazione implacabile e progressi tecnologici, comportano un cambiamento nel modo in cui operano le organizzazioni”, afferma Jeff Heller, vice presidente di tecnologia e operazioni presso Faction, Inc.

Inoltre: 4 modi in cui l’AI generativa può stimolare l’economia

“In questo ambiente in rapida evoluzione, praticamente ogni dipartimento, dalla ricerca e sviluppo alle funzioni operative quotidiane, sta vivendo una notevole espansione, con la proliferazione di dispositivi e tecnologie all’avanguardia.”

Inoltre, l’AI non è l’unico fattore che spinge la necessità di architetture dati più efficaci e reattive. “I clienti continueranno a esigere servizi e comunicazioni personalizzati, che naturalmente dipendono pesantemente da dati accurati”, afferma Bob Brauer, fondatore e CEO di Interzoid.

Inoltre: 5 modi per vendere la tua idea rivoluzionaria al resto dell’azienda

“Una crescente dipendenza da strumenti di analisi e visualizzazione, vitali per decisioni strategiche, richiederà una forte dipendenza dai dati. E mano a mano che l’intelligenza artificiale diventa più prominente, i dati diventano essenziali come base per l’addestramento di questi modelli di AI”.

Il messaggio, suggerisce Heller, è chiaro – è giunto il momento per le aziende di sviluppare strategie e adottare tecnologie avanzate per “assicurarsi che i dati rimangano un valore inestimabile anziché un onere opprimente”.

Gli esperti suggeriscono che i seguenti elementi debbano essere presi in considerazione al fine di preparare i dati per l’era emergente dell’AI:

  1. Stabilire una strategia di governance dei dati: “Con le giuste priorità, il personale, la governance, gli strumenti e un mandato esecutivo, le aziende possono trasformare le sfide legate alla qualità dei dati da un onere a un significativo vantaggio competitivo”, afferma Brauer. Un passo verso il supporto organizzativo per i dati dietro l’IA e altre iniziative potrebbe essere la creazione di una “task force, o l’equivalente appropriato per diversi tipi di organizzazioni, per studiare come l’innovazione emergente dell’IA generativa, dei grandi modelli di linguaggio e di altre nuove tecnologie basate sull’IA possano essere applicate per ottenere un vantaggio competitivo”.
  2. Stabilire una strategia di archiviazione dei dati: Trovare un posto dove posizionare tutti quei dati e consentirne la scoperta e l’accessibilità è un elemento essenziale del puzzle. Recenti sondaggi del settore affermano che “oltre la metà di tutti i dati memorizzati – il 60% – è inattivo, il che significa che raramente o mai viene più accesso”, afferma Brian Pawlowski, chief development officer presso Quantum. “Tuttavia, le aziende non vogliono separarsene poiché comprendono che i dati potrebbero offrire soluzioni preziose e valore commerciale negli anni a venire, specialmente dato l’uso diffuso dell’IA generativa”. Questo dilemma richiede una rivalutazione delle capacità esistenti per “stabilire architetture di archiviazione moderne e automatizzate che consentano alle persone di accedere facilmente e lavorare con dati attivi e inattivi per l’intero ciclo di vita”, aggiunge Pawlowski.
  3. Assicurarsi di avere una strategia di qualità dei dati: Preparare l’architettura dei dati per gestire le nuove esigenze alimentate dall’IA dovrebbe “partire dalla definizione di alti livelli di qualità dei dati come una priorità strategica”, consiglia Brauer. “Un buon inizio potrebbe essere la nomina di un chief data officer o un ruolo equivalente, con il budget e le risorse specificamente per le iniziative di qualità dei dati”.
  4. Assicurarsi di misurare i progressi: “Le priorità di leadership dovrebbero includere valutazioni dei dati aziendali a livello onnicomprensivo, e stabilire metriche e obiettivi per misurare il successo”, afferma Brauer.
  5. Assicurarsi di gestire le capacità dei dati non strutturati: “I problemi di qualità dei dati diventano più evidenti con i modelli di IA generativa rispetto ai modelli di apprendimento automatico classici, perché ci sono molti più dati e gran parte di essi è non strutturata, rendendo difficile l’utilizzo degli strumenti di tracciamento esistenti”, afferma Caserta e il team McKinsey. “I dati non strutturati rappresentano circa il 90% dei dati che verranno creati in futuro, e la capacità mondiale crescerà con un tasso di crescita annuo composto del 25% nei prossimi cinque anni”, afferma Pawlowski. “Questi dati non strutturati sono quelli memorizzati in file e oggetti: video e immagini ad alta risoluzione, dati medici complessi, sequenziamento del genoma, input per modelli di apprendimento automatico, dati scientifici catturati sul mondo naturale – come la mappatura dei campi petroliferi e del gas – e simulazione della realtà, compresi effetti speciali, animazione e realtà aumentata. È fondamentale che le organizzazioni adottino soluzioni che gestiscano il ciclo di vita dei dati in modo automatizzato e facciano uso di tecnologie all’avanguardia, come l’IA, per estrarre un valore commerciale migliorato”.
  6. Integrare capacità nell’architettura dei dati per supportare ampi casi d’uso: “Inserire capacità rilevanti (come database vettoriali e pipeline di pre- e post-elaborazione dei dati) nell’architettura dei dati esistente, in particolare a supporto di dati non strutturati”, puntualizza Caserta e i suoi coautori.
  7. Utilizzare l’IA per aiutare a costruire l’IA: “Utilizzare l’IA generativa per aiutarti a gestire i tuoi stessi dati”, suggerisce il team McKinsey. “L’IA generativa può accelerare le attività esistenti e migliorare il modo in cui vengono svolte lungo l’intera catena del valore dei dati, dall’ingegneria dei dati alla governance dei dati e all’analisi dei dati”.

L’IA promette di fare cose straordinarie, ma è necessario avere dati ben gestiti per raggiungere la destinazione giusta.