OpenAI cerca di migliorare l’IA con dati di formazione più ampi

OpenAI sta cercando di migliorare l'Intelligenza Artificiale attraverso una più ampia raccolta di dati di addestramento

Azienda di ricerca sull’intelligenza artificiale OpenAI ha annunciato una nuova iniziativa questa settimana mirata a diversificare ed espandere i dati utilizzati per addestrare i modelli di intelligenza artificiale chiamata Data Partnerships. Attraverso il programma, OpenAI pianifica di collaborare con organizzazioni terze per costruire nuovi dataset pubblici e privati per l’addestramento dell’IA.

Mirando a essere più equi e precisi, OpenAI vuole presentare dati migliori

Secondo OpenAI, l’obiettivo è creare modelli più equi, precisi e benefici, esponendoli a una gamma più ampia di dati che riflettono meglio le diverse lingue, culture e argomenti. I dataset attuali sull’IA sono spesso afflitti da problemi come il centrismo occidentale, la mancanza di diversità e l’inclusione di contenuti tossici o tendenziosi.

“Per realizzare [l’IA] che sia sicura e vantaggiosa per tutta l’umanità, vorremmo che i modelli di IA comprendessero a fondo tutti gli argomenti, le industrie, le culture e le lingue, il che richiede un dataset di addestramento il più ampio possibile”, ha dichiarato OpenAI in un post sul blog che annuncia il programma.

I modelli e la comprensione tra diverse piattaforme possono avvenire tramite l’addestramento

Lavorando con partner per raccogliere dataset su larga scala in diverse modalità come testo, immagini, audio e video, OpenAI spera di migliorare la comprensione dei modelli oltre quello che può essere facilmente acquisito dall’internet oggi. L’azienda afferma di lavorare per rimuovere qualsiasi informazione sensibile o personale e offrirà opzioni per mantenere i dataset privati.

OpenAI si è già associata ad organizzazioni come il governo islandese, il Free Law Project e Miðeind ehf nelle prime versioni del programma. Tuttavia, alcuni esperti esprimono scetticismo sul fatto che lo sforzo riuscirà a ridurre con successo i pregiudizi profondamente radicati che hanno influenzato finora i modelli di IA.

“In generale, cerchiamo partner che vogliano aiutarci a insegnare all’IA a comprendere il nostro mondo per essere massimamente utili a tutti”, ha affermato OpenAI.

Diversificazione dei dati di addestramento dell’IA per il miglioramento del GPT-4

Sebbene la diversificazione dei dati di addestramento dell’IA sia essenziale, il programma chiaramente beneficia anche dei modelli di OpenAI come il GPT-4 a livello commerciale. Questa motivazione doppia percepita, insieme alla mancanza di compensazione di OpenAI per i partner dei dati, ha suscitato alcune critiche in relazione alle accuse sullo sfruttamento dei dati da parte dell’azienda senza autorizzazione.

Maggiore trasparenza sulle modalità di raccolta dei dataset di OpenAI, sugli sforzi di mitigazione dei pregiudizi e sugli interessi commerciali sarà fondamentale per valutare l’impatto delle Data Partnerships sul panorama dell’IA nel complesso. Ma il programma segna una consapevolezza che il miglioramento futuro dell’IA richiede l’utilizzo di dati migliori e più rappresentativi.

Immagine in evidenza: Foto di Andrew Neel; Pexels; Grazie!