Cosa è un ‘AI drift’ e perché sta rendendo ChatGPT meno intelligente?

Cos'è l'AI drift e perché influisce su ChatGPT?

Sia che tu l’abbia provato tu stesso usando ChatGPT o l’abbia letto, le voci sono vere, ChatGPT sta diventando progressivamente più stupido.

Questo fenomeno è particolarmente perplesso perché i modelli di intelligenza artificiale generativi utilizzano l’input dell’utente per addestrarsi continuamente, il che dovrebbe renderli più intelligenti man mano che accumulano più inserimenti degli utenti nel tempo.

Inoltre: Come utilizzare ChatGPT per creare un’app

La risposta potrebbe risiedere in un concetto chiamato “drift”.

Un “drift” si riferisce al comportamento imprevisto o imprevedibile di grandi modelli di linguaggio (LLM) che si discostano dai parametri originali. Ciò può accadere perché i tentativi di migliorare parti di modelli di intelligenza artificiale complessi causano il peggioramento di altre parti.

Ricercatori dell’Università della California a Berkeley e dell’Università di Stanford hanno condotto uno studio per valutare i drift e analizzare come i popolari grandi modelli di linguaggio (LLM) di ChatGPT, GPT 3.5 (l’LLM dietro a ChatGPT) e GPT-4 (l’LLM dietro a Bing Chat e ChatGPT Plus), sono cambiati nel tempo.

Inoltre: I migliori chatbot di intelligenza artificiale

Lo studio ha confrontato la capacità di entrambi i LLM di risolvere problemi matematici, rispondere a domande sensibili, rispondere a sondaggi di opinione, rispondere a domande complesse basate sulla conoscenza, generare codice, superare esami di licenza medica degli Stati Uniti e completare compiti di ragionamento visivo nel mese di marzo e giugno.

Come si può vedere dai risultati dello studio sopra riportati, la versione di marzo di GPT-4 ha superato la versione di giugno in molte occasioni, con la differenza più evidente nei prompt di matematica di base, dove la versione di marzo di GPT-4 ha superato la versione di giugno in entrambi gli esempi (a) e (b).

GPT-4 ha anche peggiorato nella generazione di codice, nella risposta a domande d’esame mediche e nella risposta a sondaggi di opinione. Tutte queste situazioni possono essere attribuite al fenomeno del drift.

Riguardo ai drift, uno dei ricercatori, James Zou, ha detto al Wall Street Journal: “Sospettavamo che potesse accadere, ma siamo rimasti molto sorpresi da quanto velocemente si sta verificando il drift”.

Inoltre: GPT-3.5 vs GPT-4: vale la pena sottoscrivere ChatGPT Plus?

Nonostante l’intelligenza che si deteriora, ci sono state anche alcune miglioramenti sia in GPT-4 che in GPT-3.5.

Di conseguenza, i ricercatori incoraggiano gli utenti a continuare a utilizzare i LLM, ma a fare attenzione quando li usano e a valutarli costantemente.