Cosa è un ‘AI drift’ e perché sta rendendo ChatGPT meno intelligente?
Cos'è l'AI drift e perché influisce su ChatGPT?
Sia che tu l’abbia provato tu stesso usando ChatGPT o l’abbia letto, le voci sono vere, ChatGPT sta diventando progressivamente più stupido.
Questo fenomeno è particolarmente perplesso perché i modelli di intelligenza artificiale generativi utilizzano l’input dell’utente per addestrarsi continuamente, il che dovrebbe renderli più intelligenti man mano che accumulano più inserimenti degli utenti nel tempo.
Inoltre: Come utilizzare ChatGPT per creare un’app
La risposta potrebbe risiedere in un concetto chiamato “drift”.
Un “drift” si riferisce al comportamento imprevisto o imprevedibile di grandi modelli di linguaggio (LLM) che si discostano dai parametri originali. Ciò può accadere perché i tentativi di migliorare parti di modelli di intelligenza artificiale complessi causano il peggioramento di altre parti.
- Questo accessorio Vision Pro trasformerà qualsiasi superficie piana...
- Zoom potrebbe utilizzare le tue chiamate e i tuoi dati per addestra...
- L’azienda tecnologica aerospaziale emetterà crediti per la ri...
Ricercatori dell’Università della California a Berkeley e dell’Università di Stanford hanno condotto uno studio per valutare i drift e analizzare come i popolari grandi modelli di linguaggio (LLM) di ChatGPT, GPT 3.5 (l’LLM dietro a ChatGPT) e GPT-4 (l’LLM dietro a Bing Chat e ChatGPT Plus), sono cambiati nel tempo.
Inoltre: I migliori chatbot di intelligenza artificiale
Lo studio ha confrontato la capacità di entrambi i LLM di risolvere problemi matematici, rispondere a domande sensibili, rispondere a sondaggi di opinione, rispondere a domande complesse basate sulla conoscenza, generare codice, superare esami di licenza medica degli Stati Uniti e completare compiti di ragionamento visivo nel mese di marzo e giugno.
Come si può vedere dai risultati dello studio sopra riportati, la versione di marzo di GPT-4 ha superato la versione di giugno in molte occasioni, con la differenza più evidente nei prompt di matematica di base, dove la versione di marzo di GPT-4 ha superato la versione di giugno in entrambi gli esempi (a) e (b).
GPT-4 ha anche peggiorato nella generazione di codice, nella risposta a domande d’esame mediche e nella risposta a sondaggi di opinione. Tutte queste situazioni possono essere attribuite al fenomeno del drift.
Riguardo ai drift, uno dei ricercatori, James Zou, ha detto al Wall Street Journal: “Sospettavamo che potesse accadere, ma siamo rimasti molto sorpresi da quanto velocemente si sta verificando il drift”.
Inoltre: GPT-3.5 vs GPT-4: vale la pena sottoscrivere ChatGPT Plus?
Nonostante l’intelligenza che si deteriora, ci sono state anche alcune miglioramenti sia in GPT-4 che in GPT-3.5.
Di conseguenza, i ricercatori incoraggiano gli utenti a continuare a utilizzare i LLM, ma a fare attenzione quando li usano e a valutarli costantemente.