Anthropic rilascia un modello di intelligenza artificiale più veloce, più intelligente e più economico

Anthropic rilascia un modello di IA più efficiente

Dal momento in cui OpenAI ha rilasciato ChatGPT, molte aziende hanno cercato di creare i propri modelli di intelligenza artificiale, ma solo alcune sono riuscite a distinguersi. Anthropic è una di queste.

La startup di intelligenza artificiale ha lanciato il suo modello di intelligenza artificiale, Claude, a marzo. Si è dimostrato un degno avversario di GPT-3.5 e GPT-4 di OpenAI. Con quel lancio iniziale, Anthropic ha anche rilasciato Claude Instant, una versione più leggera, meno costosa e più veloce di Claude, secondo quanto affermato da Anthropic. Ora sta ottenendo un aggiornamento.

Inoltre: Come l’IA mi ha aiutato a far arrivare la mia musica su tutti i principali servizi di streaming 

Mercoledì, Anthropic ha rilasciato Claude Instant 1.2, una versione migliorata del modello che sfrutta Claude 2.0, l’ultima versione di Claude rilasciata a luglio.

Grazie alle avanzate capacità di Claude 2.0, Claude Instant 1.2 ha migliorato significativamente in matematica, codifica, ragionamento e sicurezza, generando risposte più lunghe e strutturate, secondo quanto dichiarato. 

Per mettere il modello alla prova, Anthropic ha confrontato le prestazioni di Claude Instant 1.1 e 1.2 in valutazioni standard di benchmark, inclusa la valutazione di Codex e il benchmark dei problemi matematici delle scuole elementari (GSM8k), che sono dei buoni benchmark per le capacità in matematica e codifica.

Inoltre: I creatori di TikTok dovranno dichiarare i contenuti generati dall’IA, altrimenti…

In entrambi i casi, la versione 1.2 ha superato la versione 1.1 con un punteggio del 58,7% rispetto al 52,8% dell’originale nella valutazione di Codex e dell’86,7% rispetto all’80,9% dell’originale nel GSM8k.

Per il resto degli esami di benchmark, il nuovo modello ha ottenuto risultati leggermente inferiori o superiori al modello precedente, con differenze minime.

La qualità delle risposte generate è migliorata, con una diminuzione delle allucinazioni e un aumento della resistenza ai tentativi di violazione. Una valutazione di “red teaming” ha stabilito che Claude 1.2 è il modello più sicuro da utilizzare.

Le aziende possono accedere al nuovo modello compilando un modulo di interesse e gli sviluppatori possono utilizzare l’API, che è molto meno costosa rispetto a Claude 2.