Gemini, la ribattitura di Google a GPT-4, è qui

Gemini, la sfida di Google a GPT-4, è arrivata

Google ha presentato Gemini, definendolo il loro “modello di intelligenza artificiale più grande e capace”.

Mercoledì, Google DeepMind, il laboratorio di ricerca sull’intelligenza artificiale dell’azienda, ha presentato il modello molto atteso che, secondo quanto riportato, supera il GPT-4 di OpenAI sui principali benchmark.

Dal lancio di ChatGPT di OpenAI un anno fa, le principali aziende tecnologiche si sono trovate in competizione per gli sviluppi dell’intelligenza artificiale. Fino ad ora, Microsoft ha avuto un certo vantaggio grazie al fatto di poter accedere ai modelli di OpenAI come investitore principale nell’azienda di intelligenza artificiale. Google è stato insolitamente impreparato. Il lancio iniziale di Bard, il suo concorrente di ChatGPT, è stato fallito. Inoltre, Google è generalmente rimasto indietro rispetto ai rilasci di OpenAI e Microsoft con Bing e Copilot. Google Gemini, tuttavia, potrebbe essere un avanzamento sufficientemente grande da superare OpenAI.

Cos’è Gemini?

Ciò che rende Gemini così buono, secondo Google, sono le sue capacità multimodali, il ragionamento sofisticato e le competenze avanzate di codifica. A differenza di altri modelli di intelligenza artificiale multimodali che sono innanzitutto costruiti sul testo e successivamente aggiungono dati di immagine, Gemini è nativamente multimodale. Ciò significa che è stato preallenato su modalità audio e immagini oltre al testo fin dall’inizio. “Questo aiuta Gemini a comprendere e ragionare in modo ottimale su tutti i tipi di input, molto meglio dei modelli multimodali esistenti”, ha dichiarato l’annuncio.

Gemini ha ottenuto il 90 percento rispetto all’86,4 percento del GPT-4 in MMLU (comprendimento del linguaggio multitasking massivo), che testa le conoscenze pluridisciplinari e la risoluzione dei problemi.

Quindi sappiamo che Gemini ha ottenuto buoni risultati, ma come se la cava nel mondo reale? Stiamo per scoprirlo tutti. Google ha ottimizzato Gemini per tre diverse dimensioni: Gemini Ultra, il modello più grande per compiti altamente complessi, Gemini Pro, il modello di peso medio in grado di svolgere la maggior parte degli altri compiti, e Gemini Nano, un modello efficiente abbastanza piccolo da poter essere incluso nel tuo telefono.

Parlando di cui, a partire da oggi, Gemini Nano funzionerà su Google Pixel 8 Pro. Per ora, Gemini Nano alimenta due funzionalità del dispositivo. È in grado di riassumere le trascrizioni nell’app Recorder e suggerisce anche risposte per Smart Reply della tastiera del telefono (Gboard).

Anche se non sei un utente Android, puoi testare Gemini in Google Bard a partire da oggi. Ci si aspetta di notare un miglioramento generale nella capacità di ragionamento, pianificazione e comprensione. Gemini Pro alimenta Bard, ma solo i suggerimenti di testo.

La multimodalità arriverà presto. L’anno prossimo, Google pianifica di annunciare una versione avanzata di Bard che sarà alimentata da Gemini Ultra.