Questa nuova razza di assistente AI vuole occuparsi dei tuoi noiosi compiti d’ufficio

Questa nuova generazione di assistenti AI vuole occuparsi dei tuoi noiosi compiti in ufficio

Questa settimana, OpenAI ha annunciato un servizio che rende possibile per praticamente chiunque creare una versione personalizzata di ChatGPT, senza necessità di competenze di programmazione. L’azienda suggerisce che gli utenti potrebbero voler creare un bot che conosca le regole di tutti i giochi da tavolo, insegni ai bambini matematica o possa offrire consigli culinari. Questi GPT, come li chiama OpenAI, possono anche eseguire azioni semplici collegandosi a servizi internet, ad esempio cercare tra le email o ordinare prodotti da un negozio online.

Non si può rimproverare OpenAI per cercare di capitalizzare sul successo del suo grande successo, ChatGPT. Ma forse non abbiamo bisogno di più chatbot?

Adept AI, una startup a San Francisco fondata da veterani di OpenAI, Google e DeepMind, sta lanciando oggi un agente AI sperimentale che automatizza mansioni comuni in modo più sofisticato e potenzialmente potente rispetto ai chatbot come ChatGPT. Invece di essere limitato all’uso di servizi online che forniscono API per renderli accessibili al software, ACT-2 cerca di usare un computer più come un essere umano – capendo i pixel su uno schermo e poi agendo per controllare un browser e servizi online.

Iscriviti Oggi

Newsletter Fast Forward di ENBLEWill Knight

Le demo di Adept mostrano come ACT-2 possa essere utilizzato per raccogliere informazioni dalle email e dai documenti per compilare richieste di assicurazione, inserire informazioni dalle fatture inviate via email nel software dei pagamenti dei fornitori e creare un tour a piedi per una città interagendo con Google Maps.

Il modo in cui ACT-2 cerca di usare le stesse interfacce utente usate dagli esseri umani promette di renderlo molto più capace ed espansivo. In teoria, questo approccio potrebbe consentire a un chatbot di fare letteralmente qualsiasi cosa una persona potrebbe fare sul proprio telefono o computer. Ma operare in questo modo è anche più impegnativo per gli algoritmi e, per ora, rende l’agente più soggetto a errori.

Sotto il cofano, ACT-2 utilizza un grande modello di linguaggio chiamato Fuyu. È simile a quello che alimenta molti chatbot, ma come ChatGPT può gestire sia testo che immagini (rendendolo un “modello multimodale”). Il modello analizza ciò che vede sullo schermo di un computer e cerca di tradurre la richiesta digitata dall’utente in azioni utili che il bot dovrebbe compiere. Adept utilizza apprendimento per rinforzo – una tecnica utilizzata per insegnare ai computer compiti come giocare a giochi da tavolo e giochi video – per istruire la sua IA su come eseguire diverse attività. Ciò comporta l’osservazione di molti esseri umani che svolgono attività specifiche e il tentativo di raggiungere una prestazione simile.

David Luan, fondatore e CEO di Adept e precedentemente VP dell’ingegneria presso OpenAI, afferma che mentre i chatbot hanno entusiasmato tutti con le loro capacità, si è dimostrato difficile far funzionare in modo affidabile gli agenti AI. Ma crede che Adept e altri si stiano avvicinando molto alla soluzione di questo problema.

“Quest’anno non c’erano”, dice Luan riguardo agli agenti attuali, incluso il suo. “Penso che accadrà che l’anno prossimo ci sarà una grande guerra attorno agli agenti che funzionano effettivamente”. Adept sta progettando inizialmente i suoi agenti per eseguire solo un numero limitato di semplici ma comuni attività da ufficio, e afferma che ora sono almeno al 95% affidabili, che è sufficiente per la loro distribuzione commerciale presso alcune aziende.

Raggiungere quel livello di affidabilità solo per le attività iniziali e limitate per cui ACT-2 è progettato rappresenta una svolta importante. Per anni, sono esistiti strumenti per automatizzare le attività di ufficio – quello che è noto come automazione dei processi robotici – ma questi sono difficili da costruire e soggetti a guasti. Se Adept e gli altri possono utilizzare l’IA per automatizzare in modo affidabile molte altre attività, potrebbe trasformare il lavoro d’ufficio e aumentare la produttività.

Se Luan ha ragione, allora la battaglia per automatizzare i compiti più noiosi potrebbe rendere relativamente tranquille le guerre dei chatbot del 2023.