Amazon aggiorna Alexa per l’era di ChatGPT

Amazon updates Alexa for the era of ChatGPT

Quando Amazon ha lanciato il suo assistente virtuale Alexa nove anni fa, la sua capacità di decodificare i comandi vocali per impostare un timer o riprodurre una canzone sembrava quasi magica. Oggi, il livello di abilità linguistica impressionante è molto più alto, grazie a ChatGPT di OpenAI. Amazon sta dando un nuovo impulso al suo assistente vocale sfruttando la tecnologia dietro la nuova ondata di chatbot in grado di intrattenere conversazioni straordinariamente realistiche.

Amazon ha annunciato l’aggiornamento di Alexa in un evento tenuto presso il suo secondo quartier generale ad Arlington, in Virginia. L’assistente risponderà a domande molto più complesse e intratterrà conversazioni più fluide e aperte, eliminando la necessità per gli utenti di dire “Alexa …” ad ogni turno.

Tra qualche settimana, gli utenti che dicono “Alexa, parliamo” avranno accesso al nuovo assistente vocale più capace. Amazon lo chiama una “anteprima anticipata” perché le nuove funzionalità restano ancora in fase di sviluppo.

Le demo mostrate sul palco mercoledì hanno mostrato Alexa che esibisce una personalità simulata con la sua intonazione e i suoi sforzi umoristici. Nei video si vedono persone che chiedono ad Alexa di scrivere poesie su un tema, di generare idee per una serata romantica e di creare una storia sul gelatina di Jell-O. I dispositivi dotati di telecamere, come l’Echo Show, cercheranno di rilevare quando una persona si aspetta che Alexa continui la conversazione e quando la conversazione è finita.

La nuova Alexa modulerà anche la sua voce per creare un dialogo più naturale. “Se chiedo ad Alexa come stanno andando i Red Sox e hanno appena perso, risponderà con un tono empatico”, dice Rohit Prasad, responsabile dello sviluppo dell’IA presso Amazon e con sede a Cambridge, nel Massachusetts.

Prasad afferma che l’aggiornamento delle capacità linguistiche di Alexa ha richiesto un’ingegnerizzazione estensiva, poiché i grandi modelli linguistici che alimentano servizi come ChatGPT possono inventarsi fatti, dire sciocchezze e essere totalmente inappropriati. “Specialmente date certe limitazioni dei modelli linguistici, questo è un enorme passo avanti”, afferma Prasad.

Justine Cassell, professore presso l’Università Carnegie Mellon che studia il modo in cui gli esseri umani interagiscono con gli agenti di intelligenza artificiale, afferma che sarà affascinante vedere come le persone reagiscono a un chatbot abilitato alla voce in grado di fornire risposte più ricche. “Gli obiettivi sono fantastici e sono entusiasta di vedere cosa faranno”, dice.

Tuttavia, Cassell afferma che alcune delle cose che Amazon promette, come rispondere al linguaggio del corpo, rimangono estremamente sfidanti. “Non esiste una grammatica del linguaggio del corpo, come invece esiste per il linguaggio parlato e scritto”, dice. Se Alexa interpreta erroneamente la postura o i movimenti di qualcuno e risponde in modo errato, le cose potrebbero diventare imbarazzanti. Cassell afferma che anche se Alexa acquisisce una fluidità simile a ChatGPT, i suoi sforzi per imitare la personalità e le emozioni umane attraverso caratteristiche come l’intonazione difficilmente raggiungeranno le capacità umane per ancora un po’. Aspettatevi che la nuova Alexa a volte sembri artificiale nelle sue risposte.

Amazon afferma che gli utenti saranno in grado di richiedere l’accesso a un test aggiuntivo della sua nuova tecnologia, in cui le nuove capacità di Alexa potranno essere utilizzate per controllare altri dispositivi, incluso alcuni non prodotti da Amazon. Nel tempo, l’azienda prevede di aggiungere nuove funzionalità ad Alexa, potenzialmente incluso la capacità di discutere e consigliare prodotti del vasto inventario dell’azienda.

Se Alexa può rispondere a domande più complesse evitando errori imbarazzanti, potrebbe segnare un miglioramento più ampio – e molto necessario – delle capacità degli assistenti vocali.

Quando Amazon ha lanciato Alexa nel 2014, ha contribuito a creare una nuova categoria nell’informatica personale basata sull’interazione vocale, suscitando previsioni che le interfacce vocali avrebbero presto dominato. Alexa e Siri di Apple hanno beneficiato dei progressi nell’apprendimento automatico che hanno finalmente reso possibile per i dispositivi riconoscere e rispondere in modo affidabile alla voce dell’utente. Tuttavia, la complessità del linguaggio ha limitato questi dispositivi solo a comandi semplici e li ha resi incapaci di intrattenere una conversazione reale. Nonostante ciò, Amazon afferma che sono stati venduti oltre mezzo miliardo di dispositivi con Alexa in tutto il mondo.

L’avvento dei grandi modelli linguistici allenati su enormi quantità di testo ha finalmente creato algoritmi in grado di gestire dialoghi più complessi. ChatGPT e altri chatbot hanno sorpreso sia gli esperti che il pubblico con la loro flessibilità e loquacità, anche se sono inclini a produrre affermazioni che possono essere false, tendenziose o addirittura offensive.

Prasad afferma che Amazon ha sviluppato un nuovo modello linguistico avanzato per rivitalizzare Alexa. Dice che l’azienda ha ottimizzato questo modello per le frasi appropriate per una conversazione vocale e utilizza algoritmi aggiuntivi per aiutare il riconoscimento del linguaggio del corpo e l’intonazione.

Uno dei grandi sfide per Amazon potrebbe risultare essere la gestione degli errori sorprendenti che derivano dall’uso di grandi modelli linguistici. Quando Microsoft ha aggiunto un chatbot avanzato di intelligenza artificiale al suo motore di ricerca Bing, gli utenti hanno scoperto rapidamente alcuni comportamenti strani. “È perfetto al 100%? No”, afferma Prasad. “Questo è il motivo per cui si tratta di un’anteprima anticipata, perché ci saranno errori occasionali.”

Prasad afferma che Amazon ha già sviluppato delle protezioni per evitare che Alexa si allontani dal percorso prestabilito. Aggiunge che alcuni utenti verranno ricordati che stanno parlando con una macchina e si cercherà di evitare che l’assistente si presenti troppo come una persona. Alcuni utenti di chatbot formano legami emotivi forti e persino romantici con le personalità simulate con cui interagiscono. Prasad aggiunge che Amazon sta conducendo ricerche sui rischi a lungo termine che potrebbero derivare dai progressi futuri nell’intelligenza artificiale.