La ‘Santissima Gral’ di Qualcomm l’IA generativa arriverà presto sui telefoni

Qualcomm's 'Holy Grail' of generative AI will soon arrive on phones.

La generazione di intelligenza artificiale come ChatGPT e Midjourney hanno affascinato l’immaginazione e sconvolto le industrie, ma il loro debutto è stato per lo più limitato alle finestre del browser sui computer desktop. L’anno prossimo, sarà possibile utilizzare l’intelligenza artificiale generativa anche in movimento, una volta che i telefoni premium saranno lanciati con i chip di fascia alta di Qualcomm all’interno.

I telefoni utilizzano l’intelligenza artificiale da anni per ritoccare le foto e migliorare la correzione automatica, ma gli strumenti di intelligenza artificiale generativa potrebbero portare il livello successivo di miglioramenti all’esperienza mobile. Qualcomm sta integrando l’intelligenza artificiale generativa nella sua prossima generazione di chip di fascia alta, che faranno il loro debutto al suo summit annuale di Qualcomm alle Hawaii a ottobre.

I partecipanti al summit avranno l’opportunità di sperimentare di persona ciò che l’intelligenza artificiale generativa porterà ai telefoni, ma il vicepresidente senior di product management di Qualcomm, Ziad Asghar, ha descritto a ENBLE perché gli utenti dovrebbero entusiasmarsi per l’intelligenza artificiale integrata nel dispositivo. Per prima cosa, avere accesso ai dati dell’utente: abitudini di guida, ricerche di ristoranti, foto e altro ancora, tutto in un unico luogo renderà le soluzioni generate dall’intelligenza artificiale nel tuo telefono molto più personalizzate e utili rispetto alle risposte generali dell’intelligenza artificiale generativa basata sul cloud.

“Penso che questo sarà il Santo Graal”, ha detto Asghar. “Questo è il vero obiettivo che ci entusiasma davvero per il potenziale di questa tecnologia.”

Ci sono anche altri vantaggi nell’avere l’intelligenza artificiale generativa nel dispositivo. In primo luogo, le ricerche delle query e i dati personali sono mantenuti privati e non vengono trasmessi attraverso un server remoto. Utilizzare l’intelligenza artificiale locale è anche più veloce dell’attesa per il calcolo nel cloud e può funzionare durante i viaggi in aereo o in altre aree prive di servizio cellulare.

Ma una soluzione nel dispositivo ha anche senso dal punto di vista aziendale ed efficiente. Come spiega Qualcomm in un white paper pubblicato il mese scorso, man mano che i modelli di apprendimento automatico sono diventati più complessi (da centinaia di migliaia di parametri a miliardi), è diventato più costoso gestire server per rispondere alle query. A partire da aprile, si stima che OpenAI abbia speso circa 700.000 dollari al giorno per far sì che ChatGPT rispondesse alle richieste, ma questa previsione di costo si basava sul modello GPT-3 più vecchio e non sul nuovo GPT-4, che è più complesso e probabilmente più costoso da mantenere a livello di scala. Invece di aver bisogno di un’intera fattoria di server, la soluzione di Qualcomm è quella di far fare tutto il pensiero al cervello di silicio esistente del dispositivo, senza costi aggiuntivi.

“Eseguire l’intelligenza artificiale sul tuo telefono è praticamente gratuito: hai già pagato per la potenza di calcolo inizialmente”, ha detto l’analista di Techsponential Avi Greengart a ENBLE via email.

Greengart ha visto l’intelligenza artificiale generativa nel dispositivo di Qualcomm in azione quando il produttore di chip l’ha mostrata al Mobile World Congress lo scorso febbraio, utilizzando un telefono Android alimentato da Snapdragon 8 Gen 2 per eseguire il software di generazione di immagini Stable Diffusion. Nonostante fosse una demo iniziale, lo ha trovato “enormemente entusiasmante”.

Un chipset Snapdragon 8 Gen 2.

David Lumb/CNET

Cosa offre l’intelligenza artificiale generativa nel dispositivo agli utenti

Qualcomm ha idee su cosa le persone potrebbero fare con l’intelligenza artificiale generativa basata sul telefono, migliorando tutto, dalle attività di produttività alla visione di contenuti alla creazione di contenuti.

Come mostrato dalla demo di Stable Diffusion, l’intelligenza artificiale generativa nel dispositivo potrebbe consentire alle persone di modificare le immagini su comando, ad esempio chiedendo di cambiare lo sfondo per metterti davanti ai canali di Venezia, ha detto Asghar. Oppure potrebbero far generare una nuova immagine completamente: ma questo è solo l’inizio, poiché modelli di apprendimento di grandi dimensioni per testo e immagini potrebbero lavorare in successione per passare da un’idea a un output pronto.

Utilizzando più modelli, ha detto Asghar, un utente potrebbe far tradurre il proprio discorso tramite il riconoscimento automatico del parlato in testo che viene quindi alimentato in un generatore di immagini. Porta questo un passo avanti e fai sì che il tuo telefono renderizzi il volto di una persona, che utilizza l’intelligenza artificiale generativa per realizzare movimenti realistici della bocca e la sintesi vocale per parlare con te, e boom, hai un assistente virtuale generativo con cui puoi avere conversazioni complete.

Questo esempio specifico potrebbe essere alimentato in parte da intelligenza artificiale di terze parti, come il grande modello di linguaggio Llama 2 lanciato di recente da Meta, casa madre di Facebook, in collaborazione con Microsoft e Qualcomm.

“[Llama 2] consentirà ai clienti, ai partner e agli sviluppatori di creare casi d’uso, come assistenti virtuali intelligenti, applicazioni di produttività, strumenti di creazione di contenuti, intrattenimento e altro ancora”, ha dichiarato Qualcomm in un comunicato stampa. “Queste nuove esperienze di intelligenza artificiale nel dispositivo, alimentate da Snapdragon, possono funzionare in aree senza connessione o anche in modalità aereo”.

All’interno del museo su appuntamento della sede centrale di Qualcomm pieno di telefoni retrò

Qualcomm non limiterà queste funzionalità ai telefoni. Durante il prossimo summit, l’azienda pianifica di annunciare soluzioni di intelligenza artificiale generativa anche per PC e auto. Quell’assistente personale potrebbe aiutarti con le tue liste di cose da fare, pianificare incontri e inviare e-mail. Se sei bloccato fuori dall’ufficio e hai bisogno di fare una presentazione, Asghar ha detto che l’intelligenza artificiale potrebbe generare uno sfondo nuovo in modo che non sembri che tu sia seduto in macchina e mostrare una presentazione (o persino aiutare a presentarla).

“Per coloro di noi che sono cresciuti guardando Supercar, beh, KITT ora diventerà reale”, ha detto Asghar, facendo riferimento al popolare smart car della serie TV.

Indipendentemente dalla piattaforma, la soluzione di intelligenza artificiale generativa di base esisterà sul dispositivo. Potrebbe aiutare con il lavoro d’ufficio, come generare automaticamente note da una chiamata e creare una presentazione di cinque slide che ne riassuma i punti chiave (“È come Clippy, ma con gli steroidi, giusto?” ha detto Asghar). Oppure potrebbe creare mondi digitali da zero in AR e VR.

Oltre ai mondi fantastici, l’intelligenza artificiale generativa potrebbe aiutare le persone non vedenti a navigare nel mondo reale. Asghar ha descritto una situazione in cui la telecamera del telefono potrebbe riconoscere quando un utente si trova in un’intersezione e informarlo quando fermarsi, oltre a quanti veicoli arrivano da quale direzione.

Nel campo dell’istruzione, l’intelligenza artificiale generativa potrebbe valutare quanto bene gli studenti stanno apprendendo una lezione, magari utilizzando una webcam o la telecamera di un telefono, tenendo traccia delle loro espressioni e linguaggio del corpo. E poi l’intelligenza artificiale generativa potrebbe adattare il materiale ai punti di forza e alle debolezze di ciascuno studente, secondo la teoria di Asghar.

Tutte queste sono previsioni di Qualcomm, ma spetta alle terze parti decidere come sfruttare al meglio la tecnologia per migliorare i propri prodotti e servizi. Per i telefoni, l’intelligenza artificiale generativa potrebbe avere un vero impatto una volta integrata nelle app mobili per esperienze di gioco più personalizzate, social media e creazione di contenuti, ha detto Greengart di Techsponential.

È difficile dire cosa significhi per gli utenti finché gli sviluppatori di app non avranno a disposizione la tecnologia di intelligenza artificiale generativa da modificare e integrare nelle loro app. È più facile fare previsioni su cosa potrebbe fare basandosi su come l’intelligenza artificiale aiuta le persone al momento. Roger Entner, analista di Recon Analytics, prevede che l’intelligenza artificiale generativa aiuterà a correggere difetti nelle foto di scarsa qualità, a generare filtri per i social media e a perfezionare la correzione automatica – problemi che esistono già.

“Qui l’intelligenza artificiale generativa crea un miglioramento della qualità d’uso che presto daremo per scontato”, ha detto Entner a ENBLE via e-mail.

Un chip Snapdragon 8 Gen 2 racchiuso in un supporto rosso di fronte a un banco utilizzato per testare i chip in produzione.

David Lumb / ENBLE

L’intelligenza artificiale generativa arriverà prima sui telefoni di fascia alta

Le attuali soluzioni di intelligenza artificiale generativa si basano su grandi server per rispondere a richieste su larga scala, ma Qualcomm è fiduciosa che il suo silicio a bordo possa gestire le esigenze degli utenti singoli. Nei laboratori di Asghar, i chip dell’azienda hanno gestito modelli di intelligenza artificiale con 7 miliardi di parametri (aspetti che valutano i dati e cambiano il tono o l’accuratezza dei risultati), molto al di sotto dei 175 miliardi di parametri del modello GPT-3 di OpenAI che alimenta ChatGPT, ma dovrebbero essere adatti alle ricerche mobili.

“Saremo in grado di dimostrare che funziona sul dispositivo al summit delle Hawaii”, ha detto Asghar.

Il dispositivo dimostrativo probabilmente includerà il prossimo chip di fascia alta di Qualcomm, presumibilmente lo Snapdragon 8 Gen 3 che verrà utilizzato nei telefoni Android di fascia alta dell’anno prossimo. Il dispositivo dimostrativo che esegue Stable Diffusion al MWC 2023 utilizzava lo Snapdragon 8 Gen 2 annunciato all’ultimo summit Snapdragon nelle Hawaii.

In un’epoca in cui i telefoni a malapena durano un giorno intero prima di dover essere ricaricati, c’è anche preoccupazione su quanto l’invocazione dell’intelligenza artificiale generativa durante il giorno possa scaricare ancora più velocemente la batteria. Dovremo aspettare i test nel mondo reale per vedere come i telefoni implementano e ottimizzano la tecnologia, ma Asghar ha sottolineato che la dimostrazione al MWC 2023 ha eseguito ricerche per tutta la giornata senza esaurire la batteria o riscaldarsi al tatto. Crede che il silicio di Qualcomm sia unico e in grado di offrire un consumo energetico molto buono, con l’intelligenza artificiale generativa che viene eseguita principalmente sul processore Hexagon e sull’unità di elaborazione neurale di un chipset Snapdragon.

“Penso che ci sarà preoccupazione per coloro che non hanno hardware dedicato per questo tipo di elaborazione”, ha detto Asghar.

Asghar crede che i telefoni Android premium dell’anno prossimo, alimentati con i chip di Qualcomm, saranno in grado di utilizzare l’IA generativa. Ma ci vorrà del tempo perché questa tecnologia arrivi anche ai telefoni più economici. Come avviene attualmente per i telefoni, l’assistenza dell’IA per la pulizia delle immagini, dell’audio e dei video è migliore nei modelli di punta e meno efficace nei telefoni più economici, le capacità dell’IA generativa saranno inferiori (ma comunque presenti) man mano che si scende nel catalogo di chip di Qualcomm.

“Forse sarà possibile utilizzare un modello a parametri superiori ai 10 miliardi sui telefoni premium, mentre il livello inferiore sarà inferiore a quello, e se si scende ulteriormente sarà ancora inferiore”, ha detto Asghar. “Quindi si avrà una degradazione graduale di queste esperienze, ma si estenderanno anche ad altri prodotti”.

Come per il 5G, Qualcomm potrebbe essere il primo ad adottare l’IA generativa come nuova tecnologia, ma non sarà l’ultimo. Apple ha silenziosamente migliorato la sua IA on-device, con il vicepresidente senior del software Craig Federighi che ha affermato in una chat post-Worldwide Developers Conference che hanno sostituito un modello di linguaggio tramite trasformatore più potente per migliorare l’autocorrezione. Si dice addirittura che Apple stia testando internamente il suo chatbot “Apple GPT”. Il colosso tecnologico starebbe sviluppando il proprio framework per creare modelli di linguaggio estesi al fine di competere nello spazio dell’IA, che si è riscaldato da quando OpenAI ha rilasciato ChatGPT al pubblico alla fine del 2022.

Guarda questo:

L’IA di Apple potrebbe entrare nella corsa contro l’IA Bard di Google e l’IA Bing di Microsoft, entrambe delle quali hanno avuto rilasci limitati quest’anno per i test pubblici. Queste seguono il modello più tradizionale di “chatbot intelligente” per migliorare il software tramite l’IA generativa, ma è possibile che arrivino sui telefoni tramite app o siano accessibili tramite browser web. Sia Google che Microsoft stanno già integrando l’IA generativa nelle loro piattaforme di produttività, quindi è probabile che gli utenti vedano i loro sforzi per primi nelle versioni mobili di Google Docs o Microsoft Office.

Ma per la maggior parte dei proprietari di telefoni, l’IA generativa basata sui chip di Qualcomm potrebbe rappresentare il primo uso significativo di questa nuova tecnologia. Dovremo aspettare il Snapdragon Summit per vedere quanto potrebbe cambiare la nostra esperienza mobile già dal prossimo anno.