Non contare sul supercomputer Dojo di Tesla per avviare una rivoluzione dell’IA

Don't count on Tesla's Dojo supercomputer to start an AI revolution.

Bisogna essere abbastanza coraggiosi per scommettere contro l’idea che l’applicazione di una maggiore potenza di calcolo e dati all’apprendimento automatico – una ricetta che ha dato vita a ChatGPT – non porterà a ulteriori progressi di qualche tipo nell’intelligenza artificiale. Tuttavia, bisogna essere ancora più coraggiosi per scommettere che questa combinazione produrrà progressi o svolte specifiche entro una data specifica, per quanto desiderabile.

Un rapporto pubblicato lo scorso fine settimana dalla banca d’investimento Morgan Stanley prevede che un supercomputer chiamato Dojo, che Tesla sta costruendo per potenziare il suo lavoro sulla guida autonoma, potrebbe aggiungere 500 miliardi di dollari al valore dell’azienda fornendo un enorme vantaggio nella produzione di auto, nei robotaxi e nella vendita di software ad altre aziende.

Il rapporto ha fatto schizzare il prezzo delle azioni di Tesla, aggiungendo oltre il 6 percento, o 70 miliardi di dollari – approssimativamente il valore della BMW e molto meno di quanto Elon Musk abbia pagato per Twitter – alla capitalizzazione di mercato del produttore di veicoli elettrici al 13 settembre.

Il rapporto di Morgan Stanley, lungo 66 pagine, è interessante da leggere. Fornisce un’argomentazione appassionata su perché Dojo, i processori personalizzati che Tesla ha sviluppato per eseguire algoritmi di apprendimento automatico, e l’enorme quantità di dati di guida che l’azienda sta raccogliendo dai veicoli Tesla sulla strada, potrebbero dare enormi dividendi in futuro. Gli analisti di Morgan Stanley affermano che Dojo fornirà svolte che daranno a Tesla un vantaggio “asimmetrico” rispetto agli altri produttori di automobili nella guida autonoma e nello sviluppo dei prodotti. Il rapporto afferma addirittura che il supercomputer aiuterà Tesla a espandersi in altre industrie in cui la visione artificiale è cruciale, tra cui l’assistenza sanitaria, la sicurezza e l’aviazione.

Ci sono buoni motivi per essere cauti riguardo a quelle ambiziose affermazioni. Si può capire perché, in questo momento di mania per l’intelligenza artificiale, la strategia di Tesla possa sembrare così affascinante. Grazie a un notevole balzo nelle capacità degli algoritmi sottostanti, le impressionanti capacità di ChatGPT possono essere ricondotte a un’equazione semplice: più calcolo x più dati = più astuzia.

Gli esperti di OpenAI sono stati tra i primi ad aderire a questa formula del “moar”, scommettendo la loro reputazione e i milioni degli investitori sull’idea che aumentare le infrastrutture ingegneristiche per le reti neurali artificiali avrebbe portato a grandi svolte, incluso nei modelli linguistici come quelli che alimentano ChatGPT. Negli anni precedenti alla fondazione di OpenAI, lo stesso schema si era osservato nel riconoscimento delle immagini, con insiemi di dati più grandi e computer più potenti che portavano a un notevole balzo nella capacità dei computer di riconoscere – seppur a un livello superficiale – ciò che un’immagine mostra.

La nuova biografia di Walter Isaacson su Musk, che è stata ampiamente estratta durante la scorsa settimana, descrive come l’ultima versione del software ottimisticamente denominato Full Self Driving (FSD) di Tesla, che guida i suoi veicoli lungo strade trafficate, si basi meno su regole codificate duramente e più su una rete neurale addestrata a imitare una guida umana corretta. Questo suona simile a come ChatGPT impara a scrivere ingerendo infiniti esempi di testo scritto da esseri umani. Musk ha detto in interviste che si aspetta che una Tesla abbia un “momento ChatGPT” con FSD nel prossimo anno circa.

Musk ha fatto grandi promesse riguardo alle svolte nella guida autonoma molte volte in passato, incluso il pronostico che ci sarebbero stati un milione di robotaxi Tesla entro la fine del 2020. Quindi consideriamo questa con attenzione.

Sviluppando i propri chip di apprendimento automatico e costruendo Dojo, Tesla potrebbe certamente risparmiare denaro nell’addestramento dei sistemi di intelligenza artificiale dietro FSD. Ciò potrebbe aiutarla a fare di più per migliorare gli algoritmi di guida utilizzando i dati di guida del mondo reale che raccoglie dalle sue auto, che i concorrenti non hanno. Ma se questi miglioramenti varcheranno un punto di svolta nella guida autonoma o nella visione artificiale in generale sembra virtualmente impossibile da prevedere.

Per una cosa, FSD non è così simile a ChatGPT. Come hanno spiegato gli ingegneri dell’azienda durante il suo evento AI Day dell’anno scorso, la funzione è alimentata da diversi programmi e sistemi di apprendimento automatico progettati per gestire una serie di diverse attività stradali, come la sterzata o la decodifica delle segnalazioni stradali. Più dati e più calcolo possono produrre progressi significativi in alcuni di questi aspetti, ma un grande balzo nella guida autonoma richiede progressi significativi in molti o tutti quei sottosistemi. Le capacità notevolmente generali di ChatGPT, al contrario, sono state rese possibili migliorando un singolo sistema sottostante – un algoritmo monolitico che svela il testo.

Un altro problema: il video e altri dati dei sensori sono fondamentalmente diversi dal testo. La scorsa settimana ho incontrato dei robotisti che hanno spiegato che una questione centrale per il loro campo è se il tipo di scalabilità che ha sbloccato nuove capacità in ChatGPT possa trasferirsi alla percezione, navigazione e ragionamento dei robot. È possibile costruire un supercomputer per lavorare su questi problemi. Ma imparare dai dati video richiede molto più potere di calcolo rispetto all’elaborazione del testo, e fare progressi fondamentali potrebbe richiedere esponenzialmente di più. Nessuno, né Tesla né Morgan Stanley, sa per certo quanto dati o quanto grande un supercomputer sia necessario per fare svolte fondamentali nella robotica.

Un terzo problema nell’idea di dominio di Dojo da parte di Morgan Stanley è l’idea che i progressi nella guida autonoma si trasferiranno ad altri problemi. Imparare a guidare richiede una comprensione approfondita del mondo fisico, ma non insegna a una macchina nulla riguardo all’operare nel mondo al di là del relativamente controllato mondo dell’autostrada, con le sue regole e segnaletica.

Ho chiesto a Christian Gerdes, co-direttore del Center for Automotive Research di Stanford (CARS), cosa ne pensa dell’approccio di Tesla. Mi ha risposto via email da un circuito in Portogallo, dove sta testando un sistema di guida autonoma sviluppato nel suo laboratorio. Gerdes afferma che nel suo campo esiste una crescente convinzione che le capacità di guida autonoma aumenteranno con i dati e la potenza di calcolo, ma che ancora non è chiaro fino a che punto si possa arrivare. “Abbiamo reti neurali relativamente semplici che imparano la fisica delle corse”, afferma Gerdes dei suoi propri esperimenti. “I risultati sono abbastanza buoni ma, interessantemente, non migliorano sempre con più dati.”

Forse tutto ciò di cui hai bisogno è ancora più dati e silicio. Secondo le stime del rapporto di Morgan Stanley, presto avremo un’idea se questa sia la soluzione. Prevede che la prossima versione di FSD sarà presentata in un Tesla AI Day all’inizio del 2024 e dimostrerà che Tesla ha fatto progressi fondamentali nella guida autonoma grazie a Dojo.

Forse. Ma dato il track record di Tesla nel promettere una prossima utopia di guida autonoma, non scommetterei, né investirei, su di essa.