Perché la visualizzazione dell’IA di DeepMind è completamente inutile

AI visualization by DeepMind is completely useless

Impressionante, ma cosa significa? Le immagini di DeepMind, come questa, sviluppate da Tim West, sono impressionanti, ma non spiegano cosa sta effettivamente accadendo nei programmi di intelligenza artificiale. L’immagine rappresenta apparentemente “i vantaggi e i difetti dei grandi modelli di linguaggio”, come ChatGPT, ma in che modo?

“L’eccellenza nella grafica statistica consiste nel comunicare idee complesse con chiarezza, precisione ed efficienza.” – Edward R Tufte, The Visual Display of Quantitative Information.

Di solito, la visualizzazione è qualcosa che serve a far capire qualcosa che non può essere visto. L’unità DeepMind di Google ha recentemente pubblicato delle visualizzazioni di intelligenza artificiale, create da vari artisti visivi. L’intenzione può essere buona, ma i risultati sono un disastro.

“Visualising AI commissiona artisti provenienti da tutto il mondo per creare rappresentazioni più diverse e accessibili dell’IA, ispirate da conversazioni con scienziati, ingegneri ed eticisti di Google DeepMind”, afferma l’azienda. Confronta quelle immagini “diverse e accessibili” con le tipiche immagini dell’IA che includono cervelli luminosi o robot e simili.

Inoltre: Generative AI: non chiamatelo ‘artista’, dicono gli studiosi nella rivista Science

È vero che le tipiche immagini di stock per l’IA, come le lettere luminose “A” e “I”, non aiutano a capire la forma piuttosto misteriosa dell’arte e della scienza dei modelli di apprendimento automatico dell’IA, la forma dominante dell’intelligenza artificiale.

Il famoso esperto di visualizzazione Edward R. Tufte, il cui libro, The Visual Display of Quantitative Information, è stato un punto di riferimento per la comprensione della visualizzazione, ha scritto che le visualizzazioni di successo dovrebbero, tra le altre cose, “indurre lo spettatore a pensare alla sostanza piuttosto che alla metodologia, al design grafico, alla tecnologia di produzione grafica o a qualcos’altro”.

Inoltre: Google aggiorna Vector AI per consentire alle aziende di addestrare GenAI sui propri dati

Le immagini di DeepMind riguardano principalmente il design grafico. In effetti, sono un sovraccarico di design grafico.

Un’immagine, realizzata da Novoto Studio, mostra ciò che sembrano essere caramelle tic-tac che si avvicinano a una sorta di interfaccia computerizzata. Nell’apprendimento profondo – o in qualsiasi altra forma di intelligenza artificiale – non c’è nulla che includa i tic-tac.

Tic-tac, qualcuno? Le immagini di DeepMind, come questa, sviluppate da Novoto Studio, sono impressionanti, ma non spiegano cosa sta effettivamente accadendo nei programmi di intelligenza artificiale.

Il testo che accompagna i tic-tac è altrettanto criptico. “Un dispositivo elettronico con molti piccoli oggetti su di esso”, si legge. “Illustrazione di un’opera d’arte dell’intelligenza artificiale (IA). Questa immagine rappresenta il potenziale dell’IA per la società attraverso visualizzazioni 3D”. Qualunque cosa significhi, probabilmente non ha molto a che fare con i tic-tac.

Inoltre: L’onda multi-visuale dell’IA sta arrivando, e sarà potente

Un video correlato dei tic-tac è altrettanto incomprensibile, sebbene affascinante. Potrebbe essere intitolato “Marcia dei tic-tac”, ma potrebbe non aiutare nessuno a capire l’IA.

Un’altra immagine, realizzata da Wes Cockx, dovrebbe essere una “struttura metallica fatta di legno e metallo” e mira a rappresentare “il metodo di predizione utilizzato nei grandi modelli di linguaggio”.

È una struttura immaginaria affascinante, ma non è chiaro cosa stia facendo nella previsione. Nemmeno il video correlato, che mostra la struttura di legno e metallo in azione, è di grande aiuto. Mostra qualcosa che assomiglia a un’apparecchiatura, forse un’enorme abaco di qualche tipo, ma cosa sta facendo quella cosa?

Alcune delle immagini sono così fantasiose da sembrare non avere alcuna relazione con nulla. Un’immagine, realizzata da XK Studio, che raffigura qualcosa che assomiglia a un cubo di una specie di materia gelatinosa, che sembra stia perdendo altre forme di materia gelatinosa simile a celle, è, ancora una volta, piuttosto affascinante, ma non ha nulla a che fare con l’IA o qualsiasi altra cosa. Costretti a indovinare, potremmo pensare che si tratti di una rappresentazione di un processo di formazione della gelatina.

Il video della cosa gelatinosa mostra molte cose che si formano, che a loro volta formano altre cose. Di nuovo, chi sa quali cose si stanno formando e perché?

Inoltre: Cos’è l’IA generativa e perché è così popolare? Ecco tutto ciò che devi sapere

Il testo che accompagna spiega che l’immagine e il video “esplorano come gli esseri umani possano collaborare creativamente con l’intelligenza artificiale generale (AGI) in futuro e come possa offrire nuovi punti di vista, accelerare i processi e portare a nuovi territori.” Oltre a non spiegare cosa sia l’AGI, o potrebbe essere, il testo è così vago da essere inutile. Questo è un caso in cui un’immagine, e anche mille parole, potrebbero non aiutare nessuno.

L’immagine che si avvicina di più all’obiettivo è un’altra di Novoto Studio, che mostra ciò che sembra essere una configurazione ramificata. Il testo la descrive come “reti neurali ispirate all’apprendimento profondo.”

È quella che si avvicina di più all’obiettivo perché le reti neurali artificiali possono essere considerate, in alcuni sensi, come reti ramificate che coinvolgono molti elementi in attività collettiva.

Inoltre: Tutti vogliono un’IA responsabile, ma poche persone stanno facendo qualcosa in proposito

In effetti, è strano che le illustrazioni siano tutte così fuori tema, perché nell’ambito dell’IA c’è una ricca tradizione di illustrazioni. Il lavoro originale sulla rete neurale, di Frank Rosenblatt del Cornell University Aeronautical Laboratory, “Il Perceptron,” ha dato il via a 60 anni di tentativi di costruire reti neurali artificiali. Rosenblatt ha rappresentato nella sua illustrazione una rete composta da neuroni artificiali. È bellissima nella sua semplicità:

È facile capire in un istante un po’ di cosa sta succedendo perché le reti di connessioni attraversano le nostre vite. Le mappe delle stazioni della metropolitana mostrano reti di connessioni. Il grafo sociale di Facebook è una collezione di entità collegate. Il grafo delle connessioni di qualsiasi cosa è potente, molto più potente delle strane rappresentazioni di Novoto Studio e degli altri.

Si può persino trasformare il diagramma tecnico originale di Rosenblatt in immagini fantasiose. Tali immagini potrebbero non essere specifiche, ma possono catturare un po’ del senso di un sistema che ha un input e un output e produce connessioni tra di essi:

Una rete neurale trasforma l’input, i cerchi a sinistra, nell’output, a destra. Come avviene questa trasformazione è un insieme di pesi (al centro), che spesso confondiamo con i modelli nei dati stessi.

Il problema fondamentale delle immagini di DeepMind è che sembra che gli artisti capiscano molto poco di IA e quindi la loro missione è principalmente quella di dare la loro personale rappresentazione impressionistica di ciò che immaginano che sia l’IA. Ciò non è particolarmente utile se si desidera che il pubblico comprenda qualcosa su ciò che sta effettivamente accadendo con l’IA.

Inoltre: L’IA va ad Hollywood: Navigare la doppia lama della tecnologia emergente nella narrazione

È un peccato perché ci sono molte persone che lavorano nel campo dell’apprendimento automatico che hanno una solida comprensione della tecnologia e che producono anche visualizzazioni. Il gruppo di ricerca People+AI di Google, ad esempio, ha prodotto alcune belle visualizzazioni di vari aspetti della tecnologia.

Un’illustrazione del gruppo People+AI di Google sul compromesso tra accuratezza e privacy nell’apprendimento automatico.

Un ex membro del gruppo, il professor Martin Wattenberg dell’Università di Harvard, è un vero studioso della visualizzazione di idee complesse. È famoso, tra le altre cose, per la Mappa del Mercato di SmartMoney sviluppata per il sito web della pubblicazione finanziaria per i consumatori, che si è fusa con MarketWatch nel 2013.

Ci sono persone là fuori che capiscono l’IA e che possono comunicarne parte. Ci sono anche persone che eccellono nella narrazione visiva e nell’esplicazione. DeepMind sembra averle scartate a favore di studi di design che non sanno molto di entrambi.