Fei-Fei Li ha iniziato una rivoluzione nell’Intelligenza Artificiale vedendo come un algoritmo.

Fei-Fei Li sta guidando una rivoluzione nell'Intelligenza Artificiale vedendo l'algoritmo come un'opportunità.

All’inizio della pandemia, un agente – letterario, non software – suggerì a Fei-Fei Li di scrivere un libro. L’approccio aveva senso. Ha lasciato un’impronta indelebile nel campo dell’intelligenza artificiale guidando un progetto avviato nel 2006 chiamato ImageNet. Ha classificato milioni di immagini digitali per formare ciò che è diventato un terreno di addestramento fondamentale per i sistemi di intelligenza artificiale che dominano il nostro mondo oggi. Li è attualmente il co-direttore fondatore dell’Istituto di Intelligenza Artificiale Centrata sull’Uomo (HAI) di Stanford, il cui stesso nome è un appello alla cooperazione, se non alla coevoluzione, tra persone e macchine intelligenti. Accettando la sfida dell’agente, Li ha trascorso l’anno di lockdown producendo una bozza. Ma quando il suo cofondatore al HAI, il filosofo Jon Etchemendy, l’ha letto, le ha detto di ricominciare – questa volta includendo il suo personale viaggio nel campo. “Ha detto che ci sono un sacco di persone tecniche che possono leggere un libro sull’IA”, dice Li. “Ma stavo perdendo l’opportunità di dire a tutti i giovani immigrati, donne e persone di origine diversa che possono fare l’IA anche loro.”

Testo normale

ISCRIVITI per Testo normale

Li è una persona riservata che si sente a disagio nel parlare di sé. Ma ha ingegnosamente trovato il modo di integrare la sua esperienza come immigrata che è arrivata negli Stati Uniti a 16 anni, senza padronanza della lingua, e ha superato gli ostacoli per diventare una figura chiave in questa tecnologia cruciale. Lungo il percorso verso la sua posizione attuale, è stata anche direttrice del Laboratorio AI di Stanford e chief scientist di AI e machine learning presso Google Cloud. Li afferma che il suo libro, I mondi che vedo, è strutturato come una doppia elica, con la sua ricerca personale e la traiettoria dell’IA intrecciate in un tutto spiraleggiante. “Continuiamo a guardarci attraverso il riflesso di ciò che siamo”, dice Li. “Parte del riflesso è la tecnologia stessa. Il mondo più difficile da vedere siamo noi stessi.”

Le trame si uniscono in modo più drammatico nel suo racconto della creazione e implementazione di ImageNet. Li racconta la sua determinazione nel sfidare coloro, compresi i suoi colleghi, che dubitavano fosse possibile etichettare e categorizzare milioni di immagini, con almeno 1000 esempi per ogni categoria di una lista in continua espansione, dai cuscini alle viole. Lo sforzo richiese non solo una fortezza tecnica, ma anche il sudore di letteralmente migliaia di persone (spoiler: il Mechanical Turk di Amazon ha contribuito a rendere possibile il trucco). Il progetto è comprensibile solo quando comprendiamo il suo percorso personale. La temerarietà nel affrontare un progetto così rischioso proveniva dal sostegno dei suoi genitori, che nonostante le difficoltà finanziarie insistevano perché lei rifiutasse un lavoro redditizio nel mondo degli affari per perseguire il suo sogno di diventare una scienziata. Realizzare questa sfida avrebbe rappresentato la massima convalida del loro sacrificio.

Il risultato è stato profondo. Li descrive come la costruzione di ImageNet l’abbia portata a guardare il mondo nello stesso modo in cui potrebbe farlo un algoritmo di rete neurale artificiale. Quando si è trovata di fronte a cani, alberi, mobili e altri oggetti nel mondo reale, la sua mente ha iniziato a vedere oltre la categorizzazione istintiva di ciò che percepiva e ha iniziato a percepire quali aspetti di un oggetto potessero rivelarne l’essenza al software. Quali indizi visivi avrebbero permesso a un’intelligenza digitale di identificare quelle cose e di determinare ulteriormente le varie sottocategorie – beagle contro levrieri, quercia contro bambù, sedia Eames contro dondolo Mission? C’è una sezione affascinante su come il suo team abbia cercato di raccogliere le immagini di ogni possibile modello di auto. Quando ImageNet è stato completato nel 2009, Li ha lanciato un concorso in cui i ricercatori hanno utilizzato l’insieme di dati per addestrare i loro algoritmi di apprendimento automatico, per vedere se i computer potevano raggiungere nuove vette nell’identificazione degli oggetti. Nel 2012, il vincitore, AlexNet, è emerso dal laboratorio di Geoffrey Hinton all’Università di Toronto e ha segnato un enorme balzo rispetto ai vincitori precedenti. Si potrebbe sostenere che la combinazione di ImageNet e AlexNet abbia dato il via all’esplosione del deep learning che ancora oggi ci preoccupa e che alimenta ChatGPT.

Ciò che Li e il suo team non hanno capito è che questo nuovo modo di vedere potrebbe anche diventare legato alla triste propensione dell’umanità a permettere al pregiudizio di contaminare ciò che vediamo. Nel suo libro, riporta un “senso di colpa” quando è emersa la notizia che Google aveva etichettato erroneamente le persone di colore come gorilla. Altri esempi spiacevoli sono seguiti. “Quando Internet presenta un’immagine prevalentemente bianca, occidentale e spesso maschile della vita quotidiana, ci troviamo con una tecnologia che fatica a dare un senso a tutti”, scrive Li, riconoscendo tardivamente il difetto. È stata spinta a lanciare un programma chiamato AI4All per coinvolgere donne e persone di colore nel settore. “Quando stavamo facendo pionierismo con ImageNet, non sapevamo quasi nulla di quello che sappiamo oggi”, afferma Li, chiarendo che stava usando “noi” in senso collettivo, non solo per riferirsi al suo piccolo team. “Siamo enormemente evoluti da allora. Ma se ci sono cose che non abbiamo fatto bene, dobbiamo correggerle”.

Il giorno in cui ho parlato con Li, The Washington Post ha pubblicato un lungo articolo su come il pregiudizio nell’apprendimento automatico rimanga un problema serio. Gli attuali generatori di immagini AI come Dall-E e Stable Diffusion producono ancora stereotipi quando interpretano prompt neutri. Quando viene chiesto di immaginare “una persona produttiva”, i sistemi mostrano principalmente uomini bianchi, ma una richiesta di “una persona ai servizi sociali” mostrerà spesso persone di colore. L’inventore chiave di ImageNet, epicentro dell’inculcazione del pregiudizio umano nell’IA, è convinto che il problema possa essere risolto? “La parola ‘convinto’ sarebbe troppo semplice”, dice. “Sono cautamente ottimista che ci siano soluzioni tecniche, soluzioni di governance e richieste di mercato per migliorare sempre di più”. Questo ottimismo cauto si estende anche al modo in cui parla delle previsioni incombenti che l’IA potrebbe portare all’estinzione umana. “Non voglio dare un falso senso di tranquillità”, dice. “Ma non voglio neanche diffondere un senso di tristezza e disperazione, perché gli esseri umani hanno bisogno di speranza”.

Li crede che un elemento importante nello sviluppo dell’IA sarà il finanziamento per assicurarsi che le prossime innovazioni epocali, come ImageNet, provengano dall’accademia e dal governo, non solo dalle imprese commerciali focalizzate sul profitto e restie a condividere con il pubblico. Lo scorso giugno, era tra un piccolo gruppo di scienziati, esperti e critici dell’IA che si sono incontrati faccia a faccia con Joe Biden quando il presidente ha visitato San Francisco. Ha spinto il governo a finanziare più innovazioni epocali nell’IA. “Se priviamo il settore pubblico delle risorse, stiamo facendo un disservizio alla prossima generazione”, gli ha detto. (Nota che non ha detto che tale privazione fosse assimilabile a un omicidio, come ha affermato Marc Andreessen nel suo recente saggio di 5200 parole in stile Ayn Rand.)

E cosa ha detto il presidente a Li quando ha proposto tali innovazioni epocali? “Beh, non ha scritto un assegno lì per lì”, dice. “Ma era interessato”. Sottolinea che l’ultima ampia ordinanza esecutiva di Biden sull’IA ha una sezione dedicata agli investimenti nel settore pubblico. Li non è del tipo che si gode una vittoria pubblica, ma sembra aver ottenuto il risultato che voleva. Forse questo investimento rende più probabile che la prossima grande avanzata a scala di ImageNet nell’IA provenga da qualcuno come Li, che non è corso subito da Google o qualche startup prima che l’inchiostro della sua laurea si asciugasse.

Nel suo libro Fei-Fei Li descrive il risveglio del dormiente Stanford AI Lab nel Gates Building nel ben curato campus dell’università. Ma come ho descritto quasi 40 anni fa nel mio libro Hackers, il SAIL originale era a parte, in più di un senso. Nota la descrizione iniziale di Internet alla fine di questo passaggio.

[L’ambientazione di SAIL era] un ex centro conferenze semicircolare in cemento, vetro e legno di sequoia sulle colline che dominano il campus di Stanford. All’interno dell’edificio, gli hacker lavoravano a una delle 64 postazioni sparse per gli uffici. Invece dell’immaginario da sparatoria nel fantascientifico Tech Square del [MIT], l’immaginario di Stanford era la gentile tradizione di elfi, hobbit e maghi descritta nella trilogia della Terra di Mezzo di J.R.R. Tolkien. Le stanze nel laboratorio di AI avevano il nome di luoghi della Terra di Mezzo e la stampante di SAIL era attrezzata per gestire tre diversi font Elfi…

Non è passato molto tempo prima che gli hacker di SAIL notassero che lo spazio di accesso tra il soffitto basso e la stanza poteva essere un comodo rifugio per dormire e molti di loro vissero lì per anni. Un hacker di sistemi trascorse i primi anni ’70 vivendo nella sua auto disfunzionale parcheggiata nel parcheggio fuori dall’edificio – una volta alla settimana faceva una corsa in bicicletta fino a Palo Alto per procurarsi provviste. L’altro alternativa per il cibo era il Prancing Pony, il distributore automatico di cibo di SAIL, carico di delizie alimentari naturali e ravioli fritti da un ristorante cinese locale. Ogni hacker aveva un account sul Prancing Pony, gestito dal computer.

Stanford e altri laboratori, che fossero nelle università come Carnegie-Mellon o nei centri di ricerca come Stanford Research Institute, si avvicinarono l’uno all’altro quando ARPA collegò i loro sistemi informatici tramite una rete di comunicazione. Questo “ARPAnet” fu molto influenzato dall’Etica degli Hacker in quanto tra i suoi valori c’era la convinzione che i sistemi dovessero essere decentralizzati, incoraggiare l’esplorazione e favorire il libero flusso delle informazioni. Da un computer in qualsiasi “nodo” dell’ARPAnet, potevi lavorare come se fossi seduto davanti a un terminale di un computer distante. Le persone si inviavano una quantità enorme di posta elettronica, scambiavano esoterismi tecnici, collaboravano su progetti, giocavano ad Adventure, si facevano amicizie strette con altri hacker che non avevano mai conosciuto di persona e rimanevano in contatto con gli amici dei luoghi in cui avevano hackerato in precedenza.

Liene chiede: “Possono nascere grandi idee da menti grandi e alterate? Gli individui intelligenti non dovrebbero alterare un po’ di più le loro menti in questi giorni?”

Ciao, Liene. Presumo che tu stia parlando di sostanze psichedeliche, che sono molto in voga. E certamente hanno avuto il loro impatto su alcuni dei migliori talenti della tecnologia. In un recente podcast di Joe Rogan, Sam Altman, spronato dall’entusiasmo dell’ospite, ha elogiato la virtù della terapia psichedelica. E Steve Jobs ha detto al giornalista John Markoff che prendere LSD “è stata una delle due o tre cose più importanti che ha fatto nella sua vita.” Pensa a questo quando prendi il tuo iPhone 58 volte al giorno.

Ma non sono solo le sostanze chimiche a piegare le menti. Come spiego nell’articolo sopra, la mente di Fei-Fei Li è stata alterata vedendo il modo in cui le reti neurali vedevano il mondo. E non ha avuto bisogno di visitare una farmacia o un venditore! Per quanto mi riguarda, le sostanze più inebrianti sono in vendita sugli scaffali delle librerie. Tra le pagine di quei libri ci sono idee che possono elevare anche le menti più elevate. E metto in dubbio l’intelligenza di chi non legge. Ad esempio: il crypto-fraud Samuel Bankman-Fried, che ha detto che nessun libro vale la pena di essere letto e “Se hai scritto un libro, hai fatto un errore e avrebbe dovuto essere un post di blog di sei paragrafi.” Forse Sam si renderà conto dell’errore dei suoi modi e altererà la sua mente nella biblioteca del carcere.

Puoi inviare domande a mail@ENBLE.com. Scrivi ASK LEVY nella riga dell’oggetto.

I pipistrelli vampiri si stanno dirigendo verso gli Stati Uniti. Nel peggiore dei casi: casi di rabbia e più sequel di Twilight.

La mia anteprima esclusiva di TGL, la lega sportiva che reinventa il golf come competizione da stadio ad alta tecnologia, fatta apposta per la TV. C’è anche Tiger!

Come la sorveglianza e i video di telefoni cellulari sono diventati il linguaggio civico di San Francisco. Leggi tutto qui.

Vuoi liberare un maiale? Dai un’occhiata al manuale operativo del gruppo anarchico più rivoluzionario per la liberazione animale.

Applica questo gadget con intelligenza artificiale sul petto per (forse) liberarti dalla dipendenza dallo smartphone.