Meta svela il suo primo chip AI personalizzato

Meta unveils its first custom AI chip

Meta ha presentato giovedì il suo primo chip, l’MTIA, ottimizzato per eseguire motori di raccomandazione e beneficiando della stretta collaborazione con gli sviluppatori di PyTorch dell’azienda.

Meta, proprietaria di Facebook, WhatsApp e Instagram, ha presentato giovedì il suo primo chip progettato su misura per l’elaborazione di programmi di intelligenza artificiale, chiamato Meta Training and Inference Accelerator, o “MTIA”.

Il chip, composto da una serie di blocchi di circuiti che operano in parallelo, esegue software che ottimizza i programmi utilizzando il framework open-source PyTorch di Meta.

Inoltre: Cos’è il deep learning? Tutto quello che devi sapere

Meta descrive il chip come ottimizzato per un particolare tipo di programma di intelligenza artificiale: i modelli di raccomandazione dell’apprendimento profondo. Questi sono programmi in grado di analizzare un pattern di attività, come il clic su post su un social network, e prevedere materiale correlato, possibilmente rilevante, da raccomandare all’utente.

Il chip è la versione uno di quella che Meta definisce una famiglia di chip, e si dice che sia iniziato nel 2020. Non è stato fornito alcun dettaglio su quando arriveranno i modelli futuri del chip.

Meta segue altre grandi aziende tecnologiche che hanno sviluppato i propri chip per l’intelligenza artificiale, oltre all’utilizzo dei chip GPU standard di Nvidia che sono diventati predominanti nel settore. Microsoft, Google e Amazon hanno tutti presentato diversi chip personalizzati negli ultimi anni per gestire diversi aspetti dei programmi di intelligenza artificiale.

Inoltre: Nvidia, Dell e Qualcomm accelerano i risultati dell’IA negli ultimi test di benchmark

L’annuncio di Meta fa parte di una presentazione più ampia di giovedì, in cui diversi dirigenti di Meta hanno discusso di come stanno potenziando le capacità di calcolo di Meta per l’intelligenza artificiale. 

Oltre al chip MTIA, l’azienda ha discusso di un “data center di prossima generazione” che sta costruendo e che “sarà un design ottimizzato per l’IA, con supporto per hardware di raffreddamento a liquido per l’IA e una rete AI ad alte prestazioni che collega migliaia di chip AI per cluster di addestramento AI a livello di data center.”

Inoltre: ChatGPT e la nuova intelligenza artificiale stanno creando problemi nella sicurezza informatica

Meta ha anche rivelato un chip personalizzato per la codifica video, chiamato Meta Scalable Video Processor. Il chip è progettato per comprimere e decomprimere video in modo più efficiente e codificarli in diversi formati per l’upload e la visualizzazione da parte degli utenti di Facebook. Meta ha dichiarato che il chip MSVP “può offrire una performance di transcodifica di picco di 4K a 15fps nella configurazione di qualità più alta con 1 ingresso e 5 uscite e può scalare fino a 4K a 60fps nella configurazione di qualità standard.”

Meta ha affermato che, anziché fare affidamento sulle GPU di Nvidia o sui processori Intel, “con uno sguardo alle future applicazioni legate all’IA, crediamo che l’hardware dedicato sia la soluzione migliore in termini di potenza di calcolo ed efficienza” per i video. L’azienda ha osservato che le persone trascorrono metà del loro tempo su Facebook guardando video, con oltre quattro miliardi di visualizzazioni di video al giorno.

Inoltre: Incontra lo sviluppatore post-AI: più creativo, più orientato al business

Meta ha accennato per anni allo sviluppo di un chip, come quando il suo capo scienziato AI, Yann LeCun, è stato intervistato da ENBLE nel 2019 in merito. L’azienda ha mantenuto il silenzio sui dettagli di quegli sforzi, anche quando i suoi concorrenti hanno presentato chip dopo chip e quando sono nate startup come Cerebras Systems, Graphcore e SambaNova Systems per sfidare Nvidia con chip esotici focalizzati sull’IA.

L’MTIA ha aspetti simili ai chip delle startup. Al centro del chip, una rete di sessantaquattro cosiddetti elementi di processo, disposti in una griglia di otto per otto, richiama molti design per i chip di intelligenza artificiale che adottano ciò che viene chiamato una “matrice sistolica”, in cui i dati possono muoversi attraverso gli elementi alla velocità massima. 

L’MTIA è in qualche modo insolito perché è progettato per gestire entrambe le due fasi principali dei programmi di intelligenza artificiale, l’addestramento e l’inferenza. L’addestramento è la fase in cui la rete neurale di un programma di IA viene perfezionata fino a quando funziona come previsto. L’inferenza è l’utilizzo effettivo della rete neurale per fare previsioni in risposta alle richieste degli utenti. Di solito, le due fasi hanno requisiti molto diversi in termini di elaborazione del computer e vengono gestite da design di chip distinti.

Inoltre: Questa nuova tecnologia potrebbe soffiare via GPT-4 e tutto ciò che gli assomiglia

Il chip MTIA, secondo Meta, può essere fino a tre volte più efficiente delle GPU in termini di numero di operazioni in virgola mobile al secondo per ogni watt di energia consumata. Tuttavia, quando il chip viene incaricato di reti neurali più complesse, le GPU sono più performanti, ha detto Meta, indicando che è necessario lavorare ulteriormente sulle future versioni del chip per gestire compiti complessi.

La presentazione di Meta da parte dei suoi ingegneri di giovedì ha sottolineato come MTIA beneficia del “co-design” hardware-software, in cui gli ingegneri hardware scambiano idee in un dialogo costante con gli sviluppatori PyTorch dell’azienda.

Oltre a scrivere codice da eseguire sul chip in PyTorch o C++, gli sviluppatori possono scrivere in un linguaggio dedicato sviluppato per il chip chiamato KNYFE. Il linguaggio KNYFE “prende una breve descrizione ad alto livello di un operatore di apprendimento automatico come input e genera codice kernel C++ ottimizzato a basso livello che rappresenta l’implementazione di questo operatore per MTIA”, ha detto Meta.

Inoltre: Nvidia afferma di poter impedire ai chatbot di allucinare

Meta ha discusso di come ha integrato più chip MTIA nei computer server basati sul progetto Open Compute Project che Meta ha contribuito a creare.

Maggiori dettagli sul MTIA sono forniti in un post del blog di Meta.

Gli ingegneri di Meta presenteranno un paper sul chip alla conferenza International Symposium on Computer Architecture a Orlando, in Florida, a giugno, dal titolo “MTIA: First Generation Silicon Targeting Meta’s Recommendation System”.