Cerebras svela WSE-3 il chip AI più grande al mondo per addestrare modelli 🚀

Le prestazioni di un singolo chip del tipo wafer di semiconduttore si sono raddoppiate, consentendogli di gestire efficientemente modelli di lingua di grandi dimensioni con decine di trilioni di parametri.

“`html

La startup di intelligenza artificiale Cerebras rivela il chip più grande, WSE-3, per l’intelligenza artificiale generativa.

La corsa per modelli di intelligenza artificiale sempre più grandi e migliori si sta intensificando, e Cerebras Systems, un importante concorrente di Nvidia, ha appena rivelato la sua ultima creazione – il Wafer Scale Engine 3 (WSE-3). Questo chip di intelligenza artificiale di terza generazione, il più grande semiconduttore al mondo, è pronto a rivoluzionare l’industria.

Introduzione

La domanda di modelli di intelligenza artificiale sempre più potenti continua a spingere i limiti della tecnologia dei chip. Cerebras Systems, nota per la sua innovazione nel settore, ha appena svelato il WSE-3, il chip di intelligenza artificiale più grande al mondo. Questo chip rivoluzionario è progettato specificamente per addestrare modelli di intelligenza artificiale, ottimizzando i loro pesi neurali per migliorarne le funzionalità. In questo articolo esploreremo le caratteristiche del WSE-3, ne analizzeremo l’impatto sull’industria e ne discuteremo le prospettive future.

Il Powerhouse WSE-3

Vantando notevoli miglioramenti delle prestazioni, il WSE-3 stabilisce un nuovo standard per i chip di intelligenza artificiale. Con un raddoppio della capacità di istruzioni, da 62,5 petaFLOPs a un impressionante 125 petaFLOPs, questo chip ha un impatto significativo. Anche il conteggio dei transistor ha registrato un significativo aumento, con 4 trilioni di transistor rispetto ai 2,6 trilioni del suo predecessore. Costruito utilizzando la tecnologia a 5 nanometri, il WSE-3 sfrutta l’esperienza produttiva di TSMC, uno dei principali produttori di chip al mondo.

Un Vero Passo secondo la Legge di Moore

Andrew Feldman, co-fondatore e CEO di Cerebras Systems, ha sottolineato l’importanza del WSE-3 in termini di Legge di Moore. La Legge di Moore afferma che la circuiteria del chip raddoppia approssimativamente ogni 18 mesi. Feldman ha dichiarato che il WSE-3 rappresenta un vero passo secondo la Legge di Moore, offrendo il doppio delle prestazioni mantenendo lo stesso consumo energetico e prezzo. Questo progresso tanto atteso è una svolta nell’industria.

La Dimensione Conta

Quando si tratta di dimensioni del chip, il WSE-3 sovrasta i suoi concorrenti, in particolare il GPU H100 di Nvidia. Feldman ha comparato i due, evidenziando la grande differenza di potenza. Il WSE-3 è 57 volte più grande dell’offerta di Nvidia, con 52 volte più core, 800 volte più memoria on-chip e oltre 3.700 volte più banda di tessuto. Queste statistiche impressionanti costituiscono la base delle eccezionali prestazioni del WSE-3.

Il Perfetto Equilibrio

Cerebras ha colpito il perfetto equilibrio tra calcolo e memoria nel WSE-3. Aumentando leggermente il contenuto di memoria e il numero di core di calcolo, hanno creato un chip che ottimizza entrambi gli aspetti. Feldman afferma che ritengono di aver raggiunto la sintesi ideale di calcolo e memoria, offrendo le migliori prestazioni per l’addestramento di intelligenza artificiale.

Riscrivere il Libro delle Regole sui Tempi di Addestramento

Il WSE-3 offre immense capacità di calcolo, in grado di gestire un teorico grande modello di lingua con 24 trilioni di parametri. Questo è un ordine di grandezza maggiore rispetto agli strumenti di intelligenza artificiale generativa di alta gamma come il GPT-4 di OpenAI, che si dice abbia solo 1 trilione di parametri. La macchina di Cerebras consente l’esecuzione di tutti i 24 trilioni di parametri su un singolo dispositivo. In confronto, le GPU richiedono una programmazione molto più complessa e significativamente più linee di codice per ottenere risultati simili.

Q&A

Q: Come si confronta il WSE-3 con gli altri chip di intelligenza artificiale in termini di dimensioni?

A: Il WSE-3 è il chip di intelligenza artificiale più grande disponibile, sovrastando i concorrenti. Rispetto al GPU H100 di Nvidia, è 57 volte più grande e offre significativamente più core, memoria on-chip e banda di tessuto.

Q: Qual è l’importanza delle capacità di calcolo e memoria aumentate del WSE-3?

A: Colpendo il giusto equilibrio tra calcolo e memoria, il WSE-3 raggiunge prestazioni ottimali per l’addestramento di intelligenza artificiale. Ciò garantisce che i modelli possano essere addestrati più velocemente e in modo più efficiente.

Q: Come semplifica la programmazione del WSE-3 rispetto alle GPU?

A: La macchina di Cerebras è più facile da programmare rispetto alle GPU. Mentre le GPU richiedono una programmazione complessa, il WSE-3 riduce il numero di righe di codice necessarie per ottenere risultati simili, rendendolo più accessibile e user-friendly.

“““html

Q: Come si confronta la performance del WSE-3 con altri chip AI?

A: Il WSE-3 offre prestazioni impareggiabili, raggiungendo 125 petaFLOPs di throughput delle istruzioni. Questa enorme potenza computazionale permette di gestire modelli linguistici di grandi dimensioni con fino a 24 trilioni di parametri, distinguendosi dai suoi concorrenti.

Una Partnership per un’Inferenza Potenziata

Oltre alle notevoli capacità di addestramento del WSE-3, Cerebras ha stretto una collaborazione con il gigante dei chip Qualcomm per potenziare il processo di inferenza. Utilizzando il processore AI 100 di Qualcomm, Cerebras mira a ridurre i costi nell’esecuzione di modelli AI generativi in produzione. Attraverso tecniche come la sparsità, la decodifica speculativa e la ricerca dell’architettura di rete, Cerebras e Qualcomm hanno ottenuto significativi miglioramenti nelle prestazioni di inferenza.

Guardando Verso il Futuro

L’introduzione del WSE-3 segna un momento cruciale nello sviluppo dei chip AI. Con le sue prestazioni rivoluzionarie ed efficienza, questo chip definisce nuovi standard per il settore. Con il continuo aumento delle dimensioni e della complessità dei modelli AI, chip come il WSE-3 svolgeranno un ruolo cruciale nello spingere avanti il campo.

Conclusione

Il WSE-3 di Cerebras è una testimonianza della costante ricerca di modelli AI più potenti. Con le sue dimensioni, prestazioni e ottimizzazioni per l’addestramento senza precedenti, il WSE-3 è pronto a rivoluzionare il settore. Questo chip rappresenta un grande passo avanti, fornendo capacità computazionali potenziate che alimenteranno i progressi nella ricerca e nello sviluppo dell’AI.

Ricordati di condividere questo articolo e di farci sapere le tue opinioni nei commenti qui sotto! 💬


Riferimenti:

  1. La Corsa ai Video Generativi Cinese si Riscalda
  2. Ottieni Microsoft Project 2021 e Visio 2021 con il 30% di Sconto
  3. Come i Firewall AI Sicureranno le Tue Nuove Applicazioni Aziendali
  4. AlphaTheta (precedentemente Pioneer DJ Corp) Lancia il Primo Controller e Altoparlante DJ Wireless
  5. Il Moonshot AI Cinese Volge a una Valutazione di $25 miliardi, Raccogliendo $1 miliardo per LLM-Focused Long Context
  6. Il Pioniere dell’AI Cerebras sta Avendo “Un Anno Mostro” nell’AI Ibrida Computing
  7. airfocus Si Aggiudica $75 milioni per Sfidare il Software di Gestione Progetti
  8. Rendere GenAI Più Efficiente con un Nuovo Tipo di Chip

“`