La Llama Open Source di Meta sconvolge la corsa dei cavalli dell’IA

Meta's Llama Open Source disrupts the AI horse race

A maggio è trapelata online una memo anonima apparentemente scritta da un ricercatore di Google preoccupato per il futuro dell’azienda. Sosteneva che, mentre i dirigenti litigavano sulla minaccia competitiva della tecnologia di generazione di testo di OpenAI, il software open source stava “silenziosamente mangiando il nostro pranzo”.

Come prova, la memo citava Llama, un grande modello linguistico creato da Meta che inizialmente era disponibile solo per i ricercatori su invito, ma che in pochi giorni è trapelato su 4Chan ed è diventato rapidamente popolare tra i programmatori che lo hanno adattato e sviluppato ulteriormente. Nelle settimane successive al suo rilascio, varianti chiamate Alpaca e Vicuna erano quasi altrettanto buone di ChatGPT, ma sufficientemente agili da personalizzare su un computer portatile. “L’impatto sulla comunità non può essere sottovalutato”, diceva la memo di Google trapelata. “All’improvviso chiunque può sperimentare”. La scorsa settimana, Meta ha rilasciato la seconda versione del suo modello inaspettatamente popolare, Llama 2. Questa volta è open source e gratuito per l’uso commerciale fin dall’inizio. La nuova versione è stata creata utilizzando il 40% in più di dati rispetto all’originale, e un chatbot costruito con il modello è in grado di generare risultati alla pari di ChatGPT di OpenAI, afferma Meta. Proprio come ChatGPT di Google, Bard, e altri modelli AI generativi rilasciati di recente, Llama 2 probabilmente ha costato milioni di dollari per essere creato. Ma solo il sistema di Meta è disponibile gratuitamente per sviluppatori, startup e altri interessati a creare variazioni personalizzate del modello. Fornendo un’opzione più economica, Llama 2 di Meta rende più facile per piccole aziende o singoli programmatori creare nuovi prodotti e servizi, accelerando potenzialmente l’attuale boom dell’AI.

Meta non offre solo Llama 2. Ha il supporto di importanti partner che stanno già rendendo il modello disponibile ai loro clienti, tra cui le startup di intelligenza artificiale Hugging Face, Databricks e OctoML.

Microsoft, che ha investito 10 miliardi di dollari in OpenAI, offrirà comunque il download di Llama 2 agli sviluppatori per l’uso nel cloud o su Windows. Durante una conferenza per i clienti di Microsoft la scorsa settimana, il CEO Satya Nadella ha parlato con entusiasmo della possibilità per gli sviluppatori di utilizzare l’IA open source di Meta insieme alle offerte proprietarie di OpenAI. Anche la divisione cloud di Amazon, AWS, offre accesso a Llama 2.

Ahmad Al-Dahle, vice presidente per l’IA generativa di Meta, si rifiuta di dire quale ruolo abbia avuto la fuga del primo modello Llama nella nuova strategia di Meta per Llama 2.

“Se guardiamo alla storia di Meta, siamo stati un grande sostenitore dell’open source”, dice, citando l’esempio di PyTorch, un popolare strumento per sviluppatori che lavorano con l’apprendimento automatico. “Uno dei principali motivi per costruire una comunità intorno a questo era che abbiamo visto che c’era una domanda al di là dei ricercatori per lavorare su questi modelli e migliorarli”. Al-Dahle afferma che il lavoro sulla sviluppo di Llama 3 è già in corso, ma non specifica in che cosa sarà diverso.

Sebbene Llama 2 dia credibilità a Meta come leader nell’IA open source, non tutti gli aspetti del rilascio possono essere caratterizzati come aperti. I dati di addestramento utilizzati per creare il modello sono descritti nei materiali di rilascio solo come “fonti disponibili online pubblicamente”, e l’azienda non fornirà ulteriori dettagli su ciò che è stato incluso nella creazione del modello.

La licenza di Meta per Llama 2 richiede anche alle aziende con più di 700 milioni di utenti attivi mensili di stipulare un accordo di licenza separato con Meta. Non è chiaro il motivo, ma questa clausola crea un ostacolo per gli altri giganti tecnologici che vogliono costruire sul sistema. Il modello è anche fornito con una politica di utilizzo accettabile, che vieta la generazione di codice maligno, la promozione della violenza o l’attività criminale, l’abuso o il molesto. Meta non ha risposto a una domanda su quali azioni potrebbe intraprendere se Llama 2 fosse utilizzato in violazione di tale politica.

Jon Turow, un investitore presso Madrona Ventures a Seattle, afferma che il passaggio di Meta dal tentativo di limitare la distribuzione del primo modello Llama all’open-source del secondo potrebbe consentire una nuova ondata di creatività utilizzando grandi modelli linguistici. “Gli sviluppatori e gli imprenditori sono molto ingegnosi, e troveranno cosa possono ottenere da Llama 2”, dice. Turow paragona la scelta di Meta di rilasciare Llama 2 questo mese all’introduzione da parte di Google del sistema operativo mobile Android nel 2007 per sfidare iOS di Apple. Offrendo un’alternativa economica ma potente, Meta può diventare un contrappeso ai sistemi proprietari come quelli sviluppati da OpenAI, stimolando l’innovazione che potrebbe generare idee che aiutano a migliorare i prodotti e i servizi di Meta.

Llama 2 è il primo modello rilasciato apertamente alla pari con ChatGPT, afferma Nathan Lambert, un ricercatore di intelligenza artificiale presso Hugging Face, una startup che rilascia software open source di apprendimento automatico, inclusi modelli generativi. Non considera il progetto veramente open source, a causa delle limitate rivelazioni di Meta sul suo sviluppo, ma è stupito dal numero di variazioni di Llama 2 che vede nel suo feed sui social media. Un esempio è l’ultima versione di WizardLM, un sistema di intelligenza artificiale, simile a ChatGPT, progettato per seguire istruzioni complesse. Otto modelli su dieci attualmente in tendenza su Hugging Face, molti dei quali sono fatti per generare testo conversazionale, sono variazioni di Llama 2.

“Penso che si possa sostenere che Llama 2 sia l’evento più importante dell’anno nell’ambito dell’AI”, dice Lambert. Afferma che i modelli proprietari hanno ancora l’avventaggio oggi, ma crede che le versioni successive di Llama raggiungeranno il livello degli stessi e, presto, saranno in grado di svolgere la maggior parte dei compiti per cui oggi ci si rivolge a ChatGPT.

Lambert afferma anche che il rilascio di Llama 2 lascia alcune domande senza risposta, in parte a causa della mancanza di documentazione dei dati di addestramento. E rimarrà ancora il fatto che solo i principali attori come Meta, Google, Microsoft e OpenAI avranno le risorse di calcolo e il personale necessari per sviluppare modelli di linguaggio di grandi dimensioni.

Ma è ottimista che, nonostante il successo dell’approccio proprietario di OpenAI, i modelli di linguaggio stiano entrando in un’era di trasparenza. Un accordo volontario tra la Casa Bianca e sette importanti aziende di AI richiede test su questioni come il potenziale di discriminazione o l’impatto sulla società o sulla sicurezza nazionale prima del loro impiego.

È una tendenza che potrebbe essere messa in discussione dalle crescenti questioni sulla responsabilità legale dei sistemi di AI e dalla crescente pressione regolamentare da parte dei politici, che temono che attori malintenzionati inizieranno a utilizzare modelli open source.

Come Demis Hassabis, il ricercatore di AI che ora guida lo sviluppo di AI di Google, Turow non è d’accordo con l’affermazione fatta dal memo di Google trapelato secondo cui esso e altre importanti aziende di AI sono minacciate dall’AI open source. Egli ritiene che i dati, il talento e l’accesso alla potenza di calcolo continueranno a proteggere le più grandi aziende tecnologiche, ma non le renderanno invincibili.

Ora sta osservando cosa faranno le startup e i ricercatori con Llama 2, aspettandosi che lo migliorino rapidamente, come è successo con la prima iterazione del modello di Meta. Afferma che ciò dovrebbe creare nuove possibilità sia per le startup che per il campo più ampio dell’AI. “Stiamo vedendo l’open source migliorare continuamente, quindi potrebbero esserci delle sorprese che mettono in difficoltà i leader precoci”, afferma Turow. “Non so cosa succederà”.