Perché il software open source è essenziale per placare le paure legate all’IA, secondo il fondatore di Stability.ai

La fondamentale importanza del software open source per attenuare le preoccupazioni riguardo all'IA, secondo il fondatore di Stability.ai

Immagini a diffusione stabile di un volto

Giocare con i comandi sul sito web di Stability.ai può diventare un passatempo coinvolgente per un’ora circa. Utilizzando il programma software DreamStudio creato dalla startup britannica di quattro anni, è possibile creare illustrazioni accattivanti semplicemente digitando una frase come “Gli autori altamente diversificati di ENBLE, visti attraverso le finestre della loro navetta stellare diretta a Ceti Alpha V”.

Grazie all’ingegneria della prompta, è possibile aggiungere diverse scenari come ad esempio “Gli autori di ENBLE sono una forza intergalattica di supereroi guerrieri metà umani e metà panda, che indossano una gigantesca Z sul fronte dei loro costumi”.

Inoltre: I migliori generatori di arte AI da provare

O si può modificare una foto esistente, come un ritratto del fondatore e CEO di Stability.ai, Emad Mostaque, fino a quando le sue caratteristiche non diventano argilla o frammenti di vetro, un processo simile ai filtri di Photoshop su steroidi.

Il software DreamStudio, apparso sulla scena un anno fa, fa parte della nuova generazione di programmi di intelligenza artificiale “generativa”, simile a ChatGPT di OpenAI.

Tuttavia, Mostaque si sta distinguendo come l’opposto di OpenAI. La sua idea è che programmi come ChatGPT e DreamStudio siano così importanti per il futuro dell’umanità che il mondo, e soprattutto la comunità commerciale, esigeranno di sapere come funzionano se vogliamo fidarci dei programmi con i nostri dati sensibili.

Inoltre: Come utilizzare Stable Diffusion AI per creare immagini straordinarie

“I modelli aperti saranno essenziali per i dati privati”, ha detto Mostaque durante una piccola conferenza stampa via Zoom il mese scorso. “È necessario conoscere tutto ciò che è al suo interno; questi modelli sono così potenti”.

Ciò è importante, sostiene, perché “molte persone stanno realizzando che la maggior parte dei dati preziosi nel mondo sono dati privati, dati regolamentati”, ha detto Mostaque. “Non si può utilizzare modelli opachi per i vostri chatbot sanitari, per l’istruzione o nei servizi finanziari, mentre un modello aperto, con una base open-source, ma con dati varianti in licenza e poi i dati privati dell’azienda, è davvero importante”.

Inoltre: Il successo di ChatGPT potrebbe spingere verso un’oscillazione dannosa verso il segreto nell’IA

Il piano aziendale di Mostaque può essere riassunto come “Posso essere il leader dell’aperto anche se tutti gli altri diventano chiusi”.

Immagine creata in DreamStudio di Stability.ai utilizzando la frase “Gli autori altamente diversificati di ENBLE, visti attraverso le finestre della loro navetta stellare diretta a Ceti Alpha V”.

Con “chiuso”, Mostaque faceva riferimento alla decisione presa da OpenAI a marzo di non divulgare alcun dettaglio tecnico sul suo ultimo programma di intelligenza artificiale generativa, il grande modello linguistico chiamato GPT-4. Alcuni studiosi di intelligenza artificiale hanno avvisato che questa decisione potrebbe avere un effetto intimidatorio sulla ricerca e che la mancanza di divulgazione ha enormi implicazioni morali.

Stability.ai è una delle numerose parti, sia commerciali che accademiche, che hanno risposto alla mancanza di trasparenza di OpenAI creando alternative. Alcuni si dedicano alla trasparenza in sé. Altri credono che il software open-source porterà maggiore efficienza per controllare il budget di calcolo enorme che i grandi modelli linguistici comportano.

Inoltre: Come usare ChatGPT per scrivere codice

Mostaque, ex gestore di un hedge fund, vede una grande opportunità commerciale, “un’opportunità di arbitraggio molto ampia”, come lui stesso dice, per “minimizzare il rimpianto massimo” delle aziende, in termini attuariali.

Il mondo open-source dell’ingegneria e della scienza, sostiene, può rassicurare le aziende riguardo all’IA, in particolare ai molti problemi pubblicizzati di ChatGPT e simili. Ciò include – ma non si limita a – “allucinazioni”, in cui i programmi danno la risposta sbagliata; pregiudizi; output non etico; e violazione del copyright.

Immagine creata con DreamStudio di Stability.ai con l’input, “Gli autori di ENBLE sono una forza intergalattica di supereroi guerrieri metà umani e metà panda che indossano una gigantesca Z sulla parte anteriore dei loro costumi.”

Come Mostaque vede le partnership tra scienza e impresa, il software open-source produrrà “un modello di riferimento per ogni modalità, basato su dati aperti, dai comuni ai comuni, e poi per ogni settore, con licenza commerciale in cui si conosce ogni singola cosa che è presente”, ovvero nel programma e nei suoi dati di addestramento.

Il termine “modalità” si riferisce a quale tipo di supporto multimediale, come testo, immagine, suono. La visione di Mostaque è che tutte le modalità saranno abilitate da programmi open-source di intelligenza artificiale, non solo quelle di linguaggio naturale che sono molto popolari.

Inoltre: Questa nuova tecnologia potrebbe soffiare via GPT-4 e tutto ciò che gli somiglia

Gli sforzi di Stability.ai fanno parte di un consenso emergente secondo cui molte istituzioni dovrebbero intervenire con codice laddove entità come OpenAI diventano poco trasparenti.

Alcuni gruppi si sono semplicemente basati sulle versioni precedenti di GPT di OpenAI, come un’iniziativa presentata a marzo da Cerebras Systems, produttore di hardware per l’IA, che ha rilasciato come open-source le proprie versioni addestrate dei programmi GPT.

Ma sta emergendo anche una sorta di ecosistema collaborativo.

Inoltre: Come usare Midjourney per generare qualsiasi immagine si possa immaginare

In febbraio, il gruppo di intelligenza artificiale della società Meta di Facebook ha rilasciato il software LLaMA in open-source per l’elaborazione del linguaggio naturale, che successivamente è stato sviluppato dai ricercatori dell’Università di Stanford per creare Alpaca. Successivamente, una squadra congiunta di UC Berkeley, Carnegie-Mellon, Stanford, UC San Diego e la Mohamed bin Zayed University of Artificial Intelligence di Abu Dhabi si è basata su LLaMA per creare un altro programma chiamato Vicuna.

La scorsa settimana, l’azienda di Mostaque ha rilasciato un modello di linguaggio open-source chiamato Stable Vicuna, basato sul programma Vicuna. (Una vicuña è un mammifero sudamericano, un omaggio a una lunga tradizione di nomi di animali in programmi open-source.)

Inoltre: L’IA generativa sta cambiando il percorso della tua carriera tecnologica. Cosa sapere

Mostaque ha seguito questa strada collaborativa negli ultimi anni con diverse istituzioni. La tecnologia su cui si basa DreamStudio, chiamata diffusione stabile, è parallela al GPT di OpenAI. Consente la generazione di un’immagine basata su stringhe di parole digitate dall’utente.

La diffusione stabile è stata sviluppata da Stability.ai in collaborazione con ricercatori del gruppo Computer Vision & Learning presso l’Università Ludwig Maximilian di Monaco di Baviera, in Germania, che ha pubblicato il lavoro originale sulla “diffusione latente“.

Il lavoro sulla diffusione latente, come descritto da un articolo dell’anno scorso di Robin Rombach e colleghi presso l’Università Ludwig Maximilian, mirava a ridurre il considerevole costo computazionale della generazione di immagini, che è uno dei compiti di intelligenza artificiale più intensivi dal punto di vista computazionale.

Inoltre: ChatGPT non è innovativo o rivoluzionario, secondo il capo scienziato AI di Meta

Stability.ai si è concentrata anche sulle economie di scala. Il software di diffusione stabile, sottolinea Mostaque, rappresenta “centomila gigabyte di immagini compressi in un file di due gigabyte”.

Riducendo il costo computazionale, la tecnologia dei grandi modelli di IA può essere sullo smartphone di tutti, immagina Mostaque, come un aiutante personale per ogni individuo.

“Questa è l’infrastruttura di prossima generazione”, ha detto.

Mostaque è stato un relatore invitato per una presentazione di 90 minuti organizzata da the Collective[i] Forecast, una serie di discussioni online e interattive organizzate da Collective[i], che si definisce “una piattaforma di intelligenza artificiale progettata per ottimizzare le vendite B2B”.

Inoltre: Ho utilizzato ChatGPT per scrivere la stessa routine in queste dieci oscure linguaggi di programmazione

Mostaque ha iniziato la sua carriera all’età di 18 anni programmando routine in linguaggio assembly. “I ragazzi di oggi ce l’hanno facile: metà del codice su GitHub è generato dall’IA”, ha osservato.

Mostaque è stato ispirato dall’intelligenza artificiale, ha detto, quando suo figlio è stato diagnosticato con l’autismo. “Tutti dicevano, non c’è cura, nessuna informazione”, ha ricordato. “Abbiamo creato un team di intelligenza artificiale e abbiamo sviluppato un programma per analizzare tutta la letteratura sull’autismo e quindi un modello di analisi dei percorsi per valutare le possibili cause, al fine di identificare farmaci che potessero essere riproposti per lui con l’assistenza medica”.

Inoltre: L’IA ha causato una rinascita nella ricerca e sviluppo dell’industria tecnologica, secondo il capo scienziato AI di Meta

“Alla fine è andato in una scuola ordinaria, cosa che ritengo molto positiva”, ha detto Mostaque.

Ora, Mostaque vede l’estensione dei benefici dell’IA al resto dell’umanità con programmi AI compatti ed efficienti che possono essere ampiamente distribuiti.

Siamo nel posto giusto, eticamente”, ha detto, “per quanto riguarda l’introduzione di questa tecnologia a tutti, focalizzandoci non sull’AGI [intelligenza artificiale generale] per sostituire gli esseri umani, ma su come potenziare gli esseri umani con modelli piccoli e agili”.