Ha lasciato una posizione di leader in GenAI come protesta. Ora vuole creare sistemi più equi per gli artisti.

Lascia la sua posizione di leader in GenAI in segno di protesta. Ora si impegna a creare sistemi più equi per gli artisti.

Ed Newton-Rex aveva raggiunto un punto di rottura. In qualità di vice presidente audio presso Stability AI, il trentaseienne era in prima linea in una rivoluzione nella creatività computazionale. Ma c’era un crescente disagio sulla strategia del movimento.

Stability stava diventando un gigante emergente nell’AI generativa. La startup con sede a Londra possiede Stability Diffusion, uno dei generatori di immagini più popolari al mondo. Recentemente si è anche espansa nei generatori di musica con il lancio a settembre di Stable Audio, uno strumento sviluppato dallo stesso Newton-Rex. Ma questi due sistemi stavano percorrendo strade conflittuali.

Stable Audio era addestrato su musica con licenza. Il modello è stato alimentato con un set di dati di oltre 800.000 file provenienti dalla libreria di musica stock AudioSparx. Eventuali materiali con copyright erano stati forniti con il consenso.

Stable Diffusion aveva preso una direzione diversa. Il sistema era stato addestrato su miliardi di immagini scaricate dal web senza il consenso dei creatori. Molte di queste erano opere con copyright. Tutte erano state acquisite senza pagamento.

Queste immagini avevano insegnato molto bene al modello. Le produzioni di Diffusion hanno portato Stability a una valutazione di $1 miliardo in una raccolta di fondi da $101 milioni l’anno scorso. Ma il sistema stava suscitando opposizione da parte degli artisti, incluso Newton-Rex.

Il dilemma etico di GenAI

Pianista, compositore e pioniere di GenAI, Newton-Rex era in contrasto con lo scraping non autorizzato.

“Ho sempre voluto assicurarmi che questi strumenti fossero costruiti con il consenso dei creatori dei dati di addestramento”, dice a TNW in una videochiamata dalla sua casa nella Silicon Valley.

Stability era lontana dall’essere l’unica sostenitrice di questo metodo. I generatori di immagini MidJourney e Dall-E adottano lo stesso approccio, così come il generatore di testo ChatGPT di OpenAI e il programmatore CoPilot. Le arti visive, le opere scritte, la musica e persino il codice vengono costantemente rielaborati senza consenso.

In risposta, creatori e detentori dei diritti d’autore hanno avviato numerose cause legali. Sono arrabbiati perché il loro lavoro viene preso, adattato e monetizzato senza permesso o rimunerazione. Sono anche preoccupati per il loro sostentamento.

“È nell’interesse dell’industria dell’IA far credere alle persone che solo i grandi attori possono farlo”.

Gli artisti sostengono che l’IA generativa sta rubando il loro lavoro. Le aziende dietro ai sistemi non sono d’accordo. In un recente documento presentato all’Ufficio del Copyright degli Stati Uniti, Stability ha sostenuto che l’addestramento fosse “uso equo” perché i risultati sono “trasformativi” e “socialmente benefici”.

Di conseguenza, l’azienda ha sostenuto che non c’era violazione del copyright. La pratica poteva quindi continuare senza autorizzazione o pagamenti. È una pretesa diventata comune in GenAI, ma che Newton-Rex ha contestato.

“Ha davvero mostrato la posizione in cui l’intera industria si trova in questo momento e non è un posto in cui mi sento felice”, dice.

La partenza non significa che Newton-Rex abbia abbandonato l’IA generativa. Al contrario, ha intenzione di continuare a lavorare nel settore, ma seguendo un modello più equo. Non è la missione impossibile che i giganti di GenAI potrebbero ritrarre. In realtà, diverse aziende l’hanno già realizzato.

Alternative disponibili

Newton-Rex ha una lunga esperienza nella creatività computazionale. Dopo aver studiato musica all’Università di Cambridge, ha fondato Jukedeck, un compositore AI pionieristico. L’app utilizzava l’apprendimento automatico per comporre musica originale su richiesta. Nel 2019, è stata acquisita dal proprietario di TikTok, Bytedance.

Newton-Rex ha poi ricoperto incarichi come direttore del prodotto presso TikTok e direttore del prodotto presso Voicey, un’app di collaborazione musicale acquisita da Snap, prima di unirsi a Stability AI l’anno scorso. Gli è stato affidato il compito di guidare gli sforzi audio della startup.

“Volevo creare un prodotto nella generazione musicale che mostrasse cosa si può fare con dati effettivamente autorizzati, dove si è d’accordo con i titolari dei diritti,” dice.

Questo obiettivo lo metteva in contrasto con molti leader dell’industria. GenAI si stava avvicinando al mainstream e le aziende si affrettavano a lanciare nuovi sistemi il più velocemente possibile. Estrarre contenuti dal web era una scorciatoia interessante.

Si è dimostrato anche efficace. In quel momento c’erano ancora dubbi sul fatto che i dataset autorizzati fossero abbastanza ampi per addestrare modelli all’avanguardia. Sono state sollevate anche questioni sulla qualità dei dati. Ma entrambe queste supposizioni sono ora smentite.

“Quello che chiamiamo dati di addestramento è in realtà l’output creativo umano.”

Stable Audio ha fornito una fonte di controprova. Il modello sottostante del sistema è stato addestrato sulla musica autorizzata in collaborazione con i titolari dei diritti. I risultati ottenuti hanno ricevuto applausi. Il mese scorso, Time ha nominato Stable Audio una delle migliori invenzioni del 2023.

“Per un paio di mesi è stato il top nel campo della generazione musicale, ed è stato addestrato su musica che avevamo autorizzato,” dice Newton-Rex. “Per me, questo ha dimostrato che si può fare.”

In effetti, ora c’è una lista crescente di aziende che dimostrano che si può fare. Una di queste è Adobe, che ha recentemente rilasciato un modello di apprendimento automatico generativo chiamato Firefly. Il sistema è addestrato su immagini prese da Creative Commons, Wikimedia e Flickr Commons, oltre a 300 milioni di immagini e video in Adobe Stock e di pubblico dominio.

Dato che questi dati vengono forniti con il permesso, è sicuro per un uso commerciale. Adobe ha anche sottolineato che gli autori il cui lavoro viene utilizzato avranno diritto a un compenso.

Un collage di immagini generate da Adobe Firefly
Le immagini in questo collage sono state generate da Adobe Firefly, che è stato addestrato su immagini autorizzate. Credito: Adobe

Un altro modello alternativo arriva da Getty Images. A settembre, l’azienda ha lanciato Generative AI by Getty Images, che viene addestrato solo sulla vasta libreria della piattaforma. Craig Peters, CEO dell’azienda, ha dichiarato che lo strumento soddisfa “le esigenze commerciali nel rispetto della proprietà intellettuale dei creatori.”

Anche Nvidia ha sviluppato GenAI in collaborazione con i detentori dei diritti d’autore. Il servizio Picasso del gigante tecnologico è stato addestrato su immagini autorizzate da Getty Images, Shutterstock e Adobe. Nvidia ha dichiarato di avere intenzione di pagare i diritti d’autore.

Questi approcci non funzioneranno per tutti. Come megacorp con un ampio pool di contenuti, le aziende che li sostengono hanno risorse che poche aziende possono eguagliare. Tuttavia, le startup mostrano che l’autorizzazione può essere ottenuta anche con un budget limitato.

GenAI per le persone

Bria AI fornisce un esempio. L’azienda ha sviluppato un nuovo modello open source commerciale per la generazione di immagini di alta qualità. Tutto l’addestramento viene fatto su dataset autorizzati, creati in collaborazione con importanti agenzie fotografiche e artisti. Un modello di condivisione dei ricavi fornisce ai creatori e ai titolari dei diritti un compenso per il loro contributo.

È un approccio simile a quello usato da Newton-Rex in Stable Audio, ma non è l’unico.

Le aziende possono anche fornire pagamenti anticipati agli artisti, creare joint venture che danno ai detentori dei diritti una quota di equità nell’azienda o utilizzare contenuti con una licenza Creative Commons, che possono essere liberamente riutilizzati senza il permesso esplicito. Le aziende GenAI possono ignorare questi sforzi, ma hanno motivi secondari.

“È nell’interesse dell’industria dell’intelligenza artificiale far credere alle persone che solo i grandi attori possono farlo, ma non è vero,” dice Newton-Rex.

“Potrebbe essere necessario essere un po’ inventivi. Sicuramente bisogna fare alcune trattative e essere disposti a dedicare tempo. Ma in definitiva, ciò che chiamiamo dati di addestramento e ciò che è in realtà l’output creativo umano è una risorsa per le aziende tecnologiche. Devono impegnarsi per ottenerla nello stesso modo in cui devono impegnarsi per ottenere qualsiasi altra risorsa.”

Se sono disposte a farlo, GenAI può funzionare in armonia con gli artisti umani. E speriamo che ci permetta di godere della creatività liberata da entrambi.