Getty Images si tuffa nel mondo dell’IA generativa

Getty Images entra nell'IA generativa

All’inizio di quest’anno, il fornitore di servizi di foto stock Getty Images ha citato in giudizio Stability AI per quello che Getty ha definito un uso improprio di oltre 12 milioni di foto di Getty per l’addestramento del tool di generazione di foto AI di Stability, Stable Diffusion.

Ora Getty Images sta rilasciando il proprio tool di generazione di foto AI, che sarà disponibile per i suoi clienti commerciali. E per farlo, si avvale di un grande nome: Nvidia.

Chiamato semplicemente Generative AI by Getty Images, lo strumento è accessibile solo tramite pagamento sul sito Getty.com. Sarà inoltre disponibile tramite un’API, in modo che i clienti di Getty possano integrarlo in altre applicazioni. È progettato esclusivamente per uso commerciale; ad esempio, un fotoeditor o un marketer potrebbero aver bisogno di trovare un’immagine generica di una scarpa da ginnastica o di uno smartphone e, anziché utilizzare un’immagine di stock tradizionale, potrebbero chiedere allo strumento di generare qualcosa di nuovo. (Getty ha dichiarato che non si aspetta che le organizzazioni di notizie lo utilizzino.)

Lo strumento AI di Getty viene addestrato esclusivamente su immagini di Getty – centinaia di milioni di esse – e utilizza l’architettura modello di Nvidia, Edify. Il CEO di Getty Images, Craig Peters, afferma che, grazie alla partnership dell’azienda con Nvidia, “avevamo praticamente un numero illimitato di unità di elaborazione grafica, cosa che quasi nessuno ha al giorno d’oggi. Abbiamo potuto effettuare numerosi cicli di addestramento con Nvidia e il loro team per ottenere il risultato desiderato”.

L’esperienza utente all’interno di Generative AI by Getty Images.

Cortesia di Getty

Peters afferma che Getty non paga per accedere alla tecnologia di Nvidia, né Nvidia paga Getty per i suoi contenuti. “Siamo partner. Solo partner”.

Con il lancio di questo tool, Getty si confronta con il rivale Shutterstock, che ha stretto una partnership con OpenAI per consentire a quest’ultima di addestrare i propri modelli Dall-E su immagini di Shutterstock; e con Adobe, che ha recentemente inserito il suo motore di generazione di AI, Firefly, in Photoshop. Adobe Firefly è addestrato su “centinaia di milioni di immagini Adobe Stock ad alta risoluzione, contenuti con licenza aperta e contenuti di dominio pubblico in cui il copyright è scaduto”, secondo il sito web di Adobe.

L’immersione di Getty nel mondo delle foto AI solleva questioni etiche riguardanti l’addestramento di un modello AI su immagini di fotografi raccolte in più di due decenni e su come le aziende che esplorano questo modello di business pagheranno in ultima analisi questi fotografi.

Sul lato delle licenze, Peters insiste sul fatto che il generatore di foto AI di Getty è diverso dagli altri strumenti di immagine AI perché Getty ha regolarizzato i diritti legali delle foto che vengono utilizzate per addestrare i modelli. “È commercialmente pulito e ciò ci consente di garantirlo al 100%”, afferma. “Quindi, se vuoi utilizzare l’AI generativa per essere più creativo ed esplorare limiti diversi, Getty Images è l’unico offerta sul mercato che è completamente indennizzata”. Ciò significa che se un cliente scarica e utilizza un’immagine di Getty generata dall’AI e un collaboratore di Getty fa notare che assomiglia molto alla sua opera originale, Getty garantisce al cliente che è coperto dagli accordi di licenza royalty-free di Getty.

Getty ha anche dichiarato in un comunicato stampa che i clienti che utilizzano lo strumento avranno il diritto di utilizzo perpetuo, mondiale e non esclusivo delle immagini e che i nuovi contenuti generati dall’AI non saranno aggiunti alle librerie di contenuti esistenti di Getty per l’uso da parte di altri.

Peters afferma che i fotografi contributori saranno compensati per l’inclusione dei loro contenuti nell’insieme di addestramento dell’AI. I clienti pagheranno una quota di abbonamento, in base al numero di “chiamate generative” effettuate, ovvero al numero di foto che desiderano generare, e i fotografi verranno pagati con questa somma. “Paghiamo circa il 30% per ogni dollaro generato, quindi sarà costante”, afferma Peters.

Ciò che non è chiaro, non solo per Getty Images, ma per i generatori di foto AI in generale, è esattamente quali foto (tra milioni o miliardi) dell’insieme di addestramento verranno accreditate per una nuova immagine generata. Tali questioni mettono in discussione la prospettiva di una compensazione equa.

Quando gli viene chiesto come Getty identificherà l’insieme di contributori per ogni immagine generata, Peters afferma: “[Noi] non lo facciamo. Ci sono tecnologie che sostengono di farlo, ma non possono farlo. Faremo un’allocazione in base a due dimensioni: la quantità di contenuto che hai contribuito all’insieme di addestramento e le prestazioni di quel contenuto nel tempo”.

“Penso che siamo sostanzialmente diversi dal 90% degli altri strumenti [di foto AI] là fuori, dove fondamentalmente rubano il contenuto e basta”, ha aggiunto Peters.

Per Getty, questo punto è fondamentale nel contesto complesso e emergente dei diritti d’autore dell’AI generativa. L’AI generativa, che si basa su modelli di linguaggio di deep learning che migliorano sempre di più nel prevedere il testo nel tempo, funziona raccogliendo una vasta quantità di dati condivisi online. Come ha sottolineato l’organizzazione no profit Tech Policy Press, molte di queste tecnologie confondono la linea tra l’acquisizione dei dati per addestrare i modelli AI e la commercializzazione delle opere appena create.

“Wikipedia è la spina dorsale dei grandi modelli linguistici; Wikimedia Commons e siti come Flickr Commons dominano nell’addestramento dei dati per i sistemi di generazione di immagini”, scrive il ricercatore e artista Eryk Salvaggio. “Questi sistemi, tuttavia, ignorano i requisiti su come il materiale può essere condiviso. Non attribuiscono gli autori o le fonti, violando la clausola di condivisione reciproca”.

Quest’estate, il comico Sarah Silverman e due autori, Richard Kadrey e Christopher Golden, hanno citato in giudizio Meta e OpenAI presso il tribunale federale di San Francisco per il modo in cui queste aziende avrebbero presumibilmente utilizzato materiali protetti da copyright, essenzialmente “raschiando” internet per addestrare i loro modelli di intelligenza artificiale. Poi la scorsa settimana, il New York Times ha riferito che la Authors Guild e oltre una dozzina di autori, tra cui John Grisham, Jonathan Franzen, Jodi Picoult e George Saunders, hanno citato in giudizio OpenAI per aver addestrato il suo chatbot sui loro libri e per aver prodotto “opere derivate” simili al loro lavoro o che riassumono completamente i loro libri.

Getty non prevede che le organizzazioni giornalistiche utilizzino il suo nuovo generatore di immagini AI.

Cortesia di Getty

Bhamati Viswanathan, che insegna diritto d’autore e proprietà intellettuale presso la New England School of Law ed è presidente della sezione New England della Copyright Society degli Stati Uniti, afferma che anche se Getty Images raccoglie solo dalla sua libreria di foto con licenza, l’uso della generative AI addestrata su milioni di foto professionali solleva ancora molte domande senza risposta.

“Esiste una clausola di opt-out in cui gli artisti possono dire: ‘Non voglio che le mie immagini vengano utilizzate in questo modo?'”, dice Viswanathan. “Assumono che tutti gli artisti diano il loro permesso? Gli artisti possono negoziare le tariffe? Le condizioni sono diverse se si è già sotto contratto con Getty Images rispetto a iscriversi come nuovo collaboratore?”

Sottolinea che ci sono delle somiglianze con le preoccupazioni sollevate nell’ambito dello sciopero di Hollywood di quest’anno, in cui scrittori e attori si sono battuti non solo per salari più equi, ma anche per termini e condizioni più chiari su come gli studi possano utilizzare l’intelligenza artificiale per il lavoro creativo. “Tutti nel mondo artistico sono spaventati”, dice Viswanathan.

Viswanathan osserva anche che i sostenitori dei contenuti generati da intelligenza artificiale stanno procedendo avanti sotto la presunta protezione dell’uso trasformativo secondo la legge sul copyright degli Stati Uniti – l’idea, in sostanza, è che le nuove opere generate da AI siano protette dalla dottrina del fair use se trasformano adeguatamente l’opera originale in qualcos’altro. Ma ciò potrebbe ancora causare danni potenziali per gli artisti, come i fotografi professionisti, se l’arte alterata è abbastanza simile o sufficiente all’originale da far sì che un cliente scelga di utilizzare immagini generate invece di pagare per l’originale.

“Alcune di queste aziende di AI stanno dicendo: ‘Lo faremo in modo responsabile e gli artisti saranno compensati'”, afferma. “Ma penso che gli artisti siano ancora molto incerti su questo. Gli artisti saranno coinvolti nelle discussioni?”