Dall-E 3 di OpenAI è un generatore di arte alimentato da ChatGPT

Dall-E 3 di OpenAI è un generatore di arte.

OpenAI ha annunciato Dall-E 3, il suo ultimo strumento di arte AI. Utilizza il popolare chatbot di OpenAI, ChatGPT, per aiutare a creare opere d’arte più complesse e attentamente composte, espandendo automaticamente un prompt in modo da fornire al generatore istruzioni più dettagliate e coerenti.

La novità di Dall-E 3 sta nel modo in cui rimuove parte della complessità richiesta per affinare il testo che viene alimentato al programma, ciò che è noto come “ingegneria del prompt”, e nel modo in cui consente agli utenti di apportare modifiche attraverso l’interfaccia conversazionale di ChatGPT. Il nuovo strumento potrebbe contribuire a abbassare la soglia per la generazione di opere d’arte AI sofisticate e potrebbe aiutare OpenAI a mantenere la leadership grazie alle superiori capacità del suo chatbot.

Arte AI cortesia di OpenAI

Prendiamo ad esempio questa immagine del re della patata.

Questo tipo di arte AI eccentrica è diventata comune nei social media grazie a diversi strumenti che trasformano un prompt di testo in una composizione visiva. Ma questa è stata creata con un significativo aiuto artistico da parte di ChatGPT, che ha preso un breve prompt e lo ha trasformato in uno più dettagliato, includendo istruzioni su come comporlo correttamente.

Questo è un grande passo avanti non solo per Dall-E, ma per l’arte AI generativa nel suo complesso. Dall-E, un portmanteau del personaggio Pixar Wall-E e dell’artista Salvador Dalí, annunciato nel 2021 e lanciato nel 2022, consiste in un algoritmo che viene alimentato con enormi quantità di immagini etichettate prese da Internet e altre fonti. Utilizza ciò che è noto come un modello di diffusione per prevedere come rappresentare un’immagine per un determinato prompt. Con una quantità sufficientemente grande di dati, questo può produrre immagini complesse, coerenti ed esteticamente piacevoli. Quello che è diverso con Dall-E 3 è il modo in cui interagiscono gli esseri umani e le macchine.

Arte AI cortesia di OpenAI

Questa immagine, creata da Dall-E 3, mostra come l’utilizzo di ChatGPT per completare un prompt produca un’immagine più coerente e sofisticata. Normalmente potrebbe richiedere una grande quantità di ingegneria del prompt, in cui l’utente prova prompt sempre più complessi per creare qualcosa di sofisticato. Ma con Dall-E 3, ChatGPT si occupa del lavoro di creare quel prompt più sofisticato.

Arte AI cortesia di OpenAI

Dall-E 3 ha prodotto questa immagine in risposta al seguente prompt: “Un’illustrazione di un cuore umano fatto di vetro traslucido, che si erge su un piedistallo in mezzo a un mare tempestoso. Raggi di luce solare squarciano le nuvole, illuminando il cuore e rivelando un piccolo universo al suo interno. La citazione ‘Trova l’universo dentro di te’ è incisa in caratteri audaci all’orizzonte.”

Dall-E 3 consentirà anche agli utenti di perfezionare una creazione attraverso ChatGPT, come se stessero chiedendo a un vero artista di apportare modifiche. “Non dovrai preoccuparti di smanettare con prompt molto lunghi”, afferma Aditya Ramesh, ricercatore capo e responsabile del team Dall-E. “Invece, puoi interagire con ChatGPT come se stessi parlando con un collega.”

Gabriel Goh, ricercatore capo del team Dall-E, ha dimostrato il trucco a ENBLE chiedendo a Dall-E 3 di creare diversi poster promozionali per un immaginario ristorante di noodle. Dopo avergli presentato alcune opzioni, Goh ha chiesto a Dall-E 3, tramite ChatGPT, di prendere una di esse e trasformarla in un’illustrazione di un’insegna appesa fuori da un ristorante.

Dall-E 3 è disponibile ora tramite ChatGPT Plus, una versione a pagamento del chatbot.

Nel 2022, l’emergere di numerosi generatori di arte AI ha segnato l’inizio di un’esplosione più ampia di AI generativa. Molti dei primi generatori erano rudimentali e incapaci di perfezionare o modificare le immagini. Oltre ad OpenAI, startup come Midjourney, Stable Diffusion e Ideogram hanno attirato finanziamenti significativi e interesse pubblico. Ma l’uso di questi sistemi di arte AI ha anche suscitato preoccupazioni sul fatto che gli artisti umani professionisti potrebbero essere sostituiti e su come le aziende di AI utilizzino materiale protetto da copyright per addestrare i loro algoritmi.

In risposta a questa controversia, OpenAI ha annunciato oggi che avvierà un modo per consentire agli artisti di rimuovere le proprie opere dalle future sessioni di addestramento. Dall-E 3 impedirà anche agli utenti di cercare di generare un’opera d’arte nello stile di un artista famoso rilevando quando ciò è incluso in un suggerimento.

OpenAI ha anche dei salvaguardie per impedire agli utenti di generare arte pornografica o violenta dal punto di vista grafico, o immagini che ritraggono personaggi pubblici. Sandhini Agarwal, una ricercatrice di politiche presso OpenAI, afferma che la nuova versione di Dall-E è stata sottoposta a ancora più “red teaming”, che coinvolge i ricercatori nel cercare di superare le sue protezioni. “Una richiesta molto esplicita di contenuti audaci, è qualcosa che dovrà passare attraverso un classificatore e sarà respinta”, afferma Agarwal. Alcuni programmatori, naturalmente, hanno creato generatori di immagini open source senza alcuna restrizione.

Uno dei risultati più notevoli del boom nell’arte generata dall’IA è l’immaginario surreale che ha invaso i social media. L’immagine seguente è stata generata utilizzando Dall-E 3 con l’aiuto di ChatGPT, utilizzando questo suggerimento: “Un vasto paesaggio composto interamente da varie carni si estende di fronte allo spettatore. Colline tenere e succulente di arrosto, alberi di cosce di pollo, fiumi di pancetta e massi di prosciutto creano una scena surreale, ma appetitosa. Il cielo è adornato da un sole di peperoni e nuvole di salame.”

Arte IA di cortesia di OpenAI