OpenAI potenzia il suo strumento di intelligenza artificiale per la generazione di immagini con DALL-E 3

OpenAI potenzia DALL-E 3 per generare immagini con intelligenza artificiale.

OpenAI ha presentato la nuova generazione del suo strumento di creazione di immagini. Conosciuta come DALL-E 3, la nuova versione è progettata per comprendere meglio le descrizioni testuali al fine di creare immagini più precise e fedeli. Sulla sua nuova pagina web di DALL-E 3, OpenAI non ha rivelato molto sullo strumento, ma ha fornito suggerimenti su come mira a superare il suo predecessore DALL-E 2.

DALL-E 3 è progettato per comprendere meglio le sfumature e i dettagli delle tue descrizioni, creando così immagini più accurate, ha dichiarato OpenAI. Gli attuali generatori di immagini basati sull’IA a volte ignorano le parole nelle tue descrizioni, risultando in immagini che non colpiscono nel segno. Sulla base delle immagini mostrate sulla pagina di DALL-E 3, la nuova versione sembra in grado di creare immagini più accurate, dettagliate e imaginative.

Inoltre: I migliori generatori di immagini basati su IA del 2023

Con l’attenzione attorno all’IA, i generatori di immagini sono diventati popolari tra individui e aziende. Strumenti come DALL-E 2, il creatore di immagini di Bing di Microsoft, Midjourney, Stable Diffusion, DreamStudio e Craiyon funzionano più o meno allo stesso modo. Utilizzando un prompt, descrivi l’immagine che desideri generare. Scegli uno stile e altri attributi. In risposta, lo strumento crea una o più immagini che corrispondono idealmente alla tua richiesta.

Ma come molti dei bot basati sull’IA di oggi, questi generatori di immagini possono essere difficili da usare. Di solito, devi formulare il tuo prompt nel modo giusto. E anche in questo caso, non sempre interpretano correttamente le tue richieste. Riconoscendo che i moderni sistemi di testo-immagine ti costringono a imparare l’ingegneria del prompt, OpenAI ha affermato che DALL-E 3 rappresenterebbe un progresso nella generazione di immagini che si attengono meglio alle tue descrizioni.

Basato su ChatGPT, DALL-E 3 sarà accessibile tramite la piattaforma ChatGPT. Il vantaggio qui è che potrai utilizzare ChatGPT per elaborare le tue idee e i tuoi prompt per le immagini. Potrai quindi fare una richiesta per creare un’immagine utilizzando una semplice frase o un paragrafo più dettagliato.

Inoltre: I miei due plugin preferiti di ChatGPT Plus e le cose straordinarie che posso fare con loro

Negli esempi offerti sulla pagina di DALL-E 3, OpenAI ha mostrato come funzionerebbe la nuova versione.

Un’immagine è stata generata sulla base della descrizione: “Piccoli re delle patate che indossano corone maestose, seduti su troni, supervisionando il loro vasto regno di patate pieno di sudditi e castelli di patate”.

Una seconda immagine è stata creata dalla descrizione: “Un’illustrazione di un avocado seduto sulla sedia di uno psicoterapeuta, che dice ‘Mi sento così vuoto dentro’, con un buco delle dimensioni di un nocciolo nel suo centro. Lo psicoterapeuta, un cucchiaio, prende appunti.”

E due immagini sono state generate sulla base di una descrizione che recitava: “Un dipinto ad olio espressivo di un giocatore di pallacanestro che schiaccia, raffigurato come un’esplosione di una nebulosa.” Una immagine è stata creata con DALL-E 2, mentre l’altra con DALL-E 3.

OpenAI ha inoltre sottolineato che ha limitato la capacità di DALL-E 3 di creare contenuti violenti, per adulti o odiosi, come ha fatto con le versioni precedenti. Sono stati apportati miglioramenti in termini di sicurezza nelle aree della creazione di figure pubbliche e di certi pregiudizi dannosi. Ad esempio, lo strumento rifiuterà i prompt che richiedono una figura pubblica per nome.

Inoltre: Chi possiede il codice, le immagini e le narrazioni generate dall’IA?

Le immagini generate dall’IA possono anche rappresentare un problema quando vengono utilizzate per raffigurare una persona o un evento reale, inducendo le persone a pensare che l’immagine sia reale. Per contrastare questo problema, OpenAI ha dichiarato di testare un nuovo strumento interno che può determinare se un’immagine è stata creata da DALL-E 3 o meno.

Attualmente in fase di test chiusi, DALL-E 3 è previsto per il lancio per i clienti di ChatGPT Plus e Enterprise all’inizio di ottobre.