Fate un passo indietro Bing Image Creator! Google annuncia nuovo strumento di generazione di immagini con intelligenza artificiale

Ritirati Bing Image Creator! Google presenta il nuovo strumento di creazione di immagini con intelligenza artificiale

Da oggi, l’esperimento di ricerca di Google alimentato dall’IA, chiamato SGE, è multimodale. Sulla scia del rilascio di DALL-E 3 di OpenAI e di Bing Image Creator di Microsoft, SGE di Google ora ha il suo stesso strumento di generazione di immagini dall’IA.

Alimentato dai modelli di diffusione testo-immagine Imagen di Google, gli utenti con accesso a SGE possono descrivere un’immagine che desiderano e in pochi secondi SGE fornirà loro quattro varianti tra cui scegliere. Da lì, gli utenti possono ulteriormente modificare la descrizione per personalizzare l’immagine che desiderano vedere. Nell’esempio di Google, la richiesta originale è per un’immagine fantasiosa di un capybara con indosso un cappello da chef che cucina pancetta. Gli utenti possono modificare la descrizione per far cucinare al capybara delle patate hash brown al posto della pancetta.

Nella corsa all’IA, o Thunderdome – o come volete chiamarlo quando i giganti della tecnologia competono per la supremazia nel mercato dell’IA – la multimodalità è un ambito strategico molto ambito. La multimodalità si riferisce alla capacità di un modello di IA di comprendere e elaborare diversi tipi di media, inclusi immagini e audio.

Un chatbot alimentato dall’IA che conversa con gli utenti è una cosa, ma “vedere,” “sentire”, e produrre risultati creativi rappresenta un livello completamente nuovo di sofisticazione dell’IA. Di recente, OpenAI ha rilasciato l’ultima versione del suo strumento di generazione di immagini DALL-E 3. Microsoft, che è un investitore di OpenAI, utilizza ora DALL-E 3 per Bing Image Creator. E ora, Google sta portando la sua stessa versione in SGE.

L’ampio accesso agli strumenti di generazione di immagini dell’IA non è privo di gravi preoccupazioni, compresa la diffusione di disinformazione e violazioni del copyright. SGE è stato addestrato per bloccare contenuti dannosi o fuorvianti che violano la politica di IA generativa di Google e non genererà immagini che contengano volti umani fotorealistici. Inoltre, le figure pubbliche di rilievo (ad esempio, celebrità) saranno bloccate dai risultati di generazione di immagini, prevenendo potenziali deepfake. Come precauzione aggiuntiva, lo strumento è destinato agli utenti di età superiore ai 18 anni.

Le immagini create da SGE avranno metadati e filigrane incorporate per indicare che sono state generate dall’IA. Inoltre, i modelli di Imagen di Google sono stati addestrati su contenuti disponibili pubblicamente. ENBLE ha chiesto a Google se i dati degli utenti relativi alle richieste di testo e alle immagini generate vengono utilizzati per addestrare il modello. Abbiamo anche chiesto se esiste un’opzione di opt-out. Aggiorneremo questo articolo quando riceveremo una risposta.

Un’altra novità di SGE è la possibilità di redigere contenuti scritti. Si tratta della stessa funzione disponibile in Bard, il chatbot di Google, ma può ora essere utilizzata direttamente nella funzione di ricerca di SGE, risparmiandovi il tempo di passare avanti e indietro tra finestre.

La funzione SGE di Google che mostra la possibilità di scrivere un messaggio utilizzando l'IA generativa

La generazione di immagini e la scrittura di messaggi all’interno di SGE vengono ora introdotte in inglese per gli utenti negli Stati Uniti.