Nuovo strumento di intelligenza artificiale mira a democratizzare la generazione di immagini ad alta risoluzione

Innovativo strumento di intelligenza artificiale mira alla democrazia nella produzione di immagini ad alta risoluzione

Nel mondo della generazione di immagini tramite intelligenza artificiale, strumenti come DALL-E e Midjourney si stanno prendendo la corona, e non solo grazie alle loro prestazioni ad alta risoluzione. L’allenamento di questi modelli richiede investimenti e risorse così sostanziali che inevitabilmente porta a servizi centralizzati e accesso a pagamento.

Un nuovo strumento di intelligenza artificiale sviluppato dall’Università del Surrey mira a invertire questa tendenza e democratizzare la tecnologia, aprendo la generazione di immagini ad alta risoluzione a un pubblico più ampio.

Chiamato DemoFusion, il modello consente agli utenti di generare immagini di alta qualità senza la necessità di sottoscrivere un servizio o possedere un computer molto potente. Infatti, il sistema richiede solo una GPU RTX 3090 di fascia media che può essere trovata in qualsiasi PC da gaming di fascia media o un Mac M1.

L’IA è essenzialmente un’estensione plug-and-play del modello open-source Stable Diffusion XL (SDXL), che genera immagini con una risoluzione di 1024×1024. DemoFusion consente un aumento della risoluzione di 4x, 16x o anche superiore, con poche righe di codice semplici e senza alcun addestramento aggiuntivo. L’unico compromesso secondo il team è “un po’ più di pazienza”. Lo abbiamo provato su TNW e ci sono voluti circa sei minuti.

SDXL vs DemoFusion AI image generator
Crediti: Università del Surrey
Sul lato sinistro: il risultato di SDXL. Sul lato destro, il risultato di DemoFusion. Crediti: Università del Surrey

Per ottenere questi risultati ad alta risoluzione, gli scienziati hanno prima generato immagini a bassa risoluzione e poi le hanno migliorate utilizzando un processo chiamato upscaling progressivo. Questo migliora i dettagli e la risoluzione dell’SDXL lavorando su patch di immagini.

“Per la prima volta, la nostra tecnica unica consente agli utenti di migliorare le loro immagini generate dall’IA senza la necessità di una potenza di calcolo enorme o di un nuovo addestramento del modello”, ha detto il professor Yi-Zhe Song.

“L’arte digitale e le immagini sono un potente mezzo che tutti dovrebbero poter utilizzare, non solo un pugno di ricche corporazioni. Ecco perché abbiamo reso DemoFusion disponibile pubblicamente. Crediamo che possa arricchire le nostre vite e che tutti dovrebbero poterlo utilizzare.”

La nuova tecnica è disponibile online nel paper “DemoFusion: Democrazia nella generazione di immagini ad alta risoluzione senza $$$”.

Se DemoFusion riuscirà a guadagnare abbastanza appeal per competere con giganti come DALL-E di OpenAI resta da vedere, ma la sua creazione rappresenta un passo importante per aprire il potenziale di generazione di immagini dell’IA al pubblico e alla più ampia comunità tecnologica.