Novità e trend

L'intelligenza artificiale crea immagini da testi in tempo reale

Michelle Brändle
30/11/2023
Traduzione: tradotto automaticamente

Esistono diversi generatori di AI che creano un'immagine a partire da un testo. Quando li si utilizza è sempre necessario avere pazienza, perché spesso ci vogliono diversi minuti per ottenere un risultato. Stability AI cambia questa situazione.

Stability AI è un'azienda che crea generatori di testo, immagini e video basati su modelli di deep learning. Il loro generatore di testo-immagine si chiama Stable Diffusion. Questo genera un'immagine in base a un testo descrittivo, chiamato prompt. La prima versione è in circolazione da oltre un anno, con un successore migliorato, lo Stable Diffusion XL.

Con Stable Diffusion XL, crei immagini generate dall'IA sulla base di prompt, cioè descrizioni testuali.
Con Stable Diffusion XL, crei immagini generate dall'IA sulla base di prompt, cioè descrizioni testuali.
Fonte: Stability AI

Tuttavia, sia la prima versione che la successiva richiedono diversi minuti dall'inserimento del testo al risultato. Stability AI ha ora rilasciato una nuova versione del suo generatore di immagini come demo. Il cosiddetto Stable Diffusion XL Turbo (SDXL-Turbo) si basa sul modello Stable Diffusion XL e, a differenza del suo fratello maggiore, fornisce risultati in pochi secondi.

Stability AI ha già spiegato come funziona il suo generatore di immagini.

Ho già trattato il funzionamento dei generatori in modo più dettagliato in articoli precedenti. Il principio per l'utente è semplice: inserisci un testo, chiamato "prompt", e il programma ti propone una o più immagini basate su questa descrizione. Si tratta di un'ottima fonte di ispirazione per i professionisti della creatività, ad esempio.

  • Opinione

    L’arte artificiale. Ovvero, come l’AI rivoluziona il mercato dell’arte

    di Michelle Brändle

Poiché un programma come questo deve accedere a un database piuttosto ampio per produrre un risultato, richiede un'enorme potenza di calcolo. E richiede molto tempo. Se poi il risultato non ti piace, devi modificare, cambiare o addirittura riscrivere il testo. Il processo ricomincia da capo. Questo può essere noioso.

Cosa c'è di nuovo con SDXL Turbo?

Con l'SDXL-Turbo, Stability AI ha creato un programma che fornisce immagini dai prompt così rapidamente che loro stessi lo definiscono un risultato in tempo reale. Le immagini risultanti non sono così dettagliate come la versione più lenta, ma sono comunque di buona qualità. Tuttavia, la velocità della loro creazione le rende già di per sé impressionanti.

Un risultato più o meno dolce di Stable Diffusion XL Turbo.
Un risultato più o meno dolce di Stable Diffusion XL Turbo.
Fonte: Stable Diffusion XL Turbo

Normalmente, il processo di un generatore di immagini prevede dai 20 ai 50 passaggi. L'innovazione di SDXL-Turbo è che il programma richiede solo fino a quattro passaggi per l'output. Stability AI chiama questa procedura "Adversarial Diffusion Distillation". È piuttosto complesso e non per niente Stability AI ha spiegato in dettaglio la teoria che vi sta dietro.

La cosa interessante è che il risultato non solo fa risparmiare tempo, ma secondo Stability AI il processo richiede anche meno potenza di calcolo. Quindi anche il mio Macbook Air con chip M1 ha abbastanza potenza per ottenere risultati divertenti. Puoi trovare la versione demo su questo sito. Dopo circa 10 frasi e risultati, tuttavia, la versione gratuita è esaurita. Le immagini possono essere ulteriormente modificate grazie al pulsante dell'editor. Ad esempio, puoi rimuovere lo sfondo premendo un pulsante o visualizzare altri tre risultati simili. Anche in questo caso, le modifiche richiedono un po' di tempo in più.

Con Stable Diffusion XL Turbo, posso anche rimuovere lo sfondo o modificare l'immagine in altri modi.
Con Stable Diffusion XL Turbo, posso anche rimuovere lo sfondo o modificare l'immagine in altri modi.
Fonte: Stable Diffusion XL Turbo
Foto di copertina: Michelle Brändle

A 15 persone piace questo articolo


User Avatar
User Avatar

Nel mio mondo, Super Mario insegue gli Stormtrooper con un unicorno e Harley Quinn mescola cocktail per Eddie e Peter al bar della spiaggia. Ovunque possa dare sfogo alla mia creatività, le mie dita fremono. O forse perché nelle mie vene non scorre altro che cioccolato, brillantini e caffè. 

Commenti

Avatar