Da un anno e mezzo sono nati diversi strumenti per la creazione di immagini da una descrizione, mediante l'intelligenza artificiale. Ce ne sono alcuni gratuiti ma la maggior parte è a pagamento oppure offre qualcosa gratis ma per maggiori funzionalità bisogna sottoscrivere un abbonamento. Il primo strumento a essere lanciato fu Midjourney che all'inizio era gratis ma che ora è esclusivamente a pagamento. Dopo poco fu seguito da DALL·E.
Adesso questo tool viene implementato in molti servizi della Microsoft ma può essere usato solo con delle limitazioni. Ci sono anche strumenti per creare immagini con la AI che rimangono gratuiti come Leonardo.
Però, anche se nominalmente si possono creare immagini di qualsiasi tipo, sono presenti delle limitazioni di diverso genere. Per esempio non si possono creare immagini con prompt con nomi di personaggi famosi o nomi di brand.
In questo post mi occuperò di un programma che utilizza l'intelligenza artificiale per creare immagini da una descrizione che però, contrariamente ai precedenti, è open source e che quindi non è soggetto a limitazioni.
Ho pubblicato sul mio Canale Youtube un tutorial in cui illustro come usare il tool open source Fooocus.
Si apre la pagina di Fooocus su GitHub e la si scorre verso il basso dove ci sono le istruzioni per installare localmente il programma su Windows, Mac e Linux. Per quanto riguarda Windows si clicca sul link Click here to download. Verrà scaricato un file di archivio in formato .7z. Per estrarre il contenuto del file .7z si può cliccarci sopra con il destro del mouse e andare su Estrai Tutto → Estrai ma si velocizza il tutto con il gratuito 7-Zip.
Verrà creata una cartella su cui fare un doppio click per visualizzarne il contenuto. Per l'installazione del programma si clicca sul file run.bat. Oltre a questo file sono presenti quelli run_anime.bat e run_realistic.bat.
Verranno scaricati i modelli predefiniti nella cartella Fooocus \models\checkpoints. Facendo un doppio click sul file run.bat si scaricheranno anche i modelli per run_anime.bat e run_realistic.bat. Si tratta di un programma molto pesante che ha bisogno di un computer con almeno 16GB di RAM ma meglio se con 32GB di RAM.
C'è però la possibilità di usare questo tool online con lo strumento Google Colaboratory. Da loggati con un account Google, si scorre la pagina di Fooocus su GitHub fino al pulsante Colab → Open in Colab.
Ci si clicca sopra con il destro del cursore e si sceglie Apri link in un'altra scheda per visualizzare questa pagina.
Si clicca sul pulsante del Play per aprire un popup in cui andare su Esegui comunque. Inizierà a caricarsi il programma Fooocus in questo strumento di Google. Il caricamento durerà qualche minuto (da 10 a 15 min).
Al termine visualizzeremo due link in basso della pagina. Si clicca su quello a destra con il destro del cursore.
Si va quindi su Apri link in un'altra scheda per aprire una pagina del dominio gradio.live con lo strumento. Si visualizzerà quindi la sua interfaccia molto minimalista, senza immagini di test o istruzioni. La si scorre in basso.
Nel campo apposito si digita un prompt (in inglese) con la descrizione dell'immagine. Si flagga Advanced.
Sulla destra si visualizzeranno varie schede. Su quella Setting si lascia Initial, si sceglie la Performance e l'aspect ratio. Purtroppo non c'è quello orizzontale più comune da 16:9 ma si può scegliere tra molte opzioni.
Più in basso si seleziona il formato delle immagini da ottenere (PNG, JPEG e WebP) e il loro numero. Ancora più in basso si può digitare il Negative Prompt cioè quello che non si deve vedere nelle immagini generate.
Ho digitato questo prompt: "full body girl with gucci bag and a dog on a leash, realistic, photographic style". Sono andato quindi su Generate e ho atteso che la AI di Fooocus creasse le immagini secondo il prompt digitato.
Si clicca con il destro del mouse sulle immagini per poi andare su Salva immagine con nome per scaricarle.
Si può anche partire da una immagine cliccando su Input Image. Poi si trascina l'immagine nell'apposito campo.
Si digita il prompt e si possono scegliere i parametri di creazione delle immagini nelle altre schede Advanced, Style e Model. Si possono caricare fino a 4 immagini come prompt. Infine si va su Generate e si attende.
Ho digitato questo prompt: "full body girl with long light blue dress in Piazza San Marco in Venice".
Anche queste immagini possono essere scaricate cliccandoci sopra con il destro del mouse per poi andare su Salva immagine con nome. Oltre a Image Prompt ci sono anche le schede Upscale or Variation, Inpaint or Outpaint, Describe e Metadata. Con la prima si possono cercare delle variazioni della immagine caricata.
Con Inpaint or Outpaint si possono eliminare o aggiungere elementi in una immagine. Ho quindi caricato una delle 4 immagini ottenute precedentemente e ho aggiunto il prompt: add pigeons pecking on the ground.
Nel menù in basso ci sono le opzioni per inpaint or outpaint (verniciare con l'aiuto del mouse), per migliorare i dettagli (faccia, mani, occhi, ecc...) e per modificare il contenuto aggiungendo oggetti o cambiando lo sfondo.
In questi casi è bene fare dei test per avere una migliore conoscenza dello strumento. Sono andato su Generate.
Fooocus ha correttamente aggiunto dei piccioni nelle due aree su cui avevo disegnato. Come ultimo test ho deciso di modificare e migliorare il volto della ragazza cambiando anche colore degli occhi e colore dei capelli.
Il risultato però sono state delle immagini solo parzialmente diverse da quella originale che avevo caricato. In conclusione Fooocus è uno strumento particolarmente interessare per creare immagini senza preoccuparsi di caricare foto di personaggi della politica e dello spettacolo per creare meme, caricature o foto particolari.
Se si raggiunge il limite di utilizzo della GPU di Google Colab si può procedere con la nostra GPU.
Nessun commento :
Posta un commento
Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy