Aggiornato:  | Nessun commento :

Come usare Fal AI per generare immagini realistiche di grande qualità

Come usare Fal AI per far girare le API dei modelli linguistici per creare immagini, video, audio e altro ancora mediante l'intelligenza artificiale

I modelli linguistici basati sull'intelligenza artificiale spesso non sono direttamente utilizzabili dai normali utenti. Vengono mostrati sotto forma di demo ma non si può usare una loro web app per generare immagini, video o altro.

Per addestrare i modelli però talvolta vengono rilasciate le API che consentono agli sviluppatori di creare degli strumenti online per generare contenuti con la loro intelligenza artificiale. Per la creazione di tali contenuti bisogna usare una GPU, Unità di Elaborazione Grafica, di grande potenza ed è quindi difficile un loro utilizzo da locale.

Ci sono però dei siti che hanno creato un business in questo senso. Permettono cioè agli utenti di utilizzare la loro GPU per creare contenuti con i modelli di alcune API. Abbiamo già visto come con Replicate si possano creare immagini con il modello Flux 1 e invece come con Hugging Face si possano realizzare video con le API di Sora.

Mentre su Replicate si deve subito inserire un metodo di pagamento, con Hugging Face si possono creare contenuti in modo gratuito, anche se la disponibilità della GPU non sempre è assicurata. In questo articolo vedremo un altro servizio simile ai due citati che è una via di mezzo. Dopo il login al sito, all'utente viene assegnato un credito di 1$ da utilizzare in un mese. Non mi è chiaro se alla fine del mese il dollaro di crediti viene ricostituito.

Finito il credito iniziale, per continuare a usare lo strumento, si dovranno acquistare altri crediti. Come però nel caso di Replicate i costi sono veramente minimi. Per accedere a Fal occorre loggarci con un account GitHub.

Ho pubblicato su Youtube un video tutorial in cui illustro come usare questo strumento online. Dopo aver cliccato sul link del paragrafo precedente, si va su Sign Up in alto a destra per accedere con un account GitHub.

Ricordo che ci si può registrare gratuitamente a GitHub con indirizzo email e password. Dopo il login a Fal, se si va su Billing, si visualizzerà il credito di un dollaro. Si possono acquistare altri crediti e non ci sono abbonamenti mensili o annuali. Con una spesa di $10, cioè circa 9€ si possono generare mediamente 4.500 immagini.

Cliccando su Model Gallery sul menù, si potranno sfogliare tutti i modelli disponibili su Fal.ai. In basso a sinistra sono suddivisi in categorie quali Image to Image, Text to Image, Text to Video, Text to Audio, Image to Video, ecc...

Come esempio di utilizzo di Fal.ai vedremo come utilizzare il modello Flux Realism LoRA per creare immagini.

generare immagini con FAL

Con prompt in inglese si ottengono risultati più precisi perché i prompt nelle altre lingue vengono tradotti e quindi si aggiunge un passaggio con la creazione di possibili equivoci linguistici. Come test ho usato il seguente prompt:

A photorealistic image of a front view young woman with long blonde hair, wearing a simple yet elegant red and blue dress, walking through Piazza San Marco in Venice. The sun casts a warm golden light, illuminating the historic architecture of the square, with the iconic bell tower and basilica in the background. Around her, pigeons flutter and swoop, some landing on the ground while others circle in the air, creating a lively atmosphere. The square is busy with a few scattered tourists in the background, adding a sense of movement and life to the scene.

Più in basso si va su Additional Settings per scegliere il rapporto tra larghezza e altezza delle immagini (landscape, portrait o personalizzato), il numero di passaggi di inferenza e la Guidance Scale cioè di quanto l'immagine debba essere vicina al prompt e di quanto se ne possa discostare aggiungendo imprevedibilità.

Si clicca su Run e si attende che la AI generi l'immagine. Al momento se ne può creare solo una per volta.

immagine generata con FAL

Per scaricare l'immagine si clicca sul pulsante Download posto in basso o su quello della freccia posto in alto a destra. L'immagine verrà salvata in formato PNG e verrà mostrato anche il suo costo, $0,035. Con il dollaro dato come dotazione si potranno creare approssimativamente 29 immagini utilizzabili anche commercialmente.

Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy