Alcuni progetti sulla intelligenza artificiale al momento sono stati rilasciati solo sotto forma di Demo senza che gli utenti li possano usare effettivamente. C'è però un interessante escamotage per farlo nel caso in cui questi progetti abbiano rilasciato delle API, acronimo di Application Programming Interface. In questo post vedremo come generare delle immagini con le API di Flux 1 mentre in un prossimo articolo vedremo come creare video con Sora.
Flux 1 al momento può essere utilizzato in tre modalità. Nella pagina linkata si clicca su Get Flux per visualizzarle. Quella fruibile da tutti è la PRO mentre della Dev e della Schnell si possono consultare le repository su GitHub.
Il fatto che sia un progetto pubblicato su GitHub, il sito di elezione per la condivisione tra sviluppatori, significa che si tratta di una realizzazione open source. Si può però usare Flux 1 Pro attraverso le sue API tramite Replicate.
Ho pubblicato sul mio Canale Youtube un tutorial per creare immagini con la AI di Flux 1 tramite Replicate.
Registrarsi a questi strumenti è un po' macchinoso. Per prima cosa, se ancora non lo si è fatto, si apre la home di GitHub e si va in alto a destra su Sign Up. Si digita un indirizzo email, si va su Continue e si completa la registrazione gratuita inserendo anche una password. Si va di nuovo su Continue. Si digita un username e si clicca ancora su Continue per due volte. Si verifica l'account risolvendo un puzzle e inserendo un codice inviatoci.
Si potrà quindi accedere a GitHub e dare delle informazioni riguardo al numero di persone della nostra equipe (Just me se si è soli) e se si è studenti o insegnanti. Si selezionano i campi di interesse e si va ancora su Continue.
Nella schermata successiva si clicca su Continue for free per un account gratuito che comunque dà delle funzionalità sovrabbondanti per un utente comune. L'accesso a GitHub è necessario per il login a Replicate.
Si torna nella pagina di Flux 1 e si clicca sulla icona posta sulla destra di Flux 1 Pro.
Verrà aperta la pagina delle API di Flux 1 su Replicate. In basso si clicca sul pulsante Sign In with GitHub.
Si aprirà una finestra modale in cui cliccare sul pulsante Authorize Replicate per usare il nostro account GitHub.
Il login su Replicate non sarà però sufficiente. Dovremo anche aggiungere un metodo di pagamento. Personalmente ho aggiunto una carta prepagata PostePay ma si può usare anche Google Wallet, ex Google Pay.
Si clicca su Manage Billing → Setup Billing per poi digitare i dati di un sistema di pagamento.
Non vi preoccupate troppo della spesa perché si tratta di importi veramente minimi. Dopo aver completato l'inserimento del metodo di pagamento, potremo tornare nella pagina Black-Forest-Labs/Flux-Pro.
Cliccando su Priced per image generated si scoprirà quanto ci costerà creare immagini con Flux 1.
Il costo è di 0,055$ per immagine o in altri termini si possono creare 18 immagini con 1$ cioè circa 20 immagini con 1€. Non c'è nessun abbonamento mensile o annuale. Si paga solo per il numero di immagini che generiamo con l'account. Si potrebbe obiettare sul perché pagare se con altri metodi si creano immagini gratis.
La ragione sarà presto evidente a tutti gli utenti. Essendo un tool open source i prompt non vengono censurati e anzi si può spostare al livello minimo la protezione da query problematiche per realizzare immagini che altri strumenti non accetterebbero. Inoltre le immagini create con questo sistema non hanno watermark sovrimpressi.
COME GENERARE IMMAGINI CON FLUX 1
La creazione di immagini da testo con l'intelligenza artificiale segue la procedura già vista altre volte. In alto si clicca sulla scheda Warm → Playground. Si digita un prompt. Ho testato solo l'inglese e non ho provato con l'italiano.
Come prompt ho usato il seguente: "A young woman is strolling down a charming urban street lined with stylish boutique shops. The scene is set in the late afternoon with a soft golden light casting long shadows. She is dressed casually, wearing a light jacket, jeans, and ankle boots, holding a shopping bag in one hand. The shop windows display elegant clothes, accessories, and decorations, creating a lively yet cozy atmosphere. The street is clean, with a few passersby in the background, adding to the urban vibe."
In Aspect Ratio si sceglie il rapporto tra la larghezza e l'altezza delle immagini tra 1:1, 16:9, 2:3, 3:2, 4:5, 5:4 e 9:16. Ho notato che l'aspect ratio 1:1 genera le immagini più rapidamente rispetto al 9:16 e soprattutto al 16:9.
Su Steps si sposta il cursore per scegliere il numero di passaggi. In Guidance si seleziona un numero intero da 1 a 5. Si imposta cioè l'equilibrio tra aderenza al messaggio di testo e qualità/diversità dell'immagine. Valori più alti rendono l'output più fedele ma potrebbero ridurre la qualità complessiva dell'immagine. Valori più bassi consentono una maggiore libertà creativa allo strumento ma potrebbero produrre risultati meno pertinenti con il prompt.
In Interval si sceglie un numero tra 1 e 4. L'intervallo è un'impostazione che aumenta la varianza nei possibili output consentendo al modello di essere un po' più dinamico negli output che può produrre in termini di composizione, colore, dettaglio e pronta interpretazione. Impostando questo valore su un valore basso si garantiranno output più coerenti, impostandolo su un valore più alto si produrranno output più dinamici o vari.
In Safety Tolerance si imposta la tolleranza rispetto a immagini con contenuti per adulti, con armi o con input oltre il consentito con altri tool. Si sceglie un numero da 1 a 5. Con 1 si è più stringenti e con 5 più permissivi.
Infine in Seed si lascia il campo in bianco per lasciare Random questo dato. Si clicca su Run per creare l'immagine.
Flux mostrerà una sola immagine che potrà essere visualizzata in grande cliccandoci sopra. Verrà mostrato anche il tempo che ci è voluto per la realizzazione (20,5 secondi nel mio test). Si va su Download per scaricare la foto.
Per dare una idea della precisione della foto in relazione al prompt immesso riporto la traduzione della descrizione in italiano: "Una giovane donna passeggia lungo un'affascinante strada urbana fiancheggiata da eleganti boutique. La scena è ambientata nel tardo pomeriggio, con una morbida luce dorata che proietta lunghe ombre. È vestita in modo casual, indossa una giacca leggera, jeans e stivaletti alla caviglia, e tiene una borsa della spesa in una mano. Le vetrine dei negozi espongono abiti eleganti, accessori e decorazioni, creando un'atmosfera vivace ma accogliente. La strada è pulita, con alcuni passanti sullo sfondo, che contribuiscono all'atmosfera urbana."
L'Aspect Ratio scelto è stato quello 1:1 e la dimensione della foto JPG scaricata è stata di 1024 x 1024 pixel.
Nessun commento :
Posta un commento
Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy