Sora è uno strumento Text-To-Video realizzato da Open AI, l'azienda pioniera dell'intelligenza artificiale. Per il momento però nel suo sito possiamo solo visualizzare delle splendide Demo di video creati con questo strumento.
Sono però state rilasciate delle API a beneficio degli sviluppatori che volessero testare le funzionalità di Sora. Gli altri utenti potranno usare Sora per creare video solo negli ultimi mesi del 2024, o almeno così è stato comunicato.
Si possono però già creare video con Sora utilizzando degli strumenti messi online da degli sviluppatori che hanno utilizzato le API di Sora. Ricordo che API è l'acronimo di Application Programming Interface in cui la parola "application" si riferisce a qualsiasi software con una funzione distinta. Si può pensare all'interfaccia come a un contratto di servizio tra due applicazioni. Ci sono siti che servono da repository per sviluppatori che intendono utilizzare le API di servizi basati sulla AI. In questo sito abbiamo già visto come usare Replicate e Hugging Face.
In questo post vedremo come usare gli strumenti creati dagli sviluppatori con le API di Sora utilizzabili per creare video da un prompt di testo. Vedremo come usare le API disponibili su Replicate e su Hugging Face.
Ho pubblicato sul Canale Youtube un video tutorial per creare video con le API di Sora su Replicate e Hugging Face. Per accedere a Replicate si va in alto a destra su Sign In per poi effettuare il login con le credenziali di GitHub. In sostanza per creare un account su Replicate dobbiamo prima crearne uno su GitHub.
Come illustrato nel post linkato in precedenza per usare Replicate occorre inserire un metodo di pagamento e conviene impostare un limite massimo mensile di spesa. Però il costo di utilizzo di Replicate è molto basso.
Con 1$ si possono creare 18 immagini e circa lo stesso numero di video. Hugging Face invece è gratuito ma c'è un limite di utilizzo della GPU per gli account gratuiti. Per accedervi si va su Sign Up per poi digitare un indirizzo email e una password e andare su Next per completare la registrazione. Anche su Hugging Face si può sottoscrivere un abbonamento a pagamento per maggiori funzioni. La creazione di immagini e video però è gratis.
CREARE VIDEO CON LE API DI SORA SU HUGGING FACE
Si apre Hugging Face, si accede con il nostro account e si clicca su Spaces nel menù orizzontale posto in alto.
Si digita poi Sora nella casella di ricerca degli Spaces per individuare quelli che fanno riferimento alle sue API.
Non sono funzionanti quelli che hanno la scritta Runtime error o la scritta Sleeping. Dovremmo considerare solo gli Space con Running. Tra questi è meglio scegliere quelli che hanno un numero di cuoricini più grande.
Il primo in alto a sinistra però non si apre. Ho quindi provato con il secondo che comunque ha 225 Mi Piace. Mi sono fatto aiutare da ChatGPT per creare un prompt in inglese piuttosto dettagliato come il seguente:
"An advanced, sleek helicopter flying dynamically through the towering skyscrapers of Manhattan during a stunning sunset. The helicopter skillfully navigates the narrow spaces between the buildings, reflecting the vibrant lights of the city. The New York skyline stretches out in the background, while the helicopter glides smoothly through the urban landscape, creating a thrilling yet controlled flight experience."
Ho incollato il prompt nell'apposito campo nello Space Open-SORA per poi andare su Run Inference.
La previsione è di un'attesa di 2 minuti ma la AI di Sora ci ha messo un po' di più a mostrare il risultato.
Si tratta di un video di soli tre secondi ma fatto piuttosto bene anche se realizzato in stile cartoon.
Il video non è però esente da difetti come l'elica che gira, visibile non solo sull'elicottero, ma anche su un grattacielo.
CREARE VIDEO CON LE API DI SORA SU REPLICATE
Su Replicate si accede con il nostro account GitHub. Nella parte sinistra della home sono mostrati i tool recenti.
Se non avete ancora usato strumenti, verranno mostrati i modelli suggeriti. Se non ci fossero quelli con SORA si digita Sora o Open-Sora nella casella di ricerca per poi cliccare sul modello che ha il maggior numero di Run. Nel mio test tale modello non ha funzionato quindi ho provato con il modello che aveva il secondo numero di Run.
Dopo aver aperto il modello si incolla un prompt per creare il video. Ho usato questa descrizione per il video:
"A young woman, dressed in a flowing blue dress, walks gracefully on the surface of the Moon. The lunar landscape is stark and desolate, with gray dust and rocky terrain stretching out in all directions. Above her, the Earth is visible in the black sky, appearing as a vibrant blue and green sphere, with swirling white clouds. The woman’s dress contrasts sharply with the gray surroundings, and as she walks, her footprints leave distinct marks on the lunar dust." L'ho incollata nel campo apposito e sono andato in basso su Boot + Run.
Con Replicate occorre aspettare qualche minuto prima di vedere il video realizzato con la nostra descrizione.
Il video realizzato con il modello che ho usato su Replicate costa approssimativamente 0,057$. Il costo del modello è invece di 0,000725$ per secondo di utilizzo. Al termine mi è stato mostrato questo risultato.
Il video dura appena due secondi e può essere scaricato in MP4. Nel video generato è palese la mancanza della Terra nello sfondo nero del cielo. Complessivamente però il video generato con Replicate è migliore di quello creato con Hugging Face. Entrambi però sono di qualità nettamente inferiore alle demo visibili nella home di SORA.
Nessun commento :
Posta un commento
Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy