Pubblicato il 12/07/24 - aggiornato il  | Nessun commento :

Creare effetti sonori da un prompt di testo con la AI di Eleven Labs

Come creare e scaricare effetti sonori con l'intelligenza artificiale di Eleven Labs digitandone la descrizione e impostandone durata e creatività

Circa un anno fa ho mostrato in questo sito come clonare le voci con l'intelligenza artificiale, anche voci che parlano in italiano. Eleven Labs è il tool online che usai a suo tempo per clonare le voci a cui accedere con un account Google o con indirizzo email e password. Si può usare con un piano a pagamento o anche in modo gratuito con il limite di 10 minuti al mese di audio generato. La clonazione della voce è però sempre a pagamento.

Oltre al classico strumento Text-To-Speech, per convertire un testo in un audio che lo pronuncia scegliendo lingua e voce, offre agli utenti anche un interessante strumento per creare effetti sonori a partire da una loro descrizione.

Ho pubblicato sul mio Canale Youtube un tutorial in cui illustro come creare effetti sonori con Eleven Labs.

Ovviamente c'era da attendersi che l'intelligenza artificiale riuscisse anche a generare degli effetti sonori dopo che come abbiamo visto più volte riesce a creare immagini, video e anche musica. La creazione di effetti sonori rientra nelle funzionalità accessibili anche a chi abbia un account gratuito. Nei miei test però ho constatato che i migliori risultati si ottengono quando si digitano prompt in inglese. Per ogni prompt vengono creati 4 effetti.

I suoni generati possono naturalmente essere riprodotti e eventualmente scaricati in MP3 con due canali stereo.

eleven labs sound effects

Dopo il login a Eleven Labs si va nella colonna di sinistra su Sound Effects per aprire la scheda omonima.

Si digita la descrizione dell'effetto sonoro da generare. Nel mio test ho inserito il seguente prompt: "ambient noises of a airport waiting area with aloud chatting people and airport announcements". Si va poi su Settings.

Si aprirà una barra verticale sulla destra in cui lasciare la spunta, per far scegliere a Eleven Labs la durata migliore per l'effetto descritto, oppure deflaggare l'opzione e scegliere manualmente la durata dell'effetto sonoro richiesto.

Più in basso c'è un cursore con cui impostare il livello di creatività lasciato al tool. Spostando verso destra il cursore (30% di default) tale livello diminuisce e l'effetto sonoro generato sarà aderente al massimo al prompt digitato. Si torna nell'area centrale della scheda, si clicca su Generate Sound Effects e si attende il termine del processo.

effetti sonori generati

Per ogni prompt vengono creati quattro effetti pertinenti con la descrizione. Cliccando sul pulsante del Play si potranno riprodurre e, andando sulla freccia che punta in basso, si potranno scaricare come audio stereo MP3.

Nella scheda History verranno mostrati tutti gli audio generati con i prompt che noi abbiamo immesso.

effetti sonori generati

I file generati sono organizzati in funzione della data e del prompt digitato e possono essere riprodotti e scaricati anche in un periodo successivo. Dopo che sono stati generati quattro file per ogni prompt, non c'è però la possibilità di interagire per eventualmente affinare il risultato. Ricordo che Sound Effects è un servizio ancora in Alpha.

Andando su Upgrade Plan in basso a destra si può passare da un account gratuito a uno a pagamento con opzioni che vanno dai 5$ del Piano Starter ai 330$ al mese del Piano Scale. Per ogni creazione vengono scalati i secondi delle quattro opzioni generate a Eleven Labs mentre non si consumano crediti quando si scaricano gli audio.



Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy