Come estrarre il testo di un audio con la AI di Audacity e OpenVINO

Come trascrivere un file audio parlato con la AI di OpenVINO e di Audacity, aggiungerlo nella traccia delle Etichette per poi salvarlo in formato TXT

Anche il celebre programma open source di editing audio Audacity ha ottenuto tramite un opportuno plugin delle funzionalità basate sulla intelligenza artificiale. Il plugin in oggetto si chiama OpenVINO e lo abbiamo già presentato nell'articolo in cui è stato illustrato come separare strumenti e vocale in un brano musicale.

Per poterlo utilizzare bisogna avere un sistema operativo Windows a 64-bit e aver installato la versione 3.5.1 di Audacity o una più recente. Si clicca sul pulsante di sinistra per scaricare un file .exe su cui fare un doppio click e seguire le finestre di dialogo per completare l'installazione. Successivamente si apre su GitHub la pagina delle releases di OpenVINO. Si scorre la pagina verso il basso fino ad assets in cui scaricare il file in formato .exe.

Ci si clicca sopra con il destro del mouse per installare il plugin che rileverà automaticamente il percorso in cui è stato installato Audacity. Nell'ultima finestra si selezionano le funzionalità da installare come vedremo dopo.

Nel momento in cui scrivo questo post il plugin OpenVINO ha ancora dei bug. Infatti dopo il suo utilizzo spesso dobbiamo procedere a una nuova installazione perché smette di funzionare. Oltre a separare musica e voce con OpenVINO di Audacity si può anche generare musica con l'intelligenza artificiale digitandone una descrizione.

In questo post vedremo come con la AI di Audacity si possa anche trascrivere un audio cioè estrarre il testo di un audio parlato per poi scaricarlo in formato TXT. Si può estrarre del testo praticamente in tutte le lingue.

Ho pubblicato sul Canale Youtube un tutorial in cui spiego come convertire un audio parlato in testo con la AI.

Durante l'installazione di OpenVINO visualizzeremo una finestra come questa in cui selezionarne le opzioni.

Si tratta di funzionalità piuttosto pesanti. Con quelle che ho scelto io lo spazio necessario sul PC è di 11,05GB.

configurazione openvino

Si mette la spunta alle funzioni da installare. Le prime cinque sono molto leggere e servono per rimuovere il rumore di sottofondo. Consiglio di flaggarle tutte. Nella seconda sezione si sceglie il modello, o i modelli, da usare per la trascrizione. Di default viene messa la spunta solo a quella Base. Io l'ho messa a quella Medium e a quella Large.

La terza sezione riguarda la generazione di brani con l'intelligenza artificiale. Di default è flaggato solo il modello per Mono ma io ho messo la spunta anche a quello Stereo. Dopo la configurazione di va su Next per scaricare i file.

Al termine del download si clicca su Install per poi andare su Finish al termine della installazione. Si fa andare Audacity quindi si clicca su Modifica → Preferenze. Si va poi su Moduli e si abilita quello mod-openvino.

abilitare openvino

Si clicca quindi su OK per salvare le modifiche. Si trascina nell'interfaccia di Audacity il brano da cui estrarre testo.

Si va poi nel menù su Analizza → OpenVINO Whisper Transcription per aprirne la finestra di configurazione.

configurazione di Whisper Transcription

Si sceglie il modello, se ne abbiamo più di uno, si lascia Transcribe in Modalità quindi si seleziona la lingua.

Si può lasciare anche auto per far rilevare automaticamente la lingua dal programma. Si va poi su Applica.

estrazione testo

Dopo qualche minuto visualizzeremo il testo inserito nella nuova traccia delle Etichette che viene aggiunta in basso.

Si può scaricare il testo andando nel menù su File → Esporta Altro → Etichette per aprire Esplora File.

esportazione testo

Si seleziona la cartella di destinazione, si dà un nome al file di testo quindi si clicca su Salva. Si può quindi aprire.

testo estratto da audio

Oltre al testo viene mostrata anche la durata dei singoli blocchi di testo che può essere modificata manualmente.

Pubblicato il 14/05/24 - aggiornato il | Nessun commento :

Come estrarre il testo di un audio con la AI di Audacity e OpenVINO

Nessun commento :

Posta un commento

Ricevi nuovi post via email: