Pubblicato il 17/01/25 - aggiornato il  | Nessun commento :

Come oscurare volti e oggetti nei video tracciandoli con Shotcut

Nascondere o censurare una o più facce in un video, prima di pubblicarlo, è una operazione necessaria quando i protagonisti del video sono minorenni, quando non si vuol far riconoscere una persona, quando non abbiano l'autorizzazione di un soggetto presente nel filmato riguardo alla sua pubblicazione e anche in molti altri casi.

Altre cose che è necessario oscurare nei video sono le targhe e altri riferimenti di dati sensibili. Con Shotcut si possono nascondere volti e oggetti in movimento nei video tracciando i loro spostamenti con un apposito filtro.



Pubblicato il 16/01/25 - aggiornato il  | Nessun commento :

Estrarre testo dalle immagini su Windows con OCR senza programmi

Il Riconoscimento Ottico dei Caratteri (OCR), dall'inglese Optical Character Recognition, è una tecnologia che consente di convertire immagini contenenti testo in dati digitali modificabili. Questa tecnologia è utilizzata per estrarre informazioni da documenti cartacei, fotografie e file PDF, trasformando il testo non modificabile in un formato leggibile da computer. Il funzionamento dell'OCR si articola in diverse fasi fondamentali:

  1. Acquisizione dell'immagine: Il processo inizia con la scansione del documento tramite uno scanner o una fotocamera digitale, creando un'immagine digitale del testo.
  2. Pre-elaborazione: L'immagine acquisita viene pulita e preparata per l'analisi. Questo può includere la rimozione di rumore, la correzione dell'orientamento e la normalizzazione del contrasto.
  3. Segmentazione: L'immagine viene suddivisa in aree contenenti testo, parole e caratteri. Questa fase è cruciale per facilitare il riconoscimento dei singoli caratteri.
  4. Estrazione delle caratteristiche: I caratteri segmentati vengono analizzati per identificare le loro caratteristiche distintive, come forma e dimensione. Queste informazioni vengono confrontate con un database di caratteri noti.
  5. Riconoscimento dei caratteri: Utilizzando algoritmi di machine learning o reti neurali, il sistema confronta le caratteristiche estratte con quelle memorizzate nel database per determinare quali caratteri sono presenti nell'immagine.
  6. Ricostruzione del testo: Dopo aver identificato i caratteri, il sistema ricompone le parole e le frasi, restituendo il testo in un formato digitale modificabile.



Pubblicato il 14/01/25 - aggiornato il  | Nessun commento :

Come convertire testo di tutte le lingue in audio con ClipChamp

Il text-to-speech, o TTS, o sintesi vocale, è una tecnologia che converte il testo scritto in parlato. In poche parole, è come avere un computer che legge ad alta voce un documento. Come funziona?

Il processo di conversione del testo in parlato coinvolge diversi passaggi:

  1. Analisi del testo: Il testo viene scomposto in parole, frasi e paragrafi. Vengono identificati i segni di punteggiatura, le maiuscole e le minuscole, e vengono analizzate le regole grammaticali.
  2. Conversione in suoni: Ogni parola viene associata a un insieme di suoni elementari (fonemi). Il computer utilizza un dizionario e regole di pronuncia per determinare come questi suoni devono essere combinati.
  3. Generazione dell'audio: I suoni vengono poi assemblati per formare le parole e le frasi. Vengono aggiunti anche gli aspetti prosodici, come l'intonazione, l'accento e il ritmo, per rendere il parlato più naturale.
  4. Produzione dell'audio: L'audio generato viene infine convertito in un formato digitale, come MP3 o WAV, che può essere riprodotto su qualsiasi dispositivo audio. A cosa serve il text-to-speech?


Pubblicato il 13/01/25 - aggiornato il  | Nessun commento :

Come attivare la trascrizione delle note vocali su WhatsApp

Se si riceve una nota vocale su WhatsApp in un momento in cui non siamo soli, e non abbiamo le cuffie dello smartphone, può essere imbarazzante riprodurla e farla ascoltare a tutti quelli che sono nelle vicinanze.

Per questa ragione WhatsApp ha introdotto la trascrizione dei messaggi vocali, per il momento questa funzione è arrivata nella versione Beta di WhatsApp e supporta solo quattro lingue. Sicuramente con il prossimo aggiornamento arriverà anche nella versione stabile e si spera che a breve supporti anche la lingua italiana.

 



Pubblicato il 12/01/25 - aggiornato il  | Nessun commento :

Forzare la AI di ChatGPT, Perplexity e Gemini a fornire risultati di qualità

Utilizzare l'intelligenza artificiale per raccogliere dati può farci risparmiare una notevole quantità di tempo. Tuttavia, l'accuratezza e l'affidabilità dei risultati dipendono fortemente dalla qualità delle informazioni utilizzate dal modello.

Con un po' di attenzione si possono però usare alcune strategie per forzare i modelli di intelligenza artificiale a fornire risposte basate solo su sorgenti di alta qualità. I modelli di ChatGPT, Perplexity e Gemini sono addestrati su un'enorme quantità di testo e di codice. Questo significa che hanno già una vasta conoscenza di fatti, concetti e informazioni generali. Quando ricevono una domanda, cercano prima di tutto una risposta all'interno di questa base di dati. Se però non trovano una risposta sufficientemente completa o precisa nei suoi dati esistenti, possono eseguire ricerche attive sul web per trovare informazioni più aggiornate e pertinenti. Questo permette loro di fornire risposte più accurate e complete, soprattutto su argomenti di strettissima attualità. In sostanza questi modelli usano una combinazione di strategie per dare risposte a domande di ogni genere con precisione, completezza e flessibilità.



Pubblicato il 10/01/25 - aggiornato il  | Nessun commento :

Come cambiare l'audio di un video e come parlarci sopra con ClipChamp

ClipChamp è da diverso tempo diventato il video editor ufficiale della Microsoft che l'ha acquistato proprio per questo. Ha una vasta libreria di effetti e animazioni ma ha il difetto di non avere la funzionalità dei Fotogrammi Chiave. Questo strumento si può fruire da browser desktop e da applicazione installata dal Microsoft Store.

Come già accennato ClipChamp si può usare da scheda del browser cliccando sul link precedente o, alternativamente, anche come app installata dal Microsoft Store o come Progressive Web App aggiunta come collegamento nel desktop del computer. Dopo il login su ClipChamp si va su Crea un nuovo video.



Pubblicato il 09/01/25 - aggiornato il  | Nessun commento :

Creare video di baci con la AI caricando le foto di due persone

Recentemente abbiamo visto come con lo strumento AI Hug si possano creare video di persone che si abbracciano a partire da delle loro foto. Con lo stesso strumento in questo post vedremo come creare video di baci tra due persone.

Di quest'ultime dovremo solo caricare le immagini. Come già scritto nel precedente articolo, visto che gli sfondi delle due foto sono generalmente diversi, è meglio eliminarli e sostituirli con uno sfondo verde con lo stesso codice Hex.



Pubblicato il 08/01/25 - aggiornato il  | Nessun commento :

Come pubblicare e ascoltare i video su Youtube doppiati in automatico

Il doppiaggio automatico per i video di Youtube genera tracce audio tradotte in diverse lingue per rendere i video dei creators più accessibili agli spettatori di tutto il mondo. Questa funzionalità viene costantemente estesa a partire dal Dicembre 2023, quindi da più di un anno. Il doppiaggio automatico è già disponibile per molti creators di lingua inglese e il suo rilascio continuerà per tutto il 2024 in modo da raggiungere un pubblico sempre più vasto.

La lingua di elezione è naturalmente l'Inglese (USA) ma già vengono supportate le lingue seguenti: Francese, Tedesco, Italiano, Portoghese e Spagnolo. Mentre sono in fase ancora sperimentale l'Hindi, l'Indonesiano e il Giapponese. Questa funzionalità diventerà attiva per impostazione predefinita. Quando il creator carica un nuovo video, vengono generate automaticamente delle versioni doppiate, che verranno pubblicate automaticamente.