Il Riconoscimento Ottico dei Caratteri (OCR), dall'inglese Optical Character Recognition, è una tecnologia che consente di convertire immagini contenenti testo in dati digitali modificabili. Questa tecnologia è utilizzata per estrarre informazioni da documenti cartacei, fotografie e file PDF, trasformando il testo non modificabile in un formato leggibile da computer. Il funzionamento dell'OCR si articola in diverse fasi fondamentali:
-
Acquisizione dell'immagine: Il processo inizia con la scansione del documento tramite uno scanner o una fotocamera digitale, creando un'immagine digitale del testo.
-
Pre-elaborazione: L'immagine acquisita viene pulita e preparata per l'analisi. Questo può includere la rimozione di rumore, la correzione dell'orientamento e la normalizzazione del contrasto.
-
Segmentazione: L'immagine viene suddivisa in aree contenenti testo, parole e caratteri. Questa fase è cruciale per facilitare il riconoscimento dei singoli caratteri.
-
Estrazione delle caratteristiche: I caratteri segmentati vengono analizzati per identificare le loro caratteristiche distintive, come forma e dimensione. Queste informazioni vengono confrontate con un database di caratteri noti.
-
Riconoscimento dei caratteri: Utilizzando algoritmi di machine learning o reti neurali, il sistema confronta le caratteristiche estratte con quelle memorizzate nel database per determinare quali caratteri sono presenti nell'immagine.
-
Ricostruzione del testo: Dopo aver identificato i caratteri, il sistema ricompone le parole e le frasi, restituendo il testo in un formato digitale modificabile.
I vantaggi principali della tecnologia OCR comprendono risparmio di tempo, precisione e facilità di archiviazione e ricerca. In definitiva l'OCR rappresenta una soluzione efficace per la digitalizzazione e la gestione dei testi, contribuendo a semplificare processi lavorativi e migliorare l'accesso alle informazioni.
Nei sistemi operativi Windows 10 e 11 è stata introdotta nativamente tale tecnologia che può essere usata per estrarre testo da immagini. Lo si può fare con immagini presenti nel PC o visualizzate in una scheda del browser.
Ho pubblicato sul Canale Youtube un tutorial in cui illustro come catturare il testo dalle immagini con Windows.
Lo si potrà fare senza l'installazione di programmi esterni ma usando solo le funzionalità pre-installate. Il testo catturato dalle immagini potrà anche essere tradotto con un click ma stavolta usando Google Lens su Chrome.
Quando si visualizza un'immagine nello schermo del PC, sia
essa aperta con un visualizzatore di foto o implementata in una pagina web
aperta nel browser, si digita la combinazione di tasti
Nella parte alta della finestra si visualizzerà uno strumento con tre pulsanti e una crocetta. Si seleziona il secondo da sinistra per catturare uno screenshot quindi si clicca sul terzo e si sceglie il Rettangolo come tipologia di cattura.
In certi casi può essere conveniente anche scegliere Figura a mano libera. Successivamente con l'aiuto del cursore si traccia un rettangolo intorno al testo da estrarre tenendo premuto il sinistro del mouse. Quando si lascia il sinistro del mouse, verrà catturata la selezione disegnata e ne visualizzeremo la notifica in basso a destra dello schermo.
Ci si clicca sopra per aprirla nello Strumento di Cattura di Windows. La notifica si visualizza per poco tempo e, se non facciamo in tempo a cliccarci sopra, si può andare su Start e digitare Strumento di Cattura.
Nella finestra si visualizzeranno le catture Recenti. Si clicca sull'ultima cattura per aprirla con tale applicazione.
Alternativamente si potrà trovare la cattura nella cartella Screenshot che è una sottocartella di Immagini.
In ogni caso, dopo aver aperto lo screenshot con lo Strumento di Cattura, si clicca sul pulsante Azioni Testo.
Il testo verrà rilevato. Si può andare su Modifica Rapida per rimuovere o meno gli indirizzi di posta elettronica e i numeri telefonici. Si clicca quindi su Copia Tutto il Testo che poi si potrà incollare in un file del Blocco Note.
ESTRARRE, COPIARE E TRADURRE TESTO CON GOOGLE LENS
Questa procedura può essere seguita anche per le immagini con del testo che fossero presenti in una pagina web.
Per le immagini visibili in una scheda del browser è però più immediato usare Google Lens di Chrome.
Lo si può attivare in due modi. Si può andare nel menù dei tre puntini e quindi cliccare su Cerca con Google Lens.
Alternativamente si clicca sulla barra degli indirizzi per visualizzare il pulsante Google Lens e cliccarci sopra.
Si disegna un rettangolo con gli angoli arrotondati intorno al testo da catturare. In basso visualizzeremo tre link.
In questo contesto non ci interessa Copia come Immagine. Se si va su Seleziona Testo verranno mostrate due altre opzioni: Copia e Traduci. Andando su Copia verrà mostrato il testo originale in una colonna verticale.
Se si sceglie Traduci verrà rilevata la lingua del testo estratto, si potrà scegliere la lingua di destinazione e tradurre il testo. Entrambi i testi verranno mostrati nella colonna verticale sulla destra. Sotto i due testi si visualizzeranno anche dei pulsanti per la sintesi vocale e per copiarli e poi eventualmente incollarli in un file del Blocco Note.
Nessun commento :
Posta un commento
Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy