OCR per tutti…senza grandi spese…
Pubblicato in utilityOCR (Optical Character Recognition) è un programma che riconosce il testo integrato in immagini e lo trasforma in testo modificabile in software per la videoscrittura.
Accade spesso di dover riportare del testo che abbiamo su carta stampata sui nostri computer…
ma ogni volta ci accorgiamo che tutto questo comporta dei disagi ed anche limitazioni. Immaginate di dover inviare un documento o un qualsiasi testo (che avete su carta…) ad un amico, spesso ci chiediamo se è meglio riscrivere il tutto, o se è meglio fare una bella scansione ad alta risoluzione per permettergli una tranquilla lettura (con il relativo aumento di mb che l’allegato comporterà ). Con l’aiuto di Office che integra le funzionalità dell’OCR ora possiamo facilmente prelevare solo il testo dall’immagine della nostra scansione ed editarlo comodamente in Word, per poi farne l’uso che ne vogliamo. Dopo la scansione (è preferibile che il file si salvi in .tif) infatti, basta aprire la nostra immagine con Office Document Imaging e premere il pulsante nella barra degli strumenti in alto “invia testo a word“.
Personalmente dopo vari test posso dirvi che funziona ottimamente con scansioni di testo nero su sfondo bianco, per il resto si possono ottenere risultati accettabili solo con scansioni in scala di grigi (sconsiglio ad esempio di acquisire pagine con sfondo arancio e testo bianco, se non in scala di grigi).
Per gli utenti di Linux consiglio Tesseract-ocr, un software sviluppato in origine da HP e poi ripreso e rilasciato in versione open source da Google. Se qualcuno ha avuto modo di usare questo software ci faccia sapere il suo giudizio e magari anche alcuni consigli per usarlo…





















Lascia un commento