I programmi per OCR (dell'inglese Optical Character
Recognition, cioé Riconoscimento Ottico dei Caratteri) si occupano di
tradurre in testo le eventuali parole contenute in un'immagine. Per
esempio, vorrei portare su computer la pagina di un libro, o -cosa un
po' più complesso- di una rivista cartacea. Uno scanner eseguirà la
digitalizzazione dell'intera pagina, ma sul computer questa verrà vista
come un'immagine grafica (che sia una fotografia di una persona o di una
pagina di testo non importa), e non come del vero e proprio testo. Se
noi vogliamo importare questo testo in un programma di videoscrittura,
come Word oppure Open Office, per sostituire parole, eseguire ricerche,
insomma tutto ciò che normalmente si fa con un documento di testo, ciò
non sarà possibile. Ecco allora la necessità di programmi che convertano
questa immagine in un testo riconoscibile dal computer (e magari lo
salvino in un formato utilizzabile direttamente, come .doc, .txt., .rtf,
ecc.).
I programmi di questo settore sono alquanto costosi, è
bene essere preparati.
I programmi al momento più interessanti di OCR sono due:
Scansoft Omnipage e Abby Fine Reader. Importante notare
che questi programmi devono essere assolutamente in italiano; se
così non fosse riconoscerebbero le parole in maniera errata, e sarebbero
del tutto inutilizzabili.
Ominpage
Pro viene aggiornato con grande frequenza,
ed è ormai famosissimo (putroppo il prezzo è all'altezza della sua
fama). Mostra le sue capacità migliori quando il testo è in un'unica
colonna, priva di tabelle, come per esempio le pagine di un libro. In
questo caso raramente commette errori, anche quando si digitalizzano
centinaia di pagine. E' ottimo anche con carta ingiallita e molto
rovinata,
Abby Fine Reader è invece eccellente quando c'è
un testo pieno di tabelle, magari con colonne multiple. Su questo
terreno (oltre su quello della leggerezza), batte nettamente il rivale
Omnipage. Anche nel caso di digitalizzazioni di riviste, con caratteri
di varie grandezze e colori, riesce quasi sempre a districarsi bene.
A questi due si aggiunge ReadIris Pro 10, che ha
come caratteristica che lo contraddistingue il riconoscimento
della scrittura manuale in stampatello (oltre alle normali funzioni di
OCR da libri, riviste, ecc.). Purtroppo questo ricoscimento non è ancora
perfetto, e ci vorrà tempo prima che migliori. Tuttavia, coloro che
devono digitalizzare molti documenti scritti in stampatello, con un po'
di sforzo possono utilizzarlo e cercare di farlo lavorare al meglio.
GIUDIZIO: Ottimi entrambi (Nuance Omnipage
Pro e
Fine Reader)