[ubuntu-it] OCR

Filippo Dal Bosco - Filippo.Dalbosco a libero.it
Ven 13 Lug 2012 16:50:24 UTC


Il giorno Fri, 13 Jul 2012 18:33:59 +0200
Felix <lccflc a email.it> ha scritto:


> >
> > ABBY ( windows era tra i soft dello scanner EpsonV600) funziona
> > decisamente meglio. Provato dentro Virtualbox
> 
> Mi spiace dissentire ma se usi bene il gImageReader funge divinamente
> bene. Un PDF ottenuto con simple scan a 600dpi ti riconosce anche
> uova sode ;-)

io ho usato jpg, ma oltre a riconoscere l' ortografia deve riconoscere
anche l' impaginazione
 
> 1) Per Tesseract hai installato anche il dizionario italiano?
si

> 2) quando "dai in pasto" a gImageReader il file PDF come sopra
> ottenuto glielo fai "leggere almeno a 300 dpi?

gli ho dato in pasto un jpg da 600 dpi identico a quello dato in pasto
a ABBY. Il risultato di Abby  decisamente superiore: ha prodotto un
file  rtf senza nessun errore ortografico e con la medesima
impaginazione del jpg. Tesseract ha prodotto un file txt con errori
ortografici e con impaginazione quasi assente


-- 
Filippo



Maggiori informazioni sulla lista ubuntu-it