[ubuntu-ar] OCR

Walter iqsistemas at gmail.com
Mon Feb 7 19:42:35 UTC 2011


El 07/02/11 15:54, Nicolas Demarchi escribió:
>
> *De:*ubuntu-ar-bounces en lists.ubuntu.com 
> [mailto:ubuntu-ar-bounces en lists.ubuntu.com] *En nombre de *Osvaldo 
> Rodriguez
> *Enviado el:* lunes, 07 de febrero de 2011 14:13
> *Para:* Ubuntu-ar en lists.ubuntu.com
> *Asunto:* [ubuntu-ar] OCR
>
> Existe algun OCR que corra en Linux?. Quiero transformar una fotocopia 
> en un documento electronico.
>
> Si no recuerdo mal Tesseract, se puede configurar con XSANE
>
Esto lo saque de un WEB y No recuerdo cual es...


Cómo escanear en 2 simples pasos

1.- Instalar gscan2pdf & tesseract-ocr (junto con su respectivo paquete 
de idioma). O sea, en caso de que vayas a escanear documentos en inglés, 
instalá tesseract-ocr-eng; si son en español instalá tesseract-ocr-spa y 
así.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- El resto es bastante sencillo para aquellos que alguna vez 
escanearon e hicieron OCR a un documento en Windows. Abrí gscan2pdf, 
escaneá el documento, andá a Opciones > OCR y seleccioná Tesseract como 
motor de OCR. Existen otros motores, pero Tesseract es, por lejos, el 
que arroja mejores resultados. Por último, podés guardar el documento 
final como PDF, DJVU, etc. yendo a Archivo > Guardar.

Nota: al guardar los documentos escaneados es mejor guardarlos en 
formato DJVU (la calidad es la misma que la de un PDF pero hay una 
diferencia muy importante de tamaño


Saludos y Suerte

-- 
Walter
www.infoquil.com.ar

------------ pr?xima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://lists.ubuntu.com/archives/ubuntu-ar/attachments/20110207/20911a1b/attachment.html>


More information about the Ubuntu-ar mailing list