[Ubuntu-BR] OCR em Linux

luciano de souza luchyanus em gmail.com
Terça Dezembro 10 18:14:51 UTC 2013


Caros,

Alguém já utilizou scanner com Linux?

Instalei:

sudo apt-get install ocrfeeder

Depois processei as páginas assim:

tesseract 01.jpg 01.txt

O resultado foi hediondo. Do arquivo, nada, nada, nada se podia ler.
Mesmo que o Tesseract não seja um bom OCR, de fato, não deve passar
por uma página e não reconhecer uma só palavra.

Se tivesse ficado apenas ruim, eu teria ficado triste. Como ficou
infinitamente ruim e não julgo que um OCR possa ser tão
extraordinariamente ruim, então, creio que há qualquer coisa de mal
configurado.

O que me dizem?

Quanto ao scanner. Não encontrei driver para o meu Epson Perfection
v500 Photo. Contudo, o suporte da Epson enviou-me um deb para a minha
arquitetura. Instalei o pacote, mas mesmo estando o scanner ligado,
não foi acionado, tendo por mensagem a informação de que não havia
nenhum dispositivo de digitalização ativo.

Suponhamos que o problema é que o meu texto não esteja tão bom e, de
fato, o problema apenas decorra de deficiências do Tesseract. Neste
caso, pergunto-lhes se haveria algum OCR pago de boníssima qualidade
disponível em ambiente Linux.

-- 
Luciano de Souza




More information about the ubuntu-br mailing list