[Ubuntu-BR] OCR em Linux

Manold manold em uol.com.br
Quinta Dezembro 12 17:46:15 UTC 2013


Olá Luciano,
Tenho uma HP PSC1400 series e uso o 'digitalizador simples' que vem
istalado no Ubuntu.
Quando mando digitalizar escolho entre duas opções: texto ou foto e é só
O processo decorre tranquilo e, as vezes, quando texto, preciso corrigir
alguma coisa.
[ ]'s
Manold



Em 10-12-2013 15:14, luciano de souza escreveu:
> Caros,
>
> Alguém já utilizou scanner com Linux?
>
> Instalei:
>
> sudo apt-get install ocrfeeder
>
> Depois processei as páginas assim:
>
> tesseract 01.jpg 01.txt
>
> O resultado foi hediondo. Do arquivo, nada, nada, nada se podia ler.
> Mesmo que o Tesseract não seja um bom OCR, de fato, não deve passar
> por uma página e não reconhecer uma só palavra.
>
> Se tivesse ficado apenas ruim, eu teria ficado triste. Como ficou
> infinitamente ruim e não julgo que um OCR possa ser tão
> extraordinariamente ruim, então, creio que há qualquer coisa de mal
> configurado.
>
> O que me dizem?
>
> Quanto ao scanner. Não encontrei driver para o meu Epson Perfection
> v500 Photo. Contudo, o suporte da Epson enviou-me um deb para a minha
> arquitetura. Instalei o pacote, mas mesmo estando o scanner ligado,
> não foi acionado, tendo por mensagem a informação de que não havia
> nenhum dispositivo de digitalização ativo.
>
> Suponhamos que o problema é que o meu texto não esteja tão bom e, de
> fato, o problema apenas decorra de deficiências do Tesseract. Neste
> caso, pergunto-lhes se haveria algum OCR pago de boníssima qualidade
> disponível em ambiente Linux.
>




More information about the ubuntu-br mailing list