[Ubuntu-BR] software de ocr no linux

Paulo Horácio horacllos em gmail.com
Terça Março 16 23:03:44 UTC 2010


Bem eu não tive problemas, foi só instalar os pacotes do tesseract e os do
idioma:

tesseract-ocr
tesseract-ocr-pt
tesseract-ocr-en

Após instalei o gscan2pdf e a partir dessa interface gráfica ele importou
minhas as imagens, tanto em jpg como em tif. Eu consegui alguma melhora no
reconhecimento transformando as imagens de RGB para grayscale através do
Gimp.

Esta é apenas minha experiência com esse recurso, talvez alguém saiba dizer
melhor qual o possível problema das imagens estarem sido recusadas aí.


Em 16 de março de 2010 16:52, Fabiano garcia Fonseca <
fabiano em linuxacessivel.org> escreveu:

> Poderia dar uma dica de como usar o tesseract-ocr, pois toda imagem que
> tento usar para ele reconhecer, recebo uma msg de erro dizendo que o
> arquivo de imagem não é suportado. Tentei com .jpg, .tiff, .png e até
> com .pdf e nada.
>
> Se puder descrever todo o processo que utiliza, seria ótimo, para ficar
> registrado, pois garanto que muitos tem a mesma dúvida...
> Abraços
>
> Fabiano garcia Fonseca
> Linux user #448759 - Ubuntu User #15701
> www.linuxacessivel.org
> e-mail: fabiano em linuxacessivel.org
>
>
>
> Paulo Horácio escreveu:
>
> Estou usando o tesseract-ocr em consonância com o gscan2pdf, produz bons
> resultados com documentos pdf ou imagens que estejam em escalas preta e
> branca e com alguma clareza. Valeu1
>
> Em 16 de março de 2010 11:00, hamacker<sirhamacker em gmail.com>  escreveu:
>
>
> > Eu uso o plugin Sun PDF Import/Export para editar PDFs   diretamente
> > no OpenOffice.
> > Para OCR, eu não uso muito, mas o pessoal recomenda o tesseract-ocr (e
> > tesseract-ocr-por ).
> > O FineReader existe para Linux, é comercial e só tem a parte CLI
> > (funciona somente na linha de comando).
> > Para scanear voce tem o Simple-Scan ou o próprio Gimp, ambos usam o
> > XSane de forma mais simples.
> >
> > []'s
> >
> > Em 15 de março de 2010 18:27, Paulo Horácio<horacllos em gmail.com>
> > escreveu:
> >
> >> Quais softwares o linux tem para OCR que possibilite não só trabalhar
> com
> >> scanner, mas também trabalhar com imagens e pdf não editáveis
> >>
> > convertendo-os
> >
> >> em arquivos textos editáveis (pdf, doc, etc)?
> >>
> >>
> >> No trabalho, como uso muito digitalização, temos um software chamado
> >>
> > ABBYY
> >
> >> FineReader, eu acredito que seja o melhor da categoria, é bem caro a
> >>
> > versão
> >
> >> pro mas pra quem depende de um software pra isso certamente não se
> >> arrepende. Como já faz algum tempo que uso ubuntu, gostaria de ver que
> >> opções que ele tem nesse sentido, obviamente que não precisam ser
> >>
> > softwares
> >
> >> "iguais" ao finereader, mas gostaria de testar e conhecer as opções que
> >> tiver. Grato
> >> Unable to translate selected text.
> >> --
> >> Mais sobre o Ubuntu em português: http://www.ubuntu-br.org/comece
> >>
> >> Lista de discussão Ubuntu Brasil
> >> Histórico, descadastramento e outras opções:
> >> https://lists.ubuntu.com/mailman/listinfo/ubuntu-br
> >>
> >>
> > --
> > Mais sobre o Ubuntu em português: http://www.ubuntu-br.org/comece
> >
> > Lista de discussão Ubuntu Brasil
> > Histórico, descadastramento e outras opções:
> > https://lists.ubuntu.com/mailman/listinfo/ubuntu-br
> >
> >
>
> --
>
>
>
> --
> Mais sobre o Ubuntu em português: http://www.ubuntu-br.org/comece
>
> Lista de discussão Ubuntu Brasil
> Histórico, descadastramento e outras opções:
> https://lists.ubuntu.com/mailman/listinfo/ubuntu-br
>



More information about the ubuntu-br mailing list