[Ubuntu-QC] pdf et ocr

Jean-Leo Vandal jl.vandal at lino.sympatico.ca
Mer 3 Nov 22:11:21 GMT 2010


Bonjour Jean,

Cet après-midi, j'ai installé et essayé le logiciel OCRFeeder que tu 
(Jean Levasseur) m'avais proposé dans le but de convertir un document au 
format pdf. J'ai fait des essaies avec des fichiers images tiff et le 
résultat est stupéfiant et m'a grandement impressionné. C'est le 
meilleur logiciel de reconnaissance de caractère que j'ai rencontré sous 
Ubuntu. Il existe bien des petites erreurs ici et là dans la 
reconnaissance des caractères, mais avec Antidote de Druide, ces petites 
erreurs sont vite détectées et corriger.

OCRFeeder, présent dans la logithèque Ubuntu, est un excellent logiciel 
graphique de reconnaissance de caractères, mais il n'est pas un 
convertisseur pdf. Il permet beaucoup de manipulation sur les fichiers 
pdf, mais il lui manque les fonctions d'exportations directes en format 
pdf ou la possibilité de créer des tables de matières. Il est possible 
d'exporter vers Writer dans avec le format odt, mais ceci ne produit pas 
un vrai fichier pdf avec deux calques. Dans un vrai document pdf, le 
premier calque contient la représentation exacte de l'image tiff tandis 
que le deuxième calque contient le texte ocr. L'utilisateur ne voit que 
le premier calque comme s'il consultait le document original. Les 
recherches de texte se font en arrière-plan sur le deuxième calque et 
sont transparentes pour l'utilisateur.

Il n'empêche que l'application OCRFeeder est une application de grande 
valeur qui va me rendres des services inestimables et je l'ai adopté. 
Merci beaucoup Jean pour me l'avoir proposé.

Jean-Léo



Plus d'informations sur la liste de diffusion Ubuntu-quebec