OCR et Linux

L'Africain lafricain79 at gmail.com
Ven 20 Juin 08:06:19 UTC 2014


Pour dire vrai je n'ai jamais calculé le nombre de fautes. Mais c'est sûr que c'est pas un mot sur 20 qui n'est pas reconnu. Le pire exemple que j'ai ces des pages texte au format jpg de mauvaise qualité, j'utilise pour ça cuneiform en ligne de commande, ça marche assez bien même si ça demande une bonne relecture. Mais quand la page est bonne pas besoin de relecture. Mais c'est vrai que je ne scanne jamais des choses bien complexe. Pour les colonnes, cuneiform dans xsane les reconnaît. Mais c'est certain que vu tes besoins (je ne crois pas les avoir lu dans un autre message), ces logiciels ne semblent pas convenir. As-tu au moins essayé? Ça serait bien d'avoir un retour. un moment j'ai aussi utilisé gscan2pdf, mais je trouve qu'Xsane avec cuneiform fonctionne mieux.
Amicalement,

PS: j'ai aussi un moment travaillé avec ocropus de google

On Mon, 16 Jun 2014 22:30:59 +0200
jguezenec <jguezenec at yahoo.fr> wrote:

> Je change de titre, c'est plus correct.
> 
> 95 %, c'est 1 mot non reconnu sur 20 mots ... C'est pas terrible. 300 
> mots par page d'un livre "pocket", ça fait 15 erreurs par page.
> 
> Dès que tu passe à des revues complexes (tableaux, colonnes, etc..) , je 
> suis certain que tu n'es plus à 95 %.
> 
> Sous Fine Reader ou Omnipage, tu es à 99,5 %; tu as reconnaissance des 
> colonnes, des tableaux, des images, etc...
> 
> J'ai dû, dans les années 95, reprendre tout le texte d'un livre de plus 
> de 400 pages, pour réédition (le manuscrit avait été perdu, et l'auteur 
> changeait de maison d'édition. - "La mort transfiguré", un ouvrage 
> collectif sur les NDE).
> 
> Malgré Fine Reader, j'y ai passé des semaines (surtout que c'était un 
> livre scientifique, avec des références constantes à des articles en 
> différentes langues).
> 
> Aujourd'hui, ces logiciels (qui ne tournent que sous Windows, sauf Fine 
> Reader qui a une édition Mac) sont capables de scanner et reconnaître 
> des choses aussi complexes que des journaux (le papier est 
> semi-transparent et ce qui est écrit au verso transparaît au recto)...
> 
> JG
> 
> Le 16/06/2014 21:12, Benoît Lafricain a écrit :
> > Ben t'utilise quoi? franchement il arrive que j'ai du 95 %. Faut pas
> > non plus que ton texte soit sale.
> >
> > Le 16/06/2014, jguezenec<jguezenec at yahoo.fr> a écrit :
> >> On ne doit pas avoir les mêmes documents à scanner et Ocriser...
> >>
> >> JG
> >>
> >> Le 16/06/2014 17:41, Benoît Lafricain a écrit :
> >>> Bon j'ai pas suivi attentivement ce post, mais j'ai juste été étonné
> >>> de lire qu'il n'y a rien pour l'OCR sous ubuntu, J'utilise depuis 5ans
> >>> cuneiform avec xsane et ça marche merveilleusement bien !
> >>>
> >>>
> >>
> >> --
> >> Liste de diffusion ubuntu-fr ubuntu-fr at lists.ubuntu.com
> >> Pour s'abonner ou se désabonner :
> >> https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
> >> Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte
> >>
> 
> 
> -- 
> Liste de diffusion ubuntu-fr ubuntu-fr at lists.ubuntu.com
> Pour s'abonner ou se désabonner : https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
> Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte


-- 
L'Africain <lafricain79 at gmail.com>




Plus d'informations sur la liste de diffusion ubuntu-fr