(g)ocr

Marc Coevoet sintsixtus op gmail.com
Do Okt 22 19:02:24 UTC 2009


Niels Egberts schreef:
> 2009/10/22 Dieter <DiiN op tele2.nl>:
>   
>> Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels
>> Egberts:
>>     
>>> Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
>>>       
>> Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
>> daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
>> nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
>> wat in xsane wordt gebruikt.
>> Wat voor parameters gebruik jij?
>>
>> Groet, Dieter.
>>
>>     
>
> Ik upload het gewoon naar de site. Ze zeggen dat ze Tesseract
> gebruiken. Die heeft een GPL licensie en (mede) ontwikkelt door
> Google. Het schijnt dat ze het ook gebruiken voor het inscannen van
> alle boeken.
>
>   


Tesseract komt van HP.  Ontwikkeld ergens in de jaren 80 al.
HP gaf de broncode vrij, want onderzoek doen op zoiets dat neit 100% 
perfect raakt, is niet leuk.


http://en.wikipedia.org/wiki/Tesseract_(software)

Marc

-- 
Shortwave transmissions in English, Francais, Deutsch, Suid-Afrikaans, Urdu, Cantonese, Greek, Spanish, Portuguese, ...
http://users.fulladsl.be/spb13810/radio/swlist/   
Stations list: http://users.fulladsl.be/spb13810/radio/txlist/





Meer informatie over de Ubuntu-NL maillijst