Es tracta d'un programa que converteix text escanejat en format .tif a fitxer .txt. Si la imatge és en format .pdf o altri es pot convertir a .tif amb GIMP.
Aquest fitxers que deixo no fan que el programa s'expressi en català, el que permeten és convertir a .txt, imatges de textos en català amb una gran fidelitat, ja que els programes d'OCR acostumen a tenir poca exactitud i converteixen uns caràcters en d'altres.
Hi ha una versió per windows però no se si valdran els fitxers que us deixo.
Primer s'ha de tenir instal.lat el programa (en anglès) i després copiar els fitxers de l'enllaç a la carpeta tessdata (en ubuntu /usr/share/tesseract-ocr/tessdata). Per fer-lo servir s'escriu a la terminal 'tesseract nom_fitxer_imatge.tif nom_fitxer_text -l cat'.També hi ha una versió gràfica (TesseractGUI)