GOCR — работающая из командной строки система оптического распознавания текста (OCR / Optical Character Recognition), имеющая TK (от авторов проекта) и GTK (а именно OCRFeeder) графический интерфейс (GUI). Разработку GOCR начал в 2000 году Jörg Schulenburg, в дальнейшем у проекта появилась небольшая команда разработчиков. Хоть проект и не слишком активно развивается (два, три релиза в год) но основной функционал для приложений подобного рода имеется.
GOCR имеет второе название: JOCR, по словам автора приложения , это получилось из за того что на проекте sourceforge.net адрес gocr.sourceforge.net был уже занят. Но название JOCR (Jörg's Optical Character Recognition) сейчас используется только для адреса страницы, хотя это и вносит некоторую путанницу у пользователей...
GOCR полностью поддерживает импорт изображений форматов: PNM, PBM, PGM, PPM, PCX (some) и TGA. Другие форматы изображений, таких как PNG, JPG, TIFF, GIF, BMP и pnm.gz / pnm.bz2 автоматически преобразовываются (используются netpbm-progs, gzip и bzip2).
GOCR поддерживает распознавание текста основных европейских языков (Czech, Danish, German, English, Spanish, French, Galician, Italian, Norwegian (bokmål), Portuguese, Romanian, Slovenian, Swedish, Chinese / русского к сожалению среди них нет).
GOCR может получать изображения напрямую со сканера (используя XSane), распознанный текст может сохраняться в форматах: txt, text, asc, htm и html. Весь процесс распознавания будет виден в окне приложения или в консоли.
GOCR используют, в качестве "движка" для оптического распознавания текста, некоторые консольные и графические приложения, например OCRFeeder.
Лицензия: GNU General Public License (GPL)
Вы можете войти под своим логином или зарегистрироваться на сайте.