gImageReader

Офисное ПО, ГрафикаПросмотров: 11670Комментарии: 95 сентября 2011 г.

gImageReader — простой Python / GTK (Gnome) графический интерфейс (GUI) к консольному приложению для распознавания текста Tesseract (frontend to tesseract-ocr).

Tesseract — консольное приложение для оптического распознавания текста. Разработкой приложения, с 1985 по 1995 год, занималась компания Hewlett-Packard (HP). После 2005 года разработка Tesseract была заморожена на 10 лет. Но в 2005 году исходные коды приложения были открыты и дальнейшую разработку возглавила компания Google.

Система оптического распознавания символов (текста) Tesseract, обычно используется для конвертации сканированных книг и документов в электронный вид, поддерживает распознавание множества языков (включая русский, с версии 3.0), имеется поддержка UTF-8 (кодировка реализующая представление Юникода).

Открываемые в gImageReader для распознавания изображения могут быть монохромными (черно-белыми), серыми и/или цветными. Изображения могут быть форматов PNG или JPG, хотя для более качественного распознавания текста рекомендуется преобразовать изображение в формат хранения растровых изображений TIFF (Tagged Image File Format).

gImageReader даёт возможность повысить яркость и контрастность изображения, изменить угол наклона (на оригинальном изображении изменения не отражаются). Распознаваться может как текст на всём изображении, так и текст только выделенного участка изображения.

gImageReader в распознанном тексте позволяет редактировать текстовое содержимое, проводит проверку орфографии (используется Aspell, можно добавить русский словарь из OpenOffice) и сохраняет распознанный текст в файле формата TXT.

Лицензия: GNU General Public License v3.0 (GPLv3)

Домашняя страница

Owlboxer

TEA (QT/GTK)

Комментариев: 9 RSS

1panas05-09-2011 20:47

а как добавить русский?

что то у меня в предпочитаемых языках можно выбрать только английский в разных интерпретациях :(

2posixru05-09-2011 21:10

Tesseract какая версия стоит? Русский доступен только с версии 3.0, а много где в репах ещё лежит tesseract-2.01 потому так и получается! Ну надо освежить его до 3.0 или просто в: /usr/local/share/tessdata/ положить распакованный из архива rus.traineddata скачанный с сайта проекта.

3panas05-09-2011 21:11

дико извиняюсь :)

подключил репозиторий: deb //ppa.launchpad.net/alex-p/notesalexp-natty/ubuntu natty main

поставил Tesseract 3.00 и русский tesseract-ocr-russian

4posixru05-09-2011 21:42

Так даже проще! :)))

5panas06-09-2011 19:07

но вот вопрос, он может распознавать не просто английский или русский, а русско-английский, т.е. многоязычный текст? и как это осуществить?

6posixru06-09-2011 20:18

Распознавание смешанного текста (русско-английский и пр...) в этом интерфейсе я не нашел как сделать, он или оно или другое...

А сразу это реализовано в интерфейсах:

//zenway.ru/page/yagf

//zenway.ru/page/cuneiform-qt

Можно ещё для общей информации посмотреть эти:

//zenway.ru/page/ocrfeeder

//zenway.ru/page/gocr

Ну и если не боимся консоли то можно использовать и этого:

//zenway.ru/page/abbyy-finereader-for-linux

7panas08-09-2011 21:33

спасибо :)

про Cuneiform слышал, распознаёт она неплохо, но вот нет возможности распознать только выделенный текст.. но оказывается есть YAGF..

поздновато я на ваш сайт наткнулся, но теперь буду постоянным читателем..

всё, ушёл пробовать

8Андрей03-04-2012 13:56

"Распознавание смешанного текста (русско-английский и пр...)" зависит не от программы графического интерфейса (gImageReader, YAGF, OCRFeeder), а от системы распознавания (CuneiForm, Tesseract). На данный момент распознавать русско-английский текст может только CuneiForm. Наберите в терминале

cuneiform -l

отобразится следующее:

eng ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slv lav lit est tur

ruseng - и есть языковой модуль для смешанного алфавита. Других сочетаний языков больше нет нигде (естественно, все утверждения относятся к свободному ПО).

9posixru03-04-2012 23:55

Других сочетаний языков больше нет нигде

Русским разработчикам видать этого не надо, а реализация распознавания смешанного текста русско-ххххх англичанам, французам или немцам вряд ли нужна... Потому и нет!

(естественно, все утверждения относятся к свободному ПО)

А что за гонево на свободное ПО? По вашему выходит что в коммерческом abbyy-finereader идеальная поддержка? Ну, ну... Не стоит идеализировать коммерческое, там тоже не медком помазано! Видел я эту поддержку и пользовал! Одно и то же распознаётся практически одинаково, потому и...

Вы можете войти под своим логином или зарегистрироваться на сайте.

gImageReader

Трансляция потока с веб-камеры с помощью ffserver

MusE - Linux Music Editor

WHDD

fbless

FreetuxTV

mlocate

GChemCalc