Linux -- это интересно

YAGF


Рубрика: Офисное ПО
Метки: | | |
Просмотров: 5102
YAGF

Система оптического распознавания текста.


YAGF — является простой QT графической оболочкой к консольной утилите распознавания текстов cuneiform.

CuneiForm — в переводе с английского "Клинопись", система оптического распознавания текстов разработанная российской компанией Cognitive Technologies. Первоначально разрабатывалась как коммерческий проект, поставляясь с некоторыми моделями сканеров, но после нескольких лет перерыва в разработке Cognitive Technologies освободила проект прекратив так же разработку и продажу CuneiForm.

YAGF используя CuneiForm преобразует электронные копии бумажных документов и графических файлов в редактируемый текст с возможностью сохранения структуры оригинального документа. Возможна как одиночная так и пакетная обработка электронных документов, упрощающая последовательное распознавание большего числа сканированных страниц.

YAGF может управлять сканированием изображений, получать изображения напрямую со сканера используя программу XSane, их предварительной обработкой (уменьшить, увеличить изображение, исправить наклон страницы), не влияющей на оригинал изображения. А так же, с помощью aspell (libaspell), возможна проверка орфографии в уже распознанном тексте.

Основная версия cuneiform позволяет распознавать тексты почти на всех европейских языках (перед началом нужно выбрать язык, или пару русский/английский если текст смешанный). А при использовании модифицированной версии cuneiform есть возможность использования опции "Представить текст в виде одной колонки", это опция повышает качество распознавание сложно-форматированных текстов.

В YAGF можно использовать не только изображения со сканера, но и изображения сохранённые на жестком диске. Добавлять графические файлы можно из контекстного меню файлового менеджера или простым перетаскиванием его в окно программы. Поддерживаются графические форматы: JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и другие...

Распознанный текст может быть сохранён на диске в текстовом формате (кодировка UTF-8), в формате HTML или скопирован в буфер обмена (например для вставки в редактор текстов OpenOffice.org).

Лицензия: GPL v3

Домашняя страница

Оставьте комментарий!
Используйте нормальные имена.Войти через loginza
Если вы уже зарегистрированы как комментатор или хотите зарегистрироваться, укажите пароль и свой действующий email.
(При регистрации на указанный адрес придет письмо с кодом активации и ссылкой на ваш персональный аккаунт, где вы сможете изменить свои данные, включая адрес сайта, ник, описание, контакты и т.д.)



 
(обязательно)