Linux -- это интересно

Ocrad (The GNU OCR)


Рубрика: Изучаем Linux -> Офисное ПО -> Графика
Метки: | | |
Просмотров: 936

Ocrad (The GNU OCR) — система оптического распознавания текста (OCR / Optical Character Recognition), на входе поддерживает изображения в формате pbm (bitmap), pgm (greyscale) или ppm (color) и выдает текст в байтовом (8-bit) формате или в UTF-8, Разработано под эгидой проекта GNU (The GNU Project).

Для оптического распознавания в Ocrad использует метод выделения признаков (feature extraction). В состав системы входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах. Может применяться как в форме библиотеки, для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках. Распознавание поддерживается только для кодировок "ascii", "iso-8859-9" и "iso-8859-15", поддержка кириллицы отсутствует.

Домашняя страница

Оставьте комментарий!
Используйте нормальные имена.Войти через loginza
Если вы уже зарегистрированы как комментатор или хотите зарегистрироваться, укажите пароль и свой действующий email.
(При регистрации на указанный адрес придет письмо с кодом активации и ссылкой на ваш персональный аккаунт, где вы сможете изменить свои данные, включая адрес сайта, ник, описание, контакты и т.д.)



 
(обязательно)