ZenWay - Linux сегодня!
  • Главная
  • Форум
  • Контакты
  • Архив
  • Гостевая книга
×
Поиск по сайту
ГлавнаяHужное/полезноеГрафикаPage dewarp

Page dewarp

Графика, Hужное/полезноеПросмотров: 3684Комментарии: 320 марта 2018 г.
Console / ImageMagick / PDF / Python / Конвертер / Простая утилита / Сканер / Фото

Page dewarp (page_dewarp) — консольная Python утилита для устранения геометрического искривления (деформации/перекоса) плоскости оцифрованных страниц. Работа утилиты основана на некоторых возможностях библиотеки OpenCV.

OpenCV (Open Source Computer Vision Library) — свободная библиотека алгоритмов компьютерного зрения (обнаружение, отслеживание и классификация объектов), обработки изображений и численных алгоритмов общего назначения.

Большинство современных систем распознавания текста (OCR / Optical Character Recognition) ориентированы на работу с прямыми горизонтальными строками, поэтому качество распознавания напрямую зависит от качества самого распознаваемого изображения. Одним из существенных факторов влияющих на качество изображений является деформация строк текста на изображении возникающее в результате особенностей съёмки (сканирования).

При сканировании толстых книг деформация выражается в искажениях строк по загибанию их краёв вблизи сгиба (в области корешка), это особенно заметно если для получения изображений вместо сканера используются цифровые камеры (добавляются искажения оптики). На одном изображении могут сочетаться несколько деформаций, что значительно усложняет построение точной модели искривления страницы.

Для систем распознавания текста устранение геометрического искривления плоскости объекта оцифровки необходимо решать ещё на этапе пост-обработки (оптимизации), известно несколько решений задачи распрямления деформированных строк сканированного документа. page_dewarp использует собственный алгоритм по коррекции изгиба страниц, основанный на параметрической модели определения параметров внешнего вида страницы.

page_dewarp прост в использовании, сканированные изображения формата JPEG оптимизируются и преобразуются в изображения формата PNG (исходные изображения остаются без изменений). При преобразовании выводятся подробности процесса, опционально изображения могут объединятся в PDF документ (используется ImageMagick), например:

page_dewarp *.jpg -o output.pdf

На сайте проекта имеется подробное описание используемого алгоритма/метода оптимизации (на английском) и доступны "тестовые" изображения (используемые как примеры в документации).

Лицензия: MLT (The MIT License)

Домашняя страница

Страница на github.com

noteshrink
Gifcurry
Автор: posixru
Еще записи по теме
grim
grim
PornView
PornView
Photini
Photini
Визуализатор Massif (Massif Visualizer)
Визуализатор Massif (Massif Visualizer)
Pinta
Pinta
Colorpicker
Colorpicker

Комментариев: 3 RSS

1Аноним27-03-2018 07:28

Получается она только для черно-белых изображений.

2Gera27-03-2018 13:37

Так написано ведь что утилитой для систем распознавания сканы правятся, упор на текстовое содержимое и потому чёрно-белое.

Для выпрямления обычных фоток другие инструменты используются. В GIMP плагин или скрипт такой есть, но названия его не помню, вот что точно помню так то что в digiKam такая функция раньше была, сам использовал, да много ещё какие редакторы это могут. На линухграфик.ру который сейчас digilinux.ru цикл статей по этому поводу был, но мне уже не надо было и я только краем глаза их пробежал.

3Аноним23-12-2022 14:44

Теперь есть плюсовая (не пайтон) версия: //github.com/ImageProcessing-ElectronicPublications/pagedewarp/releases

Оставьте комментарий!

Используйте нормальные имена.

Вы можете войти под своим логином или зарегистрироваться на сайте.

(обязательно)

Рубрики
  • Hовости
  • Изучаем Linux
  • Обзоры Linux ПО
    • Hужное/полезное
    • Аудио и видео ПО
    • Графика
    • Офисное ПО
    • Интернет ПО
    • Образовательные
    • Игры
    • Администрирование
    • Системные утилиты
    • Прочие
    • Shareware / Demo
  • Дистрибутивы
  • Дополнительные материалы
Последние комментарии
AbiWord
  • Святой_Мученик_Linux » Некорректно отображает картинки в майкросовтовски х файлах doc. Картинки позиционируются одна на другую, поверх текста. В...
  • vs » К сожалению, AbiWord давно протух и толку от него ровно 0. Даже больше вреда. Сейчас...
tarsnap
  • Анонимус » В тексте опечатка "для использования для использования"
DarGUI / KDar
  • WinGamer » Можно ли забекапить всю систему windows этим архиватором?
cfiles
  • Дмитрий » так эт самое, а как например переименовать папку?
Profanity
  • zon » проше научится свой клиент написать чем разобратся куда что клацать для отправки получения месаг.
  • vovans » Тут не нужно ничего "клацать". Достаточно пару раз на хоткеи посмотреть.
noteshrink
  • Аноним » Теперь есть плюсовая (не пайтон) версия: //github. com/ ImageProcessing - ElectronicPublications /noteshrink-c/ releases
Page dewarp
  • Аноним » Теперь есть плюсовая (не пайтон) версия: //github. com/ ImageProcessing - ElectronicPublications /pagedewarp/ releases
Strawberry Music Player
  • Rododendron » А как добавить радиостанции в плеер? Нигде найти не могу.
Форум
[18/11/2022 11:54:52]
vscode and c/c++
[31/08/2022 12:25:53]
Tor Browser
[26/08/2022 07:57:14]
Музыкальный калейдоскоп
[22/05/2022 15:45:40]
Стратегии RTS
[30/03/2022 09:05:20]
Заметки с синхронизацией
[01/03/2022 20:15:05]
Говорильня (дискуссионный клуб)
[13/02/2022 11:44:28]
[РЕШЕНО] права на запись в примонтированный образ диска (raw.img)
[07/02/2022 13:22:01]
Конвертировать текст набаранный в неправильной раскладке
[04/02/2022 20:35:22]
Редактор тегов
Облако меток
2D338 3D241 ALSA68 ASCII120 Android1 Arch Linux38 Audio416 Backup80 Benchmark78 Bluetooth2 C++969 CD48 Console1318 DJ-система17 DVD47 Debian28 DjVu22 Enlightenment19 FFmpeg191 FLTK29 FPS40 FREE155 FTP18 FVWM21 Fluxbox40 GIMP24 GNU26 GPS22 GTK1302 GUI801 Gambas11 Games686 Gentoo3 Gnome349 Gstreamer133 HDD122 HDR7 HTML62 Hex-редактор14 ICQ17 IP-сети25 IP-телефон22 IRC31 ISO39 IceWM22 ImageMagick56 JACK99 Jabber35 Java308 JavaScript115 KDE209 LAN29 LXDE37 LaTeX66 Live-CD70 Live-DVD55 Live-USB53 Lua61 MATE32 MEncoder31 MIDI91 MMORPG12 Mail42 Markdown53 Mono53 Mplayer75 MySQL2 OSS9 Open Source14 OpenGL301 Openbox89 P2P51 PDF133 PHP12 Pascal17 Perl102 Phonon27 PulseAudio17 Python759 QT894 RAW34 RPG101 RSS53 RTS42 Roguelike70 Ruby19 Rust15 SDL312 SVG39 Screencast32 Screenshot61 Script78 Slackware66 TOR17 TOX3 Tk39 Torrent67 Ubuntu69 VLC16 Vala64 Web629 WebKit72 WebUI34 WiFi47 Window Maker16 Wine8 XMPP35 Xfce70 Xine14 YouTube80 video4linux27 wxWidgets108 Автоматизация31 Администрирование335 Анонимная сеть47 Антивирус14 Апплет120 Аркада235 Архиватор11 Астрономия36 Аудио конвертер70 Аудио редактор50 Аудиоплеер184 Безопасность243 Бизнес-приложение4 Браузер87 Бродилка203 Бухгалтерия11 Веб-камера36 Видео148
© Zen Way, 2023. Работает на MaxSite CMS | Время: 0.1815 | SQL: 19 | Память: 8.73MB | Вход