pdfgrep — консольная утилита для поиска текста в PDF-документах без открытия файлов. Как следует из названия утилита сделана совместимой с grep (GNU Grep), где это имело смысл.
grep (сокращение от global/regular expression/print) — мощная консольная утилита для поиска в текстовых файлах. Для поиска используется компактный алгоритм сопоставления, выдающий по образцу уникальный и предопределённый результат, в виде строк содержащих образец. Утилита является частью проекта GNU.
pdfgrep удивительно быстрая и точная, утилита работает намного быстрее и корректнее чем поиск предоставляемый практически всеми приложениями просмотра документов PDF (Portable Document Format) с функцией поиска.
pdfgrep может работать с файлами любого размера и одновременно с несколькими файлами, в том числе и зашифрованными. Основное отличие от grep это работа с страницами а не строками, а также выводе одной строки несколько раз, если в этой строке найдено несколько совпадений.
pdfgrep с помощью дополнительных опций позволяет задать размер вывода (количество совпадений), показать краткий и расширенный вывод результатов (в разном формате). Можно задать любую фильтрацию результата (в том числе по количеству страниц), поддерживается игнорирование регистра в заданном регулярном выражении, рекурсивный поиск файлов в заданном каталоге и прочее...
pdfgrep имеет встроенную функцию подсветки найденных совпадений, используемый "по умолчанию" цвет подсветки можно изменить (с помощью переменной окружения GREP_COLORS). При отсутствии совпадений и ошибок ничего не выводится (если не используется опция --quiet или -q).
Лицензия: GNU General Public License version 2.0 (GPLv2)