Как разобрать PDF на текст и картинки
Прислано: Gans-S
чт, 11/03/2010 - 20:05
А не попадался ли кому-нибудь модуль, позволяющий вытащить из PDF-ки текст и картинки?
- Gans-S's blog
- Для комментирования войдите или зарегистрируйтесь
1. Каким боком вы относите это к Drupal?
2. pdfimages, pdftotext.
- Для комментирования войдите или зарегистрируйтесь
1. Отношу скорее по неопытности.Нужен такой функционал для сайта на Drupal: вытащить и собрать по новой - текст и картинки, без форматирования.
2. Это Perl? Незнакомы...
- Для комментирования войдите или зарегистрируйтесь
Если вы такой умный то зачем спрашиваете?
- Для комментирования войдите или зарегистрируйтесь
2. Это Perl? Незнакомы...
Пакет poppler (в некоторых дистрибутивах -- poppler-utils).
Этот пакет содержит утилиты: pdftops (конвертер PDF в PostScript), pdfinfo (извлекает информацию о документе из PDF), pdfimages (извлекает изображения из PDF), pdftohtml (конвертер PDF в HTML), pdftotext (конвертер PDF в текст), и pdffonts (анализатор шрифтов PDF).
- Для комментирования войдите или зарегистрируйтесь

Комментарии