Еще один приятный сюрприз от
pdfimages.
Нужно было получить чёткий черно-белый вариант из pdf’a, сгенерированного archive.org. Изложу далее на примере одной страницы из такого pdf’a. Вот этой —
Я напустил на этот pdf
pdfimages, предполагая затем нудную обработку изображений СканТейлором. Но всё вышло иначе. Результатом деятельность
pdfimages было превращение каждой страницы в три графических файла: rablais-000.ppm, rablais-001.ppm и rablais-002.pbm —
Выглядят они вот так (я их уменьшил и конвертнул в png):
- rablais_resized_002.png (8.77 КБ) 19763 просмотра
(Почему-то третий файл-картинка никак не хочет вставляться так же, как предыдущие два)
Разумеется, я обрадовался. Ненужные файлы элементарно удалялись командой
а нужные элементарно же инвертировались циклом
Код: Выделить всё
for file in *
do
name=`echo $file | sed "s/.pbm//"`
convert -negate $file $name.pdf
done
Затем
pdfunite, и в результате — идеальный черно-белый pdf.
Но что это за слоеный пирог делают на archive.org, не знаю. Кто в курсе, просветите.