Шаг 5 Удаление черных участков. Создание электронных копий книг в формате DjVu.

В папке 04 (что в папке 0000) лежат изображения страниц книги. У большинства из них имеются черные участки по периметру.Изображение страницы с черными участкамиЭти участки черноты необходимо убрать. Выполнять операцию по очистке будем с помощью программы ScanKromsator.
Ярлык программы ScanKromsatorВообще-то, программа ScanKromsator может очень многое делать с изображениями, но, к сожалению, работает не всегда корректно. Поэтому, я стараюсь использовать ее как можно меньше, но в данном случае без нее не обойтись.
Прежде чем приступить к обрезке полей, нужно удалить сканы страниц без текста и рисунков. Это обычно самый первый скан и возможно самый последний.
1. В папке 0000 приготовим очередную папку 05.
2. Открываем программу ScanKromsator и нажимаем на картинку с желтыми папочками. В появившемся окне «Открыть» выбираем папку 04, приводим показ файлов изображений к виду «Таблица», выделяем все файлы снизу вверх и нажимаем кнопку «Открыть».
Открывание изображенийВ верхнем левом углу окна программы должен появиться список файлов изображений для обработки.
С левой стороны задаются правила обработки.
  • "Split" - разрезание страницы с разворотом на две половины
  • "Despeckle" - удаление мелких паразитных пятен
  • "Deskew" - автоматическая компенсация наклона страниц
  • "AutoMargins" - автоматический расчет полей страницы
Для "Split" и "AutoMargins" однозначно убераем флажки, для "Despeckle" и "Deskew" можно оставить, а лучше убрать .
Задаем настройки линеек обрезки изображения по периметру. Задавать настройки можно для каждого файла в отдельности или для всего пакета сразу.
Если задаем для каждого файла в отдельности.
Активируем первый файл в списке и устанавливаем положение режущих линий, см скриншот.
Настройка линеек для обрезки полей в программе ScanKromsatorУстанавливаем флажок для первого файла и переходим к следующему и далее по порядку.
Настройка параметров для каждого файлаПри настройке важно помнить следующее:
  • Если нужно изменить настройку, сначала необходимо снять флажок, изменить настройку и затем вновь поставить флажок.
  • Важно выполнять настройку для файлов строго по порядку, иначе программа переставляет файлы местами.
  • Если держать клавишу "Ctrl" нажатой, то обе параллельные линейки обрезки будут перемещаться одновременно с сохранением заданного расстояния между ними.
  • Не нужно ставить линейки обрезки близко к тексту, программа не всегда точно соблюдает установленные настройки, может обрезать и текст, если линейка была установлена очень близко к тексту.
Если задаем настройки для всех изображений.
Выставляем линейки для первого файла, переходим к файлу в середине и проверяем, не обрезают ли линейки что-нибудь полезное и нужное, при необходимости корректируем. Переходим к последнему файлу и так же проверяем, корректируем. Если книга толстая, проверяем еще несколько раз.
Честно скажу, для толстой книги этот номер не проходит, слишком большой разбег расположения текста на страницах. А вот для тонкой книги при аккуратном сканировании очень даже замечательно получается задать обрезку для всего пакета сразу.
После того, как настроено и проверено, переходим к последнему файлу и нажимаем "Apply up to corrent", все установленные правила будут «прикреплены» ко всем файлам, начиная от первого файла в списке, не имеющего впереди галочки, и заканчивая последним файлом.
Для определения пути сохранения файлов нажимаем "File" и в "Output dir" выбираем папку (двойным кликом), в которую будут сохраняться результирующие файлы
Задаем путь для сохранения файлов Выполняем настройки для сохранения выходных файлов.
"Output prefix" – произвольная буквенно-цифровая строка, которая будет добавляться к именам выходных файлов. Можно оставить пустой.
"Start from" – числовое значение в имени файла, с которого начнется нумерация выходных страниц. Устанавливаем 1.
"Step" – числовой шаг, используемый при нумерации выходных файлов. Устанавливаем 1.
"Name length" - число знаков в номере выходного файла
"Output format" – формат выходных изображений. Выбираем TIFFG4FAXCompress
"DPI" – значение DPI выходных изображений. Устанавливаем "Original"
"Color" - Устанавливаем "Original"
Scan Kromsator растройка параметров сохранения результирующих файловНажимаем "Process!" - процесс пошел. По окончании процесса появится окошечко.
Окончание процессаНажимаем "ОК" и на экран будет выведено окно, в котором отображаются файлы с результирующими изображениями, где можно будет проверить полученные изображения и выполнить пост-обработку с помощью ластика и других инструментов.
Окно пост-обработки результирующих файлов Scan KromsatorПосле пост-обработки изображений закрываем окно просмотра и закрываем программу, появляется окно
Нажимаем "Нет".
На сегодня все. В папке 05 находятся "чистенькие" изображения. Желательно перед дальнейшей обработкой проверить соответствие номеров файлов с номерами страниц. К сожалению, программа Scan Kromsator любит переставлять страницы местами, переименовывая их, так что нумерация файлов идет строго по порядку, а в книге потом оказываются перепутанные страницы.

Design by Blogger Templates