Шаг 6 Распознавание текста. Создание электронных копий книг в формате DjVu.

В папке 05 лежат файлы почти готовые к распознаванию текста. Дело в том, что для распознавания текста будет использоваться программа ABYY FineReadar, которая не любит файлы после программы Scan Kromsator. Поэтому чтобы программа ABYY FineReadar не ругалась, необходимо прогнать файлы через программу Irfan View.
1. Подготовим очередную папку 06 в папке 0000.
2. Открываем программу IrfanView и выполняем соответствующие настройки.
Настройки преобразования файлов Irfan ViewБолее подробно выполнение настроек по преобразованию файлов описано здесь
3. Нажимаем "Старт", преобразование файлов будет происходить очень быстро. По окончанию процесса нажимаем "Выход".
Все в папке 06 лежат файлы полностью готовые к распознаванию текста.

4. Открываем программу ABYY FineReadar. Далее «файл» - «Сохранить пакет как…». В появившемся окне «Сохранить пакет как…» выделяем папку 0000 и вводим имя пакета - 07. Нажимаем «Сохранить».
5. Для загрузки изображений нажимаем на треугольник справа от картинки с надписью «Открыть», выбираем папку 06, приводим её к виду "Таблица", выделяем все файлы внизу вверх и нажимаем "Открыть".
Откроется окно «Идёт добавление файлов в пакет», и дожидаемся завершения операции.
6. Задаем опции распознавания текста, для этого нажимаем на треугольник рядом с картинкой "Распознать все".
Иконка В выпадающем меню выбираем "Опции", нажимаем "Проверка" и убираем флажок напротив надписи "Останавливаться на не словарных словах".
Настройка опций проверки распознаваемого текста в программе ABBYY FineReader7. Нажимаем "Распознать все". Распознавание текста программа выполняет достаточно долго. Так, например, у меня книгу из 300 стр программа распознает примерно 30 мин.
8. По завершению операции закрываем программу. Проверяем папку 07, в ней лежат многостраничные файлы.

Design by Blogger Templates