san4es

Я тут обнаружил, что некоторые (не будем показывать пальцами :)) не пользуются такой замечательной программой как ScanCromsator. И решил заполнить пробел небольшим введением в это "чудо". Хочу предупредить, что данный текст никак не может считаться чем-либо эквивалентным нормальному мануалу. Нет, он - просто для ознакомления.

Программа выполняет очень важную работу по подготовке изображения к распознаванию. Количество настроек для этого в самой проге огромное, я даже все толком не знаю, так как не использовал. Ограничимся самым простым случаем.

Сначала скачиваем архив с программой. Последней версией на момент написания является ScanCromsator 5.91. Брать его можно с разных мест, я качал отсюда. На Forum.Ru-Board есть страница обсуждения ScanCromsator'а, иногда попадаются весьма полезные обсуждения. К сожалению, как я понял, Болега, автор программы, прекратил её поддержку. Будем надеяться, что такой общественно полезный труд не пропадёт, и кто-то его продолжит, тем более, что существовали планы по переделке программы.

Установка ScanCromsator'а - самая простейшая. Просто разархивируйте скачанное в какую-нибудь папку, скажем C:\Soft\ScanCromsator (под Windows) или свою домашнюю папку в Linux. Всё, можете запускать, просто кликаем на программе в Винде, или открываем через Wine в Линуксе.

Итак, перед нами есть изображения, полученные со сканера или цифрового фотоаппарата. Мы очень старались, но... Всё равно имеются погрешности в виде некоторого разворота текста или грязи на странице или со светом что-то не то - да мало ли как бывает.

Открываем картинку или картинки.

Затем идём на вкладку Files. Смотрим, куда будут выводиться обработанные картинки. Обычно программа предлагает создать в папке, где лежат исходные страницы, папку Out. Если устраивает - оставляем. Там же можно выставить номера страниц, которые будут идти в названии обработанных файлов. К примеру, начать с 32 страницы. Ещё можно изменить формат в котором будут сохраняться файлы. Я, правда, оставляю как есть. Ещё на этой вкладке можно изменить разрешение как входное, так и выходное.

В случае, если предстоит обработка разворота книги, т.е. двух страниц сразу, то следует на вкладке Page выставить галочку напротив Split.

Теперь задействуем резаки для полей. В случае обработки разворота мы выставляем все галочки, как на рисунке. При обработке одиночной страницы нам не нужен внутренний резак. При наведении мышки на место для галки всплывает подсказка.

Выставляем резаки таким образом, чтобы по максимуму уходили всякие погрешности и поля. Оставляем только текст.

Осматриваем полученный результат. Если всё устраивает, то в левом верхнем углу выставляем галочку напротив названия только что обработанного файла. Нажимаем на названии следующего, и оказывается, что настройки полей перешли от предыдущей страницы на текущую. Отлично! При более-менее одинаковом положении книжки в сканере работа над полями уменьшается до минимума.

После выставления полей для всех страниц нажимаем кнопку Process! и ждём результата. В папке Out и там, куда вы решили сохранять, лежат страницы, которые теперь можно скормить FineReader'у или сразу оформить книжку в формате Djvu.

Вот и всё. Повторюсь, в программе огромное количество настроек. В комплекте идёт справочный PDF-файл. А для затравки хватит и этого текста.

Удачи!

кросспост в