san4es: (pulemet4ik)
[personal profile] san4es
Я тут обнаружил, что некоторые (не будем показывать пальцами :)) не пользуются такой замечательной программой как ScanCromsator. И решил заполнить пробел небольшим введением в это "чудо". Хочу предупредить, что данный текст никак не может считаться чем-либо эквивалентным нормальному мануалу. Нет, он - просто для ознакомления.

Программа выполняет очень важную работу по подготовке изображения к распознаванию. Количество настроек для этого в самой проге огромное, я даже все толком не знаю, так как не использовал. Ограничимся самым простым случаем.

Сначала скачиваем архив с программой. Последней версией на момент написания является ScanCromsator 5.91. Брать его можно с разных мест, я качал отсюда. На Forum.Ru-Board есть страница обсуждения ScanCromsator'а, иногда попадаются весьма полезные обсуждения. К сожалению, как я понял, Болега, автор программы, прекратил её поддержку. Будем надеяться, что такой общественно полезный труд не пропадёт, и кто-то его продолжит, тем более, что существовали планы по переделке программы.

Установка ScanCromsator'а - самая простейшая. Просто разархивируйте скачанное в какую-нибудь папку, скажем C:\Soft\ScanCromsator (под Windows) или свою домашнюю папку в Linux. Всё, можете запускать, просто кликаем на программе в Винде, или открываем через Wine в Линуксе.

Итак, перед нами есть изображения, полученные со сканера или цифрового фотоаппарата. Мы очень старались, но... Всё равно имеются погрешности в виде некоторого разворота текста или грязи на странице или со светом что-то не то - да мало ли как бывает.

Image and video hosting by TinyPic

Открываем картинку или картинки.

Image and video hosting by TinyPic

Затем идём на вкладку Files. Смотрим, куда будут выводиться обработанные картинки. Обычно программа предлагает создать в папке, где лежат исходные страницы, папку Out. Если устраивает - оставляем. Там же можно выставить номера страниц, которые будут идти в названии обработанных файлов. К примеру, начать с 32 страницы. Ещё можно изменить формат в котором будут сохраняться файлы. Я, правда, оставляю как есть. Ещё на этой вкладке можно изменить разрешение как входное, так и выходное.

Image and video hosting by TinyPic

В случае, если предстоит обработка разворота книги, т.е. двух страниц сразу, то следует на вкладке Page выставить галочку напротив Split.

Image and video hosting by TinyPic

Теперь задействуем резаки для полей. В случае обработки разворота мы выставляем все галочки, как на рисунке. При обработке одиночной страницы нам не нужен внутренний резак. При наведении мышки на место для галки всплывает подсказка.

Image and video hosting by TinyPic

Выставляем резаки таким образом, чтобы по максимуму уходили всякие погрешности и поля. Оставляем только текст.

Image and video hosting by TinyPic

Осматриваем полученный результат. Если всё устраивает, то в левом верхнем углу выставляем галочку напротив названия только что обработанного файла. Нажимаем на названии следующего, и оказывается, что настройки полей перешли от предыдущей страницы на текущую. Отлично! При более-менее одинаковом положении книжки в сканере работа над полями уменьшается до минимума.

Image and video hosting by TinyPic

После выставления полей для всех страниц нажимаем кнопку Process! и ждём результата. В папке Out и там, куда вы решили сохранять, лежат страницы, которые теперь можно скормить FineReader'у или сразу оформить книжку в формате Djvu.

Вот и всё. Повторюсь, в программе огромное количество настроек. В комплекте идёт справочный PDF-файл. А для затравки хватит и этого текста.

Удачи!

кросспост в [livejournal.com profile] znanie_vlast

простой вопрос

Date: 2008-09-29 12:12 pm (UTC)
From: [identity profile] berdychevsky.livejournal.com
А как пометить все файлы сразу?

Вопрос простой, но...

Date: 2008-09-29 12:59 pm (UTC)
From: [identity profile] san4es.livejournal.com
А вот этого похоже нет :). Я, правда, с этим не сталкивался, потому и не разбирался как это делается. Так что, по одному :)

Re: Вопрос простой, но...

Date: 2008-09-29 01:01 pm (UTC)
From: [identity profile] berdychevsky.livejournal.com
но важный. если есть 100 файлов, то выделять каждый...

Re: Вопрос простой, но...

Date: 2008-09-29 01:06 pm (UTC)
From: [identity profile] san4es.livejournal.com
Согласен. Только вот у меня как правило приходилось резаки полей почти везде поправлять. Уж не знаю, как насчёт моих рук, но было так.
Page generated Jun. 30th, 2025 12:51 pm
Powered by Dreamwidth Studios