san4es: (reader)
san4es ([personal profile] san4es) wrote2011-03-05 09:59 am

Вопрос в отношении вычитки

Я всё время перебираю имеющиеся на сегодняшний день методики создания электронных книг. Как я уже писал ранее, формат DJVU представляется мне только лишь формой хранения сканов книжки. Хранения до момента создания уже версии векторного PDF. Конечно, как только в DJVU будет введена поддержка заметок и разного рода форматирования, я сразу же перейду окончательно к этому формату, а пока...

Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.

Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...


P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом [livejournal.com profile] dorombos предложил хороший компромисный вариант - если уже наличествует DJVU, то можно ограничиться одним вычитанным текстом. На этом и остановимся пока.

[identity profile] libelli-nestor.livejournal.com 2011-03-06 12:50 pm (UTC)(link)
Идеален, по-моему, сейчас следующий набор инструментов.
1. Офлайновый (еще лучше и также онлайновый, но такового на сей момент пока еще не существует) библиотечный каталогизатор типа буксира.
2. Каталогизированная в этом каталогизаторе офлайновая библиотека.
3. Персональный поиск яндекса либо аналогичный других поисковиков - который индексирует тексты в архивах и позволяет производить в них поиск.
4. Качественный набор линков.
5. Факультативно - собственная электронная онлайн-библиотека.

Особенно эффективен такой инструментарий, когда он применяется группой исследователей. База каталогизатора, в принципе, не слишком большой файл. У меня 65 тыс. позиций в архиве весят всего мег. Участникам группы достаточно сравнительно изредка, несколько раз в год обмениваться обновленными версиями баз для того, чтоб получать в итоге в распоряжение громадные библиотеки, удобнейшие для непосредственного пользования.
В каталогизаторе "Буксир" встроен собственный отличный поиск по именам авторов и названиям текстов. Есть отфильтровка - по темам и т. п. Нужные тексты находятся в буквально два-три нажима. Альтернативно и факультативно можно выходить на нужный контекст с помощью персонального поиска яндекса в заархивированных файлах - за доли секунды.
Быстро, удобно, экономично.
Альтернативно, иначе. Долго и муторно искать нужные источники / контексты в онлайне, причем приходится просматривать горы белого мусора, далее столь же долго и муторно разбираться с отобранным более-менее подходящим.
А представленный мной инструментарий ускоряет и упрощает нахождение и получение нужных контекстов революционно, на пару порядков минимум по сравнению с традиционной технологией, где этот инструментарий не применяется.

[identity profile] san4es.livejournal.com 2011-03-06 01:51 pm (UTC)(link)
Интересно, надо будет покрутить. Насколько я понимаю, результатом поиска будет текстовый файл. А он каков? Просто текст или с соответствием страниц? Или за конкретными координатами страницы обращаться уже на этапе формирования библиографии?

[identity profile] libelli-nestor.livejournal.com 2011-03-06 02:08 pm (UTC)(link)
Текст такой, какой сделан. С пагинацией или без. Отличный поиск в тексте, с различением регистров букв, имеется также и в самом буксире. Т. е. персональный поиск яндекса на искомое место в тексте не выводит, выдает только текст, а поиск буксира находит искомое место в тексте и его повторения.
Замечу еще, что обычно цитаты бородачей я нахожу, вводя номера страниц, когда они мне известны. Совпадения с другими аналогичными цифрами, как показывает опыт, встречаются достаточно редко. Эти тексты я делал в доке. А в пдф то же делать много сложнее. Не знаю почему, но номера страниц во внутреннем поиске читалок пдф находятся крайне ненадежно.

[identity profile] libelli-nestor.livejournal.com 2011-03-07 02:35 am (UTC)(link)
Заглянул на сайт разработчика Марка Солтановича http://msolt.chat.ru . Оказывается, месяц назад вышла долгожданная новая версия буксира. Полное обалдеть, прямо фантастика. Научился каталогизировать онлайн-странички, поддерживать 7zip, обслуживать все функции fb2.
Совершенно потрясающая прога с колоссальным количеством возможностей! Я без нее давно уже не могу обходиться, как без рук.