Вопрос в отношении вычитки
Я всё время перебираю имеющиеся на сегодняшний день методики создания электронных книг. Как я уже писал ранее, формат DJVU представляется мне только лишь формой хранения сканов книжки. Хранения до момента создания уже версии векторного PDF. Конечно, как только в DJVU будет введена поддержка заметок и разного рода форматирования, я сразу же перейду окончательно к этому формату, а пока...
Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.
Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...
P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом
dorombos предложил хороший компромисный вариант - если уже наличествует DJVU, то можно ограничиться одним вычитанным текстом. На этом и остановимся пока.
Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.
Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...
P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
no subject
А вот возможность делать пометки и замечания нужны. Правда, я не знаю, какие форматы это позволяют (кроме полностью текстовых хтмл, док или фб2, разумеется - там-то всё просто).
(no subject)
no subject
(no subject)
no subject
(no subject)
(no subject)
(no subject)
(no subject)
no subject
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
Таковы самые общие положения.
Перейду к конкретике. Лично я специализируюсь на истории русской социал-демократии 1880-х гг. Наиболее часто цитируемый и наиболее ценный источник по этой теме - многотомный биобиблиографический словарь "Деятели революционного движения в России". Принято его цитировать со ссылкой на столбец. А в его существующей версии нет вообще указаний не только на столбцы, но и на тома. Постольку его существующая электронная версия имеет научную ценность, близкую к нулевой. Биографические данные можно брать не обязательно из этого источника, они присутствуют часто и в массе других публикаций, но если уж ты их откуда-то берешь, изволь дать ссылку. А если в электронном источнике не указан не только столбец, но даже том, то это полнейшая профанация, остановка на самом существенном моменте. Сведения мне и так известны, без электронной публикации, мне номер столбца и тома подай. Это безусловно необходимо для бумажной публикации. Если номера томов и столбцов отсутствуют в электронном издании, то это в традиционном научном обиходе почти равносильно полному отсутствию информации. Т. е. я эту информацию и так знаю, но я должен давать ссылку. Если не могу дать, то пользы от того, что она воспроизведена в электронном виде без указания стобцов/страниц абсолютно никакой.
(no subject)
no subject
А с любыми обычными текстовыми форматами - док - текст - хтмл никаких таких проблем вообще нет. Даже когда тексты в офлайне заархивированы, поиск по ним успешно (даже быстрее и лучше, чем в сети) выполняет персональный поиск яндекса.
Учитывая это обстоятельство, преимущества текстовых форматов над графикой с текстовыми слоями остается признавать очевидным.
(no subject)
(no subject)
(no subject)
no subject
Полагаю, что в ближайшем обозримом будущем будут разработаны форматы, лишенные недостатков текстовых и фотоформатов. А пока я отдаю предпочтение заархивированному тексту.
no subject
1. Офлайновый (еще лучше и также онлайновый, но такового на сей момент пока еще не существует) библиотечный каталогизатор типа буксира.
2. Каталогизированная в этом каталогизаторе офлайновая библиотека.
3. Персональный поиск яндекса либо аналогичный других поисковиков - который индексирует тексты в архивах и позволяет производить в них поиск.
4. Качественный набор линков.
5. Факультативно - собственная электронная онлайн-библиотека.
Особенно эффективен такой инструментарий, когда он применяется группой исследователей. База каталогизатора, в принципе, не слишком большой файл. У меня 65 тыс. позиций в архиве весят всего мег. Участникам группы достаточно сравнительно изредка, несколько раз в год обмениваться обновленными версиями баз для того, чтоб получать в итоге в распоряжение громадные библиотеки, удобнейшие для непосредственного пользования.
В каталогизаторе "Буксир" встроен собственный отличный поиск по именам авторов и названиям текстов. Есть отфильтровка - по темам и т. п. Нужные тексты находятся в буквально два-три нажима. Альтернативно и факультативно можно выходить на нужный контекст с помощью персонального поиска яндекса в заархивированных файлах - за доли секунды.
Быстро, удобно, экономично.
Альтернативно, иначе. Долго и муторно искать нужные источники / контексты в онлайне, причем приходится просматривать горы белого мусора, далее столь же долго и муторно разбираться с отобранным более-менее подходящим.
А представленный мной инструментарий ускоряет и упрощает нахождение и получение нужных контекстов революционно, на пару порядков минимум по сравнению с традиционной технологией, где этот инструментарий не применяется.
(no subject)
(no subject)
(no subject)