san4es: (reader)
san4es ([personal profile] san4es) wrote2011-03-05 09:59 am

Вопрос в отношении вычитки

Я всё время перебираю имеющиеся на сегодняшний день методики создания электронных книг. Как я уже писал ранее, формат DJVU представляется мне только лишь формой хранения сканов книжки. Хранения до момента создания уже версии векторного PDF. Конечно, как только в DJVU будет введена поддержка заметок и разного рода форматирования, я сразу же перейду окончательно к этому формату, а пока...

Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.

Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...


P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом [livejournal.com profile] dorombos предложил хороший компромисный вариант - если уже наличествует DJVU, то можно ограничиться одним вычитанным текстом. На этом и остановимся пока.

[identity profile] bezbogny.livejournal.com 2011-03-05 08:05 am (UTC)(link)
Думаю, цитирование "с координатами" нужно тем, кто использует книгу для академической работы. Лично мне - не нужно.
А вот возможность делать пометки и замечания нужны. Правда, я не знаю, какие форматы это позволяют (кроме полностью текстовых хтмл, док или фб2, разумеется - там-то всё просто).

[identity profile] monco83.livejournal.com 2011-03-05 08:29 am (UTC)(link)
Для серьёзных книг штука полезная, как я считаю.

[identity profile] dorombos.livejournal.com 2011-03-05 08:32 am (UTC)(link)
Скажем так, это полезно, не обязательно, чтобы страницы сохранялись в "читабельной" версии. Главное, чтобы оставался исходник, по которому можно было бы уточнить страницу.

[identity profile] master-genie.livejournal.com 2011-03-05 01:24 pm (UTC)(link)
ну, краще коли сторінки є, чим коли їх нема )

[identity profile] libelli-nestor.livejournal.com 2011-03-06 02:51 am (UTC)(link)
Вопрос о том, как часто требуется цитирование, некорректный. Порой требуется точное указание страницы. Но в электронном общении чаще не нужно. Если это короткая статья, при особой необходимости можно проследовать в библиотеку, точно установить страницу. Это легко. Если большая книга, дело сложнее. Но для "бумажной" фиксации результата выполняемой научной деятельности точное указание страницы абсолютно необходимо. Для электронного дискурса не нужно. Поэтому существенно важно уточнять сферу цитирования - бумажную или электронную.
Таковы самые общие положения.
Перейду к конкретике. Лично я специализируюсь на истории русской социал-демократии 1880-х гг. Наиболее часто цитируемый и наиболее ценный источник по этой теме - многотомный биобиблиографический словарь "Деятели революционного движения в России". Принято его цитировать со ссылкой на столбец. А в его существующей версии нет вообще указаний не только на столбцы, но и на тома. Постольку его существующая электронная версия имеет научную ценность, близкую к нулевой. Биографические данные можно брать не обязательно из этого источника, они присутствуют часто и в массе других публикаций, но если уж ты их откуда-то берешь, изволь дать ссылку. А если в электронном источнике не указан не только столбец, но даже том, то это полнейшая профанация, остановка на самом существенном моменте. Сведения мне и так известны, без электронной публикации, мне номер столбца и тома подай. Это безусловно необходимо для бумажной публикации. Если номера томов и столбцов отсутствуют в электронном издании, то это в традиционном научном обиходе почти равносильно полному отсутствию информации. Т. е. я эту информацию и так знаю, но я должен давать ссылку. Если не могу дать, то пользы от того, что она воспроизведена в электронном виде без указания стобцов/страниц абсолютно никакой.

[identity profile] libelli-nestor.livejournal.com 2011-03-06 11:25 am (UTC)(link)
Я привык пользоваться яндексом, но не думаю, что гугль в рассматриваемом отношении от него не отличается. В яндексе можно набрать произвольную группу из 3-5 слов в любых словоформах, в текстовых форматах он найдет, что нужно. В пдф же он умеет находить только одно слово в только одной заданной словоформе, оперировать флексиями и префисами он не умеет. Более того, не всегда почему-то производит повторный (искать следующее совпадение) поиск, бастует. А некоторые слова почему-то не находит совсем, хотя они есть. Может быть, дело в кодировках или в чем еще, причину я так и не понял.
А с любыми обычными текстовыми форматами - док - текст - хтмл никаких таких проблем вообще нет. Даже когда тексты в офлайне заархивированы, поиск по ним успешно (даже быстрее и лучше, чем в сети) выполняет персональный поиск яндекса.

Учитывая это обстоятельство, преимущества текстовых форматов над графикой с текстовыми слоями остается признавать очевидным.

[identity profile] libelli-nestor.livejournal.com 2011-03-06 11:42 am (UTC)(link)
По мне док лучше хтмл. Но предпочтительнее, по-моему, заархивированное представление. Конечно, приятно с помощью поискового запроса прямо в сети находить нужный контекст, но специалисту известны названия нужных ему источников, и ему достаточно, чтоб они как таковое присутствовали в сети.Это еще увязывается с вопросами дефицита-экономии места на винчестере и времени-скорости скачивания.
Полагаю, что в ближайшем обозримом будущем будут разработаны форматы, лишенные недостатков текстовых и фотоформатов. А пока я отдаю предпочтение заархивированному тексту.

[identity profile] libelli-nestor.livejournal.com 2011-03-06 12:50 pm (UTC)(link)
Идеален, по-моему, сейчас следующий набор инструментов.
1. Офлайновый (еще лучше и также онлайновый, но такового на сей момент пока еще не существует) библиотечный каталогизатор типа буксира.
2. Каталогизированная в этом каталогизаторе офлайновая библиотека.
3. Персональный поиск яндекса либо аналогичный других поисковиков - который индексирует тексты в архивах и позволяет производить в них поиск.
4. Качественный набор линков.
5. Факультативно - собственная электронная онлайн-библиотека.

Особенно эффективен такой инструментарий, когда он применяется группой исследователей. База каталогизатора, в принципе, не слишком большой файл. У меня 65 тыс. позиций в архиве весят всего мег. Участникам группы достаточно сравнительно изредка, несколько раз в год обмениваться обновленными версиями баз для того, чтоб получать в итоге в распоряжение громадные библиотеки, удобнейшие для непосредственного пользования.
В каталогизаторе "Буксир" встроен собственный отличный поиск по именам авторов и названиям текстов. Есть отфильтровка - по темам и т. п. Нужные тексты находятся в буквально два-три нажима. Альтернативно и факультативно можно выходить на нужный контекст с помощью персонального поиска яндекса в заархивированных файлах - за доли секунды.
Быстро, удобно, экономично.
Альтернативно, иначе. Долго и муторно искать нужные источники / контексты в онлайне, причем приходится просматривать горы белого мусора, далее столь же долго и муторно разбираться с отобранным более-менее подходящим.
А представленный мной инструментарий ускоряет и упрощает нахождение и получение нужных контекстов революционно, на пару порядков минимум по сравнению с традиционной технологией, где этот инструментарий не применяется.