Вопрос в отношении вычитки
Я всё время перебираю имеющиеся на сегодняшний день методики создания электронных книг. Как я уже писал ранее, формат DJVU представляется мне только лишь формой хранения сканов книжки. Хранения до момента создания уже версии векторного PDF. Конечно, как только в DJVU будет введена поддержка заметок и разного рода форматирования, я сразу же перейду окончательно к этому формату, а пока...
Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.
Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...
P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом
dorombos предложил хороший компромисный вариант - если уже наличествует DJVU, то можно ограничиться одним вычитанным текстом. На этом и остановимся пока.
Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.
Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...
P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
no subject
А вот возможность делать пометки и замечания нужны. Правда, я не знаю, какие форматы это позволяют (кроме полностью текстовых хтмл, док или фб2, разумеется - там-то всё просто).
no subject
no subject
no subject
no subject
no subject
Просто тут у меня сошлись две технологии: одна позволяет шлёпать любые форматы, но без соответствия страниц, а вторая - шмалить в OpenOffice с последующей выгрузкой в PDF с соответствием страниц. Сразу в двух делать неохота.
Бум думать
no subject
no subject
no subject
1. Попробуйте набрать в поисковом окошке несколько слов для поиска. Результат выдачи будет только по первому слову, остальные можно было и не вводить, так как они все равно игнорируются.
2. Допустим, Вам нужно найти слово "скамейка". Если встречается в тексте, к примеру, скамейкой или скамейке, обычный текстовый (doc, txt, html...) файл поисковик найдет, а pdf/djvu - нет, потому что словоформ для этих форматов не понимает.
3. Иногда не находит точно имеющиеся в pdf/djvu слова. Почему - не знаю. С текстовыми файлами такого не случается. Возможно, из-за особого формата шрифтов / кодировок.
4. Плохо или вообще не понимает содержания колонтитулов. В частности, номера страниц...
И т. д.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
А вот с EPUB на 301-м проблема: не возвращяется назад после прыжка в сноску.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
Наверное дело в том, что криво смастырили сами ссылки. Их делают разными способами: в конце страницы, отдельным файлом, отдельными файлами на каждую ссылку. Надо посмотреть.
no subject
no subject
P.S. Люди из Pocketbook'a собираются портировать CoolReader на свои ибуки. Так что похоже FBReader со своими темпами развития окажется на обочине.
no subject
no subject
no subject
no subject
no subject
Таковы самые общие положения.
Перейду к конкретике. Лично я специализируюсь на истории русской социал-демократии 1880-х гг. Наиболее часто цитируемый и наиболее ценный источник по этой теме - многотомный биобиблиографический словарь "Деятели революционного движения в России". Принято его цитировать со ссылкой на столбец. А в его существующей версии нет вообще указаний не только на столбцы, но и на тома. Постольку его существующая электронная версия имеет научную ценность, близкую к нулевой. Биографические данные можно брать не обязательно из этого источника, они присутствуют часто и в массе других публикаций, но если уж ты их откуда-то берешь, изволь дать ссылку. А если в электронном источнике не указан не только столбец, но даже том, то это полнейшая профанация, остановка на самом существенном моменте. Сведения мне и так известны, без электронной публикации, мне номер столбца и тома подай. Это безусловно необходимо для бумажной публикации. Если номера томов и столбцов отсутствуют в электронном издании, то это в традиционном научном обиходе почти равносильно полному отсутствию информации. Т. е. я эту информацию и так знаю, но я должен давать ссылку. Если не могу дать, то пользы от того, что она воспроизведена в электронном виде без указания стобцов/страниц абсолютно никакой.
no subject
no subject
А с любыми обычными текстовыми форматами - док - текст - хтмл никаких таких проблем вообще нет. Даже когда тексты в офлайне заархивированы, поиск по ним успешно (даже быстрее и лучше, чем в сети) выполняет персональный поиск яндекса.
Учитывая это обстоятельство, преимущества текстовых форматов над графикой с текстовыми слоями остается признавать очевидным.
no subject
no subject
no subject
no subject
Полагаю, что в ближайшем обозримом будущем будут разработаны форматы, лишенные недостатков текстовых и фотоформатов. А пока я отдаю предпочтение заархивированному тексту.
no subject
1. Офлайновый (еще лучше и также онлайновый, но такового на сей момент пока еще не существует) библиотечный каталогизатор типа буксира.
2. Каталогизированная в этом каталогизаторе офлайновая библиотека.
3. Персональный поиск яндекса либо аналогичный других поисковиков - который индексирует тексты в архивах и позволяет производить в них поиск.
4. Качественный набор линков.
5. Факультативно - собственная электронная онлайн-библиотека.
Особенно эффективен такой инструментарий, когда он применяется группой исследователей. База каталогизатора, в принципе, не слишком большой файл. У меня 65 тыс. позиций в архиве весят всего мег. Участникам группы достаточно сравнительно изредка, несколько раз в год обмениваться обновленными версиями баз для того, чтоб получать в итоге в распоряжение громадные библиотеки, удобнейшие для непосредственного пользования.
В каталогизаторе "Буксир" встроен собственный отличный поиск по именам авторов и названиям текстов. Есть отфильтровка - по темам и т. п. Нужные тексты находятся в буквально два-три нажима. Альтернативно и факультативно можно выходить на нужный контекст с помощью персонального поиска яндекса в заархивированных файлах - за доли секунды.
Быстро, удобно, экономично.
Альтернативно, иначе. Долго и муторно искать нужные источники / контексты в онлайне, причем приходится просматривать горы белого мусора, далее столь же долго и муторно разбираться с отобранным более-менее подходящим.
А представленный мной инструментарий ускоряет и упрощает нахождение и получение нужных контекстов революционно, на пару порядков минимум по сравнению с традиционной технологией, где этот инструментарий не применяется.
no subject
no subject
Замечу еще, что обычно цитаты бородачей я нахожу, вводя номера страниц, когда они мне известны. Совпадения с другими аналогичными цифрами, как показывает опыт, встречаются достаточно редко. Эти тексты я делал в доке. А в пдф то же делать много сложнее. Не знаю почему, но номера страниц во внутреннем поиске читалок пдф находятся крайне ненадежно.
no subject
Совершенно потрясающая прога с колоссальным количеством возможностей! Я без нее давно уже не могу обходиться, как без рук.