san4es: (reader)
[personal profile] san4es
Я всё время перебираю имеющиеся на сегодняшний день методики создания электронных книг. Как я уже писал ранее, формат DJVU представляется мне только лишь формой хранения сканов книжки. Хранения до момента создания уже версии векторного PDF. Конечно, как только в DJVU будет введена поддержка заметок и разного рода форматирования, я сразу же перейду окончательно к этому формату, а пока...

Вопрос собственно вот в чём. Для целей последующего цитирования требуется иметь книжку с соответствием страниц, что накладывает дополнительные требования к вычитке. Просто ради "почитать" делается очень легко и непринуждённо. Можно сходу получить кучу форматов на все случаи жизни.

Вопрос такой: ответьте, пожалуйста, насколько часто вам требуется цитирование? Заморачиваться с этим или нет? Это не очень трудно, однако...


P.S. Коллективное мнение склоняется к тому, что соответствие страниц - весьма важная вещь. При этом [livejournal.com profile] dorombos предложил хороший компромисный вариант - если уже наличествует DJVU, то можно ограничиться одним вычитанным текстом. На этом и остановимся пока.

(no subject)

Date: 2011-03-06 03:01 am (UTC)
From: [identity profile] libelli-nestor.livejournal.com
Все была ба чюдно. Но поисковики не умеют корректно искать в пдф и дежавю. А в доке и хтмл умеют. А посему графформаты можно принимать как лишь промежуточный вариант, полуфабрикат текстов, готовых к непосредственному употреблению.

(no subject)

Date: 2011-03-06 05:20 am (UTC)
From: [identity profile] san4es.livejournal.com
А точно поисковики не умеют искать в PDF? Вроде бы Гугл выдаёт результаты поиска в PDF. Или он это делает именно что "некорректно"?

(no subject)

Date: 2011-03-07 02:22 am (UTC)
From: [identity profile] libelli-nestor.livejournal.com
Проверьте сами. Я, правда, лично предпочитаю яндекс, гуглем почти не пользуюсь, но не думаю, что в этом между ними разница.
1. Попробуйте набрать в поисковом окошке несколько слов для поиска. Результат выдачи будет только по первому слову, остальные можно было и не вводить, так как они все равно игнорируются.
2. Допустим, Вам нужно найти слово "скамейка". Если встречается в тексте, к примеру, скамейкой или скамейке, обычный текстовый (doc, txt, html...) файл поисковик найдет, а pdf/djvu - нет, потому что словоформ для этих форматов не понимает.
3. Иногда не находит точно имеющиеся в pdf/djvu слова. Почему - не знаю. С текстовыми файлами такого не случается. Возможно, из-за особого формата шрифтов / кодировок.
4. Плохо или вообще не понимает содержания колонтитулов. В частности, номера страниц...
И т. д.
Page generated Jul. 15th, 2025 02:10 pm
Powered by Dreamwidth Studios