san4es: (reader)
san4es ([personal profile] san4es) wrote2010-08-03 09:08 am

Работа над Гецовым

Выкладывая Гецова, я преследовал не только цель поделиться информацией как таковой. Нет. Просто в этом году я всерьёз задумался над тем, как я работаю с информацией.

По большому счёту, как вы могли догадаться по моему интересу к данной книге, - никак. То есть в течение прошлого года я пытался привести в порядок каталог своих книг. Дело продвигалось и продвигается весьма туго из-за объёма накопленных запасов. Кроме каталогизации больше ничего не делал. А как следует из Гецова это всего лишь небольшая подготовительная работа.

Кстати, вопрос рационализации возник ещё осенью прошлого года, когда в коммуне "Знание-власть" [livejournal.com profile] a1_a1 выложил две книжки Гецова и заодно провёл небольшой опрос на эту тему. Но как вопрос возник, так и зник обратно в пучины окружающей информации.

Ситуация изменилась с приобретением PocketBook'а. Началось некоторое движение в моём подзастывшем списке чтения. Но работа, домашние мелочи сильно сокращают возможности интеллектуальной работы по старинке - "сяду в свободную минутку, почитаю". Пока сядешь, пока поймёшь о чём читал в прошлый раз - тут и время всё закончилось.

Потом я обнаружил такую вещь как Zotero - плагин для Firefox, предназначенный для сбора, управления, цитирования и распространения информации. Входными форматами таковой могут быть любые файлы. Файлы, которые не открываются в Firefox, открываются в приложениях, ассоциированных с типами этих файлов.

Нас конечно же более всего интересуют текстовые файлы. Поскольку Zotero - плагин для Firefox, то у него отлично получается захватывать интернет-страницы. Так же хорошо налажена работа с txt-файлами. Результаты можно увидеть в броузере. PDF тоже хватается, а вот дальше всё зависит от остального программного обеспечения: в Винде можно открыть и в плагине Firefox, а можно и натравить на документ другую программу. В Линуксе же, насколько я понимаю, только в вызываемой программе.

Далее, захваченные документы можно раскладывать по папкам и коллекциям. Можно назначать им теги и искать по этим тегам. Перечисленное касается управления и хранения информации.

Теперь - о работе с информацией. Здесь есть отличия, связанные с форматом текстовой информации. Самыми обширными возможностями обладают интернет-страницы, с ними можно работать прямо в Firefox - можно выделять текст цветом и вешать в нужном месте, над нужными словами свои заметки. Сам текст страницы и наши заметки индексируются и впоследствии можно искать в них.

С PDF ситуации другая. Как я уже говорил, открываются они в другом приложении, хотя есть плагины для Firefox, позволяющие работать с PDF, однако те, которые я видел, были только для Windows либо проприетарными. В Linux будет вызываться программа, отвечающая за просмотр PDF. В Gnome таковой является Evince, которая нужной функциональностью не обладает - только лишь просмотр. Куда больше возможностей имеет Okular - стандартная "смотрелка" pdf-файлов в KDE. Вот там можно и текст выделять и "клейкие листочки" лепить. Из разговора гномовских разработчиков я понял, что Okular произвёл на них впечатление, и они собираются то же самое реализовать в Evince. Вот только когда? В 2.32 появилось инвертирование цвета документа, но пилить ещё долго.

Из этого затруднения можно выйти, если использовать программы Windows под Wine. Отличной бесплатной программой такого рода является PDF-XChange Viewer. Он обладает всей требуемой функциональностью, его запросто можно прикрутить для просмотра PDF. Текст pdf-документа индексируется Zotero и участвует в поиске. Правда, пометки, сделанные вами, не индексируются в Zotero, однако поиск по ним можно осуществлять в самом PDF-XChange Viewer. Более того, по этим заметкам можно осуществлять поиск и в случае картиночных PDF, то есть документов, не имеющих текстового слоя, сделанных из одних картинок. Их достаточно много в сети, практически столько же, сколько и DJVU. Заметки в любом PDF, а также подсветка в текстовом PDF сохраняются внутри файла.

ТХТ-файлы в Zotero отображаются, но пометки и выделения там сделать нельзя, и они не индексируются для поиска.

Работа с DJVU зависит от операционной системы. Сам файл можно поместить в Zotero, как и любой другой, в качестве приложения. Он будет открываться в сторонней программе или в плагине Firefox (только под Windows). И этим вся работа в Linux и ограничивается. Насколько мне известно, программы, позволяющие создавать заметки в DJVU есть только под Windows - это плагин Document Express DjVu для Firefox и просмотрщик WinDjView. Насчёт плагина не знаю, а WinDjView хранит заметки в реестре. Хотя можно использовать WinDjView и в Linux через Wine

Таким образом у нас получается следующая связка для работы с информацией:

1. Для Linux:
- Gnome: Zotero + (Wine->PDF-XChange Viewer) + (Wine->WinDjView)
- KDE: Zotero + Okular (так как у меня нет KDE, то я ничего не могу сказать насчёт того, где Okular хранит заметки и выделения текста; смею надеяться - внутри pdf-файла) + (Wine->WinDjView)

2. Для Windows: Zotero + PDF-XChange Viewer + (Document Express DjVu или WinDjView)

Конечно же, предложенная схема будет меняться с усовершенствованием программного обеспечения. В особенности это справедливо для Linux.

Из вышеизложенного следует по крайней мере такой вывод - DjVu надо рассматривать как временный формат для последующей вычитки и получения HTML, PDF, FB2. Во всяком случае сейчас. При этом надо учитывать, что PDF в западной научной среде стал стандартом, а следовательно, на той же Гигапедии подавляющее большинство книг именно в этом формате. На втором месте там идёт HTML с сохранением соответствия страниц.

FB2 в таком случае является форматом первого знакомства. После ознакомления с книгой или её главой можно перейти к более основательной работе над HTML или PDF с составлением заметок.