Работа над Гецовым
Aug. 3rd, 2010 09:08 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Выкладывая Гецова, я преследовал не только цель поделиться информацией как таковой. Нет. Просто в этом году я всерьёз задумался над тем, как я работаю с информацией.
По большому счёту, как вы могли догадаться по моему интересу к данной книге, - никак. То есть в течение прошлого года я пытался привести в порядок каталог своих книг. Дело продвигалось и продвигается весьма туго из-за объёма накопленных запасов. Кроме каталогизации больше ничего не делал. А как следует из Гецова это всего лишь небольшая подготовительная работа.
Кстати, вопрос рационализации возник ещё осенью прошлого года, когда в коммуне "Знание-власть"
a1_a1 выложил две книжки Гецова и заодно провёл небольшой опрос на эту тему. Но как вопрос возник, так и зник обратно в пучины окружающей информации.
Ситуация изменилась с приобретением PocketBook'а. Началось некоторое движение в моём подзастывшем списке чтения. Но работа, домашние мелочи сильно сокращают возможности интеллектуальной работы по старинке - "сяду в свободную минутку, почитаю". Пока сядешь, пока поймёшь о чём читал в прошлый раз - тут и время всё закончилось.
Потом я обнаружил такую вещь как Zotero - плагин для Firefox, предназначенный для сбора, управления, цитирования и распространения информации. Входными форматами таковой могут быть любые файлы. Файлы, которые не открываются в Firefox, открываются в приложениях, ассоциированных с типами этих файлов.
Нас конечно же более всего интересуют текстовые файлы. Поскольку Zotero - плагин для Firefox, то у него отлично получается захватывать интернет-страницы. Так же хорошо налажена работа с txt-файлами. Результаты можно увидеть в броузере. PDF тоже хватается, а вот дальше всё зависит от остального программного обеспечения: в Винде можно открыть и в плагине Firefox, а можно и натравить на документ другую программу. В Линуксе же, насколько я понимаю, только в вызываемой программе.
Далее, захваченные документы можно раскладывать по папкам и коллекциям. Можно назначать им теги и искать по этим тегам. Перечисленное касается управления и хранения информации.
Теперь - о работе с информацией. Здесь есть отличия, связанные с форматом текстовой информации. Самыми обширными возможностями обладают интернет-страницы, с ними можно работать прямо в Firefox - можно выделять текст цветом и вешать в нужном месте, над нужными словами свои заметки. Сам текст страницы и наши заметки индексируются и впоследствии можно искать в них.
С PDF ситуации другая. Как я уже говорил, открываются они в другом приложении, хотя есть плагины для Firefox, позволяющие работать с PDF, однако те, которые я видел, были только для Windows либо проприетарными. В Linux будет вызываться программа, отвечающая за просмотр PDF. В Gnome таковой является Evince, которая нужной функциональностью не обладает - только лишь просмотр. Куда больше возможностей имеет Okular - стандартная "смотрелка" pdf-файлов в KDE. Вот там можно и текст выделять и "клейкие листочки" лепить. Из разговора гномовских разработчиков я понял, что Okular произвёл на них впечатление, и они собираются то же самое реализовать в Evince. Вот только когда? В 2.32 появилось инвертирование цвета документа, но пилить ещё долго.
Из этого затруднения можно выйти, если использовать программы Windows под Wine. Отличной бесплатной программой такого рода является PDF-XChange Viewer. Он обладает всей требуемой функциональностью, его запросто можно прикрутить для просмотра PDF. Текст pdf-документа индексируется Zotero и участвует в поиске. Правда, пометки, сделанные вами, не индексируются в Zotero, однако поиск по ним можно осуществлять в самом PDF-XChange Viewer. Более того, по этим заметкам можно осуществлять поиск и в случае картиночных PDF, то есть документов, не имеющих текстового слоя, сделанных из одних картинок. Их достаточно много в сети, практически столько же, сколько и DJVU. Заметки в любом PDF, а также подсветка в текстовом PDF сохраняются внутри файла.
ТХТ-файлы в Zotero отображаются, но пометки и выделения там сделать нельзя, и они не индексируются для поиска.
Работа с DJVU зависит от операционной системы. Сам файл можно поместить в Zotero, как и любой другой, в качестве приложения. Он будет открываться в сторонней программе или в плагине Firefox (только под Windows). И этим вся работа в Linux и ограничивается. Насколько мне известно, программы, позволяющие создавать заметки в DJVU есть только под Windows - это плагин Document Express DjVu для Firefox и просмотрщик WinDjView. Насчёт плагина не знаю, а WinDjView хранит заметки в реестре. Хотя можно использовать WinDjView и в Linux через Wine
Таким образом у нас получается следующая связка для работы с информацией:
1. Для Linux:
- Gnome: Zotero + (Wine->PDF-XChange Viewer) + (Wine->WinDjView)
- KDE: Zotero + Okular (так как у меня нет KDE, то я ничего не могу сказать насчёт того, где Okular хранит заметки и выделения текста; смею надеяться - внутри pdf-файла) + (Wine->WinDjView)
2. Для Windows: Zotero + PDF-XChange Viewer + (Document Express DjVu или WinDjView)
Конечно же, предложенная схема будет меняться с усовершенствованием программного обеспечения. В особенности это справедливо для Linux.
Из вышеизложенного следует по крайней мере такой вывод - DjVu надо рассматривать как временный формат для последующей вычитки и получения HTML, PDF, FB2. Во всяком случае сейчас. При этом надо учитывать, что PDF в западной научной среде стал стандартом, а следовательно, на той же Гигапедии подавляющее большинство книг именно в этом формате. На втором месте там идёт HTML с сохранением соответствия страниц.
FB2 в таком случае является форматом первого знакомства. После ознакомления с книгой или её главой можно перейти к более основательной работе над HTML или PDF с составлением заметок.
По большому счёту, как вы могли догадаться по моему интересу к данной книге, - никак. То есть в течение прошлого года я пытался привести в порядок каталог своих книг. Дело продвигалось и продвигается весьма туго из-за объёма накопленных запасов. Кроме каталогизации больше ничего не делал. А как следует из Гецова это всего лишь небольшая подготовительная работа.
Кстати, вопрос рационализации возник ещё осенью прошлого года, когда в коммуне "Знание-власть"
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Ситуация изменилась с приобретением PocketBook'а. Началось некоторое движение в моём подзастывшем списке чтения. Но работа, домашние мелочи сильно сокращают возможности интеллектуальной работы по старинке - "сяду в свободную минутку, почитаю". Пока сядешь, пока поймёшь о чём читал в прошлый раз - тут и время всё закончилось.
Потом я обнаружил такую вещь как Zotero - плагин для Firefox, предназначенный для сбора, управления, цитирования и распространения информации. Входными форматами таковой могут быть любые файлы. Файлы, которые не открываются в Firefox, открываются в приложениях, ассоциированных с типами этих файлов.
Нас конечно же более всего интересуют текстовые файлы. Поскольку Zotero - плагин для Firefox, то у него отлично получается захватывать интернет-страницы. Так же хорошо налажена работа с txt-файлами. Результаты можно увидеть в броузере. PDF тоже хватается, а вот дальше всё зависит от остального программного обеспечения: в Винде можно открыть и в плагине Firefox, а можно и натравить на документ другую программу. В Линуксе же, насколько я понимаю, только в вызываемой программе.
Далее, захваченные документы можно раскладывать по папкам и коллекциям. Можно назначать им теги и искать по этим тегам. Перечисленное касается управления и хранения информации.
Теперь - о работе с информацией. Здесь есть отличия, связанные с форматом текстовой информации. Самыми обширными возможностями обладают интернет-страницы, с ними можно работать прямо в Firefox - можно выделять текст цветом и вешать в нужном месте, над нужными словами свои заметки. Сам текст страницы и наши заметки индексируются и впоследствии можно искать в них.
С PDF ситуации другая. Как я уже говорил, открываются они в другом приложении, хотя есть плагины для Firefox, позволяющие работать с PDF, однако те, которые я видел, были только для Windows либо проприетарными. В Linux будет вызываться программа, отвечающая за просмотр PDF. В Gnome таковой является Evince, которая нужной функциональностью не обладает - только лишь просмотр. Куда больше возможностей имеет Okular - стандартная "смотрелка" pdf-файлов в KDE. Вот там можно и текст выделять и "клейкие листочки" лепить. Из разговора гномовских разработчиков я понял, что Okular произвёл на них впечатление, и они собираются то же самое реализовать в Evince. Вот только когда? В 2.32 появилось инвертирование цвета документа, но пилить ещё долго.
Из этого затруднения можно выйти, если использовать программы Windows под Wine. Отличной бесплатной программой такого рода является PDF-XChange Viewer. Он обладает всей требуемой функциональностью, его запросто можно прикрутить для просмотра PDF. Текст pdf-документа индексируется Zotero и участвует в поиске. Правда, пометки, сделанные вами, не индексируются в Zotero, однако поиск по ним можно осуществлять в самом PDF-XChange Viewer. Более того, по этим заметкам можно осуществлять поиск и в случае картиночных PDF, то есть документов, не имеющих текстового слоя, сделанных из одних картинок. Их достаточно много в сети, практически столько же, сколько и DJVU. Заметки в любом PDF, а также подсветка в текстовом PDF сохраняются внутри файла.
ТХТ-файлы в Zotero отображаются, но пометки и выделения там сделать нельзя, и они не индексируются для поиска.
Работа с DJVU зависит от операционной системы. Сам файл можно поместить в Zotero, как и любой другой, в качестве приложения. Он будет открываться в сторонней программе или в плагине Firefox (только под Windows). И этим вся работа в Linux и ограничивается. Насколько мне известно, программы, позволяющие создавать заметки в DJVU есть только под Windows - это плагин Document Express DjVu для Firefox и просмотрщик WinDjView. Насчёт плагина не знаю, а WinDjView хранит заметки в реестре. Хотя можно использовать WinDjView и в Linux через Wine
Таким образом у нас получается следующая связка для работы с информацией:
1. Для Linux:
- Gnome: Zotero + (Wine->PDF-XChange Viewer) + (Wine->WinDjView)
- KDE: Zotero + Okular (так как у меня нет KDE, то я ничего не могу сказать насчёт того, где Okular хранит заметки и выделения текста; смею надеяться - внутри pdf-файла) + (Wine->WinDjView)
2. Для Windows: Zotero + PDF-XChange Viewer + (Document Express DjVu или WinDjView)
Конечно же, предложенная схема будет меняться с усовершенствованием программного обеспечения. В особенности это справедливо для Linux.
Из вышеизложенного следует по крайней мере такой вывод - DjVu надо рассматривать как временный формат для последующей вычитки и получения HTML, PDF, FB2. Во всяком случае сейчас. При этом надо учитывать, что PDF в западной научной среде стал стандартом, а следовательно, на той же Гигапедии подавляющее большинство книг именно в этом формате. На втором месте там идёт HTML с сохранением соответствия страниц.
FB2 в таком случае является форматом первого знакомства. После ознакомления с книгой или её главой можно перейти к более основательной работе над HTML или PDF с составлением заметок.