san4es: (Default)

Когда-то давно, почти в другой жизни попалась мне книга Георгия Гецова «Как эффективно работать с информацией из книг, журналов, газет и других источников». Собственно, о чём она, можно с лёгкостью понять из заглавия. У Гецова на эту тему были и другие книги.

Уже тогда часть советов, даже возможно большая часть, была с трудом реализуема из-за увеличения потока информации в цифровом виде. Здесь в нулевые сложилась интересная ситуация.

Всё течет, всё меняется

Во-первых, массово распространились сканеры и читалки с экранами на электронных чернилах (e-ink). Так как получавшиеся картиночные файлы было невозможно из-за размеров экрана, то основное внимание как читателей, так и поставщиков контента ушло в сектор FB2. Сформировалась целая индустрия коллективной оцифровки и вычитки книг.

Теперь перейдём к форматам. В то время картиночный PDF как правило имел больший размер, чем DJVU. Кроме того, PDF клеймили как проприетарный формат. Соответственно, большая часть отсканированных тогда книг превращены в DJVU с текстовым слоем. Но это всё равно рассматривалось только как полуфабрикат для последующего трансформирования в FB2.

Что происходит сейчас. Звезда читалок e-ink судя по всему закатилась. Сейчас десятидюймовый планшет с IPS-экраном зачастую стоит дешевле шестидюймовой читалки при несравнимых остальных функциональных возможностях. Кто заботится о глазах, тот да, покупает по-прежнему e-ink. Многие же в этом смысла не видят. И выбор между FB2 и PDF/DJVU стал не таким уж однозначным.

Далее. Надо признать, что с появлением возможностей аннотирования PDF резко вырвался вперёд по сравнению с DJVU, который по своему развитию застрял на одном месте ещё десять лет назад. Попытки внедрить похожий функционал аннотирования по-моему не увенчались успехом, если вообще предпринимались. Есть варианты, но о них я расскажу ниже.

С времени прочтения Гецова прошла куча лет. И многое изменилось. Я практически не имею дела с бумажными книгами. У меня появилась девятидюймовая читалка Prometeus, и мне больше нет нужды переводить книги в FB2, чтобы их прочитать. Конечно, это повлияло на вычитку :), но в ещё большей степени повлияло отсутствие у меня времени на это.

Короче, изменилась среда, а значит надо адаптировать и свои инструменты. Я пытался экспериментировать с разными штуками. Например, в старом Firefox был прекрасный аддон Scrapbook, который позволял не только сохранять статьи на жёсткий диск, но и потом маркировать и аннотировать их. Пробовал работать и с Zotero.

Поводом к написанию этого поста стала прекрасная статья «Как аннотировать буквально всё». Я очень советую её прочитать, английский там несложный, потому что обсуждаются в основном конкретные программные решения.

Расскажу о том, что пригодилось мне.

И немедленно проаннотировал

Собственно, выбор средств аннотирования диктуется форматами и устройствами. По большому счёту, можно выделить два формата:

  • HTML, в котором у нас интернет присутствует. Как правило, это статьи
  • PDF/DJVU. Тут у нас уже более серьёзный по весу материал - книги.

HTML

Во-первых, для аннотирования статей в интернете я пользуюсь Hypothes.is. Это сервис, где надо регнуться, затем поставить официальное дополнение для Chrome или неофициальное для Firefox. Далее вы вводите в дополнении пароли и явки и можно начинать работу. После выделения текста мышью вас спросят: «Выделить?» или «Аннотировать?». Ну, и в зависимости от выбора будет либо цветовое выделение текста либо оно же плюс аннотация. Аннотации можно делать публичными или же скирдовать себе в личные закрома.

Так как бывают разные ситуации, то резонно иметь копию сделанных аннотаций. Это делается с помощью полуофициального интрумента экспорта аннотаций. Там также всё довольно просто: выбирается пользователь (надо сперва ввести ключ, который можно получить тут), группа аннотаций и вводится адрес страницы, где аннотировали. После запроса появляется иконка дискетки и дальше можно сохранить свои аннотации в виде html-файла. Его уже можно как хочешь препарировать и использовать. Ещё один вариант утилизации аннотаций - залить их в Zotero. У того же разработчика есть ещё один онлайн-сервис, позволяющий это осуществить. Надо только зарегаться на zotero.org Функционал у этой программки аналогичен: вводим ключ Hypothes.is, затем номер пользователя Zotero, ниже ключ, который генерится в своём профиле на Zotero. После чего происходит заливка аннотаций, которые после синхронизации в Zotero выглядят как примечания. Очень удобно, я считаю.

Важное примечание: Hypothes.is нормально работает только на десктопах. Для мобильных устройств надо использовать другие программы. Их перечень приведён в указанной выше статье.

PDF/DJVU

Здесь очень важным является наличие текстового слоя в файле. От этого зависит какими возможностями аннотирования вы будете располагать. Кстати, если я правильно понял, то Hypothes.is тоже можно использовать для аннотирования PDF (естественно, в браузере), но на мой взгляд это перебор :)

Так как моя система — Linux, то описывать я буду программу этой системы, а именно Okular. Насчёт других — всю информацию можно найти приведённой выше статьи про аннотирование.

Почему Okular? Потому что это, насколько я знаю, единственная программа, которая может аннотировать DJVU. Про PDF я и не говорю.

Если у вас PDF/DJVU без текстового слоя, то будут доступны следующие функции:

  • висящая заметка
  • встроенная заметка
  • произвольная линия
  • прямая линия
  • многоугольник
  • штамп
  • пишущая машинка

При наличии текстового слоя появляется возможность делать выделение цветом.

Как правило, я применяю комбинацию какого-либо выделения (прямая линия, многоугольник), чтобы выделить интересующий текст, и заметку для фиксации своих мыслей.

Если работаем с PDF, Okular сохраняет пометки прямо в файл. В случае DJVU создаётся новый файл с тем же названием, но с расширением .okular, куда и вносится вся информация об аннотировании. Открыть его можно только с помощью Okular'а же.

Замыкая круг

Написанное выше, как я упоминал, касается десктопа. Но у меня есть ещё e-ink читалка Prometeus. Книжки я читаю чаще всего на ней, поэтому пришлось вырабатывать метОду и для неё.

Вообще, для аннотирования PDF на android'е есть куча программ. К примеру, прекрасная программа под названием Xodo. Её можно также пользовать и на десктопе. Файлы можно брать как с локального компа, так и из Dropbox'а. Но Xodo работает только на свежей версии android'а, к сожалению. А это не мой случай.

Короче, процесс таков. Сами книги, PDF и DJVU, читаю в Orion Viever. Под рукой держу мобильник, где запущено что-то вроде Google Keep, где просто вношу заметки типа: «стр. <такая-то>: ...». Сам я пользуюсь GitJournal, который позволяет вести заметки в markdown, что здорово сокращает время. GitJournal хорош помимо этого тем, что набранное в нём можно тут же открыть на десктопе. Впрочем, с Google Keep та же история. Потом уже, если есть силы и желание, можно перенести заметки в сам файл книги. А можно и не переносить, а сразу в работу пускать.

Вот и всё, наверное. Это, конечно же, далеко не полный перечень существующих программ и программок, методов и методик и т.д. и т.п. Каждый сам себе подбирает инструментарий под характер и имеющееся железо. И не забывайте про ту прекрасную статью, ссылку на которую я дал в начале.

san4es: (reader)
Image and video hosting by TinyPic 

Настоящая статья представляет собой стенограмму речи, произнесенной тов. Н.И. Бухариным на диспуте о судьбах русской интеллигенции, происходившем 10 марта в Большом зале консерватории. Сборник, включающий в себя доклад и все речи, произнесенные на диспуте, находится в печати. — Ред. В диспутах первых послереволюционных лет о судьбах русской интеллигенции участвовали наряду с известными учеными, публицистами, литераторами (М. А. Рейснер, П. Н. Сакулин, А. К. Воронский и др.) видные деятели партии, авторитеты в вопросах культурной политики (Н. И. Бухарин, А. В. Луначарский). Диспут о судьбах русской интеллигенции проходил 10 марта 1925 г. в Москве в Большом зале консерватории. Стенограмма речи Н. И. Бухарина «Судьбы русской интеллигенции» публиковалась несколько раз. В настоящем сборнике печатается по: Печать и революция.— 1925.— № 3.—С. 1—10.


EPUB
HTML


Также статья выложена на marxist-texts.narod.ru




P.S. Большая просьба к читателям: если вас не затруднит, отмечайте пожалуйста все опечатки, и шлите меня подальше мне для дальнейшего исправления. Хоть тег "вычитка" и стоит, однако зачастую соблюдение форматирования съедает основное внимание. Заранее спасибо!
san4es: (reader)
Image and video hosting by TinyPic 

«Путь к социализму и рабоче-крестьянский союз» — одно из наиболее популярных в 20-е гг. произведений Н. И. Бухарина.


архив с HTML
EPUB


Также статья выложена на marxist-texts.narod.ru




P.S. Большая просьба к читателям: если вас не затруднит, отмечайте пожалуйста все опечатки, и шлите меня подальше мне для дальнейшего исправления. Хоть тег "вычитка" и стоит, однако зачастую соблюдение форматирования съедает основное внимание. Заранее спасибо!
san4es: (reader)
Я таки завершил преобразование текста "Анти-Дюринга", выложенного Ю. Финкелем, в EPUB. Ссылка для скачивания:

EPUB

С mobi придётся обождать - прямым конвертированием в Calibre добиться желаемого не удалось. SVG-картинки Calibre растеризовал и вставил настолько криво и страшно, что, чувствую, придётся опять вручную фигачить. Вообще, у меня возникает желание делать тексты с формулами в PDF - там хоть проблем не возникает. Конкретные цепочки можно продумать. К примеру, через Docbook в Latex, а потом в PDF.
san4es: (reader)
Обнаружил, что в Marxist Internet Archive есть раздел Ebooks. Сначала немного расстроился - значит, мою идею уже реализовали. А потом открыл страницу и обнаружил, что работы всё ещё непочатый край. Буду продолжать :) .

Надеюсь в ближайшие две недели закончить "Анти-Дюринга" на базе текста, сделанного Ю. Финкелем. Черновой вариант я уже читаю :).
san4es: (reader)
Теперь я обладатель вот такой штуковины:



Это - Kindle 3.

Краткая предыстория такова: в начале декабря, уже с загипсованной ногой, совершил весьма неудачное падение на пол, разбив при этом экран своего Pocketbook 360. Кинувшись к компьютеру, выяснил, что замена экрана стоит 150 долларов. Такой суммы под рукой не было, а посему я стал копить.

При этом я посещал страницы профильных форумов, чтобы держать себя в курсе последних событий в мире электронных книг. Kindle, кстати, мне не особо нравился. Отсутствие поддержки многих форматов, а также тот факт, что его надо заказывать за рубежом влияло на это.

Потом я как-то из-за спины жены, рассматривающей что-то в Amazon, узрел, что цена Kindle 139 долларов. С этого момента я стал уже интересоваться машинкой пристально. Оказалось, что у неё много "плюсов":
- экран из электронной бумаги нового поколения Pearl. При том, что новые модели как Pocketbook, так и Lbook пользуются предыдущим поколением.
- цена за Kindle 3 с 6-дюймовым экраном даже с учётом доставки всё равно ниже Pocketbook 360, не говоря о более современных 6-дюймовых моделях этих же фирм.
- на той же Flibusta.net книжки выкладываются в трёх форматах: fb2, epub и mobi - последний как раз и понимает Kindle.
- активно ведётся разработка программного обеспечения, которое даст поддержку недостающих форматов, распространённых у нас. Скажем, уже сейчас портирован на Kindle FBReader. С другой стороны друзья-китайцы пилят свою прошивку Duokan, которая позволяет читать DJVU, EPUB. Она правда недоработана, но даже в таком состоянии уже можно её использовать.

Параллельно я выяснил, что Amazon весьма сносно осуществляет доставку на территорию Украины. Есть даже тема на e-book.org для освещения вопросов доставки Kindle на Украину. Выяснив все вопросы, я окончательно уверился в том, что хочу именно Kindle.

Заказал 20 января. 27 января машинку получил.

Я ни на минуту не пожалел о своём выборе. Такого качества изображения я даже вообразить не мог. Мой старый Pocketbook 360, конечно, и рядом не валялся. Пока что даже не знаю на что пожаловаться :).

Так что, если перед вами, друзья, встанет вопрос приобретения читалки, советую посмотреть на Kindle.

P.S. Amazon мне не платил :)
san4es: (reader)
Вышла очередная версия oofbtools - 1.20. Основные изменения касаются конвертера и корректора текста.
san4es: (reader)

eCub


Один из разработчиков известной программной библиотеки wxWindows Джулиан Смарт занимается не только библиотекостроительством, но и применяет её в различных своих проектах. Его фирма Anthemion также поучаствовала в набирающем силу EPUB-движении и создала eCub - легковесный редактор для создания электронных книг в формате EPUB. Это всё-таки не open source, а freeware, однако рассмотреть его не мешает.

Что же он может? На сайте перечислены следующие возможности, предоставляемые программой:

- Создание нешифрованных EPUB-файлов из текстовых или XHTML-файлов;
- Создание MobiPocket-файлов при наличии программы mobigen
- Редактирование текстового или XHTML-файла в простом внутреннем редакторе или в выбранных внешних редакторах
- Создание простой обложки для электронной книги
- Возможно создание заглавной страницы, страницы содержания и страницы с обложкой
- Может запускаться из командной строки как часть скрипта
- Возможна работа в портативном режиме (данные и установки программы хранятся локально)
- Конвертация текста книги в аудиофайлы ((WAV или MP3)

дальше )
san4es: (reader)
Аннотация:

Монография — первая в современной советской литературе книга о „больших циклах" Н. Д. Кондратьева - ученого с мировым именем, погибшего во время репрессий 30-х годов. Авторы рассказывают о нынешнем состоянии марксистских исследований по длинным волнам, анализируют немарксистские концепции, поднимают дискуссионные вопросы о существовании длинных волн в социалистическом хозяйстве.

Для специалистов и широкого круга читателей, интересующихся экономикой.


За сканирование и DJVU благодарим [livejournal.com profile] rexy_craxy

Форматы:
EPUB: Зеркало 1 Зеркало 2
PDF: Зеркало 1 Зеркало 2
FB2: Зеркало 1 Зеркало 2
DJVU: Зеркало 1 Зеркало 2
ODT: Зеркало 1 Зеркало 2
san4es: (reader)

Немного о самом формате



Если верить Википедии, то впервые задумались о таком в 1999 году. Тогда вообще был бум разнообразного XML, и применить его пытались где только не. Тогда в был разработан стандарт Open eBook. Однако дело шло ни шатко, ни валко, поскольку в нише, на которую претендовал новый формат, и так толклось уже много конкурентов. Основным являлся PDF. А поскольку никаких особых выгод от использования формата на экране компьютера не было, то положение дел оставалось прежним.

Всё поменялось с появлением устройств с экраном из "электронной бумаги", eInk. Сразу появился рынок. К тому же к работе подключилась фирма Adobe.

дальше )

В следующих частях я хочу рассмотреть имеющиеся open source редакторы EPUB-книг.
san4es: (задумчивый)
Сейчас внезапно обнаружил, что уже две недели вникаю в детали этого самого формата. Прямо скажу, захватывающее занятие, если учесть, что в сети отсутствуют нормальные руководства на этот счёт, только какие-то обрывки. Вот из этих обрывков я и пытаюсь собрать рабочую цепочку. Похоже, что моим поискам наконец-то пришёл конец - в ближайшие дни оформлю серию заметок об этом. Весь затык образовался в формулах. Я относительно рано сообразил, что с ними делать, однако реализация, которая меня устроила, заняла время.

В своих поисках обнаружил весьма интересный репозиторий информации, равно как и ПО для развёртывания своего собственного. Это - Connexions. Тексты, выложенные там, могут быть скачены в формате PDF, ePUB, XML и HTML. Преобразование идёт на лету. Наши бы ещё и FB2 прикрутили, однако одного ePUB хватает за глаза. В общем - годная идея для собирания воедино текстов на заданную тему. Вполне себе замена электронным библиотекам. Одна проблема - контент надо в божеский вид привести, и разместить там, где бы не дотянулись длинные руки любителей копирайта.
san4es: (reader)
Что-то я со всякими заботами пропустил такое событие - вышла очередная версия прекрасного расширения OpenOffice oofbtools, которое предназначено для перегонки ODT-файлов в FB2.

Данный релиз в основном посвящён увеличению стабильности работы расширения. Хотя признаться, у меня ни разу ни падало.
san4es: (reader)
Долго ходил вокруг да около, страшновато было ставить, однако решился. Окончательно повлияло на решение наличие в прошивке 15.3 AdobeViewer. А это означает нормальную работу с ePub.

Установил без проблем. Быстренько наваял простенький тестовый epub-файл с таблицей и закатал его в читалку.

Всё работает, товарищи!

Сие означает, что отныне вся литература с формулами и таблицами идёт в ePub, а худлит - в FB2.

Попозже, когда будет время, расскажу про свои опыты с редакторами epub-файлов.

Profile

san4es: (Default)san4es

August 2020

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 27th, 2025 07:49 am
Powered by Dreamwidth Studios