san4es: (Default)

Вернее, судя по датам релизов, ещё неизвестно, кто первый. Так или иначе, ещё одна система перевода с использованием нейронной сети — OpenNMT.

На этот раз обучать сеть можно и у себя дома :) Правда, цифры при этом фигурируют офигительные. И это неудивительно, потому что базовая система написана на Lua и есть порт на Python.

Известный фанат переводческого дела Йост Зетце не преминул попробовать:

Моя первая тренировка нейросистемы машинного перевода на тестовых данных (около 250 000 фраз), взятых с сайта OpenNMT, заняла 8 часов на компьютере с Intel Xeon X3470, 2.93 GHz Quad Core с 32 Гб оперативной памяти. Люди с форума OpenNMT рекомендовали мне установить GPU, если я хочу обрабатывать большие объёмы данных. Я поставил Nvidia GTX 1070 с 8 Гб оперативной памяти. Это позволило мне провести тренировку модели на 3,2 миллионах фраз за 25 часов.

Дальше он там говорит, что результатами поражён, хотя и не всё гладко. Тем не менее, результат его впечатлил.

Короче, обкладывают нас, ой, обкладывают.

san4es: (Default)

Волею пославшей мя жены отправлен был в автошколу. Поначалу особенно сильно не мучался: ходи на теорию, записывай. Чего ж тут сложного? Правда, два дня в неделю это начало откушивать.

Так прошёл август. В начале сентября началось вождение. Тут уже стало сложнее: площадка автошколы расположена на Северной стороне. Сие означает, что туда добираться надо на катере со всеми вытекающими.

А потом я начал готовиться к сдаче экзамена по теории и тут наступил полный, мнэ, конец. Я перестал что-либо успевать. Ещё и работы привалило.

И тут интересная штука обнаружилась: если раньше времени было просто завались, на всё хватало, ну, в крайнем случае, можно было бы чуть меньше всякой чуши читать в сети. А тут — не помогает. Я полностью прекратил читать новости, всякие ЖЖ-ФБ и прочее, но толку. Видимо, старый стал и такие накрытия уже выношу плохо. Экзамены же сильно на мозги давили, отвлекали от работы напрочь.

Ну, да ладно. Пережили. Сдал я теорию и площадку. Остался город, но тут уже вряд ли пофартит — не накатал я ещё нормально, не накатал.

san4es: (Default)
День прожит не зря. Узнал новое слово "smart-assery". Это, друзья, "хитрожопость". Нет, всё-таки англосаксы не такие пропащие люди
san4es: (Default)
Возник интерес к средствам коллективного перевода. Полез в интернеты. И вот чего нарыл:

1. Pootle. Относительно давно ведущийся проект. Некоторые жалуются на ошибки и тормоза. Писано на Python и Django.

2. Weblate. Из молодых, да ранних. Развивается очень бодро. Те же самые Python и Django.

3. ReGlot. Этот уже на PHP

4. Transifex. Это "опчественная" версия проприетарного продукта. Опять таки Python.

Ни один не пробовал, потому как нужды в этом не было.

Перечислены, естественно, только программы, которые можно развернуть на своём сервере. А так - бездна сервисов по коллективному переводу, регайся - не хочу.
san4es: (Default)
Вчера в полдень таки сдали работу. До сих пор поверить не можем. Вчера лёг наконец-то в 10 вечера вместо обычных часа-двух ночи, а проснулся после 8. И хоть такое позднее вставание только в связи с НГ, но всё же - Свобода!!!!
san4es: (hujase)
Работа подходит к концу, и можно немного отвлечься.

Вводная: надо было прочитать про регион в ЮАР под названием Карру. Открываю в Гугле, после чего лезу в английскую Википедию. Прочитал, увидел, что есть на русском, открыл ещё до кучи русскую Вики. После второго абзаца сполз под стол и долго нервно хихикал оттуда.

Судите сами:
кррасота )
san4es: (Default)
Дело, друзья мои, вот в чём: мы прихватили чудовищных размеров работу, которая по срокам доходит аж до середины декабря. При этом свободного времени нет ни капли. Ни на писание в ЖЖку, ни на чтение.

Так что, с новыми EPUBами придётся обождать. Да и экономическая энциклопедия пока что приостановится в своём пополнении, хотя мой напарник [livejournal.com profile] evgeniy_kond нагрузил полуфабриката на месяц работы.

Вот так-то...
san4es: (Default)
Сейчас все про марсоход и пишут. Решил и я окунуться, так сказать, в общественную истерию. Полез на Википедию читать про него.

Всё бы ничего, однако в процессе испытал томление духа - опять переводилки читаю. Я их и по работе читаю. Сколько уже можно. Вот некоторая нямка:

таки езиг )

Я понимаю, что тема горячая, что надо срочно в номер, но дай хоть перечитать кому-нибудь мимо проходящему! Про опечатки я вообще молчу.

В общем, настроение попортилось. Деформация, да? Профессиональная, чтоле. Я, наверное, и сам пациент для граммар-наци, но тут уж совсем вопиющая перловка.
san4es: (Default)
и теперь можно спать спокойно. Эти три недели прошли весьма, э-э-э... Ну, в общем, чадновато было.

Уфф!

Jun. 11th, 2012 02:43 pm
san4es: (Default)
Как же приятно сидеть и в прострации смотреть на стену!!

Это я оттого, что сдали-таки проект, который высосал нам все мозги.

Вроде бы и текст был не шибко сложный. и времени дофига, а только всё равно вышло так, будто нам дали на всё про всё дня четыре.

А всё потому, что мы "имели честь" попользоваться новой "кошкой" (CAT system) - MultiTrans Prism конторки под названием MultiCorpora. Заказчик, видите ли, так просил.

Так вот, друзья мои, я на компьютерах много разных программ видал, но таакой - НИ РАЗУ. Её "достоинства" перечислять можно долго, однако самое первое - совершенно, как принято говорить, неинтуитивный интерфейс. Проще говоря, он очень запутан. Там вообще много окошек и кнопок. Уже тот факт, что нам три мануала на разные части проги прислали, какбэ намекает.

Жена сразу повела себя правильно - изучила только то, что нужно было для начала перевода. Хотя по чести у меня и сейчас нет уверенности в том, что мы сделали всё правильно: уж больно там много колёс, в которые можно попасть ногой.

Вообще же, меня поразил тот факт, что создатели программы похоже вообще не имеют представления о работе переводчика. Например, жена, долго и продолжительно матерясь, вручную копировала совпадающие сегменты, потому что программа сама это не делала. Дня через три заказчик прислал цидулку про то, что, оказывается, есть флажок, зарытый глубоко в настройках, который по умолчанию не установлен. Вот объясните мне - как можно такую настройку оставить вырубленной? Зачем тогда эта программа? Ведь суть CAT в том, чтобы вытаскивать из своей памяти схожий перевод. А тут...

И да, ещё один факт: если вы вставляете куда-либо текст перевода, скопированный из окна, то получаются кракозяблы. Онлайн-декодер говорит, что кодировка при этом CP1252. Ну, а этого-то как удалось "добиться"? Ведь русский язык перевода был указан заранее.

Да, можно сказать, что я - неграмотный пользователь, и что вместо брюжжания надо было курить маны до просветления. Блин, но ведь это же не программизм! Это расчитано на гуманитариев-переводчиков.

А ещё заказчик частенько по два раза в день копался в своём сайте, соответственно, работать было нельзя. Да, прога заточена на работу по интернету. Но вот есть простой вопрос - а если интернет гавкнулся, то чё делать-то? Заворачиваться в белую простыню и ползти на кладбище?

Вердикт: не нужно.

С некоторым потрясением узнал, что MultiCorpora протолкнула свою прогу двум или трём десяткам европейских правительств...
san4es: (ha-ha)
Вот за что люблю эту работу - можно получить попутно кипу лулзов, абсолютно на них не рассчитывая.

Вот и сейчас. Заглянул в поисках на сайт одного производителя. И долго валялся от восторга.

картинка )

Прекрасно всё, однако "низко в сале, высоко в протеинах" напоминает мне афоризмы достославного Александра Васильевича из "Науки побеждать".
san4es: (Default)
Лечь на диван с хорошей книжкой. Читать её, читаать, читааать... Потом дремануть часок.

P.S. Сегодня проект сдавать...
san4es: (задумчивый)
Лежит тут. Я бы и не брал - форума-то нет, однако сам сайт Мультитрана очень часто лежит.
san4es: (gentoo_linux)
Кабинет Министров Украины утвердил Государственную целевую научно-техническую программу использования в органах государственной власти программного обеспечения с открытым кодом на 2012-2015 гг.

Чё деется, чё деется! Эдак скоро ODT будут в конторах принимать, а УкрСтат перейдёт на ODS
san4es: (pulemet4ik)
А сегодня-то день переводчика!

san4es: (задумчивый)
На сайте бюро переводов инструкция для работы с OmegaT. Хоть и под Винду, однако впечатляет - свободная САТ на промышленном уровне. Так сказать, enterprise, все дела.

Удивление моё непередаваемо. С таких дел скачал последнюю OmageT, хоть и работаю с Anaphraseus. Посмотрим на эту шарманку вблизи.

Profile

san4es: (Default)san4es

June 2017

S M T W T F S
     123
45678 910
1112 13 1415 1617
18 192021222324
25 2627282930 

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 27th, 2017 12:38 pm
Powered by Dreamwidth Studios