san4es: (Default)

Давным-давно в одной далёкой галактике… Короче, написал я аж в 2009 году пост про переводчиков и Линукс. Сейчас по прошествии лет видно, что пост был наивный и даже не слишком информативный. Сейчас я бы к вопросу подошёл по-другому :) Но писать я хочу не об этом.

Недавно случилось событие, которое вполне может перевернуть привычный мир письменного перевода. Гугл анонсировал внедрение нейронных сетей в свой Переводчик. Это — третий этап развития систем автоматического/автоматизированного перевода.

Стоит окинуть взором, что же изменилось за время, прошедшее с 2009 года.

Если суммировать, то ничего особого не случилось. Если рассматривать коммерческие САТ-системы, то потолок их развития ограничивался самой концепцией памяти переводов. Соответственно, основные усилия были направлены на вылизывание продукта, увеличение его стабильности, поддержку форматов. Ну, и последний штрих — возможность коллективной работы через облачные решения. Вот и всё.

В Линуксе также особых изменений не произошло. OmegaT продолжала матереть, превращаясь в промышленную САТ-систему. Anaphraseus также занимает свою нишу. Кстати, жена там, где требуется SDLX Trados, переводит в VirtualBox, а в других местах вообще просто в LibreOffice без всяких «кошек» — так ей проще. И ещё она очень ценит функцию автодополнения слов, которая есть в Writer. В принципе, такой подход оправдан, если тексты у тебя практически не повторяются. Тогда единственный бонус САТ — это наличие глоссария. И только то!

Но вот сейчас с внедрением нейросетей начинается новая гонка. И очень интересно, кто же останется в седле. Во всяком случае для Линукса. Потому что раньше разница между системами была невелика, весь вопрос упирался в форматы, которые требовались заказчику. Переход же на нейронные сети сулит увеличение качества и скорости перевода.

Я, кстати, поглазел на этот новый Переводчик от Гугл. Что сказать… Закинул ему порядка пяти кусков текста. Книги, блоги. Стабильности пока что нет. Удивил перевод фрагмента блога: один пост Переводчик на ура съел, во втором, того же автора, напортачил. Пока сыро, но уже лучше, чем раньше. Посмотрим на эволюцию системы. У Гугла есть инструмент для коллективной работы, так вот именно он, похоже, и станет источником данных для обучения нейронной сети.

И да, крутость синхронистов возрастёт немеряно — их положению никто не угрожает. Пока. Хотя, может и мы и доживём до «балалаек» Панова.

san4es: (Default)

А ещё безумно бесят исконно русские слова типа «роутер». Прямо вот с утра и в уши…

san4es: (ha-ha)
Такое ощущение, что Google Translate обчитался "In Soviet Russia..."
In Soviet Russia

С простенькими предложениями, кстати, он справляется нормально, но вот сложные завороты родного английского языка охватить пока не в состоянии. Или, вот, три существительных подряд — всё, туши свет!
san4es: (ha-ha)
ржд хоуп

хоуп с маленькой буквы, как я понимаю, должность. Ну, типа, senior hope, hope и, например, junior hope
san4es: (Default)
День прожит не зря. Узнал новое слово "smart-assery". Это, друзья, "хитрожопость". Нет, всё-таки англосаксы не такие пропащие люди
san4es: (Default)
Возник интерес к средствам коллективного перевода. Полез в интернеты. И вот чего нарыл:

1. Pootle. Относительно давно ведущийся проект. Некоторые жалуются на ошибки и тормоза. Писано на Python и Django.

2. Weblate. Из молодых, да ранних. Развивается очень бодро. Те же самые Python и Django.

3. ReGlot. Этот уже на PHP

4. Transifex. Это "опчественная" версия проприетарного продукта. Опять таки Python.

Ни один не пробовал, потому как нужды в этом не было.

Перечислены, естественно, только программы, которые можно развернуть на своём сервере. А так - бездна сервисов по коллективному переводу, регайся - не хочу.
san4es: (ha-ha)
Сначала полез проверять сегодняшнюю дату. Однако, всё верно - 24 мая, а не 1 апреля. Тем не менее ЛОР made my day:
Работа над модификацией Fedora Linux для работы на Raspberry Pi, оптимизированной под процессоры ARMv6, возобновилась. Теперь проект будет выходить под новым именем: Pidora Linux.

Сразу вспомнились Mitsubishi Pajero и Mazda LaPuta.
san4es: (hujase)
И я туда же:

шпиёнская бумажка

Ну ведь красота, а?
Мы готовы предложить Вам 100 000 долларов США и обсудить Ваши опыт, экспертизу и сотрудничество, при этом...

Обсудить экспертизу и сотрудничество! И это ЦРУ! Куда мы катимся...
san4es: (ha-ha)
Перевожу сейчас текст. Впервые за всё время переводческой практики узрел английский вариант "свистелок и перделок" - bells and whistles. Ещё не открыв словарь, понял - это оно самое! Один из самых распространённых мемов ЛОРа и следом - прочих интернетов. Но самое забавное было увидеть в словаре такое:

картинка )

Непередаваемо "девачковое" и нежное от НаташиВ. Велик и могуч, в общем.

Очень часто при тяжёлой работе только такими "переводилками" и спасаешься - увидишь, посмеёшься и вроде бы полегчало, можно дальше тысячи гнать.
san4es: (music)
Статья про Black Flag на Википедии:

...Каждая песня этого мини-альбома - злая, параноик от заглавный трек лирика именно то, что показано в каждой песне на этом...


Много думал...
san4es: (Default)
Вчера в полдень таки сдали работу. До сих пор поверить не можем. Вчера лёг наконец-то в 10 вечера вместо обычных часа-двух ночи, а проснулся после 8. И хоть такое позднее вставание только в связи с НГ, но всё же - Свобода!!!!
san4es: (hujase)
Работа подходит к концу, и можно немного отвлечься.

Вводная: надо было прочитать про регион в ЮАР под названием Карру. Открываю в Гугле, после чего лезу в английскую Википедию. Прочитал, увидел, что есть на русском, открыл ещё до кучи русскую Вики. После второго абзаца сполз под стол и долго нервно хихикал оттуда.

Судите сами:
кррасота )
san4es: (ha-ha)
Набрал в Гугле слово "мультимудийный". Результаты не заставили, как грится, ждать. В том числе интернет-магазины из города Пермь :)
san4es: (Default)
Вчера написал, а сегодня уже обнаружил, что поправили.

Всё смотреть лень, возьмём первое, бывшее нямочное предложение и посмотрим правки.

Было:

Снизу находится теплозащитный экран, состоящий из кремниевых соединений - новейшая технология, материала из этого семейства, его корни идут от мисcий Викинг-1 и Викинг-2.

Стало:

Снизу находится теплозащитный экран, состоящий из кремниевых соединений — новейшая технология материала из этого семейства (его корни идут от мисcий Викинг-1 и Викинг-2).

О, б-же, ребята!! Вы видели своими глазами корни материала? Это довольно поэтично и смело.

P.S. Жена предполагает использование гуглопереводчика. Не знаю, не знаю, из него ведь такое на выходе получается...

Сразу вспомнил как в институте гоняли досовскую программку, которая на словарике, задаваемом пользователем, и унутренних правилах генерила смешной бред. Потом их кучи появились даже с интерфейсом. Кажется, "Рифмоплёт" называлась.
san4es: (Default)
Сейчас все про марсоход и пишут. Решил и я окунуться, так сказать, в общественную истерию. Полез на Википедию читать про него.

Всё бы ничего, однако в процессе испытал томление духа - опять переводилки читаю. Я их и по работе читаю. Сколько уже можно. Вот некоторая нямка:

таки езиг )

Я понимаю, что тема горячая, что надо срочно в номер, но дай хоть перечитать кому-нибудь мимо проходящему! Про опечатки я вообще молчу.

В общем, настроение попортилось. Деформация, да? Профессиональная, чтоле. Я, наверное, и сам пациент для граммар-наци, но тут уж совсем вопиющая перловка.

Уфф!

Jun. 11th, 2012 02:43 pm
san4es: (Default)
Как же приятно сидеть и в прострации смотреть на стену!!

Это я оттого, что сдали-таки проект, который высосал нам все мозги.

Вроде бы и текст был не шибко сложный. и времени дофига, а только всё равно вышло так, будто нам дали на всё про всё дня четыре.

А всё потому, что мы "имели честь" попользоваться новой "кошкой" (CAT system) - MultiTrans Prism конторки под названием MultiCorpora. Заказчик, видите ли, так просил.

Так вот, друзья мои, я на компьютерах много разных программ видал, но таакой - НИ РАЗУ. Её "достоинства" перечислять можно долго, однако самое первое - совершенно, как принято говорить, неинтуитивный интерфейс. Проще говоря, он очень запутан. Там вообще много окошек и кнопок. Уже тот факт, что нам три мануала на разные части проги прислали, какбэ намекает.

Жена сразу повела себя правильно - изучила только то, что нужно было для начала перевода. Хотя по чести у меня и сейчас нет уверенности в том, что мы сделали всё правильно: уж больно там много колёс, в которые можно попасть ногой.

Вообще же, меня поразил тот факт, что создатели программы похоже вообще не имеют представления о работе переводчика. Например, жена, долго и продолжительно матерясь, вручную копировала совпадающие сегменты, потому что программа сама это не делала. Дня через три заказчик прислал цидулку про то, что, оказывается, есть флажок, зарытый глубоко в настройках, который по умолчанию не установлен. Вот объясните мне - как можно такую настройку оставить вырубленной? Зачем тогда эта программа? Ведь суть CAT в том, чтобы вытаскивать из своей памяти схожий перевод. А тут...

И да, ещё один факт: если вы вставляете куда-либо текст перевода, скопированный из окна, то получаются кракозяблы. Онлайн-декодер говорит, что кодировка при этом CP1252. Ну, а этого-то как удалось "добиться"? Ведь русский язык перевода был указан заранее.

Да, можно сказать, что я - неграмотный пользователь, и что вместо брюжжания надо было курить маны до просветления. Блин, но ведь это же не программизм! Это расчитано на гуманитариев-переводчиков.

А ещё заказчик частенько по два раза в день копался в своём сайте, соответственно, работать было нельзя. Да, прога заточена на работу по интернету. Но вот есть простой вопрос - а если интернет гавкнулся, то чё делать-то? Заворачиваться в белую простыню и ползти на кладбище?

Вердикт: не нужно.

С некоторым потрясением узнал, что MultiCorpora протолкнула свою прогу двум или трём десяткам европейских правительств...
san4es: (ha-ha)
Неладно что-то в датском королевстве... Или у УНИАНа:

картинка )

А может это поклонники Михаила Юрьевича как могут выплёскивают свою любовь?
san4es: (ha-ha)
Вот за что люблю эту работу - можно получить попутно кипу лулзов, абсолютно на них не рассчитывая.

Вот и сейчас. Заглянул в поисках на сайт одного производителя. И долго валялся от восторга.

картинка )

Прекрасно всё, однако "низко в сале, высоко в протеинах" напоминает мне афоризмы достославного Александра Васильевича из "Науки побеждать".
san4es: (hujase)
Вы вот всё во всякие луркизмы играете, а люди со стороны запутались. Вот наглядный пример с сайта Visiting Nurse Service Of New York:

картинка )

ВотЪ! Ввели в заблуждение, понимаешь, на мировом уровне. А теперь - только хихикать. А если без смехуёчков, то КТО ИМ ТАК ПЕРЕВЁЛ???? Это ж даже на машинный перевод не смахивает.

P.S. "Поцыент" - мило, очень мило...
san4es: (pulemet4ik)
А сегодня-то день переводчика!

Profile

san4es: (Default)san4es

August 2020

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 27th, 2025 09:59 pm
Powered by Dreamwidth Studios