"Кошки" - OmegaT

По долгу службы, да и для повышения продуктивности пришлось освоится с т.н. "кошками" (от англ. Computer Assisted Translation - CAT). Сразу оговорюсь, что на "взрослые" варианты не было ни времени, ни денег. Потому, в итоге, остановился выбор на OmegaT, Lokalize и POedit. Сегодня расскажу об OmegaT:

OmegaT (v. 2.0.1)

Как написано на сайте программы,

OmegaT — это свободная система автоматизированного перевода, поддерживающая память переводов, написанная на языке программирования Java. Эта система предназначена для профессиональных переводчиков. OmegaT не переводит вместо человека! (В отличие от программ, выполняющих «машинный перевод», OmegaT лишь помогает переводчику и упрощает его работу.) Возможности OmegaT включают:
- подбор неточных совпадений;
- размножение совпадений;
- одновременная обработка проектов с большим числом файлов;
- одновременное использование нескольких памятей переводов;
- использование внешних глоссариев;
Поддерживаемые форматы файлов документов:
- XHTML и HTML
- Microsoft Office 2007 XML
- OpenOffice.org/StarOffice
- XLIFF (Okapi)
- MediaWiki (Wikipedia)
- неформатированный текст;
- поддержка юникода (UTF-8): используется для алфавитов без латиницы;
- поддержка языков с письмом справа налево;
- совместимость с другими программами автоматизированного перевода (TMX).
Это одно из наиболее "взрослых" решений в секторе OpenSource. Она написана на Java, что предполагает её кроссплатформенность. Тем не менее, за эту кроссплатформенность приходится расплачиваться кое-какими сбоями в работе. Так, к примеру, будучи протестированной в ОС WindowsXP и ArchLinux, в последней программа демонстрировала нежелание ввода кириллических символов. Т.е. перевод у меня получалось делать с русского на английский, но никак не наоборот. Разработчики настаивают на том, что Sun JRE, который используется для запуска программы в версиях для разных ОС работает неодинаково, и таким образом - этот сбой характерен только для ОС Linux. На данный момент разработка программы осуществляется по следующей схеме: альфа-ветка -> бета-ветка -> стабильная ветка. Ветка 2.0 на данный момент имеет статус "бета". Стабильная версия программы - 1.8.1 update 2. При чём - указанный сбой встречается как в бета-ветке, так и в стабильной. Так что он действительно на совести Sun, а не разработчиков.
А теперь о приятном. Интерфейс OmegaT крайне минималистичен, и ничем не перегружен, так что работать с программой - одно удовольствие. При создании проекта создаётся каталог, содержащий исходные файлы (импортируемые при создании проекта), и функциональную обвязку (как то: файлы памяти перевода, глоссарии и ещё немного всякого). Формат содержания каталога таков, что он рассматривается самой программой как файл проекта, что удобно, если нужно каким-либо образом подправить его содержимое. Поддерживается разбиение исходного текста на сегменты по абзацам и по предложениям, последнее - длостаточно гибко настраивается для каждого отдельного языка.
Есть возможность работы как с форматированным так и с неформатированным текстом (список поддерживаемых форматов входящих файлов - выше). Теги, найденные в исходном тексте OmegaT преобразует в теги своей собственной системы, что хотя и позволяет облегчить и формализировать работу с ними, тем не менее становится источником целой тучи неудобств, связанных с тем, что иногда необходимо менять их положение в тексте (проверка тегов начитает указывать на их несоответствие оригиналу, и в итоге может так случится, что полученный файл с переводом будет отличаться, при чём иногда разительно, от оригинала).
Функция взаимодействия с глоссарием отсутствует. Точнее, есть поддержка глоссариев, но нет возможности взаимодействия с ними из программы. В итоге, файл, который, к слову, должен иметь расширение *.utf8, приходится создавать и редактировать в ручную, уж благо его формат - обычный tab-файл (т.е. имеющий формат оригинал-табуляция-перевод) это позволяет делать без проблем.
На этом, в принципе, функциональное наполнение программы и заканчивается. Никаких спец. технологий, просто, дёшево и сердито. TMX-ы, глоссарии - и всё. Так что с текстом приходится работать по определённому алгоритму: прочитать, составить глоссарий, а потом, собственно, переводить. Что, в принципе, тоже очень даже неплохо, учитывая полную бесплатность программы.

В этом месяце читают