Каково это – перевести Google на казахский

Марат Шакен,  координатор Google Translate Community в Казахстане.

Все началось три года назад, когда я увидел в Facebook ссылку на голосование компании Google. Пользователям по всему миру предлагали самим выбрать язык, который компания добавит следующим в сервисе переводов Google Translate. В тот момент я понял, что хочу стать частью проекта и готов помогать чем только могу.  

Мне повезло: в то время я уже знал Тилека Мамутова, представителя Google, курирующего проекты компании в Центральной Азии. Я подробно расспросил его про условия голосования и конкретные действия, необходимые для успеха. Надо занять одно из первых мест, сказали мне, залог победы – активность самих сторонников казахского языка. И мы включились в работу. Весь казахстанский Фейсбук, Твиттер, а также пользователи, которых привели новостные сайты, начали усердно голосовать за добавление казахского в Google. Это было нечто невообразимое — казахский вырвался в лидеры с огромным отрывом, хотя в конкурсе участвовали более распространенные языки, на которых говорили десятки миллионов человек!

Чтобы понять суть произошедшего, надо знать и понимать работу Google Translate изнутри. Всех секретов раскрыть не могу, но основные моменты выглядят следующим образом. 

Добавление любого нового языка в реестр сервиса начинается с работы алгоритма – это он ищет по всему интернету сайты с контентом на данном языке, в нашем случае на казахском. Параллельно пытается найти мультиязычные сайты, где среди прочих есть искомый язык. Алгоритм очень умный, после сбора определенного количества данных, он самостоятельно создает зеркальные пары переводов слов, словосочетаний и предложений. 

Каково это – перевести Google на казахский 2

Какая трудность стояла перед нами в 2013 году? Несмотря на разговоры о поддержке государственного языка и постоянное муссирование темы от мала до велика, оказалось, что казахскоязычных сайтов в интернете крайне мало. Мы рисковали потерпеть фиаско, даже если за наш язык проголосует каждый житель Казахстана. И потерпели бы, не приди на помощь фонд Wikibilim во главе с Рауаном Кенжеханулы. Его команда в короткие сроки наполнила казахскую википедию качественными статьями и снабдила зеркальными переводами на английский. Мне трудно даже оценить значение проделанной ими работы. Думаю, это больше, чем деятельность всех существующих фондов в поддержку государственного языка… 

Также в это время был запущен специальный сервис Google Translate Toolkit, посредством которого каждый пользователь может самостоятельно загружать зеркальные тексты на двух языках. Потом эти тексты попадают в алгоритм, и Google Translate буквально начинает понимать и разговаривать по-казахски. Фонд Wikibilim и тут постарался – с добавлением зеркальных переводов. Что касается нас, помню, как поставил для себя задачу еженедельно добавлять как минимум один большой текст с зеркальным переводом, что и делал все прошедшее время, благо знание трех языков выручало. Это была большая серьезная работа, никем не оплачиваемая. Но результат стоил того. В ожидании которого, еще не зная, чем кончится дело, мы замерли. Хватит ли текстов для запуска казахского в сервис? Удовлетворительно ли качество существующих переводов? Как алгоритм воспринял казахский язык?

Каково это – перевести Google на казахский 3

Ответ на эти вопросы должны были дать даже не люди, а четкая, беспристрастная машина. И она приступила к изучению материалов, а также новых, появлявшихся в сети каждый день. Параллельно желающие могли давать оценки и редактировать переводы на запущенном сервисе Google Translate Community. Полгода назад он приобрел новый интерфейс, став более легким для пользователей – я решил, что это возможность привлечь дополнительных волонтеров. Стал активно собирать людей, делал почтовые рассылки с полезными материалами, обучающими курсами и подробной инструкцией по работе. Всего я обучил и скоординировал деятельность 300 человек, каждый из которых внес как минимум 1000 изменений в сервис. 

И вот наконец в морозное утро 12 декабря мы получили долгожданное сообщение из Калифорнии – казахский язык добавили в сервис переводов Google Translate! В официальном пресс-релизе компания отметила вклад в это дело волонтеров, то есть нас, что, конечно же, очень приятно. Но более важна роль казахстанцев, активность которых невероятна, если дело касается чего-то настоящего. 

Однако работа не закончилась, она продолжается. В первые дни запуска переводчика казахского в Google Translate Казнет наполнился язвительными комментариями пользователей о неточности перевода. Что ж, каждый пользователь может внести свой вклад в улучшение! Для этого надо просто нажать иконку карандаша (улучшить перевод) и внести свой вариант перевода. Разумеется, это потребует больших усилий, чем написание критических комментариев, но ведь и отдача несравнимо выше.