The Guardian: робот заменил переводчика

Ирина Фоменко

Шум - одна из основных проблем, с которой приходится сталкиваться при искусственном переводе речи. Устройство может распознавать речь в лаборатории или комнате для совещаний, но ему будет трудно справиться с фоновым шумом, пишет The Guardian.

В Технологическом институте Карлсруэ профессор компьютерных наук Вайбель и его коллеги уже проводят лекции на немецком языке, а студенты могут их читать на английском с помощью электронного переводчика. Система генерирует текст, который учащиеся читают на ноутбуках или телефонах, поэтому этот процесс напоминает субтитры. Помогает то, что лекторы говорят четко, не нужно конкурировать с фоновой болтовней и каждый год повторять одно и то же.

1111.jpg (50 KB)

Идея искусственного перевода речи существует уже давно. "Я предложил его в Массачусетском технологическом институте в 1978 году. Дуглас Адамс придумал это примерно в то же время. В "Автостопом по галактике" была представлена форма жизни, называемая вавилонской рыбой - когда ее вставляли в ухо, она позволяла слушателю понимать любой язык во вселенной", - поделился Вайбель.

Первая система речевого перевода Вайбеля, созданная в 1991 году, имела словарный запас в 500 слов, и ей требовалось несколько минут для обработки услышанного. Теперь появились устройства, которые выглядят как прототип вавилонской рыбы: с искусственным переводом и функцией распознавания голоса - Google включил функцию перевода в свои наушники Pixel, используя Google Translate; в Skype есть функция "Переводчик", которая поддерживает речь на 10 языках; стартап Waverly Labs разработал переводчик для наушников.

Системы, доступные в настоящее время, служат подтверждением концепции, но на данном этапе они кажутся привлекательными новинками, а не шагами к тому, что Вайбель называет "созданием мультиязыкового общества".

Одним из главных достижений в искусственном переводе речи стала мода на то, чтобы побуждать людей говорить с технологиями. "Мы стоим в начале парадигмы голосовых устройств, но прогрессируем очень быстро", - прокомментировал директор по продукту Google Translate Барак Туровский.

2222.png (140 KB)

В прошлом месяце Google представил переводчика для домашних устройств. Фраза "Hey, Google, be my French interpreter" активирует устный и на смарт-экранах перевод текста. Google предлагает регистрацию в отеле в качестве возможного приложения - очевидный пример практической альтернативы разговора путешественников на английском, как на родном, так и в качестве дополнительного.

Waverly Labs использовала функцию chat-up в видео, в котором основатель и генеральный директор компании Эндрю Очоа рассказывает, как он получил идею переводчика, когда встретил француженку в отпуске, но не смог с ней объясниться.  Попытка использовать приложение для перевода провалилась. Телефон мешает, но это не касается наушников. В видео он подарил француженке наушники, и они вместе пошли гулять.

3333.jpg (78 KB)

По словам одного клиента, наушники Pilot позволили ему впервые поговорить с матерью своей подруги. Некоторые даже сообщают, что наушники дали возможность побеседовать супругам. "Технология должна стать лучше, прежде чем вы сможете найти любовь через наушники, но до этого не так далеко", - заявил Очоа.

Многие используют наушники Pilot в совершенно неромантических целях, а для работы. Waverly разрабатывает новую модель для профессиональных приложений с повышенной производительностью в распознавании речи, точностью перевода и времени. "Профессионалы менее склонны к ожиданию в разговоре", - убежден Очоа.

Здесь основным драйвером является доступ к развивающимся азиатским рынкам. Google считает, что 50% контента в Интернете - на английском языке, но только 20% населения мира говорят на нем.

"Если вы посмотрите на области, в которых наблюдается интенсивный рост использования интернета, например, на азиатские страны, большинство из них вообще не знают английского. Поэтому в этом отношении преодоление языковых барьеров является важной целью для всех - и, очевидно, для Google. Вот почему Google вкладывает так много ресурсов в системы перевода", - заявил Туровский.

Вайбель подчеркивает значение Азии, отмечая, что голосовой перевод действительно получил распространение в Японии и Китае. Впрочем, предстоит еще долгий путь: перевод должен быть синхронным, как голос переводчика, говорящий по телевизору с иностранным политиком. Он должен работать в оффлайновом режиме; также необходимо решить проблемы, связанные с количеством личных речевых данных, которые накапливаются в облаке и отправляются на серверы для обработки.

4444.png (195 KB)

Вайбель полагает, что системы должны не только справляться с такими физическими проблемами, как шум, но и должны быть социально осведомлены - знать свои манеры и правильно обращаться с людьми. Искусственные переводчики могут избавить людей от необходимости осознавать различные культурные нормы. Они будут способствовать взаимодействию, уменьшая непонимание. В то же время они помогут сохранить местные обычаи, замедляя распространение привычек, связанных с международным английским языком.

Однако профессора и другие специалисты не будут передавать знания о языке программному обеспечению. Если технология превращается в непрерывный, вездесущий искусственный перевод речи - это фактически повысит ценность языковых навыков. Тем не менее, к чему бы он ни был применен, он никогда не будет таким же хорошим, как настоящий. Даже если технология преобразования голоса имитирует голос говорящего, движения его губ не будут совпадать.

Когда машинный перевод становится повсеместным товарным продуктом, человек, знающий иностранный язык, всегда будет иметь преимущество перед кем-то, кто полагается на устройство.