Google: «Распознавание голоса — главное направление технического прогресса»

Google: «Распознавание голоса — главное направление технического прогресса»

Глава исследований Google Бен Гомес считает, что совершенствование систем распознавания человеческой речи машинами — ключевой пункт в дальнейшем развитии информационных, да и всех прочих технологий. Такую идею он высказал на пресс-конференции «Будущее поиска», которую в честь своего 20-летия Google провел в Сан-Франциско.

«Распознавание речи и понимание естественного языка являются основой будущего поиска и всех информационных технологий, — говорит Гомес. — Но есть множество сложных проблем, связанных с пониманием семантики. Например, ИИ нужно научить, как работают различные ссылки, что именно значит „он“, а что „она“ или „это“. Кажется простым, но это нетривиальная задача. И таких проблем — миллионы».

Первый сервис распознавания голоса Google представил семь лет назад. Сегодня ИИ-асситенты поискового гиганта работают на миллионах устройств по всему миру. Гомес говорит, что голосовой поиск существенно изменил ситуацию с популярностью Google в странах с низкой грамотностью населения. Там, где люди не могли составить поисковый запрос из-за неумения писать или отсутствия клавиатуры для данного языка, теперь можно решить проблему устной речью, пишет Guardian.

«То, что кажется передовой технологией на Западе, считается базовой и необходимой функцией, например, в Индии. Для многих языков в развивающихся странах никогда не создавали клавиатуры. И даже те, кто профессионально изучают эти языки, не смогли бы напечатать запрос на них. В этом случае использовать голос — единственная возможность», — объясняет Гомес, родившийся в Танзании и выросший в индийском Бангалоре. Голосовое распознавание заметно ускоряет проникновение высоких технологий в самые слаборазвитые регионы мира.

Гомес говорит, что, чем лучше компьютеры понимают речь, тем проще становится людям. Он приводит в пример те времена, когда поисковики могли искать информацию только по конкретным словам. То есть, набрав «как изменить яркость монитора», вам бы не выдали статью «как настроить яркость монитора». В те времена «изменить» и «настроить» совсем не казались машине синонимичными.

У Google ушло пять лет, чтобы алгоритм поиска начал понимать подобный контекст и разбираться в том числе в неочевидных синонимах.

Процесс улучшения понимания людей машинами будет происходить и дальше, по мнению эксперта. Все идет к тому, что информацию можно будет получать максимально просто, в живом диалоге с ПО. В какой-то момент ИИ начнет понимать и сложные вопросы, верит Гомес. И именно факт глубокого понимания сделает технологию распознавания речи популярнее. Виртуальные помощники все чаще будут отвечать на сложные вопросы, авторы которых не будут думать об их структуре. Это станет особенно актуальным, когда благодаря инициативам по свободной раздаче интернета, сеть станет доступна практически везде. Тут-то и придется найти универсальный способ подключения новых и часто малообразованных пользователей.

На конференции также сообщили, что поисковик ждет целый ряд заметных изменений. IT-гигант серьезно модифицирует всем привычную главную страницу поиска — она перестанет быть такой пустой.

Источник: hightech.plus