Google Genie тепер може імітувати реальні вулиці за допомогою Street View

Дмитро Сизов

Ми всі колись відкривали Перегляд вулиць на Картах Google, щоб показати другу, як виглядав наш дім дитинства, або розміщували значок маленької людини на вулицях Парижа, щоб побачити, чи забронювали ми готель у класному районі. Уявіть собі, що ви можете робити це, але в більш захопливий, інтерактивний спосіб, який дозволяє вам справді імітувати вулицю та її околиці, і навіть робити такі речі, як налаштування погоди або бачити, як це виглядатиме у сценарії «Післязавтра».

Це одна з цілей останньої інтеграції Google. Починаючи з сьогоднішнього дня, Google DeepMind підключає Street View до Project Genie, універсальної моделі світу компанії, яка може створювати різноманітні інтерактивні середовища. Нова функція була представлена ​​під час конференції розробників  Google I/O 2026 .

«Це справді потужний інструмент як для використання агентами [і робототехнікою], так і для людей, і це завжди було тезою Genie», – сказав TechCrunch Джек Паркер-Голдер, науковий співробітник команди DeepMind, що займається відкритістю.

Він навів приклад нового робота, якого використовують у Лондоні та який рідко бачить сонце. За словами Паркер-Голдер, Genie міг би імітувати ті рідкісні випадки, коли сонце відблискує від вікторіанських будинків, щоб промені не шокували робота, коли це трапляється.

«Одночасно ви можете сказати: «Я їду до Нью-Йорка, але не цієї пори року», — продовжив він. — «Там буде сніг. Я хочу побачити, як виглядає та брила в снігу». 

Google збирає дані Street View вже 20 років за допомогою автомобілів з камерами та людей, пристебнутих «рюкзаками-трекерами». Технологічний гігант зібрав понад 280 мільярдів зображень зі 110 країн на семи континентах. 

«Завдяки Street View ми маємо зображення з великої кількості куточків світу», – сказав Джек. «Ви можете уявити, наскільки потужним є поєднання цього багатого джерела інформації та даних про реальний світ із можливістю моделювати світи».

Google випустила свою останню модель світу Genie 3 для попереднього перегляду в серпні минулого року та відкрила доступ до інструменту для передплатників Google AI Ultra у США в січні, що дозволило клієнтам створювати інтерактивні ігрові світи з текстових підказок або зображень. Мета полягає в тому, щоб використовувати Genie для освітнього досвіду, ігор та навчання робототехніці. 

Genie 3 вже допомагає Waymo працювати в одному з симуляторів для навчання безпілотних автомобілів «надзвичайно рідкісним подіям», таким як торнадо або випадкові зустрічі зі слонами. Додавання до цього даних Street View може допомогти Waymo підготуватися до запуску в більшій кількості міст по всьому світу.

Waymo має власний симулятор, на який спиралася компанія для масштабування в 11 містах США та тестування свого драйвера штучного інтелекту в кількох інших. Різниця з Genie, каже Паркер-Голдер, полягає в тому, що всі ці зйомки здійснюються з точки зору автомобіля. Street View дозволяє не лише імітувати світ, прив'язаний до реального місця, але й зміщувати точку зору на інші типи агентів, таких як людина чи робот. 

Google запускає Street View у Genie для деяких користувачів Ultra у Сполучених Штатах, починаючи з сьогоднішнього дня, і з часом доступ буде масштабно розгортатися. За даними компанії, глобальні користувачі Ultra отримають доступ протягом наступних кількох тижнів.

Мета дослідників — передати цю нову можливість якомога більшій кількості людей, за словами Дієго Ріваса, менеджера з продуктів DeepMind. Він застеріг, що Street View зокрема та Genie загалом все ще є експериментом, тому є багато чого, що потрібно покращити з точки зору точності.

У зразках, які мені показала команда Google, зокрема підводна симуляція району, де я колись жив, результати вражаючі та впізнавані, але все ж таки скоріше відеоігрової якості, ніж фотореалістичні. Моделі також ще не враховують фізику, тобто вони ще не розуміють причинно-наслідкових зв'язків. Наприклад, у симуляції жінки, яка біжить крізь засніжене дерево Джошуа, вона пробігла прямо крізь кактуси та кущі.

Порівняйте це, скажімо, з генератором зображень Google Nano Banana, який тепер може генерувати ідеальний текст в інфографіці, або з його відеогенератором Veo, який розуміє, що паперові кораблики дрейфують на водних течіях, дим розсіюється в повітрі, а тканина драпірується на формах. 

Фізика не закодована жорстко в цих моделях; вони засвоюють її інтуїтивно з часом через пасивне спостереження, як це робить жива істота. 

«Я думаю, що для такої моделі вона відстає від відео з точки зору точності та якості на шість-дванадцять місяців, тому я думаю, що це те, що ми вирішимо», – сказав Паркер-Голдер. 

Джонатан Герберт, директор Google Maps, який розпочав свою кар'єру в команді Street View як стажер 12 років тому, сказав, що Genie поки що не може створити точну реконструкцію вулиці. Він вважає, що справжнім проривом є просторова безперервність штучного інтелекту. Якщо ви повернетеся на 360 градусів, штучний інтелект правильно запам'ятає та змоделює середовище позаду вас. З цього моменту модель може створювати нове середовище поверх нього.

«Ми давно думали про те, як створити найкращу та найбагатшу модель світу на основі даних Street View», – сказав Герберт. «Використання даних Карт по-новому та для нових видів досліджень штучного інтелекту безумовно було нашою ідеєю вже досить давно».