Google представляє агента ШІ, що може вивчати веб-сайти замість людини
Сьогодні чат-боти можуть відповідати на запитання, писати вірші та створювати зображення . У майбутньому вони також зможуть автономно виконувати такі завдання, як покупки в Інтернеті, і працювати з такими інструментами , як електронні таблиці.
Google у середу представила прототип цієї технології, яку дослідники штучного інтелекту називають агентом ШІ .
Google є однією з багатьох технологічних компаній, які створюють агентів ШІ. Різні стартапи штучного інтелекту, включаючи OpenAI і Anthropic, оприлюднили подібні прототипи, які можуть використовувати програми, веб-сайти та інші онлайн-інструменти.

«По суті, ми дозволяємо користувачам вводити запити у свій веб-браузер і змушувати Mariner виконувати дії від їх імені», — сказала Жаклін Конзельманн, менеджер проекту Google, в інтерв’ю The New York Times.
Gemini — це те, що дослідники штучного інтелекту називають нейронною мережею — математичною системою, яка може навчатися навичок, аналізуючи величезні обсяги даних. Наприклад, розпізнаючи шаблони в статтях і книгах, зібраних з Інтернету, нейронна мережа може навчитися генерувати текст самостійно.
Остання версія Gemini вивчає широкий спектр даних, від тексту до зображень і звуків. Це може включати зображення, які показують, як люди використовують електронні таблиці, сайти покупок та інші онлайн-сервіси. Спираючись на те, що Gemini дізнався, Mariner може використовувати подібні послуги від імені користувачів комп’ютерів.
«Він може зрозуміти, що йому потрібно натиснути кнопку, щоб щось сталося», — сказав Деміс Хассабіс, який керує основною лабораторією штучного інтелекту Google, в інтерв’ю The Times. «Це може діяти у світі».
Mariner розроблений для використання «з людиною в циклі», сказала пані Концельманн. Наприклад, він може наповнити віртуальний кошик продуктами, якщо користувач перебуває на активній вкладці веб-переглядача, але насправді не купуватиме продукти. Користувач повинен зробити покупку.
Сундар Пічаї, виконавчий директор Google, сказав у блозі , що ці розробки «наближають нас до нашого бачення універсального помічника».

Проєкт був розроблений як розширення для популярного веб-браузера Google Chrome, що робить його важливою платформою для майбутніх амбіцій компанії щодо ШІ. Але ці плани можуть зазнати невдачі. Міністерство юстиції звернулося до федерального судді з проханням змусити Google продати або виділити Chrome після знакового рішення про те, що пошукова система компанії є незаконною монополією.
Є й інші виклики. Пані Концельманн визнала, що, як і інші чат-боти, Mariner робить помилки. Оскільки такі системи працюють відповідно до шаблонів, знайдених у величезних обсягах даних, вони іноді йдуть не так. Помилки, які роблять чат-боти під час створення тексту, іноді залишаються непоміченими, але помилки є більш проблематичними, коли системи намагаються використовувати веб-сайти та виконувати інші дії.
«Чи завжди це точно? Ще ні», – сказала пані Концельманн. «Це все ще експериментальна технологія».
Google ділиться Mariner з невеликою кількістю тестувальників за межами компанії, але поки що не поділився планами щодо ширшого випуску.
У середу компанія також продемонструвала нову версію Project Astra, цифрового помічника для смартфона, який реагує на зображення та текст, а також на словесні команди. Як і технологія, представлена OpenAI на початку цього року, Astra є більш потужною версією цифрового помічника, такого як Siri від Apple.
Він також ще не доступний для широкого загалу.