Google представляє агента ШІ, що може вивчати веб-сайти замість людини

Дмитро Сизов 13 декабря 2024 10:00

Сьогодні чат-боти можуть відповідати на запитання, писати вірші та створювати зображення . У майбутньому вони також зможуть автономно виконувати такі завдання, як покупки в Інтернеті, і працювати з такими інструментами , як електронні таблиці.

Google у середу представила прототип цієї технології, яку дослідники штучного інтелекту називають агентом ШІ .

Google є однією з багатьох технологічних компаній, які створюють агентів ШІ. Різні стартапи штучного інтелекту, включаючи OpenAI і Anthropic, оприлюднили подібні прототипи, які можуть використовувати програми, веб-сайти та інші онлайн-інструменти.

Новий прототип Google під назвою Mariner базується на Gemini 2.0, яку компанія також представила в середу. Gemini — основна технологія, яка лежить в основі багатьох продуктів ШІ та дослідницьких експериментів компанії. Версії системи будуть використовувати однойменний чат-бот компанії та AI Overviews, інструмент пошуку Google, який безпосередньо відповідає на запитання користувачів.

Роздаткове відео від Google, у якому показано новий прототип агента ШІ компанії під назвою Mariner.КредитКредит...Google

«По суті, ми дозволяємо користувачам вводити запити у свій веб-браузер і змушувати Mariner виконувати дії від їх імені», — сказала Жаклін Конзельманн, менеджер проекту Google, в інтерв’ю The New York Times.

Gemini — це те, що дослідники штучного інтелекту називають нейронною мережею — математичною системою, яка може навчатися навичок, аналізуючи величезні обсяги даних. Наприклад, розпізнаючи шаблони в статтях і книгах, зібраних з Інтернету, нейронна мережа може навчитися генерувати текст самостійно.

Остання версія Gemini вивчає широкий спектр даних, від тексту до зображень і звуків. Це може включати зображення, які показують, як люди використовують електронні таблиці, сайти покупок та інші онлайн-сервіси. Спираючись на те, що Gemini дізнався, Mariner може використовувати подібні послуги від імені користувачів комп’ютерів.

«Він може зрозуміти, що йому потрібно натиснути кнопку, щоб щось сталося», — сказав Деміс Хассабіс, який керує основною лабораторією штучного інтелекту Google, в інтерв’ю The Times. «Це може діяти у світі».

Mariner розроблений для використання «з людиною в циклі», сказала пані Концельманн. Наприклад, він може наповнити віртуальний кошик продуктами, якщо користувач перебуває на активній вкладці веб-переглядача, але насправді не купуватиме продукти. Користувач повинен зробити покупку.

Сундар Пічаї, виконавчий директор Google, сказав у блозі , що ці розробки «наближають нас до нашого бачення універсального помічника».

Зображення роздаткового матеріалу від компанії, яке демонструє останню версію Gemini, яка навчається на широкому спектрі даних, від тексту до зображень і звуків.Кредит...Google

Проєкт був розроблений як розширення для популярного веб-браузера Google Chrome, що робить його важливою платформою для майбутніх амбіцій компанії щодо ШІ. Але ці плани можуть зазнати невдачі. Міністерство юстиції звернулося до федерального судді з проханням змусити Google продати або виділити Chrome після знакового рішення про те, що пошукова система компанії є незаконною монополією.

Є й інші виклики. Пані Концельманн визнала, що, як і інші чат-боти, Mariner робить помилки. Оскільки такі системи працюють відповідно до шаблонів, знайдених у величезних обсягах даних, вони іноді йдуть не так. Помилки, які роблять чат-боти під час створення тексту, іноді залишаються непоміченими, але помилки є більш проблематичними, коли системи намагаються використовувати веб-сайти та виконувати інші дії.

«Чи завжди це точно? Ще ні», – сказала пані Концельманн. «Це все ще експериментальна технологія».

Google ділиться Mariner з невеликою кількістю тестувальників за межами компанії, але поки що не поділився планами щодо ширшого випуску.

У середу компанія також продемонструвала нову версію Project Astra, цифрового помічника для смартфона, який реагує на зображення та текст, а також на словесні команди. Як і технологія, представлена OpenAI на початку цього року, Astra є більш потужною версією цифрового помічника, такого як Siri від Apple.

Він також ще не доступний для широкого загалу.