Gemini тепер може автоматизувати деякі багатоетапні завдання на Android

Дмитро Сизов


Google оголосив про серію оновлень своїх функцій Gemini на базі штучного інтелекту в операційній системі Android, найпомітнішим з яких є новий спосіб використання штучного інтелекту для виконання багатоетапних завдань, таких як замовлення Uber або доставка їжі. Ці автоматизації приєднуються до інших покращень Gemini, що постачаються сьогодні, включаючи розширення виявлення шахрайства для телефонних дзвінків та оновлення Circle to Search, які тепер дозволяють ідентифікувати всі елементи на екрані телефону.

Автоматизація, пояснює Google, дозволяє користувачам по суті перекласти свій список справ на Gemini. Однак на практиці типи речей, якими може керувати Gemini, все ще обмежені.

Компанія заявляє, що функція, яка перебуває в бета-версії, спочатку підтримуватиме вибрані програми в категоріях їжі, продуктів харчування та спільних поїздок.

Він також буде обмежений додатком Gemini на певних пристроях, включаючи Pixel 10, Pixel 10 Pro та серію Samsung Galaxy S26. Спочатку він буде доступний лише в США та Кореї.

Авторство зображень: Google

Звісно, ​​автоматизація на базі штучного інтелекту може призвести до помилок, тому Google додав деякі засоби захисту. По-перше, автоматизацію не можна запустити без явної команди власника пристрою. Під час її виконання ви можете спостерігати за її прогресом у режимі реального часу та зупинити завдання, якщо воно помиляється або застрягає. Google також зазначає, що автоматизація відбувається у захищеному віртуальному вікні на вашому телефоні, де вона має доступ лише до обмежених програм, а не до решти даних на вашому пристрої.

Ця функція пов’язана зі зростаючою тенденцією використання штучного інтелекту для автоматизації більшої кількості завдань в особистому житті користувачів. ChatGPT, наприклад, дозволяє користувачам створювати завдання , які можна виконувати за розкладом або в певний час, а також пропонує агента , який може виконувати різноманітні комп’ютерні завдання, такі як навігація календарем, створення слайд-шоу або запуск коду. Тим часом Anthropic’s Cowork застосовує можливості свого Claude AI до завдань, не пов’язаних з кодуванням, дозволяючи не-розробникам автоматизувати щоденне управління файлами та завданнями. І, звичайно ж, інструмент штучного інтелекту під назвою OpenClaw нещодавно став вірусним завдяки своїй здатності керувати повсякденними завданнями, такими як надсилання електронних листів, керування календарями, реєстрація на рейси тощо.

Авторство зображень: Google

Ще одне оновлення Gemini, яке з'явилося зараз, — це розширення функції виявлення шахрайства для телефонних дзвінків, яка стає доступною на пристроях Samsung серії Galaxy S26 у США (ця функція вже пропонується на телефонах Pixel у США, Австралії, Канаді, Індії, Ірландії та Великій Британії). Google також використовує свою вбудовану модель Gemini для виявлення шахрайських текстових повідомлень у США, Канаді та Великій Британії на пристроях серії Pixel 10, а незабаром і на телефонах серії Galaxy S26.

Зрештою, Google повідомляє, що функція «Обведення для пошуку», яка дозволяє використовувати такі жести, як каракулі та обведення, для початку пошуку, тепер може шукати все, що ви бачите на екрані телефону, а не лише окремий об’єкт. Це означає, що ви можете шукати кожен предмет одягу та кожен аксесуар у вбранні, який вам подобається, або дізнаватися більше про групу речей та пов’язану з ними тему на екрані.

Авторство зображень: Google

Google постійно випускає оновлення Gemini для своєї екосистеми Android через регулярні проміжки часу, оновлюючи нову операційну систему та оновлення, орієнтовані на свій флагманський телефон Google Pixel, через часті оновлення, відомі як Pixel Drops . Тим часом Apple намагається випустити більш повний набір функцій штучного інтелекту, який має включати Siri на базі штучного інтелекту — запуск, який нещодавно знову було перенесено на пізніший термін цього року.