Google випускає Gemini, чат-бота та голосового помічника на основі ШІ

Дмитро Сизов 8 февраля 2024 17:49

У четвер Google представила Gemini, додаток для смартфона, який веде себе як розмовний цифровий помічник, а також як розмовний чат-бот. Відповідаючи на голосові та текстові запити, він може відповідати на запитання, писати вірші, створювати зображення, чернетки електронних листів, аналізувати особисті фотографії та виконувати інші дії, наприклад установлювати таймер або здійснювати телефонний дзвінок.

Одразу доступний для англомовних у понад 150 країнах і територіях, включаючи Сполучені Штати, Gemini замінює Bard і Google Assistant. Він базується на технології штучного інтелекту, яку компанія розробляє з початку минулого року.

За словами Google, новий додаток призначений для виконання цілої низки завдань, зокрема для персонального репетитора, допомоги програмістам із програмуванням і навіть для підготовки шукачів роботи до співбесід.

«Це може допомогти вам грати в різні сценарії», — сказала Сіссі Сяо. віце-президент Google, відповідальний за підрозділ компанії Google Assistant, під час брифінгу з журналістами.

Коли наприкінці 2022 року з OpenAI з’явився ChatGPT , який вразив публіку відповідями на запитання, написанням курсових робіт і створенням комп’ютерного коду, Google виявив, що наздоганяє. Як і інші технічні гіганти, компанія витратила роки на розробку подібної технології , але не випустила настільки передового продукту, як ChatGPT.

(У грудні New York Times подала до суду на OpenAI та її партнера Microsoft, заявивши про порушення авторських прав на новинний контент, пов’язаний із системами ШІ.)

Google випустив власного чат-бота Bard у березні, отримавши середні відгуки. У наступні тижні компанія об’єднала дві свої провідні лабораторії ШІ — Google Brain і DeepMind — і оголосила, що об’єднана лабораторія розробляє нову технологію ШІ під назвою Gemini.

Gemini — це те, що дослідники називають великою мовною моделлю, або LLM, математичною системою, яка може навчатися навичкам, аналізуючи величезну кількість даних, включаючи книги, комп’ютерні програми та онлайн-балачки. Виявляючи шаблони у всьому цьому тексті, LLM може навчитися генерувати текст самостійно. Це означає, що він може писати вірші, генерувати комп’ютерний код і навіть вести розмову.

Він також схильний до помилок. Він може помилятися у фактах або « галюцинувати » — щось вигадувати.

Gemini є «мультимодальною» системою, тобто вона може реагувати як на зображення, так і на звуки. Після аналізу математичної задачі, яка включала графіки, фігури та інші зображення, вона могла відповісти на запитання так само, як це зробив би учень середньої школи.

У грудні Google використав обмежену версію цієї технології для оновлення Bard . Тепер компанія відмовилася від імені Bard і випускає більш потужну версію технології через додаток Gemini, який доступний на телефонах Android і в Інтернеті. За словами Google, версія для iPhone з’явиться найближчими тижнями.

Google створив безкоштовну, але обмежену версію програми Gemini. Більш потужна версія — під назвою Gemini Advanced і заснована на версії мовної моделі Google Ultra — доступна за місячну передплату в розмірі 19,99 доларів США. Google пропонує безкоштовну двомісячну пробну версію.

Google оприлюднив результати порівняльного тестування, в яких стверджується, що Ultra перевершує останню технологію OpenAI, GPT-4, у кількох ключових областях, включаючи генерацію комп’ютерного коду та узагальнення статей новин.

Додаток Gemini також може створювати, аналізувати та реагувати на зображення. Користувачі можуть завантажити фотографію зі своєї вечірки Super Bowl, наприклад, і попросити програму створити підпис.

Google також заявив, що запропонує подібну технологію через бізнес-сервіси Google Workspace і Google Cloud. Це дозволить клієнтам використовувати цю технологію разом із такими програмами, як Gmail і Google Docs.

На телефонах Android новий додаток замінить Google Assistant, якщо користувачі завантажать Gemini. Як і Google Assistant, він може реагувати на голосові команди, хоча він також реагує на текстові команди.

Google заявив, що також продовжить пропонувати та вдосконалювати Google Assistant.

Минулого року OpenAI випустила подібну версію свого чат-бота ChatGPT , який може відповідати на голосові команди . Більшість інсайдерів галузі вважають, що технологія штучного інтелекту, яка керує чат-ботами, такими як ChatGPT, об’єднається з цифровими помічниками, такими як Siri від Apple і Alexa від Amazon, і замінить їх.