Google випускає оновлену модель ШІ, здатну обробляти довший текст і відео

Дмитро Сизов 15 февраля 2024 18:30

Google від Alphabet Inc. випускає нову версію своєї потужної моделі штучного інтелекту, яка, за її словами, може обробляти більшу кількість тексту та відео, ніж продукти конкурентів.

Оновлена модель штучного інтелекту під назвою Gemini 1.5 Pro буде доступна в четвер клієнтам і розробникам хмарних технологій, щоб вони могли протестувати її нові функції та, зрештою, створювати нові комерційні програми. Google та її конкуренти витратили мільярди на розширення можливостей генеративного ШІ та прагнуть залучити корпоративних клієнтів, щоб показати, що їхні інвестиції окупаються.

«Сьогодні ми зосереджуємося перш за все на тому, щоб представити вам дослідження, які створили цю модель», — сказав Оріол Віньялс, віце-президент Google і один із технічних керівників Gemini, під час брифінгу з журналістами. «Завтра ми з радістю побачимо, що світ зробить з новими можливостями». Середньорозмірна версія нової моделі AI, Gemini 1.5 Pro, працює на рівні, подібному до більшої моделі Gemini 1.0 Ultra, повідомляє Google.

Після шаленого успіху OpenAI наприкінці 2022 року з його розмовним чат-ботом ChatGPT, Google намагається показати, що він також є силою в передовій генеративній технології ШІ, яка може створювати новий текст, зображення чи навіть відео на основі підказок користувача. Більше компаній експериментують із технологією, яку можна використовувати для автоматизації таких завдань, як кодування, узагальнення звітів або створення маркетингових кампаній.

У грудні Google випустив модель штучного інтелекту Gemini у трьох версіях, що дозволяє налаштовувати її під поставлене завдання та працювати на будь-якому пристрої: від мобільних пристроїв до великих центрів обробки даних. Gemini — це відповідь Google на союзні сили Microsoft Corp. і OpenAI, які, за деякими словами, швидше скористалися нинішнім бумом штучного інтелекту, в тому числі серед клієнтів і розробників хмарних технологій.

Тепер Google прагне залучити цих користувачів у свою екосистему за допомогою ще потужніших інструментів. За словами Vinyals, Gemini 1.5 можна навчити швидше та ефективніше, і він має здатність обробляти величезну кількість інформації щоразу, коли її запитують. Наприклад, розробники можуть використовувати Gemini 1.5 Pro для запиту відео тривалістю до години, 11 годин аудіо або понад 700 000 слів у документі, обсяг даних, який, за словами Google, є «найдовшим вікном контексту» з усіх великих ще масштабна модель AI. За даними Google, Gemini 1.5 може обробляти набагато більше даних, ніж останні моделі штучного інтелекту від OpenAI і Anthropic.