Google випускає свої найпотужніші моделі ШІ, оскільки конкуренція з боку OpenAI загострюється

Дмитро Сизов 20 мая 2024 09:15

Googleвикористав свою щорічну конференцію розробників, щоб продемонструвати те, що компанія називає своїми найлегшими та найефективнішими моделями штучного інтелекту.

На Google I/O компанія анонсувала Gemini 1.5 Flash, найновіше доповнення до серії Gemini. У дописі в блозі Google сказано , що нова модель може швидко підсумовувати розмови, підписувати зображення та відео та витягувати дані з великих документів і таблиць.

«Ми чули від розробників, що вони хочуть чогось швидшого та ще більш економічного», — сказав Деміс Хассабіс, генеральний директор Google DeepMind, на брифінгу для преси.

Відкриття відбувається в той момент, коли технологічні компанії все більше переорієнтовують розробку та розгортання своїх продуктів на генеративний штучний інтелект, що має особливе значення для Google, оскільки нові інструменти надають споживачам більш просунуті та креативні способи доступу до онлайн-інформації порівняно з традиційним веб-пошуком.

OpenAI запустив нову модель штучного інтелекту та настільну версію ChatGPT, а також новий інтерфейс користувача. За словами компанії, нова модель під назвою GPT-4o вдвічі швидша за GPT-4 Turbo і вдвічі дешевша.

За словами віце-президента, який працює над Gemini, Google нещодавно анонсувала вдосконалену модель Gemini 1.5 Pro , яка може аналізувати кілька великих документів — загалом 1500 сторінок — або підсумовувати 100 електронних листів.

Gemini 1.5 Pro незабаром зможе обробляти годину відеовмісту або кодових баз із понад 30 000 рядків, сказала Сіссі Хсіао, віце-президент Google і генеральний менеджер Gemini.

«Ви можете швидко отримати відповіді та інформацію щодо щільних документів, як-от з’ясування деталей політики щодо домашніх тварин у вашому договорі оренди або порівняння ключових аргументів у кількох довгих дослідницьких роботах», — сказав Сяо.

Останнє оновлення OpenAI забезпечує покращену якість і швидкість і дозволяє ChatGPT працювати з 50 різними мовами. За словами керівників, він також буде доступний через інтерфейс програмування додатків OpenAI, або API, що дозволить розробникам негайно почати створювати програми за допомогою нової моделі.

За словами Google, Gemini 1.5 Pro має 35 мов, вікно в 2 мільйони токенів, яке вимірює контекст і вказує, скільки інформації модель може обробити одночасно. За словами керівників компанії, нова модель покращила локальне мислення, планування та розуміння іміджу.

«Вона пропонує найдовше контекстне вікно з усіх базових моделей», — сказав генеральний директор Alphabet Сундар Пічаї на брифінгу для преси. Під час заходу він навів приклад того, як батько попросив Gemini узагальнити всі останні електронні листи зі школи їхньої дитини.

Gemini 1.5 Pro спочатку буде доступний для тестування в Workspace Labs. Gemini 1.5 Flash буде доступний для тестування та у Vertex AI, яка є платформою машинного навчання Google, яка дозволяє розробникам навчати та розгортати програми AI.