Нова модель Gemini Pro від Google має рекордні результати в бенчмарках

Google випустила найновішу версію Gemini Pro, свого потужного LLM. Модель 3.1 наразі доступна в режимі попереднього перегляду та буде випущена найближчим часом, повідомила компанія.
Нова модель Google може бути однією з найпотужніших LLM на сьогоднішній день. Спостерігачі зазначили, що Gemini 3.1 Pro, схоже, є великим кроком вперед порівняно з попередником, Gemini 3, який після випуску в листопаді вже вважався дуже потужним інструментом штучного інтелекту.
Google також поділився статистикою незалежних бенчмарків, таких як Humanity's Last Exam, яка показала, що він працює значно краще, ніж його попередня версія.
Gemini 3.1 Pro також отримав високу оцінку від Брендана Фуді, генерального директора стартапу Mercor, що спеціалізується на штучному інтелекті, чия система бенчмаркінгу APEX розроблена для вимірювання того, наскільки добре нові моделі штучного інтелекту виконують реальні професійні завдання. «Gemini 3.1 Pro зараз очолює рейтинг APEX-Agents», – написав Фуді в дописі в соціальних мережах , додавши, що вражаючі результати моделі показують, «як швидко агенти вдосконалюються в реальній роботі зі знаннями».
Випуск відбувся на тлі загострення війни моделей штучного інтелекту , коли технологічні компанії продовжують випускати дедалі потужніші LLM, розроблені для агентної роботи та багатоетапного мислення. Інші великі компанії, включаючи OpenAI та Anthropic, також нещодавно випустили нові моделі.