OpenAI відповідає Google за допомогою GPT-5.2 після доповідної записки про «червоний код»

Дмитро Сизов
OpenAI відповідає Google за допомогою GPT-5.2 після доповідної записки про «червоний код»

OpenAI запустила свою останню передову модель, GPT-5.2, у четвер на тлі зростаючої конкуренції з боку Google, презентуючи її як свою найсучаснішу модель, призначену для розробників та щоденного професійного використання.

GPT-5.2 від OpenAI стане доступним для платних користувачів та розробників ChatGPT через API у трьох варіантах: Instant, оптимізована за швидкістю модель для рутинних запитів, таких як пошук інформації, письмо та переклад; Thinking, яка чудово справляється зі складною структурованою роботою, такою як кодування, аналіз довгих документів, математика та планування; та Pro, топова модель, спрямована на забезпечення максимальної точності та надійності для складних задач. 

«Ми розробили версію 5.2, щоб розкрити ще більше економічної цінності для людей», – сказав у четвер під час брифінгу з журналістами Фіджі Сімо, головний директор з продуктів OpenAI. «Вона краща для створення електронних таблиць, презентацій, написання коду, сприйняття зображень, розуміння довгого контексту, використання інструментів, а потім пов’язування складних, багатоетапних проектів».

GPT-5.2 опиняється в розпалі гоніння озброєнь з Gemini 3 від Google, який очолює таблицю лідерів LMArena за більшістю тестів (за винятком кодування, яке Claude Opus-4.5 від Anthropic все ще має під контролем).

На початку цього місяця видання The Information повідомило , що генеральний директор Сем Альтман опублікував внутрішню службову записку «червоний код» для персоналу на тлі зниження трафіку ChatGPT та побоювань, що компанія втрачає частку споживчого ринку на користь Google. «Червоний код» закликав до зміни пріоритетів, зокрема до відкладення таких зобов’язань, як впровадження реклами, та натомість до зосередження на створенні кращого досвіду роботи з ChatGPT. 

GPT-5.2 – це спроба OpenAI повернути собі лідерство, навіть попри те, що деякі співробітники, як повідомляється, просили відкласти випуск моделі, щоб компанія мала більше часу на її вдосконалення. І попри ознаки того, що OpenAI зосередить свою увагу на споживчих варіантах використання, додавши більше персоналізації та налаштування до ChatGPT, запуск GPT-5.2 має на меті розширити можливості для підприємств. 

Компанія спеціально орієнтується на розробників та екосистему інструментів, прагнучи стати основою за замовчуванням для створення додатків на базі штучного інтелекту. Раніше цього тижня OpenAI опублікувала нові дані, які показують, що використання її інструментів штучного інтелекту підприємствами різко зросло за останній рік. 

Це відбувається на тлі тісної інтеграції Gemini 3 в екосистему продуктів та хмарних технологій Google для мультимодальних та агентських робочих процесів. Цього тижня Google запустив керовані сервери MCP , які спрощують підключення агентів до таких сервісів Google та хмарних сервісів, як Карти та BigQuery. (MCP – це з’єднувачі між системами штучного інтелекту, даними та інструментами).

OpenAI стверджує, що GPT-5.2 встановлює нові стандарти в кодуванні, математиці, науці, зоровому баченні, довго контекстному мисленні та використанні інструментів, що, за словами компанії, може призвести до «надійніших агентних робочих процесів, коду виробничого рівня та складних систем, які працюють у великих контекстах та з реальними даними».

Ці можливості ставлять його в пряму конкуренцію з режимом Deep Think від Gemini 3, який рекламується як важливий прогрес у сфері мислення, спрямований на математику, логіку та науку. На власному бенчмарку OpenAI, GPT-5.2 Thinking випереджає Gemini 3 та Anthropic Claude Opus 4.5 майже в кожному переліченому тесті на мислення, від завдань з реальної розробки програмного забезпечення (SWE-Bench Pro) та знань науки докторського рівня (GPQA Diamond) до абстрактного мислення та виявлення закономірностей (пакети ARC-AGI). 

Керівник дослідження Айдан Кларк сказав, що вищі результати з математики стосуються не лише розв'язання рівнянь. Математичне мислення, пояснив він, є показником того, чи може модель дотримуватися багатоетапної логіки, зберігати узгодженість чисел з часом та уникати незначних помилок, які можуть посилюватися з часом. 

«Усе це властивості, які дійсно важливі для широкого спектра різних робочих навантажень», – сказав Кларк. «Такі речі, як фінансове моделювання, прогнозування, аналіз даних».

Під час брифінгу керівник продукту OpenAI Макс Шварцер заявив, що GPT-5.2 «суттєво покращує генерацію та налагодження коду» та може крок за кроком проходити через складні математичні та логічні операції. Він додав, що стартапи кодування, такі як Windsurf та CharlieCode, повідомляють про «найсучаснішу продуктивність кодування агентів» та вимірні покращення складних багатоетапних робочих процесів.

Окрім кодування, Шварцер зазначив, що відповіді GPT-5.2 Thinking містять на 38% менше помилок, ніж його попередник, що робить модель більш надійною для щоденного прийняття рішень, досліджень та написання. 

GPT-5.2, видається, є не стільки переосмисленням, скільки консолідацією двох останніх оновлень OpenAI. GPT-5, випущений у серпні, був перезавантаженням, яке заклало основу для уніфікованої системи з маршрутизатором для перемикання моделі між швидкою моделлю за замовчуванням та глибшим режимом «Мислення». Листопадовий GPT-5.1 був зосереджений на тому, щоб зробити цю систему більш теплою, більш розмовною та краще пристосованою до агентських завдань та завдань кодування. Остання модель, GPT-5.2, схоже, підвищує рівень усіх цих досягнень, роблячи її надійнішою основою для виробничого використання. 

Для OpenAI ставки ще ніколи не були вищими. Компанія взяла на себе зобов'язання виділити 1,4 трильйона доларів на розбудову інфраструктури штучного інтелекту протягом наступних кількох років, щоб підтримати своє зростання – зобов'язання, які вона взяла на себе, коли ще мала перевагу першопрохідця серед компаній, що займаються штучним інтелектом. Але тепер, коли Google, який спочатку відставав, просувається вперед, ця ставка може бути причиною «червоного коду» Альтмана. 

Оновлена ​​​​орієнтація OpenAI на моделі міркування також є ризикованим кроком. Системи, що лежать в основі режимів «Мислення» та «Глибоке дослідження», дорожчі в експлуатації, ніж стандартні чат-боти, оскільки вони витрачають більше обчислювальних ресурсів. Подвоюючи таку модель за допомогою GPT-5.2, OpenAI може створювати замкнене коло: витрачати більше на обчислення, щоб виграти таблицю лідерів, а потім витрачати ще більше, щоб підтримувати роботу цих дорогих моделей у великих масштабах.

Повідомляється, що OpenAI вже витрачає на обчислення більше, ніж раніше заявляла. Як нещодавно повідомляв TechCrunch , більша частина витрат OpenAI на логічний висновок — грошей, які компанія витрачає на обчислення для запуску навченої моделі штучного інтелекту — оплачується готівкою, а не через хмарні кредити, що свідчить про те, що витрати компанії на обчислення перевищили те, що можуть покрити партнерства та кредити.

Під час дзвінка Сімо припустив, що в міру масштабування OpenAI зможе пропонувати більше продуктів і послуг, щоб генерувати більше доходів для оплати додаткових обчислень.

«Але я вважаю, що важливо враховувати це у загальній схемі ефективності», – сказав Сімо. «Сьогодні ви отримуєте набагато більше інтелекту за той самий обсяг обчислень і ту саму суму грошей, що й рік тому».

Попри всю зосередженість на міркуваннях, у сьогоднішньому запуску відсутня одна річ, а саме новий генератор зображень. Альтман, як повідомляється, у своєму меморандумі Code Red заявив, що генерація зображень буде ключовим пріоритетом у майбутньому, особливо після того, як Google Nano Banana (прізвисько моделі Google Gemini 2.5 Flash Image) став вірусним після свого випуску в серпні.

Минулого місяця Google випустила Nano Banana Pro (також відомий як Gemini 3 Pro Image) – оновлену версію з ще кращим рендерингом тексту, знаннями про світ та моторошною, реалістичною, невідредагованою атмосферою фотографій. Вона також краще інтегрується з продуктами Google, що продемонстрували минулого тижня, коли з’явилася в інструментах та робочих процесах, таких як Google Labs Mixboard для автоматизованої генерації презентацій.

Повідомляється, що OpenAI планує випустити ще одну нову модель у січні з кращими зображеннями, підвищеною швидкістю та кращою інтерфейсом користувача, хоча компанія не підтвердила ці плани у четвер.

OpenAI також заявила у четвер, що впроваджує нові заходи безпеки щодо використання даних для психічного здоров'я та перевірки віку для підлітків, але не приділяла значну частину часу запуску презентації цих змін.