Anthropic випускає Sonnet 4.6

Компанія Anthropic випустила нову версію своєї моделі Sonnet середнього розміру, дотримуючись чотиримісячного циклу оновлень компанії. У публікації, що анонсує нову модель , Anthropic наголосила на покращеннях у кодуванні, виконанні інструкцій та використанні комп'ютера.
Sonnet 4.6 буде моделлю за замовчуванням для користувачів тарифних планів Free та Pro.
Бета-версія Sonnet 4.6 включатиме контекстне вікно обсягом 1 мільйон токенів, що вдвічі більше, ніж найбільше вікно, доступне раніше для Sonnet. Anthropic описав нове контекстне вікно як «достатнє для зберігання цілих кодових баз, тривалих контрактів або десятків дослідницьких робіт в одному запиті».
Реліз відбувся лише через два тижні після запуску Opus 4.6 , а оновлена модель Haiku, ймовірно, з'явиться найближчими тижнями.
Запуск супроводжується новим набором рекордних результатів у бенчмарках, включаючи OS World для використання комп'ютера та SWE-Bench для розробки програмного забезпечення. Але, мабуть, найбільш вражаючим є його результат у 60,4% у ARC-AGI-2, призначеному для вимірювання навичок, характерних для людського інтелекту. Цей результат ставить Sonnet 4.6 вище за більшість порівнянних моделей, хоча він все ще поступається таким моделям, як Opus 4.6, Gemini 3 Deep Think та одній удосконаленій версії GPT 5.2.