Anthropic випускає Opus 4.5 з новими інтеграціями Chrome та Excel

Anthropic анонсувала Opus 4.5, останню версію своєї флагманської моделі. Це остання модель серії 4.5 від Anthropic, випущена після запуску Sonnet 4.5 у вересні та Haiku 4.5 у жовтні.
Як і очікувалося, нова версія Opus має найсучаснішу продуктивність у низці тестів, включаючи тести кодування (SWE-Bench та Terminal-bench), використання інструментів (tau2-bench та MCP Atlas) та загальне розв'язання проблем (ARC-AGI 2, GPQA Diamond).
Примітно, що Opus 4.5 — перша модель, яка набрала понад 80% у SWE-Bench verified, шанованому тесті кодування.
Anthropic також наголосила на можливостях Opus щодо використання комп’ютера та роботи з електронними таблицями, і запустила низку паралельних продуктів, щоб продемонструвати, як модель працює в цих умовах. Разом з Opus 4.5 Anthropic зробить свої продукти Claude for Chrome та Claude for Excel , які раніше були в пілотному режимі, ширше доступними. Розширення для Chrome буде доступне всім користувачам Max, тоді як модель, орієнтована на Excel, буде доступна користувачам Max, Team та Enterprise.
Opus 4.5 також містить покращення пам'яті для операцій з довгим контекстом, що вимагало значних змін у способі управління пам'яттю моделі.
«Ми внесли певні покращення в загальну якість навчання з довгим контекстом за допомогою Opus 4.5, але самих контекстних вікон недостатньо», – сказала TechCrunch Діана На Пенн, керівник відділу управління продуктами для досліджень Anthropic. «Знання потрібних деталей для запам’ятовування справді важливе на додаток до простої наявності довшого контекстного вікна».
Ці зміни також дозволили давно бажану функцію «нескінченного чату» для платних користувачів Claude, яка дозволить чатам продовжуватися без переривання, коли модель потрапляє у своє контекстне вікно. Натомість модель стискатиме свою контекстну пам’ять, не попереджаючи користувача.
Багато оновлень зроблено з урахуванням варіантів використання агентами, зокрема сценаріїв, у яких Opus виступає провідним агентом, що керує групою субагентів на базі Haiku. Управління цими завданнями вимагає сильного володіння робочою пам'яттю, і саме тут покращення пам'яті, описані Пенном, дійсно показують свою цінність.
«Саме тут такі фундаментальні речі, як пам’ять, стають справді важливими», — каже Пенн, — «тому що Клоду потрібно вміти досліджувати кодові бази та великі документи, а також знати, коли потрібно повернутися назад і перевірити щось ще раз».
Opus 4.5 зіткнеться з жорсткою конкуренцією з боку інших нещодавно випущених передових моделей, зокрема GPT 5.1 від OpenAI (випущений 12 листопада) та Gemini 3 від Google (випущений 18 листопада).