«Клод Фейбл 5» від Anthropic — це версія «Міфів», що доступна публіці вже сьогодні

Дмитро Сизов

Anthropic вперше представляє свою найпотужнішу модель штучного інтелекту широкій публіці, але робить це з певними обережностями. 

Наразі 

компанія, що займається штучним інтелектом, випустила Claude Fable 5, першу публічно доступну версію своєї моделі Mythos. Anthropic стверджує, що Fable 5 чудово підходить для розробки програмного забезпечення, роботи зі знаннями та бачення, але має жорсткі обмеження безпеки. У сферах високого ризику, таких як кібербезпека, біологія, хімія та дистиляція , модель блокує реагування та повертається до Claude Opus 4.8.

Запущений як ознайомлювальна версія у квітні, Mythos спочатку був обмежений кількома партнерами через проблеми кібербезпеки. Минулого тижня Anthropic розширив доступ до сотень організацій у 15 країнах, знову зосередившись на організаціях, які керують критично важливою інфраструктурою.

Тепер версія цієї технології доступна кожному через Claude API від Anthropic та плани Enterprise на основі споживання. Доступ за передплатою буде надаватися поетапно: до 22 червня Fable 5 буде включено до планів Pro, Max, Team та Enterprise на основі робочих місць без додаткової плати. 23 червня Anthropic вилучить Fable 5 з цих планів, що вимагатиме кредитів за використання, і планує якомога швидше відновити його як стандартну функцію передплати.

Anthropic також розгортає нову версію Mythos під назвою Mythos 5 для організацій, які вже отримали дозвіл на доступ до розширеної моделі.

Запуск Fable відбувається на тлі підготовки Anthropic до виходу на публічні ринки разом із OpenAI та SpaceX Ілона Маска . Це також відбувається після звернення компанії, що займається штучним інтелектом, яка закликає великі світові лабораторії штучного інтелекту встановити скоординовану педаль гальма для розробки передового штучного інтелекту. Anthropic попереджає, що системи розвиваються так швидко, що незабаром можуть досягти рекурсивного самовдосконалення (RSI), автономно вдосконалюючи себе без втручання людини. 

Побоюючись того, що модель класу Mythos може зробити в чужих руках, Anthropic каже, що перед випуском Fable 5 провела стрес-тестування своїх класифікаторів за допомогою спроб джейлбрейка. 

«Внутрішньо ми провели зовнішній пошук помилок, який за понад 1000 годин тестування не приніс жодних універсальних джейлбрейків. Потім ми співпрацювали із зовнішніми організаціями, що об’єднуються в червоні команди, яким також не вдалося знайти універсальних джейлбрейків».

Тим не менш, нові атаки все ще можуть бути. Як наслідок, із запуском Fable 5 та Mythos 5, Anthropic заявила, що вимагатиме 30-денного зберігання всього трафіку, навіть якщо підприємства раніше мали угоди про нульове зберігання. Компанія заявила, що не використовуватиме дані для навчання та використовуватиме їх лише для «захисту від складних та нових атак, включаючи нові джейлбрейки», а також «виявлення та зменшення кількості хибних спрацьовувань». Ця політика може створити галузевий прецедент, у якому доступ до дедалі потужніших моделей супроводжується обов’язковою політикою зберігання даних, розробленою як захід безпеки.

Для тих, хто продовжує використовувати модель, не на кожне запитання буде відповідь у стилі Fable 5. Anthropic стверджує, що випадки, коли Fable має перейти на Opus 4.8, трапляються рідко, оскільки попередні дані показують, що щонайменше 95% сеансів Fable повністю працюють на основі власних відповідей моделі. 

У ході стороннього тестування аналітична компанія Hex заявила, що Fable першою отримала 90% балів у своєму основному аналітичному тесті для складних, тривалих аналітичних завдань. 

«У найскладніших питаннях це демонструє тверду оцінку та увагу до нюансів», – сказав Гекс.

Платформа кодування Vibe Base44 у своїй заяві зазначила, що Fable краще справляється з «одноразовим створенням повноцінних додатків» та має чудовий виклик інструментів. Платформа робочого простору та агентів на базі штучного інтелекту Genspark заявила, що Fable перевершила всі інші моделі в своїх оцінках та значно краще виконала такі завдання, як дизайн інтерфейсу користувача та кодування ігор. 

Ціна як для Fable 5, так і для Mythos 5 становить 10 доларів за мільйон вхідних токенів та 50 доларів за мільйон вихідних токенів, що вдвічі перевищує ціну Opus 4.8. Сама ця ціна може служити стримуючим фактором для широкого використання.

Багато підприємств дедалі більше критикують витрати на штучний інтелект після того, як бачать, що рахунки надходять або передчасно вичерпуються їхні річні бюджети на штучний інтелект. Розширені моделі, такі як Opus 4.8, можуть загострити ці проблеми завдяки розширеним навичкам міркування, які дозволяють розділити один запит на кілька завдань.

Anthropic заявила, що очікує дуже високого попиту на Fable 5, який важко передбачити. І справді, деякі, як-от платформа винагород за покупки Rakuten, можуть вважати, що перевага варта ціни. 

«Fable докладає максимум зусиль, щоб проаналізувати та перевірити власну роботу», – йдеться у заяві Rakuten. «Для нас саме це робить можливими високоавтономні операції – додаткові роздуми окупаються».