Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

9 червня компанія Anthropic випустила ШІ-модель Claude Fable 5, і за першу добу кілька експертів із кібербезпеки вказали на її надміру суворі алгоритми модерації.

Про це повідомляє TechCrunch.

Як ми вже писали, Fable — це публічна версія кібербезпекової моделі Mythos, яку презентували у квітні в межах ініціативи Project Glasswing для захисту критичної інфраструктури.

Якщо система зчитує промпт користувача як порушення правил, Fable зупиняє чат та сповіщає про позначення повідомлення «як такого, що стосується кібербезпеки або біології». Це має запобігати використанню Fable для створення шкідливого ПЗ або біологічної зброї.

Втім, у кібергалузі знайшлися ті, хто не вподобали ці обмеження.

«[Fable] відхиляє будь-який запит, який може бути хоча б побічно пов’язаний з кібербезпекою. Навіть такі нешкідливі завдання, як читання допису в блозі», — написала в X дослідниця компанії IBM X-Force Валентина Пальміотті.

Cпівробітник стартапу Tolmo Метт Суйче зазначив, що Fable відмовляється робити навіть звичайну перевірку коду. Фільтри працюють за ключовими словами, а внаслідок обмежень модель автоматично перемикається на старішу модель Claude Opus 4.8, випущену минулого місяця.

«Якщо ви просите її написати безпечний код, вона вважає, що це робота, пов’язана з кібербезпекою, замість найкращих практик програмної інженерії, і вас понижують у версії», — поділився спеціаліст.

Водночас Суйче вважає такий підхід виправданим на ранніх етапах розвитку технології. На його думку, під час подібних релізів компаніям краще запровадити максимально суворі рамки та поступово послаблювати їх з часом, ніж випадково пропустити небезпечні запити від зловмисників.

Представники Anthropic наразі не прокоментували критику від технологічної спільноти, пише TechCrunch.

Источник: techno.nv.ua