Ветерани з кібербезпеки протестують проти заборони уряду США на найпотужніші моделі Anthropic

Дмитро Сизов

Група, що складається з десятків експертів з кібербезпеки, включаючи кількох відомих ветеранів галузі, опублікувала відкритого листа до уряду США з проханням скасувати наказ про експортний контроль над моделями Fable та Mythos від Anthropic.

Згідно з відкритим листом, «ця дія позбавила захисників [кібербезпеки] найкращих моделей», які тепер не можуть використовувати ці моделі для пошуку вразливостей та підвищення безпеки свого програмного забезпечення та продуктів. 

«Позбавляти захисників найкращих можливостей без вагомої причини, коли наші супротивники швидко наступають, небезпечно», – йдеться в листі.

У п'ятницю уряд США наказав Anthropic обмежити експорт Fable та Mythos , посилаючись на проблеми національної безпеки, не пояснивши конкретних причин цього наказу, повідомляє Anthropic . У відповідь компанія призупинила доступ до моделей для всіх користувачів у всьому світі. 

На момент написання цього листа підписали 76 експертів з кібербезпеки, зокрема Алекс Стамос, колишній керівник служби безпеки Facebook; Кейсі Елліс, засновник платформи Bugcrowd для пошуку шкідливих програм; Джон Каллас, відомий криптограф і колишній менеджер з проектування та архітектури безпеки Apple; Пол Віксі, науковець з інформатики; Діно Дай Зові, колишній керівник відділу прикладної інженерії безпеки в Block; Кеті Муссуріс, засновниця Luta Security; та Рейчел Тобак, генеральний директор компанії SocialProof Security, що займається навчанням з безпеки. 

Коли Mythos було запущено в якості попередньої версії у квітні, Anthropic стверджувала, що він настільки потужний у пошуку вразливостей безпеки, що компанії довелося жорстко обмежити доступ, щоб запобігти використанню його зловмисними хакерами або іноземними супротивниками для створення хаосу в Інтернеті. На практиці це означало, що Anthropic надала приблизно 50 компаніям початковий доступ до Mythos, нещодавно розширивши цю групу , включивши до неї близько 150 організацій у 15 країнах.

Минулого тижня Anthropic випустила Fable , публічну версію Mythos, яка, за словами компанії, мала суворі обмеження, що блокують її використання в галузях біології, хімії та кібербезпеки, а також перешкоджають іншим використовувати цю модель для її повторного створення. Обмеження Fable були настільки суворими, що багато експертів з кібербезпеки виявили, що вона фактично блокує будь-які запити, пов'язані з кібербезпекою 

Anthropic заявила, що наказ Білого дому про експортний контроль, можливо, ґрунтувався на повідомленні про існування методу обходу — або джейлбрейка — Fable, щоб розблокувати його потужні можливості рівня Mythos. 

За словами Кеті Муссуріс, однієї з підписанток відкритого листа, метод був продемонстрований дослідниками Amazon у статті, яка не є публічною, але яку вона рецензувала. 

Але Муссуріс у своєму блозі зазначила , що в статті насправді не продемонстровано реального джейлбрейка. Натомість, за її словами, дослідники просто попросили Fable виправити відкритий код із загальнодоступними та відомими вразливостями разом із «навмисно встановленими вразливостями» після того, як модель спочатку відмовилася «перевіряти код на наявність проблем безпеки».

«Поведінку, описану в статті, неможливо змістовно виправити, і будь-яка спроба лише послабить модель захисту», – написав Муссуріс. «Захисники повинні мати можливість попросити ШІ виправити помилки у файлі, пояснити, чому виправлення важливе, та написати тести, які підтверджують, що патч працює. Це не обхідний маневр. Це найцінніша річ, яку модель ШІ може зробити для захисної безпеки: виконання циклу пошуку, виправлення та тестування, який захисники запускають щодня».

Критика Мусуріса була підтримана у відкритому листі, в якому також зазначалося, що група експертів вважає, що можливості моделі, описані в статті Amazon, «можна відтворити» на GPT-5.5 від OpenAI, на загальнодоступних моделях Anthropic Claude Opus 4.8 та Sonnet, «і навіть на китайських моделях, таких як Kimi 2.7».

Муссуріс розповів TechCrunch, що «помилки, використані для демонстрації методів, описаних у статті, можна знайти за допомогою інших моделей. Метод, описаний у статті, — це метод обходу захисних огорож. Інші моделі, яким бракує захисних огорож Fable, часто не відмовляються від прямого запиту на пошук помилок безпеки, тому їм не потрібен обхід».

У листі також містився запит на прозоре та справедливе застосування правил, створених шляхом «демократичного процесу нормотворчості», які базуються на наукових дослідженнях, проведених галузевими та академічними експертами, та «використовуються лише в мінімально необхідному обсязі для забезпечення безпеки американської громадськості».