Анонімність в інтернеті під загрозою: ШІ здатен розкрити особу за кілька коментарів
Приватність в інтернеті, схоже, остаточно відійшла в минуле. Група дослідників з Вищої технічної школи Цюріха (ETH Zurich), стартапу Anthropic та організації MATS Research опублікувала препринт роботи під назвою “Масштабна онлайн-деанонімізація за допомогою великих мовних моделей” (Large-scale online deanonymization with LLMs). Вчені довели, що сучасні нейромережі здатні встановлювати особистість людей, які ховаються за псевдонімами, спираючись виключно на їхні публічні цифрові сліди.
Як працює алгоритм розкриття особистості
Процес автоматизований: автономний ШІ-агент аналізує відкриті публікації анонімного користувача і витягує з них маркери ідентичності. Це можуть бути згадки міст, професій, хобі, особливості стилю письма і навіть використання місцевого сленгу. З цих розрізнених даних формується структурований профіль. Потім система шукає в мережі відповідних кандидатів, використовуючи семантичний аналіз. По суті, нейромережа діє як професійний приватний детектив, з тією лише різницею, що вона не потребує сну і може паралельно обробляти тисячі профілів за лічені хвилини.
Дослідницька команда протестувала свою розробку на реальних даних. В ході експерименту з користувачами, чиї акаунти можна було пов’язати з профілями в професійній мережі LinkedIn, ШІ вірно визначив 67% “цілей” з точністю 90%. На платформі Reddit алгоритму було достатньо всього десяти коментарів в обговореннях кінофільмів, щоб деанонімізувати авторів в 48% випадків. Для порівняння: традиційні методи деанонімізації – подібні до тих, що застосовувалися у відомій “атаці на Netflix Prize”, коли дослідники розкрили особи користувачів за їхніми оцінками фільмів – в аналогічних умовах показують результат, близький до нуля.
Економіка масового стеження
Головна загроза полягає не в самій технології, оскільки досвідчений слідчий при належних зусиллях міг би досягти схожих результатів і раніше. Ключова зміна – це обвал вартості процесу. На ідентифікацію однієї людини алгоритм витрачає від одного до чотирьох доларів, а всі експерименти, описані в дослідженні, обійшлися авторам менш ніж у дві тисячі доларів.
Це означає, що масова деанонімізація стала доступною практично кожному, хто має банківську картку і мотив: від корпорацій, які бажають максимально точно профілювати клієнтів, до сталкерів.
Раніше конфіденційність в мережі багато в чому трималася на принципі невідповідності зусиль: ніхто не був готовий витрачати тижні на те, щоб вирахувати випадкового коментатора на форумі. Тепер цей бар’єр впав. У зоні найбільшого ризику опинилися ті, для кого анонімність є питанням базової безпеки: активісти, політичні дисиденти, інформатори та жертви домашнього насильства. Ефективність системи підтверджує ще один тест: алгоритм зміг встановити особи 9 із 125 вчених у наборі анонімізованих інтерв’ю, проведених самою компанією Anthropic, просто проаналізувавши описи їхніх дослідницьких проєктів.
Як захиститися в нових реаліях
Автори роботи пропонують ряд системних контрзаходів. Серед них: обмеження доступу до даних користувачів через API, блокування автоматичного збору інформації та заборона на масовий експорт баз даних. Однак дослідники чесно визнають, що все це лише ускладнює і здорожує атаку, але не запобігає їй повністю.
Найбільш надійним способом захисту залишається цифрова аскеза – публікувати значно менше особистої інформації та суворо розділяти свої інтернет-особистості. Подібно до класичного правила розвідки – не використовувати одну і ту ж легенду в різних країнах – користувачам доведеться заводити ізольовані акаунти для різних платформ і інтересів, а також навмисно змінювати стиль письма.
Парадокс сучасної мережі в тому, що ілюзія приватності зникала поступово: з кожним натисканням кнопки “Прийняти умови”, з кожним залишеним коментарем, оціненим фільмом і думкою “мені нема чого приховувати”. Штучний інтелект не знищив анонімність – він лише зробив видимим те, що вже давно стало фактом.
Источник: itechua.com