Видавці вимагають платити за статті, які використовуються для роботи ChatGPT

Дмитро Сизов
Видавці вимагають платити за статті, які використовуються для роботи ChatGPT

Кілька великих газет ведуть переговори з OpenAI, виробником ChatGPT, щодо доступу до життєво важливого ресурсу в епоху генеративного штучного інтелекту: цифрових новин.

Роками такі технологічні компанії, як Open AI, вільно використовували новини для створення наборів даних, які навчають їхні машини розпізнавати людські запити про світ і вільно відповідати на них. Але оскільки прагнення до розробки передових моделей штучного інтелекту стає все більш шаленим, видавці газет та інші власники даних вимагають частку потенційно величезного ринку генеративного штучного інтелекту, який, за прогнозами, досягне 1,3 трильйона доларів США до 2032 року, згідно з даними Bloomberg Intelligence. .

З серпня принаймні 535 інформаційних організацій , включаючи New York Times, Reuters і The Washington Post, встановили блокувальник, який запобігає збору та використанню їхнього вмісту для навчання ChatGPT. Тепер дискусії зосереджені на тому, щоб платити видавцям, щоб чат-бот міг показувати посилання на окремі новини у своїх відповідях, розвиток, який принесе користь газетам двома способами: забезпечуючи пряму оплату та потенційно збільшуючи трафік на їхні веб-сайти.

У липні Open AI уклав угоду про ліцензування контенту з Associated Press як навчальних даних для своїх моделей AI. За словами двох знайомих із переговорами людей, які говорили на умовах анонімності для обговорення делікатних питань, але вони більше зосередилися на показі історій у відповідях ChatGPT.

Інші джерела корисних даних також шукають важелі впливу. Reddit, популярна соціальна дошка оголошень, зустрілася з провідними генеруючими компаніями штучного інтелекту щодо отримання грошей за свої дані, за словами людини, знайомої з цим питанням, яка говорила на умовах анонімності для обговорення приватних переговорів.

Якщо угоди не вдасться досягти, Reddit розглядає можливість блокування пошукових сканерів Google і Bing, що завадить виявленню форуму під час пошуку та зменшить кількість відвідувачів сайту. Але компанія вважає, що компроміс того вартий, сказав він, додавши: «Reddit може вижити без пошуку».

А в квітні Ілон Маск почав стягувати 42 000 доларів за масовий доступ до публікацій у Twitter — який раніше був безкоштовним для дослідників — після того, як він заявив, що компанії штучного інтелекту незаконно використовували дані для навчання своїх моделей. (З тих пір Маск змінив бренд Twitter на X.)

Ці кроки знаменують зростаюче відчуття терміновості та невизначеності щодо того, хто отримує прибуток від інформації в Інтернеті. Оскільки генеративний штучний інтелект готовий змінити спосіб взаємодії користувачів з Інтернетом, багато видавців та інших компаній вважають справедливу оплату своїх даних проблемою існування.

Наприклад, через місяць після того, як OpenAI запустив GPT-4 у березні, трафік до спільноти програмістів Stack Overflow знизився на 15 відсотків, оскільки програмісти звернулися до штучного інтелекту, щоб отримати відповіді на свої запитання щодо кодування, за словами генерального директора Прашанта Чандрасекара, який також сказав The Post, що він думає штучний інтелект був навчений на даних Stack Overflow.