У справі щодо авторських прав на штучний інтелект Цукерберг звертається за захистом до YouTube

Дмитро Сизов 17 января 2025 09:29

Марк Цукерберг використовував битву YouTube за видалення піратського вмісту, щоб захистити використання його власною компанією набору даних, що містить захищені авторським правом електронні книги, розкриває нещодавно оприлюднені фрагменти показань, які він дав наприкінці минулого року .

Відповідь, яка була частиною скарги, поданої до суду адвокатами позивачів, пов’язана зі справою щодо авторських прав AI Kadrey v. Meta . Це одна з багатьох подібних справ, які проходять через судову систему США, яка протиставляє компанії ШІ проти авторів та інших власників інтелектуальної власності. Здебільшого відповідачі у цих справах – компанії штучного інтелекту – стверджують, що навчання захищеному авторським правом контенту є «добросовісним використанням». Багато власників авторських прав не погоджуються.

«Наприклад, я вважаю, що YouTube може в кінцевому підсумку розміщувати деякі речі, які люди піратують протягом певного періоду часу, але YouTube намагається знищити ці речі», — сказав Цукерберг під час давання показань, згідно з частинами стенограми , опублікованою в середу. ніч. «І переважна більшість матеріалів на YouTube, я б припустив, хороша, і вони мають на це ліцензію».

Фрагменти показань Цукерберга дають певні підказки щодо поглядів Цукерберга на контент, захищений авторським правом, і добросовісне використання. Однак слід зазначити, що повна стенограма показань не була опублікована. TechCrunch звернувся до Meta за додатковим контекстом і оновить статтю, якщо компанія відповість.

Грунтуючись на самородках осадження, Цукерберг, схоже, захищає використання Meta набору навчальних даних електронних книг під назвою LibGen для розробки сімейства моделей ШІ, відомих як Llama. Llama від Meta конкурує з флагманськими моделями компаній зі штучним інтелектом, таких як OpenAI.

LibGen, який називає себе «агрегатором посилань», надає доступ до захищених авторським правом творів видавців, зокрема Cengage Learning, Macmillan Learning, McGraw Hill і Pearson Education. На LibGen неодноразово подавали позов, наказували її закрити та оштрафували на десятки мільйонів доларів за порушення авторських прав.

Відповідно до судових документів, розкритих цього тижня, Цукерберг нібито дозволив використання LibGen для навчання принаймні однієї з моделей Meta Llama, незважаючи на занепокоєння керівників штучного інтелекту компанії та дослідницьких груп щодо юридичних наслідків.

Адвокат позивачів, серед яких автори бестселерів Сара Сільверман і Та-Нехісі Коутс, процитував співробітників Meta, які називали LibGen «набором даних, який, як ми знаємо, є піратським», і зазначили, що його використання «може підірвати позицію [Meta] у переговорах з регуляторами. ", згідно з юридичною заявою ,

Під час свого показання Цукерберг заявив, що «справді не чув про» LibGen.

«Я розумію, що ви намагаєтеся змусити мене висловити думку про LibGen, про яку я насправді не чув», — сказав Цукерберг під час свідчення. «Просто я не знаю про цю конкретну річ».

На запитання одного з адвокатів позивачів, Девіда Бойса, Цукерберг пояснив, чому було б нерозумно забороняти використання такого набору даних, як LibGen.

«Чи хотів би я мати політику проти людей, які користуються YouTube, тому що певний контент може бути захищений авторським правом? Ні", - сказав він. «Є випадки, коли така загальна заборона може бути неправильною».

Цукерберг заявив, що Meta має бути «досить обережним» щодо навчання матеріалам, захищеним авторським правом.

«Ви знаєте, [якщо є] хтось, хто надає веб-сайт, і він навмисно намагається порушити права людей… очевидно, це те, з чим ми хотіли б бути обережними або обережними щодо того, як ми з ним взаємодіємо, або, можливо, навіть перешкоджати нашим командам займаючись цим», – сказав Цукерберг під час давання показань, згідно зі стенограмою.

Нові звинувачення

Адвокати позивачів у справі «Кадрі проти Мета» кілька разів вносили зміни до скарги, відколи її було подано до окружного суду США Північного округу Каліфорнії, округ Сан-Франциско у 2023 році. Остання змінена скарга, подана адвокатом позивачів увечері в середу, містить: нові звинувачення проти Meta, зокрема те, що компанія перехресно посилалася на певні піратські книги в LibGen із книгами, захищеними авторським правом доступний для отримання ліцензії. Юристи стверджують, що Meta використовувала цю тактику, щоб визначити, чи є сенс укладати ліцензійну угоду з видавцем.

Meta нібито використовувала LibGen для навчання свого останнього сімейства моделей Llama, Llama 3, згідно зі зміненою заявкою. Позивачі також стверджують, що Meta використовує набір даних для навчання своїх моделей наступного покоління Llama 4.

Згідно зі зміненою заявкою, дослідники Meta нібито намагалися приховати той факт, що моделі Llama навчалися на захищених авторським правом матеріалах, вставляючи «контрольовані зразки» в тонке налаштування Llama. І Meta завантажила піратські електронні книги з іншого джерела, Z-Library, для навчання Llama нещодавно у квітні 2024 року, як стверджується у зміненій скарзі.

Z-Library, або Z-Lib, була предметом низки судових позовів, ініційованих видавцями, включаючи конфіскацію та видалення доменів. У 2022 році росіян, які нібито підтримували його, звинуватили в порушенні авторських прав, шахрайстві та відмиванні грошей.