
Черговий юридичний скандал розгорається навколо навчання великих мовних моделей. Відомі американські письменники, серед яких комедіантка Сара Сільверман та публіцист Та-Нехісі Коутс, подали колективний позов проти техногіганта Meta. Автори стверджують, що компанія без дозволу скопіювала тисячі їхніх книг для тренування штучного інтелекту LLaMA. Ба більше, сліди ведуть особисто до Марка Цукерберга, який знав про нелегальне походження даних.
Піратська бібліотека Library Genesis як джерело знань
Адвокати позивачів надали суду внутрішнє листування співробітників Meta. З документів випливає, що розробники чудово усвідомлювали незаконність своїх дій. ШІ-моделі навчали на базі даних Books3, яка містить близько 190 тисяч оцифрованих творів. Цей архів отримали напряму з відомої тіньової онлайн-бібліотеки Library Genesis (LibGen). Незважаючи на застереження юристів щодо ризиків порушення авторських прав, Марк Цукерберг особисто схвалив використання цієї бази для збереження конкурентоспроможності компанії.
Письменники вимагають компенсації за використання своєї інтелектуальної власності. Вони наголошують, що їхню працю знецінили, позбавивши законних роялті.
Деталі судового позову проти Meta
| Параметр позову | Опис та юридичні деталі |
|---|---|
| Позивачі (Plaintiffs) | Колектив авторів на чолі з Сарою Сільверман та Та-Нехісі Коутсом. |
| Відповідач (Defendant) | Корпорація Meta Platforms. |
| Головний доказ | Внутрішні електронні листи Meta, що підтверджують санкціонування Цукербергом використання Books3. |
| Джерело даних для навчання | Піратський ресурс Library Genesis (база Books3 на 190 000 книг). |
| Суть звинувачення | Порушення авторських прав, незаконне копіювання комерційного контенту без виплати компенсацій. |
Meta наразі утримується від офіційних коментарів для преси. Результат цього процесу може створити важливий судовий прецедент. Якщо суд пристане на бік авторів, технологічним компаніям доведеться купувати ліцензії на кожну книгу, статтю чи картину, використану для навчання нейромереж, що назавжди змінить економіку індустрії генеративного ШІ.
Підсумок
Група американських письменників, включаючи Сару Сільверман та Та-Нехісі Коутса, подала позов проти компанії Meta, звинувачуючи її у порушенні авторських прав при навчанні мовних моделей LLaMA. За даними позивачів, розробники використовували базу даних Books3 з піратської бібліотеки Library Genesis, яка налічує близько 190 тисяч оцифрованих книг. Надані суду докази у вигляді внутрішнього листування свідчать, що керівництво компанії, зокрема Марк Цукерберг, схвалило використання нелегального контенту, попри усвідомлення юридичних ризиків. Рішення у цій справі може суттєво змінити практику ліцензування даних для індустрії штучного інтелекту.

