Дослідження виявило, що моделі OpenAI запам’ятовують захищений авторським правом контент

06.04.2025

Нещодавнє дослідження, проведене вченими з Університету Вашингтона, Університету Копенгагена та Стенфорда, виявило, що деякі моделі OpenAI, зокрема GPT-4 та GPT-3.5, можуть запам’ятовувати та відтворювати фрагменти текстів, захищених авторським правом. Це викликає занепокоєння щодо використання таких даних у навчанні штучного інтелекту, повідомляє TechCrunch.

Дослідники використовували метод, заснований на виявленні “високосюрпризних” слів — тобто слів, які є менш поширеними в певному контексті. Вони видаляли такі слова з уривків художніх книг та статей The New York Times, а потім просили моделі передбачити відсутні слова. Якщо модель правильно відновлювала слово, це свідчило про можливе запам’ятовування цього фрагмента під час навчання.

Результати показали, що GPT-4 демонструє ознаки запам’ятовування частин популярних художніх творів, а також деяких статей The New York Times, хоча в меншій мірі. Це піднімає питання щодо використання захищених авторським правом матеріалів у процесі навчання моделей штучного інтелекту.

Використання захищених авторським правом матеріалів для навчання ШІ без відповідного дозволу може порушувати законодавство та права авторів. Це також піднімає етичні питання щодо використання таких даних і може вплинути на довіру до компаній, що розробляють ШІ. Дослідники наголошують на необхідності більшої прозорості у використанні даних для навчання моделей, щоб уникнути потенційних юридичних та етичних проблем.

Схожі Новини

Технології

Apple готує найбільше оновлення iPhone за всю історію

Apple працює над наймасштабнішим оновленням iPhone за всю історію продукту. Йдеться про запуск складаного смартфона та спеціальної моделі до 20-річчя iPhone з повністю безрамковим дисплеєм.

4 години тому

Детальніше

Технології

Apple готує новий iPad з чипом A18: запуск очікується до літа 2026

Apple продовжує оновлювати свою лінійку пристроїв, і наступним на черзі стане базовий iPad. Компанія планує представити нову модель з чипом A18 уже в першій половині 2026 року.

7 години тому

Детальніше

Технології

Reddit може запровадити Face ID для боротьби з ботами

Reddit розглядає можливість використання біометричної ідентифікації, зокрема Face ID та Touch ID, щоб підтвердити, що користувачі є реальними людьми. Ініціатива пов’язана зі стрімким зростанням кількості ботів і контенту, створеного штучним інтелектом.

8 години тому

Детальніше

Microsoft анонсувала Xbox Partner Preview: покажуть DLC для S.T.A.L.K.E.R. 2 та нові ігри

Apple готує найбільше оновлення iPhone за всю історію

Galaxy Fold 8 отримає 45 Вт зарядку після років без змін

Популярні Теги

Дослідження виявило, що моделі OpenAI запам’ятовують захищений авторським правом контент