Grok від Маска попри обмеження продовжує генерувати інтимні дипфейки чоловіків

Grok

Після тижнів критики через масове створення несанкціонованих сексуальних дипфейків, X заявила про посилення контролю над чат-ботом Grok. Ілон Маск запевняв, що штучний інтелект дотримується правил і відмовляється генерувати незаконний контент. Втім, реальне тестування показує іншу картину: Grok і надалі здатний створювати інтимні зображення чоловіків на запит. Про це повідомляє The Verge.

Тести Grok: що змінилося насправді

Журналіст Роберт Харт із The Verge провів серію тестів, щоб перевірити, як Grok поводиться після виправлень. Результати виявилися тривожними, особливо коли йдеться про зображення чоловіків.

Під час тестування до Grok було завантажено кілька повністю пристойних фотографій автора. Після цього чат-бот без жодних заперечень виконував запити на «зняття одягу» та створював зображення в еротичній білизні. Важливо, що це працювало одразу на кількох платформах: у застосунку Grok, у чат-інтерфейсі на X і навіть на окремому сайті, який не вимагав входу в акаунт.

Гендерна асиметрія в модерації

Grok

Особливо показовим є те, що Grok поводився по-різному залежно від статі. За словами журналіста, бот категорично відмовлявся виконувати аналогічні запити щодо фотографій жінок, навіть у випадках, коли тестування відбувалося за згодою.

Натомість із чоловічими зображеннями обмеження майже не спрацьовували. Це свідчить про серйозну проблему в алгоритмах модерації: захист від сексуальної експлуатації працює вибірково й не охоплює всіх користувачів однаковою мірою.

Як Grok обходить власні фільтри

За спостереженнями журналіста, для отримання інтимних зображень зазвичай було достатньо кількох ітерацій запитів. Grok рідко відмовляв, а якщо й застосовував цензуру, то часто лише частково – наприклад, розмиваючи одне з двох згенерованих зображень. Інше при цьому залишалося без змін і відповідало запиту.

Формально Grok послідовно відхиляв прямі вимоги на кшталт «показати людину повністю оголеною». Однак креативні формулювання, наприклад із натяком на прозорий одяг, інколи дозволяли обійти фільтри. Результати були не завжди гарантовані, але можливість обходу обмежень залишалася.


Телеграм double.newsТелеграм double.news

Схожі Новини
iPhone Fold

iPhone Fold може отримати проблему з відблисками екрана на сонці

Майбутній складаний смартфон від Apple, відомий як iPhone Fold, продовжує з’являтися в інсайдерських витоках і аналітичних звітах. Очікується, що компанія зробить ставку на новітні дисплейні технології, щоб забезпечити тонкий корпус, високу енергоефективність і мінімальну складку на екрані.
Детальніше
PlayStation Network

PlayStation Network зазнав масштабного збою

Мережа PlayStation Network зіткнулася з масштабним збоєм, який тимчасово позбавив користувачів доступу до ключових функцій сервісу. Проблеми вплинули як на запуск ігор, так і на онлайн-можливості консолей PlayStation.
Детальніше
Twitter

Минуло 20 років від першого твіту: еволюція Twitter до X

21 березня 2006 року співзасновник Twitter Джек Дорсі опублікував коротке повідомлення: «just setting up my twittr». Цей запис став першим твітом в історії платформи, яка згодом перетворилася на один із найвпливовіших соціальних сервісів світу.
Детальніше