Хакери навчилися приховувати атаки на штучний інетелкт у стиснутих фото

Хакерська атака

Команда з компанії Trail of Bits виявила нову загрозу для систем штучного інтелекту: prompt injection-атаки можна приховати у звичайних зображеннях. Техніка дозволяє вставляти інструкції, невидимі для людського ока, які «розкриваються» після стиснення картинки під час завантаження. Про це пише PCWorld.

Як це працює

Prompt injection — це спосіб непомітно «підсовувати» штучному інтелекту команди, яких користувач не бачить. Наприклад, у текст можна заховати фразу, зробивши її одного кольору з фоном: людина її не прочитає, але ШІ — розпізнає.

У новому варіанті атаки інструкції вбудовуються у зображення. Коли користувач завантажує картинку до сервісу (наприклад, у Gemini чи Android Circle-to-Search), система стискає файл для економії ресурсів. У процесі стиснення прихований текст стає доступним для інтерпретації й може активувати інструкцію.

Приклад атаки

У досліді Trail of Bits було показано, що зображення після завантаження в Gemini змушувало модель надіслати календарні дані користувача сторонній особі.

Важливо, що для успішної атаки необхідні:

  • спеціально підготовлене зображення;
  • конкретний алгоритм компресії, який використовується ШІ-сервісом;
  • підлаштування під цільову систему.

Поки що немає доказів, що цей метод уже застосовується хакерами у реальних атаках.


Телеграм double.newsТелеграм double.news

Схожі Новини
Google Gemini

Google розкрила ліміти використання Gemini

Google офіційно уточнила щоденні та місячні обмеження для користувачів Gemini Apps, розділивши можливості безкоштовних акаунтів та підписників планів Google AI Pro і Ultra. Інформація з’явилася на сторінці підтримки сервісу й деталізує, які саме ресурси доступні в кожному тарифі.
Детальніше
MacBook

Інженер змусив MacBook скрипіти як двері, використавши прихований сенсор

Ви знали, що у вашому MacBook є сенсор, який визначає точний кут відкриття екрана? Цей компонент не доступний через публічні API, але інженер Сем Генрі знайшов спосіб зчитувати його дані. В результаті ноутбук почав видавати звук старих деревʼяних дверей при закритті — і навіть імітувати електронний інструмент, що змінює тональність залежно від положення кришки.
Детальніше
Pulse-Fi

Дослідники навчилися вимірювати пульс за допомогою Wi-Fi-сигналів

Команда з Університету Каліфорнії в Санта-Кларі розробила систему Pulse-Fi, яка дозволяє відстежувати серцебиття дистанційно, аналізуючи зміни у Wi-Fi-сигналах. Технологія працює безконтактно, має високу точність і може стати основою для нових медичних рішень.
Детальніше