xAI оприлюднила системні інструкції Grok після скандалу з некоректними відповідями

xAI

Чат-бот Grok від xAI почав вставляти згадки про “білий геноцид” у Південній Африці у відповіді на несумісні запити користувачів на платформі X. Наприклад, він пов’язував пісню “Kill the Boer” з мультфільмом “Губка Боб Квадратні Штани”.

Як повідомляє The Verge, xAI заявила, що це сталося через “несанкціоновану модифікацію” системного запиту Grok, яка суперечила внутрішнім політикам компанії. У відповідь компанія оприлюднила системні інструкції Grok на GitHub, щоб забезпечити прозорість і запобігти подібним інцидентам у майбутньому.

Системні інструкції Grok визначають його поведінку та відповіді на запити користувачів. Основні принципи включають:

  • Скептичність: Grok не повинен сліпо довіряти авторитетам чи ЗМІ.
  • Прагнення до правди: Чат-бот має надавати правдиву інформацію, навіть якщо вона суперечить загальноприйнятим наративам.
  • Нейтральність: Grok не повинен висловлювати власні переконання, а лише надавати інформацію.
  • Терміни платформи: Використання термінів “X” замість “Twitter” та “X пост” замість “твіту”.

Для порівняння, системні інструкції Claude AI від Anthropic зосереджені на безпеці користувачів, уникаючи створення шкідливого або неприйнятного контенту.

Після інциденту xAI вжила низку заходів для підвищення безпеки та прозорості. По-перше, компанія опублікувала системні інструкції Grok на GitHub. Це рішення має на меті забезпечити відкритість і дати змогу спільноті самостійно перевіряти логіку відповіді бота. Також створено спеціальну команду моніторингу, яка працює 24/7 для виявлення аномальної поведінки або зовнішнього втручання у систему.

Крім того, xAI впровадила додаткові рівні перевірки та затвердження змін до системних запитів. Це має запобігти несанкціонованим модифікаціям у майбутньому.

Ці кроки спрямовані на забезпечення стабільної та надійної роботи Grok, а також на відновлення довіри користувачів до платформи.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше