xAI оприлюднила системні інструкції Grok після скандалу з некоректними відповідями

xAI

Чат-бот Grok від xAI почав вставляти згадки про “білий геноцид” у Південній Африці у відповіді на несумісні запити користувачів на платформі X. Наприклад, він пов’язував пісню “Kill the Boer” з мультфільмом “Губка Боб Квадратні Штани”.

Як повідомляє The Verge, xAI заявила, що це сталося через “несанкціоновану модифікацію” системного запиту Grok, яка суперечила внутрішнім політикам компанії. У відповідь компанія оприлюднила системні інструкції Grok на GitHub, щоб забезпечити прозорість і запобігти подібним інцидентам у майбутньому.

Системні інструкції Grok визначають його поведінку та відповіді на запити користувачів. Основні принципи включають:

  • Скептичність: Grok не повинен сліпо довіряти авторитетам чи ЗМІ.
  • Прагнення до правди: Чат-бот має надавати правдиву інформацію, навіть якщо вона суперечить загальноприйнятим наративам.
  • Нейтральність: Grok не повинен висловлювати власні переконання, а лише надавати інформацію.
  • Терміни платформи: Використання термінів “X” замість “Twitter” та “X пост” замість “твіту”.

Для порівняння, системні інструкції Claude AI від Anthropic зосереджені на безпеці користувачів, уникаючи створення шкідливого або неприйнятного контенту.

Після інциденту xAI вжила низку заходів для підвищення безпеки та прозорості. По-перше, компанія опублікувала системні інструкції Grok на GitHub. Це рішення має на меті забезпечити відкритість і дати змогу спільноті самостійно перевіряти логіку відповіді бота. Також створено спеціальну команду моніторингу, яка працює 24/7 для виявлення аномальної поведінки або зовнішнього втручання у систему.

Крім того, xAI впровадила додаткові рівні перевірки та затвердження змін до системних запитів. Це має запобігти несанкціонованим модифікаціям у майбутньому.

Ці кроки спрямовані на забезпечення стабільної та надійної роботи Grok, а також на відновлення довіри користувачів до платформи.


Телеграм double.newsТелеграм double.news

Схожі Новини
NASA

NASA знайшла зоряний пил, старший за Сонячну систему

Місія OSIRIS-REx від NASA, яка у 2020 році доставила зразки з астероїда Бенну, відкрила новий вимір у дослідженні походження Сонячної системи. Вчені виявили у зразках матерію, яка утворилася ще до появи нашої зоряної системи, — справжній зоряний пил.
Детальніше
Кодінг

Перший AI-шахрай PromptLocker виявився навчальним експериментом

Нещодавнє відкриття AI‑шахрай PromptLocker компанією ESET сколихнуло сферу кібербезпеки — однак виявилося, що тривога була передчасною. Насправді це не зовсім зловмисне ПЗ, а частина дослідницького проєкту “Ransomware 3.0”, створеного командою з Нью-Йоркського університету.
Детальніше
Twitter

X запускає XChat — зашифровані повідомлення тепер доступні всім

Соціальна платформа X розширює доступ до свого нового функціоналу зашифрованих приватних повідомлень XChat. Після кількох місяців тестування в бета-версії, XChat тепер стає доступним не лише для підписників X Premium.
Детальніше