Anthropic заборонила Claude допомагати у створенні зброї масового ураження

Anthropic

У відповідь на зростаючу стурбованість щодо безпеки штучного інтелекту компанія Anthropic внесла зміни до політики використання свого мовного чат-бота Claude. Згідно з оновленими правилами, тепер суворо заборонено застосовувати Claude для створення високоефективних вибухових речовин або розробки біологічної, хімічної, радіологічної чи ядерної зброї. Про це пише PCMag.

Чітке формулювання небезпечних сценаріїв

Раніше умови використання вже містили заборону на «розробку зброї, вибухових речовин, небезпечних матеріалів або систем, що спричиняють шкоду», проте тепер Anthropic вперше деталізувала заборонені категорії. Як зазначає The Verge, нові умови акцентують на конкретних видах зброї масового ураження та їхніх прекурсорах.

Такі уточнення стали реакцією на зростаючу кількість наукових досліджень, що демонструють потенційні ризики використання великих мовних моделей (LLM) у розробці заборонених технологій.

Відкритість до політичного діалогу

На тлі посилення безпекових обмежень компанія водночас зняла повну заборону на створення політичного контенту. Тепер Claude може генерувати матеріали, пов’язані з політичними кампаніями або лобізмом, якщо вони не порушують демократичні процеси або не спрямовані на маніпуляцію виборцями.

У заяві Anthropic наголошено, що новий підхід покликаний «дозволити легітимний політичний дискурс», водночас захищаючи виборчі процеси від дезінформації та втручання.

Заборона на кіберзлочинність

Окрім того, оновлення політики включає нові положення, що забороняють використання Claude для проведення кібератак або створення шкідливого програмного забезпечення. Це важливий крок у контексті зростання занепокоєння щодо потенційного використання ШІ у злочинних цілях.


Телеграм double.newsТелеграм double.news

Схожі Новини
NASA

NASA знайшла зоряний пил, старший за Сонячну систему

Місія OSIRIS-REx від NASA, яка у 2020 році доставила зразки з астероїда Бенну, відкрила новий вимір у дослідженні походження Сонячної системи. Вчені виявили у зразках матерію, яка утворилася ще до появи нашої зоряної системи, — справжній зоряний пил.
Детальніше
Кодінг

Перший AI-шахрай PromptLocker виявився навчальним експериментом

Нещодавнє відкриття AI‑шахрай PromptLocker компанією ESET сколихнуло сферу кібербезпеки — однак виявилося, що тривога була передчасною. Насправді це не зовсім зловмисне ПЗ, а частина дослідницького проєкту “Ransomware 3.0”, створеного командою з Нью-Йоркського університету.
Детальніше
Twitter

X запускає XChat — зашифровані повідомлення тепер доступні всім

Соціальна платформа X розширює доступ до свого нового функціоналу зашифрованих приватних повідомлень XChat. Після кількох місяців тестування в бета-версії, XChat тепер стає доступним не лише для підписників X Premium.
Детальніше