OpenAI намагається зменшити упередженість у ChatGPT

OpenAI

OpenAI представила результати масштабного тесту на об’єктивність своїх моделей, згідно з яким GPT-5 демонструє найнижчий рівень політичної упередженості серед усіх попередніх версій ChatGPT. За словами компанії, це — результат багатомісячної роботи над зменшенням політичного та ідеологічного впливу на відповіді моделі.

Мета дослідження

OpenAI зазначає, що ChatGPT не має виражати політичні погляди чи схиляти користувача до певної позиції. Для перевірки цього компанія розробила спеціальний стрес-тест, який оцінює, як ChatGPT реагує на провокаційні або політично забарвлені запити.

У межах тесту модель отримала 500 різних запитів на 100 тем — від імміграції до питань репродуктивного здоров’я — у п’яти варіаціях: від нейтральних до заряджених ліберальних або консервативних формулювань.

Що показали результати тестування

ChatGPT

За результатами тестування OpenAI, нові моделі GPT-5 продемонстрували на 30% нижчий рівень упередженості, ніж попередні покоління. Це означає, що відповіді моделі частіше залишаються нейтральними, навіть коли запити мають політичне чи емоційне забарвлення.

Дослідники зазначають, що помірне упередження найчастіше з’являється лише у відповідях на політичні запити, коли формулювання вже містять певну ідеологічну позицію.

При цьому сильні ліберальні формулювання мали більший вплив на об’єктивність моделі, ніж консервативні. Якщо упередження все ж виникало, воно зазвичай проявлялося у вигляді емоційної реакції або підсилення оцінки користувача, а не в односторонній підтримці певної позиції.

OpenAI наголосила, що загалом упередження спостерігається рідко й має низьку інтенсивність, а GPT-5 наразі є найбільш збалансованою та об’єктивною моделлю ChatGPT серед усіх версій.


Телеграм double.newsТелеграм double.news

Схожі Новини
anthropic claude

Anthropic додала в Claude функцію віддаленого керування комп’ютером

Anthropic представила нову функцію для свого чат-бота Claude, яка дозволяє штучному інтелекту керувати комп’ютером користувача. Інструмент уже доступний у тестовому режимі для підписників Claude Pro та Max і працює на macOS.
Детальніше
One Plus

OnePlus може скоротити присутність на глобальних ринках

Навколо OnePlus знову з’явилися чутки про можливе скорочення діяльності на ключових міжнародних ринках. За інформацією інсайдерів, компанія може переглянути свою глобальну стратегію, що потенційно вплине на присутність бренду в США, Європі та Індії.
Детальніше
Grammarly

Grammarly використовує імена журналістів у AI без згоди

Сервіс перевірки текстів Grammarly опинився в центрі критики через нову функцію «Expert Review», яка використовує імена відомих журналістів, науковців і письменників без їхнього дозволу. Про проблему повідомили The Verge, виявивши, що AI генерує поради, нібито натхненні реальними людьми.
Детальніше