Вчені зі Стенфорда з’ясували: з часом GPT-4 “тупіє”


Нове дослідження вчених зі Стенфордського університету підтвердило думку, яку вже кілька тижнів висловлюють користувачі Інтернету: ChatGPT Plus, створений на базі GPT-4, дійсно став менш інтелектуальним, на відміну від GPT-3.5, який використовується в безкоштовній версії чат-бота.

У своїй роботі вчені порівнювали відповіді чат-бота, який працює на базі GPT-4 та GPT-3.5, на різні запити. Вони виявили, що поведінка чат-бота та точність відповідей на деякі запити в новій версії значно погіршились.

Учені аналізували мовні моделі GPT-4 та GPT-3.5, які були випущені у березні та січні відповідно. Вони виявили, що за цей час точність GPT-4 суттєво знизилась, тоді як у GPT-3.5, навпаки, покращилась.

Наприклад, точність відповіді на питання, чи є 17077 простим числом, впала на 95,2% – тоді як у GPT-3.5 вона, навпаки, зросла з 7,4% до 86,8%. Також знизилась ймовірність успішного виконання коду, написаного нейромережею, в актуальних версіях обох моделей.

Раніше віце-президент OpenAI Пітер Веліндер вже відповідав на звинувачення користувачів ChatGPT Plus:

Ні, ми не зробили GPT-4 глупішим. Ми робимо кожну нову версію розумнішою за попередню. Зараз у нас є така гіпотеза: коли ви активніше використовуєте щось, ви починаєте помічати проблеми, яких раніше не бачили“.

У відповідь на цей твіт Веліндер попросив надати докази того, що чат-бот став працювати гірше. Дослідження від стенфордських вчених з’явилося через 5 днів після цього – і відповідь від OpenAI поки що не наступила.

Це вже не перший раз, коли GPT-4 звинувачують у наданні неправдивої інформації. У березні аналітики NewsGuard виявили, що ChatGPT, заснований на GPT-4, легше можна навчити говорити неправду – тоді як сама OpenAI говорить про збільшення точності відповідей на 40% у порівнянні з GPT-3.5. Зокрема, у тестах NewsGuard нова версія нейромережі рідше спростовувала недостовірні відомості – включаючи неправдиві дані про сучасні події та теорії змови.


Телеграм double.newsТелеграм double.news

Схожі Новини
Зумери почали використовувати ШІ для складних розмов

Зумери почали використовувати ШІ для складних розмов

Покоління зумерів активно інтегрує штучний інтелект у повсякденне життя, і тепер це стосується не лише навчання чи роботи. Молоді люди дедалі частіше використовують AI-чатботи, зокрема ChatGPT, для ведення складних розмов — від вибачень до завершення романтичних стосунків.
Детальніше
iPhone Fold

iPhone Fold може отримати проблему з відблисками екрана на сонці

Майбутній складаний смартфон від Apple, відомий як iPhone Fold, продовжує з’являтися в інсайдерських витоках і аналітичних звітах. Очікується, що компанія зробить ставку на новітні дисплейні технології, щоб забезпечити тонкий корпус, високу енергоефективність і мінімальну складку на екрані.
Детальніше
PlayStation Network

PlayStation Network зазнав масштабного збою

Мережа PlayStation Network зіткнулася з масштабним збоєм, який тимчасово позбавив користувачів доступу до ключових функцій сервісу. Проблеми вплинули як на запуск ігор, так і на онлайн-можливості консолей PlayStation.
Детальніше