Стара консоль Atari перемогла ChatGPT у шахах: AI не впорався з класикою 1978 року

Atari

У червні 2025 року інженер із Citrix Роберт Карузо влаштував шаховий матч між ChatGPT та емулятором останньої версії гри Video Chess для консолі Atari 2600 (1978). Результат: навіть на найпростіших налаштуваннях ChatGPT програв і «був абсолютно розгромлений». Про це пише PCMag.

Які були помилки AI

Карузо описав гру так:

«ChatGPT плутав тур із слоном, пропускав вилки пішаків та не міг відстежувати розташування фігур» .

Після цього модель пояснила поразку «абстрактністю піксельних іконок», проте і після переходу на стандартну шахову нотацію продовжувала допускати аналогічні помилки. Матч завершився зреченням ChatGPT приблизно через 90 хвилин.

Чому це перегралося?

Atari 2600 має неймовірно скромні технічні характеристики: процесор з частотою приблизно 1 MHz і менш ніж 128 байт оперативної пам’яті. Для порівняння, iPhone 15 Pro у понад 250 000 разів потужніший. А обчислювальні ресурси, що стоять за ChatGPT у хмарних дата-центрах OpenAI, взагалі перевищують можливості старої консолі на кілька порядків.

Водночас варто розуміти, що ChatGPT — це мовна модель, а не шаховий рушій. Вона не призначена для обробки логіки гри чи моделювання шахових позицій. Її сильна сторона — генерація тексту, а не точне розуміння правил ігрових систем.

Цей випадок став своєрідним прикладом переваги традиційних алгоритмів у спеціалізованих завданнях. Він чітко демонструє, що великі мовні моделі не завжди ефективні в умовах, які вимагають послідовної логіки та точного контролю над ігровим станом.

Реакція в спільноті

На Slashdot дискусію прокоментували так:

«ChatGPT не шаховий двигун… Якщо попросити випадкову людину зіткнутися з таким викликом — результат буде схожим» .

Дехто додав:

«Головна перевага ChatGPT — він працює на тексті, а не на розумінні шахів» .

Це обговорення підкреслює розрив між широкими мовними моделями і вузькоспеціалізованими алгоритмами, які фокусуються на певних завданнях.

Експеримент з Atari 2600 яскраво ілюструє обмеження мовних моделей: хоча AI здатен генерувати текст і давати корисні відповіді, у задачах, що вимагають чіткої логіки або моделювання стану (наприклад у шахах), класичні алгоритми залишаються ефективнішими.


Телеграм double.newsТелеграм double.news

Схожі Новини
Reddit

Reddit може запровадити Face ID для боротьби з ботами

Reddit розглядає можливість використання біометричної ідентифікації, зокрема Face ID та Touch ID, щоб підтвердити, що користувачі є реальними людьми. Ініціатива пов’язана зі стрімким зростанням кількості ботів і контенту, створеного штучним інтелектом.
Детальніше