Стара консоль Atari перемогла ChatGPT у шахах: AI не впорався з класикою 1978 року

Atari

У червні 2025 року інженер із Citrix Роберт Карузо влаштував шаховий матч між ChatGPT та емулятором останньої версії гри Video Chess для консолі Atari 2600 (1978). Результат: навіть на найпростіших налаштуваннях ChatGPT програв і «був абсолютно розгромлений». Про це пише PCMag.

Які були помилки AI

Карузо описав гру так:

«ChatGPT плутав тур із слоном, пропускав вилки пішаків та не міг відстежувати розташування фігур» .

Після цього модель пояснила поразку «абстрактністю піксельних іконок», проте і після переходу на стандартну шахову нотацію продовжувала допускати аналогічні помилки. Матч завершився зреченням ChatGPT приблизно через 90 хвилин.

Чому це перегралося?

Atari 2600 має неймовірно скромні технічні характеристики: процесор з частотою приблизно 1 MHz і менш ніж 128 байт оперативної пам’яті. Для порівняння, iPhone 15 Pro у понад 250 000 разів потужніший. А обчислювальні ресурси, що стоять за ChatGPT у хмарних дата-центрах OpenAI, взагалі перевищують можливості старої консолі на кілька порядків.

Водночас варто розуміти, що ChatGPT — це мовна модель, а не шаховий рушій. Вона не призначена для обробки логіки гри чи моделювання шахових позицій. Її сильна сторона — генерація тексту, а не точне розуміння правил ігрових систем.

Цей випадок став своєрідним прикладом переваги традиційних алгоритмів у спеціалізованих завданнях. Він чітко демонструє, що великі мовні моделі не завжди ефективні в умовах, які вимагають послідовної логіки та точного контролю над ігровим станом.

Реакція в спільноті

На Slashdot дискусію прокоментували так:

«ChatGPT не шаховий двигун… Якщо попросити випадкову людину зіткнутися з таким викликом — результат буде схожим» .

Дехто додав:

«Головна перевага ChatGPT — він працює на тексті, а не на розумінні шахів» .

Це обговорення підкреслює розрив між широкими мовними моделями і вузькоспеціалізованими алгоритмами, які фокусуються на певних завданнях.

Експеримент з Atari 2600 яскраво ілюструє обмеження мовних моделей: хоча AI здатен генерувати текст і давати корисні відповіді, у задачах, що вимагають чіткої логіки або моделювання стану (наприклад у шахах), класичні алгоритми залишаються ефективнішими.


Телеграм double.newsТелеграм double.news

Схожі Новини
Nothing Phone 1

Nothing OS 4.0 виходить цього місяця, а для Phone 1 готують сюрприз

Nothing почала тизерну кампанію свого нового оновлення Nothing OS 4.0, побудованого на Android 16. За офіційними обіцянками, реліз відбудеться у вересні 2025 року, і, схоже, компанія планує дотриматися строків. Водночас генеральний директор Nothing Карл Пей натякнув на спеціальну програму для власників першого смартфона компанії — Nothing Phone 1.
Детальніше
Microsoft Store

Microsoft відкриває публікацію додатків у Windows Store без комісій для розробників

Microsoft скасувала одноразовий платіж для публікації додатків у Microsoft Store, зробивши платформу ще доступнішою для індивідуальних розробників у майже 200 країнах. Відтепер для реєстрації достатньо лише особистого облікового запису Microsoft — ані плати, ані банківської картки не потрібно.
Детальніше
Sony PlayStation

PlayStation запустила мобільний додаток для батьківського контролю на PS5 і PS4

PlayStation представила новий мобільний додаток PlayStation Family, створений для допомоги батькам у контролі за ігровим часом дітей на консолях PlayStation 5 та PlayStation 4. Тепер батьки можуть ще зручніше керувати доступом до ігор, переглядати звіти про активність і встановлювати обмеження — просто зі свого смартфона.
Детальніше