
Поява штучного загального інтелекту (AGI), який зрівняється з людиною за розумовими здібностями або перевершить її, може відбутися значно швидше, ніж ми очікували. Провідна ШІ-лабораторія Google DeepMind опублікувала масштабне 108-сторінкове дослідження, в якому прогнозує реліз перших версій AGI вже до 2030 року. Команда під керівництвом співзасновника компанії Шейна Легга не лише окреслила неймовірні перспективи технології, а й детально описала сценарії, за якими надінтелект може вийти з-під контролю та поставити під загрозу існування людської цивілізації. Про це пише видання Ars Technica.
Чотири вершники ШІ-апокаліпсису за версією DeepMind
Дослідники проаналізували десятки теоретичних загроз та структурували їх у чотири основні групи ризиків. Кожна категорія потребує розробки унікальних інженерних та законодавчих протоколів безпеки.
Чотири головні категорії ризиків розвитку AGI:
| Категорія ризику | Опис кібер- чи соціальної загрози | Запропоноване DeepMind рішення |
|---|---|---|
| Зловживання (Misuse) | Використання AGI хакерами чи терористами для написання вірусів та створення біологічної зброї. | Технологія «відучування» (unlearning) моделі небезпечних знань. |
| Невідповідність (Misalignment) | Прийняття ШІ логічних, але катастрофічних для людей рішень всупереч намірам творців. | Каскадний взаємний контроль моделей та віртуальні «пісочниці» із кнопкою вимкнення. |
| Критичні помилки (Errors) | Збої алгоритмів, галюцинації та хибні дії при інтеграції ШІ у військові та логістичні системи. | Жорстке обмеження автономії ШІ, обов’язкова верифікація команд людиною. |
| Структурні ризики (Structural) | Дестабілізація світових фінансових ринків та параліч суспільства через створення надреалістичної дезінформації. | Координація міжнародних інституцій та спільне регулювання розробки. |
Технічні методи стримування AGI
Найбільшою болячкою розробників залишається проблема невідповідності (alignment). Щоб запобігти виходу алгоритмів з-під контролю, DeepMind пропонує концепцію «підсиленого нагляду», коли кілька незалежних мовних моделей перевіряють логіку рішень одна одної. Також науковці працюють над теоретичними методами безпеки «після навчання» (post-training safety). Водночас представники команди Google Gemini зазначають, що хоча сучасні нейромережі демонструють дивовижні результати, точна відстань до створення повноцінного AGI залишається предметом дискусій.
Підсумок
Дослідницька лабораторія Google DeepMind опублікувала 108-сторінковий звіт, в якому оцінює ймовірність появи штучного загального інтелекту (AGI) до 2030 року та аналізує чотири головні загрози: зловживання технологією зловмисниками, невідповідність цілей ШІ людським цінностям, системні збої та макроструктурну дестабілізацію суспільства. Для стримування ризиків інженери пропонують впровадження каскадного взаємного моніторингу моделей, технології вибіркового стирання небезпечних знань (unlearning) та жорстке обмеження доступу ШІ до критичної інфраструктури без схвалення оператора.

