Удар у відповідь: OpenAI випустила GPT-5.2 для протидії Google Gemini 3

Інтерфейс ChatGPT на екрані мобільного телефону, знімок Getty Images

Компанія OpenAI офіційно оголосила про запуск своєї нової мовної моделі GPT-5.2. Розробники стверджують, що це оновлення наближає технологію до створення повноцінного штучного загального інтелекту (AGI). Система навчилася набагато краще аналізувати довгий контекст, писати код та діяти автономно як ШІ-агент.

Новинка виходить на ринок одразу у трьох варіаціях: Instant (для швидких відповідей), Thinking (для складних обчислень) та Pro (для розробників та професіоналів).

Краща за людей: прорив у професійних тестах

Головним досягненням нової моделі став результат у професійному тесті GDPval, який перевіряє вміння ШІ виконувати роботу представників 44 різних спеціальностей. За результатами “сліпих” тестувань, версія GPT-5.2 Thinking випередила або показала рівні результати з реальними експертами у 70,9% випадків.

Графік результатів тесту GDPval для різних професійних завдань

Вона створює фінансові таблиці, макетує презентації та пише технічну документацію в 11 разів швидше за середнього офісного працівника. При цьому вартість її послуг становить менше 1% від оплати праці фахівця.

Технічні оновлення та кодування

Розробники суттєво допрацювали інженерний потенціал системи:

  • SWE-Bench Pro: У тесті на написання реального коду модель продемонструвала рекордні 55,6% успішних рішень.
  • Робота з візуальним контентом: ШІ вдвічі точніше розпізнає графіки, дашборди та складні мікросхеми.
  • Рівень галюцинацій: Показник вигадування неіснуючих фактів знизився на 30% порівняно з попередньою версією.
  • Контекстне вікно: У бенчмарку MRCRv2 на перевірку довготривалої логіки модель показала майже 100% точність при обробці документів обсягом до 256 000 токенів.
Графік результатів тесту SWE-Bench Pro, порівняння мовних моделей

Боротьба за лідерство: відповідь на реліз Google Gemini 3

Вихід нової версії GPT-5.2 став реакцією на посилення конкуренції. У листопаді Google презентувала свою флагманську модель Gemini 3, яка тимчасово захопила лідерство в галузевих чартах.

Голова OpenAI Сем Альтман підтвердив, що компанія запровадила внутрішній режим надзвичайного стану (code red) для прискорення розробки. Проте в інтерв’ю CNBC він заявив, що реальний вплив конкурента на бізнес-показники OpenAI виявився переоціненим.

Партнерами запуску вже стали такі гіганти, як Notion, Zoom, Shopify та Databricks, які інтегрували GPT-5.2 у свої внутрішні сервіси.

Порівняємо основні версії моделі GPT-5.2:

Версія моделі Основне призначення Ключова особливість
GPT-5.2 Instant Швидке спілкування, прості повсякденні запити Мінімальна затримка відповіді при низькій вартості
GPT-5.2 Thinking Складний аналіз, математика, написання коду Використання ланцюжків міркувань (Chain of Thought) перед відповіддю
GPT-5.2 Pro Масштабні проекти, промислове програмування Максимальне контекстне вікно та підвищена точність генерації

Підсумок

Компанія OpenAI випустила модель GPT-5.2 у версіях Instant, Thinking та Pro для розробників та користувачів ChatGPT Plus. Нова нейромережа вперше перевершила експертів-людей у тесті професійної компетентності GDPval у 70,9% випадків та встановила рекорд у тесті програмування SWE-Bench Pro на рівні 55,6%. Реліз став відповіддю на запуск Google Gemini 3, для чого керівництво OpenAI навіть впроваджувало внутрішній режим тривоги “code red”.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше