Microsoft перевірила, як ШІ працює без людини

Microsoft AI

Microsoft провела масштабний експеримент, створивши штучне онлайн-середовище “Magentic Marketplace”, щоб дослідити, як ШІ-агенти діють без участі людини. Модель імітувала реальний інтернет-магазин, у якому агенти-покупці взаємодіяли з агентами-продавцями, виконуючи завдання торгівлі, переговорів і вибору товарів.

Як з’ясувалося, результати експерименту виявилися далекими від ідеалу — автономні моделі показали слабку здатність до ухвалення рішень, координації та самостійної роботи. Про це пише TechRadar.

Як працював експеримент “Magentic Marketplace”

За словами дослідників Microsoft, у тестовому середовищі діяли 100 покупців-агентів і 300 бізнес-агентів, які використовували передові моделі ШІ — GPT-4o, GPT-5 і Gemini-2.5-Flash.

Метою було перевірити, наскільки ефективно ШІ зможе діяти у складній ринковій екосистемі без втручання людини. Усі взаємодії відбувалися в симульованих умовах, а вихідний код платформи компанія опублікувала у відкритому доступі, щоб інші дослідники могли повторити експеримент або розширити його.

Що виявив експеримент Microsoft

Результати експерименту виявили низку суттєвих обмежень сучасних ШІ-моделей: покупці-агенти легко піддавалися впливу продавців, що свідчить про їхню вразливість до маніпуляцій. Коли кількість варіантів збільшувалася, ефективність рішень різко знижувалася, а під час колективних завдань системи не могли розподілити ролі між агентами, що призводило до хаотичної роботи. Ефективність моделей покращувалася лише за умови чітких покрокових інструкцій від людини.

“Без нагляду ШІ не впорається” — висновок Microsoft

Директорка Microsoft Research’s AI Frontiers Lab зазначила:

“Ми можемо давати моделям покрокові інструкції, але якщо ми тестуємо їхню здатність до співпраці, ці навички повинні бути в них спочатку”.

Вона підкреслила, що результати експерименту демонструють: нинішнім ШІ-агентам необхідна суттєва людська підтримка та контроль, особливо у багатокористувацьких або конкурентних середовищах.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше