
Лабораторія Google DeepMind презентувала інноваційні моделі Gemini Robotics 1.5 та Gemini Robotics-ER 1.5 на базі своєї флагманської ШІ-платформи. Керівниця відділу робототехніки Кароліна Парада пояснила, що ці алгоритми допомагають розумним машинам планувати власні дії на кілька кроків уперед та ефективно орієнтуватися у реальному фізичному просторі. Про це розробники оголосили у вересні 2025 року.
Раніше роботи вміли виконувати лише одну просту вказівку за один сеанс. Тепер машини самостійно розв’язують комплексні побутові задачі. Наприклад, маніпулятори сортують білизну за кольорами, складають валізу під прогноз погоди конкретного міста або розподіляють відходи на органіку, пластик та макулатуру, використовуючи для цього пошукову систему Google.
Двоступенева архітектура мислення роботів від Google
Перший етап обробки інформації бере на себе система Gemini Robotics-ER 1.5. Цей цифровий мозок сканує простір навколо. Він розпізнає зображення, читає текстові підказки та за потреби звертається до Google Search за відсутніми даними. Зібравши докупи всі відомості, алгоритм складає детальний покроковий алгоритм дій для вирішення завдання.
На наступному кроці модель Gemini Robotics 1.5 перетворює текстові інструкції на фізичні рухи. Вона узгоджує візуальні дані із мовним контекстом для точного позиціонування маніпуляторів. Провідний інженер Google DeepMind Канішка Рао вважає головним проривом саме здатність машини спочатку обдумати завдання, а вже потім починати його виконання.
Основні сфери застосування нових моделей робототехніки:
- Домашнє господарство: роботи розкладають одяг, сортують білизну та допомагають із прибиранням.
- Логістика та склади: розумні маніпулятори пакують коробки та валізи з оптимальним використанням простору.
- Екологічний менеджмент: системи автоматично розпізнають типи сміття та розділяють відходи на фракції.
| Характеристика моделі | Gemini Robotics-ER 1.5 | Gemini Robotics 1.5 |
|---|---|---|
| Роль у системі | Аналіз середовища та планування | Безпосереднє керування моторикою |
| Джерела інформації | Камери, текстові промпти, пошук Google | Покрокові інструкції від ER-моделі |
| Головний результат роботи | Створення детального плану дій | Точний рух механічних кінцівок |
Розробники також реалізували унікальну технологію міжплатформного навчання. Відтепер робот однієї конструкції може миттєво передати свій досвід машині з абсолютно іншою будовою тіла. Наприклад, якщо дворукий робот ALOHA2 навчився застібати блискавку, то маніпулятор Franka або великий гуманоїд Apollo автоматично скопіюють цю навичку без додаткового програмування.
Підсумок
У вересні 2025 року компанія Google DeepMind презентувала інтелектуальні моделі Gemini Robotics 1.5 та Gemini Robotics-ER 1.5, які дозволяють роботам планувати складні дії перед їх виконанням. Завдяки цій технології машини можуть самостійно сортувати речі, аналізувати погоду через інтернет для пакування валіз та розподіляти побутове сміття. Крім того, нова система підтримує міжплатформне навчання, що дозволяє роботам ALOHA2, Franka та Apollo легко обмінюватися навичками незалежно від конструктивних особливостей маніпуляторів.

