Gemini у дії: у Google Фото з’явилося редагування знімків голосовими командами

Логотип сервісу Google Фото на мобільному пристрої

Компанія Google офіційно презентувала нову функцію розмовного редагування зображень у фірмовому додатку Google Фото. Відтепер користувачам не потрібно вручну шукати повзунки налаштувань чи виділяти пальцем об’єкти на екрані. Достатньо голосом або текстом описати бажаний результат, а вбудований штучний інтелект самостійно виконає всю роботу. Першими випробувати нову опцію зможуть власники смартфонів Pixel 10 у США, після чого розробники розгорнуть її на інших Android-пристроях та iOS.

Як працює редагування через діалог із Gemini

Оновлений редактор Google Фото інтегрували з мультимодальними моделями штучного інтелекту Gemini. Завдяки цьому додаток тепер розуміє природну людську мову, контекст та складні інструкції.

Користувач може давати ШІ як прості команди (наприклад, «прибери випадкових перехожих на тлі» або «зроби кольори яскравішими»), так і комбінувати кілька завдань в одному запиті: «видали відблиски від скла, заміни небо на захід сонця та зроби фото теплішим». Окрім корекції дефектів, система підтримує генеративне домальовування: зміну фону, додавання нових об’єктів за текстовим описом або повну стилізацію зображення. Процес можна вести поетапно, розпочавши з простої фрази «зроби краще» та уточнюючи деталі у процесі діалогу.

Технологія захисту контенту C2PA Content Credentials
Інструмент редагування Принцип роботи Рівень автоматизації
Класичні повзунки Ручне налаштування яскравості, контрасту, експозиції Низький (повністю ручна робота)
Magic Eraser (Чарівна гумка) Виділення пальцем зайвих об’єктів для їх видалення Середній (вимагає ручного виділення)
Magic Editor (Чарівний редактор) Переміщення об’єктів та базове генеративне заповнення Високий (вимагає жестів на екрані)
Голосове редагування (Gemini) Текстовий або голосовий запит природною мовою Максимальний (ШІ сам аналізує кадр та вносить зміни)

Маркування змін та технологія C2PA

Масштабне впровадження генеративного ШІ для редагування фотографій викликає занепокоєння щодо автентичності зображень. Щоб зберегти довіру до цифрового контенту, Google інтегрував у додаток підтримку міжнародного стандарту C2PA Content Credentials.

Це цифровий водяний знак безпеки, який записує метадані про походження файлу. Будь-який користувач зможе перевірити історію знімка безпосередньо в Google Фото: чи був він зроблений на фізичну камеру, які ШІ-інструменти використовували для редагування та чи додавалися на зображення неіснуючі генеративні елементи.

Підсумок

Google додає в додаток Google Фото функцію розмовного редагування зображень на базі моделей Gemini, що дозволяє обробляти кадри за допомогою голосових або текстових запитів. Користувачі зможуть видаляти об’єкти, змінювати фон та налаштовувати кольори без використання ручних інструментів. Для гарантування прозорості Google впроваджує технологію маркування C2PA Content Credentials, яка зберігає історію редагування файлу.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше