Nvidia створила ШІ для генерації GIF

Тепер, коли ChatGPT та Midjourney стали майже мейнстрімом, наступною великою гонкою штучного інтелекту стають генератори відео з тексту. Nvidia нещодавно продемонструвала деякі технології, які можуть вивести ваші GIFки на новий рівень.

Моделі латентного розсіювання (або LDM) – це тип штучного інтелекту, який може генерувати відео без потреби в величезній обчислювальній потужності. Nvidia стверджує, що її технологія робить це додаючи “тимчасовий вимір до моделі латентного розсіювання в просторі”.

Іншими словами, генеративний штучний інтелект може заставляти нерухомі зображення рухатися реалістично та масштабувати їх за допомогою технік суперроздільності. Він може створювати короткі відео тривалістю 4,7 секунди з роздільною здатністю 1280×2048 або довші відео з нижчою роздільною здатністю 512×1024.

Звичайно, в технології є великі перспективи, такі як автоматична екранізація фільмів, але на цьому етапі конвертація тексту у GIF здається найбільш “робочім” варіантом використання.

Прості підказки, такі як “штурмовик пилососить на пляжі” та “плюшеве ведмежа грає на електрогітарі, висока чіткість, 4K”, дають досить хороші результати, хоча інколи при роботі з ШІ виникають артефакти та морфінг.


Телеграм double.newsТелеграм double.news

Схожі Новини
Drive and Listen

Drive and Listen: катайтесь вулицями Лондона, Берліна, Токіо та слухайте місцеве радіо

Уявіть, що ви їдете вузькими вуличками Парижа, швидкісними магістралями Лос-Анджелеса чи серед жвавого натовпу Токіо, а з динаміків лунає місцеве радіо. Вам не потрібно бронювати квитки чи збирати валізи – усе це можливо завдяки сервісу Drive and Listen.
Детальніше
QR код

Як сканувати QR-код за допомогою смартфона: швидка інструкція

QR-коди давно стали частиною повсякденного життя — від меню в кафе до швидкої авторизації в застосунках. Але не всі знають, як правильно їх сканувати зі свого смартфона. У цій статті пояснюємо, як це зробити на iPhone та Android, без додаткових програм.
Детальніше