Вийшло оновлення для ШІ з генерації зображень – Stable Diffusion XL


Одна з найвідоміших нейромереж, що створює зображення за текстовим запитом, нещодавно отримала значне оновлення. Основна перевага Stable Diffusion полягає в можливості її локального запуску на пристрої і створення зображень безкоштовно без потреби в підключенні до Інтернету. Цю задачу вдається виконати не тільки потужним комп’ютерам, але навіть iPhone, починаючи з 11 моделі.

Нове покоління нейромережі Stable Diffusion XL 1.0 (SDXL) дозволяє генерувати більш деталізовані зображення з основним роздільною здатністю 1024 × 1024. Було також поліпшено коліропередачу, контрастність та обробку тіней. З цікавих інновацій з’явилась можливість генерувати читабельні написи та каліграфію. Раніше доводилося сподіватися на щось, що лише віддалено нагадує текст.

Оскільки Stable Diffusion працює локально, цензурувати результати її роботи практично неможливо. Але з цим оновленням розробники намагалися дещо обмежити можливість генерування шкідливого контенту, очистивши набір даних для навчання моделі.

Що ще варто знати про використання SDXL 1.0 локально

Попри те, що Stable Diffusion XL 1.0 став ще потужнішим, успішне використання моделі локально потребує врахування кількох технічних аспектів. Насамперед, слід мати відповідне програмне забезпечення, наприклад, Automatic1111 WebUI, яке забезпечує зручний інтерфейс для взаємодії з моделлю. Це ПЗ дозволяє легко вводити текстові запити, керувати параметрами генерації, а також зберігати результати.

Ресурси пристрою також мають значення:

• Графічна карта з підтримкою CUDA (для користувачів Windows/Linux з NVIDIA GPU) або Metal (на Mac) значно прискорює генерацію.

• Мінімум 6–8 ГБ відеопам’яті дозволяє створювати зображення у високій якості без збоїв.

Для мобільних користувачів, які запускають SDXL на iPhone, існують адаптовані додатки, такі як Draw Things, що дозволяють завантажити модель і створювати зображення безпосередньо на смартфоні. Хоча продуктивність буде нижчою, це відкриває нові можливості для мобільної творчості навіть без доступу до ПК.

Також варто пам’ятати про можливість донавчання (fine-tuning) моделі під власні запити або стилі, що робить Stable Diffusion надзвичайно гнучким інструментом для ілюстраторів, дизайнерів і контент-креаторів.


Телеграм double.newsТелеграм double.news

Схожі Новини
Reddit

Reddit може запровадити Face ID для боротьби з ботами

Reddit розглядає можливість використання біометричної ідентифікації, зокрема Face ID та Touch ID, щоб підтвердити, що користувачі є реальними людьми. Ініціатива пов’язана зі стрімким зростанням кількості ботів і контенту, створеного штучним інтелектом.
Детальніше
Galaxy s26

Samsung інтегрує AirDrop у Quick Share для передачі файлів з Apple

Samsung оголосила про запуск нової функції, яка значно розширює можливості обміну файлами між різними екосистемами. Власники смартфонів серії Galaxy S26 отримають підтримку AirDrop через Quick Share — стандартний інструмент для передачі даних на Android.
Детальніше
Ілон Маск

Ілон Маск анонсував Terafab — найбільший завод з виробництва чипів

Ілон Маск оголосив про запуск амбітного проєкту Terafab — масштабного виробництва напівпровідників, яке може стати найбільшим у світі. Ініціатива об’єднує ресурси трьох компаній: Tesla, SpaceX та xAI, і має на меті вирішити дефіцит обчислювальних потужностей для майбутніх технологій.
Детальніше