MacWhisper навчилося перетворювати розмови в текст за кілька секунд

MacWhisper

Програма MacWhisper, відома як один із найзручніших способів транскрипції аудіо на комп’ютерах Mac, отримала потужне оновлення. Тепер вона підтримує Parakeet — надшвидку модель штучного інтелекту від Nvidia, яка здатна обробляти до 60 хвилин аудіо всього за одну секунду (за наявності відповідного графічного процесора). Про це пише 9to5Mac.

Що таке модель Parakeet?

Parakeet — це новітня модель автоматичного розпізнавання мовлення від Nvidia, представлена у травні 2025 року. Вона обіцяє феноменальну швидкість транскрипції, зокрема при використанні таких GPU як A100, H100, T4 або V100.

До цього часу Parakeet була доступна переважно через open-source інструменти, що вимагали командного рядка та налаштувань вручну. Проте з виходом оновлення MacWhisper 1.3 цю технологію інтегровано у зручний інтерфейс для користувачів macOS.

Переваги нового оновлення MacWhisper

Завдяки співпраці з командою Argmax, MacWhisper тепер надає змогу Pro-користувачам використовувати Parakeet напряму в застосунку. За словами розробника Жорді Бруїна, результат — справді вражаючий:

«MacWhisper тепер підтримує модель Parakeet. Ми змогли транскрибувати 30-хвилинний подкаст менше ніж за 8 секунд», — зазначив Бруїн.

У тесті на MacBook Pro з чіпом M2 Pro застосунок обробив 3-годинний випуск подкасту за 1 хвилину 22 секунди, включаючи розпізнавання мовців.

Parakeet проти Whisper: технологічна еволюція

Whisper — серія моделей OpenAI, яка стала проривом у транскрипції у 2022–2023 роках, — поступово відходить у минуле. Зосередившись на GPT‑4o та нових комерційних напрямках, OpenAI припинила розвиток Whisper, відкривши простір для нових гравців.

Parakeet — яскравий приклад цієї нової хвилі. Її продуктивність перевершує попередні моделі і дає змогу здійснювати транскрипцію у режимі, близькому до реального часу.

Обмеження та плани на майбутнє

На момент запуску Parakeet у MacWhisper підтримує лише англійську мову. Проте розробники обіцяють багатомовну версію найближчим часом.

Також слід враховувати, що функціональність доступна лише у платній версії MacWhisper Pro.


Телеграм double.newsТелеграм double.news

Схожі Новини
TikTok

Регулятори ЄС визнали нескінченну стрічку TikTok надто залежною

Європейські регулятори посилюють тиск на TikTok через дизайн платформи, який, на їхню думку, формує залежну поведінку користувачів. Попередні висновки Європейської комісії свідчать, що ключові механіки застосунку можуть порушувати вимоги законодавства ЄС у сфері цифрових сервісів.
Детальніше
Apple CarPlay

Apple дозволить використовувати сторонні AI-чатботи в CarPlay

Apple готується відкрити свою автомобільну платформу CarPlay для сторонніх голосових чат-ботів зі штучним інтелектом. Це стане першим випадком, коли користувачі зможуть напряму взаємодіяти з AI-сервісами інших компаній через вбудований інтерфейс автомобіля.
Детальніше
bithumb

Криптобіржа помилково роздала біткоїнів на $44 млрд клієнтам

Одна з найбільших криптовалютних бірж Південної Кореї опинилася в центрі гучного інциденту через технічну помилку під час рекламної кампанії. Платформа випадково нарахувала користувачам сотні тисяч біткоїнів замість символічних грошових бонусів, що призвело до різких коливань курсу та тимчасового обмеження торгів
Детальніше