Технології

DeepSeek відкриває вихідний код своїх AI-моделей, посилюючи прихильність до відкритого програмного забезпечення

22.02.2025

Китайський стартап DeepSeek оголосив про публічний доступ до частини своїх кодових репозиторіїв, демонструючи прозорість та підтримку спільноти розробників.

Цей крок спрямований на підвищення прозорості та залучення спільноти розробників до вдосконалення їхніх AI-моделей. У повідомленні на платформі X компанія зазначила, що наступного тижня відкриє п’ять репозиторіїв, назвавши це “невеликим, але щирим прогресом”, який вони готові поділитися “з повною прозорістю”.

Раніше DeepSeek здивував AI-спільноту, випустивши відкриту модель R1, яка за продуктивністю конкурує із західними аналогами, при цьому розроблена з меншими витратами. Цей крок підкреслює відмінність DeepSeek від багатьох AI-компаній у Китаї та США, які зазвичай обирають закриті моделі. Засновник компанії, Лян Веньфен, вважає, що відкритий код має більше культурне значення, ніж комерційне, оскільки сприяє повазі та інноваціям у спільноті.

Окрім цього, DeepSeek нещодавно представив новий алгоритм під назвою Native Sparse Attention, розроблений для підвищення ефективності навчання та обробки довгих контекстів. Завдяки таким ініціативам компанія зміцнила свої позиції, залучивши 22,2 мільйона активних користувачів щодня, що робить її провідним чат-ботом у Китаї.

Цей крок DeepSeek може мати значний вплив на спільноту розробників, надаючи їм можливість детально ознайомитися з внутрішньою роботою їхніх AI-моделей та сприяти подальшим інноваціям у галузі штучного інтелекту.

DeepSeek

Схожі Новини

Технології

Anthropic додала в Claude функцію віддаленого керування комп’ютером

Anthropic представила нову функцію для свого чат-бота Claude, яка дозволяє штучному інтелекту керувати комп’ютером користувача. Інструмент уже доступний у тестовому режимі для підписників Claude Pro та Max і працює на macOS.

1 годину тому

Детальніше

Технології

OnePlus може скоротити присутність на глобальних ринках

Навколо OnePlus знову з’явилися чутки про можливе скорочення діяльності на ключових міжнародних ринках. За інформацією інсайдерів, компанія може переглянути свою глобальну стратегію, що потенційно вплине на присутність бренду в США, Європі та Індії.

3 години тому

Детальніше

Технології

Grammarly використовує імена журналістів у AI без згоди

Сервіс перевірки текстів Grammarly опинився в центрі критики через нову функцію «Expert Review», яка використовує імена відомих журналістів, науковців і письменників без їхнього дозволу. Про проблему повідомили The Verge, виявивши, що AI генерує поради, нібито натхненні реальними людьми.

3 години тому

Детальніше

GTA VI коштуватиме до $80: Take-Two спростувала чутки про $100

Anthropic додала в Claude функцію віддаленого керування комп’ютером

Постігрова депресія: як відеоігри впливають на емоційний стан гравців

Популярні Теги

DeepSeek відкриває вихідний код своїх AI-моделей, посилюючи прихильність до відкритого програмного забезпечення