
Поки фінансові аналітики сперечаються про бульбашку штучного інтелекту та загрозу перевищення інвестицій, лідери ІТ-ринку зіткнулися з прозаїчною проблемою: інфраструктура просто не встигає за апетитами користувачів. Google, OpenAI та інші гіганти змушені нарощувати обчислювальні ресурси з рекордною швидкістю. Про це повідомляє видання ArsTechnica.
Під час закритих зборів компанії на початку листопада очільник департаменту ШІ-інфраструктури Google Амін Вахдат заявив підлеглим, що корпорація мусить подвоювати потужності своїх серверів кожні шість місяців. Згідно з прогнозами, які оприлюднило медіа CNBC, протягом найближчих 4-5 років пропускна здатність сервісів Google має зрости у 1000 разів.
| Параметр масштабування | Ціль та обмеження Google |
|---|---|
| Швидкість подвоєння потужностей | Кожні 6 місяців |
| Загальне зростання за 4–5 років | У 1000 разів |
| Фінансові ліміти | Витрати мають залишатися в межах поточного бюджету (без пропорційного зростання витрат) |
| Основні перешкоди | Дефіцит відеокарт (GPU), дефіцит та висока вартість електроенергії, складність охолодження дата-центрів |
| Шляхи вирішення | Оптимізація коду, розробка власних ШІ-чіпів (TPU) та покращення енергоефективності алгоритмів |
Жорсткі ліміти: як вирости в тисячу разів без додаткових витрат
Головна складність полягає в тому, що розширювати інфраструктуру доведеться без роздування бюджету. За словами Вахдата, компанія має вкластися у наявні ліміти витрат та енергоспоживання. Просте додавання нових серверів більше не працює — на заваді стають дефіцит площ, шалені рахунки за електрику та брак систем охолодження.

Додатковим викликом є глобальний дефіцит графічних процесорів (GPU), на яких навчають та запускають нейромережі. Щоб вирішити цю задачу, Google робитиме ставку на оптимізацію алгоритмів (щоб моделі потребували менше ресурсів) та розвиток власних тензорних чипів (TPU).
Підсумок
Техногігант Google планує подвоювати обчислювальні потужності для штучного інтелекту кожні шість місяців, щоб задовольнити зростаючий попит. Керівництво компанії прогнозує масштабування серверної інфраструктури в 1000 разів протягом 4-5 років без пропорційного збільшення бюджету. Основними драйверами росту стануть оптимізація алгоритмів нейромереж та активне впровадження власних процесорів TPU.

