Технології

xAI звинувачують у маніпуляціях з бенчмарками Grok-3

23.02.2025

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.

Grok 3

Схожі Новини

Технології

Apple готує новий iPad з чипом A18: запуск очікується до літа 2026

Apple продовжує оновлювати свою лінійку пристроїв, і наступним на черзі стане базовий iPad. Компанія планує представити нову модель з чипом A18 уже в першій половині 2026 року.

16 хвилин тому

Детальніше

Технології

Reddit може запровадити Face ID для боротьби з ботами

Reddit розглядає можливість використання біометричної ідентифікації, зокрема Face ID та Touch ID, щоб підтвердити, що користувачі є реальними людьми. Ініціатива пов’язана зі стрімким зростанням кількості ботів і контенту, створеного штучним інтелектом.

1 годину тому

Детальніше

Apple готує новий iPad з чипом A18: запуск очікується до літа 2026

Reddit може запровадити Face ID для боротьби з ботами

Samsung інтегрує AirDrop у Quick Share для передачі файлів з Apple

xAI звинувачують у маніпуляціях з бенчмарками Grok-3

Схожі Новини