xAI звинувачують у маніпуляціях з бенчмарками Grok-3

xAI

У лютому 2025 року компанія xAI представила Grok-3 — штучний інтелект нового покоління, який, за словами компанії, перевершує конкурентів, зокрема OpenAI та DeepSeek, у тестах з математики, науки та програмування. Представники xAI заявили, що їхня модель є “найрозумнішою AI-системою на ринку”.

Однак співробітник OpenAI, який побажав залишитися анонімним, звинуватив xAI у маніпуляціях із результатами бенчмарків. Він стверджує, що дані, оприлюднені xAI, не відповідають незалежним тестам та можуть вводити користувачів в оману. Це викликало хвилю обговорень у сфері штучного інтелекту щодо прозорості методів оцінки AI-моделей.

Експерти закликають до незалежних перевірок результатів та стандартизованих методів оцінки, щоб уникнути подібних ситуацій у майбутньому. Станом на зараз xAI не надала офіційних коментарів щодо цих звинувачень.


Телеграм double.newsТелеграм double.news

Схожі Новини
NASA

NASA знайшла зоряний пил, старший за Сонячну систему

Місія OSIRIS-REx від NASA, яка у 2020 році доставила зразки з астероїда Бенну, відкрила новий вимір у дослідженні походження Сонячної системи. Вчені виявили у зразках матерію, яка утворилася ще до появи нашої зоряної системи, — справжній зоряний пил.
Детальніше
Кодінг

Перший AI-шахрай PromptLocker виявився навчальним експериментом

Нещодавнє відкриття AI‑шахрай PromptLocker компанією ESET сколихнуло сферу кібербезпеки — однак виявилося, що тривога була передчасною. Насправді це не зовсім зловмисне ПЗ, а частина дослідницького проєкту “Ransomware 3.0”, створеного командою з Нью-Йоркського університету.
Детальніше