💻 BenchJack: ИИ-агенты научились «взламывать» бенчмарки, не решая задачи

Исследователи из UC Berkeley представили BenchJack — автоматизированную систему для аудита бенчмарков AI-агентов. Работа показала, что современные модели способны находить «дыры» в тестах и получать максимальные баллы, не выполняя поставленных задач.

В ходе эксперимента BenchJack протестировал 10 популярных бенчмарков в области разработки ПО, веб-навигации и работы с терминалом. Система выявила 219 различных уязвимостей, позволяющих агентам «накручивать» результаты. На большинстве тестов удалось достичь почти идеальных показателей без единого корректно решённого задания.

Полная версия — в Telegram

Читать пост полностью

~1 мин чтения · @qvabo_studio

В Telegram

Оригинал

Tier-1 пресса

OpenAI · Anthropic · The Verge

Qvabo Studio

Редакция

💻 BenchJack: ИИ-агенты научились «взламывать» бенчмарки, не решая задачи

Читать пост полностью

Ещё в ленте

💵 Figma отчиталась за Q1: выручка растёт, но рынок сомневается

❗️CHAL: новая архитектура для дебатов ИИ на основе иерархических агентов

🔨 Настоящие проигравшие в суде Маска против Альтмана

🕶 Graphon AI выходит из тени с $8,3 млн на создание недостающего слоя данных для LLM

🤖 Физический AI выходит на заводы: компании тестируют человекоподобных роботов

Perplexity запускает коннектор к Snowflake для запросов на естественном языке

🤖 Когда ИИ начнёт строить себя сам: стартап Ричарда Сокера на $650 млн

👩‍⚕️ Аудитория Онтарио выявила, что ИИ-секретари врачей выдумывают данные

☁️ Amazon Bedrock AgentCore получил поддержку корпоративных политик Chrome для управления браузером ИИ-агентов

❗️ Неожиданный баг в ClickHouse замедлил биллинг Cloudflare

❓ Готовность данных для агентного ИИ в финансовом секторе