QVABO STUDIO

🦾 AI побила все бенчмарки автономных кибервозможностей

Британский Институт безопасности ИИ (AISI) и Palo Alto Networks опубликовали данные, согласно которым Anthropic Claude Mythos Preview и OpenAI GPT-5.5 значительно превзошли предыдущие показатели автономного выполнения киберзадач. AISI отслеживал тренд удвоения временного горизонта 80% надежности с конца 2024 года - ранее этот показатель удваивался каждые 5 месяцев, что уже было вдвое быстрее, чем в ноябре 2025 года. Новые модели превзошли все прогнозируемые тренды.

🦾 AI побила все бенчмарки автономных кибервозможностей

Наиболее наглядные результаты получены на киберполигонах AISI - симуляциях многоэтапных атак на небольшие незащищенные корпоративные сети. Claude Mythos Preview стал первой моделью, завершившей оба полигона: 32-шаговую атаку «The Last Ones» в 6 из 10 попыток и ранее нерешаемый «Cooling Tower» в 3 из 10 попыток. GPT-5.5 справился с «The Last Ones» в 3 из 10 попыток. Palo Alto Networks подтвердила выводы: модели находят уязвимости и превращают их в критические эксплойты почти в реальном времени. Компания выпустила предупреждения по 26 CVE (75 проблем) против обычных 5 в месяц, выявленных при сканировании более 130 продуктов.

Полная версия — в Telegram

Читать пост полностью

~1 мин чтения · @qvabo_studio

В Telegram
Оригинал
Tier-1 пресса
Qvabo Studio
Редакция
Открыть в Telegram