QVABO STUDIO

🆕 VeGAS: новый метод повышения надежности воплощенных AI-агентов

Исследователи представили Verifier-Guided Action Selection (VeGAS) — фреймворк для тестирования, повышающий устойчивость мультимодальных LLM (MLLM) в задачах управления физическими агентами. Вместо выбора единственного действия на каждом шаге, VeGAS генерирует набор кандидатов и использует специальный верификатор для выбора наилучшего.

🆕 VeGAS: новый метод повышения надежности воплощенных AI-агентов

Ключевая находка: использование стандартного MLLM в качестве верификатора не дает улучшений. Авторы разработали LLM-управляемую стратегию синтеза данных, автоматически создающую разнообразный набор сценариев ошибок для обучения верификатора.

Полная версия — в Telegram

Читать пост полностью

~1 мин чтения · @qvabo_studio

В Telegram
Оригинал
Tier-1 пресса
Qvabo Studio
Редакция
Открыть в Telegram