2603.01213

📖 Источник: arxiv.org

Способны ли LLM-агенты достигать консенсуса? Исследование Byzantine-согласия

Введение

Крупные языковые модели всё чаще используются как автономные агенты, которые должны совместно принимать решения. Однако исследователи из ETH Zurich обнаружили, что надёжное достижение консенсуса не является устойчивой способностью современных LLM-агентов — даже в благоприятных условиях без вредоносных участников. Эксперименты показывают, что группы агентов на базе Qwen3 часто не могут договориться о едином значении, а добавление даже одного Byzantine-агента (намеренно нарушающего протокол) резко снижает вероятность успеха.

Экспериментальная установка

Исследователи использовали симулятор A2A-Sim с синхронной сетью «все к каждому». N агентов должны достичь согласия о скалярном значении в диапазоне от 0 до 50. Каждый агент — это LLM, который получает краткую текстовую историю предыдущих раундов и выводит новое предложение, обоснование и решение о завершении (голосовать за остановку или продолжать). Игра останавливается, когда 2/3 агентов голосуют за остановку, либо по истечении 50 раундов.

Тестировались две модели: Qwen3-8B и Qwen3-14B. Размеры групп: N ∈ {4, 8, 16}. Доля Byzantine-агентов варьировалась от f = 0 до f = 1/3. Это «no-stake» игра — агенты не имеют предпочтений относительно конкретного значения, важна только сама возможность договориться.

Результаты без Byzantine-агентов

Даже в благоприятных условиях (B = 0) только 41,6% прогонов завершаются валидным консенсусом. Qwen3-14B значительно превосходит Qwen3-8B: 67,4% против 15,8% успешных соглашений.

Удаление упоминаний о возможных Byzantine-агентах из промтов улучшает производительность Qwen3-14B с 59,1% до 75,4% валидного консенсуса и сокращает время сходимости вдвое. Это говорит о том, что простое предупреждение о возможных противниках снижает «живучесть» протокола.

Увеличение размера группы ухудшает результаты: валидный консенсус падает с 46,6% при N=4 до 33,3% при N=16.

Влияние Byzantine-агентов

При наличии вредоносных агентов ситуация ухудшается драматически. На рисунке 3 показано, что с ростом числа Byzantine-агентов (B от 1 до 4 при 8 честных агентах) вероятность валидного консенсуса стремится к нулю. Примечательно, что основная проблема — не искажение значений (invalid consensus остаётся редким), а потеря живучести: агенты просто не могут договориться и достичь порога в 2/3 голосов.

Даже один Byzantine-агент приводит к значительному снижению успеха, а при B ≥ 2 консенсус практически невозможен.

Анализ типов отказов

Исследователи разделили исходы на три категории: валидный консенсус (все честные агенты сошлись на одном из начальных предложений), невалидный консенсус (достигнуто согласие, но не на честном значении) и отсутствие консенсуса (таймаут). Оказалось, что доминирующий тип отказа — отсутствие консенсуса, а не искажение значений. Агенты застревают в бесконечных раундах обсуждения, не могут сойтись на общем значении и не набирают необходимые 2/3 голосов для завершения.

Ограничения и следующие шаги

Авторы признают ограничения: тестировались только две модели одного семейства (Qwen3) и одна стратегия Byzantine-агентов. Исследование не охватывает разнообразные вредоносные поведения, гетерогенные популяции агентов и крупномасштабные развёртывания.

Для воспроизводимости авторы опубликовали код и данные: https://anonymous.4open.science/r/bcg-iclr2026/. Эксперименты проводились с использованием vLLM для пакетного вывода моделей с точностью FP16/BF16 и контекстным окном 8192 токенов.

Заключение

Современные LLM-агенты не являются надёжными «социальными решениями» для задач координации. Способность к согласию — критически важная предпосылка для кооперации, делегирования полномочий и координации в системах безопасности — остаётся хрупкой даже в контролируемых условиях без ставок. Это ставит под сомнение применимость многоагентных LLM-систем в сценариях, требующих устойчивой координации, и указывает на необходимость дальнейших исследований в области Byzantine-робастного консенсуса для AI-агентов.

📢 Информация предоставлена телеграм-каналом: Data&AI Insights

🤖 Data&AI Insights - Ваш источник инсайтов о данных и ИИ