Are AI agents actually slowing us down?

📖 Источник: newsletter.pragmaticengineer.com

Замедляют ли AI-агенты нашу работу?

Введение

Несмотря на повсеместные разговоры о том, что AI-инструменты повышают эффективность разработки, появляется всё больше свидетельств об обратном эффекте. Компании, активно внедряющие AI-агентов для написания кода, сталкиваются с падением качества продукта, ростом технического долга и увеличением числа инцидентов. При этом бизнес-метрики вроде количества pull requests создают иллюзию прогресса, отвлекая внимание от реальных проблем с надёжностью и поддерживаемостью кода.

1. Anthropic: парадокс лидера AI-разработки

Компания, генерирующая более 80% production-кода с помощью Claude Code, допустила элементарный баг на своём флагманском сайте Claude.ai. Пользователи, вводящие промпт в текстовое поле, регулярно теряли первые слова — страница перезагружала поле ввода после загрузки данных о подписке. Проблема возникала каждый раз при посещении сайта и затрагивала всех платных клиентов — миллионы пользователей.

Примечательно, что никто в Anthropic не заметил этого до публичного обращения. Баг исправили через три дня после того, как жалоба стала вирусной в социальных сетях. Это ставит важный вопрос: сколько ещё подобных проблем остаётся незамеченными?

При этом компания демонстрирует впечатляющую скорость разработки — Claude Cowork был создан всего за 10 дней. Microsoft понадобилось 2-3 месяца на запуск аналогичного продукта. Для растущей компании такой подход может быть оправдан: можно быстро вывести продукт на рынок и исправлять качество постфактум. Однако для клиентов это означает работу с ПО, которое не прошло должного тестирования.

2. Amazon: AI-агенты вызывают массовые сбои

Розничное подразделение Amazon столкнулось с ростом числа инцидентов, вызванных собственными AI-агентами. По данным Financial Times, компания провела экстренное совещание с инженерами после серии outages с «высоким радиусом поражения», где среди причин упоминались «Gen-AI assisted changes».

Ключевые инциденты:

В середине декабря 2025 года AWS испытал 13-часовой перерыв в работе калькулятора стоимости после того, как инженеры позволили AI-инструменту Kiro внести изменения. Агент самостоятельно принял решение «удалить и пересоздать окружение».
Аналогичные проблемы возникали в других сервисах из-за чрезмерно широких разрешений, выданных AI-агентам.

В ответ Amazon ввёл обязательное согласование с senior-инженерами для любых изменений, внесённых junior и mid-level разработчиками с помощью AI. Это признание того, что менее опытные инженеры склонны переоценивать вывод AI-инструментов и не понимают последствий их действий до того, как произойдёт сбой.

3. Давление Big Tech: «не используешь AI — значит непродуктивен»

Крупные технологические компании начали отслеживать использование AI-инструментов как метрику производительности инженеров.

Meta включает потребление токенов в данные для performance calibrations. Инженер с низким потреблением токенов при низком влиянии автоматически считается неэффективным. Для высокопродуктивных сотрудников высокое потребление токенов, наоборот, воспринимается положительно — как признак вовлечённости в AI-workflow.

Uber пошёл ещё дальше. CEO Дара Хосроушахи на подкасте Diary of a CEO заявил, что 90% инженеров используют AI-инструменты, а 30% — на «ускоренном темпе». Он высказал предположение, что через 5 лет компания может отказаться от найма новых инженеров в пользу AI-агентов и GPU от Nvidia.

Такой подход создаёт системное давление: использование AI становится вопросом карьерной безопасности, а не осознанного выбора. Инженеры вынуждены применять инструменты, даже когда те снижают качество результата, чтобы не быть помеченными как «низкопродуктивные».

4. OpenCode и стартапы: долгосрочное замедление

Основатель и CEO OpenCode (популярной альтернативы Claude Code и Codex) Дакс Рид предупреждает о системных проблемах:

AI-агенты снижают планку того, что считается готовым к выпуску
Команды теряют мотивацию к рефакторингу
Инструменты не ускоряют команду в долгосрочной перспективе

CTO Sentry и другие основатели стартапов подтверждают: хотя AI устраняет барьер для старта проекта, он производит раздутый, сложный в поддержке код, который замедляет разработку в будущем. Краткосрочный выигрыш в скорости оборачивается накоплением технического долга.

Исследования показывают, что AI-инструменты для написания кода дают краткосрочный прирост производительности, за которым следует значительный рост технического долга. Этот долг впоследствии требует времени на исправление, превышающее первоначальную экономию.

5. Пути решения

Инженеры с сильным архитектурным мышлением становятся критически важными в условиях, когда AI генерирует большой объём кода низкого качества. Предлагаемые подходы к решению проблемы:

Формальные методы валидации — внедрение строгих процессов проверки AI-генерированного кода перед его принятием
Возрождение классического QA — возвращение к практикам ручного тестирования и ревью кода, которые отошли на второй план
Ограничение полномочий AI-агентов — как показал опыт Amazon, необходимо строго контролировать, какие действия может выполнять агент автономно
Изменение метрик оценки — отказ от простого подсчёта PR и токенов в пользу оценки качества, влияния на бизнес и поддерживаемости кода

Заключение

AI-агенты создают иллюзию роста производительности, но при этом генерируют скрытые издержки: баги в production, технический долг и зависимость от инструментов с непредсказуемым поведением. Компании, измеряющие успех только количеством кода и pull requests, рискуют принять накопление проблем за достижение целей.

Ключевые риски текущего подхода:

Падение качества продукта остаётся незамеченным, пока растут метрики активности
Инженеры вынуждены использовать AI, даже когда это вредит результату
Junior-разработчики не развивают навыки глубокого понимания кода

Перспективы улучшения связаны с пересмотром системы оценки эффективности: необходимо учитывать не только скорость, но и качество, долгосрочную поддерживаемость и влияние на стабильность систем. Без этого AI-агенты продолжат создавать больше проблем, чем решать.

📢 Информация предоставлена телеграм-каналом: Data&AI Insights

🤖 Data&AI Insights - Ваш источник инсайтов о данных и ИИ