Compound Engineering v3

@ai_longreads

Масштабное обновление плагина Compound Engineering: единое пространство имён, отслеживание требований от идеи до коммита, полноценная поддержка всех AI-редакторов и ревью, которые заставляют принимать решения, а не штамповать одобрения.

Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.

Compound Engineering v3

Compound Engineering v3 Автор: Trevin Chow Оригинальный текст:

v3 вышел! Долгожданная чистка имён, которую мы анонсировали три недели назад, наконец-то здесь. Артефакты, созданные на этапах brainstorm (мозговой штурм) и plan (планирование), теперь обеспечивают прослеживаемость требований от идеи до коммита. Каждый редактор за пределами Claude Code получает полноценную поддержку установки и запуска. А наши циклы ревью больше не позволяют бездумно одобрять находки — всё это в Compound Engineering 3.0.0.

Единое пространство имён, больше никаких коллизий

Все навыки и агенты теперь живут под единым префиксом с дефисом ce-. ce:work превращается в ce-work, git-commit — в ce-commit, setup — в ce-setup, и так далее.

Старая мешанина из имён с префиксами, без префиксов и с двоеточиями приводила к коллизиям с одноимёнными навыками из других плагинов в разных редакторах — постоянный источник неоднозначности при использовании нескольких плагинов одновременно. Двоеточие в ce:work также требовало санитизации файловой системы на Windows. После v3 всё, что поставляет CE, находится в собственном однозначном пространстве имён, и наши навыки не конфликтуют ни с чьими другими. Два небольших переименования были добавлены заодно для ясности и упрощения: ce-review стал ce-code-review, а ce-document-review — ce-doc-review.

Это ломающее изменение. Существующие цепочки, ссылки и мышечную память нужно перевести на новые имена... но оно того стоит!

Отслеживание от мозгового штурма до коммита — для вас и ваших агентов

До v3 требование, которое вы записывали во время ce-brainstorm, не имело стабильного идентификатора. К моменту, когда оно попадало в ce-plan, это был просто текст; к моменту реализации — скорее ощущения. Когда тест падал или ревьюер спрашивал «что это должно было покрывать?», ответ существовал только в чьей-то голове — и агенты, выполняющие ce-work или ce-code-review, восстанавливали замысел ничуть не лучше вас.

v3 переписывает документацию ce-brainstorm и ce-plan так, чтобы она несла гораздо более чёткую структуру, а не просто текст. Документ требований из мозгового штурма теперь содержит полноценные разделы для Акторов, Ключевых потоков, Примеров приёмки и Требований, каждый со стабильными идентификаторами. ce-plan протягивает эти идентификаторы в раздел Requirements Trace и назначает локальные для плана идентификаторы единиц реализации, которые переживают углубление и перестановки плана. Тестовые сценарии ссылаются на покрываемые примеры приёмки. ce-work распознаёт эти идентификаторы единиц в блокерах, верификации и метках задач.

Очевидная выгода — происхождение для вас и ваших агентов. Проследите упавший тест до примера приёмки, который он должен был покрывать, единицу плана — до потока, который её мотивировал, а коммит — до записи в мозговом штурме, с которой всё началось. Менее очевидная, но, пожалуй, ещё более значимая выгода в том, что агенты могут следовать тем же нитям. Ревьюер может проверить, действительно ли реализация удовлетворяет заявленному примеру приёмки. Отладчик может увидеть, какой поток проверял упавший тест. Рабочий агент, столкнувшийся с блокером на U3, может прочитать исходные критерии вместо того, чтобы гадать о намерении.

Самое крупное изменение, которое это также поддерживает, — улучшенные мозговые штурмы продуктового уровня для проектов с нуля. Они тоже получают структурную поддержку, которой не было до v3. Шаблон был оптимизирован для инкрементных изменений внутри существующего продукта, поэтому масштабная работа над чем-то новым имела скудное руководство и вынуждала агента импровизировать структуру.

Лучшая структура на входе порождает лучшие результаты на выходе... и не только для человека в цикле.

Полноценная поддержка каждого редактора

Claude Code был тем местом, где CE зародился, и долгое время всё остальное ощущалось как второсортный порт. v3 меняет это по всем направлениям.

Пользователи Codex могут устанавливать нативным способом: codex plugin marketplace add плюс TUI /plugins. Навыки и MCP-серверы регистрируются напрямую, без шага конвертации через Bun. Спецификация плагинов Codex пока не покрывает пользовательских агентов, поэтому небольшой конвертер заполняет пробел, записывая агентов CE как TOML для Codex в ~/.codex/agents/.

Pi получает ещё более значительный сдвиг: мы прекратили поставлять собственный слой совместимости, который конфликтовал с самым популярным расширением подагентов от сообщества и сериализовал параллельную диспетчеризацию. Теперь мы делегируем двум расширениям сообщества: pi-subagents от @nicopreme для нативных параллельных сессий и pi-ask-user от @edlzsh для UX блокирующих вопросов. Пользователи Pi получают настоящий параллелизм и правильные оверлеи для вопросов без нашей конкуренции с мейнтейнерами сообщества за инфраструктуру, которую они уже делают лучше.

Copilot в CLI и в VSCode — оба получают полноценную поддержку с нативной установкой плагина!

Кроссплатформенная чистка прошла параллельно с крупными изменениями:

question-tool больше не пропускает молча блокирующие вопросы в Codex (где request_user_input доступен только в Plan mode) или в Claude Code (где инструмент отложен и его схема не загружена при старте сессии) — исправлено единой инструкцией, применённой в 37 файлах SKILL.md.

Описания навыков теперь ограничены лимитом, установленным редактором, с тестом во фронтматтере, проверяющим соблюдение.

Ревью, которые заставляют решать, а не штамповать

Все наши навыки ревью раньше задавали вопросы на уровне политик, в результате чего одно решение покрывало множество находок. На практике это деградировало до бездумного одобрения или оптового откладывания, и ревьюеры заново обсуждали одну и ту же предпосылку в разных формулировках по десятку находок.

v3 перестраивает всё семейство ревью вокруг работы с каждой находкой по отдельности:

ce-code-review Интерактивный режим проводит вас через находки по одной с опциями Apply/Defer/Skip/«LFG the rest» и понятным описанием каждого предлагаемого исправления. Наконец-то более простой способ понять обратную связь из ревью, чтобы принимать лучшие и более быстрые решения. Если вы решите отложить находки, мы теперь направляем их в ваш реальный трекер задач вместо устаревшего внутреннего хранилища todo, которым управлял CE.

ce-doc-review добавляет трёхуровневую классификацию автоисправлений и группировку по цепочкам зависимости предпосылок — сворачивает находки, которые все зависят от одного корня, в одно решение с каскадными зависимыми. Типичное количество решений снизилось с 14+ находок за запуск до примерно 4-6 реальных решений.

ce-resolve-pr-feedback получил ужесточённую кластеризацию (кросс-раундовые доказательства требуются перед активацией, поэтому несвязанная обратная связь из одного раунда больше не запускает комплексные рефакторинги) с отфильтрованным шумом от бот-обёрток.

Новый персонаж ce-swift-ios-reviewer присоединяется к когорте ревьюеров для стеков Swift/iOS, отлавливая неправильное использование обёрток состояния в SwiftUI, циклы удержания в Combine и проблемы с потоками контекста Core Data. Спасибо @jcjvm за вклад.

Отладка, которая диагностирует, а не гадает

ce-debug уже имел четырёхфазную методологию, но на практике он скатывался к print-отладке, пропускал проверку окружения перед глубокой трассировкой и иногда объявлял гейзенбаги «исправленными», когда инструментирование вытесняло их из поля зрения. v3 ужесточает всё это:

Ранняя проверка вменяемости окружения перед глубокой трассировкой: ветка, зависимости, рантайм, переменные окружения, устаревшие артефакты.

Аудит предположений на этапе формирования гипотезы для помощи в управлении агентом. Многие неверные гипотезы — это правильные гипотезы, проверенные на неверном предположении.

Опция параллельной диспетчеризации подагентов в режиме только для чтения для широкого поиска.

Новый справочник техник, покрывающий граничное инструментирование, засорение порядка тестов, минимизацию воспроизведения, пошаговые отладчики против инструментирования, гейзенбаги и чек-лист классов багов (часовые пояса, кодировки, числа с плавающей точкой, переполнения, кеш, авторизация).

Меньше трения, меньше острых углов

Небольшие улучшения качества жизни в существующих навыках:

ce-proof теперь активируется по прямому запросу пользователя поделиться или поитерировать над markdown-файлом. «Share this to Proof so we can iterate» работает без необходимости вызова из вышестоящего инструмента вроде ce-brainstorm или ce-plan. Вы можете попробовать это с любым markdown в вашем репозитории, например, командой вроде /ce-proof iterate with me on <doc>.

ce-demo-reel добавляет локальное сохранение как альтернативу загрузке на catbox, чтобы вы могли хранить демо-ассеты на диске без ручного вылавливания из временных директорий. Спасибо Lucas Henn за этот вклад.

ce-setup проверяет наличие ast-grep и соответствующего навыка агента, с новым разделом Skills в выводе проверки состояния, аналогичным существующему разделу Tools.

И раунд исправлений корректности и безопасности:

ce-plan больше не классифицирует ошибочно несофтверные исследования как только фактологический поиск, не подставляет молча общий веб-поиск вместо указанных пользователем ресурсов и не пропускает блокирующее меню передачи после планирования. Вы можете получить по-настоящему вдумчивое планирование с помощью агента для ваших несофтверных задач — будь то уроки математики для ваших детей, поездка в Портленд или проект по благоустройству дома, который вы пытаетесь спланировать.

ce-work перестал изобретать оценки времени для человека и разбивки на многодневные сессии — формулировки, которые не применимы к выполнению агентом.

ce-update выводит директорию кеша из родительского каталога корня плагина с проверкой структуры, чтобы неправильные значения переменных окружения не могли схлопнуться в опасную цель для rm -rf. Спасибо @andrewlook за то, что поднял эту проблему.

ce-compound — YAML-фронтматтер теперь переживает строгие парсеры и валидатор плагинов Cowork.

Что дальше: дальнейшая работа над навыками продукта и стратегии, более точная верификация и поддержка выпуска, а также настраиваемые предпочтения, чтобы вещи вроде пути вывода compounded-docs не были захардкожены как docs/solutions. Последнее было почти готово к v3, но потребовало ещё времени на дозревание.

v3 — это в равной мере фундамент и релиз... скоро будет ещё!

Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!

Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot

Compound Engineering v3

Compound Engineering v3

Единое пространство имён, больше никаких коллизий

Отслеживание от мозгового штурма до коммита — для вас и ваших агентов

Полноценная поддержка каждого редактора

Ревью, которые заставляют решать, а не штамповать

Отладка, которая диагностирует, а не гадает

Меньше трения, меньше острых углов

Report Page