Compound Engineering -- 4 релиза за неделю

Compound Engineering -- 4 релиза за неделю

@ai_longreads

Итеративные циклы оптимизации, полировка с участием человека, генерация идей за пределами кода и нормальный опыт первоначальной настройки -- обзор Compound Engineering версий 2.65.0--2.68.0.

Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.


Compound Engineering -- 4 релиза за неделю

Compound Engineering - 4/17/2026 Автор: Trevin Chow Оригинальный текст:

[Новое] /ce:optimize -- итеративные циклы оптимизации в стиле autoresearch

Эта функция готовилась давно. Автор -- @huntharo, контрибьютор из сообщества.

/ce:optimize -- итеративный цикл оптимизации, вдохновлённый autoresearch от @karpathy, обобщённый для многофайловых изменений кода и задач за пределами машинного обучения.

Идея: определяете измеримую цель, выстраиваете инфраструктуру измерений, а затем запускаете длинный цикл, который параллельно проверяет множество гипотез, измеряет каждую, сохраняет улучшения и сходится к лучшему результату. Полезно для таких задач, как настройка системных промптов, повышение качества векторной кластеризации, оптимизация релевантности поиска, сокращение времени сборки или сравнение подходов к решению задачи в коде. Тот тип работы, где одно изменение вас никуда не приведёт и нужно 50+ итераций с памятью о том, что уже пробовали.

Инструмент работает как с жёсткими метриками (время сборки, покрытие тестами), так и с качественными целями. Для качественных показателей вроде когерентности кластеризации или релевантности поиска используется LLM-as-judge (LLM в роли оценщика) со стратифицированной выборкой, чтобы вы не гнались за обманчивой прокси-метрикой. Эксперименты запускаются параллельно в до 6 git worktree или песочницах Codex с встроенным восстановлением после сбоев, поскольку такие сессии могут длиться часами.

Первый реальный тестовый запуск от @huntaro: оптимизация кластеризации, ~90 минут, 16 экспериментов, покрытие выросло с 31% до 72%.

[Новое] ce:ideate v2 -- генерация идей за пределами кода

Раньше ce:ideate прогонял всё через призму репозитория и кода. Придумываете название, ценообразование, нарратив или принимаете личное решение? Жаль, получайте фреймворки с привкусом софтверной разработки и дженерик-результат.

v2 классифицирует предмет вашей идеации в два шага: привязано ли это к текущему репозиторию или к чему-то другому, и относится ли это к софту или нет. Затем направляет в нужную ветку фасилитации. 6 симметричных по режиму фреймов заменяют старый набор, ориентированный только на код. Идеация вне кода может завершиться чисто, не заставляя вас продираться мимо вашей естественной точки остановки через цепочку "мозговой штурм > план > работа", которая не имеет смысла.

Можно даже вставлять скриншоты UI и спрашивать такие вещи, как /ce:ideate how can I improve conversion?, даже если скриншот не связан с текущим репозиторием. Гибкость!

Примечание: также появился новый web-researcher агент, который обеспечивает внешнее заземление (аналоги, смежные решения, рыночные сигналы, междоменные аналогии) для наших навыков по темам, где ваша кодовая база не является основным источником контекста.

[Новое] Human-in-the-loop с Proof -- повсюду

Главная тема недели: дать вам больше моментов для ревью и корректировки работы агента до того, как она будет отправлена.

/ce:polish-beta -- новая фаза, которая встаёт между прохождением ce:review и мержем. Она запускает dev-сервер из вашего .claude/launch.json, генерирует чеклист для пользовательского тестирования на основе поверхности диффа, позволяет отметить пункты, требующие доработки, и запускает параллельные суб-агенты полировки. Если отдельные пункты слишком велики, создаются стековые PR. Если вся партия превышает размер -- генерируется переплан. Спасибо @kieranklaassen за этот вклад.

Циклы ревью через Proof теперь подключены к ce:brainstorm, ce:plan и ce:ideate через общий рабочий процесс. Мы любим терминал, но иногда посмотреть на отрендеренный Markdown приятно. Вы открываете документ в Proof, добавляете комментарии-аннотации, а агент их считывает, применяет исправления и синхронизирует отредактированный Markdown обратно на диск. Единое меню передачи во всех трёх навыках.

[Новое] /ce-setup -- онбординг, который реально работает

`/ce-setup` запускает однопроходную проверку здоровья по CLI-инструментам, конфигурации проекта и зависимостям, а затем предлагает установить недостающее и сгенерировать конфигурационные файлы. Одна команда -- от чистой установки до рабочего окружения.

[Новое] /ce-pr-description -- централизованные описания PR

Любой навык, которому нужно описание PR, теперь может делегировать это ce-pr-description. Передаёте естественно-языковой промпт с опциональной ссылкой на PR -- получаете структурированный заголовок и тело. Работает и между репозиториями: вставьте URL из репозитория, который даже не клонирован у вас локально, и он опишет PR через GitHub API. Наш собственный навык git-commit-push-pr теперь делегирует ему, так что есть единая точка для развития качества написания.

[Новое] /ce-release-notes -- "что зашипили?"

Запустите /ce:release-notes без аргументов -- получите заметки о последних 5 релизах CE-плагина. Добавьте вопрос, например /ce:release-notes what happened to deepen-plan? -- и он выполнит поиск по последнему набору релизов с цитированием версий и привязкой к PR. Удобно, чтобы наверстать упущенное после недельного отпуска или проверить, когда появилась конкретная фича.

[Исправлено] Надёжность и безопасность

Несколько исправлений, достойных упоминания в этих релизах: агенты-ревьюеры теперь ограничены инструментами только для чтения (никаких случайных записей во время ревью), ce:work и ce:work-beta получили проверки безопасности при параллельном запуске суб-агентов, ce:review всегда подтягивает базовую ветку для предотвращения сравнений с устаревшим merge-base, а git-commit-push-pr теперь пишет описания как итоговый результат вместо чейнджлога. Также убрали claude-permissions-optimizer в пользу встроенного /less-permission-prompts, который только что запустил Anthropic.

Примечание о нейминге: да, непоследовательность двоеточия и дефиса всё ещё сохраняется (ce:work vs ce-sessions). Мы готовимся к масштабному переименованию навыков и агентов в v3, где всё перейдёт на единый префикс ce-, наряду с другими большими фичами. Спасибо за терпение!


Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!

Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot

Report Page