Как получить максимум от Codex

@ai_longreads

Codex от OpenAI перестаёт быть узкоспециализированным помощником для написания кода и превращается в полноценную систему для выполнения самой разной компьютерной работы. Статья описывает ключевые возможности: долговечные треды, голосовой ввод, управление задачами, автоматизации и общую память.

Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.

Как получить максимум от Codex

Getting the most out of Codex Автор: Jason Liu Оригинальный текст:

Большинство разработчиков впервые используют агентов-программистов именно для кода: изучить репозиторий, сделать diff, прогнать тесты и открыть pull request.

Это по-прежнему центр тяжести Codex. Но значительная часть работы за компьютером и так опосредована кодом: выполнение shell-команд, просмотр веб-страниц, вызов API, экспорт документов, реакция на события и запуск автоматизаций. По мере того как эти поверхности становятся доступны Codex, он перестаёт ощущаться как помощник для написания кода в узком смысле и всё больше напоминает систему для выполнения компьютерной работы в целом.

Приложение Codex делает этот сдвиг осязаемым. Тред может сохранять контекст, использовать инструменты, показывать артефакты и продолжать работу между промптами вместо того, чтобы сбрасывать всё после каждого обмена.

Получить больше от Codex — значит использовать эти возможности вместе:

долговечные треды, сохраняющие контекст
голосовой ввод, управление ходом работы и очередь задач, пока пользователь ещё в процессе
браузер, управление компьютером, MCP-серверы и коннекторы, позволяющие Codex действовать за пределами репозитория
автоматизации тредов и цели (Goals), которые продолжают работу, пока пользователь отсутствует
боковая панель, где можно просматривать код, документы, презентации и другие артефакты

Долговечные треды

Закреплённые треды (pinned threads) — один из способов держать долговечные треды под рукой. Они полезны для повторяющихся рабочих потоков, таких как:

тред «начальник штаба» (Chief of Staff)
тред для релиза
тред для ревью документации
тред для внешнего мониторинга

Это постоянные рабочие пространства, а не короткие чаты. Codex может возвращаться к ним со временем, сохраняя предыдущие решения, предпочтения и рабочий контекст, которые иначе пришлось бы выстраивать заново.

Сочетания клавиш для закреплённых тредов делают это практичным. Command-1 — Command-9 мгновенно переключают на сохранённые треды.

Голосовой ввод

Голосовой ввод ценен тем, что позволяет зафиксировать черновую версию мысли до того, как она будет сжата в отполированный текст.

В Codex есть встроенный голосовой ввод. Он особенно хорошо работает для расплывчатых отправных точек, которые легко сказать вслух, но неудобно печатать:

Кажется, кто-то по имени Бен упоминал это в Slack.

Я не помню деталей.

Пожалуйста, поищи.

Для агента, умеющего искать, собирать контекст и отчитываться, этого часто достаточно.

Голосовой ввод также хорошо подходит для двух-трёхминутного «дампа мыслей», когда задача ещё не полностью сформирована.

Транскрипты работают аналогичным образом. Сырой транскрипт совещания или надиктованная заметка для планирования часто оказываются лучшим исходным материалом, чем краткое резюме, потому что сохраняют неопределённость, акценты и незавершённые цепочки мыслей.

Управление ходом работы и очередь задач

Голосовой ввод становится ещё полезнее в сочетании с явным управлением активной задачей.

Корректировка полезна, когда агент движется не туда и нужно исправить курс до окончания шага. Например, при ревью веб-сайта пользователь может прервать работу, аннотируя поверхность в боковой панели:

сделай это меньше
расстояние между этими двумя элементами выглядит неправильно
этот текст неверный

Очередь задач — это другое. Она не прерывает текущую задачу, а добавляет следующую в очередь. Пользователь может сказать:

Когда работа будет закончена, отправь ссылку на превью рецензенту в Slack.

Steering меняет то, что Codex делает сейчас. Queuing меняет то, что должно произойти дальше. Оба подхода позволяют пользователю оставаться рядом с работой, пока она разворачивается.

Инструменты и охват

Когда тред обретает непрерывность, следующий вопрос — на что он может воздействовать. Codex может расширять охват послойно:

$browser — встроенный браузер в боковой панели, где Codex может проверять и аннотировать веб-поверхности
@chrome — для работы с авторизованным состоянием браузера и процессами на основе Chrome
@computer — для задач, которые существуют только через графический интерфейс рабочего стола

$browser подходит для ревью в боковой панели. @chrome — для работы с авторизованным браузером, зависящей от контекста пользовательского Chrome. @computer — для задач, которые существуют только через GUI рабочего стола.

MCP-серверы и коннекторы расширяют ту же идею на остальную часть рабочего процесса. Slack, Gmail и Calendar важны, потому что многие важные задачи сначала появляются как сообщения, письма или проблемы с расписанием — до того, как стать кодом.

Навыки (skills) делают повторяющиеся рабочие процессы переиспользуемыми. Как только рабочий процесс доказывает свою полезность, упакуйте его как навык, чтобы Codex мог запускать его снова без необходимости заново осваивать рутину.

Работа откуда угодно

Мобильное приложение Codex меняет представление о том, когда нужно находиться за рабочим столом. Задачу можно начать на Mac, где уже есть файлы, разрешения и локальная настройка, а затем продолжить, проверяя статус с телефона.

Это важно в небольших моментах. Можно отойти от рабочего стола, пока Codex выполняет длительную задачу, ответить на вопрос извне, одобрить следующий шаг или перенаправить тред до возвращения. Локальное окружение остаётся на месте; пользователю оставаться на месте не обязательно.

Автоматизации

Автоматизации запускают работу Codex по расписанию. Используйте запланированную автоматизацию, когда повторяющаяся задача должна стартовать с чистого листа из рабочего пространства — например, ежедневный отчёт или регулярная проверка репозитория. Используйте автоматизацию треда, когда расписание должно возвращаться к активному разговору с его текущим контекстом.

Закреплённые треды полезны, но они всё ещё ждут возвращения пользователя. Автоматизация треда может проверять что-либо каждые несколько минут или часов, продолжать работу до выполнения условия и со временем корректировать периодичность.

Тред «начальник штаба» может запускаться каждые 30 минут:

Каждые 30 минут проверяй Slack и Gmail на предмет неотвеченных сообщений, требующих моего внимания.

Помоги расставить приоритеты по степени важности.

Если кто-то задаёт мне вопрос, исследуй ответ как можно глубже и подготовь черновик ответа, но не отправляй его.

Когда пользователь возвращается, дорогостоящая часть сбора контекста часто уже выполнена. Человек по-прежнему решает, что будет отправлено.

Автоматизации тредов также подходят для циклов обратной связи. Автоматизация треда может отслеживать комментарии к pull request-ам, комментарии в Google Docs или ответы в Slack и поддерживать движение окружающей работы, пока пользователь отсутствует.

Рассмотрим рабочий процесс анимации, в котором рецензент делится видео в Slack. Автоматизация треда может проверять тред по расписанию, рендерить обновлённую версию при появлении комментариев и отвечать в том же треде, отмечая рецензента. Если одна интеграция не может завершить финальную загрузку, автоматизация рабочего стола может закончить шаг через GUI.

Цикл охватывает Slack для обратной связи, кодовую базу для рендеринга и автоматизацию рабочего стола для финальной загрузки.

Цели (Goals)

Цели наиболее эффективны, когда у задачи есть реальная финишная черта, к которой агент может продолжать стремиться. Слабая цель выглядит так:

Реализуй план из этого Markdown-файла.

Более сильная цель имеет измеримый критерий успеха.

Например, инженер может мигрировать внутренний инструмент с Python на Rust, настроив новую директорию, определив цель и сделав финишную черту явной: новая реализация не считается завершённой, пока не пройдут юнит-тесты.

Цель объединяет постоянное выполнение с верификатором. Пользователь определяет результат, условие остановки и сигнал, показывающий, приближается ли Codex к цели.

Полезные верификаторы включают:

набор тестов
бенчмарк (эталонный тест)
воспроизведение бага
матрицу валидации
сквозной рабочий процесс, который должен продолжать проходить

Амбиции важны, но без верификации это просто желание.

Боковая панель

Боковая панель удерживает работу рядом с разговором, который её породил. Вместо экспорта артефакта и переключения контекста пользователь может просмотреть его на месте. Результатом может быть код, но это также может быть презентация, PDF, веб-страница, таблица или другой артефакт, созданный по ходу работы.

Она особенно хорошо поддерживает четыре задачи:

Инспекция артефактов
Аннотирование того, что нужно изменить
Работа с веб-поверхностями
Ревью изменений

Боковая панель позволяет пользователям просматривать Markdown, электронные таблицы, таблицы данных, документы и слайды на месте. Можно инспектировать, размечать и дорабатывать артефакты, не разрывая цикл работы.

Презентация или PDF могут оставаться открытыми рядом с тредом, который их создал, — готовыми для непосредственного ревью и исправления.

Встроенный браузер позволяет Codex инспектировать отрендеренную страницу, управлять ею и реагировать на аннотации непосредственно на поверхности, находящейся на проверке. Комментарии к странице или артефакту остаются внутри рабочего цикла, а не превращаются в отдельную передачу.

Веб становится одновременно результатом и поверхностью управления. Codex может создать артефакт, открыть его в боковой панели, проверить, отладить и продолжить совершенствовать тот же объект на месте.

Эти поверхности работают особенно хорошо:

index.html для лёгких статических артефактов
Storybook для ревью UI
Remotion Studio для программной анимации
браузерные презентации для выступлений
приложения для работы с данными для аналитических процессов

Один файл index.html может стать долговечным интерактивным артефактом без необходимости в сервере. Автоматизации тредов также могут обновлять статические артефакты со временем, так что в треде будет что-то новое к возвращению пользователя.

Общая память

Долгоживущие треды становятся полезнее, когда они делят память за пределами одного разговора.

Один из устойчивых паттернов — привязать постоянные треды к хранилищу Obsidian. На практике это означает папку с простыми файлами, которую легко просматривать, редактировать, перемещать и хранить долгое время. Команды могут хранить эту папку в облачном хранилище, Git, Dropbox, Google Drive или другом слое синхронизации, подходящем для их рабочего процесса.

Хранилище может выглядеть так:

vault/

├── TODO.md

├── people/

├── projects/

├── agent/

└── notes/

На верхнем уровне AGENTS.md может определять, как Codex должен обновлять это рабочее пространство по мере того, как он узнаёт больше о людях, проектах, решениях и открытых вопросах.

Не копируйте точную структуру хранилища. Научите агента, где должен храниться долговечный контекст, какой контекст сохранять и когда не создавать лишнюю суету.

Практический AGENTS.md может содержать:

Рассматривай ~/vault как долговечную рабочую память.
Предпочитай канонические заметки вместо разрастания заметок.
Явно маршрутизируй TODO, людей, проекты, ежедневные сводки и черновые заметки.
Сохраняй решения, блокеры, ответственных, даты и полезные ссылки.
Если ничего существенного не изменилось, не создавай ненужных обновлений в хранилище.

Репозитории хранят код. Хранилище хранит текущий контекст: вовлечённых людей, что изменилось, что заблокировано, что требует дальнейших действий и что иначе исчезло бы между сессиями.

Важный контекст не должен жить только внутри транскрипта разговора. Запишите его туда, откуда следующий тред сможет продолжить.

У Codex также есть встроенные функции памяти в настройках: Settings > Personalization > Memories. Они обеспечивают локальный слой запоминания для предпочтений, повторяющихся рабочих процессов и известных подводных камней. Они дополняют явно записанный контекст, а не заменяют его. Chronicle движется в том же направлении, помогая Codex выстраивать память из недавнего экранного контекста.

От кода — вовне

Codex по-прежнему начинает с кода. Но всё больше работы вокруг кода теперь доступно через ту же систему: MCP-серверы, браузерные поверхности, управление рабочим столом, автоматизации тредов и просматриваемые артефакты.

Это меняет модель управления. Steering прерывает текущую работу. Queuing ставит в очередь следующую задачу. Автоматизации тредов поддерживают тред активным, когда пользователь отходит. Цели (Goals) добавляют конкретную финишную черту, к которой Codex может продолжать работать.

Codex теперь может провести рабочий процесс от инструкции к выполнению и ревью артефакта — даже когда работа выходит за пределы репозитория.

Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!

Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot

Как получить максимум от Codex

Как получить максимум от Codex

Долговечные треды

Голосовой ввод

Управление ходом работы и очередь задач

Инструменты и охват

Работа откуда угодно

Автоматизации

Цели (Goals)

Боковая панель

Общая память

От кода — вовне

Report Page