Полезная работа с Codex редко помещается в одну терминальную сессию. Рефакторинг начинается маленьким, затем тесты идут двадцать минут, а потом агенту нужен ещё один проход, когда ноутбук уже сменил сеть или уснул.
Поэтому фоновые задачи Codex CLI лучше считать инфраструктурной задачей, а не трюком с промптом. Работа должна выполняться на стабильном хосте, человеческий интерфейс должен оставаться лёгким, а восстановление — скучным.
Минимальная надёжная схема
| Слой | Задача | Что предотвращает |
|---|---|---|
| Постоянный хост | Запуск на VPS вместо shell на ноутбуке | Потерю Wi-Fi, сон, локальную нагрузку |
| Обёртка сессии | tmux, systemd или task runner | Потерянный терминал не теряет работу |
| Поток логов | stdout, stderr и чекпоинты | Можно проверять без догадок |
| Человеческий gate | Ревью перед push, deploy или удалением | Автономность остаётся безопасной |
Практическая версия часто проста: небольшой VPS, Tailscale, tmux, checkout репозитория и Codex CLI. Office Claws оборачивает эту форму в desktop manager: у каждого агента есть видимый стол, доступный хост и место для проверки текущей работы.
Базовый шаблон tmux
ssh office-claws-agent
cd ~/work/product-api
tmux new -s codex-billing-refactor
codex "refactor invoice generation, run the billing tests, and summarize risky changes"Если ноутбук отключился:
ssh office-claws-agent
tmux attach -t codex-billing-refactorСостояние живёт на VPS: репозиторий, история shell, артефакты тестов, логи и процесс Codex. Ноутбук — только окно.
Сделайте задачу наблюдаемой
mkdir -p ~/agent-logs
script -f ~/agent-logs/billing-refactor.$(date +%F-%H%M).logДля долгих задач просите чекпоинты:
PLAN.mdперед изменениямиSTATUS.mdпосле каждого этапа- результаты тестов в
artifacts/ - финальное резюме рисков перед commit
Узкое задание лучше
Цель: уменьшить flaky checkout-тесты в payment-пакете.
Можно: менять тесты и fixtures, запускать npm test -- payment.
Нельзя: менять production-логику billing или push-ить branch.
Стоп: резюмировать, если нужно изменить больше 8 файлов.
В конце: перечислить тесты, файлы и риски.Такой brief создаёт границу ревью и обычно работает лучше, чем открытое «почини flaky tests».
Когда нужен отдельный агент
Обычный shell подходит для коротких задач. Выделенный remote agent нужен, если задача может пережить вашу сессию, репозиторий тяжёлый, нужно несколько Codex-запусков параллельно, затронуты секреты или важен audit trail.
Office Claws помогает именно здесь: поднимает хост, подключает его через Tailscale и показывает статус визуально. Для стратегии посмотрите сравнение OpenClaw vs Codex, а варианты self-hosted и managed — на странице цен.
Вывод
Codex CLI силён в foreground. Для background-работы ему нужны стабильный хост, восстанавливаемая сессия, понятные логи и человеческое ревью.