El trabajo útil con Codex rara vez cabe en una sola terminal. Un refactor empieza pequeño, la suite de pruebas tarda veinte minutos y luego el agente necesita otra pasada cuando ya cambiaste de red o cerraste el portátil.
Por eso tratamos las tareas en segundo plano de Codex CLI como un problema de infraestructura, no como un truco de prompt. El trabajo debe correr en un sitio estable, la interfaz humana debe ser ligera y la recuperación debe ser aburrida.
La forma mínima fiable
| Capa | Función | Evita |
|---|---|---|
| Host persistente | Ejecutar en un VPS, no en el portátil | Cortes de red, suspensión, carga local |
| Wrapper de sesión | Mantener el proceso en tmux, systemd o un runner | Perder la terminal no pierde el trabajo |
| Flujo de logs | Guardar stdout, stderr y checkpoints | Revisar sin adivinar |
| Puerta humana | Revisar antes de pushes, deploys o borrados | Autonomía sin imprudencia |
La versión práctica suele ser un VPS pequeño, Tailscale, tmux, un checkout del repo y Codex CLI. Office Claws envuelve esa misma forma en un gestor de escritorio: cada agente tiene una mesa visible, un host alcanzable y un lugar para inspeccionar lo que está corriendo.
Un patrón base con tmux
ssh office-claws-agent
cd ~/work/product-api
tmux new -s codex-billing-refactor
codex "refactor invoice generation, run the billing tests, and summarize risky changes"Si el portátil se desconecta:
ssh office-claws-agent
tmux attach -t codex-billing-refactorEl estado vive en el VPS: repo, historial, artefactos de prueba, logs y proceso de Codex. El portátil es solo una ventana.
Haz observable la tarea
mkdir -p ~/agent-logs
script -f ~/agent-logs/billing-refactor.$(date +%F-%H%M).logPara trabajos largos, pide checkpoints:
PLAN.mdantes de editarSTATUS.mddespués de cada fase- resultados de pruebas en
artifacts/ - resumen final de riesgos antes del commit
Dale a Codex un encargo estrecho
Objetivo: reducir la inestabilidad de las pruebas de checkout en payment.
Permitido: editar tests y fixtures, ejecutar npm test -- payment.
No permitido: cambiar lógica de facturación en producción ni hacer push.
Detenerse: resumir si hacen falta más de 8 archivos.
Al final: listar pruebas, archivos cambiados y riesgos.Ese límite produce mejor trabajo en segundo plano que un "arregla los tests flaky" abierto.
Cuándo usar un agente dedicado
Usa una shell normal para tareas rápidas. Promueve el trabajo a un agente remoto cuando pueda durar más que tu sesión, el repo sea pesado, necesites varios trabajos Codex en paralelo, haya credenciales o quieras auditoría.
Office Claws ayuda justo ahí: aprovisiona el host, lo conecta con Tailscale y muestra el estado en un plano visual. Para contexto estratégico, lee la comparación OpenClaw vs Codex; la página de precios muestra opciones self-hosted y managed.
Idea clave
Codex CLI es potente en primer plano. En segundo plano necesita host estable, sesión recuperable, logs claros y revisión humana.