Le travail utile avec Codex tient rarement dans une seule session de terminal. Un refactor commence petit, la suite de tests tourne vingt minutes, puis l’agent demande une passe de plus alors que le laptop a changé de réseau.
Nous traitons donc les tâches Codex CLI en arrière-plan comme un problème d’infrastructure, pas comme une astuce de prompt. Le travail doit tourner sur un hôte stable, l’interface humaine doit rester légère, et la reprise doit être banale.
La forme minimale fiable
| Couche | Rôle | Évite |
|---|---|---|
| Hôte persistant | Exécuter sur un VPS plutôt que sur le laptop | Coupures réseau, veille, charge locale |
| Wrapper de session | Garder le processus dans tmux, systemd ou un runner | Perdre le terminal ne perd pas le travail |
| Flux de logs | Sauver stdout, stderr et checkpoints | Relire sans deviner |
| Validation humaine | Revue avant push, deploy ou suppression | Autonomie sans prise de risque inutile |
La version pratique est souvent un petit VPS, Tailscale, tmux, un checkout du repo et Codex CLI. Office Claws emballe cette même forme dans un gestionnaire desktop : chaque agent a un bureau visible, un hôte joignable et un endroit pour inspecter le travail en cours.
Un motif tmux simple
ssh office-claws-agent
cd ~/work/product-api
tmux new -s codex-billing-refactor
codex "refactor invoice generation, run the billing tests, and summarize risky changes"Si la connexion tombe :
ssh office-claws-agent
tmux attach -t codex-billing-refactorL’état vit sur le VPS : repo, historique shell, artefacts de test, logs et processus Codex. Le laptop n’est qu’une fenêtre.
Rendre la tâche observable
mkdir -p ~/agent-logs
script -f ~/agent-logs/billing-refactor.$(date +%F-%H%M).logPour les travaux longs, demande des checkpoints :
PLAN.mdavant modificationSTATUS.mdaprès chaque phase- résultats de tests dans
artifacts/ - résumé des risques avant le commit
Donner un brief étroit
Objectif : réduire la flakiness des tests checkout dans payment.
Autorisé : modifier tests et fixtures, lancer npm test -- payment.
Interdit : changer la logique de billing production ou pousser une branche.
Stop : résumer si plus de 8 fichiers doivent changer.
Fin : lister tests lancés, fichiers modifiés et risques.Ce cadre produit un meilleur travail qu’un simple « corrige les tests flaky ».
Quand passer à un agent dédié
Utilise un shell normal pour les tâches rapides. Passe à un agent distant dédié si la tâche peut dépasser ta session, si le repo est lourd, si plusieurs jobs Codex doivent tourner en parallèle, si des secrets sont impliqués ou si tu veux un audit trail.
Office Claws aide précisément là : provision du host, connexion Tailscale et contrôle visuel. Pour le contexte stratégique, lis notre comparaison OpenClaw vs Codex ; la page tarifs détaille self-hosted et managed.
À retenir
Codex CLI est puissant au premier plan. En arrière-plan, il devient fiable avec un hôte stable, une session reprenable, des logs clairs et une revue humaine.