Nützliche Codex-Arbeit passt selten sauber in eine einzige Terminal-Sitzung. Ein Refactoring beginnt klein, dann läuft die Testsuite zwanzig Minuten, und danach braucht der Agent noch einen Durchlauf, obwohl der Laptop schon in einem anderen Netzwerk hängt.
Darum behandeln wir Codex-CLI-Hintergrundaufgaben als Infrastrukturproblem, nicht als Prompt-Trick. Die Arbeit soll auf einem stabilen Host laufen, die menschliche Oberfläche leicht bleiben und Wiederherstellung langweilig sein.
Die kleinste zuverlässige Form
Eine Codex-Hintergrundaufgabe braucht vier Bausteine:
| Ebene | Aufgabe | Verhindert |
|---|---|---|
| Persistenter Host | Aufgabe auf einem VPS statt im Laptop-Shell ausführen | WLAN-Abbrüche, Sleep, lokale Last |
| Sitzungswrapper | Prozess in tmux, systemd oder Task Runner halten | Verlorenes Terminal bedeutet nicht verlorene Arbeit |
| Log-Stream | stdout, stderr und Checkpoints speichern | Review ohne Raten |
| Menschliches Gate | Review vor Pushes, Deploys oder Löschungen | Autonomie bleibt kontrollierbar |
Praktisch reicht oft ein kleiner VPS, Tailscale, tmux, ein Repo-Checkout und Codex CLI. Office Claws kapselt diese Form in einem Desktop Manager: Jeder Agent bekommt einen sichtbaren Schreibtisch, einen erreichbaren Host und einen Ort zum Prüfen laufender Arbeit.
Ein einfaches tmux-Muster
ssh office-claws-agent
cd ~/work/product-api
tmux new -s codex-billing-refactor
codex "refactor invoice generation, run the billing tests, and summarize risky changes"Wenn die Verbindung abbricht:
ssh office-claws-agent
tmux attach -t codex-billing-refactorDer Zustand liegt auf dem VPS: Repo, Shell-Verlauf, Testartefakte, Logs und Codex-Prozess. Der Laptop ist nur das Fenster.
Aufgaben beobachtbar machen
Eine Hintergrundaufgabe ohne Beobachtung erzeugt nur langsamere Sorge. Lege vor dem Start fest, wohin Ausgaben gehen:
mkdir -p ~/agent-logs
script -f ~/agent-logs/billing-refactor.$(date +%F-%H%M).logBitte den Agenten bei längeren Jobs um Checkpoints:
PLAN.mdvor ÄnderungenSTATUS.mdnach jeder Phase- Testergebnisse unter
artifacts/ - eine Risiko-Zusammenfassung vor dem Commit
Ein enger Brief ist besser
Ziel: Flaky Checkout-Tests im Payment-Paket reduzieren.
Erlaubt: Tests und Hilfs-Fixtures ändern, npm test -- payment ausführen.
Nicht erlaubt: Produktionslogik für Billing ändern oder Branch pushen.
Stopp: zusammenfassen, wenn mehr als 8 Dateien betroffen sind.
Am Ende: Tests, geänderte Dateien und Risiken auflisten.So entsteht eine klare Review-Grenze statt eines endlosen "mach es besser".
Wann ein eigener Agent sinnvoll ist
Nutze eine normale Shell für kurze Aufgaben. Nimm einen dedizierten Remote-Agenten, wenn die Aufgabe länger laufen kann, das Repo groß ist, mehrere Codex-Jobs parallel laufen sollen, sensible Infrastruktur betroffen ist oder du einen Audit-Trail brauchst.
Genau hier hilft Office Claws: Host bereitstellen, über Tailscale verbinden und den Status sichtbar machen. Für die strategische Einordnung siehe unseren OpenClaw-vs-Codex-Vergleich; die Preisseite zeigt Self-Hosted und Managed.
Fazit
Codex CLI ist im Vordergrund stark. Im Hintergrund wird es erst richtig nützlich mit stabilem Host, wiederaufnehmbarer Sitzung, klaren Logs und Review-Gate.