Ein Codex ist einfach. Vier sind ein Ops-Problem.
Einen einzelnen Codex-Agenten zu starten, ist ein codex-Befehl. Er loggt sich ein, nimmt sich Ihr Repo und legt los. Der erste „Multi-Agent"-Versuch der meisten Leute besteht darin, vier Terminals zu öffnen und viermal denselben Befehl zu tippen. Das funktioniert grob — für etwa zehn Minuten. Bis sich zwei Agenten um dieselben Dateien streiten oder einer das Nachrichten-Limit von ChatGPT Plus leerschießt und die anderen drei mit runterreißt.
Die eigentliche Frage ist nicht, ob man mehrere Codex-Agenten parallel laufen lassen kann. Sie lautet: Wie hält man sie voneinander fern? Wir fahren an den meisten Tagen vier bis sechs Codex-Agenten parallel, und die Fehlermuster sind immer dieselben. Hier ist das Setup, das sie übersteht.
Was tatsächlich kollidiert, wenn Agenten parallel laufen
Bevor Sie sich ein Setup aussuchen, hilft es, präzise zu benennen, was kaputtgeht. Wir haben drei Kategorien von Kollisionen gesehen:
- Auth-Kollisionen. Die Codex CLI cached ihre Subscription-Credentials in
~/.codex/. Zwei Prozesse, die sich dieses Verzeichnis teilen, kämpfen um den Token-Refresh, loggen einander aus oder lösen eine Re-Auth-Schleife aus, die den Account minutenlang sperrt - Dateisystem-Kollisionen. Zwei Agenten, die denselben Workingtree bearbeiten, überschreiben sich gegenseitig. Selbst wenn nur ein Agent
go testausführt, während ein anderer gerade editiert, entstehen Phantomfehler, deren Debugging einen Teil des Kontexts frisst - Rate-Limit-Kollisionen. ChatGPT Plus deckelt nach Nachrichten in einem rollierenden Fenster — konto-, nicht geräteweit. Vier hungrige Agenten auf einem Plus-Konto stoßen bei etwa einem Viertel ihrer Einzellaufzeit ans Limit; ein lauter Agent verhungert die anderen
Die Lösung für alle drei ist dieselbe: Jeder Agent bekommt eine eigene Box, ein eigenes Home-Verzeichnis und — wenn Sie sie hart fahren — ein eigenes Konto.
Das Setup, das echtem Betrieb standhält
Bei Office Claws landet jeder Agent, den Sie anlegen, auf einem dedizierten DigitalOcean-Droplet, in etwa zweieinhalb Minuten provisioniert. Dieses Droplet hat ein eigenes ~/.codex/-Verzeichnis, einen eigenen Repo-Checkout und eine eigene Tailscale-Identität. Sie müssen über keine der obigen Kollisionen nachdenken — Isolation ist der Standard.
| Frage | Multi-Terminal auf dem Laptop | Office Claws Multi-Agent |
|---|---|---|
| Auth-Cache | geteiltes ~/.codex/ — Races | pro Droplet getrennt |
| Workingtree | geteilt — Überschreibungen | ein Repo pro Agent |
| Rate Limit | ein Konto, alle Agenten | ein Konto pro Agent (optional) |
| Recovery | alle Terminals killen | ein Droplet neu starten |
| Sichtbarkeit | 4 tmux-Panes | 4 Schreibtische im Pixel-Office |
Ein typischer Vier-Agenten-Tag sieht so aus:
researcher-agent → reads issues, writes tickets
builder-agent → takes a ticket, implements it
reviewer-agent → reviews the builder's PRs
scribe-agent → writes release notes, updates docs
Jeder lebt auf einem eigenen VPS. Jeder hat eine eigene Codex-Session. Jeder taucht als eigener Charakter im Pixel-Office auf, sodass Sie auf einen Blick sehen, wer gerade woran arbeitet.
Zwei Wege auf der Subscription-Seite
Die zweite Frage ist, wie viele ChatGPT-Konten Sie brauchen. Das ist weniger offensichtlich als die Infra-Seite, und die Antwort hängt davon ab, wie hart die Agenten arbeiten.
Ein Abo, mehrere Agenten. Für leichte bis mittlere Nutzung — zwei oder drei Agenten, jeder ein paar Stunden pro Tag — reicht ein ChatGPT-Plus-Abo (20 $/Monat) für alles. Plus deckelt über Nachrichten im rollierenden Fenster, nicht pro Konto und Gerät; zwei abwechselnd arbeitende Agenten bleiben deutlich unter der Grenze. Das ist der Einstieg.
Ein Abo pro Agent. Sobald vier oder mehr Agenten jeweils mehr als ein paar Stunden laufen, sehen Sie Rate-Limit-Warnungen. Ab da ist es günstiger, ein zweites Plus-Abo dazuzunehmen, als auf Pro aufzurüsten — besonders wenn zwei der Agenten überwiegend passiv arbeiten (beobachten, zusammenfassen) und zwei schwer coden. Plus zu 20 $/Monat × N parallele Konten skaliert sauber bis etwa sechs Agenten; darüber lohnt Pro für 200 $.
Drei Muster, die wir täglich nutzen
Das Setup ist nur die halbe Miete. Die Agenten brauchen eine Rolle, und die Rollen müssen eng genug sein, damit sie sich nicht gegenseitig zertrampeln:
- Pipeline. Researcher übergibt ein Ticket an Builder, Builder übergibt eine PR an Reviewer, Reviewer übergibt einen Merge an Scribe. Jeder Agent wartet auf den davor. Langsam, aber ruhig — keine Kollisionen, weil immer nur ein Agent gleichzeitig an einer Datei arbeitet
- Fan-out. Ein Planer-Agent erzeugt N unabhängige Tickets, N Builder-Agenten nehmen sie parallel aus verschiedenen Repos auf. Schnell, verlangt aber Disziplin im Scope — nie zwei Builder am selben Modul
- Watcher + Worker. Ein Agent tailt Logs / PRs / Issues und pingt Sie; die anderen übernehmen gezielt Aufgaben, wenn Sie freigeben. Kein Konfliktrisiko, sehr effizient für Oncall-Workflows
Die Muster schließen sich nicht aus. An den meisten Tagen fahren wir ein Pipeline-Paar plus einen eigenständigen Watcher — fünf Agenten, null Kollisionen, weil die Pipeline den Zugriff auf gemeinsame Dateien serialisiert und der Watcher nie schreibt.
Was Sie sich sparen können
Ein paar Dinge klingen gut und kosten Sie einen Tag:
- Einen einzigen Git-Clone zwischen Agenten teilen. Selbst mit einem Branch pro Agent prügeln sich Stash / Commit-Hooks / Build-Caches. Ein Clone pro Agent, pro Droplet
- Mehr als einen Codex-Prozess pro Droplet. Das 1-GB-RAM-Basis-Droplet packt genau eine CLI komfortabel; eine zweite OOM-killt die erste mitten im Refactor
- Round-Robin auf einem Plus-Konto, wenn Sie aktiv ins Limit laufen. Wenn Sie den „Sie haben Ihre Nachrichten aufgebraucht"-Screen mindestens einmal pro Tag pro Agent sehen, sind 20 $ für ein zweites Plus billiger als der Kontextverlust bei den abgeschnittenen Agenten
Von Null starten
Wenn Sie das ausprobieren wollen, ohne sich aufs volle Setup festzulegen:
- Legen Sie zwei Office-Claws-Agenten an. Self-Hosted mit unserer App für 4,99 $/Monat und 4-$-Droplets landet für die ersten zwei bei rund 13 $ gesamt
- Geben Sie dem einen eine enge Watcher-Rolle (offene PRs jeden Morgen zusammenfassen) und dem anderen eine Builder-Rolle (an einem bestimmten Repo arbeiten)
- Lassen Sie beide eine Woche laufen. Sie sehen die Kollisionsmodi in der Praxis und wie die Decke eines einzelnen Plus-Abos aussieht
- Den dritten Agenten mit einem separaten ChatGPT-Konto erst dann dazu, wenn Rate Limits in dieser Woche mehr als zweimal zuschlagen
Die Regel, auf die wir immer zurückkommen: Bezahlen Sie für Isolation dort, wo sie Zeit spart, und teilen Sie dort, wo sie es nicht tut. Droplets sind günstig, Abos weniger, und in der Mitte siedeln die meisten sinnvollen Multi-Agent-Setups.
Weiterlesen
- Multi-Agent-Workflows: Spezialisierte KI-Teams betreiben — die rollenbasierte Seite derselben Frage
- Langlaufende Codex-Aufgaben — warum jeder dieser Parallel-Agenten einen VPS braucht, keinen Laptop
- Self-Hosted vs. Managed — den Plan wählen, der zur Agent-Anzahl passt