Mehrere Codex-Agenten parallel laufen lassen, ohne sich selbst im Weg zu stehen

21. Apr. 20266 Min. Lesezeit

Share with

Inhaltsverzeichnis

Ein Codex ist einfach. Vier sind ein Ops-Problem.

Einen einzelnen Codex-Agenten zu starten, ist ein codex-Befehl. Er loggt sich ein, nimmt sich Ihr Repo und legt los. Der erste „Multi-Agent"-Versuch der meisten Leute besteht darin, vier Terminals zu öffnen und viermal denselben Befehl zu tippen. Das funktioniert grob — für etwa zehn Minuten. Bis sich zwei Agenten um dieselben Dateien streiten oder einer das Nachrichten-Limit von ChatGPT Plus leerschießt und die anderen drei mit runterreißt.

Die eigentliche Frage ist nicht, ob man mehrere Codex-Agenten parallel laufen lassen kann. Sie lautet: Wie hält man sie voneinander fern? Wir fahren an den meisten Tagen vier bis sechs Codex-Agenten parallel, und die Fehlermuster sind immer dieselben. Hier ist das Setup, das sie übersteht.

Vier Codex-Agenten auf isolierten VPS-Hosts, über Tailscale verbunden

Was tatsächlich kollidiert, wenn Agenten parallel laufen

Bevor Sie sich ein Setup aussuchen, hilft es, präzise zu benennen, was kaputtgeht. Wir haben drei Kategorien von Kollisionen gesehen:

Auth-Kollisionen. Die Codex CLI cached ihre Subscription-Credentials in ~/.codex/. Zwei Prozesse, die sich dieses Verzeichnis teilen, kämpfen um den Token-Refresh, loggen einander aus oder lösen eine Re-Auth-Schleife aus, die den Account minutenlang sperrt
Dateisystem-Kollisionen. Zwei Agenten, die denselben Workingtree bearbeiten, überschreiben sich gegenseitig. Selbst wenn nur ein Agent go test ausführt, während ein anderer gerade editiert, entstehen Phantomfehler, deren Debugging einen Teil des Kontexts frisst
Rate-Limit-Kollisionen. ChatGPT Plus deckelt nach Nachrichten in einem rollierenden Fenster — konto-, nicht geräteweit. Vier hungrige Agenten auf einem Plus-Konto stoßen bei etwa einem Viertel ihrer Einzellaufzeit ans Limit; ein lauter Agent verhungert die anderen

Die Lösung für alle drei ist dieselbe: Jeder Agent bekommt eine eigene Box, ein eigenes Home-Verzeichnis und — wenn Sie sie hart fahren — ein eigenes Konto.

Das Setup, das echtem Betrieb standhält

Bei Office Claws landet jeder Agent, den Sie anlegen, auf einem dedizierten DigitalOcean-Droplet, in etwa zweieinhalb Minuten provisioniert. Dieses Droplet hat ein eigenes ~/.codex/-Verzeichnis, einen eigenen Repo-Checkout und eine eigene Tailscale-Identität. Sie müssen über keine der obigen Kollisionen nachdenken — Isolation ist der Standard.

Frage	Multi-Terminal auf dem Laptop	Office Claws Multi-Agent
Auth-Cache	geteiltes `~/.codex/` — Races	pro Droplet getrennt
Workingtree	geteilt — Überschreibungen	ein Repo pro Agent
Rate Limit	ein Konto, alle Agenten	ein Konto pro Agent (optional)
Recovery	alle Terminals killen	ein Droplet neu starten
Sichtbarkeit	4 tmux-Panes	4 Schreibtische im Pixel-Office

Ein typischer Vier-Agenten-Tag sieht so aus:

researcher-agent  → reads issues, writes tickets
builder-agent     → takes a ticket, implements it
reviewer-agent    → reviews the builder's PRs
scribe-agent      → writes release notes, updates docs

Jeder lebt auf einem eigenen VPS. Jeder hat eine eigene Codex-Session. Jeder taucht als eigener Charakter im Pixel-Office auf, sodass Sie auf einen Blick sehen, wer gerade woran arbeitet.

Zwei Wege auf der Subscription-Seite

Die zweite Frage ist, wie viele ChatGPT-Konten Sie brauchen. Das ist weniger offensichtlich als die Infra-Seite, und die Antwort hängt davon ab, wie hart die Agenten arbeiten.

Ein Abo, mehrere Agenten. Für leichte bis mittlere Nutzung — zwei oder drei Agenten, jeder ein paar Stunden pro Tag — reicht ein ChatGPT-Plus-Abo (20 $/Monat) für alles. Plus deckelt über Nachrichten im rollierenden Fenster, nicht pro Konto und Gerät; zwei abwechselnd arbeitende Agenten bleiben deutlich unter der Grenze. Das ist der Einstieg.

Ein Abo pro Agent. Sobald vier oder mehr Agenten jeweils mehr als ein paar Stunden laufen, sehen Sie Rate-Limit-Warnungen. Ab da ist es günstiger, ein zweites Plus-Abo dazuzunehmen, als auf Pro aufzurüsten — besonders wenn zwei der Agenten überwiegend passiv arbeiten (beobachten, zusammenfassen) und zwei schwer coden. Plus zu 20 $/Monat × N parallele Konten skaliert sauber bis etwa sechs Agenten; darüber lohnt Pro für 200 $.

Abo-Strategie: ein Plus-Konto für leichte Nutzung, eines pro Agent für harte Nutzung, Pro ab sechs Agenten

Drei Muster, die wir täglich nutzen

Das Setup ist nur die halbe Miete. Die Agenten brauchen eine Rolle, und die Rollen müssen eng genug sein, damit sie sich nicht gegenseitig zertrampeln:

Pipeline. Researcher übergibt ein Ticket an Builder, Builder übergibt eine PR an Reviewer, Reviewer übergibt einen Merge an Scribe. Jeder Agent wartet auf den davor. Langsam, aber ruhig — keine Kollisionen, weil immer nur ein Agent gleichzeitig an einer Datei arbeitet
Fan-out. Ein Planer-Agent erzeugt N unabhängige Tickets, N Builder-Agenten nehmen sie parallel aus verschiedenen Repos auf. Schnell, verlangt aber Disziplin im Scope — nie zwei Builder am selben Modul
Watcher + Worker. Ein Agent tailt Logs / PRs / Issues und pingt Sie; die anderen übernehmen gezielt Aufgaben, wenn Sie freigeben. Kein Konfliktrisiko, sehr effizient für Oncall-Workflows

Die Muster schließen sich nicht aus. An den meisten Tagen fahren wir ein Pipeline-Paar plus einen eigenständigen Watcher — fünf Agenten, null Kollisionen, weil die Pipeline den Zugriff auf gemeinsame Dateien serialisiert und der Watcher nie schreibt.

Was Sie sich sparen können

Ein paar Dinge klingen gut und kosten Sie einen Tag:

Einen einzigen Git-Clone zwischen Agenten teilen. Selbst mit einem Branch pro Agent prügeln sich Stash / Commit-Hooks / Build-Caches. Ein Clone pro Agent, pro Droplet
Mehr als einen Codex-Prozess pro Droplet. Das 1-GB-RAM-Basis-Droplet packt genau eine CLI komfortabel; eine zweite OOM-killt die erste mitten im Refactor
Round-Robin auf einem Plus-Konto, wenn Sie aktiv ins Limit laufen. Wenn Sie den „Sie haben Ihre Nachrichten aufgebraucht"-Screen mindestens einmal pro Tag pro Agent sehen, sind 20 $ für ein zweites Plus billiger als der Kontextverlust bei den abgeschnittenen Agenten

Von Null starten

Wenn Sie das ausprobieren wollen, ohne sich aufs volle Setup festzulegen:

Legen Sie zwei Office-Claws-Agenten an. Self-Hosted mit unserer App für 4,99 $/Monat und 4-$-Droplets landet für die ersten zwei bei rund 13 $ gesamt
Geben Sie dem einen eine enge Watcher-Rolle (offene PRs jeden Morgen zusammenfassen) und dem anderen eine Builder-Rolle (an einem bestimmten Repo arbeiten)
Lassen Sie beide eine Woche laufen. Sie sehen die Kollisionsmodi in der Praxis und wie die Decke eines einzelnen Plus-Abos aussieht
Den dritten Agenten mit einem separaten ChatGPT-Konto erst dann dazu, wenn Rate Limits in dieser Woche mehr als zweimal zuschlagen

Die Regel, auf die wir immer zurückkommen: Bezahlen Sie für Isolation dort, wo sie Zeit spart, und teilen Sie dort, wo sie es nicht tut. Droplets sind günstig, Abos weniger, und in der Mitte siedeln die meisten sinnvollen Multi-Agent-Setups.

Weiterlesen

Multi-Agent-Workflows: Spezialisierte KI-Teams betreiben — die rollenbasierte Seite derselben Frage
Langlaufende Codex-Aufgaben — warum jeder dieser Parallel-Agenten einen VPS braucht, keinen Laptop
Self-Hosted vs. Managed — den Plan wählen, der zur Agent-Anzahl passt

Autor

Office Claws Team

Wir gestalten die Zukunft des KI-Agenten-Managements bei Office Claws. Einblicke in Infrastruktur, Sicherheit und Entwicklererfahrung.

Bleib auf dem Laufenden

Erhalte die neuesten Artikel über KI-Agenten, Infrastruktur und Produktupdates direkt in dein Postfach.

Kein Spam. Jederzeit abbestellbar.