Ein Agent ist ein Werkzeug, vier Agenten sind ein Team
Ein einzelner KI-Agent ist bereits nützlich — eine Frage stellen, eine Antwort erhalten. Aber die meiste echte Arbeit ist keine einzelne Frage. Sie ist eine Schleife: etwas recherchieren, eine Änderung entwerfen, sie prüfen, sie dokumentieren. Ein generalistischer Agent erledigt alle vier, aber keine davon besonders gut, und sein Kontext wird auf halbem Weg unklar.
Office Claws ist dafür gebaut, mehrere Agenten gleichzeitig laufen zu lassen. Jeder bekommt seinen eigenen VPS, seinen eigenen System-Prompt und seinen eigenen Schreibtisch im Pixel-Büro. Die interessante Frage ist nicht, ob Sie vier Agenten betreiben können — sondern was jeder von ihnen tun sollte.
Ein einfaches Vier-Rollen-Setup
Das folgende Setup ist das, welches wir intern an den meisten Tagen verwenden. Jede Rolle hat einen engen Zuständigkeitsbereich und einen Prompt, der für diesen Bereich geschrieben wurde.
Der Researcher
System-Prompt konzentriert sich auf das Finden und Zusammenfassen von Informationen. Kein Code, keine Meinungen — nur Fakten mit Quellen.
Geeignet für: lange Threads überfliegen, API-Dokumentation sammeln, Release-Notes auswerten, Bibliotheken vergleichen.
Kombinieren Sie ihn mit einem Modell mit großem Kontextfenster. Claude Sonnet 4.6 ist hier ein vernünftiger Standard.
Der Builder
System-Prompt konzentriert sich auf das Schreiben und Bearbeiten von Code. Er sollte Tests ausführen, Dateien lesen und kleine Commits erstellen dürfen — aber keine Branches pushen.
Geeignet für: Bugs beheben, kleine Features, Refactorings innerhalb einer Datei.
Geben Sie diesem Agenten das stärkste Coding-Modell, das Sie sich leisten können. Die Zeitkosten eines schlechten Patches sind höher als die Token-Kosten eines besseren Modells.
Der Reviewer
System-Prompt konzentriert sich darauf, den Diff des Builders zu lesen und Probleme zu finden. Er schreibt nie Code. Er schreibt Bedenken — Sicherheit, Korrektheit, Klarheit — und zeigt auf bestimmte Zeilen.
Geeignet für: die Art von Fehler zu finden, die Sie übersehen, weil Sie müde sind und der Diff 400 Zeilen umfasst.
Der Scribe
System-Prompt konzentriert sich darauf, fertige Arbeit in Prosa zu verwandeln — Release-Notes, interne Updates, Commit-Nachrichten, Blog-Entwürfe.
Geeignet für: die langweilige letzte Meile, die sonst übersprungen wird.
Warum getrennte Prompts wichtiger sind als getrennte Modelle
Es ist verlockend zu denken, der Trick bestehe darin, vier verschiedene Modelle zu verwenden. Meist besteht der Trick darin, vier verschiedene Prompts zu verwenden. Ein einzelnes Modell mit „Du bist ein Senior Reviewer, schreibe niemals Code, finde nur Probleme" verhält sich fast völlig anders als dasselbe Modell mit „Du bist ein hilfsbereiter Pair-Programmer".
Trennung der Zuständigkeiten ist hier ein echtes Engineering-Prinzip, nicht nur organisatorische Hygiene:
- Ein fokussierter System-Prompt verbraucht weniger Kontext-Overhead und lässt mehr Platz für die eigentliche Arbeit
- Enger Zuständigkeitsbereich macht den Agenten einfacher zu bewerten — Sie wissen, wie gute Ausgabe aussieht
- Wenn etwas schiefgeht, wissen Sie, welcher Agent schuld ist und welcher Prompt angepasst werden muss
Wie Arbeit zwischen Agenten fließt
Office Claws hat noch keine automatische Agent-zu-Agent-Übergabe. Sie sind der Router. In der Praxis sieht das so aus:
- Stellen Sie dem Researcher eine Frage, kopieren Sie die Zusammenfassung
- Fügen Sie die Zusammenfassung mit einer konkreten Anweisung in den Builder ein
- Fügen Sie den resultierenden Diff in den Reviewer ein und fragen Sie: „Was würdest du ändern?"
- Wenn der zweite Durchlauf des Builders fertig ist, fügen Sie den finalen Diff in den Scribe für eine Release-Note ein
Auf dem Papier wirkt das umständlich und ist in der Praxis überraschend natürlich. Das Pixel-Büro hilft dabei — jeder Agent hat einen Schreibtisch, also wissen Sie immer, welcher Kontext zu wem gehört. Keine Browser-Tabs, kein „Moment, in welchem Gespräch war die API-Doku?"
Kostenhinweise
Vier Agenten zu betreiben kostet nicht das Vierfache eines einzelnen Agenten. Der größte Kostenblock sind Tokens, und Tokens skalieren damit, wie viel Sie mit einem Agenten sprechen — nicht wie viele Agenten existieren.
Im Self-Hosted-Plan ist jeder Agent ein separater DigitalOcean-Droplet, also zahlen Sie für die Infrastruktur. Ein Basis-Droplet für 4 $/Monat pro Agent summiert sich, liegt aber immer noch deutlich unter den meisten SaaS-Sitzen. Im Managed-Plan kostet jeder zusätzliche Agent 14,99 $/Monat.
Wenn Sie nur experimentieren, fangen Sie mit zwei an: einem Researcher und einem Builder. Fügen Sie die anderen beiden hinzu, sobald Sie wissen, dass Sie sie wirklich brauchen.
Was Sie nicht tun sollten
- Machen Sie keinen Agenten zum „Manager" der anderen. Es gibt noch kein Agent-zu-Agent-Protokoll, und einen Agenten zu bitten, andere Agenten zu koordinieren, führt nur dazu, dass er sich Workflows ausdenkt
- Geben Sie nicht jedem Agenten jedes Werkzeug. Der Reviewer braucht keinen Schreibzugriff auf Dateien. Der Scribe braucht keinen Compiler
- Verwenden Sie nicht denselben System-Prompt mit einem anderen Namen. Wenn zwei Agenten denselben Prompt haben, haben Sie nicht zwei Agenten — Sie haben einen Agenten, der für zwei Droplets zahlt
Wohin es als Nächstes geht
Wir arbeiten an einigen Dingen, die Multi-Agent-Setups weniger manuell machen werden:
- Gespeicherte Rollen-Presets — Ein-Klick-Konfigurationen für „Researcher", „Builder", „Reviewer"
- Agent-übergreifendes Kopieren — Ausgabe eines Agenten markieren und an einen anderen senden, ohne die App zu verlassen
- Agent-zu-Agent-Nachrichten — experimentell, gegated und erst dann verfügbar, wenn wir sicher sind, dass es Fehler nicht einfach verstärkt
Bis dahin ist der manuelle Flow ein Feature, keine Einschränkung. Sie sind derjenige, der weiß, worum es bei der Arbeit eigentlich geht.