Un agent est un outil, quatre agents forment une équipe
Un seul agent d'IA est déjà utile : on pose une question, on obtient une réponse. Mais la plupart du travail réel n'est pas une question unique. C'est une boucle : faire des recherches, rédiger une modification, la relire, la documenter. Un agent généraliste fera les quatre, mais aucune particulièrement bien, et son contexte finira par s'embrouiller à mi-chemin.
Office Claws est conçu pour faire tourner plusieurs agents en parallèle. Chacun a son propre VPS, son propre system prompt et son propre bureau dans l'office en pixel art. La vraie question n'est pas si vous pouvez faire tourner quatre agents — c'est quoi chacun doit faire.
Un setup simple à quatre rôles
Le setup ci-dessous est celui que nous utilisons en interne la plupart du temps. Chaque rôle a un périmètre restreint et un prompt écrit pour ce périmètre.
Le Chercheur
System prompt concentré sur la recherche et la synthèse d'informations. Pas de code, pas d'opinion — uniquement des faits sourcés.
Idéal pour : parcourir de longs fils, collecter de la documentation d'API, extraire des notes de version, comparer des bibliothèques.
Associez-le à un modèle avec une grande fenêtre de contexte. Claude Sonnet 4.6 est un choix par défaut raisonnable.
Le Bâtisseur
System prompt concentré sur l'écriture et la modification de code. Il doit pouvoir exécuter des tests, lire des fichiers et faire de petits commits — mais pas pousser de branches.
Idéal pour : corriger des bugs, petites features, refactorings qui tiennent dans un seul fichier.
Donnez-lui le modèle de coding le plus fort que vous pouvez vous offrir. Le coût en temps d'un mauvais patch dépasse le coût en tokens d'un meilleur modèle.
Le Relecteur
System prompt concentré sur la lecture du diff du Bâtisseur et la détection de problèmes. Il n'écrit jamais de code. Il écrit des inquiétudes — sécurité, correction, clarté — et pointe des lignes précises.
Idéal pour : attraper le genre d'erreur que vous allez manquer parce que vous êtes fatigué et que le diff fait 400 lignes.
Le Scribe
System prompt concentré sur la transformation du travail terminé en prose — notes de version, mises à jour internes, messages de commit, brouillons de blog.
Idéal pour : le dernier kilomètre ennuyeux qui sinon passe à la trappe.
Pourquoi des prompts séparés comptent plus que des modèles séparés
Il est tentant de penser que l'astuce est d'utiliser quatre modèles différents. En général, l'astuce est d'utiliser quatre prompts différents. Un même modèle avec « tu es un senior relecteur, n'écris jamais de code, ne fais que pointer les problèmes » se comporte presque complètement différemment du même modèle avec « tu es un pair programmer utile ».
La séparation des responsabilités est ici un vrai principe d'ingénierie, pas juste de l'hygiène organisationnelle :
- Un system prompt ciblé consomme moins de surcoût de contexte et laisse plus de place au vrai travail
- Un périmètre restreint rend l'agent plus facile à évaluer — vous savez à quoi ressemble une bonne sortie
- Quand quelque chose cloche, vous savez quel agent blâmer et quel prompt ajuster
Comment le travail circule entre agents
Office Claws n'a pas encore de passage de relais automatique entre agents. C'est vous le routeur. En pratique cela donne :
- Posez une question au Chercheur, copiez le résumé
- Collez le résumé dans le Bâtisseur avec une instruction concrète
- Collez le diff obtenu dans le Relecteur et demandez « que changerais-tu ? »
- Quand la deuxième passe du Bâtisseur atterrit, collez le diff final dans le Scribe pour une note de version
Sur le papier cela paraît maladroit, en pratique c'est étonnamment naturel. Le bureau en pixel art aide — chaque agent a un bureau, vous savez donc toujours à qui appartient quel contexte. Pas d'onglets de navigateur, pas de « attends, dans quelle conversation était la doc de l'API ? ».
Notes sur les coûts
Faire tourner quatre agents ne coûte pas quatre fois plus cher qu'un seul. L'essentiel du coût, ce sont les tokens, et les tokens grandissent avec la quantité de discussion avec un agent — pas avec le nombre d'agents.
Sur le plan self-hosted, chaque agent est un droplet DigitalOcean distinct, vous payez donc l'infrastructure. Un droplet de base à 4 $/mois par agent finit par peser, mais reste nettement en dessous de la plupart des sièges SaaS. Sur le plan managé, chaque agent supplémentaire coûte 14,99 $/mois.
Si vous ne faites qu'expérimenter, commencez avec deux : un Chercheur et un Bâtisseur. Ajoutez les deux autres quand vous saurez que vous en avez vraiment besoin.
Ce qu'il ne faut pas faire
- Ne faites pas d'un agent « le manager » des autres. Il n'y a pas encore de protocole agent-à-agent, et demander à un agent de coordonner d'autres agents ne fait qu'halluciner des workflows
- Ne donnez pas tous les outils à chaque agent. Le Relecteur n'a pas besoin d'écrire dans les fichiers. Le Scribe n'a pas besoin d'un compilateur
- N'utilisez pas le même system prompt avec un autre nom. Si deux agents ont le même prompt, vous n'avez pas deux agents — vous avez un agent qui paie pour deux droplets
La suite
Nous travaillons sur plusieurs choses qui rendront les setups multi-agents moins manuels :
- Presets de rôles sauvegardés — configurations en un clic « Chercheur », « Bâtisseur », « Relecteur »
- Copie inter-agents — sélectionner la sortie d'un agent et l'envoyer à un autre sans quitter l'app
- Messages agent-à-agent — expérimental, sous accès restreint, et disponible seulement quand nous serons sûrs que cela n'amplifie pas simplement les erreurs
En attendant, le flux manuel est une feature, pas une limite. C'est vous qui savez en quoi consiste vraiment le travail.