Workflows multi-agents : des équipes d'IA spécialisées dans votre bureau en pixel art

Workflows multi-agents : des équipes d'IA spécialisées dans votre bureau en pixel art — Comment attribuer des rôles à plusieurs agents Office Claws pour qu'ils couvrent recherche, code, revue et rédaction comme une équipe coordonnée.
17 avr. 20265 min de lecture
Share with

Un agent est un outil, quatre agents forment une équipe

Un seul agent d'IA est déjà utile : on pose une question, on obtient une réponse. Mais la plupart du travail réel n'est pas une question unique. C'est une boucle : faire des recherches, rédiger une modification, la relire, la documenter. Un agent généraliste fera les quatre, mais aucune particulièrement bien, et son contexte finira par s'embrouiller à mi-chemin.

Office Claws est conçu pour faire tourner plusieurs agents en parallèle. Chacun a son propre VPS, son propre system prompt et son propre bureau dans l'office en pixel art. La vraie question n'est pas si vous pouvez faire tourner quatre agents — c'est quoi chacun doit faire.

Quatre agents par rôle assis à leur bureau dans le bureau en pixel art

Un setup simple à quatre rôles

Le setup ci-dessous est celui que nous utilisons en interne la plupart du temps. Chaque rôle a un périmètre restreint et un prompt écrit pour ce périmètre.

Le Chercheur

System prompt concentré sur la recherche et la synthèse d'informations. Pas de code, pas d'opinion — uniquement des faits sourcés.

Idéal pour : parcourir de longs fils, collecter de la documentation d'API, extraire des notes de version, comparer des bibliothèques.

Associez-le à un modèle avec une grande fenêtre de contexte. Claude Sonnet 4.6 est un choix par défaut raisonnable.

Le Bâtisseur

System prompt concentré sur l'écriture et la modification de code. Il doit pouvoir exécuter des tests, lire des fichiers et faire de petits commits — mais pas pousser de branches.

Idéal pour : corriger des bugs, petites features, refactorings qui tiennent dans un seul fichier.

Donnez-lui le modèle de coding le plus fort que vous pouvez vous offrir. Le coût en temps d'un mauvais patch dépasse le coût en tokens d'un meilleur modèle.

Le Relecteur

System prompt concentré sur la lecture du diff du Bâtisseur et la détection de problèmes. Il n'écrit jamais de code. Il écrit des inquiétudes — sécurité, correction, clarté — et pointe des lignes précises.

Idéal pour : attraper le genre d'erreur que vous allez manquer parce que vous êtes fatigué et que le diff fait 400 lignes.

Le Scribe

System prompt concentré sur la transformation du travail terminé en prose — notes de version, mises à jour internes, messages de commit, brouillons de blog.

Idéal pour : le dernier kilomètre ennuyeux qui sinon passe à la trappe.

Pourquoi des prompts séparés comptent plus que des modèles séparés

Il est tentant de penser que l'astuce est d'utiliser quatre modèles différents. En général, l'astuce est d'utiliser quatre prompts différents. Un même modèle avec « tu es un senior relecteur, n'écris jamais de code, ne fais que pointer les problèmes » se comporte presque complètement différemment du même modèle avec « tu es un pair programmer utile ».

La séparation des responsabilités est ici un vrai principe d'ingénierie, pas juste de l'hygiène organisationnelle :

  • Un system prompt ciblé consomme moins de surcoût de contexte et laisse plus de place au vrai travail
  • Un périmètre restreint rend l'agent plus facile à évaluer — vous savez à quoi ressemble une bonne sortie
  • Quand quelque chose cloche, vous savez quel agent blâmer et quel prompt ajuster

Comment une tâche circule du Chercheur au Bâtisseur au Relecteur au Scribe

Comment le travail circule entre agents

Office Claws n'a pas encore de passage de relais automatique entre agents. C'est vous le routeur. En pratique cela donne :

  1. Posez une question au Chercheur, copiez le résumé
  2. Collez le résumé dans le Bâtisseur avec une instruction concrète
  3. Collez le diff obtenu dans le Relecteur et demandez « que changerais-tu ? »
  4. Quand la deuxième passe du Bâtisseur atterrit, collez le diff final dans le Scribe pour une note de version

Sur le papier cela paraît maladroit, en pratique c'est étonnamment naturel. Le bureau en pixel art aide — chaque agent a un bureau, vous savez donc toujours à qui appartient quel contexte. Pas d'onglets de navigateur, pas de « attends, dans quelle conversation était la doc de l'API ? ».

Notes sur les coûts

Faire tourner quatre agents ne coûte pas quatre fois plus cher qu'un seul. L'essentiel du coût, ce sont les tokens, et les tokens grandissent avec la quantité de discussion avec un agent — pas avec le nombre d'agents.

Sur le plan self-hosted, chaque agent est un droplet DigitalOcean distinct, vous payez donc l'infrastructure. Un droplet de base à 4 $/mois par agent finit par peser, mais reste nettement en dessous de la plupart des sièges SaaS. Sur le plan managé, chaque agent supplémentaire coûte 14,99 $/mois.

Si vous ne faites qu'expérimenter, commencez avec deux : un Chercheur et un Bâtisseur. Ajoutez les deux autres quand vous saurez que vous en avez vraiment besoin.

Ce qu'il ne faut pas faire

  • Ne faites pas d'un agent « le manager » des autres. Il n'y a pas encore de protocole agent-à-agent, et demander à un agent de coordonner d'autres agents ne fait qu'halluciner des workflows
  • Ne donnez pas tous les outils à chaque agent. Le Relecteur n'a pas besoin d'écrire dans les fichiers. Le Scribe n'a pas besoin d'un compilateur
  • N'utilisez pas le même system prompt avec un autre nom. Si deux agents ont le même prompt, vous n'avez pas deux agents — vous avez un agent qui paie pour deux droplets

La suite

Nous travaillons sur plusieurs choses qui rendront les setups multi-agents moins manuels :

  • Presets de rôles sauvegardés — configurations en un clic « Chercheur », « Bâtisseur », « Relecteur »
  • Copie inter-agents — sélectionner la sortie d'un agent et l'envoyer à un autre sans quitter l'app
  • Messages agent-à-agent — expérimental, sous accès restreint, et disponible seulement quand nous serons sûrs que cela n'amplifie pas simplement les erreurs

En attendant, le flux manuel est une feature, pas une limite. C'est vous qui savez en quoi consiste vraiment le travail.

Auteur

Office Claws Team

Nous construisons le futur de la gestion des agents IA chez Office Claws. Partage d'analyses sur l'infrastructure, la sécurité et l'expérience développeur.

Restez informé

Recevez les derniers articles sur les agents IA, l'infrastructure et les mises à jour produit directement dans votre boîte de réception.

Pas de spam. Désabonnement à tout moment.