Un Codex es fácil. Cuatro son un problema de ops.
Lanzar un único agente Codex es un comando codex. Inicia sesión, coge tu repo, hace lo suyo. El primer intento «multi-agente» de la mayoría consiste en abrir cuatro terminales y escribir el mismo comando cuatro veces. Eso funciona más o menos durante diez minutos — hasta que dos agentes se pelean por los mismos archivos, o uno se come el tope de mensajes de ChatGPT Plus y se lleva por delante a los otros tres.
La pregunta real no es si puedes correr varios agentes Codex a la vez. Es cómo conseguir que no se pisen entre sí. Nosotros corremos entre cuatro y seis agentes Codex en paralelo casi todos los días, y los modos de fallo se repiten. Éste es el montaje que los sobrevive.
Qué choca de verdad cuando corres agentes en paralelo
Antes de elegir un montaje, conviene ser preciso sobre qué se rompe. Hemos visto tres categorías de colisión:
- Colisiones de autenticación. Codex CLI cachea sus credenciales de suscripción en
~/.codex/. Dos procesos compartiendo ese directorio se pelean por el refresh de token, se deslogan el uno al otro o disparan un bucle de reautenticación que bloquea la cuenta varios minutos - Colisiones de sistema de archivos. Dos agentes editando el mismo árbol de trabajo se sobrescriben mutuamente. Incluso un agente lanzando
go testmientras otro edita produce fallos fantasma que se comen un trozo de contexto intentando depurarlos - Colisiones de rate limit. ChatGPT Plus tope por mensajes en una ventana deslizante — por cuenta, no por dispositivo. Cuatro agentes hambrientos en una única cuenta Plus tocan el tope en aproximadamente un cuarto de su tiempo individual; un agente ruidoso mata de hambre a los demás
La solución para las tres es la misma: que cada agente tenga su propia caja, su propio directorio home y — si los estás exprimiendo — su propia cuenta.
El montaje que aguanta el uso real
En Office Claws, cada agente que creas aterriza en un droplet dedicado de DigitalOcean, provisionado en unos dos minutos y medio. Ese droplet tiene su propio directorio ~/.codex/, su propio clon del repo y su propia identidad de Tailscale. No tienes que pensar en ninguna de las colisiones anteriores — el aislamiento es el valor por defecto.
| Preocupación | Multi-terminal en el portátil | Multi-agente Office Claws |
|---|---|---|
| Caché de auth | ~/.codex/ compartido — races | separado por droplet |
| Árbol de trabajo | compartido — sobrescrituras | un repo por agente |
| Rate limit | una cuenta, todos los agentes | una cuenta por agente (opcional) |
| Recuperación | matar todos los terminales | reiniciar un droplet |
| Visibilidad | 4 paneles tmux | 4 escritorios en la oficina píxel |
Un día típico de cuatro agentes se ve así:
researcher-agent → reads issues, writes tickets
builder-agent → takes a ticket, implements it
reviewer-agent → reviews the builder's PRs
scribe-agent → writes release notes, updates docs
Cada uno vive en su propio VPS. Cada uno tiene su propia sesión de Codex. Cada uno aparece como un personaje distinto en la oficina píxel, así que ves de un vistazo quién está en qué.
Dos caminos en la parte de la suscripción
La segunda pregunta es cuántas cuentas de ChatGPT necesitas. Es menos obvio que el lado de la infra, y la respuesta depende de cuánto aprieten los agentes.
Una suscripción, varios agentes. Para uso ligero a moderado — dos o tres agentes, unas horas de trabajo al día cada uno — una sola suscripción Plus (20 $/mes) lo cubre todo. Plus tope por mensajes en una ventana deslizante, no por cuenta-por-dispositivo, así que dos agentes turnándose se quedan muy por debajo del techo. Este es el punto de partida.
Una suscripción por agente. En cuanto tienes cuatro o más agentes corriendo más de unas pocas horas cada uno, empezarás a ver avisos de rate limit. En ese punto sale más barato añadir una segunda Plus que pasarte a Pro, sobre todo si dos de los agentes hacen trabajo mayormente pasivo (observar, resumir) y dos codean duro. Plus a 20 $/mes × N cuentas paralelas escala limpiamente hasta unos seis agentes; por encima, Pro a 200 $ empieza a tener sentido.
Tres patrones que usamos a diario
El montaje es solo la mitad del cuadro. Los agentes necesitan un rol, y los roles tienen que ser lo bastante estrechos para no pisarse:
- En pipeline. El researcher pasa un ticket al builder, el builder pasa una PR al reviewer, el reviewer pasa un merge al scribe. Cada agente espera al anterior. Lento pero tranquilo — sin colisiones porque sólo un agente está activo en un archivo a la vez
- Fan-out. Un agente planificador produce N tickets independientes; N builders los toman en paralelo desde repos distintos. Rápido, pero pide disciplina con el alcance — nunca dos builders sobre el mismo módulo
- Watcher + worker. Un agente sigue logs / PRs / issues y te avisa; otros se ocupan de tareas concretas cuando tú apruebas. Cero riesgo de conflicto, muy eficiente para flujos tipo oncall
Los patrones no se excluyen. Casi a diario corremos un pareado en pipeline más un watcher independiente — cinco agentes, cero colisiones, porque la pipeline serializa el acceso a los archivos compartidos y el watcher no escribe nada.
Qué saltarte
Algunas ideas suenan bien y te cuestan un día:
- Compartir un único clon de git entre agentes. Incluso con ramas por agente, stash / hooks de commit / cachés de build pelean. Un clon por agente, por droplet
- Correr más de un proceso Codex por droplet. El droplet básico de 1 GB de RAM aguanta una CLI con holgura; un segundo OOM-mata al primero a mitad de un refactor
- Round-robin en una cuenta Plus cuando ya estás topando límites. Si ves la pantalla «has gastado tus mensajes» en un agente al día, el coste de una segunda Plus (20 $) es inferior al coste del contexto perdido en los agentes a los que se corta
Empezar desde cero
Si quieres probar esto sin comprometerte al montaje completo:
- Levanta dos agentes Office Claws. Self-Hosted con nuestra app a 4,99 $/mes y droplets de 4 $/mes te deja en unos 13 $ en total para los dos primeros
- Asigna a uno un rol estrecho de watcher (resumir PRs abiertas cada mañana) y al otro un rol de builder (trabajar en un repo concreto)
- Déjalos correr una semana. Verás los modos de colisión en la práctica y la forma del techo con una única suscripción Plus
- Añade el tercer agente con una cuenta ChatGPT separada sólo si has visto rate limits morder más de dos veces esa semana
La regla a la que volvemos: paga por aislamiento donde te ahorre tiempo, y comparte donde no. Los droplets son baratos, las suscripciones menos, y en el término medio viven la mayoría de los montajes multi-agente útiles.
Lecturas relacionadas
- Flujos multi-agente: equipos de IA especializados — el lado de roles del mismo problema
- Tareas largas de Codex — por qué cada uno de esos agentes paralelos necesita un VPS, no un portátil
- Self-Hosted vs Managed — elegir el plan que case con la cantidad de agentes