Cómo ejecutar varios agentes Codex a la vez sin tropezar contigo mismo

21 abr 20266 min de lectura

Share with

Tabla de contenidos

Un Codex es fácil. Cuatro son un problema de ops.

Lanzar un único agente Codex es un comando codex. Inicia sesión, coge tu repo, hace lo suyo. El primer intento «multi-agente» de la mayoría consiste en abrir cuatro terminales y escribir el mismo comando cuatro veces. Eso funciona más o menos durante diez minutos — hasta que dos agentes se pelean por los mismos archivos, o uno se come el tope de mensajes de ChatGPT Plus y se lleva por delante a los otros tres.

La pregunta real no es si puedes correr varios agentes Codex a la vez. Es cómo conseguir que no se pisen entre sí. Nosotros corremos entre cuatro y seis agentes Codex en paralelo casi todos los días, y los modos de fallo se repiten. Éste es el montaje que los sobrevive.

Cuatro agentes Codex corriendo en hosts VPS aislados, conectados por Tailscale

Qué choca de verdad cuando corres agentes en paralelo

Antes de elegir un montaje, conviene ser preciso sobre qué se rompe. Hemos visto tres categorías de colisión:

Colisiones de autenticación. Codex CLI cachea sus credenciales de suscripción en ~/.codex/. Dos procesos compartiendo ese directorio se pelean por el refresh de token, se deslogan el uno al otro o disparan un bucle de reautenticación que bloquea la cuenta varios minutos
Colisiones de sistema de archivos. Dos agentes editando el mismo árbol de trabajo se sobrescriben mutuamente. Incluso un agente lanzando go test mientras otro edita produce fallos fantasma que se comen un trozo de contexto intentando depurarlos
Colisiones de rate limit. ChatGPT Plus tope por mensajes en una ventana deslizante — por cuenta, no por dispositivo. Cuatro agentes hambrientos en una única cuenta Plus tocan el tope en aproximadamente un cuarto de su tiempo individual; un agente ruidoso mata de hambre a los demás

La solución para las tres es la misma: que cada agente tenga su propia caja, su propio directorio home y — si los estás exprimiendo — su propia cuenta.

El montaje que aguanta el uso real

En Office Claws, cada agente que creas aterriza en un droplet dedicado de DigitalOcean, provisionado en unos dos minutos y medio. Ese droplet tiene su propio directorio ~/.codex/, su propio clon del repo y su propia identidad de Tailscale. No tienes que pensar en ninguna de las colisiones anteriores — el aislamiento es el valor por defecto.

Preocupación	Multi-terminal en el portátil	Multi-agente Office Claws
Caché de auth	`~/.codex/` compartido — races	separado por droplet
Árbol de trabajo	compartido — sobrescrituras	un repo por agente
Rate limit	una cuenta, todos los agentes	una cuenta por agente (opcional)
Recuperación	matar todos los terminales	reiniciar un droplet
Visibilidad	4 paneles tmux	4 escritorios en la oficina píxel

Un día típico de cuatro agentes se ve así:

researcher-agent  → reads issues, writes tickets
builder-agent     → takes a ticket, implements it
reviewer-agent    → reviews the builder's PRs
scribe-agent      → writes release notes, updates docs

Cada uno vive en su propio VPS. Cada uno tiene su propia sesión de Codex. Cada uno aparece como un personaje distinto en la oficina píxel, así que ves de un vistazo quién está en qué.

Dos caminos en la parte de la suscripción

La segunda pregunta es cuántas cuentas de ChatGPT necesitas. Es menos obvio que el lado de la infra, y la respuesta depende de cuánto aprieten los agentes.

Una suscripción, varios agentes. Para uso ligero a moderado — dos o tres agentes, unas horas de trabajo al día cada uno — una sola suscripción Plus (20 $/mes) lo cubre todo. Plus tope por mensajes en una ventana deslizante, no por cuenta-por-dispositivo, así que dos agentes turnándose se quedan muy por debajo del techo. Este es el punto de partida.

Una suscripción por agente. En cuanto tienes cuatro o más agentes corriendo más de unas pocas horas cada uno, empezarás a ver avisos de rate limit. En ese punto sale más barato añadir una segunda Plus que pasarte a Pro, sobre todo si dos de los agentes hacen trabajo mayormente pasivo (observar, resumir) y dos codean duro. Plus a 20 $/mes × N cuentas paralelas escala limpiamente hasta unos seis agentes; por encima, Pro a 200 $ empieza a tener sentido.

Estrategia de suscripción: una cuenta Plus para uso ligero, una por agente para uso pesado, Pro por encima de seis agentes

Tres patrones que usamos a diario

El montaje es solo la mitad del cuadro. Los agentes necesitan un rol, y los roles tienen que ser lo bastante estrechos para no pisarse:

En pipeline. El researcher pasa un ticket al builder, el builder pasa una PR al reviewer, el reviewer pasa un merge al scribe. Cada agente espera al anterior. Lento pero tranquilo — sin colisiones porque sólo un agente está activo en un archivo a la vez
Fan-out. Un agente planificador produce N tickets independientes; N builders los toman en paralelo desde repos distintos. Rápido, pero pide disciplina con el alcance — nunca dos builders sobre el mismo módulo
Watcher + worker. Un agente sigue logs / PRs / issues y te avisa; otros se ocupan de tareas concretas cuando tú apruebas. Cero riesgo de conflicto, muy eficiente para flujos tipo oncall

Los patrones no se excluyen. Casi a diario corremos un pareado en pipeline más un watcher independiente — cinco agentes, cero colisiones, porque la pipeline serializa el acceso a los archivos compartidos y el watcher no escribe nada.

Qué saltarte

Algunas ideas suenan bien y te cuestan un día:

Compartir un único clon de git entre agentes. Incluso con ramas por agente, stash / hooks de commit / cachés de build pelean. Un clon por agente, por droplet
Correr más de un proceso Codex por droplet. El droplet básico de 1 GB de RAM aguanta una CLI con holgura; un segundo OOM-mata al primero a mitad de un refactor
Round-robin en una cuenta Plus cuando ya estás topando límites. Si ves la pantalla «has gastado tus mensajes» en un agente al día, el coste de una segunda Plus (20 $) es inferior al coste del contexto perdido en los agentes a los que se corta

Empezar desde cero

Si quieres probar esto sin comprometerte al montaje completo:

Levanta dos agentes Office Claws. Self-Hosted con nuestra app a 4,99 $/mes y droplets de 4 $/mes te deja en unos 13 $ en total para los dos primeros
Asigna a uno un rol estrecho de watcher (resumir PRs abiertas cada mañana) y al otro un rol de builder (trabajar en un repo concreto)
Déjalos correr una semana. Verás los modos de colisión en la práctica y la forma del techo con una única suscripción Plus
Añade el tercer agente con una cuenta ChatGPT separada sólo si has visto rate limits morder más de dos veces esa semana

La regla a la que volvemos: paga por aislamiento donde te ahorre tiempo, y comparte donde no. Los droplets son baratos, las suscripciones menos, y en el término medio viven la mayoría de los montajes multi-agente útiles.

Lecturas relacionadas

Flujos multi-agente: equipos de IA especializados — el lado de roles del mismo problema
Tareas largas de Codex — por qué cada uno de esos agentes paralelos necesita un VPS, no un portátil
Self-Hosted vs Managed — elegir el plan que case con la cantidad de agentes

Autor

Office Claws Team

Construyendo el futuro de la gestión de agentes de IA en Office Claws. Compartiendo conocimientos sobre infraestructura, seguridad y experiencia del desarrollador.

Mantente al día

Recibe los últimos artículos sobre agentes de IA, infraestructura y novedades del producto directamente en tu bandeja de entrada.

Sin spam. Cancela tu suscripción en cualquier momento.