Dos formas de pagar por el mismo modelo
Si quieres que Codex mueva un agente dentro de Office Claws, tienes dos caminos. Puedes apuntar la Codex CLI a tu suscripción de ChatGPT Plus o Pro y pagar una tarifa plana mensual. O puedes conectar una API key de OpenAI y pagar por token. Mismo modelo de fondo, facturas con formas completamente distintas.
La mayoría de los desarrolladores eligen lo que ya tenían. Funciona, pero a menudo deja dinero sobre la mesa. Una semana de trabajo real de programación hace la respuesta obvia — basta con contar los tokens primero.
Cómo factura cada camino en realidad
La suscripción de ChatGPT es un techo. Plus son 20 $/mes, Pro son 200 $/mes. Ambos incluyen acceso a la Codex CLI y ambos te limitan por número de mensajes en una ventana móvil, no por tokens brutos. Si llegas al tope, esperas o subes de plan. Hasta entonces, cada petición adicional es gratis al margen.
La API de OpenAI es un contador. No hay suelo ni techo — pagas por cada token de entrada y cada token de salida. Los modelos de codificación con mucho razonamiento cuestan en torno a 5–15 $ por millón de tokens de entrada y 30–60 $ por millón de tokens de salida. Una sola conversación larga puede mover la aguja de la factura por desarrollador.
| ChatGPT Plus | ChatGPT Pro | OpenAI API | |
|---|---|---|---|
| Forma | Mensual fija | Mensual fija | Por token |
| Precio | 20 $/mes | 200 $/mes | Variable |
| Acceso a Codex CLI | Sí | Sí, con más límite | Sí, vía API key |
| Coste marginal por petición | 0 $ hasta el tope | 0 $ hasta el tope | Cada token se factura |
| Quién paga el exceso | Tú esperas | Tú esperas | Tú, al instante |
Lo que realmente consume una semana de código
Las listas de precios abstractas no te dicen si acabarás en 15 $ o 300 $ al mes. Los conteos de tokens sí. Esto es lo que vemos en agentes haciendo trabajo real en escritorios de Office Claws:
- Día ligero — unas cuantas preguntas concretas, diffs pequeños, sin refactors profundos. Unos 150K–400K tokens entre entrada y salida
- Día enfocado — una sola feature, el agente mantiene el código en contexto, vuelve a correr tests tras cada patch. 1M–3M tokens es normal
- Día duro — refactor multi-archivo, el agente lee decenas de archivos, largo ida y vuelta sobre casos límite. 5M–10M tokens es común, 20M+ no es raro
Multiplica un día enfocado por 20 días laborables y aterrizas en 20M–60M tokens al mes de un desarrollador con un agente. En la franja alta de los precios de la API, eso es una factura de tres cifras medias. En la franja baja, sigue estando muy por encima de la suscripción de 20 $ de Plus.
El punto de equilibrio
Por debajo de unos 2M tokens al mes, la API suele ser más barata. Eres usuario ocasional o aficionado, y Plus se te queda grande. Es una minoría.
Entre 2M y 20M tokens al mes, Plus a 20 $ gana con mucha diferencia — a menudo entre 5× y 15× más barato que la factura equivalente de API por el mismo trabajo. Aquí vive la mayoría de los desarrolladores en solitario.
Por encima de 20M tokens al mes, Plus empieza a mandarte límites de ritmo. Pro a 200 $ amplía el techo y, según nuestras mediciones, sigue siendo más barato que la API hasta aproximadamente 60M–100M tokens de trabajo duro de programación. Por encima de eso, el precio predecible por token de la API vuelve a resultar atractivo — sobre todo porque dejas de pelearte con los límites.
Monthly tokens Best value
-----------------------------
< 2M OpenAI API
2M – 20M ChatGPT Plus ($20)
20M – 80M ChatGPT Pro ($200)
> 80M API or multi-seat Pro
Estos tramos se moverán si OpenAI reajusta cualquiera de los dos productos, pero la forma de la curva es duradera. Las tarifas planas ganan el centro. La facturación por uso gana las dos colas.
Dónde la API sigue ganando
Un flujo basado en suscripción no es la respuesta para todos los equipos. Algunas situaciones te devuelven a la API:
- Imputación de costes en un equipo — si necesitas facturación por proyecto, la granularidad por token de la API ahorra dinero real en operaciones
- Cargas programáticas — jobs de CI, evaluaciones por lotes, cualquier cosa que corra sin humano detrás. Ahí el contrato es la API key, no una suscripción personal
- SSO y compras corporativas — los planes business de OpenAI traen SSO, logs de auditoría y DPAs que las suscripciones individuales no
- Gasto mensual predecible a escala — los equipos de finanzas a menudo prefieren una factura variable que puedan modelar antes que una tarifa plana que no puedan limitar
Fuera de esos casos, para un desarrollador corriendo uno o dos agentes ocho horas al día, la suscripción casi siempre gana.
Hacer viable la suscripción en un VPS
Hay un truco. Correr Codex desde la suscripción ha significado históricamente ejecutar la CLI en tu portátil, que muere al cerrarlo y desaparece al cambiar de red. Los agentes que necesitan correr horas — builders, reviewers, cualquier cosa autónoma — no caben en un portátil.
Office Claws se construyó para cerrar esa brecha. En el plan self-hosted (4,99 $/mes, 2,99 $ para nuestros primeros 100 usuarios) provisionamos un droplet de DigitalOcean con la Codex CLI preinstalada, en red vía Tailscale, y con sesión iniciada en tu suscripción de ChatGPT. El agente corre 24/7 en el VPS. Tu suscripción paga los tokens. El droplet cuesta unos pocos dólares de gasto en DigitalOcean al mes.
Resultado: un agente Codex que cuesta unos 20 $/mes por el acceso al modelo más unos pocos dólares por la máquina. La misma carga en la API aterrizaría de forma habitual entre 80 $ y 400 $, dependiendo de cuánto se empuje al agente.
Una recomendación práctica
Si no sabes qué camino te encaja:
- Empieza con ChatGPT Plus. 20 $ son un seguro barato y cubren la mayoría de cargas de un único desarrollador
- Si los límites de ritmo te interrumpen el flujo lo bastante, pasa a Pro. Los 200 $ compensan si Codex es central en tu día
- Solo pásate a la API si aplica uno de los casos límite de arriba, o si realmente quemas más de ~80M tokens/mes
Para todo lo demás, la suscripción es la factura más barata, la más fácil de prever, y la que no te castiga por hacerle una pregunta más al agente. Córrela en un VPS para que siga corriendo cuando no estás mirando, y la cuenta cuadra.
Lecturas relacionadas
- Reducir la factura de tu agente de IA — las tres palancas que de verdad mueven la factura de tokens
- Self-Hosted vs Managed — elegir el plan de Office Claws que encaja con el flujo de arriba