Codex-Abo vs. API: Welche Rechnung ist wirklich günstiger?

19. Apr. 20265 Min. Lesezeit

Share with

Inhaltsverzeichnis

Zwei Wege, dasselbe Modell zu bezahlen

Wenn Sie Codex einen Agenten innerhalb von Office Claws antreiben lassen wollen, führen zwei Wege dorthin. Sie können die Codex CLI an Ihr ChatGPT Plus- oder Pro-Abo anbinden und einen pauschalen Monatsbetrag zahlen. Oder Sie hinterlegen einen OpenAI API-Key und zahlen pro Token. Gleiches Modellfundament, völlig unterschiedliche Rechnungsformen.

Die meisten Entwickler nehmen das, was sie ohnehin schon hatten. Das funktioniert, lässt aber oft Geld liegen. Eine Woche echter Programmierarbeit macht die Antwort offensichtlich — man muss nur erst die Tokens zählen.

Zwei Abrechnungsmodelle für Codex: Pauschal-Abo vs. pro Token via API

Wie die beiden Wege tatsächlich abrechnen

Das ChatGPT-Abo ist eine Obergrenze. Plus kostet 20 $/Monat, Pro kostet 200 $/Monat. Beide enthalten Zugriff auf die Codex CLI, und beide drosseln über die Anzahl der Nachrichten in einem rollierenden Fenster — nicht über rohe Tokens. Stößt man an die Grenze, wartet man oder rüstet auf. Bis dahin ist jede zusätzliche Anfrage marginal kostenlos.

Die OpenAI API ist ein Zähler. Es gibt weder Mindest- noch Höchstbetrag — Sie zahlen für jeden Eingabe-Token und jeden Ausgabe-Token. Reasoning-intensive Coding-Modelle liegen grob bei 5–15 $ pro Million Input-Tokens und 30–60 $ pro Million Output-Tokens. Ein einziges langes Gespräch kann die Rechnung pro Entwickler spürbar bewegen.

	ChatGPT Plus	ChatGPT Pro	OpenAI API
Form	Monatspauschale	Monatspauschale	Pro Token
Preis	20 $/Monat	200 $/Monat	Variabel
Codex-CLI-Zugriff	Ja	Ja, höhere Limits	Ja, über API-Key
Marginale Kosten pro Anfrage	0 $ bis zum Cap	0 $ bis zum Cap	Jeder Token wird abgerechnet
Wer trägt das Überschreiten	Sie warten	Sie warten	Sie, sofort

Was eine Programmierwoche wirklich verbrennt

Abstrakte Preislisten sagen Ihnen nicht, ob Sie bei 15 $ oder 300 $ pro Monat landen. Token-Zahlen schon. Das sehen wir bei Agenten, die auf Office-Claws-Desktops reale Arbeit erledigen:

Leichter Tag — ein paar gezielte Fragen, kleine Diffs, keine tiefen Refactorings. Rund 150K–400K Tokens insgesamt (Input + Output)
Fokussierter Tag — ein einzelnes Feature, Agent hält die Codebase im Kontext, führt nach jedem Patch Tests aus. 1M–3M Tokens sind normal
Harter Tag — Multi-File-Refactor, Agent liest Dutzende Dateien, langes Hin und Her zu Edge Cases. 5M–10M Tokens sind üblich, 20M+ keine Seltenheit

Rechnen Sie einen fokussierten Tag auf 20 Arbeitstage hoch und Sie liegen bei 20M–60M Tokens pro Monat für einen Entwickler mit einem Agenten. Am oberen Ende der API-Preise ist das eine Rechnung im mittleren dreistelligen Bereich. Am unteren Ende immer noch deutlich oberhalb des 20 $-Plus-Abos.

Monatlicher Token-Verbrauch nach Nutzungsmuster

Der Break-even

Unter etwa 2M Tokens pro Monat ist die API meist günstiger. Sie sind Hobby- oder Gelegenheitsnutzer, und Plus ist überdimensioniert. Das ist eine kleine Gruppe.

Zwischen 2M und 20M Tokens pro Monat gewinnt Plus für 20 $ mit großem Abstand — oft 5× bis 15× günstiger als die entsprechende API-Rechnung für dieselbe Arbeit. Hier sind die meisten Solo-Entwickler zu Hause.

Über 20M Tokens pro Monat fängt Plus an, Ihnen Rate-Limits entgegenzuwerfen. Pro für 200 $ erweitert die Obergrenze und bleibt nach unseren Messungen bis grob 60M–100M Tokens an harter Programmierarbeit günstiger als die API-Abrechnung. Darüber wird die planbare Pro-Token-Abrechnung der API wieder attraktiver — vor allem, weil man aufhört, gegen Rate-Limits anzukämpfen.

Monthly tokens    Best value
-----------------------------
< 2M              OpenAI API
2M – 20M          ChatGPT Plus ($20)
20M – 80M         ChatGPT Pro ($200)
> 80M             API or multi-seat Pro

Diese Grenzen verschieben sich, wenn OpenAI eines der beiden Produkte neu bepreist, aber die Form der Kurve ist robust. Pauschalpläne gewinnen die Mitte. Metered Billing gewinnt beide Enden.

Wo die API trotzdem gewinnt

Ein abobasierter Workflow ist nicht für jedes Team die richtige Antwort. Ein paar Situationen drängen Sie zurück zur API:

Kostenzuordnung im Team — wenn Sie pro Projekt abrechnen müssen, ist die token-genaue API bares Geld im operativen Overhead wert
Programmatische Workloads — CI-Jobs, Batch-Auswertungen, alles, was ohne Mensch läuft. Dort ist der API-Key der Vertrag, nicht ein persönliches Abo
SSO und Enterprise-Beschaffung — die Business-Pläne von OpenAI bündeln SSO, Audit-Logs und DPAs, die einzelne Abos nicht bieten
Planbare Monatsausgaben im großen Maßstab — Finanzabteilungen bevorzugen oft eine variable Rechnung, die sie modellieren können, gegenüber einer Pauschale, die sie nicht deckeln können

Außerhalb dieser Fälle gewinnt das Abo fast immer für einen Entwickler, der ein oder zwei Agenten acht Stunden am Tag betreibt.

Den Abo-Weg auf einem VPS nutzbar machen

Es gibt einen Haken. Codex historisch aus dem Abo zu betreiben hieß, die CLI auf dem Laptop laufen zu lassen — der stirbt beim Zuklappen und verschwindet beim Wechsel zwischen Netzwerken. Agenten, die Stunden laufen müssen — Builder, Reviewer, alles Autonome — passen nicht auf einen Laptop.

Office Claws wurde gebaut, um diese Lücke zu schließen. Im Self-Hosted-Plan (4,99 $/Monat, 2,99 $ für unsere ersten 100 Nutzer) provisionieren wir ein DigitalOcean-Droplet mit vorinstallierter Codex CLI, über Tailscale vernetzt und in Ihr ChatGPT-Abo eingeloggt. Der Agent läuft rund um die Uhr auf dem VPS. Ihr Abo bezahlt die Tokens. Der Droplet kostet ein paar Dollar DigitalOcean-Ausgaben im Monat.

Das Ergebnis: ein Codex-Agent, der etwa 20 $/Monat für Modellzugriff plus ein paar Dollar für die Box kostet. Dieselbe Last würde auf der API regelmäßig zwischen 80 $ und 400 $ landen — je nachdem, wie hart der Agent gefordert wird.

Eine praktische Empfehlung

Wenn Sie unsicher sind, welcher Weg passt:

Starten Sie mit ChatGPT Plus. 20 $ sind günstige Versicherung und decken die meisten Workloads eines einzelnen Entwicklers
Wenn Rate-Limits Sie so oft einbremsen, dass der Flow leidet, wechseln Sie zu Pro. Die 200 $ lohnen sich, wenn Codex zentral für Ihren Tag ist
Wechseln Sie nur zur API, wenn einer der obigen Spezialfälle zutrifft oder Sie tatsächlich mehr als ~80M Tokens/Monat verbrennen

Für alles dazwischen ist das Abo die günstigere Rechnung, die einfachere zum Planen und die, die Sie nicht dafür bestraft, dem Agenten noch eine Frage zu stellen. Lassen Sie es auf einem VPS laufen, damit es auch wirklich läuft, wenn Sie nicht hinsehen — dann geht die Rechnung auf.

Weiterlesen

Ihre KI-Agenten-Rechnung senken — die drei Hebel, die die Token-Rechnung wirklich bewegen
Self-Hosted vs. Managed — den Office-Claws-Plan wählen, der zum Workflow oben passt

Autor

Office Claws Team

Wir gestalten die Zukunft des KI-Agenten-Managements bei Office Claws. Einblicke in Infrastruktur, Sicherheit und Entwicklererfahrung.

Bleib auf dem Laufenden

Erhalte die neuesten Artikel über KI-Agenten, Infrastruktur und Produktupdates direkt in dein Postfach.

Kein Spam. Jederzeit abbestellbar.