Zwei Wege, dasselbe Modell zu bezahlen
Wenn Sie Codex einen Agenten innerhalb von Office Claws antreiben lassen wollen, führen zwei Wege dorthin. Sie können die Codex CLI an Ihr ChatGPT Plus- oder Pro-Abo anbinden und einen pauschalen Monatsbetrag zahlen. Oder Sie hinterlegen einen OpenAI API-Key und zahlen pro Token. Gleiches Modellfundament, völlig unterschiedliche Rechnungsformen.
Die meisten Entwickler nehmen das, was sie ohnehin schon hatten. Das funktioniert, lässt aber oft Geld liegen. Eine Woche echter Programmierarbeit macht die Antwort offensichtlich — man muss nur erst die Tokens zählen.
Wie die beiden Wege tatsächlich abrechnen
Das ChatGPT-Abo ist eine Obergrenze. Plus kostet 20 $/Monat, Pro kostet 200 $/Monat. Beide enthalten Zugriff auf die Codex CLI, und beide drosseln über die Anzahl der Nachrichten in einem rollierenden Fenster — nicht über rohe Tokens. Stößt man an die Grenze, wartet man oder rüstet auf. Bis dahin ist jede zusätzliche Anfrage marginal kostenlos.
Die OpenAI API ist ein Zähler. Es gibt weder Mindest- noch Höchstbetrag — Sie zahlen für jeden Eingabe-Token und jeden Ausgabe-Token. Reasoning-intensive Coding-Modelle liegen grob bei 5–15 $ pro Million Input-Tokens und 30–60 $ pro Million Output-Tokens. Ein einziges langes Gespräch kann die Rechnung pro Entwickler spürbar bewegen.
| ChatGPT Plus | ChatGPT Pro | OpenAI API | |
|---|---|---|---|
| Form | Monatspauschale | Monatspauschale | Pro Token |
| Preis | 20 $/Monat | 200 $/Monat | Variabel |
| Codex-CLI-Zugriff | Ja | Ja, höhere Limits | Ja, über API-Key |
| Marginale Kosten pro Anfrage | 0 $ bis zum Cap | 0 $ bis zum Cap | Jeder Token wird abgerechnet |
| Wer trägt das Überschreiten | Sie warten | Sie warten | Sie, sofort |
Was eine Programmierwoche wirklich verbrennt
Abstrakte Preislisten sagen Ihnen nicht, ob Sie bei 15 $ oder 300 $ pro Monat landen. Token-Zahlen schon. Das sehen wir bei Agenten, die auf Office-Claws-Desktops reale Arbeit erledigen:
- Leichter Tag — ein paar gezielte Fragen, kleine Diffs, keine tiefen Refactorings. Rund 150K–400K Tokens insgesamt (Input + Output)
- Fokussierter Tag — ein einzelnes Feature, Agent hält die Codebase im Kontext, führt nach jedem Patch Tests aus. 1M–3M Tokens sind normal
- Harter Tag — Multi-File-Refactor, Agent liest Dutzende Dateien, langes Hin und Her zu Edge Cases. 5M–10M Tokens sind üblich, 20M+ keine Seltenheit
Rechnen Sie einen fokussierten Tag auf 20 Arbeitstage hoch und Sie liegen bei 20M–60M Tokens pro Monat für einen Entwickler mit einem Agenten. Am oberen Ende der API-Preise ist das eine Rechnung im mittleren dreistelligen Bereich. Am unteren Ende immer noch deutlich oberhalb des 20 $-Plus-Abos.
Der Break-even
Unter etwa 2M Tokens pro Monat ist die API meist günstiger. Sie sind Hobby- oder Gelegenheitsnutzer, und Plus ist überdimensioniert. Das ist eine kleine Gruppe.
Zwischen 2M und 20M Tokens pro Monat gewinnt Plus für 20 $ mit großem Abstand — oft 5× bis 15× günstiger als die entsprechende API-Rechnung für dieselbe Arbeit. Hier sind die meisten Solo-Entwickler zu Hause.
Über 20M Tokens pro Monat fängt Plus an, Ihnen Rate-Limits entgegenzuwerfen. Pro für 200 $ erweitert die Obergrenze und bleibt nach unseren Messungen bis grob 60M–100M Tokens an harter Programmierarbeit günstiger als die API-Abrechnung. Darüber wird die planbare Pro-Token-Abrechnung der API wieder attraktiver — vor allem, weil man aufhört, gegen Rate-Limits anzukämpfen.
Monthly tokens Best value
-----------------------------
< 2M OpenAI API
2M – 20M ChatGPT Plus ($20)
20M – 80M ChatGPT Pro ($200)
> 80M API or multi-seat Pro
Diese Grenzen verschieben sich, wenn OpenAI eines der beiden Produkte neu bepreist, aber die Form der Kurve ist robust. Pauschalpläne gewinnen die Mitte. Metered Billing gewinnt beide Enden.
Wo die API trotzdem gewinnt
Ein abobasierter Workflow ist nicht für jedes Team die richtige Antwort. Ein paar Situationen drängen Sie zurück zur API:
- Kostenzuordnung im Team — wenn Sie pro Projekt abrechnen müssen, ist die token-genaue API bares Geld im operativen Overhead wert
- Programmatische Workloads — CI-Jobs, Batch-Auswertungen, alles, was ohne Mensch läuft. Dort ist der API-Key der Vertrag, nicht ein persönliches Abo
- SSO und Enterprise-Beschaffung — die Business-Pläne von OpenAI bündeln SSO, Audit-Logs und DPAs, die einzelne Abos nicht bieten
- Planbare Monatsausgaben im großen Maßstab — Finanzabteilungen bevorzugen oft eine variable Rechnung, die sie modellieren können, gegenüber einer Pauschale, die sie nicht deckeln können
Außerhalb dieser Fälle gewinnt das Abo fast immer für einen Entwickler, der ein oder zwei Agenten acht Stunden am Tag betreibt.
Den Abo-Weg auf einem VPS nutzbar machen
Es gibt einen Haken. Codex historisch aus dem Abo zu betreiben hieß, die CLI auf dem Laptop laufen zu lassen — der stirbt beim Zuklappen und verschwindet beim Wechsel zwischen Netzwerken. Agenten, die Stunden laufen müssen — Builder, Reviewer, alles Autonome — passen nicht auf einen Laptop.
Office Claws wurde gebaut, um diese Lücke zu schließen. Im Self-Hosted-Plan (4,99 $/Monat, 2,99 $ für unsere ersten 100 Nutzer) provisionieren wir ein DigitalOcean-Droplet mit vorinstallierter Codex CLI, über Tailscale vernetzt und in Ihr ChatGPT-Abo eingeloggt. Der Agent läuft rund um die Uhr auf dem VPS. Ihr Abo bezahlt die Tokens. Der Droplet kostet ein paar Dollar DigitalOcean-Ausgaben im Monat.
Das Ergebnis: ein Codex-Agent, der etwa 20 $/Monat für Modellzugriff plus ein paar Dollar für die Box kostet. Dieselbe Last würde auf der API regelmäßig zwischen 80 $ und 400 $ landen — je nachdem, wie hart der Agent gefordert wird.
Eine praktische Empfehlung
Wenn Sie unsicher sind, welcher Weg passt:
- Starten Sie mit ChatGPT Plus. 20 $ sind günstige Versicherung und decken die meisten Workloads eines einzelnen Entwicklers
- Wenn Rate-Limits Sie so oft einbremsen, dass der Flow leidet, wechseln Sie zu Pro. Die 200 $ lohnen sich, wenn Codex zentral für Ihren Tag ist
- Wechseln Sie nur zur API, wenn einer der obigen Spezialfälle zutrifft oder Sie tatsächlich mehr als ~80M Tokens/Monat verbrennen
Für alles dazwischen ist das Abo die günstigere Rechnung, die einfachere zum Planen und die, die Sie nicht dafür bestraft, dem Agenten noch eine Frage zu stellen. Lassen Sie es auf einem VPS laufen, damit es auch wirklich läuft, wenn Sie nicht hinsehen — dann geht die Rechnung auf.
Weiterlesen
- Ihre KI-Agenten-Rechnung senken — die drei Hebel, die die Token-Rechnung wirklich bewegen
- Self-Hosted vs. Managed — den Office-Claws-Plan wählen, der zum Workflow oben passt