OpenAI · Frontier · 2,00 $ Input/1M · 8,00 $ Output/1M · 200K Kontext
Typische Monatskosten
44,95 $
≈ pro Tag
2,04 $
Mix-Preis pro 1M
2,26 $
Kontextfenster
200K
o3 von OpenAI ist ein Frontier-Modell mit 2,00 $ pro 1 Mio. Input-Tokens und 8,00 $ pro 1 Mio. Output-Tokens. Bei einem typischen Solo-Entwicklertag (8 Stunden, 22 Tage pro Monat — 1 mittleres Feature, 5 kleine Bugfixes, 4 PR-Reviews, 2 Stacktrace-Debugs, 1500 Zeilen TypeScript, 1 Lesedurchgang großer Dokumente, mit Prompt-Caching im Standard-Mix) kostet o3 rund 45 $ pro Monat. Das Kontextfenster reicht für 200K Tokens.
Regler bewegen oder Mix umschalten — Werte aktualisieren sich live.
Monatsbudget
100 $ / Monat
≈ $23/Woche · ≈ $4.55/Tag
auf o3
Input-Tokens
68,0M
Output-Tokens
1,9M
Tokens gesamt
69,9M
Pro Monat liefert das Budget
Beim Standard-Coding-Agent-Mix mit 50 % Cache-Hits.
Die 22-Tage-Annahme pro Monat basiert auf der medianen Werktagezahl in DE/US.
| Aktivität | Anzahl | Pro Aufgabe | Pro Tag | Pro Monat |
|---|---|---|---|---|
| Mittleres Feature (10–15 Dateien) | 1 | 0,74 $ | 0,74 $ | 16,22 $ |
| Kleiner Bugfix | 5 | 0,06 $ | 0,28 $ | 6,24 $ |
| PR-Review | 4 | 0,06 $ | 0,25 $ | 5,41 $ |
| Debugging mit Stacktrace | 2 | 0,14 $ | 0,28 $ | 6,09 $ |
| Großes Dokument lesen | 1 | 0,08 $ | 0,08 $ | 1,82 $ |
| Mikro-Interaktion (Erklären / Lint-Fix) | 30 | 0,00 $ | 0,09 $ | 1,88 $ |
| Zeilen TypeScript | 1.500 | 0,00 $ | 0,33 $ | 7,29 $ |
| Gesamt | 2,04 $ | 44,95 $ | ||
Die Zeile „1500 Zeilen TS” deckt etwa 1000 Zeilen Lesezugriff (mit Cache-Treffer) und 500 Zeilen Schreibzugriff ab. Headline-Werte sind auf rund 5 % genau — siehe FAQ.
Was jedes monatliche Budget auf diesem Modell kauft (typischer Solo-Entwicklertag, 22 Arbeitstage).
| Monatsbudget | Mittlere Features | PR-Reviews | Debug-Sitzungen | Zeilen TS |
|---|---|---|---|---|
| Typisch (ca. 45 $) | 60 | 730 | 324 | 203.390 |
| 50 $/Monat | 67 | 813 | 361 | 226.244 |
| 200 $/Monat | 271 | 3.252 | 1.444 | 904.977 |
| 500 $/Monat | 678 | 8.130 | 3.611 | 2.262.443 |
| 2000 $/Monat | 2.712 | 32.520 | 14.445 | 9.049.773 |
Typischer Mix: coding-agent (85 % Input, 50 % Cache-Hits). Werte zeigen die maximale Anzahl der jeweiligen Aufgabe bei diesem Budget.
Coding
Speziell für Code-Generierung trainiert oder nachtrainiert.
Reasoning
Starkes mehrstufiges Reasoning bei komplexen Prompts.
Multimodal
Akzeptiert Bilder zusätzlich zu Text.
Prompt-Cache
Cache-Reads ~10 % des Input-Preises — senkt Agent-Kosten stark.
Batch-API
50 % günstiger, wenn bis zu 24 h Wartezeit ok ist.
Tool-Use
Native Function-Calling-/Tool-Use-API.
Langer Kontext
Kontextfenster ≥ 200K Tokens.
Extended Thinking
Versteckte Reasoning-Tokens (Anthropic „Thinking" / OpenAI Reasoning).
Modelle insgesamt
6
Median Input/1M
1,63 $
Median Output/1M
8,00 $
Input-Spannweite
0,25 $–2,50 $
Geprüft am: 2026-05-07
Bei dem realistischen Solo-Entwicklertag (1 mittleres Feature + 5 kleine Bugfixes + 4 PR-Reviews + 2 Debug-Sitzungen + 1500 Zeilen TypeScript + 1 großes Dokument lesen, 22 Werktage) kostet o3 rund 45 $ pro Monat. Wer mehr macht, zahlt proportional mehr; wer weniger macht, weniger.
200K Tokens insgesamt, davon bis zu 100K Output. Das reicht für ganze Repository-Snapshots inklusive Tests in einem einzigen Aufruf.
Provider verlangen 8,00 $ pro 1 Mio. Output-Tokens gegenüber 2,00 $ pro 1 Mio. Input — Output erfordert tatsächliche Compute-Schritte, Input wird aus dem Cache gezogen. Coding-Agenten lesen viele Dateien (Input-lastig) und produzieren kompakte Diffs (wenig Output), deshalb sind die Gesamtkosten meist input-getrieben.
Cache-Reads kosten typischerweise nur 10 % des regulären Input-Preises. Bei einem Coding-Agent-Mix mit 50 % Cache-Hits sparst du grob 45 % der Input-Kosten — was bei input-lastigen Workloads etwa 38 % der Gesamtrechnung ausmacht. Anthropic-Modelle berechnen einen einmaligen Cache-Write-Aufschlag (25 % über Input), der sich nach 2–3 Hits amortisiert.
Extended-Thinking-/Reasoning-Tokens werden zum vollen Output-Preis abgerechnet, sind aber für die Antwort im Klartext nicht sichtbar. Bei harten agentischen Aufgaben können sie die Output-Rechnung verdoppeln und damit den Monatswert um 20–30 % heben. Schalte Thinking nur ein, wenn die Standard-Antwort sichtbar versagt.
Ja, wenn du bis zu 24 Stunden Wartezeit verkraftest: Batch-Input/Output sind 50 % günstiger als die Realtime-Preise. Ideal für nächtliche Code-Reviews, Bulk-Refactors oder Pre-Merge-Analysen — schlecht für inneren Edit-Loop, der Antworten in Sekunden braucht.
Öffne den vollständigen Rechner mit deinem eigenen Budget, Mix und Region (US oder DE mit 19 % MwSt.).
Rechner öffnen