Anthropic · Mid-Tier · 3,00 $ Input/1M · 15,00 $ Output/1M · 200K Kontext
Typische Monatskosten
71,23 $
≈ pro Tag
3,24 $
Mix-Preis pro 1M
3,65 $
Kontextfenster
200K
Claude Sonnet 3.7 von Anthropic ist ein Mid-Tier-Modell mit 3,00 $ pro 1 Mio. Input-Tokens und 15,00 $ pro 1 Mio. Output-Tokens. Bei einem typischen Solo-Entwicklertag (8 Stunden, 22 Tage pro Monat — 1 mittleres Feature, 5 kleine Bugfixes, 4 PR-Reviews, 2 Stacktrace-Debugs, 1500 Zeilen TypeScript, 1 Lesedurchgang großer Dokumente, mit Prompt-Caching im Standard-Mix) kostet Claude Sonnet 3.7 rund 71 $ pro Monat. Das Kontextfenster reicht für 200K Tokens.
Regler bewegen oder Mix umschalten — Werte aktualisieren sich live.
Monatsbudget
100 $ / Monat
≈ $23/Woche · ≈ $4.55/Tag
auf Claude Sonnet 3.7
Input-Tokens
51,5M
Output-Tokens
1,0M
Tokens gesamt
52,5M
Pro Monat liefert das Budget
Beim Standard-Coding-Agent-Mix mit 50 % Cache-Hits.
Die 22-Tage-Annahme pro Monat basiert auf der medianen Werktagezahl in DE/US.
| Aktivität | Anzahl | Pro Aufgabe | Pro Tag | Pro Monat |
|---|---|---|---|---|
| Mittleres Feature (10–15 Dateien) | 1 | 1,23 $ | 1,23 $ | 26,98 $ |
| Kleiner Bugfix | 5 | 0,09 $ | 0,43 $ | 9,41 $ |
| PR-Review | 4 | 0,09 $ | 0,38 $ | 8,32 $ |
| Debugging mit Stacktrace | 2 | 0,21 $ | 0,43 $ | 9,44 $ |
| Großes Dokument lesen | 1 | 0,12 $ | 0,12 $ | 2,64 $ |
| Mikro-Interaktion (Erklären / Lint-Fix) | 30 | 0,00 $ | 0,14 $ | 3,07 $ |
| Zeilen TypeScript | 1.500 | 0,00 $ | 0,52 $ | 11,39 $ |
| Gesamt | 3,24 $ | 71,23 $ | ||
Die Zeile „1500 Zeilen TS” deckt etwa 1000 Zeilen Lesezugriff (mit Cache-Treffer) und 500 Zeilen Schreibzugriff ab. Headline-Werte sind auf rund 5 % genau — siehe FAQ.
Was jedes monatliche Budget auf diesem Modell kauft (typischer Solo-Entwicklertag, 22 Arbeitstage).
| Monatsbudget | Mittlere Features | PR-Reviews | Debug-Sitzungen | Zeilen TS |
|---|---|---|---|---|
| Typisch (ca. 71 $) | 58 | 753 | 332 | 206.465 |
| 50 $/Monat | 40 | 529 | 233 | 144.927 |
| 200 $/Monat | 163 | 2.116 | 932 | 579.710 |
| 500 $/Monat | 407 | 5.291 | 2.331 | 1.449.275 |
| 2000 $/Monat | 1.630 | 21.164 | 9.324 | 5.797.101 |
Typischer Mix: coding-agent (85 % Input, 50 % Cache-Hits). Werte zeigen die maximale Anzahl der jeweiligen Aufgabe bei diesem Budget.
Coding
Speziell für Code-Generierung trainiert oder nachtrainiert.
Reasoning
Starkes mehrstufiges Reasoning bei komplexen Prompts.
Multimodal
Akzeptiert Bilder zusätzlich zu Text.
Prompt-Cache
Cache-Reads ~10 % des Input-Preises — senkt Agent-Kosten stark.
Batch-API
50 % günstiger, wenn bis zu 24 h Wartezeit ok ist.
Tool-Use
Native Function-Calling-/Tool-Use-API.
Langer Kontext
Nicht verfügbar
Extended Thinking
Versteckte Reasoning-Tokens (Anthropic „Thinking" / OpenAI Reasoning).
Modelle insgesamt
5
Median Input/1M
3,00 $
Median Output/1M
15,00 $
Input-Spannweite
1,00 $–15,00 $
Geprüft am: 2026-05-07
Bei dem realistischen Solo-Entwicklertag (1 mittleres Feature + 5 kleine Bugfixes + 4 PR-Reviews + 2 Debug-Sitzungen + 1500 Zeilen TypeScript + 1 großes Dokument lesen, 22 Werktage) kostet Claude Sonnet 3.7 rund 71 $ pro Monat. Wer mehr macht, zahlt proportional mehr; wer weniger macht, weniger.
200K Tokens insgesamt, davon bis zu 8K Output. Das reicht für ein paar Dutzend Quelldateien in einem einzigen Aufruf.
Provider verlangen 15,00 $ pro 1 Mio. Output-Tokens gegenüber 3,00 $ pro 1 Mio. Input — Output erfordert tatsächliche Compute-Schritte, Input wird aus dem Cache gezogen. Coding-Agenten lesen viele Dateien (Input-lastig) und produzieren kompakte Diffs (wenig Output), deshalb sind die Gesamtkosten meist input-getrieben.
Cache-Reads kosten typischerweise nur 10 % des regulären Input-Preises. Bei einem Coding-Agent-Mix mit 50 % Cache-Hits sparst du grob 45 % der Input-Kosten — was bei input-lastigen Workloads etwa 38 % der Gesamtrechnung ausmacht. Anthropic-Modelle berechnen einen einmaligen Cache-Write-Aufschlag (25 % über Input), der sich nach 2–3 Hits amortisiert.
Extended-Thinking-/Reasoning-Tokens werden zum vollen Output-Preis abgerechnet, sind aber für die Antwort im Klartext nicht sichtbar. Bei harten agentischen Aufgaben können sie die Output-Rechnung verdoppeln und damit den Monatswert um 20–30 % heben. Schalte Thinking nur ein, wenn die Standard-Antwort sichtbar versagt.
Ja, wenn du bis zu 24 Stunden Wartezeit verkraftest: Batch-Input/Output sind 50 % günstiger als die Realtime-Preise. Ideal für nächtliche Code-Reviews, Bulk-Refactors oder Pre-Merge-Analysen — schlecht für inneren Edit-Loop, der Antworten in Sekunden braucht.
Öffne den vollständigen Rechner mit deinem eigenen Budget, Mix und Region (US oder DE mit 19 % MwSt.).
Rechner öffnen