Google DeepMind · Budget · 0,30 $ Input/1M · 2,50 $ Output/1M · 1000K Kontext
Typische Monatskosten
8,39 $
≈ pro Tag
0,38 $
Mix-Preis pro 1M
0,53 $
Kontextfenster
1000K
Gemini 2.5 Flash von Google DeepMind ist ein Budget-Modell mit 0,30 $ pro 1 Mio. Input-Tokens und 2,50 $ pro 1 Mio. Output-Tokens. Bei einem typischen Solo-Entwicklertag (8 Stunden, 22 Tage pro Monat — 1 mittleres Feature, 5 kleine Bugfixes, 4 PR-Reviews, 2 Stacktrace-Debugs, 1500 Zeilen TypeScript, 1 Lesedurchgang großer Dokumente, mit Prompt-Caching im Standard-Mix) kostet Gemini 2.5 Flash rund 8 $ pro Monat. Das Kontextfenster reicht für 1.000K Tokens.
Regler bewegen oder Mix umschalten — Werte aktualisieren sich live.
Monatsbudget
100 $ / Monat
≈ $23/Woche · ≈ $4.55/Tag
auf Gemini 2.5 Flash
Input-Tokens
453,3M
Output-Tokens
6,0M
Tokens gesamt
459,3M
Pro Monat liefert das Budget
Beim Standard-Coding-Agent-Mix mit 50 % Cache-Hits.
Die 22-Tage-Annahme pro Monat basiert auf der medianen Werktagezahl in DE/US.
| Aktivität | Anzahl | Pro Aufgabe | Pro Tag | Pro Monat |
|---|---|---|---|---|
| Mittleres Feature (10–15 Dateien) | 1 | 0,15 $ | 0,15 $ | 3,40 $ |
| Kleiner Bugfix | 5 | 0,01 $ | 0,04 $ | 0,95 $ |
| PR-Review | 4 | 0,01 $ | 0,04 $ | 0,94 $ |
| Debugging mit Stacktrace | 2 | 0,02 $ | 0,03 $ | 0,75 $ |
| Großes Dokument lesen | 1 | 0,01 $ | 0,01 $ | 0,29 $ |
| Mikro-Interaktion (Erklären / Lint-Fix) | 30 | 0,00 $ | 0,02 $ | 0,45 $ |
| Zeilen TypeScript | 1.500 | 0,00 $ | 0,07 $ | 1,61 $ |
| Gesamt | 0,38 $ | 8,39 $ | ||
Die Zeile „1500 Zeilen TS” deckt etwa 1000 Zeilen Lesezugriff (mit Cache-Treffer) und 500 Zeilen Schreibzugriff ab. Headline-Werte sind auf rund 5 % genau — siehe FAQ.
Was jedes monatliche Budget auf diesem Modell kauft (typischer Solo-Entwicklertag, 22 Arbeitstage).
| Monatsbudget | Mittlere Features | PR-Reviews | Debug-Sitzungen | Zeilen TS |
|---|---|---|---|---|
| Typisch (ca. 8 $) | 54 | 789 | 491 | 172.079 |
| 50 $/Monat | 323 | 4.705 | 2.930 | 1.025.641 |
| 200 $/Monat | 1.292 | 18.823 | 11.721 | 4.102.564 |
| 500 $/Monat | 3.232 | 47.058 | 29.304 | 10.256.410 |
| 2000 $/Monat | 12.929 | 188.235 | 117.216 | 41.025.641 |
Typischer Mix: coding-agent (85 % Input, 50 % Cache-Hits). Werte zeigen die maximale Anzahl der jeweiligen Aufgabe bei diesem Budget.
Coding
Speziell für Code-Generierung trainiert oder nachtrainiert.
Reasoning
Starkes mehrstufiges Reasoning bei komplexen Prompts.
Multimodal
Akzeptiert Bilder zusätzlich zu Text.
Prompt-Cache
Cache-Reads ~10 % des Input-Preises — senkt Agent-Kosten stark.
Batch-API
50 % günstiger, wenn bis zu 24 h Wartezeit ok ist.
Tool-Use
Native Function-Calling-/Tool-Use-API.
Langer Kontext
Kontextfenster ≥ 200K Tokens.
Extended Thinking
Nicht verfügbar
Modelle insgesamt
4
Median Input/1M
0,78 $
Median Output/1M
6,25 $
Input-Spannweite
0,10 $–2,00 $
Geprüft am: 2026-05-07
Bei dem realistischen Solo-Entwicklertag (1 mittleres Feature + 5 kleine Bugfixes + 4 PR-Reviews + 2 Debug-Sitzungen + 1500 Zeilen TypeScript + 1 großes Dokument lesen, 22 Werktage) kostet Gemini 2.5 Flash rund 8 $ pro Monat. Wer mehr macht, zahlt proportional mehr; wer weniger macht, weniger.
1.000K Tokens insgesamt, davon bis zu 8K Output. Das reicht für ganze Repository-Snapshots inklusive Tests in einem einzigen Aufruf.
Provider verlangen 2,50 $ pro 1 Mio. Output-Tokens gegenüber 0,30 $ pro 1 Mio. Input — Output erfordert tatsächliche Compute-Schritte, Input wird aus dem Cache gezogen. Coding-Agenten lesen viele Dateien (Input-lastig) und produzieren kompakte Diffs (wenig Output), deshalb sind die Gesamtkosten meist input-getrieben.
Cache-Reads kosten typischerweise nur 10 % des regulären Input-Preises. Bei einem Coding-Agent-Mix mit 50 % Cache-Hits sparst du grob 45 % der Input-Kosten — was bei input-lastigen Workloads etwa 38 % der Gesamtrechnung ausmacht. Anthropic-Modelle berechnen einen einmaligen Cache-Write-Aufschlag (25 % über Input), der sich nach 2–3 Hits amortisiert.
Ja, wenn du bis zu 24 Stunden Wartezeit verkraftest: Batch-Input/Output sind 50 % günstiger als die Realtime-Preise. Ideal für nächtliche Code-Reviews, Bulk-Refactors oder Pre-Merge-Analysen — schlecht für inneren Edit-Loop, der Antworten in Sekunden braucht.
Öffne den vollständigen Rechner mit deinem eigenen Budget, Mix und Region (US oder DE mit 19 % MwSt.).
Rechner öffnen