Gemini 2.5 Flash

Google DeepMind · Budget · 0,30 $ Input/1M · 2,50 $ Output/1M · 1000K Kontext

Auf einen Blick

Typische Monatskosten

8,39 $

≈ pro Tag

0,38 $

Mix-Preis pro 1M

0,53 $

Kontextfenster

1000K

Gemini 2.5 Flash von Google DeepMind ist ein Budget-Modell mit 0,30 $ pro 1 Mio. Input-Tokens und 2,50 $ pro 1 Mio. Output-Tokens. Bei einem typischen Solo-Entwicklertag (8 Stunden, 22 Tage pro Monat — 1 mittleres Feature, 5 kleine Bugfixes, 4 PR-Reviews, 2 Stacktrace-Debugs, 1500 Zeilen TypeScript, 1 Lesedurchgang großer Dokumente, mit Prompt-Caching im Standard-Mix) kostet Gemini 2.5 Flash rund 8 $ pro Monat. Das Kontextfenster reicht für 1.000K Tokens.

Was kauft dein Monatsbudget?

Regler bewegen oder Mix umschalten — Werte aktualisieren sich live.

Monatsbudget

100 $ / Monat

≈ $23/Woche · ≈ $4.55/Tag

auf Gemini 2.5 Flash

$10$100$500$1000$2000

Aufgaben-Mix

Input-Tokens

453,3M

Output-Tokens

6,0M

Tokens gesamt

459,3M

Pro Monat liefert das Budget

Mittleres Feature (10–15 Dateien)646
PR-Review9.411
Zeilen TypeScript2.051.282
Kleiner Bugfix11.594
Geschäftliche E-Mail142.857
Unit-Test-Datei6.837

Im vollen Rechner öffnen

Wie teuer ist dieses Modell im Vergleich?

Input vs. Output pro 1M Tokens

Über eine Zeile fahren, um Input/Output direkt zu vergleichen.

Gemini 2.5 Flash
0,30 $
2,50 $
Budget-Median (andere Budget-Modelle)
0,30 $
1,10 $
Günstigstes im Katalog (Gemini 2.0 Flash)
0,10 $
0,40 $

Input pro 1MOutput pro 1M

Kosten pro Aufgabe

Beim Standard-Coding-Agent-Mix mit 50 % Cache-Hits.

USD pro einzelner Aufgabe

Mit der Maus über einen Balken fahren, um Detail-Kosten zu sehen.

Zeilen TypeScript
0,0000 $
Kleiner Bugfix
0,0086 $
PR-Review
0,0106 $
Großes Dokument lesen
0,0131 $
Debugging mit Stacktrace
0,0171 $
Modul-Refactor (8–12 Dateien)
0,11 $
Neues Repo einarbeiten
0,13 $
Mittleres Feature (10–15 Dateien)
0,15 $

Typischer Entwicklertag

Die 22-Tage-Annahme pro Monat basiert auf der medianen Werktagezahl in DE/US.

Aktivität	Anzahl	Pro Aufgabe	Pro Tag	Pro Monat
Mittleres Feature (10–15 Dateien)	1	0,15 $	0,15 $	3,40 $
Kleiner Bugfix	5	0,01 $	0,04 $	0,95 $
PR-Review	4	0,01 $	0,04 $	0,94 $
Debugging mit Stacktrace	2	0,02 $	0,03 $	0,75 $
Großes Dokument lesen	1	0,01 $	0,01 $	0,29 $
Mikro-Interaktion (Erklären / Lint-Fix)	30	0,00 $	0,02 $	0,45 $
Zeilen TypeScript	1.500	0,00 $	0,07 $	1,61 $
Gesamt			0,38 $	8,39 $

Die Zeile „1500 Zeilen TS” deckt etwa 1000 Zeilen Lesezugriff (mit Cache-Treffer) und 500 Zeilen Schreibzugriff ab. Headline-Werte sind auf rund 5 % genau — siehe FAQ.

Monatsbudget-Matrix

Was jedes monatliche Budget auf diesem Modell kauft (typischer Solo-Entwicklertag, 22 Arbeitstage).

Monatsbudget	Mittlere Features	PR-Reviews	Debug-Sitzungen	Zeilen TS
Typisch (ca. 8 $)	54	789	491	172.079
50 $/Monat	323	4.705	2.930	1.025.641
200 $/Monat	1.292	18.823	11.721	4.102.564
500 $/Monat	3.232	47.058	29.304	10.256.410
2000 $/Monat	12.929	188.235	117.216	41.025.641

Typischer Mix: coding-agent (85 % Input, 50 % Cache-Hits). Werte zeigen die maximale Anzahl der jeweiligen Aufgabe bei diesem Budget.

Was das Modell kann

Coding
Speziell für Code-Generierung trainiert oder nachtrainiert.
Reasoning
Starkes mehrstufiges Reasoning bei komplexen Prompts.
Multimodal
Akzeptiert Bilder zusätzlich zu Text.
Prompt-Cache
Cache-Reads ~10 % des Input-Preises — senkt Agent-Kosten stark.
Batch-API
50 % günstiger, wenn bis zu 24 h Wartezeit ok ist.
Tool-Use
Native Function-Calling-/Tool-Use-API.
Langer Kontext
Kontextfenster ≥ 200K Tokens.
Extended Thinking
Nicht verfügbar

Wann passt dieses Modell?

Optimal für

Günstiger Standard für input-lastige Retrieval-Agenten
Batch-Verarbeitung von Code (Lints, Klassifikationen, Zusammenfassungen)
Kostengrenze unter 1 USD/Tag/Entwickler ist mit diesem Modell realistisch

Worauf achten

Coding-Qualität unter Frontier — kein Sonnet/Opus-Ersatz bei schwierigen Aufgaben
Kontext-Stufe über 128K teurer — tatsächliche Repo-Größe prüfen

Google DeepMind im Katalog

Modelle insgesamt

Median Input/1M

0,78 $

Median Output/1M

6,25 $

Input-Spannweite

0,10 $–2,00 $

Quellen

Google AI Pricing ↗
Geprüft am: 2026-05-07

Häufige Fragen zu Gemini 2.5 Flash

Was kostet ein typischer Monat auf Gemini 2.5 Flash?

Bei dem realistischen Solo-Entwicklertag (1 mittleres Feature + 5 kleine Bugfixes + 4 PR-Reviews + 2 Debug-Sitzungen + 1500 Zeilen TypeScript + 1 großes Dokument lesen, 22 Werktage) kostet Gemini 2.5 Flash rund 8 $ pro Monat. Wer mehr macht, zahlt proportional mehr; wer weniger macht, weniger.

Wie groß ist das Kontextfenster von Gemini 2.5 Flash?

1.000K Tokens insgesamt, davon bis zu 8K Output. Das reicht für ganze Repository-Snapshots inklusive Tests in einem einzigen Aufruf.

Warum ist Output bei Gemini 2.5 Flash so viel teurer als Input?

Provider verlangen 2,50 $ pro 1 Mio. Output-Tokens gegenüber 0,30 $ pro 1 Mio. Input — Output erfordert tatsächliche Compute-Schritte, Input wird aus dem Cache gezogen. Coding-Agenten lesen viele Dateien (Input-lastig) und produzieren kompakte Diffs (wenig Output), deshalb sind die Gesamtkosten meist input-getrieben.

Wie viel spart Prompt-Caching bei Gemini 2.5 Flash?

Cache-Reads kosten typischerweise nur 10 % des regulären Input-Preises. Bei einem Coding-Agent-Mix mit 50 % Cache-Hits sparst du grob 45 % der Input-Kosten — was bei input-lastigen Workloads etwa 38 % der Gesamtrechnung ausmacht. Anthropic-Modelle berechnen einen einmaligen Cache-Write-Aufschlag (25 % über Input), der sich nach 2–3 Hits amortisiert.

Lohnt die Batch-API von Gemini 2.5 Flash?

Ja, wenn du bis zu 24 Stunden Wartezeit verkraftest: Batch-Input/Output sind 50 % günstiger als die Realtime-Preise. Ideal für nächtliche Code-Reviews, Bulk-Refactors oder Pre-Merge-Analysen — schlecht für inneren Edit-Loop, der Antworten in Sekunden braucht.

Gemini 2.5 Flash live ausprobieren

Öffne den vollständigen Rechner mit deinem eigenen Budget, Mix und Region (US oder DE mit 19 % MwSt.).

Rechner öffnen

Gemini 2.5 Flash

Google DeepMind · Budget · 0,30 $ Input/1M · 2,50 $ Output/1M · 1000K Kontext

Auf einen Blick

Typische Monatskosten

8,39 $

≈ pro Tag

0,38 $

Mix-Preis pro 1M

0,53 $

Kontextfenster

1000K

Was kauft dein Monatsbudget?

Regler bewegen oder Mix umschalten — Werte aktualisieren sich live.

Monatsbudget

100 $ / Monat

≈ $23/Woche · ≈ $4.55/Tag

auf Gemini 2.5 Flash

$10$100$500$1000$2000

Aufgaben-Mix

Input-Tokens

453,3M

Output-Tokens

6,0M

Tokens gesamt

459,3M

Pro Monat liefert das Budget

Mittleres Feature (10–15 Dateien)646
PR-Review9.411
Zeilen TypeScript2.051.282
Kleiner Bugfix11.594
Geschäftliche E-Mail142.857
Unit-Test-Datei6.837

Im vollen Rechner öffnen

Wie teuer ist dieses Modell im Vergleich?

Input vs. Output pro 1M Tokens

Über eine Zeile fahren, um Input/Output direkt zu vergleichen.

Gemini 2.5 Flash
0,30 $
2,50 $
Budget-Median (andere Budget-Modelle)
0,30 $
1,10 $
Günstigstes im Katalog (Gemini 2.0 Flash)
0,10 $
0,40 $

Input pro 1MOutput pro 1M

Kosten pro Aufgabe

Beim Standard-Coding-Agent-Mix mit 50 % Cache-Hits.

USD pro einzelner Aufgabe

Mit der Maus über einen Balken fahren, um Detail-Kosten zu sehen.

Zeilen TypeScript
0,0000 $
Kleiner Bugfix
0,0086 $
PR-Review
0,0106 $
Großes Dokument lesen
0,0131 $
Debugging mit Stacktrace
0,0171 $
Modul-Refactor (8–12 Dateien)
0,11 $
Neues Repo einarbeiten
0,13 $
Mittleres Feature (10–15 Dateien)
0,15 $

Typischer Entwicklertag

Die 22-Tage-Annahme pro Monat basiert auf der medianen Werktagezahl in DE/US.

Aktivität	Anzahl	Pro Aufgabe	Pro Tag	Pro Monat
Mittleres Feature (10–15 Dateien)	1	0,15 $	0,15 $	3,40 $
Kleiner Bugfix	5	0,01 $	0,04 $	0,95 $
PR-Review	4	0,01 $	0,04 $	0,94 $
Debugging mit Stacktrace	2	0,02 $	0,03 $	0,75 $
Großes Dokument lesen	1	0,01 $	0,01 $	0,29 $
Mikro-Interaktion (Erklären / Lint-Fix)	30	0,00 $	0,02 $	0,45 $
Zeilen TypeScript	1.500	0,00 $	0,07 $	1,61 $
Gesamt			0,38 $	8,39 $

Die Zeile „1500 Zeilen TS” deckt etwa 1000 Zeilen Lesezugriff (mit Cache-Treffer) und 500 Zeilen Schreibzugriff ab. Headline-Werte sind auf rund 5 % genau — siehe FAQ.

Monatsbudget-Matrix

Was jedes monatliche Budget auf diesem Modell kauft (typischer Solo-Entwicklertag, 22 Arbeitstage).

Monatsbudget	Mittlere Features	PR-Reviews	Debug-Sitzungen	Zeilen TS
Typisch (ca. 8 $)	54	789	491	172.079
50 $/Monat	323	4.705	2.930	1.025.641
200 $/Monat	1.292	18.823	11.721	4.102.564
500 $/Monat	3.232	47.058	29.304	10.256.410
2000 $/Monat	12.929	188.235	117.216	41.025.641

Typischer Mix: coding-agent (85 % Input, 50 % Cache-Hits). Werte zeigen die maximale Anzahl der jeweiligen Aufgabe bei diesem Budget.

Was das Modell kann

Coding
Speziell für Code-Generierung trainiert oder nachtrainiert.
Reasoning
Starkes mehrstufiges Reasoning bei komplexen Prompts.
Multimodal
Akzeptiert Bilder zusätzlich zu Text.
Prompt-Cache
Cache-Reads ~10 % des Input-Preises — senkt Agent-Kosten stark.
Batch-API
50 % günstiger, wenn bis zu 24 h Wartezeit ok ist.
Tool-Use
Native Function-Calling-/Tool-Use-API.
Langer Kontext
Kontextfenster ≥ 200K Tokens.
Extended Thinking
Nicht verfügbar

Wann passt dieses Modell?

Optimal für

Günstiger Standard für input-lastige Retrieval-Agenten
Batch-Verarbeitung von Code (Lints, Klassifikationen, Zusammenfassungen)
Kostengrenze unter 1 USD/Tag/Entwickler ist mit diesem Modell realistisch

Worauf achten

Coding-Qualität unter Frontier — kein Sonnet/Opus-Ersatz bei schwierigen Aufgaben
Kontext-Stufe über 128K teurer — tatsächliche Repo-Größe prüfen

Google DeepMind im Katalog

Modelle insgesamt

Median Input/1M

0,78 $

Median Output/1M

6,25 $

Input-Spannweite

0,10 $–2,00 $

Quellen

Google AI Pricing ↗
Geprüft am: 2026-05-07

Häufige Fragen zu Gemini 2.5 Flash

Was kostet ein typischer Monat auf Gemini 2.5 Flash?

Wie groß ist das Kontextfenster von Gemini 2.5 Flash?

1.000K Tokens insgesamt, davon bis zu 8K Output. Das reicht für ganze Repository-Snapshots inklusive Tests in einem einzigen Aufruf.

Warum ist Output bei Gemini 2.5 Flash so viel teurer als Input?

Wie viel spart Prompt-Caching bei Gemini 2.5 Flash?

Lohnt die Batch-API von Gemini 2.5 Flash?

Gemini 2.5 Flash live ausprobieren

Öffne den vollständigen Rechner mit deinem eigenen Budget, Mix und Region (US oder DE mit 19 % MwSt.).

Rechner öffnen

Gemini 2.5 Flash

Auf einen Blick

Was kauft dein Monatsbudget?

Wie teuer ist dieses Modell im Vergleich?

Input vs. Output pro 1M Tokens

Kosten pro Aufgabe

USD pro einzelner Aufgabe

Typischer Entwicklertag

Monatsbudget-Matrix

Was das Modell kann

Wann passt dieses Modell?

Optimal für

Worauf achten

Google DeepMind im Katalog

Verwandte Modelle

Gemini 2.5 Pro

Claude Haiku 4.5

GPT-5 mini

DeepSeek V3

Quellen

Häufige Fragen zu Gemini 2.5 Flash

Gemini 2.5 Flash live ausprobieren

Gemini 2.5 Flash

Auf einen Blick

Was kauft dein Monatsbudget?

Wie teuer ist dieses Modell im Vergleich?

Input vs. Output pro 1M Tokens

Kosten pro Aufgabe

USD pro einzelner Aufgabe

Typischer Entwicklertag

Monatsbudget-Matrix

Was das Modell kann

Wann passt dieses Modell?

Optimal für

Worauf achten

Google DeepMind im Katalog

Verwandte Modelle

Gemini 2.5 Pro

Claude Haiku 4.5

GPT-5 mini

DeepSeek V3

Quellen

Häufige Fragen zu Gemini 2.5 Flash

Gemini 2.5 Flash live ausprobieren