Computer Science

KI-Coding-Token-Kosten-Rechner

Verwandle jedes monatliche USD-Budget in konkrete Engineering-Leistung über 25 beliebte KI-Coding-Modelle.

Eingaben

Modell

Monatsbudget (USD)

Aufgaben-Mix

Region

Ergebnisse

Kosten eines typischen Entwicklermonats

Wie viele typische Tage dein Budget abdeckt

Mittlere Features pro Monat

PR-Reviews pro Monat

Debug-Sitzungen pro Monat

Zeilen TypeScript pro Monat

Input-Tokens pro Monat

Output-Tokens pro Monat

Monatskosten (EUR netto)

Monatskosten (EUR brutto, inkl. 19 % MwSt.)

Explore similar tools

37% Rule Dating Calculator

Calculate when to stop exploring and start committing with the 37% optimal stopping rule.

Jetzt berechnen

Abitur Grade Calculator (KMK Scale)

Convert your exam percentage to the 15-point KMK grading scale used across all German states. Instantly see your Notenpunkte, Schulnote, and how close you are to the next grade.

Jetzt berechnen

Grade Points Calculator (15-Point System)

Convert German upper school points to decimal grades and back.

Jetzt berechnen

KI-Tooling-Budget

Was jeder Dollar an KI-Coding-Ausgaben tatsächlich bringt

25 beliebte Modelle, echte Preise, echte Engineering-Szenarien.

Datenquelle

Preise wöchentlich aus BerriAIs LiteLLM-Datensatz gezogen und mit handgepflegten Anthropic-, xAI- und Frontier-Overrides ergänzt.

Hinweis

Token-Annahmen pro Szenario sind Mediane aus typischen agentischen API-Traces. Dein realer Workload kann heißer oder kühler laufen.

By HelpfulCalculator Team•07.05.2026•4 min read

Was ist der KI-Coding-Token-Kosten-Rechner?

Budget umgerechnet in greifbare Engineering-Leistung

Dieser Rechner übersetzt ein USD- oder EUR-Budget in konkrete Engineering-Arbeit — Input-Tokens, Output-Tokens und die Anzahl mittlerer Features, PR-Reviews, Code-Zeilen, Dokumentationsseiten oder E-Mails, die du auf dem gewählten Modell produzieren kannst. Der Rechner existiert, weil die meisten Budget-Entscheidungen für KI-Tools im Management getroffen werden, ohne dass jemand weiß, was ein Dollar tatsächlich kauft.

Modell wählen, Budget eintippen, sehen, wie viele Features drin sind, bevor das Limit greift.

Die Token-Mathematik ist einfach, sobald man Input und Output trennt. Jedes Modell rechnet die Tokens, die du sendest, und die Tokens, die zurückkommen, getrennt ab. Input macht meist 70–90 Prozent eines agentischen Coding-Workloads aus, weil der Agent pro Aktion viele Dateien liest; Chat-Workloads drehen das Verhältnis um. Prompt-Caching senkt, wo unterstützt, den Input-Preis um etwa das Zehnfache für den gecachten Anteil.

Tokens, die du dir leisten kannst

Input-Tokens = (Budget × Input-Anteil) ÷ effektiver Input-Preis pro Token

Szenarien pro Budget

Aufgaben pro Budget = abrunden(Budget ÷ Kosten pro Aufgabe)

Geh dasselbe 6-USD-Budget auf drei verschiedenen Modellen durch, damit die Lücke sichtbar wird.

Budget und Mix wählen
6 USD pro Entwickler pro Tag, Coding-Agent-Mix (85 % Input, 50 % Cache-Treffer, wenn unterstützt).
Claude Opus 4.7 — Frontier-Tier
Preise 15 / 75 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,36 USD. Budget reicht für 16 Features pro Tag, dann ist Schluss.
Claude Sonnet 4.6 — mittleres Tier
Preise 3 / 15 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,072 USD. Budget reicht für 83 Features pro Tag — fünfmal mehr als bei Opus.
DeepSeek V3 — Budget-Tier
Preise 0,27 / 1,10 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,0066 USD. Budget reicht für ca. 900 Features pro Tag bei akzeptabler Qualität.

Die Anzahl mittlerer Features ist die Headline-Kennzahl, weil sie am ehesten auf „Was schippt mein Engineering-Team pro Tag?" abbildet. Ein typischer autonomer Coding-Agent in einem echten Repo verbrennt 25–35 Tausend Input-Tokens pro Feature (Datei-Reads und Grep-Ergebnisse) und produziert einen Diff von 1–2 Tausend Tokens. Liegt deine Zahl im einstelligen Bereich, ist das Budget für das Modell zu niedrig — auf ein günstigeres Tier wechseln oder das Limit anheben. Liegt sie in den Hunderten, hast du überdimensioniert und kannst eine Stufe günstiger gehen, ohne Leistung zu verlieren.

Die PR-Review-Anzahl und die TypeScript-Zeilen sind Plausibilitätsvergleiche. Ein Pull-Request-Review verbrennt 10–15 Tausend Input-Tokens und schreibt 1,5 Tausend Output-Tokens strukturiert; reine TypeScript-Generierung kostet etwa 12 Tokens pro Zeile, sodass die TS-Zeilen-Zahl grob deinem „rohen Code-Durchsatz"-Budget entspricht.

Die Token-Schätzungen gehen von Median-Traces aus — die tatsächliche Repo-Größe, der Prompt-Overhead und Tool-Use-Schleifen können die Zahl in beide Richtungen um 30 Prozent verschieben. Cache-Trefferraten hängen davon ab, wie stabil dein System-Prompt ist und wie lange das Gespräch läuft; die Standardannahmen des Rechners sind konservativ.

Preise ändern sich wöchentlich

Preise ändern sich ohne Vorankündigung, weil die Anbieter konkurrieren. Der Datensatz wird wöchentlich per LiteLLM-Cron aktualisiert; das verifiedAt-Datum pro Modell ist die Quelle der Wahrheit. Vor einem Vertragsabschluss immer mit der Preisseite des Anbieters abgleichen.

Preisseiten der Anbieter (primär)

Official2026

Anthropic

Claude — Preise

Anthropic

Maßgebliche Quelle für die Preise pro 1M Tokens von Claude Opus 4.7, Sonnet 4.6, Haiku 4.5, Opus 4 und Sonnet 3.7 inkl. Cache-Write, Cache-Read und Batch-Stufen.

Official2026

OpenAI

API-Preise

OpenAI

Maßgebliche Quelle für die Token-Preise von GPT-5, GPT-5 mini, GPT-4.1, GPT-4o, o3 und o3-mini inkl. Cached-Input und Batch-API-Stufen.

Official2026

Google DeepMind

Gemini-API-Preise

Google DeepMind

Maßgebliche Quelle für Gemini 3 Pro, 2.5 Pro, 2.5 Flash und 2.0 Flash inkl. der Aufschlüsselung der 200K-Kontext-Stufe.

Official2026

DeepSeek

DeepSeek API — Preise

DeepSeek

Preise für DeepSeek V3, R1 und Coder V3 inkl. Off-Peak- und Cache-Hit-Stufen.

Official2026

xAI

xAI Models — Preise

xAI

Preise für Grok 4 und Grok Code Fast 1 inkl. erweiterter Kontextstufen.

Aggregat-Datensätze und Multi-Vendor

Resource2026

BerriAI / LiteLLM

model_prices_and_context_window.json

BerriAI

Community-gepflegter normalisierter Datensatz von über 400 Modellpreisen, der wöchentlich per Cron für diesen Rechner aktualisiert wird.

Official2026

Mistral

Mistral — Preise

Mistral AI

Preise für Codestral 25.01 und Mistral Large 2 inkl. der in der EU gehosteten Stufen.

Resource2026

Together AI

Together — Preise

Together AI

Hosted-Inferenz-Preise für Open-Weights-Modelle (Qwen2.5 Coder 32B, Llama 3.3 70B Instruct), die wir als 'Budget-Tier'-Basis verwenden.

Steuern und Währung

Official2026

Europäische Zentralbank

Euro-Referenzkurse

EZB

Täglicher EUR/USD-Referenzkurs, wöchentlich per Cron aktualisiert und für die Spalten EUR-Netto und Brutto im Rechner verwendet.

Official2026

Bundesministerium der Finanzen

Umsatzsteuersatz Deutschland (§ 12 UStG)

Bundesministerium der Finanzen

Gesetzlicher 19 %-USt-Satz, der auf die EUR-Brutto-Spalte für die DE-Region angewendet wird.

Häufig gestellte Fragen

Häufige Fragen zu KI-Coding-Token-Kosten, Modellpreisen und Budgetplanung.

Was ist ein Token?

Ein Token ist die Abrechnungseinheit, mit der KI-Modelle Input und Output messen. Grob: ein englisches Wort sind 1,3 Tokens, eine Code-Zeile 12–14 Tokens, ein 500-Wörter-Dokument etwa 750 Tokens. Jedes Modell in diesem Rechner berechnet pro Million Tokens — getrennt für das, was du sendest, und das, was zurückkommt.

Warum ist Claude Sonnet 4.6 so viel günstiger als Opus 4.7?

Sonnet 4.6 kostet 3 USD pro 1M Input und 15 USD pro 1M Output; Opus 4.7 kostet 15 USD pro 1M Input und 75 USD pro 1M Output. Das ist ein 5×-Aufschlag auf jeden Token, der sich zu 5× mehr Tagesfeatures für dasselbe Budget summiert. Anthropic reserviert Opus für schwierige agentische Probleme, bei denen 80 % der Sonnet-Qualität nicht reichen.

Reichen 6 USD pro Entwickler pro Tag wirklich?

Auf Sonnet 4.6 mit Prompt-Caching kauft 6 USD/Tag etwa 80 mittlere agentische Features. Auf Opus 4.7 endet dasselbe Budget bei 16 Features. Auf Budget-Tier-Modellen wie DeepSeek V3 kauft 6 USD Hunderte Features. Ob es reicht, hängt vom Modell ab — erst Modell wählen, dann prüfen, ob die Feature-Anzahl zum Tagesoutput deines Teams passt.

Wie verändert Prompt-Caching die Rechnung?

Wenn ein Modell Prompt-Caching unterstützt, wird der gecachte Anteil des Inputs zu etwa 10 % des vollen Input-Preises abgerechnet. Der Rechner nimmt 50 % Cache-Treffer beim Coding-Agent-Mix an (realistischer Median bei stabilem System-Prompt), 30 % beim ausgewogenen Mix und 10 % beim Chat. Modelle ohne Caching bekommen keinen Rabatt.

Woher kommen die Preise und wie oft werden sie aktualisiert?

Die Preise stammen von der offiziellen Preisseite jedes Anbieters, normalisiert wöchentlich über BerriAIs Open-Source-LiteLLM-Datensatz, und dann mit handgepflegten Overrides für Anthropic und die neuesten Frontier-Releases überlagert. Der Cron läuft jeden Sonntag um 03:00 UTC. Jedes Modell trägt ein verifiedAt-Datum, das du prüfen kannst.

Wie wird die deutsche Umsatzsteuer behandelt?

Die Anbieter-Preise sind netto in USD. Der Rechner konvertiert zu EUR mit dem täglichen EZB-Referenzkurs und schlägt für die DE-Region 19 % USt auf. EU-B2B-Kunden können meist das Reverse-Charge-Verfahren anwenden — deine Rechnung von Anthropic, OpenAI oder Google zeigt dann den Netto-Betrag mit deiner USt-ID. Vor einer echten Steuererklärung mit dem Steuerberater abklären.

Wie genau sind die Token-Zahlen pro Szenario?

Die Token-Annahmen pro Szenario (12 für eine TypeScript-Zeile, 30K für ein mittleres Feature, 100K für ein großes Feature usw.) sind Mediane aus typischen agentischen API-Traces. Dein realer Workload kann 30 % heißer oder kühler laufen, je nach Repo-Größe, Prompt-Overhead und Tool-Use-Schleifen. Behandle die Zahlen als Größenordnung, nicht als Garantie.

Welches Modell ist insgesamt am besten für Coding?

Es gibt nicht das eine beste Modell — es ist immer ein Trade-off zwischen Leistung und Kosten. Claude Sonnet 4.6 ist das Arbeitspferd für autonome Agenten. Opus 4.7 gewinnt bei harten mehrfach-Datei-Refactorings. GPT-5 ist konkurrenzfähig bei input-lastigem Retrieval. DeepSeek V3 gewinnt bei den Kosten pro Feature, wenn 80 % Sonnet-Qualität reichen. Wähle das günstigste Modell, das die Qualitätsanforderungen deines Teams noch erfüllt.

Wann soll ich die Batch-API für Coding nutzen?

Die meisten Anbieter geben 50 % Rabatt, wenn du Jobs per Batch-API einsendest und bis zu 24 Stunden Bearbeitungszeit akzeptierst. Perfekt für nächtliche Code-Reviews, Massen-Refactorings oder Pre-Merge-Analysen. Falsch für innere Edit-Schleifen, bei denen du eine Antwort in Sekunden brauchst. Der Rechner zeigt Live-Preise; halbiere sie im Kopf, wenn dein Workload async ist.

Kostet ein größeres Kontextfenster mehr?

Bei den meisten Modellen nein — der Preis ist pro Token konstant, egal wie voll das Kontextfenster ist. Gemini 2.5 Pro und 3 Pro sind Ausnahmen: über 200K Input-Tokens verdoppelt sich der Preis ungefähr. Wenn du ein ganzes Monorepo in den Gemini-Kontext lädst, mit dem höheren Preis rechnen, um Überraschungen zu vermeiden.

KI-Tooling-Budget

Was jeder Dollar an KI-Coding-Ausgaben tatsächlich bringt

25 beliebte Modelle, echte Preise, echte Engineering-Szenarien.

Datenquelle

Preise wöchentlich aus BerriAIs LiteLLM-Datensatz gezogen und mit handgepflegten Anthropic-, xAI- und Frontier-Overrides ergänzt.

Hinweis

Token-Annahmen pro Szenario sind Mediane aus typischen agentischen API-Traces. Dein realer Workload kann heißer oder kühler laufen.

By HelpfulCalculator Team•07.05.2026•4 min read

Was ist der KI-Coding-Token-Kosten-Rechner?

Budget umgerechnet in greifbare Engineering-Leistung

Modell wählen, Budget eintippen, sehen, wie viele Features drin sind, bevor das Limit greift.

Tokens, die du dir leisten kannst

Input-Tokens = (Budget × Input-Anteil) ÷ effektiver Input-Preis pro Token

Szenarien pro Budget

Aufgaben pro Budget = abrunden(Budget ÷ Kosten pro Aufgabe)

Geh dasselbe 6-USD-Budget auf drei verschiedenen Modellen durch, damit die Lücke sichtbar wird.

Budget und Mix wählen
6 USD pro Entwickler pro Tag, Coding-Agent-Mix (85 % Input, 50 % Cache-Treffer, wenn unterstützt).
Claude Opus 4.7 — Frontier-Tier
Preise 15 / 75 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,36 USD. Budget reicht für 16 Features pro Tag, dann ist Schluss.
Claude Sonnet 4.6 — mittleres Tier
Preise 3 / 15 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,072 USD. Budget reicht für 83 Features pro Tag — fünfmal mehr als bei Opus.
DeepSeek V3 — Budget-Tier
Preise 0,27 / 1,10 USD pro 1M mit Cache. Kosten pro mittlerem Feature ≈ 0,0066 USD. Budget reicht für ca. 900 Features pro Tag bei akzeptabler Qualität.

Related Calculators

37% Rule Dating Calculator

Abitur Grade Calculator (KMK Scale)

Grade Points Calculator (15-Point System)

Budget und Mix wählen

Claude Opus 4.7 — Frontier-Tier

Claude Sonnet 4.6 — mittleres Tier

DeepSeek V3 — Budget-Tier

Preise ändern sich wöchentlich

Preisseiten der Anbieter (primär)

Claude — Preise

API-Preise

Gemini-API-Preise

DeepSeek API — Preise

xAI Models — Preise

Aggregat-Datensätze und Multi-Vendor

model_prices_and_context_window.json

Mistral — Preise

Together — Preise

Steuern und Währung

Euro-Referenzkurse

Umsatzsteuersatz Deutschland (§ 12 UStG)

Häufig gestellte Fragen

Related Calculators

37% Rule Dating Calculator

Abitur Grade Calculator (KMK Scale)

Grade Points Calculator (15-Point System)

Budget und Mix wählen

Claude Opus 4.7 — Frontier-Tier

Claude Sonnet 4.6 — mittleres Tier

DeepSeek V3 — Budget-Tier

Preise ändern sich wöchentlich

Preisseiten der Anbieter (primär)

Claude — Preise

API-Preise

Gemini-API-Preise

DeepSeek API — Preise

xAI Models — Preise

Aggregat-Datensätze und Multi-Vendor

model_prices_and_context_window.json

Mistral — Preise

Together — Preise

Steuern und Währung

Euro-Referenzkurse

Umsatzsteuersatz Deutschland (§ 12 UStG)

Häufig gestellte Fragen