Modell-Landschaft 2026: Welches KI-Modell wofür
Ehrlicher Überblick über Claude, GPT und Gemini im Jahr 2026. Welche Modellklasse für welche Aufgabe reicht, ohne Hype, mit konkreten Preisen.
Die meisten Leute nehmen das teuerste Modell für alles. Das ist so, als würdest du für jede Fahrt zum Bäcker den Sportwagen aus der Garage holen. Funktioniert, kostet aber das Zehnfache und bringt dir beim Brötchenholen genau nichts.
2026 gibt es bei jedem großen Anbieter mindestens drei bis vier Modellklassen. Die teure für harte Probleme, eine mittlere für den Alltag, eine billige für Massenkram. Wenn du verstehst welche wofür gemacht ist, sparst du Geld und bekommst oft sogar bessere Ergebnisse, weil ein schnelles Modell auf einer einfachen Aufgabe weniger overengineered.
Diese Lesson ordnet die drei großen Familien ein. Keine Benchmarks, keine Tabellen mit 40 Spalten. Nur die Frage: wann reicht was.
Claude: Fable, Opus, Sonnet, Haiku
Anthropic staffelt nach Tiers. Die Namen Opus, Sonnet und Haiku gibt es seit Claude 3 aus dem März 2024, sie beschreiben die Größenklasse, nicht die Generation.
Ganz oben steht seit Juni 2026 Claude Fable 5, die neue Spitzenklasse. Die ist für Probleme gedacht wo du wirklich tiefes Reasoning brauchst, lange Ketten von Schlussfolgerungen, schwierige Code-Architektur. Sie kostet 10 Dollar pro Million Input-Tokens und 50 Dollar pro Million Output. Das klingt viel, und für eine schnelle Frage ist es das auch.
Darunter Opus 4.8 (5 Dollar Input, 25 Dollar Output), das klassische High-End-Arbeitspferd. Dann Sonnet 4.6 (3 und 15 Dollar), die mittlere Klasse die für 90 Prozent der echten Arbeit ausreicht. Und ganz unten Haiku 4.5 (1 und 5 Dollar), schnell und billig für einfache Klassifizierung, Zusammenfassungen, kurze Antworten.
Mein praktischer Rat: fang mit Sonnet an. Wenn die Antwort spürbar zu flach ist, geh eine Stufe hoch. Wenn du tausend Mails am Tag sortierst, geh runter auf Haiku. Du musst nicht raten, du kannst es einfach ausprobieren, der Unterschied ist beim Lesen sofort sichtbar.
GPT: Instant, Thinking, Pro und der Codex-Strang
OpenAI trennt 2026 nach Denkaufwand statt nach Größe. Der Default ist GPT-5.3 Instant, auch in der kostenlosen Version (dort mit Nutzungs-Kontingent). Schnell, antwortet sofort, gut für normale Gespräche und die meisten Alltagsfragen.
Wenn du "denk länger nach" willst, gibt es GPT-5.4 Thinking in den bezahlten Tiers, und ganz oben GPT-5.4 Pro für die schwersten Fälle. Das aktuelle Flaggschiff für agentische Aufgaben, also Modelle die selbstständig mehrere Schritte planen und Werkzeuge benutzen, ist GPT-5.5 seit April 2026.
Spannend für alle die programmieren: der Codex-Strang. Wenn du nach "chatgpt codex" suchst landest du hier. GPT-5.3-Codex ist OpenAIs fähigstes agentisches Coding-Modell, es vereint den alten Codex-Stack mit dem GPT-5-Stack und ist rund 25 Prozent schneller als der Vorgänger. Daneben gibt es eine kleinere Codex-Mini-Variante mit deutlich höherem Nutzungskontingent. Wenn du den ganzen Tag Code generieren lässt ist die kleine Variante oft die schlauere Wahl, weil du nicht nach drei Stunden ins Limit läufst.
Ein Hinweis am Rande, weil viele darüber stolpern: ältere Modelle werden abgeschaltet. o3 verschwindet am 26. August 2026, GPT-4.5 schon am 27. Juni 2026. Wenn dein Workflow noch auf einem alten Modellnamen festgenagelt ist, prüf das rechtzeitig.
Gemini: Pro, Flash, Flash-Lite
Google staffelt ähnlich wie Anthropic, nur mit anderen Namen. Die aktuelle, neueste Familie ist Gemini 3.5, die Generation davor war Gemini 3. Das Muster ist leicht zu merken: Pro für schweres Reasoning und Coding, Flash für schnellen Alltag, Flash-Lite für hohes Volumen zum kleinen Preis.
Gemini 3.5 Flash ist allgemein verfügbar und gilt als sehr stark für agentische Workflows und lange Aufgaben. Darüber sitzt die Pro-Stufe für die harten Fälle, darunter Flash-Lite für den billigen Massenbetrieb. Neu ist außerdem Gemini Omni, ein multimodales Modell das beliebige Eingaben in beliebige Ausgaben verwandelt, also Text, Bild, Audio in Kombination.
Wenn du schon tief im Google-Universum sitzt, mit Drive, Docs, Gmail, ist Gemini oft die naheliegende Wahl, einfach weil die Anbindung da ist.
Die ehrliche Wahrheit
Die Unterschiede zwischen den drei Familien sind kleiner als das Marketing dir weismacht. Auf einer durchschnittlichen Aufgabe wirst du zwischen Sonnet, GPT-5.3 und Gemini Flash kaum einen Unterschied merken. Der große Hebel ist nicht welche Marke, sondern welche Stufe innerhalb einer Marke.
Wo es wirklich auseinandergeht ist bei den schweren Sachen. Tiefe Code-Architektur, langes selbstständiges Arbeiten über viele Schritte, Probleme die echtes mehrstufiges Denken brauchen. Da zahlst du für die Spitzenmodelle, und da lohnt es sich auch.
Ein zweiter Punkt der oft untergeht: das Modell allein macht noch keinen guten Assistenten. Was den Unterschied macht ist Kontext. Ein Sonnet das dein Projekt kennt schlägt ein Fable das blind rät. Genau hier kommt sowas wie ein codebase-memory-mcp ins Spiel, ein Werkzeug das dem Modell dauerhaftes Gedächtnis über deinen Code gibt. Aber das ist eine eigene Geschichte für ein späteres Level.
Für jetzt reicht: nimm nicht reflexhaft das teuerste. Fang in der Mitte an, geh hoch wenn es nötig ist, runter wenn es geht.
Quiz
1. Du willst tausend Kundenmails pro Tag automatisch in Kategorien sortieren. Welche Modellklasse passt am besten?
- A) Claude Fable 5
- B) Haiku 4.5 oder Gemini Flash-Lite
- C) GPT-5.4 Pro
Richtig ist B. Einfache Klassifizierung in hohem Volumen ist genau der Fall für die billige, schnelle Stufe. Ein Spitzenmodell wäre reine Geldverschwendung.
2. Was beschreiben die Namen Opus, Sonnet und Haiku?
- A) Die Generation des Modells
- B) Das Erscheinungsjahr
- C) Die Größenklasse innerhalb einer Generation
Richtig ist C. Die Tier-Namen gibt es seit Claude 3 und stehen für groß, mittel, klein, nicht für die Generation.
3. Du lässt den ganzen Tag agentisch Code generieren und willst nicht ins Nutzungslimit laufen. Was ist oft die schlauere Wahl?
- A) GPT-5.3-Codex
- B) GPT-5-Codex-Mini
- C) GPT-4.5
Richtig ist B. Die Codex-Mini-Variante hat ein deutlich höheres Nutzungskontingent. C fällt sowieso weg, GPT-4.5 wird am 27. Juni 2026 abgeschaltet.
Source
Die konkreten Modellnamen, Versionen und Preise in dieser Lesson sind gegen die offiziellen Anbieter-Dokumentationen geprüft (Stand Juni 2026):
- Claude: platform.claude.com/docs/en/about-claude/models/overview
- OpenAI Modell-Release-Notes: help.openai.com/en/articles/9624314
- ChatGPT Release-Notes: help.openai.com/en/articles/6825453
- Gemini: ai.google.dev/gemini-api/docs/models
Modellnamen und Preise ändern sich schnell. Wenn du diese Lesson Monate später liest, prüf die Versionen über die Links oben nach.