Level 1· Lektion 11 von 13

Modell-Landschaft 2026: Welches KI-Modell wofür

Ehrlicher Überblick über Claude, GPT und Gemini im Jahr 2026. Welche Modellklasse für welche Aufgabe reicht, ohne Hype, mit konkreten Preisen.

Die meisten Leute nehmen das teuerste Modell für alles. Das ist so, als würdest du für jede Fahrt zum Bäcker den Sportwagen aus der Garage holen. Funktioniert, kostet aber das Zehnfache und bringt dir beim Brötchenholen genau nichts.

2026 gibt es bei jedem großen Anbieter mindestens drei bis vier Modellklassen. Die teure für harte Probleme, eine mittlere für den Alltag, eine billige für Massenkram. Wenn du verstehst welche wofür gemacht ist, sparst du Geld und bekommst oft sogar bessere Ergebnisse, weil ein schnelles Modell auf einer einfachen Aufgabe weniger overengineered.

Diese Lesson ordnet die drei großen Familien ein. Keine Benchmarks, keine Tabellen mit 40 Spalten. Nur die Frage: wann reicht was.

Claude: Opus, Sonnet, Haiku

Anthropic staffelt nach Tiers. Die Namen Opus, Sonnet und Haiku gibt es seit Claude 3 aus dem März 2024, sie beschreiben die Größenklasse, nicht die Generation.

Die aktuelle Spitze ist Opus 4.8 (5 Dollar pro Million Input-Tokens, 25 Dollar Output), das High-End-Arbeitspferd für Probleme wo du wirklich tiefes Reasoning brauchst, lange Ketten von Schlussfolgerungen, schwierige Code-Architektur. Darunter Sonnet 4.6 (3 und 15 Dollar), die mittlere Klasse die für 90 Prozent der echten Arbeit ausreicht. Und ganz unten Haiku 4.5 (1 und 5 Dollar), schnell und billig für einfache Klassifizierung, Zusammenfassungen, kurze Antworten.

Eine lehrreiche Fußnote, weil sie zeigt wie schnell sich das dreht. Am 9. Juni 2026 hat Anthropic Claude Fable 5 gelauncht (10 Dollar Input, 50 Dollar Output), eine Klasse über Opus. Drei Tage später, am 12. Juni, war es weg, weltweit für alle, weil eine US-Exportkontrolle nach einem gemeldeten Jailbreak den Zugang für ausländische Nutzer verbot und Anthropic daraufhin lieber allen den Stecker zog, statt in Echtzeit Nationalitäten zu prüfen. Am 30. Juni hat die US-Behörde die Kontrolle wieder aufgehoben, seit dem 1. Juli ist Fable global zurück, auch in der EU. Ein Detail bleibt für europäische Nutzer trotzdem wichtig: Fable und sein Schwestermodell Mythos gelten als Covered Models mit einer Pflicht-Speicherung von mindestens 30 Tagen, eine Zero-Data-Retention-Option gibt es nicht, auch nicht in EU-Regionen. Wo das zählt, ist Opus 4.8 die ruhigere Wahl. Die eigentliche Lehre ist nicht "nimm das stärkste Modell", sondern "bau so, dass dich der Wegfall eines einzelnen Modells nicht umwirft". Mehr dazu in einem späteren Level.

Mein praktischer Rat: fang mit Sonnet an. Wenn die Antwort spürbar zu flach ist, geh eine Stufe hoch. Wenn du tausend Mails am Tag sortierst, geh runter auf Haiku. Du musst nicht raten, du kannst es einfach ausprobieren, der Unterschied ist beim Lesen sofort sichtbar.

GPT: Instant, Thinking, Pro und der Codex-Strang

OpenAI trennt 2026 nach Denkaufwand statt nach Größe. Der Default ist seit Mai 2026 GPT-5.5 Instant, auch in der kostenlosen Version (dort mit Nutzungs-Kontingent). Schnell, antwortet sofort, gut für normale Gespräche und die meisten Alltagsfragen.

Wenn du "denk länger nach" willst, gibt es die Thinking-Stufe, GPT-5.5 Thinking in den bezahlten Tiers. Das aktuelle Flaggschiff, auch für agentische Aufgaben, also Modelle die selbstständig mehrere Schritte planen und Werkzeuge benutzen, ist GPT-5.5 seit April 2026, in der stärksten Ausbaustufe GPT-5.5 Pro für die schwersten Fälle.

Spannend für alle die programmieren: der Codex-Strang. Wenn du nach "chatgpt codex" suchst landest du hier. GPT-5.3-Codex ist OpenAIs fähigstes agentisches Coding-Modell, es vereint den alten Codex-Stack mit dem GPT-5-Stack und ist rund 25 Prozent schneller als der Vorgänger. Daneben gibt es eine kleinere Codex-Mini-Variante mit deutlich höherem Nutzungskontingent. Wenn du den ganzen Tag Code generieren lässt ist die kleine Variante oft die schlauere Wahl, weil du nicht nach drei Stunden ins Limit läufst.

Ein Hinweis am Rande, weil viele darüber stolpern: ältere Modelle werden abgeschaltet. o3 verschwindet am 26. August 2026, GPT-4.5 schon am 27. Juni 2026. Wenn dein Workflow noch auf einem alten Modellnamen festgenagelt ist, prüf das rechtzeitig.

Gemini: Pro, Flash, Flash-Lite

Google staffelt ähnlich wie Anthropic, nur mit anderen Namen. Die aktuelle, neueste Familie ist Gemini 3.5, die Generation davor war Gemini 3. Das Muster ist leicht zu merken: Pro für schweres Reasoning und Coding, Flash für schnellen Alltag, Flash-Lite für hohes Volumen zum kleinen Preis.

Gemini 3.5 Flash ist allgemein verfügbar und gilt als sehr stark für agentische Workflows und lange Aufgaben. Darüber sitzt die Pro-Stufe für die harten Fälle, darunter Flash-Lite für den billigen Massenbetrieb. Neu ist außerdem Gemini Omni, ein multimodales Modell das beliebige Eingaben in beliebige Ausgaben verwandelt, also Text, Bild, Audio in Kombination.

Wenn du schon tief im Google-Universum sitzt, mit Drive, Docs, Gmail, ist Gemini oft die naheliegende Wahl, einfach weil die Anbindung da ist.

Die ehrliche Wahrheit

Die Unterschiede zwischen den drei Familien sind kleiner als das Marketing dir weismacht. Auf einer durchschnittlichen Aufgabe wirst du zwischen Sonnet, GPT-5.5 und Gemini Flash kaum einen Unterschied merken. Der große Hebel ist nicht welche Marke, sondern welche Stufe innerhalb einer Marke.

Wo es wirklich auseinandergeht ist bei den schweren Sachen. Tiefe Code-Architektur, langes selbstständiges Arbeiten über viele Schritte, Probleme die echtes mehrstufiges Denken brauchen. Da zahlst du für die Spitzenmodelle, und da lohnt es sich auch.

Ein zweiter Punkt der oft untergeht: das Modell allein macht noch keinen guten Assistenten. Was den Unterschied macht ist Kontext. Ein Sonnet das dein Projekt kennt schlägt ein Opus das blind rät. Genau hier kommt sowas wie ein codebase-memory-mcp ins Spiel, ein Werkzeug das dem Modell dauerhaftes Gedächtnis über deinen Code gibt. Aber das ist eine eigene Geschichte für ein späteres Level.

Für jetzt reicht: nimm nicht reflexhaft das teuerste. Fang in der Mitte an, geh hoch wenn es nötig ist, runter wenn es geht.

Quiz

1. Du willst tausend Kundenmails pro Tag automatisch in Kategorien sortieren. Welche Modellklasse passt am besten?

A) Opus 4.8
B) Haiku 4.5 oder Gemini Flash-Lite
C) GPT-5.5 Pro

Richtig ist B. Einfache Klassifizierung in hohem Volumen ist genau der Fall für die billige, schnelle Stufe. Ein Spitzenmodell wäre reine Geldverschwendung.

2. Was beschreiben die Namen Opus, Sonnet und Haiku?

A) Die Generation des Modells
B) Das Erscheinungsjahr
C) Die Größenklasse innerhalb einer Generation

Richtig ist C. Die Tier-Namen gibt es seit Claude 3 und stehen für groß, mittel, klein, nicht für die Generation.

3. Du lässt den ganzen Tag agentisch Code generieren und willst nicht ins Nutzungslimit laufen. Was ist oft die schlauere Wahl?

A) GPT-5.3-Codex
B) GPT-5-Codex-Mini
C) GPT-4.5

Richtig ist B. Die Codex-Mini-Variante hat ein deutlich höheres Nutzungskontingent. C fällt sowieso weg, GPT-4.5 wird am 27. Juni 2026 abgeschaltet.

Source

Die konkreten Modellnamen, Versionen und Preise in dieser Lesson sind gegen die offiziellen Anbieter-Dokumentationen geprüft (Stand Juni 2026):

Claude: platform.claude.com/docs/en/about-claude/models/overview
OpenAI Modell-Release-Notes: help.openai.com/en/articles/9624314
ChatGPT Release-Notes: help.openai.com/en/articles/6825453
Gemini: ai.google.dev/gemini-api/docs/models

Zur Fable-5-Fußnote (Launch am 9. Juni 2026, weltweite Sperrung am 12. Juni nach einer US-Exportkontrolle, Aufhebung am 30. Juni, globale Rückkehr inklusive EU am 1. Juli 2026):

Anthropic, Launch-Ankündigung: anthropic.com/news/claude-fable-5-mythos-5
Anthropic, Wieder-Verfügbarkeit: anthropic.com/news/redeploying-fable-5
US-Behörde hebt die Exportkontrollen auf (01.07.2026): euronews.com
EU-Datenhaltung (Covered Models, 30-Tage-Pflichtretention): support.claude.com

Modellnamen und Preise ändern sich schnell. Wenn du diese Lesson Monate später liest, prüf die Versionen über die Links oben nach.

Du liest ohne Account. Login speichert Deinen Fortschritt, damit Du beim nächsten Mal direkt weitermachen kannst. Einloggen →

← Git für KI 3, der GitHub MCP S Datenschutz für AI-Einsteiger:→