Playbook· setup

Modell-Verfügbarkeit tracken, wenn ein Modell über Nacht verschwindet

Modelle kommen und gehen schneller als du denkst. Wie du eine Fallback-Kette baust, Verfügbarkeit aktiv prüfst und umschaltest, ohne dass deine Produktion bricht. Zehn Schritte.

Am 9. Juni 2026 hat Anthropic Claude Fable 5 gelauncht, eine Klasse über Opus. Am 12. Juni war es wieder weg, weltweit für alle, weil eine US-Export-Anweisung den Zugang sperrte. Drei Tage. Wer in der Zeit einen Workflow fest auf Fable festgenagelt hatte, stand am 12. Juni vor einem toten Modell-Namen und einer Pipeline die nichts mehr zurückgab.

Das ist kein Einzelfall, das ist der Normalzustand 2026. Modelle werden geplant abgeschaltet (Claude 4 wurde am 15. Juni retired), über Nacht suspendiert, regional gesperrt oder im Rate-Limit verschärft. Die Frage ist nicht ob dir ein Modell wegbricht, sondern wann. Dieses Playbook zeigt dir, wie du dich so aufstellst, dass dich der Wegfall eines einzelnen Modells nicht umwirft.

1. Verstehen, auf wie viele Arten ein Modell verschwindet

Es gibt nicht nur "abgeschaltet". Vier Fälle, die du auseinanderhalten musst, weil sie unterschiedliche Vorwarnzeit haben:

Geplante Deprecation. Der Anbieter kündigt Wochen vorher ein Abschalt-Datum an. Hier hast du Zeit, wenn du die Ankündigung mitbekommst. Suspendierung über Nacht. Export-Kontrolle, rechtlicher Streit, Sicherheitsvorfall. Null Vorwarnung, wie bei Fable. Regionale Sperre. Das Modell läuft, nur nicht von deinem Standort aus. Rate-Limit-Verschärfung. Das Modell ist da, aber dein Kontingent reicht plötzlich nicht mehr. Alle vier führen zum gleichen Ergebnis aus Sicht deines Workflows: der Aufruf schlägt fehl. Nur die Vorwarnzeit ist anders.

2. Niemals auf ein einzelnes Modell festnageln

Das ist der Kernfehler. Ein hartkodierter Modell-Name an einer einzigen Stelle, ohne Plan B. Wenn dieser Name stirbt, stirbt dein Workflow mit.

Die Denkweise die du brauchst: ein Modell ist eine austauschbare Ressource, kein fester Bestandteil. Du baust nicht "mit Fable", du baust "mit dem stärksten verfügbaren Modell, und das ist gerade Fable". Der Unterschied klingt akademisch, ist aber der ganze Punkt. Sobald du so denkst, ist der Ausfall eines Modells ein Wechsel, kein Bruch.

3. Eine Fallback-Kette definieren, anbieter-übergreifend

Eine Fallback-Kette ist eine geordnete Liste: wenn das erste Modell nicht geht, nimm das zweite, dann das dritte. Wichtig ist, dass die Kette nicht nur innerhalb eines Anbieters bleibt. Wenn ein Export-Stopp alle Modelle eines Anbieters trifft, hilft dir ein Fallback auf dasselbe Haus nichts.

Eine robuste Kette mischt deshalb die Häuser. Zum Beispiel: oben das Spitzenmodell das du eigentlich willst, darunter die solide Mittelklasse eines anderen Anbieters, ganz unten ein günstiges Modell das fast immer läuft. So überlebst du auch den Fall, dass ein ganzer Anbieter ausfällt. Welche Modellklassen es bei den drei Großen gibt und wofür sie reichen, steht in der Lektion Modell-Landschaft 2026.

4. Verfügbarkeit aktiv prüfen, nicht erst beim Ausfall merken

Warte nicht, bis ein Kunde sich beschwert. Die meisten Anbieter haben eine Status-Seite und einen Endpunkt der die aktuell verfügbaren Modelle auflistet. Ein simpler Aufruf gegen diese Modell-Liste, einmal am Tag oder vor einem wichtigen Lauf, sagt dir ob dein primäres Modell noch da ist, bevor du dich darauf verlässt.

Du musst dafür nichts Großes bauen. Ein kleiner Check der die Liste der verfügbaren Modelle holt und schaut ob dein Wunsch-Modell drin ist, reicht für den Anfang. Ist es weg, weißt du es zu deinen Bedingungen, nicht zu denen des Ausfalls.

5. Modell-Namen an genau einer Stelle zentralisieren

Wenn dein Modell-Name an fünf Stellen im Code oder in fünf verschiedenen Tools steht, ist ein Wechsel eine Suchaktion mit Fehlerquote. Leg die Modell-Wahl an eine einzige Stelle, eine Konfigurationsdatei, eine Umgebungsvariable, ein zentrales Feld. Dann ist ein Modell-Wechsel eine Änderung an einem Ort, nicht fünf.

Das ist dieselbe Disziplin wie bei Claude Code mit der fallbackModel-Einstellung. Wie das dort konkret aussieht, zeigt das Playbook Fallback-Modelle einrichten. Das Prinzip gilt aber überall, egal welches Tool: eine Quelle der Wahrheit für die Modell-Wahl.

6. Graceful degradation, lieber schwächer als gar nicht

Wenn dein Spitzenmodell wegfällt, ist ein schwächeres Modell fast immer besser als gar keine Antwort. Eine Klassifizierungs-Aufgabe läuft auch auf der Mittelklasse, nur vielleicht eine Spur ungenauer. Eine Zusammenfassung wird auf dem Budget-Modell etwas flacher, aber sie kommt.

Bau deine Kette deshalb so, dass sie nach unten degradiert statt abzubrechen. Der Fachbegriff dafür ist graceful degradation, sanftes Abstufen. Für die wirklich harten Aufgaben, tiefe Code-Architektur, langes mehrstufiges Denken, kann es sein dass nur das Spitzenmodell reicht. Dann ist die ehrliche Antwort an dieser Stelle nicht "irgendein Modell", sondern "warte bis das gute wieder da ist". Aber das ist die Ausnahme, nicht die Regel.

7. Den Wechsel testen, bevor es brennt

Du willst nicht beim echten Ausfall zum ersten Mal herausfinden, ob deine Fallback-Kette funktioniert. Der pragmatische Test: setz als primäres Modell kurz einen Namen den es nicht gibt, oder einen auf den du keinen Zugriff hast, und schau ob dein System sauber auf den nächsten Eintrag der Kette springt. Klappt das, weißt du dass die Mechanik greift. Danach stellst du das richtige Modell zurück.

Das ist ein Mini-Chaos-Test. Einmal absichtlich kaputt machen, beobachten, wieder geraderücken. Fünf Minuten, die dir im Ernstfall eine schlaflose Nacht sparen.

8. Kosten und Qualität beim Fallback im Blick behalten

Eine Fallback-Kette zeigt fast immer nach unten, vom teuren Spitzenmodell zum günstigeren. Das ist gut, im Ausfall wird es eher billiger als teurer. Pass nur auf, dass du nicht aus Versehen ein teureres Modell als Fallback einträgst, sonst kostet dich genau der Ausfall, gegen den du dich absichern wolltest, am meisten.

Und behalte im Kopf, dass ein Fallback die Qualität verändert. Wenn dein System still auf ein schwächeres Modell springt und niemand merkt es, kann die Ausgabe wochenlang schlechter sein, ohne dass du davon weißt. Deshalb der nächste Schritt.

9. Monitoring, das dir sagt wenn die Kette greift

Ein Fallback der lautlos passiert ist nur die halbe Lösung. Du willst wissen, wann dein System auf ein Ersatz-Modell umgeschaltet hat, besonders wenn es bis zum letzten Eintrag der Kette durchgefallen ist. Eine einzige Benachrichtigung, eine Mail, eine Telegram-Nachricht, ein Eintrag in einem Kanal, mit der Info "primäres Modell weg, laufe jetzt auf Fallback X" reicht.

Mach es nicht zu laut. Wenn jeder kurze Schluckauf dir eine Nachricht schickt, schaust du nach drei Tagen nicht mehr hin. Melde den Fall der wirklich zählt: die Kette ist auf dem letzten Modell, oder das Spitzenmodell ist seit Stunden weg. Das Prinzip ist dasselbe wie beim Alerting für Automationen, beschrieben in der Lektion Wenn Automationen scheitern.

10. Wann dich das alles nicht betrifft

Der ehrliche Schluss. Wenn du AI nur gelegentlich im Chat-Fenster nutzt und keine Pipeline betreibst die durchlaufen muss, brauchst du keine Fallback-Kette. Fällt dein Modell aus, nimmst du eben von Hand ein anderes. Der ganze Aufwand hier lohnt sich erst, wenn etwas automatisch läuft und nicht stehenbleiben darf, ein Agent, ein Workflow, ein Dienst für andere.

Aber genau das ist die Schwelle vom AI-Nutzer zum AI-Operator. Ein Nutzer merkt den Ausfall und wartet. Ein Operator hat vorgesorgt und merkt ihn kaum. Wann sich die teure Spitzenklasse überhaupt lohnt und wann die Mittelklasse reicht, vertieft das Playbook Mythos-Modellklasse, wann lohnt sich das.

Quellen

Claude Fable 5 Launch (09.06.2026) und Suspendierung per Export-Anweisung (12.06.2026): die Modell-Landschaft-Lektion dokumentiert den Verlauf, Anthropic-Ankündigungen unter https://www.anthropic.com/news
Claude Modell-Übersicht und Deprecation-Hinweise: https://platform.claude.com/docs/en/about-claude/models/overview
OpenAI Modell-Release- und Retirement-Notizen: https://help.openai.com/en/articles/9624314-model-release-notes
Gemini Modell-Übersicht: https://ai.google.dev/gemini-api/docs/models

Modell-Namen und Verfügbarkeit ändern sich schnell. Wenn du das Monate später liest, prüf den aktuellen Stand über die Links oben.

← Claude Code Agent Teams einric Zur Academy →