Playbook· build

Opus 4.8 Migration, das erste Opus-Update ohne Breaking Changes

Opus 4.8 ist seit 28. Mai 2026 GA. Anders als der 4.7-Sprung gibt es null Breaking API-Changes, Du tauschst nur das model-Feld. Was sich trotzdem am Verhalten ändert, plus zwei neue Hebel: Fast Mode und Dynamic Workflows.

Opus 4.8 ist am 28. Mai 2026 GA gegangen, knapp sechs Wochen nach 4.7. Wenn Du die 4.7-Migration noch im Kopf hast, mit den drei harten 400-Errors weil temperature, top_p und budget_tokens rausgeflogen sind, dann ist die gute Nachricht hier kurz: das passiert diesmal nicht. Opus 4.8 ist ein echtes Drop-in. Dein 4.7-Code läuft unverändert, Du tauschst nur claude-opus-4-7 gegen claude-opus-4-8 im model-Feld.

Trotzdem ist es keine Migration die Du blind durchwinkst. Das Modell verhält sich anders, und es kommen zwei neue Hebel die Deine Cost- und Architektur-Entscheidungen berühren. Dieser Playbook ist für Dich wenn Du API-Code oder Claude Code im Daily-Driver hast und 4.8 sauber einziehen willst.

Schritt 1, das Ein-Zeilen-Upgrade

Such in Deiner Codebase nach dem model-String und tausch ihn.

grep -rn "claude-opus-4-7" src/
# jeden Treffer auf claude-opus-4-8 umstellen

Die 1-Million-Context-Variante heißt weiterhin claude-opus-4-8[1m], gleiche Schreibweise wie vorher. Verfügbar ist das Modell sofort auf der Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry und GitHub Copilot. Kein Beta-Header, kein neuer SDK-Pin, keine geänderten Request-Felder. Das war es technisch.

Schritt 2, das Pricing bleibt, aber prüf Deine eigene Doku

Standard-Pricing ist unverändert gegenüber 4.7: 5 Dollar pro Million Input-Tokens, 25 Dollar pro Million Output-Tokens. Kein Aufschlag fürs neue Modell.

Ein konkreter Stolperstein aus der Praxis: ich hatte in meiner internen Doku fälschlich 15 Dollar pro 75 Dollar stehen, ein Zahlendreher aus einer frühen Notiz. Wenn Du Pricing-Zahlen irgendwo hardcoded hast (Cost-Dashboards, interne Wikis, Kunden-Angebote), prüf sie gegen die offizielle Anthropic-Pricing-Page bevor Du auf Basis falscher Zahlen kalkulierst. Die echte Quelle ist platform.claude.com/docs/en/about-claude/pricing, nicht Dein Gedächtnis.

Schritt 3, das Verhalten ändert sich, auch ohne API-Change

Das ist der eigentliche Grund warum 4.8 keine triviale Migration ist. Die Kern-Verbesserung ist Honesty und Alignment. Anthropic gibt an dass 4.8 ungefähr vier Mal seltener als 4.7 einen Code-Fehler durchwinkt ohne ihn zu markieren. Das Modell flaggt häufiger Unsicherheiten über die eigene Arbeit und macht seltener unbelegte Behauptungen.

Praktisch heißt das: wenn Du einen Agent hast der bisher selbstbewusst durchgelaufen ist, wird er unter 4.8 öfter sagen "hier bin ich unsicher" oder "diese Annahme habe ich nicht verifiziert". Das ist gewollt und meistens besser. Aber wenn Deine Pipeline auf einer bestimmten Output-Form aufbaut (z.B. ein Parser der ein klares Ja/Nein erwartet), kann das zusätzliche Hedging Deinen Downstream-Code überraschen. Lauf einmal Deine wichtigsten Agent-Pfade durch und schau ob das vorsichtigere Antwortverhalten irgendwo eine harte Annahme bricht.

Die Benchmark-Zahlen dazu, falls Du sie brauchst: agentic Coding steigt von 64,3 auf 69,2 Prozent, multidisziplinäres Reasoning mit Tools von 54,7 auf 57,9, agentic Computer-Use von 82,8 auf 83,4. Die Coding-Verbesserung ist der spürbarste Sprung im Daily-Driver.

Schritt 4, Effort defaulted auf high

Opus 4.8 nutzt per Default den Effort-Level high. Anthropic gibt an dass das auf Coding-Tasks ungefähr gleich viele Tokens verbraucht wie 4.7, bei besserer Performance. Du kannst hochdrehen auf extra (in Claude Code heißt das xhigh) oder max, dann denkt das Modell länger und verbraucht mehr Tokens.

Wenn Du aus der 4.7-Welt kommst wo Claude Code teils auf xhigh defaultet hat, ist high als neuer Default eher eine leichte Cost-Entlastung bei gleicher oder besserer Qualität. Für kostensensible Workflows ist das eine gute Nachricht. Für kritische Reasoning-Tasks wo Du die letzten Prozent willst, setz bewusst max statt Dich auf den Default zu verlassen.

Schritt 5, Fast Mode als neuer Cost-Speed-Hebel

Neu mit 4.8 ist Fast Mode. Das Modell läuft ungefähr 2,5 Mal schneller, kostet aber 10 Dollar pro 50 Dollar je Million Tokens, also das Doppelte vom Standard. Anthropic beschreibt diesen Fast Mode als drei Mal günstiger als der Fast-Mode früherer Modelle.

Der Trade-off ist klar: doppelter Token-Preis für 2,5-fache Geschwindigkeit. Das lohnt sich nur wo Latenz echtes Geld oder echte UX kostet, z.B. ein interaktiver Chat-Flow den ein User live abwartet, oder ein Bulk-Job mit hartem Zeitfenster. Für Hintergrund-Cron-Agents, Research-Pipelines oder alles was asynchron läuft, bleib bei Standard. Da zahlst Du sonst doppelt für Geschwindigkeit die niemand braucht.

Schritt 6, Dynamic Workflows ist Research Preview, kein Produktions-Feature

Zusammen mit 4.8 hat Anthropic Dynamic Workflows als Research Preview gestartet, ein System um komplexe Aufgaben über hunderte parallele Subagents in Claude Code zu koordinieren. Das klingt nach genau dem CEO-Worker-Pattern das Du vielleicht schon von Hand baust.

Wichtig für die Migration: Research Preview heißt nicht produktionsreif. Probier es in einem Spielprojekt aus bevor Du Deine bestehende Subagent-Architektur darauf umbaust. Wenn Du heute schon mit einem eigenen Orchestrator arbeitest der läuft, ist das kein Grund sofort zu wechseln. Beobachte das Feature, bis es aus der Preview raus ist.

Migrations-Checkliste, fünf Punkte

Eins, model-Feld von claude-opus-4-7 auf claude-opus-4-8 umstellen, ein einziger grep-und-replace.

Zwei, hardcoded Pricing-Zahlen gegen die offizielle Pricing-Page prüfen, nicht aus dem Gedächtnis kalkulieren.

Drei, Deine wichtigsten Agent-Pfade einmal durchlaufen und schauen ob das vorsichtigere Antwortverhalten (mehr Hedging, mehr Unsicherheits-Flags) irgendwo eine harte Downstream-Annahme bricht.

Vier, Effort-Level bewusst setzen wo es zählt, statt Dich auf den neuen high-Default zu verlassen.

Fünf, Eval-Tests trotzdem einmal gegen 4.8 laufen lassen. Auch ohne Breaking Changes kann ein Prompt der auf 4.7-Verhalten optimiert war unter 4.8 anders reagieren, gerade wegen der Honesty-Änderung.

Sollst Du migrieren

Ja, und zwar zügig. Es gibt keine Breaking Changes, die Coding-Performance ist messbar besser, und die Honesty-Verbesserung reduziert genau die Klasse von Fehlern die Dir im Agent-Betrieb am meisten weh tut, nämlich den selbstbewusst falschen Output. Opus 4.7 bleibt als claude-opus-4-7 ansprechbar, aber es gibt diesmal wenig Grund drauf zu bleiben.

Was als nächstes

Wenn Du den Sprung von 4.6 auf 4.7 noch vor Dir hast, mach erst die Opus 4.7 Migration, die hat die echten Breaking Changes. Wenn Du Dein Claude-Code-Update-Ritual sauber aufsetzen willst, Claude Code Update-Strategie erklärt welche Releases stabil sind. Und wenn Fast Mode plus Effort-Level Deine Bills bewegen, Claude Code Cost-Controls für Daily Driver hat den Workflow um das zu messen.

Source

Anthropic Opus 4.8: https://www.anthropic.com/claude/opus
Claude API Pricing: https://platform.claude.com/docs/en/about-claude/pricing
What's new in Claude Opus 4.8: https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-8
TechCrunch zum Dynamic-Workflows-Tool: https://techcrunch.com/2026/05/28/anthropic-releases-opus-4-8-with-new-dynamic-workflow-tool

← Generative Engine Optimization Background-Sessions mit Claude→