Claude Opus 4.7: Was ist neu, Benchmarks & Komplette Anleitung (2026)
Claude Opus 4.7 ist da – 13 % besser beim Coding, 3-fache Vision-Kapazität, neue xhigh Effort-Stufe. Vollständige Benchmarks, Preise und Vergleich mit GPT-5.4.
TL;DR
| Detail | Claude Opus 4.7 |
|---|---|
| Veröffentlichungsdatum | 16. April 2026 |
| Modell-ID | claude-opus-4-7 |
| Preise | $5/$25 pro MTok (gleich wie Opus 4.6) |
| Kontextfenster | 1M Tokens |
| Verfügbarkeit | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Wichtigste Verbesserungen | 13 % besser beim Coding, 3x Vision, neue Effort-Level |
| SWE-bench Verified | ~85–90 % (vorher 80,8 %) |
| Neue Claude Code Funktion | /ultrareview — Multi-Agenten-Code-Review |
Was ist neu in Claude Opus 4.7?
Claude Opus 4.7 ist Anthropic's neuestes, allgemein verfügbares Frontier-Modell, das am 16. April 2026 veröffentlicht wurde. Es ist ein inkrementelles, aber bedeutendes Upgrade gegenüber Opus 4.6, mit den größten Fortschritten in den Bereichen Software-Engineering und Vision.
Im Gegensatz zu Claude Mythos Preview (das Anthropic auf Cybersecurity-Partner beschränkt hat), ist Opus 4.7 öffentlich verfügbar über alle Claude-Produkte und APIs hinweg.
Benchmark-Ergebnisse
Software-Engineering
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85–90 % | 80,8 % | ~80 % | 93,9 % |
| SWE-bench Pro | ~45 % | — | 57,7 % | 77,8 % |
| Terminal-Bench 2.0 | 65,4 % | 66,5 % | 75,1 % | 82 % |
| Interne 93-Aufgaben-Codierung | +13 % vs 4.6 | Baseline | — | — |
| Rakuten-SWE-Bench | 3x mehr gelöst | Baseline | — | — |
Die größte Verbesserung zeigt sich bei schwierigen, dateiübergreifenden Aufgaben. Anthropic hebt speziell Gewinne bei den „schwierigsten Aufgaben“ hervor – jenen, die das Verständnis mehrerer Dateien, komplexes Refactoring und die Verifizierung von Ergebnissen erfordern.
Andere Fähigkeiten
| Bereich | Verbesserung |
|---|---|
| Dokumenten-Reasoning | 21 % weniger Fehler |
| Fabrikautomatisierung | 10–15 % Leistungssteigerung |
| Vision | 3-fache Bildauflösung (bis zu 2.576px / 3,75MP) |
| Langer Kontext | Verbessertes Retrieval und Reasoning über 1M Tokens |
| MCP-Optimierung | 30 % weniger Token-Overhead gegenüber Opus 4.5 |
Vision-Upgrade: 3-fache Auflösung
Opus 4.7 akzeptiert Bilder mit bis zu 2.576 Pixeln an der langen Kante (~3,75 Megapixel) — mehr als das Dreifache der bisherigen Kapazität. Dies ist entscheidend für:
- Technische Diagramme — Architekturdiagramme, Schaltpläne
- Chemische Strukturen — Molekulardiagramme in Publikationsqualität
- Dichte Screenshots — Ganzseitige Aufnahmen von Code, Dashboards, Tabellenkalkulationen
- Design-Mockups — Hochauflösende UI-Designs
Neu: Effort-Steuerung mit „xhigh“
Opus 4.7 führt ein neues Effort-Level ein: xhigh — angesiedelt zwischen „high“ und „max“.
| Effort-Level | Anwendungsfall | Token-Verbrauch |
|---|---|---|
| low | Einfache Abfragen, schnelle Antworten | Minimal |
| medium | Standardaufgaben | Normal |
| high | Komplexes Reasoning | Erhöht |
| xhigh | Schwierige, mehrstufige Aufgaben | Hoch |
| max | Härteste Probleme, höchste Qualität | Maximum |
Das xhigh-Level bietet Ihnen mehr Tiefe im Reasoning als „high“, ohne die vollen Token-Kosten von „max“ zu verursachen — ein praktischer Mittelweg für Produktions-Workloads.
Task-Budgets (Public Beta)
Zusammen mit der Effort-Steuerung führt Anthropic Task-Budgets ein — eine Möglichkeit für Entwickler, ein Ausgabenlimit für Token bei lang laufenden Operationen festzulegen. Dies ermöglicht Kostenkontrolle, ohne jeden API-Aufruf mikromanagen zu müssen.
Claude Code Updates
/ultrareview — Multi-Agenten-Code-Review
Das Highlight-Feature von Claude Code ist /ultrareview — ein Cloud-basiertes Code-Review-System, das mehrere Sub-Agenten nutzt, um Ihren Code zu analysieren:
- Fehlererkennungsphase: Erzeugt 5–20 Sub-Agenten, die unabhängig voneinander verschiedene Pfade in Ihrer Codebasis untersuchen.
- Verifizierungsphase: Separate Sub-Agenten verifizieren jeden potenziellen Fehler und filtern Fehlalarme (False Positives) heraus.
Auto-Modus für Max-Nutzer
Der Auto-Modus — in dem Claude Code Befehle ausführt und Änderungen vornimmt, ohne um Bestätigung zu bitten — ist jetzt für Max-Abonnenten verfügbar.
Opus 4.7 vs. GPT-5.4: Welches Modell sollten Sie nutzen?
| Dimension | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Komplexes Coding | Führend (dateiübergreifendes Refactoring) | Stark, aber dahinter |
| Computer-Nutzung | Nicht verfügbar | Führend (75 % OSWorld) |
| Langer Kontext | 1M Tokens, besseres Reasoning | 1,05M Tokens |
| Vision | 3,75MP, technische Diagramme | Gut, aber kleiner |
| Geschwindigkeit | Langsamer, gründlicher | Schnellere Ausführung |
| Preis | $5/$25 pro MTok | $2,50/$15 pro MTok |
| MCP-Unterstützung | Nativ, optimiert | Begrenzt |
Warnung zum Token-Verbrauch
Opus 4.7 verwendet einen aktualisierten Tokenizer, der Text anders verarbeitet. Derselbe Input kann, abhängig vom Inhalt, zu 1,0–1,35x mehr Tokens führen. In Kombination mit mehr Output-Tokens bei höheren Effort-Leveln könnten Ihre Kosten steigen, obwohl sich die Preise pro Token nicht geändert haben.
Wenn Sie von Opus 4.6 upgraden, überwachen Sie Ihren Token-Verbrauch in den ersten Tagen genau.
Cybersecurity-Schutzmaßnahmen
Nach der Situation um Mythos Preview hat Anthropic Cybersecurity-Schutzmaßnahmen direkt in Opus 4.7 integriert:
- Automatische Erkennung und Blockierung von verbotenen oder risikoreichen Cybersecurity-Anfragen.
- Cyber-Verifizierungsprogramm für legitime Sicherheitsforscher und Penetrationstester.
- Absichtlich weniger leistungsfähig im Bereich Cyber als Mythos Preview, was es Anthropic ermöglicht, Schutzmaßnahmen zuerst an einem weniger mächtigen Modell zu testen.
Zugriffsmöglichkeiten
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # Standardmäßig das neueste Opus-Modell
Ab dem ersten Tag auch auf Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar.
Häufig gestellte Fragen (FAQ)
Wie viel kostet Claude Opus 4.7?
$5 pro Million Input-Tokens und $25 pro Million Output-Tokens — genauso viel wie Opus 4.6. Der aktualisierte Tokenizer kann jedoch zu 1,0–1,35x mehr Tokens für denselben Inhalt führen.
Ist Opus 4.7 besser als GPT-5.4?
Für komplexes Software-Engineering und dateiübergreifende Coding-Aufgaben: Ja. Für Computer-Nutzung, Desktop-Automatisierung und Kosteneffizienz ist GPT-5.4 derzeit besser. Beide glänzen in unterschiedlichen Bereichen.
Was ist der /ultrareview Befehl in Claude Code?
Es ist ein Multi-Agenten-Code-Review-System, das 5–20 Sub-Agenten startet, um unabhängig Fehler in Ihrem Code zu finden, und dann jeden Fund verifiziert, um Fehlalarme zu filtern. Pro- und Max-Nutzer erhalten 3 kostenlose Ultrareviews.
Wie schlägt sich Opus 4.7 im Vergleich zu Claude Mythos Preview?
Mythos Preview ist deutlich leistungsfähiger (93,9 % vs. ~85–90 % im SWE-bench), aber nicht öffentlich verfügbar. Opus 4.7 ist das beste Claude-Modell, das man tatsächlich benutzen kann.
Sollte ich von Opus 4.6 upgraden?
Ja, wenn Sie komplexes Coding betreiben oder mit technischen Bildern arbeiten. Die 13 % Verbesserung beim Coding und die 3-fache Vision-Auflösung sind bedeutend. Achten Sie nur auf Ihren Token-Verbrauch, da der neue Tokenizer die Kosten erhöhen kann.
Was ist das „xhigh“ Effort-Level?
Eine neue Effort-Einstellung zwischen „high“ und „max“, die mehr Reasoning-Tiefe bietet, ohne die vollen Token-Kosten von maximalem Effort zu verursachen. Gut für schwierige Aufgaben, bei denen Qualität wichtig ist, aber die Kosten kontrolliert werden müssen.
Fazit
Opus 4.7 ist ein solides Upgrade, keine Revolution. Die Fortschritte beim Coding sind real, die Vision-Verbesserungen sind signifikant und /ultrareview ist eine wirklich neue Fähigkeit. Aber die größte Nachricht ist vielleicht das, was es nicht ist — es ist nicht Mythos Preview. Die Lücke zwischen Anthropics öffentlichen und privaten Modellen ist nun größer denn je.
Für Entwickler ist Opus 4.7 das beste öffentlich verfügbare Claude-Modell und eine starke Wahl für komplexe Engineering-Arbeiten. Wenn Sie KI-gestützte Produkte entwickeln möchten, ohne Modelle und Infrastruktur selbst zu verwalten, übernimmt Y Build das für Sie — stellen Sie es sich als Mobile-First KI-Agent vor, der Produkte liefert, ganz ohne Server oder Terminal.