Claude Opus 4.7: Nowości, benchmarki i pełny przewodnik (2026)
Claude Opus 4.7 już tu jest — o 13% lepszy w kodowaniu, 3x większa wydajność wizyjna, nowy poziom wysiłku xhigh. Pełne benchmarki, ceny i porównanie z GPT-5.4.
TL;DR
| Szczegół | Claude Opus 4.7 |
|---|---|
| Data premiery | 16 kwietnia 2026 |
| ID modelu | claude-opus-4-7 |
| Cennik | $5/$25 za MTok (tak samo jak Opus 4.6) |
| Okno kontekstowe | 1 mln tokenów |
| Dostępność | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Kluczowe ulepszenia | 13% lepszy w kodowaniu, 3x lepsza wizja, nowe poziomy wysiłku |
| SWE-bench Verified | ~85-90% (wzrost z 80,8%) |
| Nowa funkcja Claude Code | /ultrareview — wieloagentowy przegląd kodu |
Co nowego w Claude Opus 4.7?
Claude Opus 4.7 to najnowszy, ogólnodostępny model typu frontier od Anthropic, wydany 16 kwietnia 2026 roku. Jest to stopniowe, ale znaczące ulepszenie względem wersji Opus 4.6, oferujące największe korzyści w obszarach inżynierii oprogramowania oraz wizji.
W przeciwieństwie do Claude Mythos Preview (który Anthropic udostępnił wyłącznie partnerom z branży cyberbezpieczeństwa), Opus 4.7 jest publicznie dostępny we wszystkich produktach i API Claude.
Wyniki benchmarków
Inżynieria oprogramowania
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80,8% | ~80% | 93,9% |
| SWE-bench Pro | ~45% | — | 57,7% | 77,8% |
| Terminal-Bench 2.0 | 65,4% | 66,5% | 75,1% | 82% |
| Wewnętrzny test kodowania (93 zadania) | +13% vs 4.6 | punkt odniesienia | — | — |
| Rakuten-SWE-Bench | 3x więcej rozwiązanych | punkt odniesienia | — | — |
Największa poprawa dotyczy trudnych, wieloplikowych zadań. Anthropic szczególnie podkreśla zyski w "najtrudniejszych zadaniach" — takich, które wymagają zrozumienia wielu plików, złożonej refaktoryzacji i weryfikacji wyników.
Inne możliwości
| Obszar | Ulepszenie |
|---|---|
| Wnioskowanie z dokumentów | 21% mniej błędów |
| Automatyka przemysłowa | 10-15% wzrostu wydajności |
| Wizja | 3x większa rozdzielczość obrazu (do 2 576 px / 3,75 MP) |
| Długi kontekst | Poprawione wyszukiwanie i wnioskowanie przy 1 mln tokenów |
| Optymalizacja MCP | 30% mniejszy narzut tokenów vs Opus 4.5 |
Ulepszenie wizji: 3x wyższa rozdzielczość
Opus 4.7 akceptuje obrazy o rozdzielczości do 2 576 pikseli na dłuższej krawędzi (~3,75 megapiksela) — to ponad trzykrotność poprzedniej wydajności. Ma to kluczowe znaczenie dla:
- Schematów technicznych — wykresów architektury, schematów obwodów.
- Struktur chemicznych — diagramów molekularnych w jakości publikacyjnej.
- Złożonych zrzutów ekranu — pełnych zrzutów kodu, paneli sterowania, arkuszy kalkulacyjnych.
- Makiet projektowych — projektów UI o wysokiej wierności.
Nowość: Kontrola wysiłku dzięki "xhigh"
Opus 4.7 wprowadza nowy poziom wysiłku (effort): xhigh — plasujący się pomiędzy "high" a "max".
| Poziom wysiłku | Zastosowanie | Zużycie tokenów |
|---|---|---|
| low | Proste zapytania, szybkie odpowiedzi | Minimalne |
| medium | Standardowe zadania | Normalne |
| high | Złożone rozumowanie | Podwyższone |
| xhigh | Trudne zadania wieloetapowe | Wysokie |
| max | Najtrudniejsze problemy, najwyższa jakość | Maksymalne |
Poziom xhigh oferuje większą głębię rozumowania niż "high" bez pełnego kosztu tokenów poziomu "max" — co stanowi praktyczny kompromis dla zadań produkcyjnych.
Budżety zadań (Public Beta)
Wraz z kontrolą wysiłku Anthropic wprowadza budżety zadań (task budgets) — sposób na ustawienie przez deweloperów limitu wydatków na tokeny dla długotrwałych operacji. Daje to kontrolę nad kosztami bez konieczności mikrozarządzania każdym wywołaniem API.
Aktualizacje Claude Code
/ultrareview — Wieloagentowy przegląd kodu
Najważniejszą funkcją Claude Code jest /ultrareview — system przeglądu kodu oparty na chmurze, który wykorzystuje wiele podagentów do analizy kodu:
- Faza wykrywania błędów: Uruchamia od 5 do 20 podagentów, którzy niezależnie badają różne ścieżki w bazie kodu.
- Faza weryfikacji: Oddzielne podagenty weryfikują każdy potencjalny błąd, odfiltrowując wyniki fałszywie dodatnie.
Tryb Auto dla użytkowników Max
Tryb Auto — w którym Claude Code wykonuje polecenia i wprowadza zmiany bez proszenia o potwierdzenie — jest teraz dostępny dla subskrybentów Max.
Opus 4.7 vs GPT-5.4: Który wybrać?
| Wymiar | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Złożone kodowanie | Lider (refaktoryzacja wieloplikowa) | Silny, ale w tyle |
| Computer use | Niedostępne | Lider (75% OSWorld) |
| Długi kontekst | 1 mln tokenów, lepsze wnioskowanie | 1,05 mln tokenów |
| Wizja | 3,75 MP, schematy techniczne | Dobra, ale mniejsza |
| Szybkość | Wolniejszy, dokładniejszy | Szybsze wykonanie |
| Cena | $5/$25 za MTok | $2,50/$15 za MTok |
| Wsparcie MCP | Natywne, zoptymalizowane | Ograniczone |
Ostrzeżenie dotyczące zużycia tokenów
Opus 4.7 korzysta ze zaktualizowanego tokenizera, który przetwarza tekst w inny sposób. Ten sam tekst wejściowy może zostać przeliczony na 1,0–1,35x więcej tokenów w zależności od treści. W połączeniu z większą liczbą tokenów wyjściowych na wyższych poziomach wysiłku, koszty mogą wzrosnąć, mimo że cena za token nie uległa zmianie.
Jeśli przechodzisz z wersji Opus 4.6, monitoruj zużycie tokenów przez pierwsze kilka dni.
Zabezpieczenia cybernetyczne
Po sytuacji z Mythos Preview, Anthropic wbudował zabezpieczenia cybernetyczne bezpośrednio w model Opus 4.7:
- Automatyczne wykrywanie i blokowanie zabronionych lub wysokiego ryzyka zapytań dotyczących cyberbezpieczeństwa.
- Program weryfikacji cybernetycznej (Cyber Verification Program) dla legalnych badaczy bezpieczeństwa i testerów penetracyjnych.
- Celowo mniejsze możliwości w zakresie cyber niż w Mythos Preview, co pozwala Anthropic przetestować zabezpieczenia najpierw na mniej potężnym modelu.
Jak uzyskać dostęp
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # domyślnie wybiera najnowszą wersję opus
Model jest również dostępny na platformach Amazon Bedrock, Google Cloud Vertex AI oraz Microsoft Foundry od dnia premiery.
Często zadawane pytania
Ile kosztuje Claude Opus 4.7?
5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych — tyle samo co Opus 4.6. Jednak zaktualizowany tokenizer może spowodować generowanie o 1,0-1,35x więcej tokenów dla tej samej treści.
Czy Opus 4.7 jest lepszy niż GPT-5.4?
W przypadku złożonej inżynierii oprogramowania i wieloplikowych zadań kodowania — tak. W przypadku korzystania z komputera, automatyzacji pulpitu i efektywności kosztowej, GPT-5.4 jest obecnie lepszy. Oba modele przodują w innych dziedzinach.
Czym jest komenda /ultrareview w Claude Code?
To wieloagentowy system przeglądu kodu, który uruchamia od 5 do 20 podagentów w celu niezależnego znalezienia błędów w kodzie, a następnie weryfikuje każde znalezisko, aby odfiltrować wyniki fałszywie dodatnie. Użytkownicy Pro i Max otrzymują 3 darmowe ultrareview.
Jak Opus 4.7 wypada w porównaniu do Claude Mythos Preview?
Mythos Preview jest znacznie bardziej wydajny (93,9% vs ~85-90% w SWE-bench), ale nie jest publicznie dostępny. Opus 4.7 to najlepszy model Claude, z którego faktycznie można korzystać.
Czy powinienem przejść z Opus 4.6?
Tak, jeśli zajmujesz się złożonym kodowaniem lub pracujesz z obrazami technicznymi. 13% poprawy w kodowaniu i 3x wyższa rozdzielczość wizji są znaczące. Pamiętaj tylko, aby monitorować zużycie tokenów, ponieważ nowy tokenizer może zwiększyć koszty.
Co to jest poziom wysiłku "xhigh"?
Nowe ustawienie wysiłku pomiędzy "high" a "max", które zapewnia większą głębię rozumowania bez ponoszenia pełnego kosztu tokenów związanego z maksymalnym wysiłkiem. Idealne do trudnych zadań, gdzie zależy Ci na jakości, ale musisz kontrolować koszty.
Podsumowanie
Opus 4.7 to solidna aktualizacja, a nie rewolucja. Zyski w kodowaniu są realne, poprawa wizji jest znacząca, a /ultrareview to autentycznie nowa możliwość. Jednak najważniejszą wiadomością może być to, czym ten model nie jest — nie jest to Mythos Preview. Luka między publicznymi a prywatnymi modelami Anthropic jest teraz szersza niż kiedykolwiek.
Dla programistów Opus 4.7 jest najlepszym publicznie dostępnym modelem Claude i silnym wyborem do złożonych prac inżynieryjnych. Jeśli chcesz budować produkty oparte na AI bez zarządzania modelami i infrastrukturą, Y Build zajmie się tym za Ciebie — pomyśl o tym jak o agencie AI typu mobile-first, który dostarcza gotowe produkty bez potrzeby posiadania serwera czy terminala.