Claude Opus 4.7: Nowości, benchmarki i pełny przewodnik (2026)

Q: Opus 4.7 vs GPT-5.4: Który wybrać?

| Wymiar | Opus 4.7 | GPT-5.4 | |-----------|----------|---------| | Złożone kodowanie | Lider (refaktoryzacja wieloplikowa) | Silny, ale w tyle |

TL;DR

Szczegół	Claude Opus 4.7
Data premiery	16 kwietnia 2026
ID modelu	`claude-opus-4-7`
Cennik	$5/$25 za MTok (tak samo jak Opus 4.6)
Okno kontekstowe	1 mln tokenów
Dostępność	API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry
Kluczowe ulepszenia	13% lepszy w kodowaniu, 3x lepsza wizja, nowe poziomy wysiłku
SWE-bench Verified	~85-90% (wzrost z 80,8%)
Nowa funkcja Claude Code	`/ultrareview` — wieloagentowy przegląd kodu

Co nowego w Claude Opus 4.7?

Claude Opus 4.7 to najnowszy, ogólnodostępny model typu frontier od Anthropic, wydany 16 kwietnia 2026 roku. Jest to stopniowe, ale znaczące ulepszenie względem wersji Opus 4.6, oferujące największe korzyści w obszarach inżynierii oprogramowania oraz wizji.

W przeciwieństwie do Claude Mythos Preview (który Anthropic udostępnił wyłącznie partnerom z branży cyberbezpieczeństwa), Opus 4.7 jest publicznie dostępny we wszystkich produktach i API Claude.

Wyniki benchmarków

Inżynieria oprogramowania

Benchmark	Opus 4.7	Opus 4.6	GPT-5.4	Mythos Preview
SWE-bench Verified	~85-90%	80,8%	~80%	93,9%
SWE-bench Pro	~45%	—	57,7%	77,8%
Terminal-Bench 2.0	65,4%	66,5%	75,1%	82%
Wewnętrzny test kodowania (93 zadania)	+13% vs 4.6	punkt odniesienia	—	—
Rakuten-SWE-Bench	3x więcej rozwiązanych	punkt odniesienia	—	—

Największa poprawa dotyczy trudnych, wieloplikowych zadań. Anthropic szczególnie podkreśla zyski w "najtrudniejszych zadaniach" — takich, które wymagają zrozumienia wielu plików, złożonej refaktoryzacji i weryfikacji wyników.

Inne możliwości

Obszar	Ulepszenie
Wnioskowanie z dokumentów	21% mniej błędów
Automatyka przemysłowa	10-15% wzrostu wydajności
Wizja	3x większa rozdzielczość obrazu (do 2 576 px / 3,75 MP)
Długi kontekst	Poprawione wyszukiwanie i wnioskowanie przy 1 mln tokenów
Optymalizacja MCP	30% mniejszy narzut tokenów vs Opus 4.5

Ulepszenie wizji: 3x wyższa rozdzielczość

Opus 4.7 akceptuje obrazy o rozdzielczości do 2 576 pikseli na dłuższej krawędzi (~3,75 megapiksela) — to ponad trzykrotność poprzedniej wydajności. Ma to kluczowe znaczenie dla:

Schematów technicznych — wykresów architektury, schematów obwodów.
Struktur chemicznych — diagramów molekularnych w jakości publikacyjnej.
Złożonych zrzutów ekranu — pełnych zrzutów kodu, paneli sterowania, arkuszy kalkulacyjnych.
Makiet projektowych — projektów UI o wysokiej wierności.

Jeśli dotychczasowe rozumienie obrazów przez Claude'a w przypadku szczegółowych wizualizacji było niewystarczające, jest to znacząca aktualizacja.

Nowość: Kontrola wysiłku dzięki "xhigh"

Opus 4.7 wprowadza nowy poziom wysiłku (effort): xhigh — plasujący się pomiędzy "high" a "max".

Poziom wysiłku	Zastosowanie	Zużycie tokenów
low	Proste zapytania, szybkie odpowiedzi	Minimalne
medium	Standardowe zadania	Normalne
high	Złożone rozumowanie	Podwyższone
xhigh	Trudne zadania wieloetapowe	Wysokie
max	Najtrudniejsze problemy, najwyższa jakość	Maksymalne

Poziom xhigh oferuje większą głębię rozumowania niż "high" bez pełnego kosztu tokenów poziomu "max" — co stanowi praktyczny kompromis dla zadań produkcyjnych.

Budżety zadań (Public Beta)

Wraz z kontrolą wysiłku Anthropic wprowadza budżety zadań (task budgets) — sposób na ustawienie przez deweloperów limitu wydatków na tokeny dla długotrwałych operacji. Daje to kontrolę nad kosztami bez konieczności mikrozarządzania każdym wywołaniem API.

Aktualizacje Claude Code

/ultrareview — Wieloagentowy przegląd kodu

Najważniejszą funkcją Claude Code jest /ultrareview — system przeglądu kodu oparty na chmurze, który wykorzystuje wiele podagentów do analizy kodu:

Faza wykrywania błędów: Uruchamia od 5 do 20 podagentów, którzy niezależnie badają różne ścieżki w bazie kodu.
Faza weryfikacji: Oddzielne podagenty weryfikują każdy potencjalny błąd, odfiltrowując wyniki fałszywie dodatnie.

Użytkownicy planów Pro i Max otrzymują 3 darmowe ultrareview. Jest to najbardziej zaawansowana funkcja przeglądu kodu dostępna w jakimkolwiek narzędziu AI do kodowania.

Tryb Auto dla użytkowników Max

Tryb Auto — w którym Claude Code wykonuje polecenia i wprowadza zmiany bez proszenia o potwierdzenie — jest teraz dostępny dla subskrybentów Max.

Opus 4.7 vs GPT-5.4: Który wybrać?

Wymiar	Opus 4.7	GPT-5.4
Złożone kodowanie	Lider (refaktoryzacja wieloplikowa)	Silny, ale w tyle
Computer use	Niedostępne	Lider (75% OSWorld)
Długi kontekst	1 mln tokenów, lepsze wnioskowanie	1,05 mln tokenów
Wizja	3,75 MP, schematy techniczne	Dobra, ale mniejsza
Szybkość	Wolniejszy, dokładniejszy	Szybsze wykonanie
Cena	$5/$25 za MTok	$2,50/$15 za MTok
Wsparcie MCP	Natywne, zoptymalizowane	Ograniczone

Wybierz Opus 4.7 do: złożonej inżynierii oprogramowania, wieloplikowej refaktoryzacji, analizy długiego kontekstu, wnioskowania z dokumentacji technicznej, przepływów agentowych z MCP. Wybierz GPT-5.4 do: korzystania z komputera (computer use)/automatyzacji, szybkiego prototypowania, aplikacji wrażliwych na koszty, zadań agentów desktopowych.

Ostrzeżenie dotyczące zużycia tokenów

Opus 4.7 korzysta ze zaktualizowanego tokenizera, który przetwarza tekst w inny sposób. Ten sam tekst wejściowy może zostać przeliczony na 1,0–1,35x więcej tokenów w zależności od treści. W połączeniu z większą liczbą tokenów wyjściowych na wyższych poziomach wysiłku, koszty mogą wzrosnąć, mimo że cena za token nie uległa zmianie.

Jeśli przechodzisz z wersji Opus 4.6, monitoruj zużycie tokenów przez pierwsze kilka dni.

Zabezpieczenia cybernetyczne

Po sytuacji z Mythos Preview, Anthropic wbudował zabezpieczenia cybernetyczne bezpośrednio w model Opus 4.7:

Automatyczne wykrywanie i blokowanie zabronionych lub wysokiego ryzyka zapytań dotyczących cyberbezpieczeństwa.
Program weryfikacji cybernetycznej (Cyber Verification Program) dla legalnych badaczy bezpieczeństwa i testerów penetracyjnych.
Celowo mniejsze możliwości w zakresie cyber niż w Mythos Preview, co pozwala Anthropic przetestować zabezpieczenia najpierw na mniej potężnym modelu.

Jak uzyskać dostęp

bash

# API
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'

# Claude Code
claude --model opus  # domyślnie wybiera najnowszą wersję opus

Model jest również dostępny na platformach Amazon Bedrock, Google Cloud Vertex AI oraz Microsoft Foundry od dnia premiery.

Często zadawane pytania

Ile kosztuje Claude Opus 4.7?

5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych — tyle samo co Opus 4.6. Jednak zaktualizowany tokenizer może spowodować generowanie o 1,0-1,35x więcej tokenów dla tej samej treści.

Czy Opus 4.7 jest lepszy niż GPT-5.4?

W przypadku złożonej inżynierii oprogramowania i wieloplikowych zadań kodowania — tak. W przypadku korzystania z komputera, automatyzacji pulpitu i efektywności kosztowej, GPT-5.4 jest obecnie lepszy. Oba modele przodują w innych dziedzinach.

Czym jest komenda /ultrareview w Claude Code?

To wieloagentowy system przeglądu kodu, który uruchamia od 5 do 20 podagentów w celu niezależnego znalezienia błędów w kodzie, a następnie weryfikuje każde znalezisko, aby odfiltrować wyniki fałszywie dodatnie. Użytkownicy Pro i Max otrzymują 3 darmowe ultrareview.

Jak Opus 4.7 wypada w porównaniu do Claude Mythos Preview?

Mythos Preview jest znacznie bardziej wydajny (93,9% vs ~85-90% w SWE-bench), ale nie jest publicznie dostępny. Opus 4.7 to najlepszy model Claude, z którego faktycznie można korzystać.

Czy powinienem przejść z Opus 4.6?

Tak, jeśli zajmujesz się złożonym kodowaniem lub pracujesz z obrazami technicznymi. 13% poprawy w kodowaniu i 3x wyższa rozdzielczość wizji są znaczące. Pamiętaj tylko, aby monitorować zużycie tokenów, ponieważ nowy tokenizer może zwiększyć koszty.

Co to jest poziom wysiłku "xhigh"?

Nowe ustawienie wysiłku pomiędzy "high" a "max", które zapewnia większą głębię rozumowania bez ponoszenia pełnego kosztu tokenów związanego z maksymalnym wysiłkiem. Idealne do trudnych zadań, gdzie zależy Ci na jakości, ale musisz kontrolować koszty.

Podsumowanie

Opus 4.7 to solidna aktualizacja, a nie rewolucja. Zyski w kodowaniu są realne, poprawa wizji jest znacząca, a /ultrareview to autentycznie nowa możliwość. Jednak najważniejszą wiadomością może być to, czym ten model nie jest — nie jest to Mythos Preview. Luka między publicznymi a prywatnymi modelami Anthropic jest teraz szersza niż kiedykolwiek.

Dla programistów Opus 4.7 jest najlepszym publicznie dostępnym modelem Claude i silnym wyborem do złożonych prac inżynieryjnych. Jeśli chcesz budować produkty oparte na AI bez zarządzania modelami i infrastrukturą, Y Build zajmie się tym za Ciebie — pomyśl o tym jak o agencie AI typu mobile-first, który dostarcza gotowe produkty bez potrzeby posiadania serwera czy terminala.