Průvodce GPT-5.4: Model autonomního agenta od OpenAI (2026)
GPT-5.4 dosahuje 75 % v OSWorld, čímž překonává lidi v ovládání počítače. Kontext 1M, cena 2,50 $/MTok, 5 variant modelu. Kompletní benchmarky, ceník a srovnávací příručka.
TL;DR
OpenAI vydala GPT-5.4 dne 5. března 2026 – první model pro obecné účely, který překonává lidi v autonomním ovládání počítače. Klíčové statistiky:
| Funkce | Detail |
|---|---|
| OSWorld-Verified | 75,0 % — překonává lidskou základní úroveň (72,4 %) |
| SWE-bench Pro | 57,7 % — silné v kódování, ale zaostává za Claude Opus 4.6 (80,8 %) |
| Kontextové okno | Až 1,05M tokenů (272K standardní, 1M rozšířené) |
| Ovládání počítače | Nativní, špičková úroveň — poprvé integrováno do obecného modelu |
| Efektivita tokenů | Výrazně méně tokenů než GPT-5.2 pro ekvivalentní úkoly |
| Cena API | 2,50 $ vstup / 15,00 $ výstup za 1M tokenů |
| Varianty | Standard, Thinking, Pro, Mini, Nano |
| Interaktivní myšlení | Plán předem + možnost korigování uprostřed odpovědi |
Co je GPT-5.4?
GPT-5.4 je vlajkový velký jazykový model společnosti OpenAI, vydaný 5. března 2026. Kombinuje to nejlepší ze silných stránek modelu GPT-5.3 Codex v kódování s průlomovými schopnostmi autonomního ovládání počítače (computer-use), kontextovým oknem o velikosti 1 milionu tokenů a novým systémem interaktivního myšlení.
Hlavní zpráva zní: GPT-5.4 je první AI model pro obecné účely, který překonává lidský výkon v úlohách na stolním počítači. V benchmarku OSWorld-Verified dosahuje skóre 75,0 %, zatímco lidští expertní testeři dosahují 72,4 %. Žádný jiný model předtím tuto hranici čistě nepřekonal.
To představuje zlepšení o 28 bodů oproti GPT-5.2 (47,3 %) za méně než čtyři měsíce. Model dokáže analyzovat souřadnice obrazovky ze snímků a přímo vydávat příkazy pro myš a klávesnici, což mu umožňuje autonomně procházet soubory, prohlížeče, terminály a produktivní software.
Klíčové funkce
Nativní ovládání počítače
Na rozdíl od předchozích modelů, které ke kódování vyžadovaly externí nástroje pro ovládání počítače, má GPT-5.4 tyto schopnosti integrované přímo v sobě. V aplikaci Codex a prostřednictvím API může model:
- Navigovat v desktopových prostředích pomocí snímků obrazovky a akcí klávesnice/myši
- Pracovat napříč více aplikacemi v sekvenci
- Dokončovat vícekrokové pracovní postupy (správa souborů, úkoly v prohlížeči, operace v terminálu)
- Ovládat produktivní software, jako jsou tabulkové procesory, prezentace a dokumenty
Kontextové okno 1 milion tokenů
GPT-5.4 podporuje kontext až 1,05M tokenů. Standardní okno je 272K tokenů; požadavky překračující tento práh jsou zpracovávány za dvojnásobek běžné vstupní sazby. Tento masivní kontext je kritický pro agentní pracovní postupy, kde model potřebuje v paměti udržet dlouhou historii používání nástrojů, rozsáhlé kódové báze nebo dlouhé sady dokumentů.
Interaktivní myšlení
GPT-5.4 Thinking zavádí nové paradigma: model poskytuje plán předem o svém uvažování a vy jej můžete korigovat uprostřed odpovědi. Můžete přidávat instrukce, opravovat směr nebo upřesňovat cíl, aniž byste museli začínat znovu. To představuje významné zlepšení uživatelského komfortu u složitých, vícekrokových úkolů.
Zlepšená efektivita tokenů
OpenAI uvádí, že GPT-5.4 používá k řešení problémů výrazně méně tokenů ve srovnání s GPT-5.2, spolu s 33% snížením faktických chyb. Pro produkční nasazení to znamená nižší náklady na úkol, a to i bez započtení konkurenceschopných cen.
Benchmarky
V čem GPT-5.4 vede
| Benchmark | Co testuje | GPT-5.4 | Nejlepší konkurent |
|---|---|---|---|
| OSWorld-Verified | Ovládání stolního počítače | 75,0 % | Claude Opus 4.6: 72,7 % |
| Toolathlon | Vícekrokové použití nástrojů/API | Nejvyšší skóre | — |
| GDPval | Znalostní práce | 83 % | — |
Úplné srovnání modelů
| Benchmark | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| OSWorld-Verified | 75,0 % | 72,7 % | N/A |
| SWE-bench Verified | ~80 % | 80,8 % | 80,6 % |
| SWE-bench Pro | 57,7 % | ~45 % | 54,2 % |
| ARC-AGI-2 | 52,9 % | 68,8 % | 77,1 % |
| GDPval | 83 % | — | — |
Co ta čísla znamenají
GPT-5.4 je první model, který věrohodně a současně zvládá ovládání počítače, kódování a znalostní práci na špičkové úrovni. Skóre 75 % v OSWorld je nejjasnějším milníkem — znamená to, že model dokáže dokončit tři ze čtyř reálných desktopových úkolů, které jsou náročné i pro lidské experty.
Obraz je však nuancovaný. V SWE-bench Verified (reálné kódování) Claude Opus 4.6 i Gemini 3.1 Pro výrazně překonávají GPT-5.4 s 80,8 %, respektive 80,6 %. V abstraktním uvažování (ARC-AGI-2) GPT-5.4 zaostává za Claude Opus 4.6 o 16 procentních bodů a za Gemini 3.1 Pro o více než 24 bodů.
Závěr: GPT-5.4 vítězí v autonomním ovládání počítače a praktickém používání nástrojů, ale není nejlepším modelem pro každý úkol.
Varianty modelu a ceny
GPT-5.4 se dodává v pěti variantách, z nichž každá cílí na jiné případy použití a rozpočty:
| Varianta | Vstup (za 1M tokenů) | Výstup (za 1M tokenů) | Nejvhodnější pro |
|---|---|---|---|
| GPT-5.4 Standard | 2,50 $ | 15,00 $ | Obecné účely, ovládání počítače, agentní procesy |
| GPT-5.4 Thinking | 2,50 $ | 15,00 $ | Komplexní uvažování s interaktivním řízením plánu |
| GPT-5.4 Pro | 30,00 $ | 180,00 $ | Právní, lékařské, finanční sféry — max. přesnost |
| GPT-5.4 Mini | 0,75 $ | 4,50 $ | Velkoobjemové úlohy citlivé na latenci |
| GPT-5.4 Nano | TBD | TBD | Edge a vestavěná (embedded) použití |
- Prompty přesahující 272K tokenů jsou účtovány 2× vyšší sazbou za standardní vstup (5,00 $/MTok u verze Standard).
- Koncové body s regionální rezidencí dat mají u všech variant 10% příplatek.
- GPT-5.4 Mini je k dispozici uživatelům ChatGPT zdarma; Nano je pouze pro API.
Srovnání nákladů: GPT-5.4 vs Claude Opus 4.6
Pro typickou denní pracovní zátěž:
| GPT-5.4 | Claude Opus 4.6 | |
|---|---|---|
| Průměrné denní náklady | ~$5,50 | ~$10,00 |
| Průměrné měsíční náklady | ~$165 | ~$300 |
| Poměr nákladů | 1x | ~1,8x |
GPT-5.4 je zhruba o 50 % levnější než Claude Opus 4.6 při ekvivalentním průtoku tokenů. Varianta Mini to posouvá ještě dále — v SWE-bench Pro dosahuje skóre 54,38 % při zhruba 6× nižších nákladech.
GPT-5.4 vs Claude Opus 4.6: Kdy který použít?
To je otázka, kterou si v dubnu 2026 klade většina týmů. Odpověď závisí na vaší pracovní náplni.
Zvolte GPT-5.4, pokud potřebujete:
- Desktopovou automatizaci a ovládání počítače — 75,0 % v OSWorld oproti 72,7 % u Opus 4.6
- Volání nástrojů a orchestraci API — lepší přesnost v méně krocích v Toolathlonu
- Efektivitu nákladů — zhruba poloviční náklady na token oproti Opus 4.6
- Uvažování efektivní z hlediska tokenů — méně tokenů na problém znamená nižší účty
- Rychlé prototypování — rychlá iterace s nižší režií
Zvolte Claude Opus 4.6, pokud potřebujete:
- Komplexní refaktorování kódu ve více souborech — vede v SWE-bench Verified s 80,8 %
- Koherenci v dlouhém kontextu — lepší v udržování kvality napříč velmi dlouhými kontexty
- Abstraktní a neotřelé uvažování — náskok 16 bodů v ARC-AGI-2
- Agentní vyhledávání a hlubokou architekturu kódu — vyniká v úlohách vyžadujících hluboké porozumění
- Kvalitu a nuance psaní — 1. místo v uživatelské spokojenosti Chatbot Arena
Souhrnné srovnání
| Dimenze | Vítěz | Rozdíl |
|---|---|---|
| Ovládání počítače (OSWorld) | GPT-5.4 | 75,0 % vs 72,7 % |
| Kódování (SWE-bench Verified) | Claude Opus 4.6 | 80,8 % vs ~80 % |
| Abstraktní uvažování (ARC-AGI-2) | Claude Opus 4.6 | 68,8 % vs 52,9 % |
| Volání nástrojů (Toolathlon) | GPT-5.4 | Méně kroků, lepší přesnost |
| Znalostní práce (GDPval) | GPT-5.4 | 83 % |
| Cena | GPT-5.4 | ~50 % levnější |
| Uživatelská spokojenost | Claude Opus 4.6 | #1 Chatbot Arena |
Jak získat přístup k GPT-5.4
GPT-5.4 je dostupný prostřednictvím:
- ChatGPT — GPT-5.4 Thinking je výchozím modelem pro uživatele tarifů Plus, Pro a Team. Mini je k dispozici pro uživatele zdarma.
- OpenAI API — Všech pět variant je přístupných přes standardní koncové body pro doplňování (completions) a chat.
- Codex App — Plné možnosti ovládání počítače s desktopovým agentem.
- OpenRouter — Přístup třetích stran za konkurenceschopné ceny.
computer_use a poskytnout snímky obrazovky jako obrazové vstupy. Model vrací strukturované akce (kliknutí, psaní, posouvání), které vaše aplikace převede na systémové události.
FAQ
Je GPT-5.4 lepší než Claude Opus 4.6?
Závisí to na úkolu. GPT-5.4 vítězí v ovládání počítače, volání nástrojů a nákladové efektivitě. Claude Opus 4.6 vítězí v komplexním kódování, abstraktním uvažování a kvalitě psaní. Pro většinu týmů závisí volba na tom, zda je jejich hlavní náplní automatizace desktopu (GPT-5.4) nebo hluboké softwarové inženýrství (Opus 4.6).
Kolik stojí GPT-5.4?
Standardní model stojí 2,50 $ za milion vstupních tokenů a 15,00 $ za milion výstupních tokenů. Varianta Pro stojí 30/180 $ za MTok. Mini stojí 0,75/4,50 $ za MTok. Prompty překračující 272K tokenů jsou účtovány dvojnásobnou sazbou za vstup.
Dokáže GPT-5.4 opravdu ovládat počítač lépe než lidé?
V benchmarku OSWorld-Verified ano — 75,0 % oproti lidské základní úrovni 72,4 %. Benchmarky však měří specifické kategorie úkolů. Reálné používání počítače zahrnuje úsudek, kontext a přizpůsobivost, které benchmarky plně nezachycují. Je nejlepší jej považovat za nadlidský ve strukturovaných desktopových úlohách, nikoli za úplnou náhradu lidského ovládání počítače.
Jaké je kontextové okno pro GPT-5.4?
Až 1,05 milionu tokenů. Standardní úroveň je 272K tokenů. Rozšíření nad 272K zdvojnásobuje cenu vstupního tokenu. Plný kontext 1M je kritický pro agentní pracovní postupy, které hromadí dlouhou historii interakcí.
Mám upgradovat z GPT-5.3 Codex?
Pokud vaše pracovní náplň zahrnuje ovládání počítače nebo orchestraci více nástrojů, pak ano. Skok z 64,7 % na 75,0 % v OSWorld je podstatný. Pro čistě kódovací úkoly je zlepšení oproti GPT-5.3 Codex spíše inkrementální — SWE-bench Pro se posunul z 56,8 % na 57,7 %. Rozhodujte se na základě svého konkrétního případu použití.
Jaké varianty modelu jsou k dispozici?
Pět: Standard, Thinking, Pro, Mini a Nano. Standard a Thinking sdílejí stejnou cenu a jsou hlavními modely pro většinu použití. Pro je prémiová úroveň pro maximální přesnost. Mini cílí na produkční nasazení s důrazem na cenu. Nano je navržen pro edge a vestavěné aplikace.
Sečteno a podtrženo
GPT-5.4 představuje skutečný bod zlomu pro autonomní AI agenty. Je to první model pro obecné účely, který poráží lidské experty v ovládání stolního počítače, a to při polovičních nákladech oproti svému hlavnímu konkurentovi. Nabídka pěti variant znamená, že existuje GPT-5.4 pro každý rozpočet a požadavky na latenci.
To však neznamená, že je nejlepší ve všem. Claude Opus 4.6 zůstává silnější volbou pro komplexní softwarové inženýrství a abstraktní uvažování. Gemini 3.1 Pro stále vede v několika benchmarcích uvažování. Správná odpověď pro většinu týmů není „který model je nejlepší“, ale „který model je nejlepší pro tento konkrétní úkol“.
Pokud stavíte produkty poháněné AI a chcete využívat modely jako GPT-5.4 a Claude Opus 4.6, aniž byste se utopili v infrastruktuře, Y Build vám pomůže dodávat rychleji. Poskytujeme nástroje a platformu pro vytváření, nasazování a iterování AI aplikací — abyste se mohli soustředit na produkt, nikoli na technické zázemí.
Zdroje: OpenAI GPT-5.4 Announcement, OpenAI API Pricing, NxCode GPT-5.4 Complete Guide, NxCode GPT-5.4 vs Claude Opus 4.6, DataCamp GPT-5.4 Overview, Artificial Analysis GPT-5.4, MindStudio Benchmark Comparison, Nerd Level Tech: GPT-5.4 Beats Humans