Průvodce GPT-5.4: Model autonomního agenta od OpenAI (2026)

TL;DR

OpenAI vydala GPT-5.4 dne 5. března 2026 – první model pro obecné účely, který překonává lidi v autonomním ovládání počítače. Klíčové statistiky:

Funkce	Detail
OSWorld-Verified	75,0 % — překonává lidskou základní úroveň (72,4 %)
SWE-bench Pro	57,7 % — silné v kódování, ale zaostává za Claude Opus 4.6 (80,8 %)
Kontextové okno	Až 1,05M tokenů (272K standardní, 1M rozšířené)
Ovládání počítače	Nativní, špičková úroveň — poprvé integrováno do obecného modelu
Efektivita tokenů	Výrazně méně tokenů než GPT-5.2 pro ekvivalentní úkoly
Cena API	2,50 $ vstup / 15,00 $ výstup za 1M tokenů
Varianty	Standard, Thinking, Pro, Mini, Nano
Interaktivní myšlení	Plán předem + možnost korigování uprostřed odpovědi

Co je GPT-5.4?

GPT-5.4 je vlajkový velký jazykový model společnosti OpenAI, vydaný 5. března 2026. Kombinuje to nejlepší ze silných stránek modelu GPT-5.3 Codex v kódování s průlomovými schopnostmi autonomního ovládání počítače (computer-use), kontextovým oknem o velikosti 1 milionu tokenů a novým systémem interaktivního myšlení.

Hlavní zpráva zní: GPT-5.4 je první AI model pro obecné účely, který překonává lidský výkon v úlohách na stolním počítači. V benchmarku OSWorld-Verified dosahuje skóre 75,0 %, zatímco lidští expertní testeři dosahují 72,4 %. Žádný jiný model předtím tuto hranici čistě nepřekonal.

To představuje zlepšení o 28 bodů oproti GPT-5.2 (47,3 %) za méně než čtyři měsíce. Model dokáže analyzovat souřadnice obrazovky ze snímků a přímo vydávat příkazy pro myš a klávesnici, což mu umožňuje autonomně procházet soubory, prohlížeče, terminály a produktivní software.

Klíčové funkce

Nativní ovládání počítače

Na rozdíl od předchozích modelů, které ke kódování vyžadovaly externí nástroje pro ovládání počítače, má GPT-5.4 tyto schopnosti integrované přímo v sobě. V aplikaci Codex a prostřednictvím API může model:

Navigovat v desktopových prostředích pomocí snímků obrazovky a akcí klávesnice/myši
Pracovat napříč více aplikacemi v sekvenci
Dokončovat vícekrokové pracovní postupy (správa souborů, úkoly v prohlížeči, operace v terminálu)
Ovládat produktivní software, jako jsou tabulkové procesory, prezentace a dokumenty

Kontextové okno 1 milion tokenů

GPT-5.4 podporuje kontext až 1,05M tokenů. Standardní okno je 272K tokenů; požadavky překračující tento práh jsou zpracovávány za dvojnásobek běžné vstupní sazby. Tento masivní kontext je kritický pro agentní pracovní postupy, kde model potřebuje v paměti udržet dlouhou historii používání nástrojů, rozsáhlé kódové báze nebo dlouhé sady dokumentů.

Interaktivní myšlení

GPT-5.4 Thinking zavádí nové paradigma: model poskytuje plán předem o svém uvažování a vy jej můžete korigovat uprostřed odpovědi. Můžete přidávat instrukce, opravovat směr nebo upřesňovat cíl, aniž byste museli začínat znovu. To představuje významné zlepšení uživatelského komfortu u složitých, vícekrokových úkolů.

Zlepšená efektivita tokenů

OpenAI uvádí, že GPT-5.4 používá k řešení problémů výrazně méně tokenů ve srovnání s GPT-5.2, spolu s 33% snížením faktických chyb. Pro produkční nasazení to znamená nižší náklady na úkol, a to i bez započtení konkurenceschopných cen.

Benchmarky

V čem GPT-5.4 vede

Benchmark	Co testuje	GPT-5.4	Nejlepší konkurent
OSWorld-Verified	Ovládání stolního počítače	75,0 %	Claude Opus 4.6: 72,7 %
Toolathlon	Vícekrokové použití nástrojů/API	Nejvyšší skóre	—
GDPval	Znalostní práce	83 %	—

Úplné srovnání modelů

Benchmark	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
OSWorld-Verified	75,0 %	72,7 %	N/A
SWE-bench Verified	~80 %	80,8 %	80,6 %
SWE-bench Pro	57,7 %	~45 %	54,2 %
ARC-AGI-2	52,9 %	68,8 %	77,1 %
GDPval	83 %	—	—

Co ta čísla znamenají

GPT-5.4 je první model, který věrohodně a současně zvládá ovládání počítače, kódování a znalostní práci na špičkové úrovni. Skóre 75 % v OSWorld je nejjasnějším milníkem — znamená to, že model dokáže dokončit tři ze čtyř reálných desktopových úkolů, které jsou náročné i pro lidské experty.

Obraz je však nuancovaný. V SWE-bench Verified (reálné kódování) Claude Opus 4.6 i Gemini 3.1 Pro výrazně překonávají GPT-5.4 s 80,8 %, respektive 80,6 %. V abstraktním uvažování (ARC-AGI-2) GPT-5.4 zaostává za Claude Opus 4.6 o 16 procentních bodů a za Gemini 3.1 Pro o více než 24 bodů.

Závěr: GPT-5.4 vítězí v autonomním ovládání počítače a praktickém používání nástrojů, ale není nejlepším modelem pro každý úkol.

Varianty modelu a ceny

GPT-5.4 se dodává v pěti variantách, z nichž každá cílí na jiné případy použití a rozpočty:

Varianta	Vstup (za 1M tokenů)	Výstup (za 1M tokenů)	Nejvhodnější pro
GPT-5.4 Standard	2,50 $	15,00 $	Obecné účely, ovládání počítače, agentní procesy
GPT-5.4 Thinking	2,50 $	15,00 $	Komplexní uvažování s interaktivním řízením plánu
GPT-5.4 Pro	30,00 $	180,00 $	Právní, lékařské, finanční sféry — max. přesnost
GPT-5.4 Mini	0,75 $	4,50 $	Velkoobjemové úlohy citlivé na latenci
GPT-5.4 Nano	TBD	TBD	Edge a vestavěná (embedded) použití

Důležité poznámky k cenám:

Prompty přesahující 272K tokenů jsou účtovány 2× vyšší sazbou za standardní vstup (5,00 $/MTok u verze Standard).
Koncové body s regionální rezidencí dat mají u všech variant 10% příplatek.
GPT-5.4 Mini je k dispozici uživatelům ChatGPT zdarma; Nano je pouze pro API.

Srovnání nákladů: GPT-5.4 vs Claude Opus 4.6

Pro typickou denní pracovní zátěž:

GPT-5.4	Claude Opus 4.6
Průměrné denní náklady	~$5,50	~$10,00
Průměrné měsíční náklady	~$165	~$300
Poměr nákladů	1x	~1,8x

GPT-5.4 je zhruba o 50 % levnější než Claude Opus 4.6 při ekvivalentním průtoku tokenů. Varianta Mini to posouvá ještě dále — v SWE-bench Pro dosahuje skóre 54,38 % při zhruba 6× nižších nákladech.

GPT-5.4 vs Claude Opus 4.6: Kdy který použít?

To je otázka, kterou si v dubnu 2026 klade většina týmů. Odpověď závisí na vaší pracovní náplni.

Zvolte GPT-5.4, pokud potřebujete:

Desktopovou automatizaci a ovládání počítače — 75,0 % v OSWorld oproti 72,7 % u Opus 4.6
Volání nástrojů a orchestraci API — lepší přesnost v méně krocích v Toolathlonu
Efektivitu nákladů — zhruba poloviční náklady na token oproti Opus 4.6
Uvažování efektivní z hlediska tokenů — méně tokenů na problém znamená nižší účty
Rychlé prototypování — rychlá iterace s nižší režií

Zvolte Claude Opus 4.6, pokud potřebujete:

Komplexní refaktorování kódu ve více souborech — vede v SWE-bench Verified s 80,8 %
Koherenci v dlouhém kontextu — lepší v udržování kvality napříč velmi dlouhými kontexty
Abstraktní a neotřelé uvažování — náskok 16 bodů v ARC-AGI-2
Agentní vyhledávání a hlubokou architekturu kódu — vyniká v úlohách vyžadujících hluboké porozumění
Kvalitu a nuance psaní — 1. místo v uživatelské spokojenosti Chatbot Arena

Souhrnné srovnání

Dimenze	Vítěz	Rozdíl
Ovládání počítače (OSWorld)	GPT-5.4	75,0 % vs 72,7 %
Kódování (SWE-bench Verified)	Claude Opus 4.6	80,8 % vs ~80 %
Abstraktní uvažování (ARC-AGI-2)	Claude Opus 4.6	68,8 % vs 52,9 %
Volání nástrojů (Toolathlon)	GPT-5.4	Méně kroků, lepší přesnost
Znalostní práce (GDPval)	GPT-5.4	83 %
Cena	GPT-5.4	~50 % levnější
Uživatelská spokojenost	Claude Opus 4.6	#1 Chatbot Arena

Jak získat přístup k GPT-5.4

GPT-5.4 je dostupný prostřednictvím:

ChatGPT — GPT-5.4 Thinking je výchozím modelem pro uživatele tarifů Plus, Pro a Team. Mini je k dispozici pro uživatele zdarma.
OpenAI API — Všech pět variant je přístupných přes standardní koncové body pro doplňování (completions) a chat.
Codex App — Plné možnosti ovládání počítače s desktopovým agentem.
OpenRouter — Přístup třetích stran za konkurenceschopné ceny.

Chcete-li používat funkce ovládání počítače přes API, musíte povolit parametr nástroje computer_use a poskytnout snímky obrazovky jako obrazové vstupy. Model vrací strukturované akce (kliknutí, psaní, posouvání), které vaše aplikace převede na systémové události.

FAQ

Je GPT-5.4 lepší než Claude Opus 4.6?

Závisí to na úkolu. GPT-5.4 vítězí v ovládání počítače, volání nástrojů a nákladové efektivitě. Claude Opus 4.6 vítězí v komplexním kódování, abstraktním uvažování a kvalitě psaní. Pro většinu týmů závisí volba na tom, zda je jejich hlavní náplní automatizace desktopu (GPT-5.4) nebo hluboké softwarové inženýrství (Opus 4.6).

Kolik stojí GPT-5.4?

Standardní model stojí 2,50 $ za milion vstupních tokenů a 15,00 $ za milion výstupních tokenů. Varianta Pro stojí 30/180 $ za MTok. Mini stojí 0,75/4,50 $ za MTok. Prompty překračující 272K tokenů jsou účtovány dvojnásobnou sazbou za vstup.

Dokáže GPT-5.4 opravdu ovládat počítač lépe než lidé?

V benchmarku OSWorld-Verified ano — 75,0 % oproti lidské základní úrovni 72,4 %. Benchmarky však měří specifické kategorie úkolů. Reálné používání počítače zahrnuje úsudek, kontext a přizpůsobivost, které benchmarky plně nezachycují. Je nejlepší jej považovat za nadlidský ve strukturovaných desktopových úlohách, nikoli za úplnou náhradu lidského ovládání počítače.

Jaké je kontextové okno pro GPT-5.4?

Až 1,05 milionu tokenů. Standardní úroveň je 272K tokenů. Rozšíření nad 272K zdvojnásobuje cenu vstupního tokenu. Plný kontext 1M je kritický pro agentní pracovní postupy, které hromadí dlouhou historii interakcí.

Mám upgradovat z GPT-5.3 Codex?

Pokud vaše pracovní náplň zahrnuje ovládání počítače nebo orchestraci více nástrojů, pak ano. Skok z 64,7 % na 75,0 % v OSWorld je podstatný. Pro čistě kódovací úkoly je zlepšení oproti GPT-5.3 Codex spíše inkrementální — SWE-bench Pro se posunul z 56,8 % na 57,7 %. Rozhodujte se na základě svého konkrétního případu použití.

Jaké varianty modelu jsou k dispozici?

Pět: Standard, Thinking, Pro, Mini a Nano. Standard a Thinking sdílejí stejnou cenu a jsou hlavními modely pro většinu použití. Pro je prémiová úroveň pro maximální přesnost. Mini cílí na produkční nasazení s důrazem na cenu. Nano je navržen pro edge a vestavěné aplikace.

Sečteno a podtrženo

GPT-5.4 představuje skutečný bod zlomu pro autonomní AI agenty. Je to první model pro obecné účely, který poráží lidské experty v ovládání stolního počítače, a to při polovičních nákladech oproti svému hlavnímu konkurentovi. Nabídka pěti variant znamená, že existuje GPT-5.4 pro každý rozpočet a požadavky na latenci.

To však neznamená, že je nejlepší ve všem. Claude Opus 4.6 zůstává silnější volbou pro komplexní softwarové inženýrství a abstraktní uvažování. Gemini 3.1 Pro stále vede v několika benchmarcích uvažování. Správná odpověď pro většinu týmů není „který model je nejlepší“, ale „který model je nejlepší pro tento konkrétní úkol“.

Pokud stavíte produkty poháněné AI a chcete využívat modely jako GPT-5.4 a Claude Opus 4.6, aniž byste se utopili v infrastruktuře, Y Build vám pomůže dodávat rychleji. Poskytujeme nástroje a platformu pro vytváření, nasazování a iterování AI aplikací — abyste se mohli soustředit na produkt, nikoli na technické zázemí.

Zdroje: OpenAI GPT-5.4 Announcement, OpenAI API Pricing, NxCode GPT-5.4 Complete Guide, NxCode GPT-5.4 vs Claude Opus 4.6, DataCamp GPT-5.4 Overview, Artificial Analysis GPT-5.4, MindStudio Benchmark Comparison, Nerd Level Tech: GPT-5.4 Beats Humans