Gemini 3.1 Pro: Skok v uvažování od Googlu vysvětlen

TL;DR

Google vydal Gemini 3.1 Pro (preview) 19. února 2026. Klíčová čísla:

ARC-AGI-2: 77,1 % — více než dvojnásobek Gemini 3 Pro (31,1 %), poráží Opus 4.6 (68,8 %) a GPT-5.2 (52,9 %)
GPQA Diamond: 94,3 % — vede nad všemi modely ve vědeckých úlohách na úrovni postgraduálního studia
SWE-bench: 80,6 % — vyrovná se Opus 4.6 (80,8 %) v kódování
Cena: 2 $/12 $ za M tokenů — nejlevnější špičkový (frontier) model
Kontext 1M tokenů — beze změny oproti Gemini 3 Pro
Vede ve 13 z 16 benchmarků hodnocených Googlem
Dostupné nyní v preview: AI Studio, Vertex AI, Gemini CLI, aplikace Gemini

Co Google oznámil

února 2026 vydal Google Gemini 3.1 Pro — první přírůstek „.1“ ve svém verzování modelů. Staví na Gemini 3 Pro (listopad 2025) a integruje techniky z řady Gemini 3 Deep Think do dostupnějšího a rychlejšího modelu.

Blog Googlu jej popisuje jako model navržený pro „úkoly, kde jednoduchá odpověď nestačí“ — komplexní vícekrokové uvažování, syntéza dat a agentní workflow.

Hlavní statistika: 77,1 % v ARC-AGI-2, benchmarku pro nové abstraktní uvažování. To je více než dvojnásobek oproti 31,1 % u Gemini 3 Pro a výrazně před modely Opus 4.6 (68,8 %) i GPT-5.2 (52,9 %). VentureBeat jej nazývá „Deep Think Mini s nastavitelným uvažováním na vyžádání“.

Kompletní rozbor benchmarků

Kde Gemini 3.1 Pro vede (13 z 16 benchmarků)

Benchmark	Co testuje	Gemini 3.1 Pro	Nejlepší konkurent
ARC-AGI-2	Nové uvažování	77,1 %	Opus 4.6: 68,8 %
GPQA Diamond	Postgraduální věda	94,3 %	GPT-5.2: 92,4 %
BrowseComp	Agentní webové vyhledávání	85,9 %	Opus 4.6: 84,0 %
Terminal-Bench 2.0	Kódování v terminálu	68,5 %	Opus 4.6: 65,4 %
APEX-Agents	Schopnosti agentů	33,5 %	Opus 4.6: 29,8 %
MCP Atlas	Používání nástrojů	69,2 %	—
t2-bench Telecom	Doménově specifické	99,3 %	—
SWE-bench Verified	Kódování	80,6 %	Opus 4.6: 80,8 %
MRCR v2	Dlouhý kontext	84,9 %	Sonnet 4.6: 84,9 % (shoda)

Kde konkurence stále vítězí

Benchmark	Co testuje	Vítěz	Gemini 3.1 Pro
GDPval-AA (Elo)	Kancelářské úkoly	Sonnet 4.6: 1633	Nezveřejněno
Terminal-Bench 2.0	Náročné kódování v terminálu	GPT-5.3-Codex: 77,3 %	68,5 %
SWE-Bench Pro	Pokročilé kódování	GPT-5.3-Codex: 56,8 %	Nezveřejněno
OSWorld	Ovládání počítače	Sonnet 4.6: 72,5 %	Netestováno

Skok v uvažování v kontextu

ARC-AGI-2 měří schopnost modelu řešit problémy, které nikdy dříve neviděl — čisté abstraktní uvažování, nikoliv shodu vzorů z tréninkových dat. Zde je vidět, jak rychle se Gemini zlepšilo:

Model	ARC-AGI-2	Datum
Gemini 3 Pro	31,1 %	Listopad 2025
GPT-5.2	52,9 %	Prosinec 2025
Claude Opus 4.6	68,8 %	Únor 2026
Gemini 3.1 Pro	77,1 %	Únor 2026

Gemini 3.1 Pro poskočilo z 31,1 % na 77,1 % v jediné verzi — to je zlepšení o 148 %. Toho bylo dosaženo integrací pokročilých technik uvažování z Deep Think přímo do základního modelu.

Co se změnilo oproti Gemini 3 Pro

1. Integrace Deep Think

Gemini 3 Deep Think byl samostatný, pomalejší model optimalizovaný pro hluboké uvažování. Gemini 3.1 Pro tyto techniky začleňuje do standardního modelu s nastavitelnou hloubkou uvažování. U většiny úkolů tak získáte úroveň uvažování Deep Think bez jeho vysoké latence.

2. Dramaticky lepší uvažování

Čísla mluví sama za sebe:

Benchmark	Gemini 3 Pro	Gemini 3.1 Pro	Zlepšení
ARC-AGI-2	31,1 %	77,1 %	+148 %
GPQA Diamond	~88 %	94,3 %	+7 %
APEX-Agents	18,4 %	33,5 %	+82 %

3. Lepší výkon v agentních úlohách

Skóre v APEX-Agents (33,5 %) a MCP Atlas (69,2 %) ukazují, že Gemini 3.1 Pro je výrazně schopnější jako autonomní agent — používání nástrojů, vícekrokové plánování a samokorekce jsou na mnohem vyšší úrovni.

4. Zachování multimodální síly

Gemini 3.1 Pro si ponechává hlavní výhodu modelů Gemini: nativní multimodální zpracování textu, obrázků, zvuku a videa v rámci jediného kontextu. Žádný jiný špičkový model nenabízí takovou šíři za tuto cenu.

Ceny

Stejná cena jako u Gemini 3 Pro — bezplatný upgrade:

Velikost kontextu	Vstup (za M tokenů)	Výstup (za M tokenů)
≤200K tokenů	2,00 $	12,00 $
>200K tokenů	4,00 $	18,00 $

Srovnání s konkurencí

Model	Vstup	Výstup	Relativní cena
Gemini 3.1 Pro	2,00 $	12,00 $	1x
Claude Sonnet 4.6	3,00 $	15,00 $	1,5x
GPT-5.2	5,00 $	15,00 $	2,0x (vstup)
Claude Opus 4.6	15,00 $	75,00 $	7,5x

Gemini 3.1 Pro je nejlevnější špičkový model — o 33 % levnější než Sonnet 4.6 na vstupu a o 20 % levnější na výstupu.

Cena za sezení (100K vstup + 20K výstup)

Model	Cena
Gemini 3.1 Pro	0,44 $
Claude Sonnet 4.6	0,60 $
GPT-5.2	0,80 $
Claude Opus 4.6	3,00 $

Další optimalizace nákladů:

Batch mode: 50% sleva (0,22 $/sezení)

Context caching: Čtení z cacheovaného vstupu stojí 10 % základní ceny

Dostupnost

Kde jej používat

Platforma	Stav	ID modelu
Aplikace Gemini (pro spotřebitele)	Postupně zaváděno	Automaticky vybráno
Google AI Studio	Již dostupné	`gemini-3.1-pro-preview`
Vertex AI	Již dostupné	`gemini-3.1-pro-preview`
Gemini API	Již dostupné	`gemini-3.1-pro-preview`
Gemini CLI	Již dostupné	`gemini-3.1-pro-preview`
Antigravity	Již dostupné	Automaticky vybráno
Android Studio	Již dostupné	Automaticky vybráno
GitHub Copilot	Veřejné preview	Volitelné
NotebookLM	Předplatitelé Pro/Ultra	Automaticky vybráno

Rychlý start s API

python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-3.1-pro-preview")

response = model.generate_content("Váš prompt zde")
print(response.text)

Koncový bod pro vlastní nástroje (Custom Tools)

Google také spustil specializovaný koncový bod pro lepší výkon nástrojů:

python

model = genai.GenerativeModel("gemini-3.1-pro-preview-customtools")

Tento koncový bod použijte při budování agentů, kteří silně spoléhají na volání funkcí (function calling) a používání nástrojů.

Co to znamená

Závod v uvažování přitvrzuje

Během 13 dnů byly vydány tři špičkové modely:

6. února: Claude Opus 4.6 (Anthropic)

17. února: Claude Sonnet 4.6 (Anthropic)

19. února: Gemini 3.1 Pro (Google)

Každý si nárokuje prvenství v jiných oblastech. Prostředí modelů se fragmentuje — žádný jediný model už nedominuje všemu.

Nejlepší uvažování ve své třídě za výhodnou cenu

Výsledek 77,1 % v ARC-AGI-2 u Gemini 3.1 Pro je nejvyšší dostupné skóre uvažování za nejnižší cenu (2 $/12 $). Pro úkoly vyžadující nové řešení problémů, abstraktní uvažování nebo vědeckou analýzu je to jasná volba.

Rovnocennost v kódování

S 80,6 % v SWE-bench (oproti 80,8 % u Opus 4.6 a 79,6 % u Sonnet 4.6) je Gemini 3.1 Pro poprvé plně konkurenceschopné v kódování. Předchozí modely Gemini v tomto benchmarku za modely Claude výrazně zaostávaly.

Chybějící kousek: Ovládání počítače (Computer Use)

Gemini 3.1 Pro nemá benchmark v OSWorld (ovládání počítače). Claude Sonnet 4.6 v této schopnosti vede se 72,5 %. Pokud vaše workflow zahrnuje automatizaci prohlížeče, vyplňování formulářů nebo ovládání desktopu, Claude zůstává jedinou životaschopnou volbou.

Pro vývojáře budující produkty

Praktické důsledky:

Nejlevnější uvažování: 0,44 $/sezení vs. 0,60 $ (Sonnet) vs. 0,80 $ (GPT-5.2)

Nejlepší pro vědecké/analytické úkoly: 94,3 % v GPQA Diamond je nejvyšší dostupné skóre

Konkurenceschopné v kódování: 80,6 % v SWE-bench stahuje náskok Claudu

Multimodální výhoda: Nativní zpracování videa/audia, kterému se Claude a GPT nevyrovnají

Stav preview: Zatím není GA (General Availability) – očekávejte vylepšení před plným vydáním

Stavíte s AI? Y Build se integruje s vašimi oblíbenými AI nástroji pro vývoj a následně řeší nasazení, produktová videa Demo Cut, AI SEO a analytiku — kompletní stack od kódu až po růst. Začněte zdarma.

Zdroje:

TL;DR

Google vydal Gemini 3.1 Pro (preview) 19. února 2026. Klíčová čísla:

ARC-AGI-2: 77,1 % — více než dvojnásobek Gemini 3 Pro (31,1 %), poráží Opus 4.6 (68,8 %) a GPT-5.2 (52,9 %)
GPQA Diamond: 94,3 % — vede nad všemi modely ve vědeckých úlohách na úrovni postgraduálního studia
SWE-bench: 80,6 % — vyrovná se Opus 4.6 (80,8 %) v kódování
Cena: 2 $/12 $ za M tokenů — nejlevnější špičkový (frontier) model
Kontext 1M tokenů — beze změny oproti Gemini 3 Pro
Vede ve 13 z 16 benchmarků hodnocených Googlem
Dostupné nyní v preview: AI Studio, Vertex AI, Gemini CLI, aplikace Gemini

Co Google oznámil

února 2026 vydal Google Gemini 3.1 Pro — první přírůstek „.1“ ve svém verzování modelů. Staví na Gemini 3 Pro (listopad 2025) a integruje techniky z řady Gemini 3 Deep Think do dostupnějšího a rychlejšího modelu.

Blog Googlu jej popisuje jako model navržený pro „úkoly, kde jednoduchá odpověď nestačí“ — komplexní vícekrokové uvažování, syntéza dat a agentní workflow.

Kompletní rozbor benchmarků

Kde Gemini 3.1 Pro vede (13 z 16 benchmarků)

Benchmark	Co testuje	Gemini 3.1 Pro	Nejlepší konkurent
ARC-AGI-2	Nové uvažování	77,1 %	Opus 4.6: 68,8 %
GPQA Diamond	Postgraduální věda	94,3 %	GPT-5.2: 92,4 %
BrowseComp	Agentní webové vyhledávání	85,9 %	Opus 4.6: 84,0 %
Terminal-Bench 2.0	Kódování v terminálu	68,5 %	Opus 4.6: 65,4 %
APEX-Agents	Schopnosti agentů	33,5 %	Opus 4.6: 29,8 %
MCP Atlas	Používání nástrojů	69,2 %	—
t2-bench Telecom	Doménově specifické	99,3 %	—
SWE-bench Verified	Kódování	80,6 %	Opus 4.6: 80,8 %
MRCR v2	Dlouhý kontext	84,9 %	Sonnet 4.6: 84,9 % (shoda)

Kde konkurence stále vítězí

Benchmark	Co testuje	Vítěz	Gemini 3.1 Pro
GDPval-AA (Elo)	Kancelářské úkoly	Sonnet 4.6: 1633	Nezveřejněno
Terminal-Bench 2.0	Náročné kódování v terminálu	GPT-5.3-Codex: 77,3 %	68,5 %
SWE-Bench Pro	Pokročilé kódování	GPT-5.3-Codex: 56,8 %	Nezveřejněno
OSWorld	Ovládání počítače	Sonnet 4.6: 72,5 %	Netestováno

Skok v uvažování v kontextu

Model	ARC-AGI-2	Datum
Gemini 3 Pro	31,1 %	Listopad 2025
GPT-5.2	52,9 %	Prosinec 2025
Claude Opus 4.6	68,8 %	Únor 2026
Gemini 3.1 Pro	77,1 %	Únor 2026

Co se změnilo oproti Gemini 3 Pro

1. Integrace Deep Think

2. Dramaticky lepší uvažování

Čísla mluví sama za sebe:

Benchmark	Gemini 3 Pro	Gemini 3.1 Pro	Zlepšení
ARC-AGI-2	31,1 %	77,1 %	+148 %
GPQA Diamond	~88 %	94,3 %	+7 %
APEX-Agents	18,4 %	33,5 %	+82 %

3. Lepší výkon v agentních úlohách

4. Zachování multimodální síly

Ceny

Stejná cena jako u Gemini 3 Pro — bezplatný upgrade:

Velikost kontextu	Vstup (za M tokenů)	Výstup (za M tokenů)
≤200K tokenů	2,00 $	12,00 $
>200K tokenů	4,00 $	18,00 $

Srovnání s konkurencí

Model	Vstup	Výstup	Relativní cena
Gemini 3.1 Pro	2,00 $	12,00 $	1x
Claude Sonnet 4.6	3,00 $	15,00 $	1,5x
GPT-5.2	5,00 $	15,00 $	2,0x (vstup)
Claude Opus 4.6	15,00 $	75,00 $	7,5x

Gemini 3.1 Pro je nejlevnější špičkový model — o 33 % levnější než Sonnet 4.6 na vstupu a o 20 % levnější na výstupu.

Cena za sezení (100K vstup + 20K výstup)

Model	Cena
Gemini 3.1 Pro	0,44 $
Claude Sonnet 4.6	0,60 $
GPT-5.2	0,80 $
Claude Opus 4.6	3,00 $

Další optimalizace nákladů:

Batch mode: 50% sleva (0,22 $/sezení)

Context caching: Čtení z cacheovaného vstupu stojí 10 % základní ceny

Dostupnost

Kde jej používat

Platforma	Stav	ID modelu
Aplikace Gemini (pro spotřebitele)	Postupně zaváděno	Automaticky vybráno
Google AI Studio	Již dostupné	`gemini-3.1-pro-preview`
Vertex AI	Již dostupné	`gemini-3.1-pro-preview`
Gemini API	Již dostupné	`gemini-3.1-pro-preview`
Gemini CLI	Již dostupné	`gemini-3.1-pro-preview`
Antigravity	Již dostupné	Automaticky vybráno
Android Studio	Již dostupné	Automaticky vybráno
GitHub Copilot	Veřejné preview	Volitelné
NotebookLM	Předplatitelé Pro/Ultra	Automaticky vybráno

Rychlý start s API

python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-3.1-pro-preview")

response = model.generate_content("Váš prompt zde")
print(response.text)

Koncový bod pro vlastní nástroje (Custom Tools)

Google také spustil specializovaný koncový bod pro lepší výkon nástrojů:

python

model = genai.GenerativeModel("gemini-3.1-pro-preview-customtools")

Tento koncový bod použijte při budování agentů, kteří silně spoléhají na volání funkcí (function calling) a používání nástrojů.

Co to znamená

Závod v uvažování přitvrzuje

Během 13 dnů byly vydány tři špičkové modely:

6. února: Claude Opus 4.6 (Anthropic)

17. února: Claude Sonnet 4.6 (Anthropic)

19. února: Gemini 3.1 Pro (Google)

Každý si nárokuje prvenství v jiných oblastech. Prostředí modelů se fragmentuje — žádný jediný model už nedominuje všemu.

Nejlepší uvažování ve své třídě za výhodnou cenu

Rovnocennost v kódování

Chybějící kousek: Ovládání počítače (Computer Use)

Pro vývojáře budující produkty

Praktické důsledky:

Nejlevnější uvažování: 0,44 $/sezení vs. 0,60 $ (Sonnet) vs. 0,80 $ (GPT-5.2)

Nejlepší pro vědecké/analytické úkoly: 94,3 % v GPQA Diamond je nejvyšší dostupné skóre

Konkurenceschopné v kódování: 80,6 % v SWE-bench stahuje náskok Claudu

Multimodální výhoda: Nativní zpracování videa/audia, kterému se Claude a GPT nevyrovnají

Stav preview: Zatím není GA (General Availability) – očekávejte vylepšení před plným vydáním

Zdroje: