Gemini 3.1 Pro: Skok v uvažování od Googlu vysvětlen
Google vydal Gemini 3.1 Pro 19. února 2026 – dosáhl 77,1 % v ARC-AGI-2, což je více než dvojnásobek oproti Gemini 3 Pro. Kompletní rozbor benchmarků, ceny (2 $/12 $ za M tokenů), dostupnost a co to znamená pro vývojáře.
TL;DR
Google vydal Gemini 3.1 Pro (preview) 19. února 2026. Klíčová čísla:
- ARC-AGI-2: 77,1 % — více než dvojnásobek Gemini 3 Pro (31,1 %), poráží Opus 4.6 (68,8 %) a GPT-5.2 (52,9 %)
- GPQA Diamond: 94,3 % — vede nad všemi modely ve vědeckých úlohách na úrovni postgraduálního studia
- SWE-bench: 80,6 % — vyrovná se Opus 4.6 (80,8 %) v kódování
- Cena: 2 $/12 $ za M tokenů — nejlevnější špičkový (frontier) model
- Kontext 1M tokenů — beze změny oproti Gemini 3 Pro
- Vede ve 13 z 16 benchmarků hodnocených Googlem
- Dostupné nyní v preview: AI Studio, Vertex AI, Gemini CLI, aplikace Gemini
Co Google oznámil
- února 2026 vydal Google Gemini 3.1 Pro — první přírůstek „.1“ ve svém verzování modelů. Staví na Gemini 3 Pro (listopad 2025) a integruje techniky z řady Gemini 3 Deep Think do dostupnějšího a rychlejšího modelu.
Hlavní statistika: 77,1 % v ARC-AGI-2, benchmarku pro nové abstraktní uvažování. To je více než dvojnásobek oproti 31,1 % u Gemini 3 Pro a výrazně před modely Opus 4.6 (68,8 %) i GPT-5.2 (52,9 %). VentureBeat jej nazývá „Deep Think Mini s nastavitelným uvažováním na vyžádání“.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Kompletní rozbor benchmarků
Kde Gemini 3.1 Pro vede (13 z 16 benchmarků)
| Benchmark | Co testuje | Gemini 3.1 Pro | Nejlepší konkurent |
|---|---|---|---|
| ARC-AGI-2 | Nové uvažování | 77,1 % | Opus 4.6: 68,8 % |
| GPQA Diamond | Postgraduální věda | 94,3 % | GPT-5.2: 92,4 % |
| BrowseComp | Agentní webové vyhledávání | 85,9 % | Opus 4.6: 84,0 % |
| Terminal-Bench 2.0 | Kódování v terminálu | 68,5 % | Opus 4.6: 65,4 % |
| APEX-Agents | Schopnosti agentů | 33,5 % | Opus 4.6: 29,8 % |
| MCP Atlas | Používání nástrojů | 69,2 % | — |
| t2-bench Telecom | Doménově specifické | 99,3 % | — |
| SWE-bench Verified | Kódování | 80,6 % | Opus 4.6: 80,8 % |
| MRCR v2 | Dlouhý kontext | 84,9 % | Sonnet 4.6: 84,9 % (shoda) |
Kde konkurence stále vítězí
| Benchmark | Co testuje | Vítěz | Gemini 3.1 Pro |
|---|---|---|---|
| GDPval-AA (Elo) | Kancelářské úkoly | Sonnet 4.6: 1633 | Nezveřejněno |
| Terminal-Bench 2.0 | Náročné kódování v terminálu | GPT-5.3-Codex: 77,3 % | 68,5 % |
| SWE-Bench Pro | Pokročilé kódování | GPT-5.3-Codex: 56,8 % | Nezveřejněno |
| OSWorld | Ovládání počítače | Sonnet 4.6: 72,5 % | Netestováno |
Skok v uvažování v kontextu
ARC-AGI-2 měří schopnost modelu řešit problémy, které nikdy dříve neviděl — čisté abstraktní uvažování, nikoliv shodu vzorů z tréninkových dat. Zde je vidět, jak rychle se Gemini zlepšilo:
| Model | ARC-AGI-2 | Datum |
|---|---|---|
| Gemini 3 Pro | 31,1 % | Listopad 2025 |
| GPT-5.2 | 52,9 % | Prosinec 2025 |
| Claude Opus 4.6 | 68,8 % | Únor 2026 |
| Gemini 3.1 Pro | 77,1 % | Únor 2026 |
Gemini 3.1 Pro poskočilo z 31,1 % na 77,1 % v jediné verzi — to je zlepšení o 148 %. Toho bylo dosaženo integrací pokročilých technik uvažování z Deep Think přímo do základního modelu.
Co se změnilo oproti Gemini 3 Pro
1. Integrace Deep Think
Gemini 3 Deep Think byl samostatný, pomalejší model optimalizovaný pro hluboké uvažování. Gemini 3.1 Pro tyto techniky začleňuje do standardního modelu s nastavitelnou hloubkou uvažování. U většiny úkolů tak získáte úroveň uvažování Deep Think bez jeho vysoké latence.
2. Dramaticky lepší uvažování
Čísla mluví sama za sebe:
| Benchmark | Gemini 3 Pro | Gemini 3.1 Pro | Zlepšení |
|---|---|---|---|
| ARC-AGI-2 | 31,1 % | 77,1 % | +148 % |
| GPQA Diamond | ~88 % | 94,3 % | +7 % |
| APEX-Agents | 18,4 % | 33,5 % | +82 % |
3. Lepší výkon v agentních úlohách
Skóre v APEX-Agents (33,5 %) a MCP Atlas (69,2 %) ukazují, že Gemini 3.1 Pro je výrazně schopnější jako autonomní agent — používání nástrojů, vícekrokové plánování a samokorekce jsou na mnohem vyšší úrovni.
4. Zachování multimodální síly
Gemini 3.1 Pro si ponechává hlavní výhodu modelů Gemini: nativní multimodální zpracování textu, obrázků, zvuku a videa v rámci jediného kontextu. Žádný jiný špičkový model nenabízí takovou šíři za tuto cenu.
Ceny
Stejná cena jako u Gemini 3 Pro — bezplatný upgrade:
| Velikost kontextu | Vstup (za M tokenů) | Výstup (za M tokenů) |
|---|---|---|
| ≤200K tokenů | 2,00 $ | 12,00 $ |
| >200K tokenů | 4,00 $ | 18,00 $ |
Srovnání s konkurencí
| Model | Vstup | Výstup | Relativní cena |
|---|---|---|---|
| Gemini 3.1 Pro | 2,00 $ | 12,00 $ | 1x |
| Claude Sonnet 4.6 | 3,00 $ | 15,00 $ | 1,5x |
| GPT-5.2 | 5,00 $ | 15,00 $ | 2,0x (vstup) |
| Claude Opus 4.6 | 15,00 $ | 75,00 $ | 7,5x |
Gemini 3.1 Pro je nejlevnější špičkový model — o 33 % levnější než Sonnet 4.6 na vstupu a o 20 % levnější na výstupu.
Cena za sezení (100K vstup + 20K výstup)
| Model | Cena |
|---|---|
| Gemini 3.1 Pro | 0,44 $ |
| Claude Sonnet 4.6 | 0,60 $ |
| GPT-5.2 | 0,80 $ |
| Claude Opus 4.6 | 3,00 $ |
Další optimalizace nákladů:
- Batch mode: 50% sleva (0,22 $/sezení)
- Context caching: Čtení z cacheovaného vstupu stojí 10 % základní ceny
Dostupnost
Kde jej používat
| Platforma | Stav | ID modelu |
|---|---|---|
| Aplikace Gemini (pro spotřebitele) | Postupně zaváděno | Automaticky vybráno |
| Google AI Studio | Již dostupné | gemini-3.1-pro-preview |
| Vertex AI | Již dostupné | gemini-3.1-pro-preview |
| Gemini API | Již dostupné | gemini-3.1-pro-preview |
| Gemini CLI | Již dostupné | gemini-3.1-pro-preview |
| Antigravity | Již dostupné | Automaticky vybráno |
| Android Studio | Již dostupné | Automaticky vybráno |
| GitHub Copilot | Veřejné preview | Volitelné |
| NotebookLM | Předplatitelé Pro/Ultra | Automaticky vybráno |
Rychlý start s API
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-3.1-pro-preview")
response = model.generate_content("Váš prompt zde")
print(response.text)
Koncový bod pro vlastní nástroje (Custom Tools)
Google také spustil specializovaný koncový bod pro lepší výkon nástrojů:
model = genai.GenerativeModel("gemini-3.1-pro-preview-customtools")
Tento koncový bod použijte při budování agentů, kteří silně spoléhají na volání funkcí (function calling) a používání nástrojů.
Co to znamená
Závod v uvažování přitvrzuje
Během 13 dnů byly vydány tři špičkové modely:
- 6. února: Claude Opus 4.6 (Anthropic)
- 17. února: Claude Sonnet 4.6 (Anthropic)
- 19. února: Gemini 3.1 Pro (Google)
Každý si nárokuje prvenství v jiných oblastech. Prostředí modelů se fragmentuje — žádný jediný model už nedominuje všemu.
Nejlepší uvažování ve své třídě za výhodnou cenu
Výsledek 77,1 % v ARC-AGI-2 u Gemini 3.1 Pro je nejvyšší dostupné skóre uvažování za nejnižší cenu (2 $/12 $). Pro úkoly vyžadující nové řešení problémů, abstraktní uvažování nebo vědeckou analýzu je to jasná volba.
Rovnocennost v kódování
S 80,6 % v SWE-bench (oproti 80,8 % u Opus 4.6 a 79,6 % u Sonnet 4.6) je Gemini 3.1 Pro poprvé plně konkurenceschopné v kódování. Předchozí modely Gemini v tomto benchmarku za modely Claude výrazně zaostávaly.
Chybějící kousek: Ovládání počítače (Computer Use)
Gemini 3.1 Pro nemá benchmark v OSWorld (ovládání počítače). Claude Sonnet 4.6 v této schopnosti vede se 72,5 %. Pokud vaše workflow zahrnuje automatizaci prohlížeče, vyplňování formulářů nebo ovládání desktopu, Claude zůstává jedinou životaschopnou volbou.
Pro vývojáře budující produkty
Praktické důsledky:
- Nejlevnější uvažování: 0,44 $/sezení vs. 0,60 $ (Sonnet) vs. 0,80 $ (GPT-5.2)
- Nejlepší pro vědecké/analytické úkoly: 94,3 % v GPQA Diamond je nejvyšší dostupné skóre
- Konkurenceschopné v kódování: 80,6 % v SWE-bench stahuje náskok Claudu
- Multimodální výhoda: Nativní zpracování videa/audia, kterému se Claude a GPT nevyrovnají
- Stav preview: Zatím není GA (General Availability) – očekávejte vylepšení před plným vydáním
Stavíte s AI? Y Build se integruje s vašimi oblíbenými AI nástroji pro vývoj a následně řeší nasazení, produktová videa Demo Cut, AI SEO a analytiku — kompletní stack od kódu až po růst. Začněte zdarma.
Zdroje:
- Google Blog: Oznámení Gemini 3.1 Pro
- Google DeepMind: Model Card Gemini 3.1 Pro
- 9to5Google: Gemini 3.1 Pro pro komplexní řešení problémů
- VentureBeat: První dojmy z Gemini 3.1 Pro
- MarkTechPost: Gemini 3.1 Pro 77,1 % ARC-AGI-2
- OfficeChai: Benchmarky Gemini 3.1 Pro
- GitHub Blog: Gemini 3.1 Pro v GitHub Copilot
- The Decoder: Schopnosti uvažování Gemini 3.1 Pro
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.