Gemini 3.1 Pro
Gemini 3.1 Pro je flagship reasoning model od Google DeepMind, vydaný 19. februára 2026 ako bodová aktualizácia Gemini 3 Pro (november 2025). Predstavuje najvýraznejší medziverziový skok v histórii rodiny Gemini — viac než dvojnásobok schopnosti uvažovania oproti predchodcovi a vedenie na 13 z 16 sledovaných benchmarkov v čase vydania.
Stav článku: 22. apríl 2026. Parametre, cenník a dostupnosť sa môžu meniť s každým release cyklom Google.
1. Čo je Gemini 3.1 Pro
Gemini 3.1 Pro je priama evolúcia Gemini 3 Pro s dôrazom na hlboké multimodálne uvažovanie, konzistenciu pri extrémne dlhom kontexte a schopnosť pracovať s viachodinovým video a audio materiálom natívne — bez reťazenia samostatných modelov.
Hlavné míľniky rodiny 3.x:
- November 2025 — Gemini 3 Pro (prvý release série Gemini 3)
- 19. február 2026 — Gemini 3.1 Pro (flagship; reasoning skok, nové benchmarky)
- 3. marec 2026 — Gemini 3.1 Flash-Lite Preview (najlacnejší variant rodiny)
Model je dostupný cez Gemini API (Google AI Studio, Vertex AI) a integrovaný priamo do Gemini aplikácie pre predplatiteľov Google AI Pro a Ultra.
2. Hlavné zmeny oproti Gemini 3 Pro
Reasoning posun — ARC-AGI-2
- Gemini 3 Pro: 33 % na ARC-AGI-2
- Gemini 3.1 Pro: 77,1 % — viac než dvojnásobok, čo predstavuje najväčší medziverzový skok zaznamenaný na tomto benchmarku
- ARC-AGI-2 testuje abstraktné uvažovanie a schopnosť riešiť problémy, ktoré nie sú pokryté tréningovými dátami
Dominancia na benchmarkovej tabuľke
- model vedie na 13 z 16 sledovaných benchmarkov oproti aktuálnym frontier modelom v čase vydania
- výnimka: MMMU-Pro (multimodálne porozumenie) — tu Gemini 3 Pro (81,0 %) mierne predbehol Gemini 3.1 Pro (80,5 %), čo naznačuje, že bodové aktualizácie neprinášajú zlepšenie uniformne
Lepší multimodálny reasoning
- natívna podpora vstupu: text, obrázky, audio, video, celé kódové repozitáre v jedinom kontexte
- model dokáže analyzovať niekoľkohodinové video a reagovať na otázky o konkrétnych momentoch bez externého spracovania
- vylepšená cross-modálna konzistencia — model udržiava zámer pri prepínaní medzi modalitami
Long-context konzistencia
- kontextové okno: 1 milión tokenov (1 048 576) pre Gemini 3.1 Pro
- maximálny výstup: 65 536 tokenov
- pri vysokých pozíciách v kontexte (700K+ tokenov) model výrazne lepšie zachováva relevantné informácie oproti predchodcovi
3. Benchmarky
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.7 | GPT-5 Turbo | Llama 4 Maverick |
|---|---|---|---|---|
| ARC-AGI-2 | 77,1 % | n/a | n/a | nízke |
| GPQA Diamond | 94,3 % | ~87 % | ~85 % | ~72 % |
| SWE-bench Verified | 80,6 % | ~84 % | ~78 % | ~65 % |
| MMMU-Pro | 80,5 % | ~78 % | ~77 % | ~68 % |
| Humanity's Last Exam | 44,7 % | ~38 % | ~41,6 % | nízke |
Tabuľka je orientačná — benchmark čísla sa menia s každým novým release. Vyberajte podľa vlastných eval-ov na vašich dátach.
Kľúčové poznatky z benchmarkov:
- Gemini 3.1 Pro dominuje na GPQA Diamond (94,3 % — historicky najvyšší zaznamenaný výsledok) a Humanity's Last Exam (44,7 %)
- Na SWE-bench Verified ho predbehol Claude Opus 4.7 (~84 % vs. 80,6 %) — kódovanie zostáva silnejšou stránkou Anthropic modelov
- Na ARC-AGI-2 je Gemini 3.1 Pro bez konkurencie medzi komerčnými modelmi k aprílu 2026
4. API a dostupnosť
Prístupové kanály:
- Google AI Studio — webové rozhranie, bezplatné na testovanie a prototypovanie; programatický prístup cez API je platený
- Gemini API — REST aj SDK (Python, Node.js, Go); model ID:
gemini-3.1-pro-preview - Vertex AI — produkčné nasadenie v Google Cloud; enterprise SLA, VPC Service Controls, regionálne nasadenie
Cenník (Gemini API, apríl 2026):
| Tier | Input (per 1M tokenov) | Output (per 1M tokenov) |
|---|---|---|
| Kontext do 200K tokenov | $2,00 | $12,00 |
| Kontext nad 200K tokenov | $4,00 | $18,00 |
Free tier:
- Google AI Studio je bezplatné ako UI nástroj — neobmedzené testovanie promptov v prehliadači
- Bezplatný API prístup pre Gemini 3.1 Pro nie je k dispozícii (platené API tier je vyžadované pre produkciu)
- Vo voľnejších modeloch rodiny (Flash-Lite) existuje obmedzený free API tier
Prompt caching:
- Google ponúka context caching — opakované posielanie rovnakého dlhého kontextu (napr. knowledge base, systémový prompt) umožňuje uložiť ho a neplatiť plnú cenu pri každom requeste
- Context caching nie je dostupné na free tier
- Pri opakovanom používaní rovnakého veľkého kontextu možno ušetriť až 90 % nákladov na input tokeny
Ukážka API volania (Python SDK):
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel(
model_name="gemini-3.1-pro-preview",
system_instruction="Si analytický asistent pre spracovanie dlhých dokumentov."
)
response = model.generate_content(
contents=[
{
"role": "user",
"parts": [
{"text": "Analyzuj nasledujúci technický dokument a identifikuj kľúčové riziká:"},
{"text": "... [dlhý text dokumentu] ..."}
]
}
],
generation_config=genai.GenerationConfig(
max_output_tokens=8192,
temperature=0.2
)
)
print(response.text)
Curl varianta:
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [{"text": "Zhrň tento technický report na 5 kľúčových bodov."}]
}],
"generationConfig": {"maxOutputTokens": 2048, "temperature": 0.1}
}'
5. Varianty v rodine Gemini 3.1
Gemini 3.1 Pro — flagship reasoning model; najvyšší výkon, najvyššia cena; vhodný pre komplexné analýzy, dlhý kontext, multimodálne workloady
Gemini 3.1 Flash — ak existuje ako samostatný variant, ide o rýchlejší a lacnejší tier oproti Pro; optimalizovaný pre high-throughput scenáre kde plný reasoning Pro nie je nutný
Gemini 3.1 Flash-Lite (vydaný 3. marca 2026) — najlacnejší variant celej rodiny 3.1; cena $0,25 / 1M input tokenov a $1,50 / 1M output tokenov — teda polovica ceny oproti Gemini 3 Flash; kontext 1M tokenov; výstup až 65 536 tokenov; podpora thinking úrovní (minimal, low, medium, high) pre granulárnu kontrolu nákladov vs. výkon; maximálna rýchlosť ~330 tokenov/sekundu; ideálny pre masovú produkciu, klasifikáciu a jednoduché multimodálne úlohy
Porovnanie variantov (apríl 2026):
| Variant | Input $/1M | Output $/1M | Kontext | Určenie |
|---|---|---|---|---|
| Gemini 3.1 Pro | $2,00 | $12,00 | 1M | Flagship reasoning, multimodál |
| Gemini 3.1 Flash-Lite | $0,25 | $1,50 | 1M | Masová produkcia, nízke náklady |
6. Use cases — kedy je Gemini 3.1 Pro lepší ako Claude Opus 4.7 alebo GPT-5 Turbo
Analýza dlhého videa a audia
- Gemini 3.1 Pro je jediný komerčný frontier model s natívnou podporou dlhého video vstupu (hodiny materiálu) bez externého spracovania
- Claude Opus 4.7 nepodporuje video vstup; GPT-5 Turbo zvláda krátke video klipy, nie dlhé nahrávky
- Typický use case: analýza záznamu zo schôdze, monitoring bezpečnostných kamerových záberov, štúdium výukových videí
Multimodálne grounding — kombinovanie zdrojov
- model spracuje v jedinom kontexte textové dokumenty, tabuľky, naskenované PDF, obrázky aj audio naraz
- lepšia cross-modálna syntéza ako pri pipeline prístupe (reťazenie samostatných modelov)
Vyhľadávanie cez Google Search tool
- Gemini API natívne podporuje grounding cez Google Search — model môže overovať fakty a doplňovať kontext z webu v reálnom čase priamo v API requeste
- Claude ani GPT-5 Turbo toto nenúkajú ako natívnu API funkciu bez vlastného toolingu
GPQA a vedecký výskum
- 94,3 % na GPQA Diamond z neho robí najsilnejší nástroj pre graduate-level vedecké úlohy, fyziku, chémiu, biológiu
- vhodný pre automatizáciu literatúrnych review, analýzu vedeckých publikácií
Dlhý kontext pri nižšej cene než Claude Opus 4.7
- $4,00 / 1M input tokenov nad 200K je lacnejší ako Claude Opus 4.7 long-context premium ($10 / 1M nad 200K)
- pri workloadoch s konzistentne dlhými vstupmi (legal documents, celé kódové bázy) je cenová výhoda výrazná
7. Slabosti
Kódovanie — SWE-bench
- 80,6 % na SWE-bench Verified je silný výsledok, ale Claude Opus 4.7 (~84 %) tu vedie
- pri komplexných multi-súborových refaktoroch a test-driven scenároch Anthropic modely stále dominujú
Hĺbka agentického workflowu
- Google dohnieva v agentickej stabilite — Claude Opus 4.7 je lepšie optimalizovaný pre dlhé autonómne sessiony (4+ hodín) bez driftu a straty zámeru
- Gemini 3.1 Pro je silný v jednom-volaní multimodálnych úlohách; menej testovaný v rekurzívnych multi-krokových agentických scenároch
Refusal rate a bezpečnostné filtre
- Google modely majú tendenciu k vyššiemu refusal rate pri boundary úlohách (bezpečnostné výskumy, citlivý obsah)
- v porovnaní s Claude (kde je refusal behavior dobre zdokumentovaný) je správanie Gemini menej predvídateľné v edge case scenároch
Regionálna dostupnosť
- niektoré funkcie (grounding cez Google Search, voice, video output) nie sú k dispozícii vo všetkých regiónoch
- Vertex AI nasadenie pre EÚ/GDPR prostredia je dostupné, ale konkrétne funkcie sa môžu líšiť podľa regiónu
- pre heavily regulated prostredia (zdravotníctvo, finančný sektor) treba overiť aktuálnu dostupnosť na Google Cloud konzoli
Kreatívne písanie a marketing copy
- nezávislé testy ukazujú, že Gemini 3.1 Pro produkuje generickejší marketingový obsah — Claude a GPT-5 Turbo sú preferovanejšie pri nuansovanom kreatívnom písaní
8. Záver — pozícia v Q2 2026
Gemini 3.1 Pro je v apríli 2026 dominantný model pre reasoning a multimodálne workloady — ARC-AGI-2 (77,1 %), GPQA Diamond (94,3 %) a Humanity's Last Exam (44,7 %) mu dávajú jasnú prevahu vo vedeckom a analytickom segmente.
Reálna architektúra výberu modelov v Q2 2026:
- Gemini 3.1 Pro — ak potrebujete video/audio analýzu, multimodálne grounding, vedecký reasoning alebo Google Search integráciu natívne v API
- Claude Opus 4.7 — ak potrebujete agentickú stabilitu, dlhé autonómne sessiony a najlepší SWE-bench výkon
- GPT-5 Turbo — ak potrebujete natívnu generáciu obrázkov a audia v jedinom API volaní
Pre väčšinu tímov má zmysel kombinovať modely podľa úlohy, nie vybrať jeden ako univerzálny štandard. Gemini 3.1 Pro Flash-Lite ponúka výrazne nižšiu cenu (8× lacnejší input ako Pro) pri zachovaní 1M kontextového okna — vhodný pre masovú produkciu kde plný reasoning Pro nie je nutný.
Zdroje
- Gemini 3.1 Pro — Google DeepMind
- Gemini 3.1 Pro: Announcing our latest Gemini AI model — Google Blog
- Gemini API Pricing | Google AI for Developers
- Gemini 3.1 Flash Lite: Our most cost-effective AI model yet — Google Blog
- Gemini 3.1 Pro Model Card — Google DeepMind
- Gemini 3.1 Pro Benchmark Analysis — SmartScope
- Humanity's Last Exam Leaderboard — Artificial Analysis
- Gemini 3.1 Pro Preview — Artificial Analysis