Gemini 3.1 Pro

Gemini 3.1 Pro je flagship reasoning model od Google DeepMind, vydaný 19. februára 2026 ako bodová aktualizácia Gemini 3 Pro (november 2025). Predstavuje najvýraznejší medziverziový skok v histórii rodiny Gemini — viac než dvojnásobok schopnosti uvažovania oproti predchodcovi a vedenie na 13 z 16 sledovaných benchmarkov v čase vydania.

Stav článku: 22. apríl 2026. Parametre, cenník a dostupnosť sa môžu meniť s každým release cyklom Google.

1. Čo je Gemini 3.1 Pro

Gemini 3.1 Pro je priama evolúcia Gemini 3 Pro s dôrazom na hlboké multimodálne uvažovanie, konzistenciu pri extrémne dlhom kontexte a schopnosť pracovať s viachodinovým video a audio materiálom natívne — bez reťazenia samostatných modelov.

Hlavné míľniky rodiny 3.x:

November 2025 — Gemini 3 Pro (prvý release série Gemini 3)
19. február 2026 — Gemini 3.1 Pro (flagship; reasoning skok, nové benchmarky)
3. marec 2026 — Gemini 3.1 Flash-Lite Preview (najlacnejší variant rodiny)

Model je dostupný cez Gemini API (Google AI Studio, Vertex AI) a integrovaný priamo do Gemini aplikácie pre predplatiteľov Google AI Pro a Ultra.

2. Hlavné zmeny oproti Gemini 3 Pro

Reasoning posun — ARC-AGI-2
- Gemini 3 Pro: 33 % na ARC-AGI-2
- Gemini 3.1 Pro: 77,1 % — viac než dvojnásobok, čo predstavuje najväčší medziverzový skok zaznamenaný na tomto benchmarku
- ARC-AGI-2 testuje abstraktné uvažovanie a schopnosť riešiť problémy, ktoré nie sú pokryté tréningovými dátami
Dominancia na benchmarkovej tabuľke
- model vedie na 13 z 16 sledovaných benchmarkov oproti aktuálnym frontier modelom v čase vydania
- výnimka: MMMU-Pro (multimodálne porozumenie) — tu Gemini 3 Pro (81,0 %) mierne predbehol Gemini 3.1 Pro (80,5 %), čo naznačuje, že bodové aktualizácie neprinášajú zlepšenie uniformne
Lepší multimodálny reasoning
- natívna podpora vstupu: text, obrázky, audio, video, celé kódové repozitáre v jedinom kontexte
- model dokáže analyzovať niekoľkohodinové video a reagovať na otázky o konkrétnych momentoch bez externého spracovania
- vylepšená cross-modálna konzistencia — model udržiava zámer pri prepínaní medzi modalitami
Long-context konzistencia
- kontextové okno: 1 milión tokenov (1 048 576) pre Gemini 3.1 Pro
- maximálny výstup: 65 536 tokenov
- pri vysokých pozíciách v kontexte (700K+ tokenov) model výrazne lepšie zachováva relevantné informácie oproti predchodcovi

3. Benchmarky

Benchmark	Gemini 3.1 Pro	Claude Opus 4.7	GPT-5 Turbo	Llama 4 Maverick
ARC-AGI-2	77,1 %	n/a	n/a	nízke
GPQA Diamond	94,3 %	~87 %	~85 %	~72 %
SWE-bench Verified	80,6 %	~84 %	~78 %	~65 %
MMMU-Pro	80,5 %	~78 %	~77 %	~68 %
Humanity's Last Exam	44,7 %	~38 %	~41,6 %	nízke

Tabuľka je orientačná — benchmark čísla sa menia s každým novým release. Vyberajte podľa vlastných eval-ov na vašich dátach.

Kľúčové poznatky z benchmarkov:

Gemini 3.1 Pro dominuje na GPQA Diamond (94,3 % — historicky najvyšší zaznamenaný výsledok) a Humanity's Last Exam (44,7 %)
Na SWE-bench Verified ho predbehol Claude Opus 4.7 (~84 % vs. 80,6 %) — kódovanie zostáva silnejšou stránkou Anthropic modelov
Na ARC-AGI-2 je Gemini 3.1 Pro bez konkurencie medzi komerčnými modelmi k aprílu 2026

4. API a dostupnosť

Prístupové kanály:

Google AI Studio — webové rozhranie, bezplatné na testovanie a prototypovanie; programatický prístup cez API je platený
Gemini API — REST aj SDK (Python, Node.js, Go); model ID: gemini-3.1-pro-preview
Vertex AI — produkčné nasadenie v Google Cloud; enterprise SLA, VPC Service Controls, regionálne nasadenie

Cenník (Gemini API, apríl 2026):

Tier	Input (per 1M tokenov)	Output (per 1M tokenov)
Kontext do 200K tokenov	$2,00	$12,00
Kontext nad 200K tokenov	$4,00	$18,00

Free tier:

Google AI Studio je bezplatné ako UI nástroj — neobmedzené testovanie promptov v prehliadači
Bezplatný API prístup pre Gemini 3.1 Pro nie je k dispozícii (platené API tier je vyžadované pre produkciu)
Vo voľnejších modeloch rodiny (Flash-Lite) existuje obmedzený free API tier

Prompt caching:

Google ponúka context caching — opakované posielanie rovnakého dlhého kontextu (napr. knowledge base, systémový prompt) umožňuje uložiť ho a neplatiť plnú cenu pri každom requeste
Context caching nie je dostupné na free tier
Pri opakovanom používaní rovnakého veľkého kontextu možno ušetriť až 90 % nákladov na input tokeny

Ukážka API volania (Python SDK):

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel(
    model_name="gemini-3.1-pro-preview",
    system_instruction="Si analytický asistent pre spracovanie dlhých dokumentov."
)

response = model.generate_content(
    contents=[
        {
            "role": "user",
            "parts": [
                {"text": "Analyzuj nasledujúci technický dokument a identifikuj kľúčové riziká:"},
                {"text": "... [dlhý text dokumentu] ..."}
            ]
        }
    ],
    generation_config=genai.GenerationConfig(
        max_output_tokens=8192,
        temperature=0.2
    )
)

print(response.text)

Curl varianta:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "Zhrň tento technický report na 5 kľúčových bodov."}]
    }],
    "generationConfig": {"maxOutputTokens": 2048, "temperature": 0.1}
  }'

5. Varianty v rodine Gemini 3.1

Gemini 3.1 Pro — flagship reasoning model; najvyšší výkon, najvyššia cena; vhodný pre komplexné analýzy, dlhý kontext, multimodálne workloady
Gemini 3.1 Flash — ak existuje ako samostatný variant, ide o rýchlejší a lacnejší tier oproti Pro; optimalizovaný pre high-throughput scenáre kde plný reasoning Pro nie je nutný
Gemini 3.1 Flash-Lite (vydaný 3. marca 2026) — najlacnejší variant celej rodiny 3.1; cena $0,25 / 1M input tokenov a $1,50 / 1M output tokenov — teda polovica ceny oproti Gemini 3 Flash; kontext 1M tokenov; výstup až 65 536 tokenov; podpora thinking úrovní (minimal, low, medium, high) pre granulárnu kontrolu nákladov vs. výkon; maximálna rýchlosť ~330 tokenov/sekundu; ideálny pre masovú produkciu, klasifikáciu a jednoduché multimodálne úlohy

Porovnanie variantov (apríl 2026):

Variant	Input $/1M	Output $/1M	Kontext	Určenie
Gemini 3.1 Pro	$2,00	$12,00	1M	Flagship reasoning, multimodál
Gemini 3.1 Flash-Lite	$0,25	$1,50	1M	Masová produkcia, nízke náklady

6. Use cases — kedy je Gemini 3.1 Pro lepší ako Claude Opus 4.7 alebo GPT-5 Turbo

Analýza dlhého videa a audia
- Gemini 3.1 Pro je jediný komerčný frontier model s natívnou podporou dlhého video vstupu (hodiny materiálu) bez externého spracovania
- Claude Opus 4.7 nepodporuje video vstup; GPT-5 Turbo zvláda krátke video klipy, nie dlhé nahrávky
- Typický use case: analýza záznamu zo schôdze, monitoring bezpečnostných kamerových záberov, štúdium výukových videí
Multimodálne grounding — kombinovanie zdrojov
- model spracuje v jedinom kontexte textové dokumenty, tabuľky, naskenované PDF, obrázky aj audio naraz
- lepšia cross-modálna syntéza ako pri pipeline prístupe (reťazenie samostatných modelov)
Vyhľadávanie cez Google Search tool
- Gemini API natívne podporuje grounding cez Google Search — model môže overovať fakty a doplňovať kontext z webu v reálnom čase priamo v API requeste
- Claude ani GPT-5 Turbo toto nenúkajú ako natívnu API funkciu bez vlastného toolingu
GPQA a vedecký výskum
- 94,3 % na GPQA Diamond z neho robí najsilnejší nástroj pre graduate-level vedecké úlohy, fyziku, chémiu, biológiu
- vhodný pre automatizáciu literatúrnych review, analýzu vedeckých publikácií
Dlhý kontext pri nižšej cene než Claude Opus 4.7
- $4,00 / 1M input tokenov nad 200K je lacnejší ako Claude Opus 4.7 long-context premium ($10 / 1M nad 200K)
- pri workloadoch s konzistentne dlhými vstupmi (legal documents, celé kódové bázy) je cenová výhoda výrazná

7. Slabosti

Kódovanie — SWE-bench
- 80,6 % na SWE-bench Verified je silný výsledok, ale Claude Opus 4.7 (~84 %) tu vedie
- pri komplexných multi-súborových refaktoroch a test-driven scenároch Anthropic modely stále dominujú
Hĺbka agentického workflowu
- Google dohnieva v agentickej stabilite — Claude Opus 4.7 je lepšie optimalizovaný pre dlhé autonómne sessiony (4+ hodín) bez driftu a straty zámeru
- Gemini 3.1 Pro je silný v jednom-volaní multimodálnych úlohách; menej testovaný v rekurzívnych multi-krokových agentických scenároch
Refusal rate a bezpečnostné filtre
- Google modely majú tendenciu k vyššiemu refusal rate pri boundary úlohách (bezpečnostné výskumy, citlivý obsah)
- v porovnaní s Claude (kde je refusal behavior dobre zdokumentovaný) je správanie Gemini menej predvídateľné v edge case scenároch
Regionálna dostupnosť
- niektoré funkcie (grounding cez Google Search, voice, video output) nie sú k dispozícii vo všetkých regiónoch
- Vertex AI nasadenie pre EÚ/GDPR prostredia je dostupné, ale konkrétne funkcie sa môžu líšiť podľa regiónu
- pre heavily regulated prostredia (zdravotníctvo, finančný sektor) treba overiť aktuálnu dostupnosť na Google Cloud konzoli
Kreatívne písanie a marketing copy
- nezávislé testy ukazujú, že Gemini 3.1 Pro produkuje generickejší marketingový obsah — Claude a GPT-5 Turbo sú preferovanejšie pri nuansovanom kreatívnom písaní

8. Záver — pozícia v Q2 2026

Gemini 3.1 Pro je v apríli 2026 dominantný model pre reasoning a multimodálne workloady — ARC-AGI-2 (77,1 %), GPQA Diamond (94,3 %) a Humanity's Last Exam (44,7 %) mu dávajú jasnú prevahu vo vedeckom a analytickom segmente.

Reálna architektúra výberu modelov v Q2 2026:

Gemini 3.1 Pro — ak potrebujete video/audio analýzu, multimodálne grounding, vedecký reasoning alebo Google Search integráciu natívne v API
Claude Opus 4.7 — ak potrebujete agentickú stabilitu, dlhé autonómne sessiony a najlepší SWE-bench výkon
GPT-5 Turbo — ak potrebujete natívnu generáciu obrázkov a audia v jedinom API volaní

Pre väčšinu tímov má zmysel kombinovať modely podľa úlohy, nie vybrať jeden ako univerzálny štandard. Gemini 3.1 Pro Flash-Lite ponúka výrazne nižšiu cenu (8× lacnejší input ako Pro) pri zachovaní 1M kontextového okna — vhodný pre masovú produkciu kde plný reasoning Pro nie je nutný.