Gemini 3.1 Pro

Gemini 3.1 Pro je flagship reasoning model od Google DeepMind, vydaný 19. februára 2026 ako bodová aktualizácia Gemini 3 Pro (november 2025). Predstavuje najvýraznejší medziverziový skok v histórii rodiny Gemini — viac než dvojnásobok schopnosti uvažovania oproti predchodcovi a vedenie na 13 z 16 sledovaných benchmarkov v čase vydania.

Stav článku: 22. apríl 2026. Parametre, cenník a dostupnosť sa môžu meniť s každým release cyklom Google.


1. Čo je Gemini 3.1 Pro

Gemini 3.1 Pro je priama evolúcia Gemini 3 Pro s dôrazom na hlboké multimodálne uvažovanie, konzistenciu pri extrémne dlhom kontexte a schopnosť pracovať s viachodinovým video a audio materiálom natívne — bez reťazenia samostatných modelov.

Hlavné míľniky rodiny 3.x:

  • November 2025 — Gemini 3 Pro (prvý release série Gemini 3)
  • 19. február 2026 — Gemini 3.1 Pro (flagship; reasoning skok, nové benchmarky)
  • 3. marec 2026 — Gemini 3.1 Flash-Lite Preview (najlacnejší variant rodiny)

Model je dostupný cez Gemini API (Google AI Studio, Vertex AI) a integrovaný priamo do Gemini aplikácie pre predplatiteľov Google AI Pro a Ultra.


2. Hlavné zmeny oproti Gemini 3 Pro

  • Reasoning posun — ARC-AGI-2

    • Gemini 3 Pro: 33 % na ARC-AGI-2
    • Gemini 3.1 Pro: 77,1 % — viac než dvojnásobok, čo predstavuje najväčší medziverzový skok zaznamenaný na tomto benchmarku
    • ARC-AGI-2 testuje abstraktné uvažovanie a schopnosť riešiť problémy, ktoré nie sú pokryté tréningovými dátami
  • Dominancia na benchmarkovej tabuľke

    • model vedie na 13 z 16 sledovaných benchmarkov oproti aktuálnym frontier modelom v čase vydania
    • výnimka: MMMU-Pro (multimodálne porozumenie) — tu Gemini 3 Pro (81,0 %) mierne predbehol Gemini 3.1 Pro (80,5 %), čo naznačuje, že bodové aktualizácie neprinášajú zlepšenie uniformne
  • Lepší multimodálny reasoning

    • natívna podpora vstupu: text, obrázky, audio, video, celé kódové repozitáre v jedinom kontexte
    • model dokáže analyzovať niekoľkohodinové video a reagovať na otázky o konkrétnych momentoch bez externého spracovania
    • vylepšená cross-modálna konzistencia — model udržiava zámer pri prepínaní medzi modalitami
  • Long-context konzistencia

    • kontextové okno: 1 milión tokenov (1 048 576) pre Gemini 3.1 Pro
    • maximálny výstup: 65 536 tokenov
    • pri vysokých pozíciách v kontexte (700K+ tokenov) model výrazne lepšie zachováva relevantné informácie oproti predchodcovi

3. Benchmarky

Benchmark Gemini 3.1 Pro Claude Opus 4.7 GPT-5 Turbo Llama 4 Maverick
ARC-AGI-2 77,1 % n/a n/a nízke
GPQA Diamond 94,3 % ~87 % ~85 % ~72 %
SWE-bench Verified 80,6 % ~84 % ~78 % ~65 %
MMMU-Pro 80,5 % ~78 % ~77 % ~68 %
Humanity's Last Exam 44,7 % ~38 % ~41,6 % nízke

Tabuľka je orientačná — benchmark čísla sa menia s každým novým release. Vyberajte podľa vlastných eval-ov na vašich dátach.

Kľúčové poznatky z benchmarkov:

  • Gemini 3.1 Pro dominuje na GPQA Diamond (94,3 % — historicky najvyšší zaznamenaný výsledok) a Humanity's Last Exam (44,7 %)
  • Na SWE-bench Verified ho predbehol Claude Opus 4.7 (~84 % vs. 80,6 %) — kódovanie zostáva silnejšou stránkou Anthropic modelov
  • Na ARC-AGI-2 je Gemini 3.1 Pro bez konkurencie medzi komerčnými modelmi k aprílu 2026

4. API a dostupnosť

Prístupové kanály:

  • Google AI Studio — webové rozhranie, bezplatné na testovanie a prototypovanie; programatický prístup cez API je platený
  • Gemini API — REST aj SDK (Python, Node.js, Go); model ID: gemini-3.1-pro-preview
  • Vertex AI — produkčné nasadenie v Google Cloud; enterprise SLA, VPC Service Controls, regionálne nasadenie

Cenník (Gemini API, apríl 2026):

Tier Input (per 1M tokenov) Output (per 1M tokenov)
Kontext do 200K tokenov $2,00 $12,00
Kontext nad 200K tokenov $4,00 $18,00

Free tier:

  • Google AI Studio je bezplatné ako UI nástroj — neobmedzené testovanie promptov v prehliadači
  • Bezplatný API prístup pre Gemini 3.1 Pro nie je k dispozícii (platené API tier je vyžadované pre produkciu)
  • Vo voľnejších modeloch rodiny (Flash-Lite) existuje obmedzený free API tier

Prompt caching:

  • Google ponúka context caching — opakované posielanie rovnakého dlhého kontextu (napr. knowledge base, systémový prompt) umožňuje uložiť ho a neplatiť plnú cenu pri každom requeste
  • Context caching nie je dostupné na free tier
  • Pri opakovanom používaní rovnakého veľkého kontextu možno ušetriť až 90 % nákladov na input tokeny

Ukážka API volania (Python SDK):

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel(
    model_name="gemini-3.1-pro-preview",
    system_instruction="Si analytický asistent pre spracovanie dlhých dokumentov."
)

response = model.generate_content(
    contents=[
        {
            "role": "user",
            "parts": [
                {"text": "Analyzuj nasledujúci technický dokument a identifikuj kľúčové riziká:"},
                {"text": "... [dlhý text dokumentu] ..."}
            ]
        }
    ],
    generation_config=genai.GenerationConfig(
        max_output_tokens=8192,
        temperature=0.2
    )
)

print(response.text)

Curl varianta:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "Zhrň tento technický report na 5 kľúčových bodov."}]
    }],
    "generationConfig": {"maxOutputTokens": 2048, "temperature": 0.1}
  }'

5. Varianty v rodine Gemini 3.1

  • Gemini 3.1 Pro — flagship reasoning model; najvyšší výkon, najvyššia cena; vhodný pre komplexné analýzy, dlhý kontext, multimodálne workloady

  • Gemini 3.1 Flash — ak existuje ako samostatný variant, ide o rýchlejší a lacnejší tier oproti Pro; optimalizovaný pre high-throughput scenáre kde plný reasoning Pro nie je nutný

  • Gemini 3.1 Flash-Lite (vydaný 3. marca 2026) — najlacnejší variant celej rodiny 3.1; cena $0,25 / 1M input tokenov a $1,50 / 1M output tokenov — teda polovica ceny oproti Gemini 3 Flash; kontext 1M tokenov; výstup až 65 536 tokenov; podpora thinking úrovní (minimal, low, medium, high) pre granulárnu kontrolu nákladov vs. výkon; maximálna rýchlosť ~330 tokenov/sekundu; ideálny pre masovú produkciu, klasifikáciu a jednoduché multimodálne úlohy

Porovnanie variantov (apríl 2026):

Variant Input $/1M Output $/1M Kontext Určenie
Gemini 3.1 Pro $2,00 $12,00 1M Flagship reasoning, multimodál
Gemini 3.1 Flash-Lite $0,25 $1,50 1M Masová produkcia, nízke náklady

6. Use cases — kedy je Gemini 3.1 Pro lepší ako Claude Opus 4.7 alebo GPT-5 Turbo

  • Analýza dlhého videa a audia

    • Gemini 3.1 Pro je jediný komerčný frontier model s natívnou podporou dlhého video vstupu (hodiny materiálu) bez externého spracovania
    • Claude Opus 4.7 nepodporuje video vstup; GPT-5 Turbo zvláda krátke video klipy, nie dlhé nahrávky
    • Typický use case: analýza záznamu zo schôdze, monitoring bezpečnostných kamerových záberov, štúdium výukových videí
  • Multimodálne grounding — kombinovanie zdrojov

    • model spracuje v jedinom kontexte textové dokumenty, tabuľky, naskenované PDF, obrázky aj audio naraz
    • lepšia cross-modálna syntéza ako pri pipeline prístupe (reťazenie samostatných modelov)
  • Vyhľadávanie cez Google Search tool

    • Gemini API natívne podporuje grounding cez Google Search — model môže overovať fakty a doplňovať kontext z webu v reálnom čase priamo v API requeste
    • Claude ani GPT-5 Turbo toto nenúkajú ako natívnu API funkciu bez vlastného toolingu
  • GPQA a vedecký výskum

    • 94,3 % na GPQA Diamond z neho robí najsilnejší nástroj pre graduate-level vedecké úlohy, fyziku, chémiu, biológiu
    • vhodný pre automatizáciu literatúrnych review, analýzu vedeckých publikácií
  • Dlhý kontext pri nižšej cene než Claude Opus 4.7

    • $4,00 / 1M input tokenov nad 200K je lacnejší ako Claude Opus 4.7 long-context premium ($10 / 1M nad 200K)
    • pri workloadoch s konzistentne dlhými vstupmi (legal documents, celé kódové bázy) je cenová výhoda výrazná

7. Slabosti

  • Kódovanie — SWE-bench

    • 80,6 % na SWE-bench Verified je silný výsledok, ale Claude Opus 4.7 (~84 %) tu vedie
    • pri komplexných multi-súborových refaktoroch a test-driven scenároch Anthropic modely stále dominujú
  • Hĺbka agentického workflowu

    • Google dohnieva v agentickej stabilite — Claude Opus 4.7 je lepšie optimalizovaný pre dlhé autonómne sessiony (4+ hodín) bez driftu a straty zámeru
    • Gemini 3.1 Pro je silný v jednom-volaní multimodálnych úlohách; menej testovaný v rekurzívnych multi-krokových agentických scenároch
  • Refusal rate a bezpečnostné filtre

    • Google modely majú tendenciu k vyššiemu refusal rate pri boundary úlohách (bezpečnostné výskumy, citlivý obsah)
    • v porovnaní s Claude (kde je refusal behavior dobre zdokumentovaný) je správanie Gemini menej predvídateľné v edge case scenároch
  • Regionálna dostupnosť

    • niektoré funkcie (grounding cez Google Search, voice, video output) nie sú k dispozícii vo všetkých regiónoch
    • Vertex AI nasadenie pre EÚ/GDPR prostredia je dostupné, ale konkrétne funkcie sa môžu líšiť podľa regiónu
    • pre heavily regulated prostredia (zdravotníctvo, finančný sektor) treba overiť aktuálnu dostupnosť na Google Cloud konzoli
  • Kreatívne písanie a marketing copy

    • nezávislé testy ukazujú, že Gemini 3.1 Pro produkuje generickejší marketingový obsah — Claude a GPT-5 Turbo sú preferovanejšie pri nuansovanom kreatívnom písaní

8. Záver — pozícia v Q2 2026

Gemini 3.1 Pro je v apríli 2026 dominantný model pre reasoning a multimodálne workloady — ARC-AGI-2 (77,1 %), GPQA Diamond (94,3 %) a Humanity's Last Exam (44,7 %) mu dávajú jasnú prevahu vo vedeckom a analytickom segmente.

Reálna architektúra výberu modelov v Q2 2026:

  • Gemini 3.1 Pro — ak potrebujete video/audio analýzu, multimodálne grounding, vedecký reasoning alebo Google Search integráciu natívne v API
  • Claude Opus 4.7 — ak potrebujete agentickú stabilitu, dlhé autonómne sessiony a najlepší SWE-bench výkon
  • GPT-5 Turbo — ak potrebujete natívnu generáciu obrázkov a audia v jedinom API volaní

Pre väčšinu tímov má zmysel kombinovať modely podľa úlohy, nie vybrať jeden ako univerzálny štandard. Gemini 3.1 Pro Flash-Lite ponúka výrazne nižšiu cenu (8× lacnejší input ako Pro) pri zachovaní 1M kontextového okna — vhodný pre masovú produkciu kde plný reasoning Pro nie je nutný.


Zdroje