Gemini 3.5 Flash: agentický frontier model od Google

Gemini 3.5 Flash je nový frontier model od Google DeepMind, predstavený 19. mája 2026 na Google I/O. Google ho cieli primárne na agentické workflow a coding, nie na klasickú chat-interakciu — slogan z keynote: "the next AI wave is agents, not chatbots". Model je rýchlejší, lacnejší a vo viacerých benchmarkoch silnejší než Gemini 3.1 Pro, pričom vo výrazne väčšom modeli Gemini 3.5 Pro (interné použitie, GA jún 2026) Google sľubuje ešte vyšší skok.


1. Benchmarky — kde poráža Gemini 3.1 Pro

Google v keynote ukázal porovnanie s vlastným väčším modelom predchádzajúcej generácie:

  • Terminal-Bench 2.1: 76.2% (agentické multi-step CLI úlohy)
  • GDPval-AA: 1656 Elo (general-purpose value benchmark)
  • MCP Atlas: 83.6% (multi-step tool-use cez MCP protokol)
  • CharXiv Reasoning: 84.2% (multimodal — papers + grafy)
  • Output throughput: 4× rýchlejší vs ostatné frontier modely (Claude Opus 4.7, GPT-5 Turbo)

Pre porovnanie — Gemini 3.1 Pro dosahuje na Terminal-Bench 2.1 zhruba 71%, MCP Atlas ~78%. 3.5 Flash je teda menší/lacnejší model, ktorý outperforms väčší starší flagship.


2. Agentický focus

Google neskrýva, že Flash je optimalizovaný pre long-horizon agentické úlohy:

  • Autonomous coding pipelines — model dokáže sám driveovať PR od issue cez implementáciu po review
  • Research projects — multi-step web search → synthesis → write-up bez zásahu človeka
  • OS-from-scratch demo — keynote ukázal agent, ktorý cez 30+ tool calls postavil minimal OS v Rust

Pod kapotou: agresívne RLHF na multi-step tool-use a error recovery, plus natívna integrácia MCP (Model Context Protocol) — model je trénovaný na MCP server discovery a dynamický tool routing.


3. Dostupnosť

Gemini 3.5 Flash je GA od dňa launchu cez:

  • Gemini API (gemini-3-5-flash) — Google AI Studio + Vertex AI
  • Antigravity — Google IDE, vstavaný agent mód
  • Gemini Enterprise — Google Workspace integrácia
  • Gemini app + Search AI mode — consumer-facing
  • GitHub Copilot — GA cez gh copilot v ten istý deň
  • Cursor, Windsurf, Cline — typicky do 24-48h po Google GA

4. Cena — drahší než 3.0 Flash

Google priznáva, že 3.5 Flash je drahší než predchodca:

  • 3.0 Flash: $0.075 / 1M input, $0.30 / 1M output
  • 3.5 Flash: $0.30 / 1M input, $2.50 / 1M output (4× / 8×)

Logika: Google očakáva, že agentický throughput (úloha vyriešená za sekundy nie minúty) vyrovná vyššiu cenu — a plánuje "use it for everything" namiesto držania samostatného lacnejšieho tieru pre triviálne úlohy.


5. Čo s tým reálne urobíš

Praktické use-cases, kde 3.5 Flash dáva zmysel dnes:

  • GitHub Copilot agent mode — multi-file PR cez jeden prompt
  • MCP-driven workflows — namiesto Claude Opus na MCP routing (lacnejšie + rýchlejšie)
  • Long-horizon Codex/Aider-style úlohy — model nestratí kontext po 50+ tool calls
  • Náhrada za Claude Opus 4.7 / GPT-5 Turbo v agentických pipeline-och, ak ťa primárne zaujíma latency

Naopak nevyplatí sa používať ho na:

  • Krátke jednorázové prompty (cena vyššia než 3.0 Flash, kvalita nepotrebná)
  • Striktne reasoning úlohy bez tools (GPT-5 Turbo + Claude Opus 4.7 zostávajú silnejšie)

6. Pozadie — Gemini 3.5 Pro odložené

Pôvodne sa očakával launch 3.5 Pro v máji 2026. Google interne potvrdil, že 3.5 Pro je už v internom použití, ale GA bola posunutá na jún 2026. Dôvod nepriznaný oficiálne — pravdepodobne (a) eval/safety review, (b) capacity provisioning (TPU v6 supply), (c) konkurenčné timing voči Anthropic Claude Opus 4.8 očakávanému koncom mája.

Zatiaľ je 3.5 Flash defaultný Gemini frontier model — ak v API zadáš gemini-latest, dostaneš 3.5 Flash.


7. Volanie cez API

Model je v API pod ID gemini-3-5-flash (alebo gemini-latest):

from google import genai

client = genai.Client(api_key="GEMINI_API_KEY")
resp = client.models.generate_content(
    model="gemini-3-5-flash",
    contents="Naplánuj kroky na refaktor tohto modulu a navrhni testy.",
)
print(resp.text)

Pre agentické workflow sa typicky kombinuje s MCP (Model Context Protocol) na dynamický tool routing — model je naň priamo trénovaný.


8. Súvislosti


Pre koho je to relevantné

  • Developeri s agentic workflow — okamžite oplatí prepnúť MCP/tool-use endpoints
  • Cursor/Windsurf users — 4× rýchlosť pre file-by-file generation
  • Anyone running Claude Opus 4.7 batch jobs — porovnaj cenu/throughput, 3.5 Flash môže byť výhodnejšia
  • Multimodálne data pipelines — 84.2% CharXiv = silný na PDF/papers/dashboards

Sledovať: Gemini 3.5 Pro GA jún 2026, a Anthropic odpoveď (Claude Opus 4.8 / Sonnet 4.7) očakávaná do konca mája.