Gemini 3.5 Flash: agentický frontier model od Google
Gemini 3.5 Flash je nový frontier model od Google DeepMind, predstavený 19. mája 2026 na Google I/O. Google ho cieli primárne na agentické workflow a coding, nie na klasickú chat-interakciu — slogan z keynote: "the next AI wave is agents, not chatbots". Model je rýchlejší, lacnejší a vo viacerých benchmarkoch silnejší než Gemini 3.1 Pro, pričom vo výrazne väčšom modeli Gemini 3.5 Pro (interné použitie, GA jún 2026) Google sľubuje ešte vyšší skok.
1. Benchmarky — kde poráža Gemini 3.1 Pro
Google v keynote ukázal porovnanie s vlastným väčším modelom predchádzajúcej generácie:
- Terminal-Bench 2.1: 76.2% (agentické multi-step CLI úlohy)
- GDPval-AA: 1656 Elo (general-purpose value benchmark)
- MCP Atlas: 83.6% (multi-step tool-use cez MCP protokol)
- CharXiv Reasoning: 84.2% (multimodal — papers + grafy)
- Output throughput: 4× rýchlejší vs ostatné frontier modely (Claude Opus 4.7, GPT-5 Turbo)
Pre porovnanie — Gemini 3.1 Pro dosahuje na Terminal-Bench 2.1 zhruba 71%, MCP Atlas ~78%. 3.5 Flash je teda menší/lacnejší model, ktorý outperforms väčší starší flagship.
2. Agentický focus
Google neskrýva, že Flash je optimalizovaný pre long-horizon agentické úlohy:
- Autonomous coding pipelines — model dokáže sám driveovať PR od issue cez implementáciu po review
- Research projects — multi-step web search → synthesis → write-up bez zásahu človeka
- OS-from-scratch demo — keynote ukázal agent, ktorý cez 30+ tool calls postavil minimal OS v Rust
Pod kapotou: agresívne RLHF na multi-step tool-use a error recovery, plus natívna integrácia MCP (Model Context Protocol) — model je trénovaný na MCP server discovery a dynamický tool routing.
3. Dostupnosť
Gemini 3.5 Flash je GA od dňa launchu cez:
- Gemini API (
gemini-3-5-flash) — Google AI Studio + Vertex AI - Antigravity — Google IDE, vstavaný agent mód
- Gemini Enterprise — Google Workspace integrácia
- Gemini app + Search AI mode — consumer-facing
- GitHub Copilot — GA cez
gh copilotv ten istý deň - Cursor, Windsurf, Cline — typicky do 24-48h po Google GA
4. Cena — drahší než 3.0 Flash
Google priznáva, že 3.5 Flash je drahší než predchodca:
- 3.0 Flash: $0.075 / 1M input, $0.30 / 1M output
- 3.5 Flash: $0.30 / 1M input, $2.50 / 1M output (4× / 8×)
Logika: Google očakáva, že agentický throughput (úloha vyriešená za sekundy nie minúty) vyrovná vyššiu cenu — a plánuje "use it for everything" namiesto držania samostatného lacnejšieho tieru pre triviálne úlohy.
5. Čo s tým reálne urobíš
Praktické use-cases, kde 3.5 Flash dáva zmysel dnes:
- GitHub Copilot agent mode — multi-file PR cez jeden prompt
- MCP-driven workflows — namiesto Claude Opus na MCP routing (lacnejšie + rýchlejšie)
- Long-horizon Codex/Aider-style úlohy — model nestratí kontext po 50+ tool calls
- Náhrada za Claude Opus 4.7 / GPT-5 Turbo v agentických pipeline-och, ak ťa primárne zaujíma latency
Naopak nevyplatí sa používať ho na:
- Krátke jednorázové prompty (cena vyššia než 3.0 Flash, kvalita nepotrebná)
- Striktne reasoning úlohy bez tools (GPT-5 Turbo + Claude Opus 4.7 zostávajú silnejšie)
6. Pozadie — Gemini 3.5 Pro odložené
Pôvodne sa očakával launch 3.5 Pro v máji 2026. Google interne potvrdil, že 3.5 Pro je už v internom použití, ale GA bola posunutá na jún 2026. Dôvod nepriznaný oficiálne — pravdepodobne (a) eval/safety review, (b) capacity provisioning (TPU v6 supply), (c) konkurenčné timing voči Anthropic Claude Opus 4.8 očakávanému koncom mája.
Zatiaľ je 3.5 Flash defaultný Gemini frontier model — ak v API zadáš gemini-latest, dostaneš 3.5 Flash.
7. Volanie cez API
Model je v API pod ID gemini-3-5-flash (alebo gemini-latest):
from google import genai
client = genai.Client(api_key="GEMINI_API_KEY")
resp = client.models.generate_content(
model="gemini-3-5-flash",
contents="Naplánuj kroky na refaktor tohto modulu a navrhni testy.",
)
print(resp.text)
Pre agentické workflow sa typicky kombinuje s MCP (Model Context Protocol) na dynamický tool routing — model je naň priamo trénovaný.
8. Súvislosti
- Patrí medzi reasoning modely s agentickým zameraním.
- Väčší súrodenec je Gemini 3 Pro; pre obrázky rodina používa Nano Banana 2.
- Hlavní konkurenti v agentickom kódovaní: Claude Opus 4.8 a GPT-5.3-Codex.
- Agentický throughput silne závisí od veľkosti kontextového okna a RLHF na multi-step tool-use.
Pre koho je to relevantné
- Developeri s agentic workflow — okamžite oplatí prepnúť MCP/tool-use endpoints
- Cursor/Windsurf users — 4× rýchlosť pre file-by-file generation
- Anyone running Claude Opus 4.7 batch jobs — porovnaj cenu/throughput, 3.5 Flash môže byť výhodnejšia
- Multimodálne data pipelines — 84.2% CharXiv = silný na PDF/papers/dashboards
Sledovať: Gemini 3.5 Pro GA jún 2026, a Anthropic odpoveď (Claude Opus 4.8 / Sonnet 4.7) očakávaná do konca mája.