ChatGPT 5.5
ChatGPT 5.5 (interný názov gpt-5.5, kódové meno Helios) je aprílová iterácia vlajkovej rady GPT-5 od OpenAI, vydaná 22. apríla 2026, šesť týždňov po GPT-5.4. Nejde o veľký skok ako 5.0 → 5.4, ale o cielený post-training a inference-stack rewrite: rovnaký pre-train, výrazne lepšia samplovacia efektivita, nová generácia agentov a prvý oficiálny action world model integrovaný priamo do chat rozhrania.
Čo je nové v GPT-5.5
1. Distilled Reasoning Stack
GPT-5.4 priniesol unified reasoning engine, ale v praxi platili používatelia latenciou — adaptive compute často „premýšľal" aj na triviálnych dotazoch. 5.5 prináša distilled reasoner: malý router model rozhoduje o reasoning hĺbke pred prvým tokenom.
- Sub-200ms time-to-first-token pre 78 % bežných promptov (5.4: 41 %).
- Reasoning budget API: vývojár môže explicitne nastaviť
max_reasoning_tokensper request — 5.5 dodrží limit alebo vrátiincomplete_reasoningflag. - Speculative reasoning: model paralelne testuje dve uvažovacie cesty a vyberá kvalitnejšiu (interne nazývané twin-prover).
- Cached chain-of-thought: opakované sub-úlohy v rámci session (napr. parsing rovnakej štruktúry) zdieľajú reasoning cache → 30–60 % zníženie tokenov pre dlhé agentické runs.
2. World Model (Helios-WM)
Najväčšia funkčná novinka: integrovaný action world model, ktorý simuluje dôsledky navrhovaných akcií skôr, ako ich agent vykoná v reálnom svete.
- Plan rollouts: pre
tool_usecalls model interne odsimuluje 3–8 alternatívnych postupov a vyberie ten s najvyššou predikovanou úspešnosťou. - Counterfactual debugging: pri chybe agenta vie operatívne ukázať „čo by sa stalo, keby sa rozhodol inak" — užitočné pre red-teaming a postmortem analýzu.
- Persistent world state: dlhodobí agenti udržiavajú lightweight reprezentáciu prostredia (filesystem, repo state, account balances) namiesto re-fetchovania pri každom kroku.
- Limity: WM je trénovaný hlavne na softvérových a webových akciách. Pre fyzický svet (robotika, IoT) ho OpenAI explicitne neodporúča — tam doporučujú dedikované modely typu NVIDIA Isaac GR00T.
3. Native Long-Form Audio
GPT-5.4 mal video; 5.5 dokončuje audio modalitu na produkčnej úrovni.
- Streamované 8-hodinové audio s persistentnou identitou rečníkov, sentimentom a topic segmentáciou.
- Voice cloning konsenz: generovanie hlasu vyžaduje cryptographicky podpísaný consent token od majiteľa hlasu — nemožno obísť API-only.
- Real-time dubbing: súbežná translácia + lip-sync (cez video-to-video pipeline z 5.4) v 14 jazykoch vrátane slovenčiny.
- Music understanding: model rozpoznáva melódie, harmonickú štruktúru a vie generovať notové zápisy alebo MIDI.
4. Agent Marketplace v2
- Verified Agents Program: OpenAI auditovaní agenti tretích strán s SLA a zodpovednosťou za škodu (max $1000/incident pre Pro plán, $50000 pre Enterprise).
- Sandboxed execution: každý agent beží vo Firecracker microVM s explicitne povolenými scope-mi (filesystem, network, identity).
- Revenue sharing: developeri zarábajú 70 % z agent subscriptions cez OpenAI billing.
- Inter-agent protokol: agenti komunikujú cez podmnožinu MCP (Model Context Protocol) — kompatibilita so Claude a Gemini ekosystémom.
5. Memory v3
Pamäť z 5.4 bola hierarchická; 5.5 pridáva kontrolu a vysvetliteľnosť.
- Memory inspector: UI v ChatGPT zobrazí každú vec, ktorú si model zapamätal, vrátane zdroja konverzácie a confidence skóre.
- Topic-scoped memory: používateľ vie zapnúť/vypnúť pamäť per téma (napr. „pamätaj si kód, ale nie osobné info").
- Forgetting API: programatická požiadavka na vymazanie konkrétnych spomienok podľa GDPR — model potvrdí čo zabudol.
Technické parametre a benchmarky
| Benchmark | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| MMLU-Pro | 95,1 % | 94,2 % | 93,4 % | 92,0 % |
| SWE-Bench Pro | 68,7 % | 62,4 % | 71,2 % | 58,9 % |
| Terminal-Bench 2.0 | 84,3 % | 81,6 % | 86,1 % | 75,2 % |
| GPQA Diamond | 81,2 % | 78,9 % | 79,4 % | 74,1 % |
| WebArena (agentic) | 74,8 % | 68,5 % | 70,1 % | 63,3 % |
| Audio-Bench v2 | 91,4 % | 76,2 % | 72,8 % | 88,1 % |
| WorldModel-Eval | 67,3 % | — | — | — |
| TTFT median | 187 ms | 412 ms | 240 ms | 295 ms |
Pozn.: WorldModel-Eval je nový benchmark zavedený OpenAI v apríli 2026, externé scóre zatiaľ chýbajú. Číslo považujte za vendor-reported.
Dostupnosť a cenník
ChatGPT plány
| Plán | GPT-5.5 prístup | World Model | Verified Agents | Cena |
|---|---|---|---|---|
| Free | ✅ (limitovaný, 25 správ/3 hod) | ❌ | ❌ | $0 |
| Plus | ✅ | ✅ (basic) | ✅ (do 5) | $20/mesiac |
| Pro | ✅ (prioritný) | ✅ (full) | ✅ (neobmedzené) | $200/mesiac |
| Team | ✅ | ✅ | ✅ (team-shared) | $25/osoba/mesiac |
| Enterprise | ✅ (dedikovaný) | ✅ (custom WM) | ✅ (private marketplace) | Individuálne |
API prístup
| Model | Input (1M tokenov) | Output (1M tokenov) | Reasoning (1M tokenov) | Poznámka |
|---|---|---|---|---|
| gpt-5.5 | $2,50 | $12,00 | $8,00 | Plný model + WM |
| gpt-5.5-mini | $0,30 | $1,20 | $0,80 | Bez WM, bez audio |
| gpt-5.5-nano | $0,07 | $0,28 | — | Žiadne reasoning |
Reasoning tokeny sa účtujú zvlášť — režim transparentnosti predstavený v 5.4 sa stal billing-relevant. Vývojárom OpenAI odporúča nastaviť
max_reasoning_tokensv produkcii.
Migrácia z 5.4
- Drop-in kompatibilný —
model: "gpt-5.4"→model: "gpt-5.5", žiadne breaking changes v request/response formáte. - Persistent agents zo 5.4 sa automaticky migrujú; pamäť je preindexovaná pri prvom použití (~5–30 sekúnd downtime per agent).
- Tool definitions: OpenAI deprekuje
function_call(legacy z GPT-3.5 éry), odstránenie naplánované na 2026-Q4. Použitetoolsarray.
Bezpečnosť a alignment
Kľúčové vylepšenia
- WM-based safety: world model preverí dôsledky agentickej akcie pred jej vykonaním. Zníženie nepredpokladaných side-effectov o 62 % (interný red-team).
- Constitutional safe completions: namiesto fixného safety prompt-u model konzultuje verejne publikovanú OpenAI Model Spec v3 (April 2026 revízia).
- Watermarking 2.0: robustnejší voči re-encodingu a screenshot-and-OCR útokom (zostáva detekovateľný po 4 generáciách re-uploadu).
- Audit log API: Enterprise zákazníci môžu streamovať všetky tool-calls a ich WM rollouts do vlastného SIEM.
Známe obmedzenia
- WorldModel je presný hlavne v doménach pokrytých tréningom (web, kód, štandardné API). Nezvyčajné enterprise systémy (legacy ERP, custom internal services) potrebujú calibration runs — niekoľko desiatok manuálne anotovaných príkladov.
- Distilled reasoner občas podstreluje komplexitu — pre kritické use-cases (medicína, financie, legal) odporúčaná flag
force_full_reasoning: true. - Voice cloning consent enforcement spolieha na podpisy — nedeterministicky platí pre samples kratšie ako 3 sekundy (technický limit hlasovej extrakcie).
Porovnanie s konkurenciou (apríl 2026)
| Vlastnosť | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro | Llama 4 Maverick |
|---|---|---|---|---|
| Reasoning | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Kódovanie | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Audio | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐ |
| World model | ⭐⭐⭐⭐ | ⭐⭐⭐ (interný) | ⭐⭐⭐ | ❌ |
| Open-weight | ❌ | ❌ | ❌ | ✅ |
| Latencia | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ (self-host) |
| Cena | Stredná | Stredná–vysoká | Nízka–stredná | Nízka (self-host) |
Pre koho je GPT-5.5 určený
- Vývojári s low-latency požiadavkami: chat UI, IDE pluginy, interaktívne tooly — distilled reasoner výrazne zlepší UX oproti 5.4.
- Agent operátori: WM rollouts znižujú „agent regret" — počet incidentov, kde agent urobil niečo, čo používateľ musel manuálne vrátiť.
- Multimédia produkcia: real-time dubbing a music understanding otvárajú nové podcast a video workflow.
- Compliance-heavy odvetvia: memory inspector + audit log API uľahčujú GDPR/HIPAA dokumentáciu.
GPT-5.5 nie je najlepšia voľba ak:
- Potrebujete najvyšší kódovací výkon — Claude Opus 4.7 stále vedie v SWE-Bench Pro a Terminal-Bench.
- Robíte on-prem deploy so silnými data residency požiadavkami — Llama 4 Maverick alebo Mistral Medium 3 sú flexibilnejšie.
- Pracujete s fyzickými robotmi — Helios-WM nie je trénovaný na fyzický svet.
Záver
ChatGPT 5.5 nie je revolúcia ako 5.0, ale kvalitatívne dospelá verzia GPT-5 rodiny: rýchlejšia, predvídateľnejšia, lacnejšia v API a s prvým kreditibilným world modelom v hlavnom prúde LLM. Najväčší dopad bude pravdepodobne v agentickom segmente — Helios-WM mení economics autonómnych agentov tým, že znižuje retry cycles a katastrofické zlyhania.
Tip pre upgrade: Z 5.4 na 5.5 prejdite v dvoch krokoch — najprv 5.5-mini pre non-critical workloady (úspora ~30 % nákladov), potom 5.5 full pre flagship use-cases. Sledujte
incomplete_reasoningflag — ak sa objavuje často, zvýštemax_reasoning_tokensnamiesto návratu na 5.4.