ChatGPT 5.5

ChatGPT 5.5 (interný názov gpt-5.5, kódové meno Helios) je aprílová iterácia vlajkovej rady GPT-5 od OpenAI, vydaná 22. apríla 2026, šesť týždňov po GPT-5.4. Nejde o veľký skok ako 5.0 → 5.4, ale o cielený post-training a inference-stack rewrite: rovnaký pre-train, výrazne lepšia samplovacia efektivita, nová generácia agentov a prvý oficiálny action world model integrovaný priamo do chat rozhrania.


Čo je nové v GPT-5.5

1. Distilled Reasoning Stack

GPT-5.4 priniesol unified reasoning engine, ale v praxi platili používatelia latenciou — adaptive compute často „premýšľal" aj na triviálnych dotazoch. 5.5 prináša distilled reasoner: malý router model rozhoduje o reasoning hĺbke pred prvým tokenom.

  • Sub-200ms time-to-first-token pre 78 % bežných promptov (5.4: 41 %).
  • Reasoning budget API: vývojár môže explicitne nastaviť max_reasoning_tokens per request — 5.5 dodrží limit alebo vráti incomplete_reasoning flag.
  • Speculative reasoning: model paralelne testuje dve uvažovacie cesty a vyberá kvalitnejšiu (interne nazývané twin-prover).
  • Cached chain-of-thought: opakované sub-úlohy v rámci session (napr. parsing rovnakej štruktúry) zdieľajú reasoning cache → 30–60 % zníženie tokenov pre dlhé agentické runs.

2. World Model (Helios-WM)

Najväčšia funkčná novinka: integrovaný action world model, ktorý simuluje dôsledky navrhovaných akcií skôr, ako ich agent vykoná v reálnom svete.

  • Plan rollouts: pre tool_use calls model interne odsimuluje 3–8 alternatívnych postupov a vyberie ten s najvyššou predikovanou úspešnosťou.
  • Counterfactual debugging: pri chybe agenta vie operatívne ukázať „čo by sa stalo, keby sa rozhodol inak" — užitočné pre red-teaming a postmortem analýzu.
  • Persistent world state: dlhodobí agenti udržiavajú lightweight reprezentáciu prostredia (filesystem, repo state, account balances) namiesto re-fetchovania pri každom kroku.
  • Limity: WM je trénovaný hlavne na softvérových a webových akciách. Pre fyzický svet (robotika, IoT) ho OpenAI explicitne neodporúča — tam doporučujú dedikované modely typu NVIDIA Isaac GR00T.

3. Native Long-Form Audio

GPT-5.4 mal video; 5.5 dokončuje audio modalitu na produkčnej úrovni.

  • Streamované 8-hodinové audio s persistentnou identitou rečníkov, sentimentom a topic segmentáciou.
  • Voice cloning konsenz: generovanie hlasu vyžaduje cryptographicky podpísaný consent token od majiteľa hlasu — nemožno obísť API-only.
  • Real-time dubbing: súbežná translácia + lip-sync (cez video-to-video pipeline z 5.4) v 14 jazykoch vrátane slovenčiny.
  • Music understanding: model rozpoznáva melódie, harmonickú štruktúru a vie generovať notové zápisy alebo MIDI.

4. Agent Marketplace v2

  • Verified Agents Program: OpenAI auditovaní agenti tretích strán s SLA a zodpovednosťou za škodu (max $1000/incident pre Pro plán, $50000 pre Enterprise).
  • Sandboxed execution: každý agent beží vo Firecracker microVM s explicitne povolenými scope-mi (filesystem, network, identity).
  • Revenue sharing: developeri zarábajú 70 % z agent subscriptions cez OpenAI billing.
  • Inter-agent protokol: agenti komunikujú cez podmnožinu MCP (Model Context Protocol) — kompatibilita so Claude a Gemini ekosystémom.

5. Memory v3

Pamäť z 5.4 bola hierarchická; 5.5 pridáva kontrolu a vysvetliteľnosť.

  • Memory inspector: UI v ChatGPT zobrazí každú vec, ktorú si model zapamätal, vrátane zdroja konverzácie a confidence skóre.
  • Topic-scoped memory: používateľ vie zapnúť/vypnúť pamäť per téma (napr. „pamätaj si kód, ale nie osobné info").
  • Forgetting API: programatická požiadavka na vymazanie konkrétnych spomienok podľa GDPR — model potvrdí čo zabudol.

Technické parametre a benchmarky

Benchmark GPT-5.5 GPT-5.4 Claude Opus 4.7 Gemini 3.1 Pro
MMLU-Pro 95,1 % 94,2 % 93,4 % 92,0 %
SWE-Bench Pro 68,7 % 62,4 % 71,2 % 58,9 %
Terminal-Bench 2.0 84,3 % 81,6 % 86,1 % 75,2 %
GPQA Diamond 81,2 % 78,9 % 79,4 % 74,1 %
WebArena (agentic) 74,8 % 68,5 % 70,1 % 63,3 %
Audio-Bench v2 91,4 % 76,2 % 72,8 % 88,1 %
WorldModel-Eval 67,3 %
TTFT median 187 ms 412 ms 240 ms 295 ms

Pozn.: WorldModel-Eval je nový benchmark zavedený OpenAI v apríli 2026, externé scóre zatiaľ chýbajú. Číslo považujte za vendor-reported.


Dostupnosť a cenník

ChatGPT plány

Plán GPT-5.5 prístup World Model Verified Agents Cena
Free ✅ (limitovaný, 25 správ/3 hod) $0
Plus ✅ (basic) ✅ (do 5) $20/mesiac
Pro ✅ (prioritný) ✅ (full) ✅ (neobmedzené) $200/mesiac
Team ✅ (team-shared) $25/osoba/mesiac
Enterprise ✅ (dedikovaný) ✅ (custom WM) ✅ (private marketplace) Individuálne

API prístup

Model Input (1M tokenov) Output (1M tokenov) Reasoning (1M tokenov) Poznámka
gpt-5.5 $2,50 $12,00 $8,00 Plný model + WM
gpt-5.5-mini $0,30 $1,20 $0,80 Bez WM, bez audio
gpt-5.5-nano $0,07 $0,28 Žiadne reasoning

Reasoning tokeny sa účtujú zvlášť — režim transparentnosti predstavený v 5.4 sa stal billing-relevant. Vývojárom OpenAI odporúča nastaviť max_reasoning_tokens v produkcii.

Migrácia z 5.4

  • Drop-in kompatibilný — model: "gpt-5.4"model: "gpt-5.5", žiadne breaking changes v request/response formáte.
  • Persistent agents zo 5.4 sa automaticky migrujú; pamäť je preindexovaná pri prvom použití (~5–30 sekúnd downtime per agent).
  • Tool definitions: OpenAI deprekuje function_call (legacy z GPT-3.5 éry), odstránenie naplánované na 2026-Q4. Použite tools array.

Bezpečnosť a alignment

Kľúčové vylepšenia

  • WM-based safety: world model preverí dôsledky agentickej akcie pred jej vykonaním. Zníženie nepredpokladaných side-effectov o 62 % (interný red-team).
  • Constitutional safe completions: namiesto fixného safety prompt-u model konzultuje verejne publikovanú OpenAI Model Spec v3 (April 2026 revízia).
  • Watermarking 2.0: robustnejší voči re-encodingu a screenshot-and-OCR útokom (zostáva detekovateľný po 4 generáciách re-uploadu).
  • Audit log API: Enterprise zákazníci môžu streamovať všetky tool-calls a ich WM rollouts do vlastného SIEM.

Známe obmedzenia

  • WorldModel je presný hlavne v doménach pokrytých tréningom (web, kód, štandardné API). Nezvyčajné enterprise systémy (legacy ERP, custom internal services) potrebujú calibration runs — niekoľko desiatok manuálne anotovaných príkladov.
  • Distilled reasoner občas podstreluje komplexitu — pre kritické use-cases (medicína, financie, legal) odporúčaná flag force_full_reasoning: true.
  • Voice cloning consent enforcement spolieha na podpisy — nedeterministicky platí pre samples kratšie ako 3 sekundy (technický limit hlasovej extrakcie).

Porovnanie s konkurenciou (apríl 2026)

Vlastnosť GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro Llama 4 Maverick
Reasoning ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐
Kódovanie ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐
Audio ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐
World model ⭐⭐⭐⭐ ⭐⭐⭐ (interný) ⭐⭐⭐
Open-weight
Latencia ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ (self-host)
Cena Stredná Stredná–vysoká Nízka–stredná Nízka (self-host)

Pre koho je GPT-5.5 určený

  • Vývojári s low-latency požiadavkami: chat UI, IDE pluginy, interaktívne tooly — distilled reasoner výrazne zlepší UX oproti 5.4.
  • Agent operátori: WM rollouts znižujú „agent regret" — počet incidentov, kde agent urobil niečo, čo používateľ musel manuálne vrátiť.
  • Multimédia produkcia: real-time dubbing a music understanding otvárajú nové podcast a video workflow.
  • Compliance-heavy odvetvia: memory inspector + audit log API uľahčujú GDPR/HIPAA dokumentáciu.

GPT-5.5 nie je najlepšia voľba ak:

  • Potrebujete najvyšší kódovací výkon — Claude Opus 4.7 stále vedie v SWE-Bench Pro a Terminal-Bench.
  • Robíte on-prem deploy so silnými data residency požiadavkami — Llama 4 Maverick alebo Mistral Medium 3 sú flexibilnejšie.
  • Pracujete s fyzickými robotmi — Helios-WM nie je trénovaný na fyzický svet.

Záver

ChatGPT 5.5 nie je revolúcia ako 5.0, ale kvalitatívne dospelá verzia GPT-5 rodiny: rýchlejšia, predvídateľnejšia, lacnejšia v API a s prvým kreditibilným world modelom v hlavnom prúde LLM. Najväčší dopad bude pravdepodobne v agentickom segmente — Helios-WM mení economics autonómnych agentov tým, že znižuje retry cycles a katastrofické zlyhania.

Tip pre upgrade: Z 5.4 na 5.5 prejdite v dvoch krokoch — najprv 5.5-mini pre non-critical workloady (úspora ~30 % nákladov), potom 5.5 full pre flagship use-cases. Sledujte incomplete_reasoning flag — ak sa objavuje často, zvýšte max_reasoning_tokens namiesto návratu na 5.4.