Claude Opus 4.6

Claude Opus 4.6 je najvyššia (flagship) verzia modelu Claude od Anthropic, navrhnutá pre dlhé, komplexné a viac-krokové úlohy – najmä agentné workflowy, softvérové inžinierstvo, prácu s veľkými kontextami a „knowledge work" (výskum, dokumenty, prezentácie, tabuľky, analýzy).

1. Čo je na Claude Opus 4.6 podstatné

„Long-horizon" práca bez neustáleho doťukávania
- cieľ je, aby model vydržal riešiť úlohu dlhšie a spoľahlivejšie (plánovanie → vykonanie → kontrola → oprava)
- vhodné pre zadania typu „urob to end-to-end" (napr. migrácia, refaktor, audit, výskum + výstup)
Veľké kontextové okno
- štandardne 200K tokenov kontext
- voliteľne 1M tokenov (beta) – hlavne pre prácu s viacerými dokumentmi naraz
Veľké výstupy
- podporuje až 128K output tokenov, takže zvládne vyprodukovať výrazne dlhšie výstupy v jednom ťahu (napr. rozsiahle reporty, špecifikácie, viac-súborové návrhy)
Silnejšie agentné schopnosti + nástroje
- lepšia práca s „tool use" (volania nástrojov, workflowy, multi-step vykonávanie)
- pribudli API prvky, ktoré smerujú k stabilnejšej „agentnej prevádzke" (napr. compaction, detailnejší streaming)

2. Modely/verzie v ekosystéme Claude (kontext pre Opus)

Opus: najvyššia inteligencia, najlepšie pre náročné úlohy, agentov a veľké projekty
Sonnet: „stred" – dobrý pomer výkon/cena pre každodenné úlohy
Haiku: najrýchlejší a najlacnejší – masové použitie, jednoduchšie úlohy

(V praxi sa často oplatí kombinovať: Haiku/Sonnet na rutinu, Opus na „ťažké jadro" problému.)

3. Technické detaily, ktoré v praxi najviac cítiť

API model ID
- claude-opus-4-6
Thinking režimy
- odporúčaný je adaptive thinking – model si dynamicky rozhoduje, kedy a koľko „premýšľať"
- priamo sa dá riadiť hĺbka cez parameter effort (vrátane najvyššej úrovne)
Compaction (beta)
- server-side „zhrnutie" staršej časti kontextu
- cieľ: efektívne dlhšie konverzácie/workflowy bez toho, aby si manuálne summarizoval a prenášal stav
Tool streaming (GA)
- jemnejšie streamovanie udalostí pri používaní nástrojov – praktické pre agentné aplikácie, kde chceš priebežný stav
Breaking zmena: prefill
- Opus 4.6 nepodporuje „seedovanie" nedokončených odpovedí, aby ich model dokončil
- namiesto toho sa typicky odporúča structured outputs / JSON schema alebo prísne systémové inštrukcie

4. Výkon a benchmarky (high-level obraz)

Z pohľadu „reálneho worku" sa Opus 4.6 profiluje ako model, ktorý:

drží kvalitu v dlhých reťazcoch krokov (plánovanie + vykonanie + kontrola)
zvláda väčšie codebase / repo workflowy
posúva agentné úlohy (napr. terminálové a OS úlohy, multi-agent scenáre, tool-use)

Príklady výsledkov, ktoré sa často citujú pri porovnávaniach:

SWE-bench Verified ~ 80.8%
Terminal-Bench 2.0 ~ 65.4%
OSWorld ~ 72.7%
ARC-AGI-2 ~ ~69% (pri vyššom „effort")
v „knowledge work" evaloch (napr. tvorba dokumentov/slidov/tabuliek) má byť veľmi konkurencieschopný

5. Dostupnosť

Claude (web/app) – použitie v bežnom UI
Claude API (Anthropic platform) – cez developer konzolu a SDK
Cloud platformy
- dostupnosť cez partnerské platformy (napr. Google Vertex AI, Microsoft Foundry; často aj AWS ekosystém podľa ponuky regiónov a endpointov)

6. Ceny a praktika nákladov (čo si strážiť)

Pri Opus 4.6 je dôležité, že cena sa líši podľa veľkosti promptu:

Input tokeny
- do 200K tokenov: $5 / MTok
- nad 200K tokenov: $10 / MTok (long-context premium)
Output tokeny
- do 200K tokenov: $25 / MTok
- nad 200K tokenov: $37.50 / MTok

Čo ti vie ušetriť peniaze (a zároveň pomôcť stabilite):

prompt caching (keď opakovane používaš rovnaké „šablóny"/kontext)
Batch API (asynchrónne spracovanie s výraznou zľavou – ak ti nevadí čakať)
rozumné nastavenie effort (nepáliť maximum na triviálne kroky)

7. Bezpečnosť a súkromie (praktický pohľad)

Opus 4.6 je stavaný na agentné použitie, a práve preto je dobré myslieť na „prevádzkovú bezpečnosť":

Nedávaj agentovi široké práva bez poistiek
- pri kóde, termináli alebo GUI akciách sa môže prejaviť prílišná iniciatíva (riskantné kroky bez explicitného súhlasu)
Preferuj „least privilege" + schvaľovanie krokov
- whitelists pre nástroje, limity pre príkazy, sandbox prostredie, potvrdenie pred destruktívnymi akciami
Data residency / lokalita inferencie
- dá sa voliť routing (napr. „US-only inference") – býva to užitočné pre compliance, ale má to cenový multiplier
Odolnosť voči prompt injection
- pri agentoch s webom/nástrojmi vždy rátaj s tým, že externý obsah môže obsahovať „návody" ako obísť pravidlá → izoluj inštrukcie, validuj tool inputy, loguj

8. Kedy sa oplatí použiť Opus 4.6 (a kedy nie)

Použi Opus 4.6, keď:
- riešiš veľký projekt (repo, migrácia, refaktor, audit)
- potrebuješ dlhý kontext (mnoho dokumentov, dlhá história rozhodnutí)
- chceš agentné workflowy s nástrojmi (vyhľadávanie, analýzy, generovanie výstupov)
Zváž Sonnet/Haiku, keď:
- ide o rutinné úlohy, veľa krátkych requestov, alebo potrebuješ nízku latenciu/cenu

Quick Reference

Najdôležitejšie parametre v praxi: model, max_tokens, thinking: { type: "adaptive" }, effort, (pri agentoch) tool streaming
Limitné čísla: 200K kontext (štandard), 1M kontext (beta), 128K output
Najčastejšie „gotchas": dlhé výstupy → streaming; agentné práva → schvaľovanie; nad 200K input → premium pricing

Zhrnutie

Claude Opus 4.6 cieli na autonómnejšiu a spoľahlivejšiu prácu v dlhých, komplexných úlohách (najmä agenti + kód + knowledge work).
Kľúčové upgrady sú 1M context (beta), 128K output, a nové API mechaniky pre agentné workflowy (adaptive thinking, effort, compaction).
V praxi sa oplatí riešiť cost control (200K hranica, caching/batch) a bezpečný dizajn agentov (least privilege, schvaľovanie krokov).