Claude Opus 4.6

Claude Opus 4.6 je najvyššia (flagship) verzia modelu Claude od Anthropic, navrhnutá pre dlhé, komplexné a viac-krokové úlohy – najmä agentné workflowy, softvérové inžinierstvo, prácu s veľkými kontextami a „knowledge work" (výskum, dokumenty, prezentácie, tabuľky, analýzy).


1. Čo je na Claude Opus 4.6 podstatné

  • „Long-horizon" práca bez neustáleho doťukávania

    • cieľ je, aby model vydržal riešiť úlohu dlhšie a spoľahlivejšie (plánovanie → vykonanie → kontrola → oprava)

    • vhodné pre zadania typu „urob to end-to-end" (napr. migrácia, refaktor, audit, výskum + výstup)

  • Veľké kontextové okno

    • štandardne 200K tokenov kontext

    • voliteľne 1M tokenov (beta) – hlavne pre prácu s viacerými dokumentmi naraz

  • Veľké výstupy

    • podporuje až 128K output tokenov, takže zvládne vyprodukovať výrazne dlhšie výstupy v jednom ťahu (napr. rozsiahle reporty, špecifikácie, viac-súborové návrhy)
  • Silnejšie agentné schopnosti + nástroje

    • lepšia práca s „tool use" (volania nástrojov, workflowy, multi-step vykonávanie)

    • pribudli API prvky, ktoré smerujú k stabilnejšej „agentnej prevádzke" (napr. compaction, detailnejší streaming)


2. Modely/verzie v ekosystéme Claude (kontext pre Opus)

  • Opus: najvyššia inteligencia, najlepšie pre náročné úlohy, agentov a veľké projekty

  • Sonnet: „stred" – dobrý pomer výkon/cena pre každodenné úlohy

  • Haiku: najrýchlejší a najlacnejší – masové použitie, jednoduchšie úlohy

(V praxi sa často oplatí kombinovať: Haiku/Sonnet na rutinu, Opus na „ťažké jadro" problému.)


3. Technické detaily, ktoré v praxi najviac cítiť

  • API model ID

    • claude-opus-4-6
  • Thinking režimy

    • odporúčaný je adaptive thinking – model si dynamicky rozhoduje, kedy a koľko „premýšľať"

    • priamo sa dá riadiť hĺbka cez parameter effort (vrátane najvyššej úrovne)

  • Compaction (beta)

    • server-side „zhrnutie" staršej časti kontextu

    • cieľ: efektívne dlhšie konverzácie/workflowy bez toho, aby si manuálne summarizoval a prenášal stav

  • Tool streaming (GA)

    • jemnejšie streamovanie udalostí pri používaní nástrojov – praktické pre agentné aplikácie, kde chceš priebežný stav
  • Breaking zmena: prefill

    • Opus 4.6 nepodporuje „seedovanie" nedokončených odpovedí, aby ich model dokončil

    • namiesto toho sa typicky odporúča structured outputs / JSON schema alebo prísne systémové inštrukcie


4. Výkon a benchmarky (high-level obraz)

Z pohľadu „reálneho worku" sa Opus 4.6 profiluje ako model, ktorý:

  • drží kvalitu v dlhých reťazcoch krokov (plánovanie + vykonanie + kontrola)

  • zvláda väčšie codebase / repo workflowy

  • posúva agentné úlohy (napr. terminálové a OS úlohy, multi-agent scenáre, tool-use)

Príklady výsledkov, ktoré sa často citujú pri porovnávaniach:

  • SWE-bench Verified ~ 80.8%

  • Terminal-Bench 2.0 ~ 65.4%

  • OSWorld ~ 72.7%

  • ARC-AGI-2 ~ ~69% (pri vyššom „effort")

  • v „knowledge work" evaloch (napr. tvorba dokumentov/slidov/tabuliek) má byť veľmi konkurencieschopný


5. Dostupnosť

  • Claude (web/app) – použitie v bežnom UI

  • Claude API (Anthropic platform) – cez developer konzolu a SDK

  • Cloud platformy

    • dostupnosť cez partnerské platformy (napr. Google Vertex AI, Microsoft Foundry; často aj AWS ekosystém podľa ponuky regiónov a endpointov)

6. Ceny a praktika nákladov (čo si strážiť)

Pri Opus 4.6 je dôležité, že cena sa líši podľa veľkosti promptu:

  • Input tokeny

    • do 200K tokenov: $5 / MTok

    • nad 200K tokenov: $10 / MTok (long-context premium)

  • Output tokeny

    • do 200K tokenov: $25 / MTok

    • nad 200K tokenov: $37.50 / MTok

Čo ti vie ušetriť peniaze (a zároveň pomôcť stabilite):

  • prompt caching (keď opakovane používaš rovnaké „šablóny"/kontext)

  • Batch API (asynchrónne spracovanie s výraznou zľavou – ak ti nevadí čakať)

  • rozumné nastavenie effort (nepáliť maximum na triviálne kroky)


7. Bezpečnosť a súkromie (praktický pohľad)

Opus 4.6 je stavaný na agentné použitie, a práve preto je dobré myslieť na „prevádzkovú bezpečnosť":

  • Nedávaj agentovi široké práva bez poistiek

    • pri kóde, termináli alebo GUI akciách sa môže prejaviť prílišná iniciatíva (riskantné kroky bez explicitného súhlasu)
  • Preferuj „least privilege" + schvaľovanie krokov

    • whitelists pre nástroje, limity pre príkazy, sandbox prostredie, potvrdenie pred destruktívnymi akciami
  • Data residency / lokalita inferencie

    • dá sa voliť routing (napr. „US-only inference") – býva to užitočné pre compliance, ale má to cenový multiplier
  • Odolnosť voči prompt injection

    • pri agentoch s webom/nástrojmi vždy rátaj s tým, že externý obsah môže obsahovať „návody" ako obísť pravidlá → izoluj inštrukcie, validuj tool inputy, loguj

8. Kedy sa oplatí použiť Opus 4.6 (a kedy nie)

  • Použi Opus 4.6, keď:

    • riešiš veľký projekt (repo, migrácia, refaktor, audit)

    • potrebuješ dlhý kontext (mnoho dokumentov, dlhá história rozhodnutí)

    • chceš agentné workflowy s nástrojmi (vyhľadávanie, analýzy, generovanie výstupov)

  • Zváž Sonnet/Haiku, keď:

    • ide o rutinné úlohy, veľa krátkych requestov, alebo potrebuješ nízku latenciu/cenu

Quick Reference

  • Najdôležitejšie parametre v praxi: model, max_tokens, thinking: { type: "adaptive" }, effort, (pri agentoch) tool streaming

  • Limitné čísla: 200K kontext (štandard), 1M kontext (beta), 128K output

  • Najčastejšie „gotchas": dlhé výstupy → streaming; agentné práva → schvaľovanie; nad 200K input → premium pricing


Zhrnutie

  • Claude Opus 4.6 cieli na autonómnejšiu a spoľahlivejšiu prácu v dlhých, komplexných úlohách (najmä agenti + kód + knowledge work).

  • Kľúčové upgrady sú 1M context (beta), 128K output, a nové API mechaniky pre agentné workflowy (adaptive thinking, effort, compaction).

  • V praxi sa oplatí riešiť cost control (200K hranica, caching/batch) a bezpečný dizajn agentov (least privilege, schvaľovanie krokov).