Claude Opus 4.7

Claude Opus 4.7 je najnovšia verzia flagship modelu Claude od Anthropic, vydaná v marci/apríli 2026. Pokračuje v línii Opus 4.6 (február 2026), ale prináša niekoľko zásadných posunov pre agentné workloady, dlhý kontext a softvérové inžinierstvo ako disciplínu.

Tento článok je kompaktný technický prehľad — čo je nové, kde má zmysel ho použiť a kde naopak nie.


1. Čo je hlavná zmena oproti Opus 4.6

  • 1M tokens context window — natívne, nie beta

    • 4.6 mal 1M ako beta feature; v 4.7 je default pre všetky API tier-y bez dodatočného flagu
    • model si v rámci 1M okna drží konzistenciu výrazne lepšie (menej "lost in the middle" efektu) — interné Anthropic benchmarky uvádzajú ~92% needle-in-haystack accuracy aj na pozíciách 700K+ tokenov
  • Agentic prevádzka stabilnejšia

    • cieľ: agent dokáže bežať hodiny bez "drift-u" alebo straty zámeru
    • lepšia self-correction — keď model spraví chybu (napr. zlý tool call), častejšie ju sám detekuje a opraví v ďalšom kroku
    • výrazne lepšie plánovanie pred akciou — model implicitne robí "todo decompositon" pre komplexné zadania
  • SWE-bench Verified ~84%

    • 4.6 dosiahol ~80.8%, 4.7 zlepšil na circa 84% (konkrétne číslo Anthropic uvádza v release notes)
    • lepšia práca s viac-súborovými refaktormi a test-driven scenariami
  • Lepšie reasoning v dlhých reťazcoch

    • "extended thinking" mode (introduced v Sonnet 4.5/Opus 4.5) je v 4.7 efektívnejší — model spotrebuje menej thinking tokenov na rovnaký výsledok, alebo dosahuje lepší výsledok s rovnakým budgetom
  • Memory tool integration

    • podpora persistent memory cez Anthropic File System / Memory tool (introduced v Sonnet 4.6)
    • agent si môže ukladať poznatky medzi sessions bez external infrastructure

2. Pozícia v Claude rodine (apríl 2026)

  • Opus 4.7 — flagship; agentic + dlhý kontext + náročný coding
  • Opus 4.6 — predchodca, stále podporovaný (deprecation v H2 2026 pravdepodobné)
  • Sonnet 4.6 — najlepší pomer výkon/cena; pre väčšinu úloh dostatočne silný
  • Haiku 4.5 — rýchly a lacný; rutina, klasifikácia, RAG retrieval, masová prevádzka
  • Mythos Preview — výhradne pre Project Glasswing partnerov, focus na cybersec; nie je verejne dostupný

V praxi sa typicky kombinuje: Haiku/Sonnet na rutinu, Opus na "ťažké jadro" problému. Veľa devov používa Opus 4.7 ako orchestrator a delegujte sub-úlohy na Sonnet.


3. Technické detaily, ktoré v praxi cítiť

  • API model ID

    • claude-opus-4-7 (latest stable)
    • claude-opus-4-7-20260310 (datum-pinned variant — odporúčané pre produkciu)
  • Fast mode (1M context)

    • variant claude-opus-4-6 (predchodca) podporoval fast mode — rýchlejší tokens-per-second za cenu drobnej kvality
    • Opus 4.7 fast mode neexistuje (zatiaľ) — Anthropic prioritizoval kvalitu nad rýchlosťou v tomto release
  • Token economics (rovnaké tier-y ako Opus 4.6)

    • input do 200K: $5 / 1M tokens
    • input nad 200K (long-context premium): $10 / 1M tokens
    • output do 200K: $25 / 1M tokens
    • output nad 200K: $37.50 / 1M tokens
    • cache hit: ~10× lacnejšie než input
    • batching API: 50% zľava — ideálne pre offline workloads
  • Maximum output

    • max_tokens až 128K (rovnako ako Opus 4.6)
    • v praxi pre väčšinu úloh stačí 16K–32K — prebytočný max_tokens len zvyšuje latency cap
  • Latency

    • typická first-token latency: 2–4s pre krátke prompty
    • streaming throughput: 60–90 tokens/sec
    • extended thinking: pridá 10–60s podľa veľkosti budget-u

4. Kde Opus 4.7 najviac vyniká

  • Multi-súborový refaktor v real-world repozitári

    • cross-file dependencies, preserving public API, migration zmien postupne
    • 4.7 si lepšie pamätá konvencie projektu naprieč súbormi
  • Agentic prevádzka 4+ hodín

    • autonómne dokončenie veľkej task-list (build, test, deploy, review) bez human-in-the-loop
    • stabilnejší než 4.6 v reactive scenároch (obnova z chýb)
  • Hlboká analýza dokumentov

    • 1M context = celý codebase + dokumentácia + tickets v jednom prompte
    • lepšia cross-document syntéza
  • Long-form writing

    • články, white papery, knihy — model udrží konzistentný hlas a zámer
  • Reasoning-heavy úlohy

    • matematika, dôkazy, SAT solving — extended thinking + 4.7's improved reasoning robí značný rozdiel

5. Kde Opus 4.7 NIE je správna voľba

  • High-throughput klasifikácia — Haiku je 20× lacnejší a pre triviálne úlohy rovnako dobrý
  • Real-time chat — latency 2–4s do prvého tokena je príliš pre mnohé UI scenáre; Sonnet alebo Haiku majú nižšiu latency
  • Image/video generation — Opus 4.7 nie je generative model; pre obrázky použite Imagen 4, DALL·E 3 / Firefly, Stable Diffusion 3.5
  • Massively parallel tooling — open-source modely (Llama 3.x, Qwen3) môžu byť lacnejšie ak ich vlastníte
  • Air-gapped environments — Anthropic nedistribuuje weights; pre on-prem MUSÍTE použiť open-source

6. Migrácia z Opus 4.6

Najčastejšie scenáre:

  • Rovnaký kód, len bump model ID — funguje vo väčšine prípadov bez zmeny
  • Cache invalidation — prompt cache je per-model, takže prvé requesty po zmene budú drahšie (žiadny cache hit)
  • Extended thinking budget tuning — 4.7 efektívnejšie využíva thinking tokens; môžete znížiť budget o 20–30% a získať rovnaký výsledok lacnejšie
  • System prompt review — niektoré "hacks" pre 4.6 (napr. explicit "think step by step") sú v 4.7 redundantné a môžu zhoršiť výsledok
# Príklad migrácie v Python SDK
import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",   # bolo: claude-opus-4-6
    max_tokens=4096,
    thinking={"type": "enabled", "budget_tokens": 8000},  # bolo 12000 v 4.6
    messages=[{"role": "user", "content": "Refactor this codebase..."}]
)

7. Ako sa porovnáva s konkurenciou (apríl 2026)

Schopnosť Opus 4.7 GPT-5 Turbo Gemini 3 Pro DeepSeek V4
SWE-bench Verified ~84% ~78% ~72% ~70%
Context window 1M 256K 2M 256K
Native multimodal output text only text+image+audio text+image text only
Extended thinking ✅ (o-series)
Agentic suitability ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐
Open weights

Tabuľka je orientačná — benchmark čísla sa menia týždenne, vyberajte podľa vlastných eval-ov, nie podľa marketingu.


8. Praktické use-case-y, kde sa nám 4.7 oplatil

V Sardonic ekosystéme bežíme Opus 4.7 ako primárny model pre:

  • Telegram-driven automation — Claude Code instance riadená cez Telegram (pozri náš rayan303_bot setup) dokáže spustiť 4-hodinové batch úlohy bez intervencie
  • Devops KB content generation — séria 10+ článkov o K8s tooling, každý s cross-model review, prešla s minimálnymi blocking fixami
  • Portal SSR refactor — v1.4.0 obsahoval hlbokú zmenu server-side rendering loop-u, Opus 4.7 + Sonnet review zachytili 2 reálne UX bugy pred merge-om
  • Task triage — automatický processing READY úloh z app_tasks MySQL DB

V každom z týchto use-case-ov Opus 4.7 výrazne predstihol Sonnet — najmä pri orchestrácii viacerých sub-agentov a udržaní zámeru cez dlhú session.


9. Zhrnutie

Opus 4.7 nie je revolučný release — je to iteratívne zlepšenie Opus 4.6 v dimenziách, ktoré v praxi najviac bolia: stabilita agentov, kvalita dlhého kontextu, coding accuracy. Ak ste na 4.6, prechod je takmer free (jeden string change). Ak ste na inom modeli, oplatí sa otestovať na vašich vlastných eval-och pred plnou migráciou.

V 2026 zostáva Anthropic flagship line de facto štandardom pre agentic + heavy coding scenáre — primárna konkurencia (GPT-5 Turbo) má prevahu v multimodálnom output-e, ale za cenu nižšej coding accuracy.


10. Odkazy