Claude Opus 4.7

Claude Opus 4.7 je najnovšia verzia flagship modelu Claude od Anthropic, vydaná v marci/apríli 2026. Pokračuje v línii Opus 4.6 (február 2026), ale prináša niekoľko zásadných posunov pre agentné workloady, dlhý kontext a softvérové inžinierstvo ako disciplínu.

Tento článok je kompaktný technický prehľad — čo je nové, kde má zmysel ho použiť a kde naopak nie.

1. Čo je hlavná zmena oproti Opus 4.6

1M tokens context window — natívne, nie beta
- 4.6 mal 1M ako beta feature; v 4.7 je default pre všetky API tier-y bez dodatočného flagu
- model si v rámci 1M okna drží konzistenciu výrazne lepšie (menej "lost in the middle" efektu) — interné Anthropic benchmarky uvádzajú ~92% needle-in-haystack accuracy aj na pozíciách 700K+ tokenov
Agentic prevádzka stabilnejšia
- cieľ: agent dokáže bežať hodiny bez "drift-u" alebo straty zámeru
- lepšia self-correction — keď model spraví chybu (napr. zlý tool call), častejšie ju sám detekuje a opraví v ďalšom kroku
- výrazne lepšie plánovanie pred akciou — model implicitne robí "todo decompositon" pre komplexné zadania
SWE-bench Verified ~84%
- 4.6 dosiahol ~80.8%, 4.7 zlepšil na circa 84% (konkrétne číslo Anthropic uvádza v release notes)
- lepšia práca s viac-súborovými refaktormi a test-driven scenariami
Lepšie reasoning v dlhých reťazcoch
- "extended thinking" mode (introduced v Sonnet 4.5/Opus 4.5) je v 4.7 efektívnejší — model spotrebuje menej thinking tokenov na rovnaký výsledok, alebo dosahuje lepší výsledok s rovnakým budgetom
Memory tool integration
- podpora persistent memory cez Anthropic File System / Memory tool (introduced v Sonnet 4.6)
- agent si môže ukladať poznatky medzi sessions bez external infrastructure

2. Pozícia v Claude rodine (apríl 2026)

Opus 4.7 — flagship; agentic + dlhý kontext + náročný coding
Opus 4.6 — predchodca, stále podporovaný (deprecation v H2 2026 pravdepodobné)
Sonnet 4.6 — najlepší pomer výkon/cena; pre väčšinu úloh dostatočne silný
Haiku 4.5 — rýchly a lacný; rutina, klasifikácia, RAG retrieval, masová prevádzka
Mythos Preview — výhradne pre Project Glasswing partnerov, focus na cybersec; nie je verejne dostupný

V praxi sa typicky kombinuje: Haiku/Sonnet na rutinu, Opus na "ťažké jadro" problému. Veľa devov používa Opus 4.7 ako orchestrator a delegujte sub-úlohy na Sonnet.

3. Technické detaily, ktoré v praxi cítiť

API model ID
- claude-opus-4-7 (latest stable)
- claude-opus-4-7-20260310 (datum-pinned variant — odporúčané pre produkciu)
Fast mode (1M context)
- variant claude-opus-4-6 (predchodca) podporoval fast mode — rýchlejší tokens-per-second za cenu drobnej kvality
- Opus 4.7 fast mode neexistuje (zatiaľ) — Anthropic prioritizoval kvalitu nad rýchlosťou v tomto release
Token economics (rovnaké tier-y ako Opus 4.6)
- input do 200K: $5 / 1M tokens
- input nad 200K (long-context premium): $10 / 1M tokens
- output do 200K: $25 / 1M tokens
- output nad 200K: $37.50 / 1M tokens
- cache hit: ~10× lacnejšie než input
- batching API: 50% zľava — ideálne pre offline workloads
Maximum output
- max_tokens až 128K (rovnako ako Opus 4.6)
- v praxi pre väčšinu úloh stačí 16K–32K — prebytočný max_tokens len zvyšuje latency cap
Latency
- typická first-token latency: 2–4s pre krátke prompty
- streaming throughput: 60–90 tokens/sec
- extended thinking: pridá 10–60s podľa veľkosti budget-u

4. Kde Opus 4.7 najviac vyniká

Multi-súborový refaktor v real-world repozitári
- cross-file dependencies, preserving public API, migration zmien postupne
- 4.7 si lepšie pamätá konvencie projektu naprieč súbormi
Agentic prevádzka 4+ hodín
- autonómne dokončenie veľkej task-list (build, test, deploy, review) bez human-in-the-loop
- stabilnejší než 4.6 v reactive scenároch (obnova z chýb)
Hlboká analýza dokumentov
- 1M context = celý codebase + dokumentácia + tickets v jednom prompte
- lepšia cross-document syntéza
Long-form writing
- články, white papery, knihy — model udrží konzistentný hlas a zámer
Reasoning-heavy úlohy
- matematika, dôkazy, SAT solving — extended thinking + 4.7's improved reasoning robí značný rozdiel

5. Kde Opus 4.7 NIE je správna voľba

High-throughput klasifikácia — Haiku je 20× lacnejší a pre triviálne úlohy rovnako dobrý
Real-time chat — latency 2–4s do prvého tokena je príliš pre mnohé UI scenáre; Sonnet alebo Haiku majú nižšiu latency
Image/video generation — Opus 4.7 nie je generative model; pre obrázky použite Imagen 4, DALL·E 3 / Firefly, Stable Diffusion 3.5
Massively parallel tooling — open-source modely (Llama 3.x, Qwen3) môžu byť lacnejšie ak ich vlastníte
Air-gapped environments — Anthropic nedistribuuje weights; pre on-prem MUSÍTE použiť open-source

6. Migrácia z Opus 4.6

Najčastejšie scenáre:

Rovnaký kód, len bump model ID — funguje vo väčšine prípadov bez zmeny
Cache invalidation — prompt cache je per-model, takže prvé requesty po zmene budú drahšie (žiadny cache hit)
Extended thinking budget tuning — 4.7 efektívnejšie využíva thinking tokens; môžete znížiť budget o 20–30% a získať rovnaký výsledok lacnejšie
System prompt review — niektoré "hacks" pre 4.6 (napr. explicit "think step by step") sú v 4.7 redundantné a môžu zhoršiť výsledok

# Príklad migrácie v Python SDK
import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",   # bolo: claude-opus-4-6
    max_tokens=4096,
    thinking={"type": "enabled", "budget_tokens": 8000},  # bolo 12000 v 4.6
    messages=[{"role": "user", "content": "Refactor this codebase..."}]
)

7. Ako sa porovnáva s konkurenciou (apríl 2026)

Schopnosť	Opus 4.7	GPT-5 Turbo	Gemini 3 Pro	DeepSeek V4
SWE-bench Verified	~84%	~78%	~72%	~70%
Context window	1M	256K	2M	256K
Native multimodal output	text only	text+image+audio	text+image	text only
Extended thinking	✅	✅ (o-series)	✅	✅
Agentic suitability	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
Open weights	❌	❌	❌	✅

Tabuľka je orientačná — benchmark čísla sa menia týždenne, vyberajte podľa vlastných eval-ov, nie podľa marketingu.

8. Praktické use-case-y, kde sa nám 4.7 oplatil

V Sardonic ekosystéme bežíme Opus 4.7 ako primárny model pre:

Telegram-driven automation — Claude Code instance riadená cez Telegram (pozri náš rayan303_bot setup) dokáže spustiť 4-hodinové batch úlohy bez intervencie
Devops KB content generation — séria 10+ článkov o K8s tooling, každý s cross-model review, prešla s minimálnymi blocking fixami
Portal SSR refactor — v1.4.0 obsahoval hlbokú zmenu server-side rendering loop-u, Opus 4.7 + Sonnet review zachytili 2 reálne UX bugy pred merge-om
Task triage — automatický processing READY úloh z app_tasks MySQL DB

V každom z týchto use-case-ov Opus 4.7 výrazne predstihol Sonnet — najmä pri orchestrácii viacerých sub-agentov a udržaní zámeru cez dlhú session.

9. Zhrnutie

Opus 4.7 nie je revolučný release — je to iteratívne zlepšenie Opus 4.6 v dimenziách, ktoré v praxi najviac bolia: stabilita agentov, kvalita dlhého kontextu, coding accuracy. Ak ste na 4.6, prechod je takmer free (jeden string change). Ak ste na inom modeli, oplatí sa otestovať na vašich vlastných eval-och pred plnou migráciou.

V 2026 zostáva Anthropic flagship line de facto štandardom pre agentic + heavy coding scenáre — primárna konkurencia (GPT-5 Turbo) má prevahu v multimodálnom output-e, ale za cenu nižšej coding accuracy.

10. Odkazy

Anthropic API docs — model card, pricing, API reference
Claude Code — terminálny coding agent built on Claude
SWE-bench leaderboard — independent verified scores
Anthropic engineering blog — technické deep-dive