Claude Opus 4.7
Claude Opus 4.7 je najnovšia verzia flagship modelu Claude od Anthropic, vydaná v marci/apríli 2026. Pokračuje v línii Opus 4.6 (február 2026), ale prináša niekoľko zásadných posunov pre agentné workloady, dlhý kontext a softvérové inžinierstvo ako disciplínu.
Tento článok je kompaktný technický prehľad — čo je nové, kde má zmysel ho použiť a kde naopak nie.
1. Čo je hlavná zmena oproti Opus 4.6
1M tokens context window — natívne, nie beta
- 4.6 mal 1M ako beta feature; v 4.7 je default pre všetky API tier-y bez dodatočného flagu
- model si v rámci 1M okna drží konzistenciu výrazne lepšie (menej "lost in the middle" efektu) — interné Anthropic benchmarky uvádzajú ~92% needle-in-haystack accuracy aj na pozíciách 700K+ tokenov
Agentic prevádzka stabilnejšia
- cieľ: agent dokáže bežať hodiny bez "drift-u" alebo straty zámeru
- lepšia self-correction — keď model spraví chybu (napr. zlý tool call), častejšie ju sám detekuje a opraví v ďalšom kroku
- výrazne lepšie plánovanie pred akciou — model implicitne robí "todo decompositon" pre komplexné zadania
SWE-bench Verified ~84%
- 4.6 dosiahol ~80.8%, 4.7 zlepšil na circa 84% (konkrétne číslo Anthropic uvádza v release notes)
- lepšia práca s viac-súborovými refaktormi a test-driven scenariami
Lepšie reasoning v dlhých reťazcoch
- "extended thinking" mode (introduced v Sonnet 4.5/Opus 4.5) je v 4.7 efektívnejší — model spotrebuje menej thinking tokenov na rovnaký výsledok, alebo dosahuje lepší výsledok s rovnakým budgetom
Memory tool integration
- podpora persistent memory cez Anthropic File System / Memory tool (introduced v Sonnet 4.6)
- agent si môže ukladať poznatky medzi sessions bez external infrastructure
2. Pozícia v Claude rodine (apríl 2026)
- Opus 4.7 — flagship; agentic + dlhý kontext + náročný coding
- Opus 4.6 — predchodca, stále podporovaný (deprecation v H2 2026 pravdepodobné)
- Sonnet 4.6 — najlepší pomer výkon/cena; pre väčšinu úloh dostatočne silný
- Haiku 4.5 — rýchly a lacný; rutina, klasifikácia, RAG retrieval, masová prevádzka
- Mythos Preview — výhradne pre Project Glasswing partnerov, focus na cybersec; nie je verejne dostupný
V praxi sa typicky kombinuje: Haiku/Sonnet na rutinu, Opus na "ťažké jadro" problému. Veľa devov používa Opus 4.7 ako orchestrator a delegujte sub-úlohy na Sonnet.
3. Technické detaily, ktoré v praxi cítiť
API model ID
claude-opus-4-7(latest stable)claude-opus-4-7-20260310(datum-pinned variant — odporúčané pre produkciu)
Fast mode (1M context)
- variant
claude-opus-4-6(predchodca) podporoval fast mode — rýchlejší tokens-per-second za cenu drobnej kvality - Opus 4.7 fast mode neexistuje (zatiaľ) — Anthropic prioritizoval kvalitu nad rýchlosťou v tomto release
- variant
Token economics (rovnaké tier-y ako Opus 4.6)
- input do 200K: $5 / 1M tokens
- input nad 200K (long-context premium): $10 / 1M tokens
- output do 200K: $25 / 1M tokens
- output nad 200K: $37.50 / 1M tokens
- cache hit: ~10× lacnejšie než input
- batching API: 50% zľava — ideálne pre offline workloads
Maximum output
max_tokensaž 128K (rovnako ako Opus 4.6)- v praxi pre väčšinu úloh stačí 16K–32K — prebytočný
max_tokenslen zvyšuje latency cap
Latency
- typická first-token latency: 2–4s pre krátke prompty
- streaming throughput: 60–90 tokens/sec
- extended thinking: pridá 10–60s podľa veľkosti budget-u
4. Kde Opus 4.7 najviac vyniká
Multi-súborový refaktor v real-world repozitári
- cross-file dependencies, preserving public API, migration zmien postupne
- 4.7 si lepšie pamätá konvencie projektu naprieč súbormi
Agentic prevádzka 4+ hodín
- autonómne dokončenie veľkej task-list (build, test, deploy, review) bez human-in-the-loop
- stabilnejší než 4.6 v reactive scenároch (obnova z chýb)
Hlboká analýza dokumentov
- 1M context = celý codebase + dokumentácia + tickets v jednom prompte
- lepšia cross-document syntéza
Long-form writing
- články, white papery, knihy — model udrží konzistentný hlas a zámer
Reasoning-heavy úlohy
- matematika, dôkazy, SAT solving — extended thinking + 4.7's improved reasoning robí značný rozdiel
5. Kde Opus 4.7 NIE je správna voľba
- High-throughput klasifikácia — Haiku je 20× lacnejší a pre triviálne úlohy rovnako dobrý
- Real-time chat — latency 2–4s do prvého tokena je príliš pre mnohé UI scenáre; Sonnet alebo Haiku majú nižšiu latency
- Image/video generation — Opus 4.7 nie je generative model; pre obrázky použite Imagen 4, DALL·E 3 / Firefly, Stable Diffusion 3.5
- Massively parallel tooling — open-source modely (Llama 3.x, Qwen3) môžu byť lacnejšie ak ich vlastníte
- Air-gapped environments — Anthropic nedistribuuje weights; pre on-prem MUSÍTE použiť open-source
6. Migrácia z Opus 4.6
Najčastejšie scenáre:
- Rovnaký kód, len bump model ID — funguje vo väčšine prípadov bez zmeny
- Cache invalidation — prompt cache je per-model, takže prvé requesty po zmene budú drahšie (žiadny cache hit)
- Extended thinking budget tuning — 4.7 efektívnejšie využíva thinking tokens; môžete znížiť budget o 20–30% a získať rovnaký výsledok lacnejšie
- System prompt review — niektoré "hacks" pre 4.6 (napr. explicit "think step by step") sú v 4.7 redundantné a môžu zhoršiť výsledok
# Príklad migrácie v Python SDK
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7", # bolo: claude-opus-4-6
max_tokens=4096,
thinking={"type": "enabled", "budget_tokens": 8000}, # bolo 12000 v 4.6
messages=[{"role": "user", "content": "Refactor this codebase..."}]
)
7. Ako sa porovnáva s konkurenciou (apríl 2026)
| Schopnosť | Opus 4.7 | GPT-5 Turbo | Gemini 3 Pro | DeepSeek V4 |
|---|---|---|---|---|
| SWE-bench Verified | ~84% | ~78% | ~72% | ~70% |
| Context window | 1M | 256K | 2M | 256K |
| Native multimodal output | text only | text+image+audio | text+image | text only |
| Extended thinking | ✅ | ✅ (o-series) | ✅ | ✅ |
| Agentic suitability | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| Open weights | ❌ | ❌ | ❌ | ✅ |
Tabuľka je orientačná — benchmark čísla sa menia týždenne, vyberajte podľa vlastných eval-ov, nie podľa marketingu.
8. Praktické use-case-y, kde sa nám 4.7 oplatil
V Sardonic ekosystéme bežíme Opus 4.7 ako primárny model pre:
- Telegram-driven automation — Claude Code instance riadená cez Telegram (pozri náš
rayan303_botsetup) dokáže spustiť 4-hodinové batch úlohy bez intervencie - Devops KB content generation — séria 10+ článkov o K8s tooling, každý s cross-model review, prešla s minimálnymi blocking fixami
- Portal SSR refactor — v1.4.0 obsahoval hlbokú zmenu server-side rendering loop-u, Opus 4.7 + Sonnet review zachytili 2 reálne UX bugy pred merge-om
- Task triage — automatický processing READY úloh z
app_tasksMySQL DB
V každom z týchto use-case-ov Opus 4.7 výrazne predstihol Sonnet — najmä pri orchestrácii viacerých sub-agentov a udržaní zámeru cez dlhú session.
9. Zhrnutie
Opus 4.7 nie je revolučný release — je to iteratívne zlepšenie Opus 4.6 v dimenziách, ktoré v praxi najviac bolia: stabilita agentov, kvalita dlhého kontextu, coding accuracy. Ak ste na 4.6, prechod je takmer free (jeden string change). Ak ste na inom modeli, oplatí sa otestovať na vašich vlastných eval-och pred plnou migráciou.
V 2026 zostáva Anthropic flagship line de facto štandardom pre agentic + heavy coding scenáre — primárna konkurencia (GPT-5 Turbo) má prevahu v multimodálnom output-e, ale za cenu nižšej coding accuracy.
10. Odkazy
- Anthropic API docs — model card, pricing, API reference
- Claude Code — terminálny coding agent built on Claude
- SWE-bench leaderboard — independent verified scores
- Anthropic engineering blog — technické deep-dive