Kimi K2.5
Kimi K2.5 je open-source multimodálny (text + obrázky + video) „agentic“ AI model od Moonshot AI, zameraný na praktickú prácu: vizuálne „design-to-code“ workflowy, dlhé úlohy s nástrojmi a paralelné riešenie problémov cez agent swarm.
1. Čo je na Kimi K2.5 podstatné
- Multimodalita pre reálnu prácu (text/obraz/video):
- vie z vizuálnych podkladov generovať funkčný front-end kód (vrátane interakcií) a pomáhať s vizuálnym debugovaním
- Agentické režimy (od rýchlej odpovede po „vykonanie práce“):
- v Kimi (web/app) má režimy Instant, Thinking, Agent, Agent Swarm (Beta)
- Agent Swarm (paralelizácia):
- dokáže sa „samosprávne“ rozložiť až na ~100 sub-agentov a vykonávať paralelné workflowy; Moonshot uvádza škálovanie až na ~1 500 tool-call krokov a zrýchlenie veľkých úloh až ~4.5× vs. single-agent
- Open-source ekosystém (váhy + kód):
- model je publikovaný na Hugging Face/GitHub ako open-source a má licenciu Modified MIT
2. Technické detaily (prakticky, čo ťa bude zaujímať)
| Parameter | Hodnota | Poznámka |
|---|---|---|
| Architektúra | MoE (Mixture-of-Experts) |
efektívne škálovanie: veľa parametrov, ale aktivuje sa len časť |
| „Veľkosť“ | ~1T total params / ~32B activated |
bežné tvrdenie pri MoE: aktivovaných je ~32B na token |
| Kontext | 256K tokenov |
dlhé dokumenty, logy, veľké repo kontexty |
| Multimodalita | text + obraz; video (najmä cez oficiálne API) | video je uvádzané ako experimentálne/limitované v niektorých režimoch |
| Vision encoder | MoonViT (~400M) |
natívna integrácia v modelovej karte |
| Tréningové dáta (scope) | ~15T zmiešaných vizuálnych + text tokenov |
„continual pretraining“ nad Kimi-K2 base |
| Kvantizácia | INT4 (natívna) |
uvádzaná ako súčasť dizajnu/deploymentu |
- Výkon / benchmarky (iba orientačne):
- v oficiálnej model karte sú uvedené silné výsledky v agentických a coding benchmarkoch (napr. SWE-Bench Verified a agentic search benchmarky), s detailnými tabuľkami
3. Dostupnosť
- Kimi web + mobilná app: režimy Instant/Thinking/Agent/Agent Swarm, upload súborov a vizuálnych podkladov
- API (Moonshot Open Platform) + kompatibilita:
- model karta uvádza API prístup a spomína kompatibilitu v štýle
OpenAI/Anthropic-compatible APIpre integrácie
- model karta uvádza API prístup a spomína kompatibilitu v štýle
- Third-party provideri: dostupný napr. cez OpenRouter a Together AI (užitočné, ak chceš routing/fallbacky alebo infra mimo Moonshot)
- CLI pre dev workflow („Kimi Code“):
- Moonshot propaguje Kimi Code (terminál/IDE workflow, integrácie)
4. Ceny / licencia
- Licencia (self-host / vlastné nasadenie):
- váhy aj repozitár sú pod Modified MIT; model je uvádzaný ako použiteľný aj komerčne
- Ceny API (líšia sa podľa poskytovateľa a „cache“):
- oficiálne materiály a médiá pri K2.5 bežne uvádzajú približne
~$0.60 / 1M input,~$0.10 / 1M cached input,~$3.00 / 1M output(Moonshot API) - príklady tretích strán:
- OpenRouter: zobrazuje
~$0.45/M inputa~$2.50/M output(ich routing/markup) - Together AI: uvádza
~$0.50 input / $2.80 output
- OpenRouter: zobrazuje
- oficiálne materiály a médiá pri K2.5 bežne uvádzajú približne
- Realita v praxi: pri veľkom kontexte (256K) alebo dlhých agentických úlohách sú náklady najmä o objeme tokenov a počte krokov; ceny sa môžu rýchlo meniť podľa providera.
5. Bezpečnosť a súkromie (čo si strážiť)
- Rozlišuj „open-source váhy“ vs. „hostované služby“:
- aj keď je model open-source, pri použití Kimi web/app/API posielaš dáta na cudziu infra; pri citlivých dátach je bezpečnejšie self-host alebo použiť providera s jasnými zmluvnými podmienkami.
- Praktické pravidlá pre prácu s citlivým obsahom:
- nedávaj do promptov heslá, API kľúče, osobné údaje klientov, interné zmluvy v plnom znení
- ak potrebuješ analyzovať dokument, anonymizuj ho (mená, čísla, adresy) a používaj minimálne výrezy
- pri agentoch so „tool use“ si všímaj, kam model posiela dáta (napr. web browsing, uploady, externé integrácie)
6. Quick Reference
- Na čo je K2.5 najlepší: vizuálne front-end generovanie, dlhé kontexty, agentické workflowy a paralelizácia cez Agent Swarm.
- Kľúčové čísla:
256K context,MoE ~1T/32B active, tréning ~15Tmultimodálnych tokenov,Modified MIT. - Kde to použiť: Kimi web/app, Moonshot API, OpenRouter/Together AI, Kimi Code CLI.
Zhrnutie
- Kimi K2.5 je open-source multimodálny agentický model od Moonshot AI s dôrazom na visual coding a dlhé „real-work“ workflowy.
- Má 256K kontext, MoE architektúru (~1T/32B) a režimy od rýchlych odpovedí až po Agent Swarm s paralelným riešením úloh.
- Licencia Modified MIT umožňuje široké použitie, ale pri hostovaných verziách si stráž dáta a compliance rovnako ako pri každom cloud LLM.