Kimi K2.5

Kimi K2.5 je open-source multimodálny (text + obrázky + video) „agentic“ AI model od Moonshot AI, zameraný na praktickú prácu: vizuálne „design-to-code“ workflowy, dlhé úlohy s nástrojmi a paralelné riešenie problémov cez agent swarm.

1. Čo je na Kimi K2.5 podstatné

Multimodalita pre reálnu prácu (text/obraz/video):
- vie z vizuálnych podkladov generovať funkčný front-end kód (vrátane interakcií) a pomáhať s vizuálnym debugovaním
Agentické režimy (od rýchlej odpovede po „vykonanie práce“):
- v Kimi (web/app) má režimy Instant, Thinking, Agent, Agent Swarm (Beta)
Agent Swarm (paralelizácia):
- dokáže sa „samosprávne“ rozložiť až na ~100 sub-agentov a vykonávať paralelné workflowy; Moonshot uvádza škálovanie až na ~1 500 tool-call krokov a zrýchlenie veľkých úloh až ~4.5× vs. single-agent
Open-source ekosystém (váhy + kód):
- model je publikovaný na Hugging Face/GitHub ako open-source a má licenciu Modified MIT

2. Technické detaily (prakticky, čo ťa bude zaujímať)

Parameter	Hodnota	Poznámka
Architektúra	`MoE (Mixture-of-Experts)`	efektívne škálovanie: veľa parametrov, ale aktivuje sa len časť
„Veľkosť“	`~1T total params / ~32B activated`	bežné tvrdenie pri MoE: aktivovaných je ~32B na token
Kontext	`256K` tokenov	dlhé dokumenty, logy, veľké repo kontexty
Multimodalita	text + obraz; video (najmä cez oficiálne API)	video je uvádzané ako experimentálne/limitované v niektorých režimoch
Vision encoder	`MoonViT (~400M)`	natívna integrácia v modelovej karte
Tréningové dáta (scope)	~`15T` zmiešaných vizuálnych + text tokenov	„continual pretraining“ nad Kimi-K2 base
Kvantizácia	`INT4` (natívna)	uvádzaná ako súčasť dizajnu/deploymentu

Výkon / benchmarky (iba orientačne):
- v oficiálnej model karte sú uvedené silné výsledky v agentických a coding benchmarkoch (napr. SWE-Bench Verified a agentic search benchmarky), s detailnými tabuľkami

3. Dostupnosť

Kimi web + mobilná app: režimy Instant/Thinking/Agent/Agent Swarm, upload súborov a vizuálnych podkladov
API (Moonshot Open Platform) + kompatibilita:
- model karta uvádza API prístup a spomína kompatibilitu v štýle OpenAI/Anthropic-compatible API pre integrácie
Third-party provideri: dostupný napr. cez OpenRouter a Together AI (užitočné, ak chceš routing/fallbacky alebo infra mimo Moonshot)
CLI pre dev workflow („Kimi Code“):
- Moonshot propaguje Kimi Code (terminál/IDE workflow, integrácie)

4. Ceny / licencia

Licencia (self-host / vlastné nasadenie):
- váhy aj repozitár sú pod Modified MIT; model je uvádzaný ako použiteľný aj komerčne
Ceny API (líšia sa podľa poskytovateľa a „cache“):
- oficiálne materiály a médiá pri K2.5 bežne uvádzajú približne ~$0.60 / 1M input, ~$0.10 / 1M cached input, ~$3.00 / 1M output (Moonshot API)
- príklady tretích strán:
  - OpenRouter: zobrazuje ~$0.45/M input a ~$2.50/M output (ich routing/markup)
  - Together AI: uvádza ~$0.50 input / $2.80 output
Realita v praxi: pri veľkom kontexte (256K) alebo dlhých agentických úlohách sú náklady najmä o objeme tokenov a počte krokov; ceny sa môžu rýchlo meniť podľa providera.

5. Bezpečnosť a súkromie (čo si strážiť)

Rozlišuj „open-source váhy“ vs. „hostované služby“:
- aj keď je model open-source, pri použití Kimi web/app/API posielaš dáta na cudziu infra; pri citlivých dátach je bezpečnejšie self-host alebo použiť providera s jasnými zmluvnými podmienkami.
Praktické pravidlá pre prácu s citlivým obsahom:
- nedávaj do promptov heslá, API kľúče, osobné údaje klientov, interné zmluvy v plnom znení
- ak potrebuješ analyzovať dokument, anonymizuj ho (mená, čísla, adresy) a používaj minimálne výrezy
- pri agentoch so „tool use“ si všímaj, kam model posiela dáta (napr. web browsing, uploady, externé integrácie)

6. Quick Reference

Na čo je K2.5 najlepší: vizuálne front-end generovanie, dlhé kontexty, agentické workflowy a paralelizácia cez Agent Swarm.
Kľúčové čísla: 256K context, MoE ~1T/32B active, tréning ~15T multimodálnych tokenov, Modified MIT.
Kde to použiť: Kimi web/app, Moonshot API, OpenRouter/Together AI, Kimi Code CLI.

Zhrnutie

Kimi K2.5 je open-source multimodálny agentický model od Moonshot AI s dôrazom na visual coding a dlhé „real-work“ workflowy.
Má 256K kontext, MoE architektúru (~1T/32B) a režimy od rýchlych odpovedí až po Agent Swarm s paralelným riešením úloh.
Licencia Modified MIT umožňuje široké použitie, ale pri hostovaných verziách si stráž dáta a compliance rovnako ako pri každom cloud LLM.