Kimi K2.5

Kimi K2.5 je open-source multimodálny (text + obrázky + video) „agentic“ AI model od Moonshot AI, zameraný na praktickú prácu: vizuálne „design-to-code“ workflowy, dlhé úlohy s nástrojmi a paralelné riešenie problémov cez agent swarm.


1. Čo je na Kimi K2.5 podstatné

  • Multimodalita pre reálnu prácu (text/obraz/video):
    • vie z vizuálnych podkladov generovať funkčný front-end kód (vrátane interakcií) a pomáhať s vizuálnym debugovaním
  • Agentické režimy (od rýchlej odpovede po „vykonanie práce“):
    • v Kimi (web/app) má režimy Instant, Thinking, Agent, Agent Swarm (Beta)
  • Agent Swarm (paralelizácia):
    • dokáže sa „samosprávne“ rozložiť až na ~100 sub-agentov a vykonávať paralelné workflowy; Moonshot uvádza škálovanie až na ~1 500 tool-call krokov a zrýchlenie veľkých úloh až ~4.5× vs. single-agent
  • Open-source ekosystém (váhy + kód):
    • model je publikovaný na Hugging Face/GitHub ako open-source a má licenciu Modified MIT

2. Technické detaily (prakticky, čo ťa bude zaujímať)

Parameter Hodnota Poznámka
Architektúra MoE (Mixture-of-Experts) efektívne škálovanie: veľa parametrov, ale aktivuje sa len časť
„Veľkosť“ ~1T total params / ~32B activated bežné tvrdenie pri MoE: aktivovaných je ~32B na token
Kontext 256K tokenov dlhé dokumenty, logy, veľké repo kontexty
Multimodalita text + obraz; video (najmä cez oficiálne API) video je uvádzané ako experimentálne/limitované v niektorých režimoch
Vision encoder MoonViT (~400M) natívna integrácia v modelovej karte
Tréningové dáta (scope) ~15T zmiešaných vizuálnych + text tokenov „continual pretraining“ nad Kimi-K2 base
Kvantizácia INT4 (natívna) uvádzaná ako súčasť dizajnu/deploymentu
  • Výkon / benchmarky (iba orientačne):
    • v oficiálnej model karte sú uvedené silné výsledky v agentických a coding benchmarkoch (napr. SWE-Bench Verified a agentic search benchmarky), s detailnými tabuľkami

3. Dostupnosť

  • Kimi web + mobilná app: režimy Instant/Thinking/Agent/Agent Swarm, upload súborov a vizuálnych podkladov
  • API (Moonshot Open Platform) + kompatibilita:
    • model karta uvádza API prístup a spomína kompatibilitu v štýle OpenAI/Anthropic-compatible API pre integrácie
  • Third-party provideri: dostupný napr. cez OpenRouter a Together AI (užitočné, ak chceš routing/fallbacky alebo infra mimo Moonshot)
  • CLI pre dev workflow („Kimi Code“):
    • Moonshot propaguje Kimi Code (terminál/IDE workflow, integrácie)

4. Ceny / licencia

  • Licencia (self-host / vlastné nasadenie):
    • váhy aj repozitár sú pod Modified MIT; model je uvádzaný ako použiteľný aj komerčne
  • Ceny API (líšia sa podľa poskytovateľa a „cache“):
    • oficiálne materiály a médiá pri K2.5 bežne uvádzajú približne ~$0.60 / 1M input, ~$0.10 / 1M cached input, ~$3.00 / 1M output (Moonshot API)
    • príklady tretích strán:
      • OpenRouter: zobrazuje ~$0.45/M input a ~$2.50/M output (ich routing/markup)
      • Together AI: uvádza ~$0.50 input / $2.80 output
  • Realita v praxi: pri veľkom kontexte (256K) alebo dlhých agentických úlohách sú náklady najmä o objeme tokenov a počte krokov; ceny sa môžu rýchlo meniť podľa providera.

5. Bezpečnosť a súkromie (čo si strážiť)

  • Rozlišuj „open-source váhy“ vs. „hostované služby“:
    • aj keď je model open-source, pri použití Kimi web/app/API posielaš dáta na cudziu infra; pri citlivých dátach je bezpečnejšie self-host alebo použiť providera s jasnými zmluvnými podmienkami.
  • Praktické pravidlá pre prácu s citlivým obsahom:
    • nedávaj do promptov heslá, API kľúče, osobné údaje klientov, interné zmluvy v plnom znení
    • ak potrebuješ analyzovať dokument, anonymizuj ho (mená, čísla, adresy) a používaj minimálne výrezy
    • pri agentoch so „tool use“ si všímaj, kam model posiela dáta (napr. web browsing, uploady, externé integrácie)

6. Quick Reference

  • Na čo je K2.5 najlepší: vizuálne front-end generovanie, dlhé kontexty, agentické workflowy a paralelizácia cez Agent Swarm.
  • Kľúčové čísla: 256K context, MoE ~1T/32B active, tréning ~15T multimodálnych tokenov, Modified MIT.
  • Kde to použiť: Kimi web/app, Moonshot API, OpenRouter/Together AI, Kimi Code CLI.

Zhrnutie

  • Kimi K2.5 je open-source multimodálny agentický model od Moonshot AI s dôrazom na visual coding a dlhé „real-work“ workflowy.
  • 256K kontext, MoE architektúru (~1T/32B) a režimy od rýchlych odpovedí až po Agent Swarm s paralelným riešením úloh.
  • Licencia Modified MIT umožňuje široké použitie, ale pri hostovaných verziách si stráž dáta a compliance rovnako ako pri každom cloud LLM.