DeepSeek: lacnejší prístup k silným LLM

DeepSeek je AI lab z Číny, ktorý vydáva veľké jazykové modely (LLM) a zároveň ponúka vlastnú chat aplikáciu aj API. Zaujímavý je tým, že kombinuje „open-weights“ prístup (váhy modelu sú dostupné) s veľmi agresívnym pricingom, takže sa dá reálne používať aj na väčšie objemy práce.

1. Čo to je a prečo je to podstatné

DeepSeek si predstav ako tím, ktorý stavia „motor“ (model) aj „autá“ (chat + API) okolo neho. Pre bežného používateľa je dôležité hlavne to, že sa tu stretávajú tri veci: výkon, cena a (do istej miery) otvorenosť.

Kto za tým stojí: DeepSeek je výskumný tím/firmička so sídlom v Hangzhou (Čína), spájaná s financovaním cez High-Flyer a s lídrom Liang Wenfengom.
Prečo sa o tom hovorí: DeepSeek posunul latku v tom, ako lacno vieš používať „schopný“ model cez API, a zároveň vydal váhy viacerých modelov na komunitné použitie.
Čím sa líši v praxi: namiesto toho, aby si platil za každé použitie „ako za taxi na letisko“, vieš si z toho spraviť „mestský mesačník“ – najmä ak máš workflow s opakujúcimi sa promptami a vieš využiť cache.
Kľúčové veci, ktoré ťa budú zaujímať: cena za tokeny, dlhý kontext, thinking/reasoning režim, tool-calls, a možnosť ísť lokálne (pri vybraných modeloch).

2. Technické detaily (bez magie, len čo cítiš v praxi)

DeepSeek modely sú postavené tak, aby mali vysoký výkon, ale aby ich inference (generovanie) nestálo extrémne veľa. Najznámejší prístup je Mixture of Experts (MoE) – ako keby si namiesto jedného super-špecialistu mal tím expertov a na každý token sa aktivuje len časť z nich.

MoE (Mixture of Experts): model má obrovský „celkový mozog“, ale v každom kroku používa len „vybranú skupinu neurónov“, čo šetrí výpočet. Pri DeepSeek-V3 sa uvádza 671B celkových parametrov a 37B aktivovaných na token.
Dlhý kontext: prakticky to znamená, že vieš do jedného chatu tlačiť dlhšie dokumenty, logy, špecifikácie či viac-krokové zadania. V oficiálnych parametrových informáciách pri API je uvedených 128K kontextu.
Thinking vs non-thinking: DeepSeek API explicitne rozlišuje „non-thinking“ (rýchlejší, lacnejší štýl odpovedí) a „thinking“ mód (viac krokov uvažovania/overovania, typicky lepšie na zložité úlohy). V API to uvidíš ako deepseek-chat vs deepseek-reasoner.
Post-training a RL: pri reasoning línii (R1) DeepSeek zdôrazňuje veľkosť RL fázy po supervised doladení – teda „tvrdenie“ schopností cez spätnú väzbu, nie len ďalšie texty.

Mini tabuľka, čo ťa reálne zaujíma (API, k 8. 2. 2026):

Parameter	deepseek-chat	deepseek-reasoner
Kontext	128K	128K
Max output (default / max)	4K / 8K	32K / 64K
Tool calls / JSON output	áno	áno
FIM completion	áno	nie
Cena (1M input cache hit / miss, 1M output)	$0.028 / $0.28, $0.42	$0.028 / $0.28, $0.42

3. Dostupnosť: kde to vieš používať

DeepSeek nie je len „model na papieri“. Máš viac ciest, ako sa k nemu dostať – od jednoduchého chatu po integrácie v aplikáciách.

Web/chat: existuje oficiálny chat (typicky najjednoduchší vstup, keď chceš len skúšať).
API (OpenAI-kompatibilné): pre vývojárov a automatizácie je kľúčové, že endpointy sú dizajnované tak, aby sa dali relatívne ľahko „zapojiť“ do existujúcich integrácií.
Open-weights / lokálne spustenie: pri vybraných verziách (napr. DeepSeek-V3 a R1 séria) sú váhy dostupné a komunita ich vie nasadzovať cez bežné serving nástroje. V praxi to však znamená: veľké nároky na GPU a infra, ak chceš plnú veľkosť.
Platformy: lokálne nasadenie je typicky Linux-first a často sa opiera o konkrétne serving stacky; ak si „desktop-only“ používateľ, väčšinou skončíš pri cloude alebo hotových integráciách.

4. Ceny a licencie (čo je „open“ a čo len vyzerá open)

Tu sa oplatí byť presný: medzi „open-source“ a „open-weights“ je rozdiel. DeepSeek často uvoľňuje váhy modelu a kód okolo toho, ale to automaticky neznamená, že je zverejnený celý tréningový pipeline, dáta, filtrácie atď.

API pricing: DeepSeek má priamo na docs stránke ceny za 1M tokenov, vrátane rozdielu medzi cache hit a cache miss (to je veľmi praktické, ak posielaš často podobné inštrukcie alebo systémové prompty).
Modely v API: dnes sú hlavné „produkčné“ mená deepseek-chat a deepseek-reasoner (pričom sa opierajú o verzie V3.x).
Licencia (R1): repozitár DeepSeek-R1 explicitne uvádza MIT licenciu pre kód aj váhy, vrátane komerčného použitia a derivátov.
Licencia (V3 line): DeepSeek pri niektorých vydaniach komunikuje prechod na MIT licenciu aj pri V3 vetve (dôležité, ak chceš robiť interné nasadenie alebo odvodené modely).
Praktická rada: ak ideš „lokálne“ alebo do produktu, vždy si otvor licenčný text konkrétneho modelu (nie len blogpost), lebo licencie sa môžu líšiť medzi verziami.

5. Bezpečnosť a súkromie: čo si strážiť

Pri DeepSeek sa bezpečnosť rieši v dvoch rovinách: (1) cloudová služba a (2) lokálne nasadenie. Každé má iný profil rizika.

Cloud (chat/API): všetko, čo posielaš, ide mimo tvojho prostredia – preto do toho netlač interné heslá, osobné údaje zákazníkov, alebo citlivé dokumenty bez toho, aby si mal jasno v pravidlách spracovania a retention.
Regulačné/štátne obmedzenia: v niektorých krajinách sa objavili reštrikcie pre použitie DeepSeek v štátnej správe kvôli obavám o prístup k dátam. Aj keď sa ťa to netýka priamo, je to signál, že pri firmách v EÚ je dobré mať internú politiku, čo sa môže posielať do takýchto služieb.
Lokálne nasadenie: získaš kontrolu nad dátami, ale pribudnú ti iné starosti: záplaty, logovanie, prístupy, unik tokenov, a najmä prompt injection pri tool-calls (model ti môže „vypýtať“ viac oprávnení, než by mal).
Praktické minimum:
- separuj prostredia (dev vs prod),
- maskuj citlivé dáta ešte pred odoslaním do modelu,
- pri tool-calls používaj least privilege (modelu nikdy nedaj API kľúč, ktorý vie všetko),
- a logy nastav tak, aby si v nich nemal osobné údaje „navždy“.

6. Praktické tipy: kedy DeepSeek dáva zmysel (a kedy nie)

DeepSeek nie je „najlepší na všetko“. Je to skôr veľmi dobrý pracant, ktorý vie byť extrémne výhodný, keď máš správny typ úloh.

Kedy ho použiť:
- Automatizácie s veľkým objemom textu (prepisy, sumarizácie, kategorizácie, generovanie šablón).
- Kód a technické texty (refaktoring návrhov, vysvetlenie logiky, návrh testov) – najmä ak chceš často iterovať bez toho, aby si sledoval náklady pri každom spustení.
- Reasoning úlohy (plánovanie krokov, kontrola konzistencie, riešenie zadaní s obmedzeniami) – vtedy siahni po deepseek-reasoner.
Kedy radšej nie:
- Ak riešiš právne/medicínske rozhodnutia a potrebuješ striktne auditovateľné zdroje a procesy (tam je dôležitejší workflow než „dobrý chat“).
- Ak máš ultra-citlivé dáta a nemáš možnosť lokálneho nasadenia alebo jasne dohodnutých podmienok spracovania.
Tipy, ktoré reálne zlepšia výsledky:
- Rozdeľ úlohu na kroky: namiesto „sprav mi to celé“ daj: (1) extrahuj fakty, (2) navrhni štruktúru, (3) doplň detaily, (4) finálny výstup.
- Využi cache: ak máš dlhý systémový prompt alebo opakované inštrukcie, oplatí sa mať stabilnú „hlavičku“ – pri cache-hit cenách je to citeľné.
- Voľ model podľa náročnosti: bežné veci rob na deepseek-chat, zložité veci prehoď na deepseek-reasoner až vtedy, keď sa začne lámať kvalita.
- Tool-calls uzamkni: ak model volá nástroje, nech má presne definované API a limity (napr. whitelist domén, read-only režim, rate limit).

Zhrnutie

DeepSeek je zaujímavý hlavne kombináciou dostupných váh modelov a veľmi nízkych nákladov v API, čo z neho robí praktický nástroj na „veľa práce za málo peňazí“.
Technicky stavia na prístupoch typu MoE a ponúka režimy chat vs reasoner, ktoré si vieš vybrať podľa náročnosti úlohy.
Pri licencovaní je kľúčové čítať konkrétne podmienky modelu – pri R1 sérii je explicitne komunikovaná MIT licencia pre váhy aj kód.
Pri súkromí a bezpečnosti platí klasika: čo ide do cloudu, ber ako potenciálne citlivé; ak potrebuješ kontrolu, rieš lokálne nasadenie a prísne limity pri tool-calls.