DeepSeek: lacnejší prístup k silným LLM

DeepSeek je AI lab z Číny, ktorý vydáva veľké jazykové modely (LLM) a zároveň ponúka vlastnú chat aplikáciu aj API. Zaujímavý je tým, že kombinuje „open-weights“ prístup (váhy modelu sú dostupné) s veľmi agresívnym pricingom, takže sa dá reálne používať aj na väčšie objemy práce.


1. Čo to je a prečo je to podstatné

DeepSeek si predstav ako tím, ktorý stavia „motor“ (model) aj „autá“ (chat + API) okolo neho. Pre bežného používateľa je dôležité hlavne to, že sa tu stretávajú tri veci: výkon, cena a (do istej miery) otvorenosť.

  • Kto za tým stojí: DeepSeek je výskumný tím/firmička so sídlom v Hangzhou (Čína), spájaná s financovaním cez High-Flyer a s lídrom Liang Wenfengom.

  • Prečo sa o tom hovorí: DeepSeek posunul latku v tom, ako lacno vieš používať „schopný“ model cez API, a zároveň vydal váhy viacerých modelov na komunitné použitie.

  • Čím sa líši v praxi: namiesto toho, aby si platil za každé použitie „ako za taxi na letisko“, vieš si z toho spraviť „mestský mesačník“ – najmä ak máš workflow s opakujúcimi sa promptami a vieš využiť cache.

  • Kľúčové veci, ktoré ťa budú zaujímať: cena za tokeny, dlhý kontext, thinking/reasoning režim, tool-calls, a možnosť ísť lokálne (pri vybraných modeloch).


2. Technické detaily (bez magie, len čo cítiš v praxi)

DeepSeek modely sú postavené tak, aby mali vysoký výkon, ale aby ich inference (generovanie) nestálo extrémne veľa. Najznámejší prístup je Mixture of Experts (MoE) – ako keby si namiesto jedného super-špecialistu mal tím expertov a na každý token sa aktivuje len časť z nich.

  • MoE (Mixture of Experts): model má obrovský „celkový mozog“, ale v každom kroku používa len „vybranú skupinu neurónov“, čo šetrí výpočet. Pri DeepSeek-V3 sa uvádza 671B celkových parametrov a 37B aktivovaných na token.

  • Dlhý kontext: prakticky to znamená, že vieš do jedného chatu tlačiť dlhšie dokumenty, logy, špecifikácie či viac-krokové zadania. V oficiálnych parametrových informáciách pri API je uvedených 128K kontextu.

  • Thinking vs non-thinking: DeepSeek API explicitne rozlišuje „non-thinking“ (rýchlejší, lacnejší štýl odpovedí) a „thinking“ mód (viac krokov uvažovania/overovania, typicky lepšie na zložité úlohy). V API to uvidíš ako deepseek-chat vs deepseek-reasoner.

  • Post-training a RL: pri reasoning línii (R1) DeepSeek zdôrazňuje veľkosť RL fázy po supervised doladení – teda „tvrdenie“ schopností cez spätnú väzbu, nie len ďalšie texty.

Mini tabuľka, čo ťa reálne zaujíma (API, k 8. 2. 2026):

Parameter deepseek-chat deepseek-reasoner
Kontext 128K 128K
Max output (default / max) 4K / 8K 32K / 64K
Tool calls / JSON output áno áno
FIM completion áno nie
Cena (1M input cache hit / miss, 1M output) $0.028 / $0.28, $0.42 $0.028 / $0.28, $0.42

3. Dostupnosť: kde to vieš používať

DeepSeek nie je len „model na papieri“. Máš viac ciest, ako sa k nemu dostať – od jednoduchého chatu po integrácie v aplikáciách.

  • Web/chat: existuje oficiálny chat (typicky najjednoduchší vstup, keď chceš len skúšať).

  • API (OpenAI-kompatibilné): pre vývojárov a automatizácie je kľúčové, že endpointy sú dizajnované tak, aby sa dali relatívne ľahko „zapojiť“ do existujúcich integrácií.

  • Open-weights / lokálne spustenie: pri vybraných verziách (napr. DeepSeek-V3 a R1 séria) sú váhy dostupné a komunita ich vie nasadzovať cez bežné serving nástroje. V praxi to však znamená: veľké nároky na GPU a infra, ak chceš plnú veľkosť.

  • Platformy: lokálne nasadenie je typicky Linux-first a často sa opiera o konkrétne serving stacky; ak si „desktop-only“ používateľ, väčšinou skončíš pri cloude alebo hotových integráciách.


4. Ceny a licencie (čo je „open“ a čo len vyzerá open)

Tu sa oplatí byť presný: medzi „open-source“ a „open-weights“ je rozdiel. DeepSeek často uvoľňuje váhy modelu a kód okolo toho, ale to automaticky neznamená, že je zverejnený celý tréningový pipeline, dáta, filtrácie atď.

  • API pricing: DeepSeek má priamo na docs stránke ceny za 1M tokenov, vrátane rozdielu medzi cache hit a cache miss (to je veľmi praktické, ak posielaš často podobné inštrukcie alebo systémové prompty).

  • Modely v API: dnes sú hlavné „produkčné“ mená deepseek-chat a deepseek-reasoner (pričom sa opierajú o verzie V3.x).

  • Licencia (R1): repozitár DeepSeek-R1 explicitne uvádza MIT licenciu pre kód aj váhy, vrátane komerčného použitia a derivátov.

  • Licencia (V3 line): DeepSeek pri niektorých vydaniach komunikuje prechod na MIT licenciu aj pri V3 vetve (dôležité, ak chceš robiť interné nasadenie alebo odvodené modely).

  • Praktická rada: ak ideš „lokálne“ alebo do produktu, vždy si otvor licenčný text konkrétneho modelu (nie len blogpost), lebo licencie sa môžu líšiť medzi verziami.


5. Bezpečnosť a súkromie: čo si strážiť

Pri DeepSeek sa bezpečnosť rieši v dvoch rovinách: (1) cloudová služba a (2) lokálne nasadenie. Každé má iný profil rizika.

  • Cloud (chat/API): všetko, čo posielaš, ide mimo tvojho prostredia – preto do toho netlač interné heslá, osobné údaje zákazníkov, alebo citlivé dokumenty bez toho, aby si mal jasno v pravidlách spracovania a retention.

  • Regulačné/štátne obmedzenia: v niektorých krajinách sa objavili reštrikcie pre použitie DeepSeek v štátnej správe kvôli obavám o prístup k dátam. Aj keď sa ťa to netýka priamo, je to signál, že pri firmách v EÚ je dobré mať internú politiku, čo sa môže posielať do takýchto služieb.

  • Lokálne nasadenie: získaš kontrolu nad dátami, ale pribudnú ti iné starosti: záplaty, logovanie, prístupy, unik tokenov, a najmä prompt injection pri tool-calls (model ti môže „vypýtať“ viac oprávnení, než by mal).

  • Praktické minimum:

    • separuj prostredia (dev vs prod),

    • maskuj citlivé dáta ešte pred odoslaním do modelu,

    • pri tool-calls používaj least privilege (modelu nikdy nedaj API kľúč, ktorý vie všetko),

    • a logy nastav tak, aby si v nich nemal osobné údaje „navždy“.


6. Praktické tipy: kedy DeepSeek dáva zmysel (a kedy nie)

DeepSeek nie je „najlepší na všetko“. Je to skôr veľmi dobrý pracant, ktorý vie byť extrémne výhodný, keď máš správny typ úloh.

  • Kedy ho použiť:

    • Automatizácie s veľkým objemom textu (prepisy, sumarizácie, kategorizácie, generovanie šablón).

    • Kód a technické texty (refaktoring návrhov, vysvetlenie logiky, návrh testov) – najmä ak chceš často iterovať bez toho, aby si sledoval náklady pri každom spustení.

    • Reasoning úlohy (plánovanie krokov, kontrola konzistencie, riešenie zadaní s obmedzeniami) – vtedy siahni po deepseek-reasoner.

  • Kedy radšej nie:

    • Ak riešiš právne/medicínske rozhodnutia a potrebuješ striktne auditovateľné zdroje a procesy (tam je dôležitejší workflow než „dobrý chat“).

    • Ak máš ultra-citlivé dáta a nemáš možnosť lokálneho nasadenia alebo jasne dohodnutých podmienok spracovania.

  • Tipy, ktoré reálne zlepšia výsledky:

    • Rozdeľ úlohu na kroky: namiesto „sprav mi to celé“ daj: (1) extrahuj fakty, (2) navrhni štruktúru, (3) doplň detaily, (4) finálny výstup.

    • Využi cache: ak máš dlhý systémový prompt alebo opakované inštrukcie, oplatí sa mať stabilnú „hlavičku“ – pri cache-hit cenách je to citeľné.

    • Voľ model podľa náročnosti: bežné veci rob na deepseek-chat, zložité veci prehoď na deepseek-reasoner až vtedy, keď sa začne lámať kvalita.

    • Tool-calls uzamkni: ak model volá nástroje, nech má presne definované API a limity (napr. whitelist domén, read-only režim, rate limit).


Zhrnutie

  • DeepSeek je zaujímavý hlavne kombináciou dostupných váh modelov a veľmi nízkych nákladov v API, čo z neho robí praktický nástroj na „veľa práce za málo peňazí“.

  • Technicky stavia na prístupoch typu MoE a ponúka režimy chat vs reasoner, ktoré si vieš vybrať podľa náročnosti úlohy.

  • Pri licencovaní je kľúčové čítať konkrétne podmienky modelu – pri R1 sérii je explicitne komunikovaná MIT licencia pre váhy aj kód.

  • Pri súkromí a bezpečnosti platí klasika: čo ide do cloudu, ber ako potenciálne citlivé; ak potrebuješ kontrolu, rieš lokálne nasadenie a prísne limity pri tool-calls.