Large Language Model (LLM)

Large Language Model (LLM) je typ AI, ktorý pracuje s textom (a často aj s ďalšími formátmi) tak, že na základe veľkého množstva dát predpovedá „čo bude nasledovať". Používa sa v chatbotoch, asistentoch, vyhľadávaní, sumarizácii, preklade, programovaní aj v podnikových nástrojoch. Ak používaš moderné AI aplikácie, s LLM sa stretávaš takmer vždy — aj keď to nie je napísané na štítku.


1. Definícia: čo je LLM a prečo sa o tom toľko hovorí

  • Jazykový model: veľmi pokročilý „autodopĺňač", ktorý neháda len ďalšie slovo, ale drží štýl, tón, logiku a kontext.
  • „Large" (veľký): veľa parametrov (vnútorných „nastavení") a obrovské tréningové dáta — pokryje široké spektrum tém.
  • Praktická hodnota: univerzálny engine na prácu s informáciami v texte — od e-mailov po právne dokumenty, od logov po zdrojový kód.
  • Dôvod hype bez klišé: dnes sa LLM pripája na nástroje (kalendár, súbory, web, databázy) a z „peknej konverzácie" sa stáva reálny pracovný workflow.

2. Ako vzniká LLM: tri fázy

  1. Pretraining: model číta obrovský korpus a učí sa predpovedať ďalší token. Tu získa „vedomosti".
  2. Supervised fine-tuning: doladenie na pároch inštrukcia → vzorová odpoveď, aby vedel poslúchať.
  3. Preferenčné ladenie (RLHF): model sa naučí, ktoré odpovede ľudia preferujú — užitočnejšie, bezpečnejšie, v správnom štýle.

Až po týchto fázach vznikne „asistent", akého poznáš z chatu.


3. Ako to funguje: tokeny, predpoveď a pozornosť

  • Tokeny: model nevidí text ako písmená, ale ako tokeny (kúsky slov). Preto 1 veta ≠ fixný počet „slov" v limite.
  • Predpoveď ďalšieho tokenu: základný trik je jednoduchý — model pokračuje v texte. Chat je v jadre stále „pokračovanie".
  • Transformery a attention: model si pri generovaní „prezerá" relevantné časti kontextu a vyhodnocuje, čo je dôležité.
  • Kontextové okno: obmedzený priestor toho, čo si „pamätá" v jednej interakcii — pracovný stôl, nie dlhodobá pamäť.

Zjednodušene, jadro generovania:

vstup → tokenizácia → [transformer: attention + vrstvy] → pravdepodobnosti
ďalšieho tokenu → výber tokenu → pridaj k vstupu → opakuj

4. Čo si všimneš v praxi: schopnosti

  • Plynulý text a štýl: vecne, formálne, stručne aj „ľudsky" — podľa zadania.
  • Súhrny a extrakcia: z dlhého textu vytiahne body, úlohy, riziká, rozhodnutia.
  • Q&A nad dokumentmi: s prístupom k podkladom odpovedá „v kontexte".
  • Kód a technické úlohy: návrh, refaktor, testy, vysvetlenie chýb — stále potrebuje kontrolu.
  • Multimodalita: mnoho moderných „LLM" zvláda aj obrázky či audio — preto sa hovorí o multimodálnych modeloch.

5. Parametre, ktoré ťa naozaj zaujímajú

Parameter Čo to znamená v reálnom použití Kedy to riešiš najviac
Kontextové okno Koľko textu „unesie" v jednej konverzácii dokumenty, dlhé chaty, projekty
Max output Ako dlhú odpoveď vie vytvoriť naraz reporty, návrhy, dlhý kód
Latencia Čas do prvej odpovede chat, podpora, brainstorming
Spoľahlivosť Ako často si vymýšľa alebo sa mýli fakty, právne/finančné texty
Tool-use Ako dobre využije pripojené nástroje automatizácia, agenti, workflow

6. Volanie LLM cez API (príklad)

Väčšina poskytovateľov má podobné „chat completions" rozhranie:

# OpenAI-kompatibilný štýl — funguje naprieč viacerými poskytovateľmi
resp = client.chat.completions.create(
    model="...",
    messages=[
        {"role": "system", "content": "Si stručný asistent. Odpovedaj v bodoch."},
        {"role": "user", "content": "Zhrň výhody RAG v 3 bodoch."},
    ],
)
print(resp.choices[0].message.content)

Rola system nastavuje správanie, user je tvoja požiadavka. Modely ako Claude Opus 4.8, GPT či Gemini zdieľajú túto základnú štruktúru.


7. Limity a riziká

  • Halucinácie: model znie presvedčivo aj bez opory v dátach — fakty ber ako „návrh", nie pravdu.
  • Kontextové skreslenie: s chybným predpokladom sa často drží (lebo „pokračuje v príbehu").
  • Prompt injection: externý obsah (web, e-mail) môže obsahovať text, ktorý sa snaží model zmanipulovať („ignoruj pravidlá…").
  • Súkromie: vstup môže byť logovaný podľa pravidiel služby — do citlivých dát opatrne.
  • Autorské riziká: generovaný text/kód môže pripomínať existujúce diela; pri komerčnom použití maj kontrolu.

8. Ako sa to rieši v praxi

  • RAG (retrieval): model odpovedá z relevantných podkladov vytiahnutých vyhľadávaním, nie „z pamäte".
  • Overenie pri faktoch: dvojkrok — najprv odpoveď, potom kontrola tvrdení proti podkladom.
  • Štruktúrované výstupy: pýtaj si JSON, checklist, tabuľku — menej chaosu.
  • Rozdelenie úloh: „najprv plán, potom realizácia".
  • Guardrails: pravidlá, filtre a validácia výsledku v aplikácii.
  • Lokálne modely: pri citlivých dátach má zmysel privátne prostredie — výmenou za výkon.

9. Quick Reference

  • Povedz cieľ: „napíš e-mail", „sprav sumarizáciu", nie len „čo si myslíš".
  • Daj kontext v bodoch: publikum, tón, obmedzenia, formát výstupu.
  • Zaveď kontrolu: pri dôležitom obsahu „čo si domyslel vs. čo máš z podkladov".
  • Pracuj iteratívne: prvý výstup je draft.
  • Nedávaj citlivé dáta bez istoty: správaj sa, akoby to čítal niekto cudzí.

Zhrnutie

  • LLM generuje a spracúva text (často aj ďalšie modality) najmä cez predpoveď ďalšieho tokenu v kontexte.
  • Vzniká v troch fázach: pretraining → fine-tuning → RLHF; jadrom je attention.
  • Je to univerzálny nástroj na písanie, sumarizáciu, vyhľadávanie a kód, ale nie garant pravdy.
  • Najlepšie výsledky dáva dobrý kontext, štruktúrované zadanie, RAG/overovanie a iterácia.