Large Language Model (LLM)

Large Language Model (LLM) je typ AI, ktorý pracuje s textom (a často aj s ďalšími formátmi) tak, že na základe veľkého množstva dát predpovedá „čo bude nasledovať". Používa sa v chatbotoch, asistentoch, vyhľadávaní, sumarizácii, preklade, programovaní aj v podnikových nástrojoch. Ak používaš moderné AI aplikácie, s LLM sa stretávaš takmer vždy — aj keď to nie je napísané na štítku.

1. Definícia: čo je LLM a prečo sa o tom toľko hovorí

Jazykový model: veľmi pokročilý „autodopĺňač", ktorý neháda len ďalšie slovo, ale drží štýl, tón, logiku a kontext.
„Large" (veľký): veľa parametrov (vnútorných „nastavení") a obrovské tréningové dáta — pokryje široké spektrum tém.
Praktická hodnota: univerzálny engine na prácu s informáciami v texte — od e-mailov po právne dokumenty, od logov po zdrojový kód.
Dôvod hype bez klišé: dnes sa LLM pripája na nástroje (kalendár, súbory, web, databázy) a z „peknej konverzácie" sa stáva reálny pracovný workflow.

2. Ako vzniká LLM: tri fázy

Pretraining: model číta obrovský korpus a učí sa predpovedať ďalší token. Tu získa „vedomosti".
Supervised fine-tuning: doladenie na pároch inštrukcia → vzorová odpoveď, aby vedel poslúchať.
Preferenčné ladenie (RLHF): model sa naučí, ktoré odpovede ľudia preferujú — užitočnejšie, bezpečnejšie, v správnom štýle.

Až po týchto fázach vznikne „asistent", akého poznáš z chatu.

3. Ako to funguje: tokeny, predpoveď a pozornosť

Tokeny: model nevidí text ako písmená, ale ako tokeny (kúsky slov). Preto 1 veta ≠ fixný počet „slov" v limite.
Predpoveď ďalšieho tokenu: základný trik je jednoduchý — model pokračuje v texte. Chat je v jadre stále „pokračovanie".
Transformery a attention: model si pri generovaní „prezerá" relevantné časti kontextu a vyhodnocuje, čo je dôležité.
Kontextové okno: obmedzený priestor toho, čo si „pamätá" v jednej interakcii — pracovný stôl, nie dlhodobá pamäť.

Zjednodušene, jadro generovania:

vstup → tokenizácia → [transformer: attention + vrstvy] → pravdepodobnosti
ďalšieho tokenu → výber tokenu → pridaj k vstupu → opakuj

4. Čo si všimneš v praxi: schopnosti

Plynulý text a štýl: vecne, formálne, stručne aj „ľudsky" — podľa zadania.
Súhrny a extrakcia: z dlhého textu vytiahne body, úlohy, riziká, rozhodnutia.
Q&A nad dokumentmi: s prístupom k podkladom odpovedá „v kontexte".
Kód a technické úlohy: návrh, refaktor, testy, vysvetlenie chýb — stále potrebuje kontrolu.
Multimodalita: mnoho moderných „LLM" zvláda aj obrázky či audio — preto sa hovorí o multimodálnych modeloch.

5. Parametre, ktoré ťa naozaj zaujímajú

Parameter	Čo to znamená v reálnom použití	Kedy to riešiš najviac
Kontextové okno	Koľko textu „unesie" v jednej konverzácii	dokumenty, dlhé chaty, projekty
Max output	Ako dlhú odpoveď vie vytvoriť naraz	reporty, návrhy, dlhý kód
Latencia	Čas do prvej odpovede	chat, podpora, brainstorming
Spoľahlivosť	Ako často si vymýšľa alebo sa mýli	fakty, právne/finančné texty
Tool-use	Ako dobre využije pripojené nástroje	automatizácia, agenti, workflow

6. Volanie LLM cez API (príklad)

Väčšina poskytovateľov má podobné „chat completions" rozhranie:

# OpenAI-kompatibilný štýl — funguje naprieč viacerými poskytovateľmi
resp = client.chat.completions.create(
    model="...",
    messages=[
        {"role": "system", "content": "Si stručný asistent. Odpovedaj v bodoch."},
        {"role": "user", "content": "Zhrň výhody RAG v 3 bodoch."},
    ],
)
print(resp.choices[0].message.content)

Rola system nastavuje správanie, user je tvoja požiadavka. Modely ako Claude Opus 4.8, GPT či Gemini zdieľajú túto základnú štruktúru.

7. Limity a riziká

Halucinácie: model znie presvedčivo aj bez opory v dátach — fakty ber ako „návrh", nie pravdu.
Kontextové skreslenie: s chybným predpokladom sa často drží (lebo „pokračuje v príbehu").
Prompt injection: externý obsah (web, e-mail) môže obsahovať text, ktorý sa snaží model zmanipulovať („ignoruj pravidlá…").
Súkromie: vstup môže byť logovaný podľa pravidiel služby — do citlivých dát opatrne.
Autorské riziká: generovaný text/kód môže pripomínať existujúce diela; pri komerčnom použití maj kontrolu.

8. Ako sa to rieši v praxi

RAG (retrieval): model odpovedá z relevantných podkladov vytiahnutých vyhľadávaním, nie „z pamäte".
Overenie pri faktoch: dvojkrok — najprv odpoveď, potom kontrola tvrdení proti podkladom.
Štruktúrované výstupy: pýtaj si JSON, checklist, tabuľku — menej chaosu.
Rozdelenie úloh: „najprv plán, potom realizácia".
Guardrails: pravidlá, filtre a validácia výsledku v aplikácii.
Lokálne modely: pri citlivých dátach má zmysel privátne prostredie — výmenou za výkon.

9. Quick Reference

Povedz cieľ: „napíš e-mail", „sprav sumarizáciu", nie len „čo si myslíš".
Daj kontext v bodoch: publikum, tón, obmedzenia, formát výstupu.
Zaveď kontrolu: pri dôležitom obsahu „čo si domyslel vs. čo máš z podkladov".
Pracuj iteratívne: prvý výstup je draft.
Nedávaj citlivé dáta bez istoty: správaj sa, akoby to čítal niekto cudzí.

Zhrnutie

LLM generuje a spracúva text (často aj ďalšie modality) najmä cez predpoveď ďalšieho tokenu v kontexte.
Vzniká v troch fázach: pretraining → fine-tuning → RLHF; jadrom je attention.
Je to univerzálny nástroj na písanie, sumarizáciu, vyhľadávanie a kód, ale nie garant pravdy.
Najlepšie výsledky dáva dobrý kontext, štruktúrované zadanie, RAG/overovanie a iterácia.