Large Language Model (LLM)
Large Language Model (LLM) je typ AI, ktorý pracuje s textom (a často aj s ďalšími formátmi) tak, že na základe veľkého množstva dát predpovedá „čo bude nasledovať". Používa sa v chatbotoch, asistentoch, vyhľadávaní, sumarizácii, preklade, programovaní aj v podnikových nástrojoch. Ak používaš moderné AI aplikácie, s LLM sa stretávaš takmer vždy — aj keď to nie je napísané na štítku.
1. Definícia: čo je LLM a prečo sa o tom toľko hovorí
- Jazykový model: veľmi pokročilý „autodopĺňač", ktorý neháda len ďalšie slovo, ale drží štýl, tón, logiku a kontext.
- „Large" (veľký): veľa parametrov (vnútorných „nastavení") a obrovské tréningové dáta — pokryje široké spektrum tém.
- Praktická hodnota: univerzálny engine na prácu s informáciami v texte — od e-mailov po právne dokumenty, od logov po zdrojový kód.
- Dôvod hype bez klišé: dnes sa LLM pripája na nástroje (kalendár, súbory, web, databázy) a z „peknej konverzácie" sa stáva reálny pracovný workflow.
2. Ako vzniká LLM: tri fázy
- Pretraining: model číta obrovský korpus a učí sa predpovedať ďalší token. Tu získa „vedomosti".
- Supervised fine-tuning: doladenie na pároch inštrukcia → vzorová odpoveď, aby vedel poslúchať.
- Preferenčné ladenie (RLHF): model sa naučí, ktoré odpovede ľudia preferujú — užitočnejšie, bezpečnejšie, v správnom štýle.
Až po týchto fázach vznikne „asistent", akého poznáš z chatu.
3. Ako to funguje: tokeny, predpoveď a pozornosť
- Tokeny: model nevidí text ako písmená, ale ako tokeny (kúsky slov). Preto 1 veta ≠ fixný počet „slov" v limite.
- Predpoveď ďalšieho tokenu: základný trik je jednoduchý — model pokračuje v texte. Chat je v jadre stále „pokračovanie".
- Transformery a attention: model si pri generovaní „prezerá" relevantné časti kontextu a vyhodnocuje, čo je dôležité.
- Kontextové okno: obmedzený priestor toho, čo si „pamätá" v jednej interakcii — pracovný stôl, nie dlhodobá pamäť.
Zjednodušene, jadro generovania:
vstup → tokenizácia → [transformer: attention + vrstvy] → pravdepodobnosti
ďalšieho tokenu → výber tokenu → pridaj k vstupu → opakuj
4. Čo si všimneš v praxi: schopnosti
- Plynulý text a štýl: vecne, formálne, stručne aj „ľudsky" — podľa zadania.
- Súhrny a extrakcia: z dlhého textu vytiahne body, úlohy, riziká, rozhodnutia.
- Q&A nad dokumentmi: s prístupom k podkladom odpovedá „v kontexte".
- Kód a technické úlohy: návrh, refaktor, testy, vysvetlenie chýb — stále potrebuje kontrolu.
- Multimodalita: mnoho moderných „LLM" zvláda aj obrázky či audio — preto sa hovorí o multimodálnych modeloch.
5. Parametre, ktoré ťa naozaj zaujímajú
| Parameter | Čo to znamená v reálnom použití | Kedy to riešiš najviac |
|---|---|---|
| Kontextové okno | Koľko textu „unesie" v jednej konverzácii | dokumenty, dlhé chaty, projekty |
| Max output | Ako dlhú odpoveď vie vytvoriť naraz | reporty, návrhy, dlhý kód |
| Latencia | Čas do prvej odpovede | chat, podpora, brainstorming |
| Spoľahlivosť | Ako často si vymýšľa alebo sa mýli | fakty, právne/finančné texty |
| Tool-use | Ako dobre využije pripojené nástroje | automatizácia, agenti, workflow |
6. Volanie LLM cez API (príklad)
Väčšina poskytovateľov má podobné „chat completions" rozhranie:
# OpenAI-kompatibilný štýl — funguje naprieč viacerými poskytovateľmi
resp = client.chat.completions.create(
model="...",
messages=[
{"role": "system", "content": "Si stručný asistent. Odpovedaj v bodoch."},
{"role": "user", "content": "Zhrň výhody RAG v 3 bodoch."},
],
)
print(resp.choices[0].message.content)
Rola system nastavuje správanie, user je tvoja požiadavka. Modely ako Claude Opus 4.8, GPT či Gemini zdieľajú túto základnú štruktúru.
7. Limity a riziká
- Halucinácie: model znie presvedčivo aj bez opory v dátach — fakty ber ako „návrh", nie pravdu.
- Kontextové skreslenie: s chybným predpokladom sa často drží (lebo „pokračuje v príbehu").
- Prompt injection: externý obsah (web, e-mail) môže obsahovať text, ktorý sa snaží model zmanipulovať („ignoruj pravidlá…").
- Súkromie: vstup môže byť logovaný podľa pravidiel služby — do citlivých dát opatrne.
- Autorské riziká: generovaný text/kód môže pripomínať existujúce diela; pri komerčnom použití maj kontrolu.
8. Ako sa to rieši v praxi
- RAG (retrieval): model odpovedá z relevantných podkladov vytiahnutých vyhľadávaním, nie „z pamäte".
- Overenie pri faktoch: dvojkrok — najprv odpoveď, potom kontrola tvrdení proti podkladom.
- Štruktúrované výstupy: pýtaj si JSON, checklist, tabuľku — menej chaosu.
- Rozdelenie úloh: „najprv plán, potom realizácia".
- Guardrails: pravidlá, filtre a validácia výsledku v aplikácii.
- Lokálne modely: pri citlivých dátach má zmysel privátne prostredie — výmenou za výkon.
9. Quick Reference
- Povedz cieľ: „napíš e-mail", „sprav sumarizáciu", nie len „čo si myslíš".
- Daj kontext v bodoch: publikum, tón, obmedzenia, formát výstupu.
- Zaveď kontrolu: pri dôležitom obsahu „čo si domyslel vs. čo máš z podkladov".
- Pracuj iteratívne: prvý výstup je draft.
- Nedávaj citlivé dáta bez istoty: správaj sa, akoby to čítal niekto cudzí.
Zhrnutie
- LLM generuje a spracúva text (často aj ďalšie modality) najmä cez predpoveď ďalšieho tokenu v kontexte.
- Vzniká v troch fázach: pretraining → fine-tuning → RLHF; jadrom je attention.
- Je to univerzálny nástroj na písanie, sumarizáciu, vyhľadávanie a kód, ale nie garant pravdy.
- Najlepšie výsledky dáva dobrý kontext, štruktúrované zadanie, RAG/overovanie a iterácia.