Hermes: Otvorené modely od Nous Research
Hermes je rodina open-weights jazykových modelov od Nous Research — jeden z najznámejších príkladov toho, ako ďaleko sa dá dostať kvalitným post-trainingom otvorených základov. Pre každého, kto chce bežať silný model lokálne alebo bez závislosti na uzavretých API, je Hermes referenčný bod.
1. Čo je Hermes a kto za ním stojí
Nous Research začínal ako komunita nadšencov okolo fine-tuningu otvorených modelov a vyrástol na rešpektované AI laboratórium. Séria Hermes je ich vlajková loď: nejde o modely trénované od nuly, ale o dôkladný post-training (SFT + preferenčné techniky ako DPO) nad otvorenými základmi — historicky Llama, neskôr aj ďalšie open-weights rodiny.
Kľúčové črty filozofie Hermes:
- Open weights — váhy sú voľne stiahnuteľné (Hugging Face), model môžete bežať na vlastnom hardvéri.
- Steerability — model sa drží system promptu bez toho, aby presadzoval vlastnú „osobnosť" alebo nadbytočné odmietanie.
- Transparentný tréning — Nous publikuje technické reporty a veľkú časť dátových postupov.
2. Ako Hermes vzniká: dáta namiesto výpočtov
Nous Research nemá tréningové rozpočty frontier laboratórií, preto stavia na kvalite dát. Pipeline DataForge generuje syntetické tréningové príklady cielene podľa domén (kód, matematika, roleplay, štruktúrované výstupy) a filtruje ich cez automatické hodnotenie. Výsledok: relatívne malý, ale hustý dataset, ktorý zo základného modelu vytiahne výrazne lepšie správanie.
Novšie generácie (Hermes 3, Hermes 4) pridali hybridné reasoning režimy — model vie na požiadanie prepnúť do dlhého uvažovania s <think> stopou a potom vrátiť zhustenú odpoveď, podobne ako uzavreté reasoning modely.
3. Hermes vs. uzavreté modely — kedy čo
| Kritérium | Hermes (open-weights) | Uzavreté API (Claude, GPT) |
|---|---|---|
| Nasadenie | vlastný hardvér, plná kontrola | len cez API poskytovateľa |
| Súkromie dát | dáta neopúšťajú vašu infraštruktúru | dáta idú tretej strane |
| Špičkový výkon | top medzi open-weights | vyšší (frontier trieda) |
| Cena pri veľkom objeme | fixné náklady na GPU | platba za token |
| Údržba | vlastná zodpovednosť | rieši poskytovateľ |
| Prispôsobenie | plný fine-tuning možný | obmedzené (prompt, RAG) |
4. Praktické použitie
- Lokálne nasadenie: menšie varianty (8B–70B) bežia na jednej pracovnej stanici s dostatočnou VRAM; kvantizované verzie (GGUF, AWQ) aj na spotrebiteľských GPU.
- Function calling a JSON: Hermes má dlhodobo nadštandardnú podporu štruktúrovaných výstupov a volania nástrojov — hodí sa do agentických pipeline, kde potrebujete spoľahlivú schému.
- Citlivé domény: tam, kde dáta nesmú opustiť firmu (zdravotníctvo, právo, interné dokumenty), je open-weights model s vlastným hostingom často jediná schodná cesta.
- Výskum: voľné váhy umožňujú interpretability experimenty, ablácie a vlastný ďalší fine-tuning.
5. Limity a na čo si dať pozor
- Výkonový strop: proti aktuálnym frontier modelom (Claude Fable 5 a spol.) Hermes zaostáva v najťažších reasoning a agentických úlohách — porovnateľný je skôr so staršími uzavretými generáciami.
- Steerability je dvojsečná: minimálne odmietanie znamená, že bezpečnostné mantinely si musíte postaviť sami (filtre, moderácia, audit logy).
- Prevádzková réžia: serving, škálovanie, monitoring a aktualizácie modelu idú za vami — TCO býva vyšší, než vyzerá z ceny GPU.
- Licencie základov: váhy dedia licenciu základného modelu (napr. Llama Community License) — pred komerčným nasadením treba skontrolovať podmienky.
Zhrnutie: Hermes od Nous Research je najviditeľnejšia odpoveď open-weights sveta na uzavreté modely: dátovo precízny post-training, silná steerability a plná kontrola nad nasadením. Frontier výkon nečakajte, ale ako lokálny pracant pre štruktúrované úlohy a citlivé dáta je ťažko prekonateľný.