Hermes: Otvorené modely od Nous Research

Hermes je rodina open-weights jazykových modelov od Nous Research — jeden z najznámejších príkladov toho, ako ďaleko sa dá dostať kvalitným post-trainingom otvorených základov. Pre každého, kto chce bežať silný model lokálne alebo bez závislosti na uzavretých API, je Hermes referenčný bod.

1. Čo je Hermes a kto za ním stojí

Nous Research začínal ako komunita nadšencov okolo fine-tuningu otvorených modelov a vyrástol na rešpektované AI laboratórium. Séria Hermes je ich vlajková loď: nejde o modely trénované od nuly, ale o dôkladný post-training (SFT + preferenčné techniky ako DPO) nad otvorenými základmi — historicky Llama, neskôr aj ďalšie open-weights rodiny.

Kľúčové črty filozofie Hermes:

Open weights — váhy sú voľne stiahnuteľné (Hugging Face), model môžete bežať na vlastnom hardvéri.
Steerability — model sa drží system promptu bez toho, aby presadzoval vlastnú „osobnosť" alebo nadbytočné odmietanie.
Transparentný tréning — Nous publikuje technické reporty a veľkú časť dátových postupov.

2. Ako Hermes vzniká: dáta namiesto výpočtov

Nous Research nemá tréningové rozpočty frontier laboratórií, preto stavia na kvalite dát. Pipeline DataForge generuje syntetické tréningové príklady cielene podľa domén (kód, matematika, roleplay, štruktúrované výstupy) a filtruje ich cez automatické hodnotenie. Výsledok: relatívne malý, ale hustý dataset, ktorý zo základného modelu vytiahne výrazne lepšie správanie.

Novšie generácie (Hermes 3, Hermes 4) pridali hybridné reasoning režimy — model vie na požiadanie prepnúť do dlhého uvažovania s <think> stopou a potom vrátiť zhustenú odpoveď, podobne ako uzavreté reasoning modely.

3. Hermes vs. uzavreté modely — kedy čo

Kritérium	Hermes (open-weights)	Uzavreté API (Claude, GPT)
Nasadenie	vlastný hardvér, plná kontrola	len cez API poskytovateľa
Súkromie dát	dáta neopúšťajú vašu infraštruktúru	dáta idú tretej strane
Špičkový výkon	top medzi open-weights	vyšší (frontier trieda)
Cena pri veľkom objeme	fixné náklady na GPU	platba za token
Údržba	vlastná zodpovednosť	rieši poskytovateľ
Prispôsobenie	plný fine-tuning možný	obmedzené (prompt, RAG)

4. Praktické použitie

Lokálne nasadenie: menšie varianty (8B–70B) bežia na jednej pracovnej stanici s dostatočnou VRAM; kvantizované verzie (GGUF, AWQ) aj na spotrebiteľských GPU.
Function calling a JSON: Hermes má dlhodobo nadštandardnú podporu štruktúrovaných výstupov a volania nástrojov — hodí sa do agentických pipeline, kde potrebujete spoľahlivú schému.
Citlivé domény: tam, kde dáta nesmú opustiť firmu (zdravotníctvo, právo, interné dokumenty), je open-weights model s vlastným hostingom často jediná schodná cesta.
Výskum: voľné váhy umožňujú interpretability experimenty, ablácie a vlastný ďalší fine-tuning.

5. Limity a na čo si dať pozor

Výkonový strop: proti aktuálnym frontier modelom (Claude Fable 5 a spol.) Hermes zaostáva v najťažších reasoning a agentických úlohách — porovnateľný je skôr so staršími uzavretými generáciami.
Steerability je dvojsečná: minimálne odmietanie znamená, že bezpečnostné mantinely si musíte postaviť sami (filtre, moderácia, audit logy).
Prevádzková réžia: serving, škálovanie, monitoring a aktualizácie modelu idú za vami — TCO býva vyšší, než vyzerá z ceny GPU.
Licencie základov: váhy dedia licenciu základného modelu (napr. Llama Community License) — pred komerčným nasadením treba skontrolovať podmienky.

Zhrnutie: Hermes od Nous Research je najviditeľnejšia odpoveď open-weights sveta na uzavreté modely: dátovo precízny post-training, silná steerability a plná kontrola nad nasadením. Frontier výkon nečakajte, ale ako lokálny pracant pre štruktúrované úlohy a citlivé dáta je ťažko prekonateľný.