Pamäťové systémy AI agentov
Moderné AI agenty potrebujú pamäť — nielen kontext. Bez schopnosti uchovávať informácie nad rámec aktívneho okna sú agenty len chytrými chatbotmi, nie autonómnymi systémami.
1. Prečo nestačí kontext
Kontextové okno definuje, koľko textu model v jednom momente „vidí". Aj pri milióne tokenov narážame na štyri problémy:
- Cena: Dlhý kontext znamená drahé API volania — každý token sa počíta.
- Rýchlosť: Väčší kontext spomaľuje generovanie odpovede.
- Strata pozornosti: Modely pri extrémne dlhom kontexte strácajú presnosť na informáciách uprostred — fenomén nazývaný lost in the middle.
- Nekontinuita: Po skončení relácie kontext zmizne. Každá nová konverzácia začína od nuly.
Pamäťové systémy riešia všetky štyri obmedzenia oddelením toho, čo agent práve vidí, od toho, čo môže nájsť.
2. Štyri typy pamäti
Kognitívna veda rozlišuje štyri typy ľudskej pamäti. Moderné AI agenty ich replikujú do počítačovej architektúry:
Senzorická / okamžitá pamäť (In-Context) Aktuálny obsah promptu. Krátkodobá, prchavá — existuje len počas relácie. Zodpovedá tomu, čo model v danej chvíli spracúva.
Epizodická pamäť Záznam minulých udalostí a interakcií. Agent vie „čo sa stalo" — predchádzajúce konverzácie, rozhodnutia, výsledky vykonaných akcií. Ukladá sa externe a načítava pri ďalšom stretnutí.
Sémantická pamäť Faktické znalosti nezávislé od konkrétnych udalostí. Napríklad: „zákazník X preferuje formálnu komunikáciu", „modul Y má neošetrenú výnimku pri null vstupe". Organizuje sa vo vektorových databázach podľa sémantickej podobnosti.
Procedurálna pamäť Postupy, návody a definície nástrojov. Ako agent vykonáva akcie — systémové prompte, workflow schémy, API špecifikácie. Zvyčajne súčasť konfigurácie, nie dynamicky ukladaná.
3. Architektonické prístupy
| Typ pamäti | Implementácia | Príklady nástrojov | Hlavný limit |
|---|---|---|---|
| In-context buffer | Text priamo v prompte | LangChain ConversationBuffer | Veľkosť kontextového okna |
| Externý key-value store | Štruktúrovaná databáza | Redis, DynamoDB | Bez sémantického vyhľadávania |
| Vektorová (embedding) | Sémantické vyhľadávanie | Pinecone, Weaviate, Qdrant | Halucinačný recall |
| Grafová pamäť | Knowledge graph | Neo4j + LLM vrstva | Vysoká komplexnosť nastavenia |
| Komprimovaná / skrátená | LLM sumarizuje → uloží | Mem0, MemGPT | Strata detailov pri kompresii |
Väčšina produkčných systémov kombinuje viacero vrstiev: in-context buffer pre aktuálnu reláciu, vektorová databáza pre sémantickú pamäť, a kľúčové fakty v štruktúrovanom úložisku.
4. Praktické použitie
Zákaznícka podpora s kontextom histórie Agent pri každom kontakte načíta históriu zákazníka z vektorovej databázy. Zákazník nemusí prepisovať problém znova. Agent vie: „minulý mesiac ste riešili faktúru č. 2241, problém bol uzatvorený 14. mája."
Kódovacie agenty (Cursor, Claude Code) Agenty si ukladajú kontext projektu — architektúra, prijaté rozhodnutia, závislosti medzi modulmi. Pri dlhých sessions nepotrebujú celý codebase v kontexte naraz.
Výskumné multi-krokové agenty Agent uloží medzivýsledky do externej pamäte a pri ďalšom kroku pokračuje bez straty vlákna. Umožňuje úlohy, ktoré trvajú hodiny alebo dni.
Personalizovaní asistenti Systémy ako Mem0 alebo MemoryOS udržiavajú profil používateľa — preferencie, minulé úlohy, štýl komunikácie — naprieč všetkými reláciami a zariadeniami.
Základný produkčný vzor vyzerá takto:
# Uloženie sémantickej pamäte po relácii
memory.add(
user_id="u123",
text="user prefers concise bullet answers, no preamble",
memory_type="semantic"
)
# Recall na začiatku novej relácie
context_snippets = memory.search(
user_id="u123",
query="communication style preferences",
top_k=3
)
prompt = build_prompt(system_context=context_snippets, message=user_input)
5. Limity, riziká a otvorené problémy
Presnosť vyhľadávania Vektorové úložisko funguje na sémantickej podobnosti, nie na exaktných faktoch. Agent môže „zapamätať" niečo mierne odlišné od pôvodného záznamu — najmä ak embedding model sémantiku zjednodušil.
Aktívne zabúdanie Príliš veľa pamäti spomaľuje retrieval a zakladá šum. Systémy potrebujú pravidlá pre mazanie starých alebo neplatných záznamov — čo je v podstate mikro-mierka strojového unlearning problému.
Bezpečnosť a injekcia cez pamäť Externá pamäť je vektor útoku. Škodlivý záznam uložený v databáze môže pri budúcom retrieve manipulovať správanie agenta — varianta prompt injection útoku, ťažko detekovateľná štandardnými filtrami.
Konzistencia v multi-agent systémoch Keď viacero agentov zdieľa alebo zapisuje do rovnakej pamäte, vznikajú konflikty. Kto má autoritu prepisovať záznam? Ako sa rieši race condition pri súčasnom zápise? Existujúce protokoly (MCP, Agent2Agent) riešia komunikáciu medzi agentmi, nie správu zdieľanej pamäte — táto vrstva zatiaľ nemá štandard.
Náklady na škálovanie Embedding každého záznamu vyžaduje API volanie. Pri vysokom objeme interakcií sa tieto náklady rýchlo sčítajú. Selektívne ukladanie — len toho, čo je dlhodobo relevantné — je nevyhnutnosť, nie optimalizácia.
Zhrnutie: Pamäťové systémy sú kľúčová infraštruktúra pre skutočne autonómnych AI agentov — bez nich každá relácia začína od nuly a agenty ostávajú izolovanými nástrojmi. Optimálna architektúra kombinuje vektorové úložisko pre sémantickú pamäť, kompresiu pre epizodické záznamy a explicitné pravidlá pre bezpečné mazanie zastaraných informácií.