Claude Code AgentOS: Systém paměti bez zapomínání

Claude AI Čvn 18, 2026

Claude Code je výkonný nástroj, ale jeho výchozí paměť je překvapivě slabá. Zapomíná rozhodnutí, kontext i odvedenou práci. Tento článek popisuje, jak vznikl vlastní AgentOS s pamětí schopnou vyhledávat podle významu a citovat zdroje každé odpovědi.

Čtyři pilíře dokonalé paměti pro Claude Code

Autor definoval dokonalou paměť pro firemní použití prostřednictvím čtyř konkrétních vlastností. Každou z nich převzal z jiného open-source projektu, který danou část řeší nejlépe.

  • Citování zdrojů (z GBrain) – při každé odpovědi systém uvede, odkud informace pochází, přesná slova z původního rozhovoru a datum, kdy bylo něco dohodnuto. Pokud odpověď nezná, přizná to místo vymýšlení.
  • Rychlé načtení nedávného kontextu (z Hermes) – při startu každé session se pomocí hooku tiše injektuje malý, zastropovaný snímek klíčového kontextu, aby nedocházelo k tzv. context rot (postupné ztrátě důležitého kontextu v dlouhých konverzacích).
  • Dlouhodobé vyhledávání podle významu (z Memsearch) – konverzace se rozdělí na části (chunky), převedou do vektorů a uloží pro hybridní sémantické i klíčové vyhledávání. Dotaz na „platební zpracování“ vrátí i výsledky obsahující Stripe, přestože slovo „Stripe“ ve vyhledávání nebylo.
  • Rozsahový přístup pro tým (z GBrain) – jeden sdílený mozek, kde je každá vzpomínka označena vlastníkem a každý dotaz filtrován podle toho, kdo se ptá. Člen týmu vidí pouze klienty a projekty, ke kterým má přístup.

Proč výchozí paměť Claude Code nestačí

Každý systém paměti odpovídá na tři otázky: kde a jak ukládá data, co injektuje do krátkodobého kontextu při novém sezení a jak vybavuje správnou informaci na dotaz. Claude Code je ve všech třech oblastech slabý.

  • Ukládání: Funkce automemory zachytí jen minimum. V repozitáři používaném měsíce se nashromáždily pouze dva soubory s jedním záznamem.
  • Injekce: Při startu sezení se načte claude.md a memory.md, ale protože se toho málo ukládá, je kontext prakticky prázdný a vše je nutné zadávat ručně.
  • Vybavování: Neexistuje žádné sémantické vyhledávání. Systém prohledává pouze soubor automemory nebo celé předchozí session, což je náročné na tokeny a nespolehlivé. Dotaz na dohodu z meetingu před šesti měsíci často nevrátí žádný výsledek.

Jak systém funguje v praxi: tok dat od začátku do konce

Po každém obratu v konverzaci se aktivuje stop hook, který rozhodne, zda má být informace uložena jako krátkodobá paměť (rozhodnutí, cenové změny, preference) do souboru memory.md. Zároveň ji vždy vloží do dlouhodobého vektorového úložiště.

  • Krátkodobá paměť se jako „frozen snapshot“ (zmrazený snímek stavu) injektuje do každého nového sezení, podobně jako Hermes injektuje soul.md, user.md, memory.md a today.
  • Vše se navíc rozdělí na části a uloží do vektoru pro pozdější sémantické vyhledávání, bez ohledu na to, zda šlo do krátkodobé paměti.
  • Třístupňový retrieval (vyhledávání a vybavování): nejdříve se prohledá krátkodobý kontext, pak vektorová databáze (top 5–10 výsledků), výsledky se přeřadí a syntetizují do citované odpovědi s uvedením souboru, řádku a data.

Proč byl Memsearch nahrazen PG Lite a PG Vector

Původně byl pro dlouhodobé úložiště plánován Memsearch, nakonec ho však nahradilo lokálně hostované PG Lite a Vector Store. Důvody jsou tři.

  • Žádné externí závislosti – systém běží lokálně na PC.
  • Funguje na Windows – Memsearch byl na Windows problematický a vyžadoval cloudový účet.
  • Umožňuje scoping paměti per uživatel. Pro týmové použití se nastavuje Railway Postgres databáze s row-level security (zabezpečení na úrovni řádků), která řídí přístup podle systému, týmu, klienta nebo soukromého rozsahu.

Zpětné načtení historických session a týmový AgentOS

Systém řeší i problém existujících měsíců konverzací uložených pouze v historii session před samotnou instalací. Nástroj dokáže vzít celou historii předchozích session a automaticky z ní vytvořit krátkodobé i dlouhodobé vzpomínky. V den instalace tak uživatel nezačíná od nuly, ale s veškerým dříve sdíleným kontextem, který je okamžitě prohledatelný a citovatelný.

Týmový AgentOS (v době tvorby videa ve vývoji) přináší dvě klíčová pravidla: netechničtí členové týmu mohou přispívat přes Notion nebo Google Drive, zatímco Claude Code spravuje skills a memory funkce. Vše je zálohováno v GitHubu. Přístup je řízen Postgres databází s row-level security. Vlastník databáze vidí vše, junior člen týmu vidí pouze své přidělené klienty a projekty.

Pokud chcete tento AgentOS s kompletní pamětí zprovoznit bez nutnosti budovat vše od základů, autoři nabízejí instalaci na jeden řádek v rámci placené komunity Agentic Academy. Odkaz najdete v popisu videa. Více o možnostech AI agentů a jejich nasazení najdete také v naší znalostní bázi – například jak delegovat práci na AI agenta nebo jak nastavit perzistentní paměť v Claude Code.

Vladimír Matula

Vladimír Matula se v digitálním marketingu pohybuje od roku 2008. Svou expertízu staví na pevných základech z předních českých agentur, kde se specializoval na tvorbu webů, ecommerce, SEO a webovou analytiku. V roce 2012 založil marketingovou agenturu DIVERSITY PROMOTION s.r.o., kde nabízí online marketingové služby, tvorbu webů na WordPress, tvorbu eshopů na platformě Shoptet, Web design a AI marketing. Generativní AI integruje do klíčových procesů – od hloubkové analýzy dat, SEO a konverzního copywritingu podle ověřených vzorců až po automatizaci rutinních úkolů, které přináší úsporu času a vyšší kvalitu výstupů nejen jemu, ale i jeho klientům.