Claude Code AgentOS: Systém paměti bez zapomínání

Claude Code je výkonný nástroj, ale jeho výchozí paměť je překvapivě slabá. Zapomíná rozhodnutí, kontext i odvedenou práci. Tento článek popisuje, jak vznikl vlastní AgentOS s pamětí schopnou vyhledávat podle významu a citovat zdroje každé odpovědi.

Čtyři pilíře dokonalé paměti pro Claude Code

Autor definoval dokonalou paměť pro firemní použití prostřednictvím čtyř konkrétních vlastností. Každou z nich převzal z jiného open-source projektu, který danou část řeší nejlépe.

Citování zdrojů (z GBrain) – při každé odpovědi systém uvede, odkud informace pochází, přesná slova z původního rozhovoru a datum, kdy bylo něco dohodnuto. Pokud odpověď nezná, přizná to místo vymýšlení.
Rychlé načtení nedávného kontextu (z Hermes) – při startu každé session se pomocí hooku tiše injektuje malý, zastropovaný snímek klíčového kontextu, aby nedocházelo k tzv. context rot (postupné ztrátě důležitého kontextu v dlouhých konverzacích).
Dlouhodobé vyhledávání podle významu (z Memsearch) – konverzace se rozdělí na části (chunky), převedou do vektorů a uloží pro hybridní sémantické i klíčové vyhledávání. Dotaz na „platební zpracování“ vrátí i výsledky obsahující Stripe, přestože slovo „Stripe“ ve vyhledávání nebylo.
Rozsahový přístup pro tým (z GBrain) – jeden sdílený mozek, kde je každá vzpomínka označena vlastníkem a každý dotaz filtrován podle toho, kdo se ptá. Člen týmu vidí pouze klienty a projekty, ke kterým má přístup.

Proč výchozí paměť Claude Code nestačí

Každý systém paměti odpovídá na tři otázky: kde a jak ukládá data, co injektuje do krátkodobého kontextu při novém sezení a jak vybavuje správnou informaci na dotaz. Claude Code je ve všech třech oblastech slabý.

Ukládání: Funkce automemory zachytí jen minimum. V repozitáři používaném měsíce se nashromáždily pouze dva soubory s jedním záznamem.
Injekce: Při startu sezení se načte claude.md a memory.md, ale protože se toho málo ukládá, je kontext prakticky prázdný a vše je nutné zadávat ručně.
Vybavování: Neexistuje žádné sémantické vyhledávání. Systém prohledává pouze soubor automemory nebo celé předchozí session, což je náročné na tokeny a nespolehlivé. Dotaz na dohodu z meetingu před šesti měsíci často nevrátí žádný výsledek.

Jak systém funguje v praxi: tok dat od začátku do konce

Po každém obratu v konverzaci se aktivuje stop hook, který rozhodne, zda má být informace uložena jako krátkodobá paměť (rozhodnutí, cenové změny, preference) do souboru memory.md. Zároveň ji vždy vloží do dlouhodobého vektorového úložiště.

Krátkodobá paměť se jako „frozen snapshot“ (zmrazený snímek stavu) injektuje do každého nového sezení, podobně jako Hermes injektuje soul.md, user.md, memory.md a today.
Vše se navíc rozdělí na části a uloží do vektoru pro pozdější sémantické vyhledávání, bez ohledu na to, zda šlo do krátkodobé paměti.
Třístupňový retrieval (vyhledávání a vybavování): nejdříve se prohledá krátkodobý kontext, pak vektorová databáze (top 5–10 výsledků), výsledky se přeřadí a syntetizují do citované odpovědi s uvedením souboru, řádku a data.

Proč byl Memsearch nahrazen PG Lite a PG Vector

Původně byl pro dlouhodobé úložiště plánován Memsearch, nakonec ho však nahradilo lokálně hostované PG Lite a Vector Store. Důvody jsou tři.

Žádné externí závislosti – systém běží lokálně na PC.
Funguje na Windows – Memsearch byl na Windows problematický a vyžadoval cloudový účet.
Umožňuje scoping paměti per uživatel. Pro týmové použití se nastavuje Railway Postgres databáze s row-level security (zabezpečení na úrovni řádků), která řídí přístup podle systému, týmu, klienta nebo soukromého rozsahu.

Zpětné načtení historických session a týmový AgentOS

Systém řeší i problém existujících měsíců konverzací uložených pouze v historii session před samotnou instalací. Nástroj dokáže vzít celou historii předchozích session a automaticky z ní vytvořit krátkodobé i dlouhodobé vzpomínky. V den instalace tak uživatel nezačíná od nuly, ale s veškerým dříve sdíleným kontextem, který je okamžitě prohledatelný a citovatelný.

Týmový AgentOS (v době tvorby videa ve vývoji) přináší dvě klíčová pravidla: netechničtí členové týmu mohou přispívat přes Notion nebo Google Drive, zatímco Claude Code spravuje skills a memory funkce. Vše je zálohováno v GitHubu. Přístup je řízen Postgres databází s row-level security. Vlastník databáze vidí vše, junior člen týmu vidí pouze své přidělené klienty a projekty.

Pokud chcete tento AgentOS s kompletní pamětí zprovoznit bez nutnosti budovat vše od základů, autoři nabízejí instalaci na jeden řádek v rámci placené komunity Agentic Academy. Odkaz najdete v popisu videa. Více o možnostech AI agentů a jejich nasazení najdete také v naší znalostní bázi – například jak delegovat práci na AI agenta nebo jak nastavit perzistentní paměť v Claude Code.