Claude Code je výkonný nástroj, ale jeho výchozí paměť je překvapivě slabá. Zapomíná rozhodnutí, kontext i odvedenou práci. Tento článek popisuje, jak vznikl vlastní AgentOS s pamětí schopnou vyhledávat podle významu a citovat zdroje každé odpovědi.
Čtyři pilíře dokonalé paměti pro Claude Code
Autor definoval dokonalou paměť pro firemní použití prostřednictvím čtyř konkrétních vlastností. Každou z nich převzal z jiného open-source projektu, který danou část řeší nejlépe.
- Citování zdrojů (z GBrain) – při každé odpovědi systém uvede, odkud informace pochází, přesná slova z původního rozhovoru a datum, kdy bylo něco dohodnuto. Pokud odpověď nezná, přizná to místo vymýšlení.
- Rychlé načtení nedávného kontextu (z Hermes) – při startu každé session se pomocí hooku tiše injektuje malý, zastropovaný snímek klíčového kontextu, aby nedocházelo k tzv. context rot (postupné ztrátě důležitého kontextu v dlouhých konverzacích).
- Dlouhodobé vyhledávání podle významu (z Memsearch) – konverzace se rozdělí na části (chunky), převedou do vektorů a uloží pro hybridní sémantické i klíčové vyhledávání. Dotaz na „platební zpracování“ vrátí i výsledky obsahující Stripe, přestože slovo „Stripe“ ve vyhledávání nebylo.
- Rozsahový přístup pro tým (z GBrain) – jeden sdílený mozek, kde je každá vzpomínka označena vlastníkem a každý dotaz filtrován podle toho, kdo se ptá. Člen týmu vidí pouze klienty a projekty, ke kterým má přístup.
Proč výchozí paměť Claude Code nestačí
Každý systém paměti odpovídá na tři otázky: kde a jak ukládá data, co injektuje do krátkodobého kontextu při novém sezení a jak vybavuje správnou informaci na dotaz. Claude Code je ve všech třech oblastech slabý.
- Ukládání: Funkce automemory zachytí jen minimum. V repozitáři používaném měsíce se nashromáždily pouze dva soubory s jedním záznamem.
- Injekce: Při startu sezení se načte claude.md a memory.md, ale protože se toho málo ukládá, je kontext prakticky prázdný a vše je nutné zadávat ručně.
- Vybavování: Neexistuje žádné sémantické vyhledávání. Systém prohledává pouze soubor automemory nebo celé předchozí session, což je náročné na tokeny a nespolehlivé. Dotaz na dohodu z meetingu před šesti měsíci často nevrátí žádný výsledek.
Jak systém funguje v praxi: tok dat od začátku do konce
Po každém obratu v konverzaci se aktivuje stop hook, který rozhodne, zda má být informace uložena jako krátkodobá paměť (rozhodnutí, cenové změny, preference) do souboru memory.md. Zároveň ji vždy vloží do dlouhodobého vektorového úložiště.
- Krátkodobá paměť se jako „frozen snapshot“ (zmrazený snímek stavu) injektuje do každého nového sezení, podobně jako Hermes injektuje soul.md, user.md, memory.md a today.
- Vše se navíc rozdělí na části a uloží do vektoru pro pozdější sémantické vyhledávání, bez ohledu na to, zda šlo do krátkodobé paměti.
- Třístupňový retrieval (vyhledávání a vybavování): nejdříve se prohledá krátkodobý kontext, pak vektorová databáze (top 5–10 výsledků), výsledky se přeřadí a syntetizují do citované odpovědi s uvedením souboru, řádku a data.
Proč byl Memsearch nahrazen PG Lite a PG Vector
Původně byl pro dlouhodobé úložiště plánován Memsearch, nakonec ho však nahradilo lokálně hostované PG Lite a Vector Store. Důvody jsou tři.
- Žádné externí závislosti – systém běží lokálně na PC.
- Funguje na Windows – Memsearch byl na Windows problematický a vyžadoval cloudový účet.
- Umožňuje scoping paměti per uživatel. Pro týmové použití se nastavuje Railway Postgres databáze s row-level security (zabezpečení na úrovni řádků), která řídí přístup podle systému, týmu, klienta nebo soukromého rozsahu.
Zpětné načtení historických session a týmový AgentOS
Systém řeší i problém existujících měsíců konverzací uložených pouze v historii session před samotnou instalací. Nástroj dokáže vzít celou historii předchozích session a automaticky z ní vytvořit krátkodobé i dlouhodobé vzpomínky. V den instalace tak uživatel nezačíná od nuly, ale s veškerým dříve sdíleným kontextem, který je okamžitě prohledatelný a citovatelný.
Týmový AgentOS (v době tvorby videa ve vývoji) přináší dvě klíčová pravidla: netechničtí členové týmu mohou přispívat přes Notion nebo Google Drive, zatímco Claude Code spravuje skills a memory funkce. Vše je zálohováno v GitHubu. Přístup je řízen Postgres databází s row-level security. Vlastník databáze vidí vše, junior člen týmu vidí pouze své přidělené klienty a projekty.
Pokud chcete tento AgentOS s kompletní pamětí zprovoznit bez nutnosti budovat vše od základů, autoři nabízejí instalaci na jeden řádek v rámci placené komunity Agentic Academy. Odkaz najdete v popisu videa. Více o možnostech AI agentů a jejich nasazení najdete také v naší znalostní bázi – například jak delegovat práci na AI agenta nebo jak nastavit perzistentní paměť v Claude Code.