Tato infografika ukazuje,
jak funguje AI agent, který může využívat různé nástroje a zároveň může být v procesu zapojen člověk (Human in the Loop). AI agent postupně analyzuje zadání, rozhoduje o dalších krocích, používá dostupné nástroje a iteruje, dokud nedojde k finální odpovědi. Celý proces řídí jazykový model (LLM), který funguje jako hlavní „mozek“ systému.
Vstup
Proces začíná vstupem – tedy dotazem nebo úkolem od uživatele. Může jít například o otázku, požadavek na analýzu dat, vytvoření reportu nebo vyhledání informací.
Příklady vstupu:
- Kolik máme zákazníků z Německa?
- Najdi aktuální informace o konkurenci.
- Vytvoř report z prodejních dat.
Tento vstup je předán jazykovému modelu (LLM).
LLM – mozek agenta
LLM (Large Language Model) funguje jako řídící vrstva AI agenta. Analyzuje zadání a rozhoduje, jak postupovat dál. Model vyhodnocuje, zda dokáže odpovědět přímo ze svých znalostí, nebo zda potřebuje získat další informace pomocí nástrojů. Klíčovou technikou, kterou LLM používá pro strukturované uvažování, je
Chain of Thought – řetězení myšlenek, které umožňuje rozložit komplexní úkoly na dílčí kroky.
Typicky si agent „položí otázku“:
Jaký nástroj mi pomůže získat informace potřebné k odpovědi?
Nástroje (Tools)
Pokud LLM potřebuje další data, využije externí nástroje. Ty umožňují agentovi pracovat s daty, systémy nebo dokumenty mimo samotný model.
Vyhledávání na webu (Web Search)
Agent může vyhledávat aktuální informace na internetu. Tento nástroj je užitečný například pro získání nejnovějších zpráv, informací o konkurenci nebo veřejných dat.
Dotaz do databáze (Database Query)
Agent může získat data z interních databází nebo firemních systémů. Typicky jde například o CRM, datové sklady nebo interní statistiky.
Výpočty / Python (Calculator / Python)
Tento nástroj umožňuje provádět matematické výpočty nebo datovou analýzu pomocí programovacího jazyka Python. Lze jej využít například pro statistiku, agregaci dat nebo tvorbu analytických výstupů.
Napojení na API (API Connector)
Agent může komunikovat s externími systémy prostřednictvím API. Díky tomu může pracovat například s CRM, ERP, marketingovými nástroji nebo jinými službami. Moderní přístup k propojení AI s externími aplikacemi představuje
MCP protokol, který standardizuje komunikaci mezi modely a datovými zdroji.
Čtení souborů (File Reader)
Agent může analyzovat dokumenty a soubory, například PDF, CSV, Excel nebo Word dokumenty. Tento nástroj umožňuje extrahovat informace z dokumentů a pracovat s nimi.
Vektorové vyhledávání (Vector Search / RAG)
Pomocí vektorového vyhledávání může agent hledat informace v interní znalostní bázi. Dokumenty jsou převedeny do
vektorových reprezentací (embeddingů), což umožňuje vyhledávání podle významu textu. Tato technika se nazývá
RAG – Retrieval-Augmented Generation a patří mezi nejúčinnější metody, jak doplnit
znalosti LLM o externí data. Pro ukládání embeddingů se využívá
vektorová databáze, která umožňuje rychlé sémantické vyhledávání. Podrobný přehled
RAG architektury nabízí AWS.
Automatizace / Akce (Automation / Actions)
Agent může provádět konkrétní akce v systémech. Například může odeslat e-mail, vytvořit ticket v helpdesku, založit záznam v CRM nebo spustit workflow. Tato oblast úzce souvisí s
automatizací firemních procesů.
Spouštění kódu (Code Execution)
Agent může generovat a spouštět skripty nebo programy, které řeší konkrétní úlohy. To umožňuje automatizovat složitější operace nebo zpracování dat.
Pozorování (Observation)
Když agent použije některý z nástrojů, získá výsledek – tzv. pozorování (observation). Může jít například o výsledek databázového dotazu, odpověď z API, výstup z Python skriptu nebo nalezené dokumenty.
LLM tento výsledek vyhodnotí a rozhodne, zda je potřeba použít další nástroj, nebo zda už má dost informací pro finální odpověď.
Smyčka rozhodování
Proces funguje jako opakující se smyčka:
- LLM rozhodne, jaký krok udělat
- agent použije vhodný nástroj
- získá výsledek
- vyhodnotí ho a rozhodne o dalším kroku
Tento cyklus se opakuje tak dlouho, dokud agent nedosáhne konečné odpovědi. Tento přístup formalizuje
ReAct framework, který kombinuje uvažování (Reasoning) s akcemi (Acting). Více o této architektuře popisuje
IBM ve svém přehledu ReAct agentů. Detailní návod k implementaci nabízí také
Prompt Engineering Guide.
Human in the Loop
V některých situacích může být do procesu zapojen člověk. Tomu se říká
Human in the Loop (HITL). Člověk může do procesu vstoupit například ve chvíli, kdy je potřeba potvrdit rozhodnutí, zkontrolovat výstup nebo schválit provedení určité akce.
Typické situace, kdy vstupuje člověk:
- schválení důležité akce
- kontrola kvality výstupu
- doplnění kontextu
- řešení nejednoznačné situace
Tento přístup zvyšuje bezpečnost, kontrolu nad systémem a spolehlivost výsledků.
Stanford Human-Centered AI Institute zdůrazňuje, že HITL přeformuluje automatizační problém na problém interakce člověk-počítač. Praktickou implementaci v cloudových službách popisuje
Google Cloud.
Výstup
Jakmile agent získá všechny potřebné informace, vytvoří finální výstup. Může jít například o textovou odpověď, analytický report, doporučení nebo provedení konkrétní akce v systému.
Díky tomu AI není omezená jen na znalosti modelu, ale dokáže pracovat s aktuálními daty, interními systémy a reálnými akcemi. Pokud vás zajímá, jak efektivně
delegovat práci na AI agenta, přečtěte si náš praktický průvodce.