AI agenti 2027: Budoucnost autonomních systémů

Na konferenci Interrupt 26 o tom mluvil Harrison Chase z LangChain a řekl: „Zapomeňte na hloupé chatboty, kterých se musíte na všechno ptát. Blíží se doba, kdy digitální asistenti budou pracovat sami, klidně i několik dní v kuse, a budou se sami učit z vlastních chyb.“

Když roboti mluví a mají vlastní občanku

Dřív to fungovalo tak, že když jsi na robota mluvil, počítač tvůj hlas nejdřív složitě přepsal do textu, pak vymyslel textovou odpověď a tu teprve přečetl. Teď přichází změna – roboti spolu budou mluvit přímo hlasem, což bude působit mnohem přirozeněji, bez trapného ticha a čekání.

Navíc tito asistenti začínají mít v digitálním světě svou vlastní identitu. Když za tebe robot půjde vyřídit vrácení zboží na e-shop, bude mít buď tvoje klíče (bude vystupovat tvým jménem), nebo bude mít zaměstnaneckou kartičku firmy (servisní účet), aby každý věděl, že jedná s automatem.

Dva hlavní směry: dlouhá práce a rychlá komunikace

První skupinou budou agenti pro delší a složitější úkoly. To jsou systémy, které mohou běžet několik minut, hodin, nebo v některých případech i déle. Budou se hodit pro práci, kde nestačí jedna odpověď z chatu.

Typicky půjde o analýzu dat, přípravu reportů, rešerše, práci s dokumenty, kontrolu tabulek, tvorbu návrhů nebo vývojářské úkoly. Takový AI agent si může úkol rozdělit na kroky, spustit kód, použít různé nástroje, zapojit další specializované agenty a postupně dojít k výsledku.

Druhou skupinou budou agenti pro zákaznickou zkušenost. Ti musí fungovat rychle. Když člověk píše na podporu, volá do firmy nebo komunikuje s obchodníkem, nechce čekat dlouhé minuty. Tady bude klíčová nízká latence, přirozený styl komunikace, práce s tónem značky a stále častěji také hlas.

Jinak řečeno: jeden typ agenta bude řešit hlubší znalostní práci, druhý bude stát blíž zákaznické podpoře, prodeji a běžné komunikaci se zákazníky.

Hlas se stane důležitější součástí AI

LangChain zdůrazňuje i rostoucí význam hlasových agentů. Dnes většina hlasových AI řešení funguje tak, že se řeč nejdřív převede na text, ten zpracuje model a výstup se znovu převede na hlas.

Tento přístup známe například z různých voicebotů, asistentů nebo zákaznických linek. Funguje, ale pořád je to technicky složené z několika kroků.

Do budoucna se očekává větší nástup nativních speech-to-speech modelů, tedy modelů, které zvládnou pracovat přímo s hlasem. OpenAI, Google i další firmy tímto směrem už viditelně jdou. Otázkou je, zda převládne přímý hlasový model, klasická pipeline řeč-text-řeč, nebo kombinace obou přístupů.

Proč budou důležité sandboxy

U agentů, kteří mají dělat složitější práci, bude zásadní bezpečné prostředí pro spouštění kódu a testování postupů. Proto LangChain mluví o sandboxech.

Sandbox je izolované prostředí, kde může agent bezpečně spouštět kód, analyzovat data, zkoušet výpočty nebo pracovat se soubory, aniž by ohrozil produkční systémy firmy. To je důležité nejen pro coding agenty, ale také pro datovou analýzu, automatizaci marketingových činností, výzkum nebo práci s interními dokumenty.

Prakticky to znamená, že agent nebude jen „psát odpovědi“, ale bude mít prostor něco opravdu provést, ověřit a vrátit výsledek.

Open source modely budou hrát větší roli

Dalším výrazným tématem jsou open source modely. Důvod je jednoduchý: agenti často spotřebují hodně tokenů, protože musí plánovat, kontrolovat mezikroky, pracovat s nástroji a někdy opakovaně přemýšlet nad výsledkem.

Používat pro všechno nejdražší frontier modely typu GPT-4, Claude nebo Gemini nemusí být ekonomicky výhodné. Open source modely jako Qwen, Llama nebo další alternativy se proto stávají zajímavou možností, hlavně tam, kde firma potřebuje nižší cenu, větší kontrolu nebo možnost model doladit na vlastní doménu pomocí fine-tuningu.

LangChain zmiňuje také využití traces, tedy záznamů toho, jak agent při práci postupoval. Tyto záznamy mohou sloužit jako data pro další zlepšování systému nebo fine-tuning.

Kdo za agenta jedná?

Jakmile agent začne používat reálné nástroje, například Gmail, Slack, CRM, tabulky nebo interní databáze, přichází důležitá otázka identity a oprávnění.

Agent může jednat jménem konkrétního uživatele. V takovém případě má přístup jen k tomu, k čemu má přístup daný člověk. Obchodník, marketér a člověk z financí tak mohou od stejného agenta dostat rozdílné výsledky, protože každý vidí jiná data.

Druhou možností je agent s vlastní pevnou sadou přístupů, podobně jako servisní účet. Ten funguje jednotně pro všechny uživatele a odpovídá podle toho, k čemu má tento účet oprávnění.

Tohle bude důležité hlavně ve firmách, kde AI agenti nebudou jen radit, ale budou skutečně něco dělat. Klíčovou roli tu hrají MCP servery jako standardizovaný způsob napojení agentů na externí nástroje a data.

Kontinuální učení: agenti se musí zlepšovat z praxe

Jedním z hlavních sdělení přednášky bylo, že úspěšné agentní systémy se budou muset průběžně zlepšovat. Nejde jen o výběr nejlepšího modelu. Důležité je vylepšovat celý systém kolem něj, včetně samoučícího se agenta, který se dokáže adaptovat na základě zpětné vazby z praxe.

LangChain popisuje tři vrstvy.

První je model layer, tedy samotný jazykový model. Může jít o GPT, Claude, Gemini, Qwen nebo jiný model.

Druhá je harness layer. To je kód, pravidla, nástroje a logika, které určují, jak agent pracuje, jak plánuje kroky, kdy používá nástroje a jak kontroluje výsledek.

Třetí je context layer. Sem patří instrukce, firemní znalosti, dokumentace, skills, soubory typu agent.md nebo pravidla podobná custom instructions v ChatGPT. Právě tady hraje zásadní roli systém RAG, který agentovi umožňuje dynamicky čerpat z firemních dokumentů a znalostních bází.

Pointa je, že výkon agenta nezávisí jen na tom, jak chytrý je samotný model. Velký rozdíl dělá i to, jaké má instrukce, jaké nástroje používá a jak dobře je celý systém navržený.

LangSmith Fleet: agenti bez programování

LangChain zároveň představil LangSmith Fleet. Jde o managed agent builder, tedy platformu pro tvorbu agentů bez nutnosti psát kód.

Základní myšlenka je velmi praktická: agenty by měli umět stavět lidé, kteří danou práci skutečně dělají. Nejen vývojáři.

Marketér ví, jak má vypadat příprava kampaně. Obchodník ví, co potřebuje před schůzkou. HR člověk ví, jak kontrolovat kandidáty. Člověk ze zákaznické podpory ví, jaké dotazy se opakují nejčastěji. Fleet jim má umožnit popsat agenta přirozeným jazykem a napojit ho na nástroje, které už používají.

Platforma má podporovat integrace jako Slack, Gmail nebo Outlook, práci s přihlašovacími údaji, kontrolu nákladů, Human in the Loop a transparentnost přes LangSmith traces. Důležitá je také podpora schématu MCP a možnost používat různé modely, nejen jeden konkrétní ekosystém.

Co z toho plyne

Vývoj AI agentů míří k tomu, že se z nich stanou praktičtější pracovní systémy. Nebudou sloužit jen k odpovídání na otázky, ale stále častěji k provádění úkolů.

Někteří agenti budou dělat delší analytickou nebo znalostní práci. Jiní budou rychle komunikovat se zákazníky. Hlas bude přirozenější, open source modely budou ekonomicky zajímavější a firmy budou muset řešit oprávnění, kontrolu, bezpečnost i průběžné zlepšování.

Nejde tedy o konec chatbotů, ale o další fázi. ChatGPT ukázal, že lidé umí s AI komunikovat přirozeným jazykem. AI agenti teď posouvají tuto logiku dál: od konverzace k reálné práci v konkrétních nástrojích a firemních procesech.

Vladimír Matula

Vladimír Matula se v digitálním marketingu pohybuje od roku 2008. Svou expertízu staví na pevných základech z předních českých agentur, kde se specializoval na tvorbu webů, ecommerce, SEO a webovou analytiku. V roce 2012 založil marketingovou agenturu DIVERSITY PROMOTION s.r.o., kde nabízí online marketingové služby, tvorbu webů na WordPress, tvorbu eshopů na platformě Shoptet, Web design a AI marketing. Generativní AI integruje do klíčových procesů – od hloubkové analýzy dat, SEO a konverzního copywritingu podle ověřených vzorců až po automatizaci rutinních úkolů, které přináší úsporu času a vyšší kvalitu výstupů nejen jemu, ale i jeho klientům.