Przewodnik po Hermes Agent: Samodoskonalący się agent AI typu Open-Source (2026)
Kompletny przewodnik po Hermes Agent od Nous Research: kroki instalacji, samodoskonaląca się pamięć, ponad 40 narzędzi, cennik i porównanie z OpenClaw w 2026 roku.
Hermes Agent od Nous Research to otwartoźródłowy agent AI na licencji MIT, który pamięta, czego się uczy, buduje umiejętności wielokrotnego użytku na podstawie doświadczenia i działa na praktycznie każdym LLM. Od swojej pierwszej premiery 25 lutego 2026 roku przekroczył liczbę 57 000 gwiazdek na GitHub i stał się najszybciej rozwijającym się frameworkiem dla agentów open-source w tym roku.
Ten przewodnik obejmuje wszystko, co musisz wiedzieć: co faktycznie robi Hermes Agent, jak go zainstalować, ile kosztuje, jak działa jego system samodoskonalącej się pamięci i czy ma sens w Twoim przepływie pracy.
TL;DR — Hermes Agent w skrócie
| Szczegół | Informacja |
|---|---|
| Deweloper | Nous Research |
| Licencja | MIT (w pełni open-source, użytek komercyjny dozwolony) |
| Gwiazdki GitHub | 57,000+ |
| Najnowsza wersja | v0.7.0 "Resilience Release" (3 kwietnia 2026) |
| Obsługiwane platformy | Linux, macOS, WSL2, Android (Termux) |
| Kanały czatu | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| Wsparcie LLM | 200+ modeli przez OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google |
| Wbudowane narzędzia | 40+ (web, terminal, pliki, przeglądarka, wizja, generowanie obrazów, TTS, cron, delegowanie) |
| Pamięć | Trwała między sesjami (SQLite + FTS5) |
| Samodoskonalący się | Tak — proceduralne tworzenie umiejętności z doświadczenia |
| Koszt | Za darmo (self-hosted) + $0–15/miesiąc za zużycie API |
Co wyróżnia Hermes Agent
Większość agentów AI jest bezstanowa. Dajesz im zadanie, one je wykonują (lub próbują), a następna rozmowa zaczyna się od zera. Hermes Agent przełamuje ten schemat dzięki trzem kluczowym możliwościom, które go wyróżniają.
Trwała pamięć między sesjami
Każda rozmowa jest zapisywana w bazie danych SQLite i indeksowana za pomocą pełnotekstowego wyszukiwania FTS5. Gdy później pojawia się podobne zadanie, Hermes przeszukuje własną historię, zamiast ładować całe stare sesje do okna kontekstowego (context window). Pobrane wyniki przechodzą przez podsumowanie LLM, dzięki czemu wstrzykiwany jest tylko istotny kontekst. Rezultat: agent staje się tym bardziej użyteczny, im dłużej go używasz.
Samodoskonaląca się pętla uczenia
Co 15 wywołań narzędzi, Hermes uruchamia punkt kontrolny samooceny. Jeśli praca obejmowała procedurę wielokrotnego użytku, automatycznie tworzy lub aktualizuje umiejętność — plik markdown przechowywany w ~/.hermes/skills/. Te proceduralne umiejętności rejestrują jak coś zrobić, a nie tylko co się wydarzyło. Następnym razem, gdy pojawi się podobny problem, Hermes ładuje odpowiednią umiejętność i wykonuje ją wydajniej.
To kluczowa różnica w porównaniu do innych agentów. Hermes oddziela pamięć proceduralną (metody) od pamięci epizodycznej (zdarzenia), a obie formy utrzymują się między sesjami.
Ponad 40 wbudowanych narzędzi w każdej kategorii
Hermes jest dostarczany z szerokim rejestrem narzędzi dostępnych od razu po instalacji:
- Operacje na plikach — odczyt, zapis, wyszukiwanie, edycja plików
- Terminal — uruchamianie poleceń powłoki, przechwytywanie danych wyjściowych
- Wyszukiwanie w sieci — pobieranie aktualnych informacji z internetu
- Automatyzacja przeglądarki — nawigacja, klikanie, zrzuty ekranu (oparta na Chromium)
- Wizja i generowanie obrazów — analiza wizualna, tworzenie obrazów przez FAL
- Wykonywanie kodu — izolowane środowisko do uruchamiania kodu (sandbox)
- Przeszukiwanie pamięci i sesji — przeszukiwanie przeszłych rozmów
- Delegowanie — uruchamianie sub-agentów do zadań równoległych
- Zadania cron — harmonogram zadań cyklicznych
- Home Assistant — sterowanie IoT i inteligentnym domem
- TTS — wyjście tekstowo-mowę
- Todo — śledzenie zadań
- RL (reinforcement learning) — samouczenie się poprzez Atropos
hermes tools.
Jak zainstalować Hermes Agent
Hermes działa na systemach Linux, macOS, WSL2 i Android (Termux). Natywny Windows nie jest obsługiwany — zamiast tego użyj WSL2. Cała konfiguracja zajmuje około pięciu minut.
Instalacja jednym poleceniem (zalecana)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
To polecenie zajmie się wszystkim: klonowaniem repozytorium, konfiguracją środowiska wirtualnego Python 3.11, instalacją zależności i konfiguracją katalogów.
Instalacja ręczna
# 1. Zainstaluj uv (szybki menedżer pakietów Python)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Sklonuj repozytorium
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. Utwórz środowisko wirtualne i zainstaluj
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
Skonfiguruj swojego dostawcę LLM
# Uruchom kreatora konfiguracji
hermes setup
# Lub skonfiguruj ręcznie — dodaj swój klucz API do ~/.hermes/.env
echo "OPENROUTER_API_KEY=twoj-klucz-tutaj" >> ~/.hermes/.env
# Wybierz swój model
hermes model
Hermes współpracuje z każdym LLM, który obsługuje kontekst 64K+. Popularne wybory to modele z OpenRouter (ponad 200 opcji), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic oraz Google.
Opcjonalnie: Dodaj klucze specyficzne dla narzędzi
# Wyszukiwanie w sieci (Firecrawl)
echo "FIRECRAWL_API_KEY=twoj-klucz" >> ~/.hermes/.env
# Generowanie obrazów (FAL)
echo "FAL_KEY=twoj-klucz" >> ~/.hermes/.env
Uruchomienie
# Tryb CLI
hermes
# Lub połącz się z platformą komunikacyjną
hermes gateway
Proces gateway łączy agenta Hermes jednocześnie z Telegramem, Discordem, Slackiem, WhatsAppem i Signalem za pomocą jednego procesu.
v0.7.0 — Wydanie Resilience
Ostatnia duża aktualizacja (3 kwietnia 2026) przyniosła 168 PR-ów i rozwiązała 46 problemów. Oto najważniejsze zmiany:
Wtyczkowi dostawcy pamięci. Pamięć jest teraz rozszerzalnym systemem wtyczek. Backend-y firm trzecich (magazyny wektorowe, Honcho, niestandardowe bazy danych) implementują prosty interfejs dostawcy i rejestrują się w systemie wtyczek. Nie jesteś już ograniczony tylko do SQLite. Rotacja puli poświadczeń. Skonfiguruj wiele kluczy API dla tego samego dostawcy. Hermes rotuje nimi automatycznie, korzystając z bezpiecznej dla wątków strategii „najmniej używanego”. Błąd 401 wyzwala natychmiastową rotację do następnego klucza. Przeglądarka anty-detekcyjna Camofox. Nowy lokalny backend przeglądarki wykorzystujący Camoufox do niewykrywalnego przeglądania z trwałymi sesjami i wykrywaniem adresów URL VNC do wizualnego debugowania. Podgląd zmian inline (diff). Operacje zapisu i łatania plików pokazują teraz podgląd zmian (diff) bezpośrednio w kanale aktywności narzędzi, dając wizualne potwierdzenie zmian, zanim agent przejdzie dalej. Ciągłość sesji serwera API. Serwer API przesyła strumieniowo zdarzenia postępu narzędzi w czasie rzeczywistym i obsługuje nagłówkiX-Hermes-Session-Id dla trwałych sesji między żądaniami HTTP.
Hermes Agent vs. OpenClaw — Co wybrać?
OpenClaw to drugi duży framework dla agentów open-source w 2026 roku. Oto bezpośrednie porównanie.
| Funkcja | Hermes Agent | OpenClaw |
|---|---|---|
| Gwiazdki GitHub | 57,000+ | 15,000+ |
| Licencja | MIT | MIT |
| Samodoskonaląca się pamięć | Tak (proceduralna + epizodyczna) | Nie (oparta na plikach, ręczna) |
| Pętla uczenia | Automatyczne tworzenie umiejętności co 15 wywołań | Ręczna instalacja umiejętności przez ClawHub |
| Platformy czatu | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (w tym WeChat, Teams, Line, IRC, email) |
| Umiejętności społeczności | Rosnące (młody ekosystem) | 13,000+ na ClawHub |
| Luki CVE | 0 zgłoszonych (stan na kwieciecień 2026) | 9 CVE w 4 dni (marzec 2026, w tym CVSS 9.9) |
| Automatyzacja przeglądarki | Wbudowana (Chromium + Camofox) | Oparta na wtyczkach |
| Wsparcie modeli | 200+ przez OpenRouter + bezpośredni dostawcy | Podobny zakres |
| Typowy koszt | Za darmo + $0–15/miesiąc API | Za darmo + $5–15/miesiąc API + opcjonalny hosting $6/miesiąc |
Ile kosztuje Hermes Agent?
Sam Hermes jest darmowy i hostowany samodzielnie. Prawdziwym kosztem jest zużycie API LLM.
| Poziom użytkowania | Szacowany miesięczny koszt |
|---|---|
| Lekkie (kilka zadań dziennie, tani model) | $0–3 |
| Umiarkowane (codzienne użytkowanie, model średniej klasy) | $5–10 |
| Intensywne (zawsze włączony, model premium) | $10–15 |
| Power user (delegowanie do wielu agentów, wizja, gen. obrazów) | $15–30+ |
Warto wiedzieć: około 73% każdego wywołania API to stały narzut wynikający z definicji narzędzi. Oznacza to, że krótkie zadania kosztują proporcjonalnie więcej niż długie. Jeśli koszt ma znaczenie, wybierz model z niższą ceną za token (DeepSeek i MiniMax M2.7 to popularne opcje budżetowe).
Uruchomienie na VPS dodaje $5–10/miesiąc, jeśli chcesz, aby agent był zawsze dostępny.
Partnerstwo z MiniMax AI
Nous Research ogłosiło partnerstwo z MiniMax AI na początku 2026 roku. MiniMax M2.7 jest obecnie jednym z najczęściej używanych modeli wewnątrz Hermes Agent. Integracja jest najwyższej klasy: wybierz „MiniMax (global endpoint)” z listy dostawców i MiniMax-M2.7 jako model. Obie firmy współpracują nad optymalizacją przyszłych wydań specjalnie pod kątem agenta, planując funkcje multimodalne, w tym wizję, dźwięk i potencjalną integrację z robotyką.
Często zadawane pytania
Czy Hermes Agent współpracuje z lokalnymi modelami?
Tak. Hermes współpracuje z każdym LLM obsługującym kontekst 64K+. Możesz go uruchomić z Ollama dla w pełni lokalnej pracy offline, korzystając z modeli takich jak Hermes 3 (oparty na Llama 3.1). Klucz API nie jest wymagany dla modeli lokalnych.
Czy Hermes Agent jest bezpieczny do uruchomienia na serwerze?
Architektura obejmuje utwardzanie kontenerów, izolację przestrzeni nazw dla sub-agentów oraz rotację poświadczeń. Wydanie v0.7.0 dodało głębokie poprawki bezpieczeństwa. Stanem na kwiecień 2026, Hermes nie ma zgłoszonych żadnych specyficznych dla agenta luk CVE — co stanowi wyraźny kontrast wobec niedawnego ujawnienia 9 CVE w 4 dni w przypadku OpenClaw.
Czy mogę przeprowadzić migrację z OpenClaw do Hermes Agent?
Tak. Rosnąca liczba użytkowników migruje z OpenClaw do Hermes, szczególnie po ujawnieniu luk CVE w marcu 2026 r. Hermes nie posiada narzędzia do migracji jednym kliknięciem, ale konfiguracja jest prosta. Twoje umiejętności z OpenClaw będą wymagały ponownego stworzenia, choć Hermes nauczy się wielu z nich automatycznie dzięki swojej pętli samodoskonalenia.
W jakim języku programowania napisany jest Hermes Agent?
W języku Python. Kod źródłowy wymaga wersji Python 3.11+ i wykorzystuje uv jako menedżer pakietów.
Czy Hermes Agent może sterować moim inteligentnym domem?
Tak. Hermes posiada wbudowany zestaw narzędzi Home Assistant, który łączy się z Twoją instancją Home Assistant w celu sterowania urządzeniami IoT i inteligentnym domem.
Czym Hermes Agent różni się od ChatGPT lub Claude?
ChatGPT i Claude to konwersacyjne modele AI. Hermes Agent to framework dla autonomicznych agentów, który używa LLM (w tym GPT i Claude) do podejmowania działań: uruchamiania poleceń, edytowania plików, przeglądania sieci, zarządzania zadaniami i budowania umiejętności wielokrotnego użytku. Kluczową różnicą jest sprawczość (agency) — Hermes działa, uczy się i pamięta między sesjami.
Podsumowanie
Hermes Agent to jak dotąd najciekawszy projekt agenta open-source w 2026 roku. Samodoskonaląca się pętla uczenia nie jest tylko hasłem marketingowym — to konkretny system zbudowany na SQLite, FTS5 i proceduralnych plikach umiejętności, który wymiernie poprawia skuteczność wykonywania zadań w miarę upływu czasu. Poziom bezpieczeństwa jest wysoki, elastyczność w wyborze modeli nie ma sobie równych, a licencja MIT oznacza, że jesteś właścicielem wszystkiego.
Ekosystem jest wciąż młody w porównaniu do dojrzałego rynku umiejętności OpenClaw, a 73% stałego narzutu na każde wywołanie API to realny koszt, który należy wziąć pod uwagę. Ale dla każdego, kto chce agenta AI, który autentycznie staje się lepszy, im częściej go używasz, Hermes Agent jest zdecydowanym faworytem.
Chcesz mocy Hermes Agent bez konfiguracji serwera? Y Build jest jak mobilna wersja Hermes Agent — te same możliwości automatyzacji AI i budowania produktów, ale bez potrzeby posiadania VPS, terminala czy wiedzy technicznej. Buduj i wdrażaj prosto ze swojego telefonu.