Hermes Agent Guide: Selbstverbessernder Open-Source AI Agent (2026)
Vollständiger Guide zum Hermes Agent von Nous Research: Installationsschritte, selbstverbesserndes Gedächtnis, 40+ Tools, Preise und Vergleich mit OpenClaw im Jahr 2026.
Hermes Agent von Nous Research ist ein quelloffener, MIT-lizenzierter AI Agent, der Gelerntes behält, aus Erfahrung wiederverwendbare Skills aufbaut und auf praktisch jedem LLM läuft. Seit seiner ersten Veröffentlichung am 25. Februar 2026 hat er die Marke von 57.000 GitHub-Stars überschritten und ist zum am schnellsten wachsenden Open-Source-Agent-Framework des Jahres geworden.
Dieser Guide deckt alles Wissenswerte ab: Was Hermes Agent tatsächlich macht, wie man ihn installiert, was er kostet, wie sein selbstverbesserndes Gedächtnissystem funktioniert und ob er für Ihren Workflow sinnvoll ist.
TL;DR — Hermes Agent im Überblick
| Detail | Info |
|---|---|
| Entwickler | Nous Research |
| Lizenz | MIT (vollständig Open-Source, kommerzielle Nutzung OK) |
| GitHub Stars | 57.000+ |
| Aktuelle Version | v0.7.0 "Resilience Release" (3. April 2026) |
| Unterstützte Plattformen | Linux, macOS, WSL2, Android (Termux) |
| Chat-Kanäle | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| LLM-Unterstützung | 200+ Modelle via OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google |
| Integrierte Tools | 40+ (Web, Terminal, File, Browser, Vision, Image Gen, TTS, Cron, Delegation) |
| Gedächtnis | Persistent und sitzungsübergreifend (SQLite + FTS5) |
| Selbstverbessernd | Ja — prozedurale Skill-Erstellung aus Erfahrung |
| Kosten | Kostenlos (selbstgehostet) + $0–15/Monat für API-Nutzung |
Was Hermes Agent unterscheidet
Die meisten AI Agents sind zustandslos (stateless). Man gibt ihnen eine Aufgabe, sie erledigen sie (oder versuchen es), und die nächste Konversation beginnt bei Null. Hermes Agent bricht dieses Muster mit drei Kernfunktionen, die ihn von anderen abheben.
Persistentes, sitzungsübergreifendes Gedächtnis
Jede Konversation wird in eine SQLite-Datenbank geschrieben und mit FTS5-Volltextsuche indiziert. Wenn später eine ähnliche Aufgabe ansteht, durchsucht Hermes seinen eigenen Verlauf, anstatt ganze alte Sitzungen in das Context Window zu laden. Die abgerufenen Ergebnisse werden durch eine LLM-Zusammenfassung gefiltert, sodass nur relevanter Kontext injiziert wird. Das Ergebnis: Der Agent wird nützlicher, je länger man ihn verwendet.
Selbstverbessernder Lernzyklus (Learning Loop)
Alle 15 Tool-Aufrufe führt Hermes einen Self-Evaluation-Checkpoint durch. Wenn die Arbeit einen wiederverwendbaren Ablauf beinhaltete, erstellt oder patcht er automatisch einen Skill — eine Markdown-Datei, die in ~/.hermes/skills/ gespeichert wird. Diese prozeduralen Skills erfassen, wie man etwas tut, nicht nur, was passiert ist. Wenn das nächste Mal ein ähnliches Problem auftritt, lädt Hermes den relevanten Skill und führt ihn effizienter aus.
Dies ist der entscheidende Unterschied zu anderen Agents. Hermes trennt das prozedurale Gedächtnis (Methoden) vom episodischen Gedächtnis (Ereignisse), und beide bleiben über Sitzungen hinweg bestehen.
40+ integrierte Tools über alle Kategorien hinweg
Hermes wird standardmäßig mit einem breiten Tool-Registry ausgeliefert:
- Dateioperationen — Dateien lesen, schreiben, suchen, bearbeiten
- Terminal — Shell-Befehle ausführen, Output erfassen
- Websuche — Live-Informationen aus dem Internet abrufen
- Browser-Automatisierung — Navigieren, Klicken, Snapshots (Chromium-basiert)
- Vision & Image Generation — Visuelle Analyse, Bilderstellung via FAL
- Code-Ausführung — Sandboxed Code Runner
- Gedächtnis- & Sitzungssuche — Vergangene Konversationen durchsuchen
- Delegation — Sub-Agents für parallele Aufgaben starten
- Cron-Jobs — Wiederkehrende Aufgaben planen
- Home Assistant — IoT- und Smart-Home-Steuerung
- TTS — Text-to-Speech Ausgabe
- Todo — Aufgabenverfolgung
- RL (Reinforcement Learning) — Selbsttraining via Atropos
hermes tools lässt sich konfigurieren, welche Toolsets aktiv sind.
So installieren Sie Hermes Agent
Hermes läuft auf Linux, macOS, WSL2 und Android (Termux). Natives Windows wird nicht unterstützt — verwenden Sie stattdessen WSL2. Die gesamte Einrichtung dauert etwa fünf Minuten.
Einzeilige Installation (Empfohlen)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Dies erledigt alles: Klonen des Repos, Einrichten einer Python 3.11 virtuellen Umgebung, Installieren der Abhängigkeiten und Konfigurieren der Verzeichnisse.
Manuelle Installation
# 1. uv installieren (schneller Python Package Manager)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Repository klonen
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. Virtuelle Umgebung erstellen und installieren
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
LLM-Provider konfigurieren
# Den Setup-Wizard ausführen
hermes setup
# Oder manuell konfigurieren — API-Key zu ~/.hermes/.env hinzufügen
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# Modell wählen
hermes model
Hermes funktioniert mit jedem LLM, das 64K+ Kontext unterstützt. Beliebte Optionen sind Modelle von OpenRouter (200+ Optionen), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic und Google.
Optional: Tool-spezifische Keys hinzufügen
# Websuche (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# Bilderstellung (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
Starten
# CLI-Modus
hermes
# Oder mit einer Messaging-Plattform verbinden
hermes gateway
Der Gateway-Prozess verbindet Hermes gleichzeitig mit Telegram, Discord, Slack, WhatsApp und Signal über einen einzigen Prozess.
v0.7.0 — Das Resilience Release
Das neueste Major-Release (3. April 2026) enthielt 168 PRs und behob 46 Issues. Hier sind die Highlights:
Pluggable Memory Providers. Das Gedächtnis ist nun ein erweiterbares Plugin-System. Drittanbieter-Backends (Vektorspeicher, Honcho, benutzerdefinierte Datenbanken) implementieren ein einfaches Provider-Interface und registrieren sich über das Plugin-System. Sie sind nicht mehr nur an SQLite gebunden. Credential Pool Rotation. Konfigurieren Sie mehrere API-Keys für denselben Provider. Hermes rotiert automatisch durch diese unter Verwendung einer Thread-sicheren "Least-used"-Strategie. Ein 401-Fehler löst eine sofortige Rotation zum nächsten Key aus. Camofox Anti-Detection Browser. Ein neues lokales Browser-Backend auf Basis von Camoufox für Stealth-Browsing mit persistenten Sitzungen und VNC-URL-Discovery für visuelles Debugging. Inline Diff Previews. Dateischreib- und Patch-Operationen zeigen nun Inline-Diffs im Tool-Aktivitäts-Feed an, was eine visuelle Bestätigung der Änderungen ermöglicht, bevor der Agent fortfährt. API Server Session Continuity. Der API-Server streamt Tool-Fortschrittsereignisse in Echtzeit und unterstütztX-Hermes-Session-Id Header für persistente Sitzungen über HTTP-Requests hinweg.
Hermes Agent vs. OpenClaw — Welchen sollten Sie wählen?
OpenClaw ist das andere große Open-Source-Agent-Framework im Jahr 2026. Hier ist ein direkter Vergleich.
| Feature | Hermes Agent | OpenClaw |
|---|---|---|
| GitHub Stars | 57.000+ | 15.000+ |
| Lizenz | MIT | MIT |
| Selbstverbesserndes Gedächtnis | Ja (prozedural + episodisch) | Nein (dateibasiert, manuell) |
| Learning Loop | Automatische Skill-Erstellung alle 15 Tool-Aufrufe | Manuelle Skill-Installation via ClawHub |
| Chat-Plattformen | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (einschließlich WeChat, Teams, Line, IRC, E-Mail) |
| Community Skills | Wachsend (junges Ökosystem) | 13.000+ auf ClawHub |
| Sicherheits-CVEs | 0 gemeldet (Stand April 2026) | 9 CVEs in 4 Tagen (März 2026, inkl. CVSS 9.9) |
| Browser-Automatisierung | Integriert (Chromium + Camofox) | Plugin-basiert |
| Modell-Unterstützung | 200+ via OpenRouter + direkte Provider | Ähnliches Spektrum |
| Typische Kosten | Gratis + $0–15/Monat API | Gratis + $5–15/Monat API + optional $6/Monat Hosting |
Wie viel kostet Hermes Agent?
Hermes selbst ist kostenlos und selbstgehostet. Die tatsächlichen Kosten entstehen durch die LLM API-Nutzung.
| Nutzungsgrad | Geschätzte monatliche Kosten |
|---|---|
| Gering (einige Aufgaben/Tag, günstiges Modell) | $0–3 |
| Mittel (tägliche Nutzung, Mid-Tier Modell) | $5–10 |
| Hoch (Dauerbetrieb, Premium-Modell) | $10–15 |
| Power-User (Multi-Agent Delegation, Vision, Image Gen) | $15–30+ |
Wichtig zu wissen: Etwa 73% jedes API-Aufrufs entfallen auf fixen Overhead durch Tool-Definitionen. Das bedeutet, kurze Aufgaben kosten proportional mehr als lange. Wenn die Kosten eine Rolle spielen, wählen Sie ein Modell mit niedrigeren Preisen pro Token (DeepSeek und MiniMax M2.7 sind beliebte Budget-Optionen).
Der Betrieb auf einem VPS schlägt mit zusätzlichen $5–10/Monat zu Buche, falls der Agent immer online sein soll.
MiniMax AI Partnerschaft
Nous Research gab Anfang 2026 eine Partnerschaft mit MiniMax AI bekannt. MiniMax M2.7 ist mittlerweile eines der meistgenutzten Modelle innerhalb von Hermes Agent. Die Integration ist erstklassig: Wählen Sie "MiniMax (global endpoint)" aus der Provider-Liste und MiniMax-M2.7 als Modell. Die beiden Unternehmen arbeiten zusammen, um zukünftige Releases speziell für den Agenten zu optimieren, wobei Pläne für multimodale Funktionen wie Vision, Audio und potenzielle Robotik-Integration bestehen.
Häufig gestellte Fragen (FAQ)
Funktioniert Hermes Agent mit lokalen Modellen?
Ja. Hermes funktioniert mit jedem LLM, das 64K+ Kontext unterstützt. Sie können es mit Ollama für einen vollständig lokalen Offline-Betrieb nutzen, zum Beispiel mit Modellen wie Hermes 3 (basierend auf Llama 3.1). Für lokale Modelle ist kein API-Key erforderlich.
Ist es sicher, Hermes Agent auf einem Server laufen zu lassen?
Die Architektur umfasst Container-Hardening, Namespace-Isolierung für Sub-Agents und Credential-Rotation. Das v0.7.0 Release fügte tiefgreifende Sicherheitsfixes hinzu. Stand April 2026 hat Hermes null gemeldete Agent-spezifische CVEs — ein scharfer Kontrast zu den kürzlich veröffentlichten 9 CVEs in 4 Tagen bei OpenClaw.
Kann ich von OpenClaw zu Hermes Agent migrieren?
Ja. Eine wachsende Zahl von Nutzern migriert von OpenClaw zu Hermes, insbesondere nach den CVE-Enthüllungen im März 2026. Hermes hat kein One-Click-Migrations-Tool, aber das Setup ist unkompliziert. Ihre OpenClaw-Skills müssen neu erstellt werden, wobei Hermes viele davon durch seinen selbstverbessernden Loop automatisch lernen wird.
In welcher Programmiersprache ist Hermes Agent geschrieben?
Python. Die Codebasis erfordert Python 3.11+ und nutzt uv als Package Manager.
Kann Hermes Agent mein Smart Home steuern?
Ja. Hermes verfügt über ein integriertes Home Assistant Toolset, das sich mit Ihrer Home Assistant Instanz für IoT- und Smart-Home-Steuerung verbindet.
Wie unterscheidet sich Hermes Agent von ChatGPT oder Claude?
ChatGPT und Claude sind konversationelle AI-Modelle. Hermes Agent ist ein autonomes Agent-Framework, das LLMs (einschließlich GPT und Claude) nutzt, um Aktionen auszuführen: Befehle ausführen, Dateien bearbeiten, im Web surfen, Aufgaben verwalten und wiederverwendbare Skills aufbauen. Der Hauptunterschied ist die Handlungsfähigkeit (Agency) — Hermes agiert, lernt und erinnert sich über Sitzungen hinweg.
Abschließende Gedanken
Hermes Agent ist das bisher interessanteste Open-Source-Agent-Projekt des Jahres 2026. Der selbstverbessernde Learning Loop ist kein Marketingversprechen — es ist ein konkretes System auf Basis von SQLite, FTS5 und prozeduralen Skill-Dateien, das die Aufgabenerledigung messbar über die Zeit verbessert. Der Sicherheitsansatz ist stark, die Modell-Flexibilität unübertroffen und die MIT-Lizenz bedeutet, dass Ihnen alles gehört.
Das Ökosystem ist im Vergleich zum reifen Skill-Marktplatz von OpenClaw noch jung, und der 73% fixe Overhead pro API-Call ist ein realer Kostenfaktor. Aber für jeden, der einen AI Agenten sucht, der mit jeder Nutzung tatsächlich besser wird, ist Hermes Agent der klare Spitzenreiter.
Sie möchten die Power von Hermes Agent ohne Server-Setup? Y Build ist wie eine Mobile-First-Version von Hermes Agent — die gleichen AI-Automatisierungs- und Produktbaufunktionen, aber Sie benötigen keinen VPS, kein Terminal und keinen technischen Hintergrund. Bauen und veröffentlichen Sie direkt von Ihrem Smartphone aus.