Hermes Agent Guide: Self-Improving Open-Source AI Agent (2026)
Nous Research 的 Hermes Agent 完整指南:安装步骤、自我改进内存、40+ 工具、定价,以及 2026 年其与 OpenClaw 的对比。
Nous Research 开发的 Hermes Agent 是一款开源、遵循 MIT 协议的 AI agent,它能够记住学习到的内容,根据经验构建可重用的技能,并能在几乎任何 LLM 上运行。自 2026 年 2 月 25 日首次发布以来,它的 GitHub stars 已突破 57,000 个,成为年度增长最快的开源 agent 框架。
本指南涵盖了你所需要了解的一切:Hermes Agent 究竟能做什么、如何安装、成本如何、其自我改进的内存系统如何工作,以及它是否适合你的工作流。
TL;DR — Hermes Agent 一览
| 详情 | 信息 |
|---|---|
| 开发者 | Nous Research |
| 许可证 | MIT (完全开源,允许商用) |
| GitHub Stars | 57,000+ |
| 最新版本 | v0.7.0 "Resilience Release" (2026年4月3日) |
| 支持平台 | Linux, macOS, WSL2, Android (Termux) |
| 聊天渠道 | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| LLM 支持 | 通过 OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google 支持 200+ 模型 |
| 内置工具 | 40+ (web, terminal, file, browser, vision, image gen, TTS, cron, delegation) |
| 内存 | 持久化跨会话内存 (SQLite + FTS5) |
| 自我改进 | 是 — 从经验中生成程序化技能 |
| 成本 | 免费 (自托管) + $0–15/月 API 使用费 |
为什么 Hermes Agent 与众不同
大多数 AI agent 是无状态的。你给它们一个任务,它们去执行(或尝试执行),然后下一次对话又从零开始。Hermes Agent 凭借三项核心能力打破了这一模式,使其脱颖而出。
持久化跨会话内存
每一次对话都会写入 SQLite 数据库,并使用 FTS5 全文搜索进行索引。当稍后出现类似任务时,Hermes 会搜索自己的历史记录,而不是将整个旧会话加载到上下文窗口中。检索到的结果会经过 LLM 总结,因此只有相关的上下文会被注入。结果是:你使用 agent 的时间越长,它就变得越好用。
自我改进学习循环
每进行 15 次工具调用,Hermes 就会运行一次自我评估检查点。如果工作涉及可重用的程序,它会自动创建或修补一个技能——一个存储在 ~/.hermes/skills/ 中的 markdown 文件。这些程序化技能捕捉的是“如何”做某事,而不仅仅是发生了“什么”。下一次出现类似问题时,Hermes 会加载相关技能并更高效地执行。
这是与其他 agent 的关键区别。Hermes 将程序性记忆(方法)与情节性记忆(事件)分开,并且两者都能跨会话持久存在。
覆盖各个领域的 40+ 内置工具
Hermes 开箱即提供广泛的工具注册表:
- 文件操作 — 读取、写入、搜索、编辑文件
- 终端 (Terminal) — 运行 shell 命令,捕获输出
- 网页搜索 — 从互联网获取实时信息
- 浏览器自动化 — 导航、点击、快照 (基于 Chromium)
- 视觉与图像生成 — 视觉分析,通过 FAL 生成图像
- 代码执行 — 沙箱代码运行器
- 内存与会话搜索 — 搜索过去的对话
- 委派 (Delegation) — 启动子 agent 处理并行任务
- 定时任务 (Cron jobs) — 安排循环任务
- Home Assistant — IoT 和智能家居控制
- TTS — 文本转语音输出
- Todo — 任务追踪
- RL (强化学习) — 通过 Atropos 进行自我训练
hermes tools 配置哪些工具集处于激活状态。
如何安装 Hermes Agent
Hermes 可运行在 Linux, macOS, WSL2 和 Android (Termux) 上。不支持原生 Windows — 请改用 WSL2。整个设置过程大约需要五分钟。
一键安装(推荐)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
这将处理所有事务:克隆仓库、设置 Python 3.11 虚拟环境、安装依赖项以及配置目录。
手动安装
# 1. 安装 uv (快速 Python 包管理器)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. 克隆仓库
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. 创建虚拟环境并安装
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
配置你的 LLM 供应商
# 运行设置向导
hermes setup
# 或手动配置 — 将你的 API key 添加到 ~/.hermes/.env
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# 选择你的模型
hermes model
Hermes 适用于任何支持 64K+ 上下文的 LLM。热门选择包括来自 OpenRouter (200+ 选项)、DeepSeek、MiniMax M2.7、Kimi、OpenAI、Anthropic 和 Google 的模型。
可选:添加特定工具的 Key
# 网页搜索 (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# 图像生成 (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
启动
# CLI 模式
hermes
# 或连接到消息平台
hermes gateway
gateway 进程通过单一进程同时将 Hermes 连接到 Telegram, Discord, Slack, WhatsApp 和 Signal。
v0.7.0 — Resilience Release
最新的重大版本(2026年4月3日)交付了 168 个 PR 并解决了 46 个问题。以下是亮点:
可插拔内存提供者。 内存现在是一个可扩展的插件系统。第三方后端(向量数据库、Honcho、自定义数据库)可以实现简单的提供者接口并通过插件系统注册。你不再被局限于 SQLite。 凭据池轮换。 为同一供应商配置多个 API key。Hermes 会使用线程安全的“最少使用”策略自动轮换。401 错误会立即触发轮换到下一个 key。 Camofox 反检测浏览器。 使用 Camoufox 的新本地浏览器后端,支持隐身浏览、持久化会话以及用于视觉调试的 VNC URL 发现。 行内 Diff 预览。 文件写入和补丁操作现在在工具活动流中显示行内 diff,在 agent 继续下一步之前提供变更的视觉确认。 API 服务端会话连续性。 API server 实时流式传输工具进度事件,并支持X-Hermes-Session-Id 标头,实现跨 HTTP 请求的持久会话。
Hermes Agent vs. OpenClaw — 你该选哪一个?
OpenClaw 是 2026 年另一个主要的开源 agent 框架。以下是直接对比。
| 特性 | Hermes Agent | OpenClaw |
|---|---|---|
| GitHub Stars | 57,000+ | 15,000+ |
| 许可证 | MIT | MIT |
| 自我改进内存 | 是 (程序化 + 情节性) | 否 (基于文件,手动) |
| 学习循环 | 每 15 次工具调用自动创建技能 | 通过 ClawHub 手动安装技能 |
| 聊天平台 | 6 个 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (包括微信, Teams, Line, IRC, 邮件) |
| 社区技能 | 增长中 (年轻的生态系统) | ClawHub 上有 13,000+ |
| 安全 CVEs | 0 个已报告 (截至 2026 年 4 月) | 4 天内发现 9 个 CVE (2026 年 3 月,包括 CVSS 9.9) |
| 浏览器自动化 | 内置 (Chromium + Camofox) | 基于插件 |
| 模型支持 | 通过 OpenRouter + 直接供应商支持 200+ | 范围相似 |
| 典型成本 | 免费 + $0–15/月 API | 免费 + $5–15/月 API + 可选 $6/月 托管 |
Hermes Agent 需要多少钱?
Hermes 本身是免费且自托管的。真正的成本在于 LLM API 的使用。
| 使用级别 | 预计每月成本 |
|---|---|
| 轻度 (每天几个任务,使用廉价模型) | $0–3 |
| 中度 (每日使用,中端模型) | $5–10 |
| 重度 (全天候运行,高端模型) | $10–15 |
| 高级用户 (多 agent 委派、视觉、图像生成) | $15–30+ |
需要了解的一点是:每次 API 调用中大约 73% 是来自工具定义的固定开销。这意味着短任务的比例成本比长任务更高。如果成本很重要,请选择每 token 价格更低的模型(DeepSeek 和 MiniMax M2.7 是热门的经济选择)。
如果你希望 agent 全天候在线,运行在 VPS 上会增加每月 $5–10 的费用。
MiniMax AI 合作伙伴关系
Nous Research 在 2026 年初宣布与 MiniMax AI 达成合作伙伴关系。MiniMax M2.7 现在是 Hermes Agent 内部使用最多的模型之一。集成是顶级的:从供应商列表中选择 "MiniMax (global endpoint)" 并选择 MiniMax-M2.7 作为模型。两家公司正在合作专门为该 agent 优化未来的版本,并计划推出多模态功能,包括视觉、音频以及潜在的机器人集成。
常见问题解答
Hermes Agent 支持本地模型吗?
支持。Hermes 适用于任何支持 64K+ 上下文的 LLM。你可以通过 Ollama 使用 Hermes 3 (基于 Llama 3.1) 等模型进行完全本地、离线的运行。本地模型不需要 API key。
在服务器上运行 Hermes Agent 安全吗?
其架构包括容器加固、子 agent 的命名空间隔离以及凭据轮换。v0.7.0 版本增加了深度安全修复。截至 2026 年 4 月,Hermes 没有报告过任何针对 agent 的 CVE——这与 OpenClaw 最近 4 天披露 9 个 CVE 的情况形成了鲜明对比。
我可以从 OpenClaw 迁移到 Hermes Agent 吗?
可以。越来越多的用户正在从 OpenClaw 迁移到 Hermes,尤其是在 2026 年 3 月的 CVE 披露之后。Hermes 虽然没有一键迁移工具,但设置非常简单。你的 OpenClaw 技能需要重新创建,不过 Hermes 会通过其自我改进循环自动学习其中的许多技能。
Hermes Agent 是用什么编程语言编写的?
Python。代码库要求 Python 3.11+ 并使用 uv 作为其包管理器。
Hermes Agent 能控制我的智能家居吗?
可以。Hermes 有内置的 Home Assistant 工具集,可以连接到你的 Home Assistant 实例进行 IoT 和智能家居控制。
Hermes Agent 与 ChatGPT 或 Claude 有什么不同?
ChatGPT 和 Claude 是对话式 AI 模型。Hermes Agent 是一个自主 agent 框架,它 调用 LLM (包括 GPT 和 Claude) 来采取行动:运行命令、编辑文件、浏览网页、管理任务以及构建可重用技能。关键区别在于代理性 (agency) —— Hermes 会在不同会话之间执行动作、学习并记忆。
总结
Hermes Agent 是到目前为止 2026 年最有趣的开源 agent 项目。自我改进的学习循环并非营销口号——它是一个建立在 SQLite、FTS5 和程序化技能文件之上的具体系统,能够显著提高随时间推移的任务完成率。安全态势强劲,模型灵活性无与伦比,且 MIT 许可证意味着你拥有了一切。
与 OpenClaw 成熟的技能市场相比,其生态系统仍然年轻,且每次 API 调用 73% 的固定开销是一个现实的成本考量。但对于任何想要一个能随着使用而真正变得更好的 AI agent 的人来说,Hermes Agent 是明显的领跑者。
想要拥有 Hermes Agent 的能力却不想折腾服务器设置? Y Build 就像是移动优先版的 Hermes Agent —— 拥有同样的 AI 自动化和产品构建能力,但你不需要 VPS、终端或任何技术背景。直接在手机上构建并发布。