Hermes Agent ガイド:自己改善型オープンソース AI エージェント (2026年版)
Nous Research による Hermes Agent の完全ガイド:インストール手順、自己改善メモリ、40以上のツール、価格、および 2026年における OpenClaw との比較。
Nous Research による Hermes Agent は、学んだ内容を記憶し、経験から再利用可能なスキルを構築し、実質的にあらゆる LLM で動作する MIT ライセンスのオープンソース AI エージェントです。2026年2月25日の初回リリース以来、GitHub スター数は 57,000 を超え、今年最も急速に成長しているオープンソースのエージェントフレームワークとなっています。
このガイドでは、Hermes Agent で実際に何ができるのか、インストール方法、コスト、自己改善型のメモリシステムの仕組み、そしてあなたのワークフローに適しているかどうかなど、必要な情報をすべて網羅しています。
TL;DR — Hermes Agent の概要
| 項目 | 情報 |
|---|---|
| 開発元 | Nous Research |
| ライセンス | MIT (完全オープンソース、商用利用可) |
| GitHub スター数 | 57,000+ |
| 最新バージョン | v0.7.0 "Resilience Release" (2026年4月3日) |
| 対応プラットフォーム | Linux, macOS, WSL2, Android (Termux) |
| チャットチャネル | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| LLM サポート | OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google を介した 200 以上のモデル |
| 内蔵ツール | 40以上 (web, terminal, file, browser, vision, image gen, TTS, cron, delegation) |
| メモリ | セッションを跨ぐ永続的メモリ (SQLite + FTS5) |
| 自己改善機能 | あり — 経験からの手続き的スキル作成 |
| コスト | 無料 (セルフホスト) + API 使用料 $0–15/月 |
Hermes Agent が他と異なる理由
ほとんどの AI エージェントはステートレス(状態を持たない)です。タスクを与えれば実行(あるいは試行)しますが、次の会話はゼロから始まります。Hermes Agent は、他とは一線を画す 3 つのコア機能によってそのパターンを打破しています。
セッションを跨ぐ永続的メモリ
すべての会話は SQLite データベースに書き込まれ、FTS5 全文検索でインデックス化されます。後で同様のタスクが発生した際、Hermes Agent は古いセッション全体をコンテキストウィンドウに読み込むのではなく、自身の履歴を検索します。取得された結果は LLM によって要約され、関連するコンテキストのみが注入されます。その結果、エージェントを使えば使うほど、より便利になっていきます。
自己改善型学習ループ
ツール呼び出しが 15 回行われるごとに、Hermes Agent は自己評価チェックポイントを実行します。もしその作業に再利用可能な手順が含まれていた場合、自動的に「スキル」(~/.hermes/skills/ に保存される Markdown ファイル)を作成または更新します。これらの手続き的スキルは、何が起きたかだけでなく、どのように行うかを記録します。次に同様の問題が発生したとき、Hermes Agent は関連するスキルを読み込み、より効率的に実行します。
これが他のエージェントとの決定的な違いです。Hermes Agent は手続き的メモリ(手法)とエピソード的メモリ(出来事)を分離し、その両方がセッションを跨いで保持されます。
あらゆるカテゴリに対応する 40 以上の内蔵ツール
Hermes Agent は、標準で幅広いツールレジストリを備えています:
- ファイル操作 — ファイルの読み取り、書き込み、検索、編集
- ターミナル — シェルコマンドの実行、出力のキャプチャ
- Web 検索 — インターネットから最新情報を取得
- ブラウザ自動化 — ナビゲーション、クリック、スナップショット (Chromium ベース)
- ビジョン & 画像生成 — 視覚分析、FAL を介した画像作成
- コード実行 — サンドボックス化されたコード実行環境
- メモリ & セッション検索 — 過去の会話を検索
- 委任 (Delegation) — 並列タスクのためにサブエージェントを起動
- Cron ジョブ — 定期的なタスクのスケジュール
- Home Assistant — IoT およびスマートホーム制御
- TTS — テキスト読み上げ出力
- Todo — タスク追跡
- RL (強化学習) — Atropos による自己トレーニング
hermes tools で設定可能です。
Hermes Agent のインストール方法
Hermes Agent は Linux, macOS, WSL2, および Android (Termux) で動作します。Windows ネイティブはサポートされていません。WSL2 を使用してください。セットアップ全体は約 5 分で完了します。
ワンライン・インストール (推奨)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
これにより、リポジトリのクローン、Python 3.11 仮想環境の構築、依存関係のインストール、ディレクトリ設定のすべてが自動で行われます。
手動インストール
# 1. uv (高速な Python パッケージマネージャー) のインストール
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. リポジトリのクローン
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. 仮想環境の作成とインストール
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
LLM プロバイダーの設定
# セットアップウィザードの実行
hermes setup
# または手動設定 — API キーを ~/.hermes/.env に追加
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# モデルの選択
hermes model
Hermes Agent は、64K 以上のコンテキストをサポートするあらゆる LLM で動作します。よく使われるのは OpenRouter (200 以上の選択肢)、DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic, Google のモデルです。
オプション:ツール専用キーの追加
# Web 検索 (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# 画像生成 (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
起動
# CLI モード
hermes
# またはメッセージングプラットフォームに接続
hermes gateway
gateway プロセスは、単一のプロセスを通じて Hermes Agent を Telegram, Discord, Slack, WhatsApp, Signal に同時に接続します。
v0.7.0 — Resilience Release
最新のメジャーリリース (2026年4月3日) では、168 件の PR がマージされ、46 件の問題が解決されました。主なハイライトは以下の通りです:
プラグイン可能なメモリプロバイダー。 メモリが拡張可能なプラグインシステムになりました。サードパーティのバックエンド (ベクターストア, Honcho, カスタムデータベース) は、シンプルなプロバイダーインターフェースを実装し、プラグインシステム経由で登録できます。SQLite だけに縛られることはもうありません。 認証情報プールのローテーション。 同じプロバイダーに対して複数の API キーを設定できるようになりました。Hermes Agent は、スレッドセーフな「最小利用」戦略を使用して、それらを自動的にローテーションします。401 エラーが発生すると、即座に次のキーへローテーションされます。 Camoufox 検知回避ブラウザ。 ステルスブラウジングのための Camoufox を使用した新しいローカルブラウザバックエンド。永続セッションと、視覚的デバッグのための VNC URL 検出をサポートしています。 インライン Diff プレビュー。 ファイルの書き込みおよびパッチ操作において、ツールアクティビティフィードにインライン diff が表示されるようになりました。エージェントが次の動作に移る前に、何が変更されたかを視覚的に確認できます。 API サーバーのセッション継続性。 API サーバーはツールの進行イベントをリアルタイムでストリーミングし、HTTP リクエストを跨いだ永続セッションのためにX-Hermes-Session-Id ヘッダーをサポートします。
Hermes Agent vs. OpenClaw — どちらを選ぶべきか?
OpenClaw は、2026年におけるもう一つの主要なオープンソースエージェントフレームワークです。直接的な比較は以下の通りです。
| 機能 | Hermes Agent | OpenClaw |
|---|---|---|
| GitHub スター数 | 57,000+ | 15,000+ |
| ライセンス | MIT | MIT |
| 自己改善メモリ | あり (手続き的 + エピソード的) | なし (ファイルベース、手動) |
| 学習ループ | 15 回のツール呼び出しごとに自動スキル作成 | ClawHub を介した手動スキルインストール |
| チャットプラットフォーム | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (WeChat, Teams, Line, IRC, email 等を含む) |
| コミュニティスキル | 成長中 (若いエコシステム) | ClawHub 上に 13,000+ |
| セキュリティ CVE | 0 件報告 (2026年4月時点) | 4 日間で 9 件の CVE (2026年3月、CVSS 9.9 を含む) |
| ブラウザ自動化 | 内蔵 (Chromium + Camoufox) | プラグインベース |
| モデルサポート | OpenRouter + 直接プロバイダー経由で 200+ | 同等の範囲 |
| 標準的コスト | 無料 + $0–15/月の API 料 | 無料 + $5–15/月の API 料 + オプションの $6/月ホスティング |
Hermes Agent のコストは?
Hermes Agent 自体は無料でセルフホスト可能です。実際のコストは LLM API の使用料です。
| 利用レベル | 推定月額コスト |
|---|---|
| ライト (1日あたり数タスク、安価なモデル) | $0–3 |
| 標準 (毎日利用、中位モデル) | $5–10 |
| ヘビー (常時稼働、プレミアムモデル) | $10–15 |
| パワーユーザー (マルチエージェント、ビジョン、画像生成) | $15–30+ |
知っておくべきことの一つとして、各 API コールの約 73% はツール定義による固定のオーバーヘッドです。これは、短いタスクは長いタスクに比べて相対的にコストが高くなることを意味します。コストを重視する場合は、トークンあたりの価格が低いモデル(DeepSeek や MiniMax M2.7 が予算重視の選択肢として人気です)を選んでください。
エージェントを常時稼働させたい場合、VPS の運用に月額 $5–10 程度かかります。
MiniMax AI との提携
Nous Research は 2026 年初頭に MiniMax AI との提携を発表しました。現在、MiniMax M2.7 は Hermes Agent 内で最も利用されているモデルの一つです。統合はファーストクラスで行われており、プロバイダーリストから "MiniMax (global endpoint)" を選択し、モデルとして MiniMax-M2.7 を選択するだけです。両社は将来のリリースをエージェント向けに特別に最適化するために協力しており、ビジョン、オーディオ、そして潜在的にはロボティクス統合を含むマルチモーダル機能の計画を進めています。
よくある質問 (FAQ)
Hermes Agent はローカルモデルで動作しますか?
はい。Hermes Agent は 64K 以上のコンテキストをサポートするあらゆる LLM で動作します。Ollama を使用して、Hermes 3 (Llama 3.1 ベース) などのモデルで完全にローカル、オフラインでの運用が可能です。ローカルモデルの場合、API キーは不要です。
サーバーで Hermes Agent を実行しても安全ですか?
アーキテクチャには、コンテナのハードニング、サブエージェント用の名前空間の分離、認証情報のローテーションが含まれています。v0.7.0 リリースでは、深いセキュリティ修正が加えられました。2026年4月現在、Hermes Agent 特有の報告された CVE はゼロであり、これは 4 日間で 9 件の CVE を出した OpenClaw の最近の状況とは対照的です。
OpenClaw から Hermes Agent に移行できますか?
はい。特に 2026 年 3 月の CVE 公開以降、OpenClaw から Hermes Agent へ移行するユーザーが増えています。ワンクリックの移行ツールはありませんが、セットアップは簡単です。OpenClaw のスキルは作り直す必要がありますが、Hermes Agent は自己改善ループを通じてその多くを自動的に学習します。
Hermes Agent はどのプログラミング言語で書かれていますか?
Python です。コードベースは Python 3.11+ を必要とし、パッケージマネージャーとして uv を使用します。
Hermes Agent でスマートホームを操作できますか?
はい。Hermes Agent には Home Assistant ツールセットが内蔵されており、お使いの Home Assistant インスタンスに接続して IoT やスマートホームの制御が可能です。
Hermes Agent は ChatGPT や Claude とどう違うのですか?
ChatGPT や Claude は対話型 AI モデルです。Hermes Agent は、それらの LLM(GPT や Claude を含む)を「使用して」アクションを起こす自律型エージェントフレームワークです。コマンドの実行、ファイルの編集、Web ブラウジング、タスク管理、再利用可能なスキルの構築などを行います。最大の違いは「主体性(Agency)」にあります。Hermes Agent はセッションを跨いで行動し、学び、記憶します。
最終的な考察
Hermes Agent は、これまでのところ 2026 年で最も興味深いオープンソースエージェントプロジェクトです。自己改善型の学習ループは単なるマーケティング文句ではなく、SQLite、FTS5、および手続き的スキルファイルに基づいた、タスク完了能力を測定可能な形で向上させる具体的なシステムです。セキュリティ体制は強固で、モデルの柔軟性は類を見ず、MIT ライセンスによりすべてを自分のものとして所有できます。
エコシステムは OpenClaw の成熟したスキルマーケットプレイスと比較するとまだ若いですが、API コールごとの 73% の固定オーバーヘッドはコスト面で考慮すべき点です。しかし、使えば使うほど真に賢くなる AI エージェントを求めている人にとって、Hermes Agent は間違いなく最有力候補です。
サーバー設定なしで Hermes Agent のパワーを利用したいですか? Y Build は、Hermes Agent のモバイルファースト版のようなものです。同じ AI 自動化とプロダクト構築機能を備えていますが、VPS もターミナルも、技術的なバックグラウンドも必要ありません。スマホから構築してリリースしましょう。