Panduan Hermes Agent: Ejen AI Sumber Terbuka Penambahbaikan Kendiri (2026)
Panduan lengkap Hermes Agent oleh Nous Research: langkah pemasangan, memori penambahbaikan kendiri, 40+ alatan, harga, dan perbandingannya dengan OpenClaw pada tahun 2026.
Hermes Agent oleh Nous Research ialah ejen AI sumber terbuka berlesen MIT yang mengingati apa yang dipelajarinya, membina kemahiran boleh guna semula daripada pengalaman, dan berjalan pada hampir mana-mana LLM. Sejak keluaran pertamanya pada 25 Februari 2026, ia telah melepasi 57,000 bintang GitHub dan menjadi rangka kerja ejen sumber terbuka yang paling pesat berkembang tahun ini.
Panduan ini merangkumi semua yang anda perlu tahu: apa yang sebenarnya dilakukan oleh Hermes Agent, cara memasangnya, kosnya, cara sistem memori penambahbaikan kendirinya berfungsi, dan sama ada ia sesuai untuk aliran kerja anda.
TL;DR — Hermes Agent Secara Ringkas
| Butiran | Maklumat |
|---|---|
| Pembangun | Nous Research |
| Lesen | MIT (sumber terbuka sepenuhnya, penggunaan komersial OK) |
| Bintang GitHub | 57,000+ |
| Versi Terkini | v0.7.0 "Resilience Release" (3 April 2026) |
| Platform Sokongan | Linux, macOS, WSL2, Android (Termux) |
| Saluran Sembang | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| Sokongan LLM | 200+ model melalui OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google |
| Alatan Terbina Dalam | 40+ (web, terminal, fail, pelayar, vision, penjanaan imej, TTS, cron, delegasi) |
| Memori | Silang sesi berterusan (SQLite + FTS5) |
| Penambahbaikan Kendiri | Ya — penciptaan kemahiran prosedur daripada pengalaman |
| Kos | Percuma (hos sendiri) + $0–15/bulan untuk penggunaan API |
Apa Yang Membezakan Hermes Agent
Kebanyakan ejen AI adalah tanpa keadaan (stateless). Anda berikan tugasan, mereka melakukannya (atau cuba), dan perbualan seterusnya bermula dari sifar. Hermes Agent memecahkan corak itu dengan tiga keupayaan teras yang membezakannya.
Memori Silang Sesi Berterusan
Setiap perbualan ditulis ke pangkalan data SQLite dan diindeks dengan carian teks penuh FTS5. Apabila tugasan yang serupa muncul kemudian, Hermes mencari sejarahnya sendiri dan bukannya memuatkan keseluruhan sesi lama ke dalam tetingkap konteks (context window). Keputusan yang diperoleh melalui ringkasan LLM supaya hanya konteks yang relevan sahaja yang dimasukkan. Hasilnya: ejen menjadi lebih berguna semakin lama anda menggunakannya.
Gelung Pembelajaran Penambahbaikan Kendiri
Setiap 15 panggilan alatan, Hermes menjalankan pusat pemeriksaan penilaian kendiri. Jika kerja tersebut melibatkan prosedur yang boleh digunakan semula, ia akan mencipta atau membaiki kemahiran secara automatik — satu fail markdown yang disimpan dalam ~/.hermes/skills/. Kemahiran prosedur ini merakam cara melakukan sesuatu, bukan sekadar apa yang berlaku. Kali seterusnya masalah yang serupa muncul, Hermes memuatkan kemahiran yang relevan dan melaksanakannya dengan lebih cekap.
Ini adalah perbezaan utama berbanding ejen lain. Hermes memisahkan memori prosedur (kaedah) daripada memori episodik (peristiwa), dan kedua-duanya kekal merentasi sesi.
40+ Alatan Terbina Dalam Merentasi Setiap Kategori
Hermes didatangkan dengan pendaftaran alatan yang luas secara terus:
- Operasi fail — baca, tulis, cari, edit fail
- Terminal — jalankan arahan shell, tangkap output
- Carian web — ambil maklumat langsung dari internet
- Automasi pelayar — navigasi, klik, tangkap paparan (berasaskan Chromium)
- Vision & penjanaan imej — analisis visual, penciptaan imej melalui FAL
- Pelaksanaan kod — pelari kod dalam persekitaran sandbox
- Memori & carian sesi — cari perbualan lampau
- Delegasi — lancarkan sub-ejen untuk tugasan selari
- Tugasan Cron — jadualkan tugasan berulang
- Home Assistant — kawalan IoT dan rumah pintar
- TTS — output teks-ke-ucapan
- Todo — penjejakan tugasan
- RL (reinforcement learning) — latihan kendiri melalui Atropos
hermes tools.
Cara Memasang Hermes Agent
Hermes berjalan pada Linux, macOS, WSL2, dan Android (Termux). Windows asli tidak disokong — gunakan WSL2 sebagai ganti. Keseluruhan persediaan mengambil masa kira-kira lima minit.
Pemasangan Satu Baris (Disyorkan)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Ini mengendalikan segala-galanya: mengklon repo, menyediakan persekitaran maya Python 3.11, memasang dependensi, dan mengkonfigurasi direktori.
Pemasangan Manual
# 1. Pasang uv (pengurus pakej Python yang pantas)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Klon repositori
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. Cipta persekitaran maya dan pasang
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
Konfigurasi Penyedia LLM Anda
# Jalankan wizard persediaan
hermes setup
# Atau konfigurasi secara manual — tambah kunci API anda ke ~/.hermes/.env
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# Pilih model anda
hermes model
Hermes berfungsi dengan mana-mana LLM yang menyokong konteks 64K+. Pilihan popular termasuk model daripada OpenRouter (200+ pilihan), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic, dan Google.
Pilihan: Tambah Kunci Khusus Alatan
# Carian web (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# Penjanaan imej (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
Lancarkan
# Mod CLI
hermes
# Atau sambungkan ke platform pemesejan
hermes gateway
Proses gateway menyambungkan Hermes ke Telegram, Discord, Slack, WhatsApp, dan Signal secara serentak melalui satu proses tunggal.
v0.7.0 — Keluaran Ketahanan (Resilience Release)
Keluaran utama terbaru (3 April 2026) menyertakan 168 PR dan menyelesaikan 46 isu. Berikut adalah sorotannya:
Penyedia Memori Boleh Cabut (Pluggable). Memori kini merupakan sistem plugin yang boleh dilanjutkan. Backend pihak ketiga (stor vektor, Honcho, pangkalan data tersuai) melaksanakan antara muka penyedia yang mudah dan mendaftar melalui sistem plugin. Anda tidak lagi terikat dengan SQLite sahaja. Putaran Kolam Kredential. Konfigurasi berbilang kunci API untuk penyedia yang sama. Hermes berputar melaluinya secara automatik menggunakan strategi least-used yang selamat. Kegagalan 401 mencetuskan putaran segera ke kunci seterusnya. Pelayar Anti-Pengesanan Camoufox. Backend pelayar tempatan baharu menggunakan Camoufox untuk pelayaran tersembunyi dengan sesi berterusan dan penemuan URL VNC untuk penyahpepijatan visual. Pratonton Perbezaan (Diff) Dalam Talian. Operasi tulis fail dan tampalan kini menunjukkan perbezaan dalam talian dalam suapan aktiviti alatan, memberikan pengesahan visual tentang apa yang berubah sebelum ejen meneruskan langkah seterusnya. Kesinambungan Sesi Pelayan API. Pelayan API menstrim peristiwa kemajuan alatan dalam masa nyata dan menyokong pengepalaX-Hermes-Session-Id untuk sesi berterusan merentasi permintaan HTTP.
Hermes Agent lwn. OpenClaw — Mana Satu Patut Anda Pilih?
OpenClaw ialah rangka kerja ejen sumber terbuka utama yang lain pada tahun 2026. Berikut ialah perbandingan langsung.
| Ciri | Hermes Agent | OpenClaw |
|---|---|---|
| Bintang GitHub | 57,000+ | 15,000+ |
| Lesen | MIT | MIT |
| Memori Penambahbaikan Kendiri | Ya (prosedur + episodik) | Tidak (berasaskan fail, manual) |
| Gelung Pembelajaran | Penciptaan kemahiran automatik setiap 15 panggilan alatan | Pemasangan kemahiran manual melalui ClawHub |
| Platform Sembang | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (termasuk WeChat, Teams, Line, IRC, emel) |
| Kemahiran Komuniti | Berkembang (ekosistem muda) | 13,000+ di ClawHub |
| Keselamatan CVE | 0 dilaporkan (sehingga April 2026) | 9 CVE dalam 4 hari (Mac 2026, termasuk CVSS 9.9) |
| Automasi Pelayar | Terbina dalam (Chromium + Camoufox) | Berasaskan plugin |
| Sokongan Model | 200+ melalui OpenRouter + penyedia terus | Julat yang serupa |
| Kos Tipikal | Percuma + $0–15/bulan API | Percuma + $5–15/bulan API + pilihan $6/bulan pengehosan |
Berapakah Kos Hermes Agent?
Hermes sendiri adalah percuma dan dihoskan sendiri. Kos sebenar adalah penggunaan API LLM.
| Tahap Penggunaan | Anggaran Kos Bulanan |
|---|---|
| Ringan (beberapa tugasan/hari, model murah) | $0–3 |
| Sederhana (penggunaan harian, model tahap pertengahan) | $5–10 |
| Berat (sentiasa aktif, model premium) | $10–15 |
| Pengguna Berkuasa (delegasi berbilang ejen, vision, penjanaan imej) | $15–30+ |
Satu perkara yang perlu diketahui: kira-kira 73% daripada setiap panggilan API adalah overhed tetap daripada definisi alatan. Ini bermakna tugasan pendek menelan kos yang lebih tinggi secara berkadar berbanding tugasan panjang. Jika kos menjadi faktor, pilih model dengan harga per-token yang lebih rendah (DeepSeek dan MiniMax M2.7 adalah pilihan bajet yang popular).
Menjalankan pada VPS menambah $5–10/bulan jika anda mahu ejen sentiasa aktif.
Perkongsian MiniMax AI
Nous Research mengumumkan perkongsian dengan MiniMax AI pada awal 2026. MiniMax M2.7 kini merupakan salah satu model yang paling banyak digunakan di dalam Hermes Agent. Integrasi ini adalah kelas pertama: pilih "MiniMax (global endpoint)" daripada senarai penyedia dan pilih MiniMax-M2.7 sebagai model. Kedua-dua syarikat sedang bekerjasama untuk mengoptimumkan keluaran masa hadapan khusus untuk ejen tersebut, dengan rancangan untuk ciri multimodal termasuk vision, audio, dan potensi integrasi robotik.
Soalan Lazim
Adakah Hermes Agent berfungsi dengan model tempatan?
Ya. Hermes berfungsi dengan mana-mana LLM yang menyokong konteks 64K+. Anda boleh menjalankannya dengan Ollama untuk operasi luar talian sepenuhnya menggunakan model seperti Hermes 3 (berasaskan Llama 3.1). Tiada kunci API diperlukan untuk model tempatan.
Adakah Hermes Agent selamat untuk dijalankan pada pelayan?
Arkitekturnya merangkumi pengukuhan kontena, pengasingan ruang nama untuk sub-ejen, dan putaran kredential. Keluaran v0.7.0 menambah pembaikan keselamatan yang mendalam. Setakat April 2026, Hermes mempunyai sifar CVE khusus ejen yang dilaporkan — berbeza dengan pendedahan baru-baru ini oleh OpenClaw iaitu 9 CVE dalam 4 hari.
Bolehkah saya berhijrah dari OpenClaw ke Hermes Agent?
Ya. Semakin ramai pengguna berhijrah dari OpenClaw ke Hermes, terutamanya selepas pendedahan CVE Mac 2026. Hermes tidak mempunyai alat penghijrahan satu klik, tetapi persediaannya mudah. Kemahiran OpenClaw anda perlu dicipta semula, walaupun Hermes akan mempelajari kebanyakannya secara automatik melalui gelung penambahbaikan kendirinya.
Apakah bahasa pengaturcaraan yang digunakan untuk menulis Hermes Agent?
Python. Kod sumber memerlukan Python 3.11+ dan menggunakan uv sebagai pengurus pakejnya.
Bolehkah Hermes Agent mengawal rumah pintar saya?
Ya. Hermes mempunyai set alatan Home Assistant terbina dalam yang menyambung ke instansi Home Assistant anda untuk kawalan IoT dan rumah pintar.
Apakah perbezaan Hermes Agent dengan ChatGPT atau Claude?
ChatGPT dan Claude adalah model AI perbualan. Hermes Agent ialah rangka kerja ejen autonomi yang menggunakan LLM (termasuk GPT dan Claude) untuk mengambil tindakan: menjalankan arahan, mengedit fail, melayari web, mengurus tugasan, dan membina kemahiran boleh guna semula. Perbezaan utamanya ialah agensi — Hermes bertindak, belajar, dan mengingati merentasi sesi.
Kata Putus
Hermes Agent ialah projek ejen sumber terbuka yang paling menarik pada tahun 2026 setakat ini. Gelung pembelajaran penambahbaikan kendiri bukannya sekadar dakwaan pemasaran — ia adalah sistem konkrit yang dibina di atas SQLite, FTS5, dan fail kemahiran prosedur yang secara terukur meningkatkan penyelesaian tugasan dari semasa ke semasa. Tahap keselamatannya teguh, fleksibiliti model tidak tertandingi, dan lesen MIT bermakna anda memiliki segala-galanya.
Ekosistemnya masih muda berbanding pasaran kemahiran matang OpenClaw, dan overhed tetap 73% bagi setiap panggilan API adalah pertimbangan kos yang nyata. Tetapi bagi sesiapa yang mahukan ejen AI yang benar-benar bertambah baik semakin lama anda menggunakannya, Hermes Agent adalah pendahulu yang jelas.
Mahukan kuasa Hermes Agent tanpa persediaan pelayan? Y Build adalah seperti versi mudah alih Hermes Agent — keupayaan automasi AI dan pembinaan produk yang sama, tetapi anda tidak memerlukan VPS, terminal, atau sebarang latar belakang teknikal. Bina dan lancarkan terus dari telefon anda.