Hướng dẫn Hermes Agent: AI Agent Mã Nguồn Mở Tự Cải Thiện (2026)
Hướng dẫn đầy đủ về Hermes Agent của Nous Research: các bước cài đặt, bộ nhớ tự cải thiện, hơn 40 công cụ, chi phí và so sánh với OpenClaw năm 2026.
Hermes Agent của Nous Research là một AI agent mã nguồn mở, sử dụng giấy phép MIT, có khả năng ghi nhớ những gì nó học được, xây dựng các kỹ năng có thể tái sử dụng từ kinh nghiệm và chạy trên hầu hết mọi LLM. Kể từ bản phát hành đầu tiên vào ngày 25 tháng 2 năm 2026, nó đã vượt qua 57.000 sao trên GitHub và trở thành framework agent mã nguồn mở phát triển nhanh nhất trong năm.
Hướng dẫn này bao gồm mọi thứ bạn cần biết: Hermes Agent thực sự làm được gì, cách cài đặt, chi phí, cách hệ thống bộ nhớ tự cải thiện hoạt động và liệu nó có phù hợp với quy trình làm việc của bạn hay không.
TL;DR — Tổng quan về Hermes Agent
| Chi tiết | Thông tin |
|---|---|
| Nhà phát triển | Nous Research |
| Giấy phép | MIT (hoàn toàn mã nguồn mở, cho phép sử dụng thương mại) |
| GitHub Stars | 57.000+ |
| Phiên bản mới nhất | v0.7.0 "Resilience Release" (03/04/2026) |
| Nền tảng hỗ trợ | Linux, macOS, WSL2, Android (Termux) |
| Kênh trò chuyện | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| Hỗ trợ LLM | 200+ mô hình thông qua OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google |
| Công cụ tích hợp | 40+ (web, terminal, file, trình duyệt, vision, tạo ảnh, TTS, cron, ủy quyền) |
| Bộ nhớ | Lưu trữ liên phiên (SQLite + FTS5) |
| Tự cải thiện | Có — tạo kỹ năng theo quy trình từ kinh nghiệm |
| Chi phí | Miễn phí (tự lưu trữ) + $0–15/tháng phí sử dụng API |
Điều gì làm cho Hermes Agent khác biệt
Hầu hết các AI agent đều không có trạng thái (stateless). Bạn giao cho chúng một nhiệm vụ, chúng thực hiện (hoặc cố gắng thực hiện), và cuộc hội thoại tiếp theo sẽ bắt đầu từ con số không. Hermes Agent phá vỡ mô hình đó với ba khả năng cốt lõi tạo nên sự khác biệt.
Bộ nhớ liên phiên bền vững (Persistent Cross-Session Memory)
Mọi cuộc hội thoại đều được ghi vào cơ sở dữ liệu SQLite và được lập chỉ mục bằng tìm kiếm toàn văn FTS5. Khi một nhiệm vụ tương tự xuất hiện sau đó, Hermes sẽ tìm kiếm trong lịch sử của chính nó thay vì tải toàn bộ các phiên cũ vào context window. Kết quả truy xuất được đi qua bước tóm tắt của LLM để chỉ các ngữ cảnh có liên quan mới được đưa vào. Kết quả là: agent càng trở nên hữu ích khi bạn sử dụng nó càng lâu.
Vòng lặp học tập tự cải thiện (Self-Improving Learning Loop)
Cứ sau mỗi 15 lần gọi công cụ, Hermes sẽ thực hiện một điểm kiểm tra tự đánh giá. Nếu công việc liên quan đến một quy trình có thể tái sử dụng, nó sẽ tự động tạo hoặc vá một kỹ năng — một tệp markdown được lưu trữ trong ~/.hermes/skills/. Những kỹ năng quy trình này ghi lại cách thực hiện một việc gì đó, chứ không chỉ là những gì đã xảy ra. Lần tới khi một vấn đề tương tự xuất hiện, Hermes sẽ tải kỹ năng liên quan và thực hiện nó hiệu quả hơn.
Đây là điểm khác biệt chính so với các agent khác. Hermes tách biệt bộ nhớ quy trình (phương pháp) khỏi bộ nhớ tình tiết (sự kiện), và cả hai đều tồn tại xuyên suốt các phiên làm việc.
Hơn 40 công cụ tích hợp trong mọi danh mục
Hermes đi kèm với một danh mục công cụ rộng lớn ngay khi xuất xưởng:
- Thao tác tệp — đọc, ghi, tìm kiếm, chỉnh sửa tệp
- Terminal — chạy các lệnh shell, thu thập đầu ra
- Tìm kiếm web — lấy thông tin trực tiếp từ internet
- Tự động hóa trình duyệt — điều hướng, nhấp chuột, chụp ảnh màn hình (dựa trên Chromium)
- Vision & tạo ảnh — phân tích hình ảnh, tạo ảnh thông qua FAL
- Thực thi mã — trình chạy mã trong môi trường sandbox
- Tìm kiếm bộ nhớ & phiên — tìm kiếm các cuộc hội thoại trong quá khứ
- Ủy quyền (Delegation) — khởi tạo các sub-agent cho các tác vụ song song
- Cron jobs — lập lịch các tác vụ định kỳ
- Home Assistant — điều khiển IoT và nhà thông minh
- TTS — đầu ra chuyển văn bản thành giọng nói
- Todo — theo dõi nhiệm vụ
- RL (reinforcement learning) — tự huấn luyện thông qua Atropos
hermes tools.
Cách cài đặt Hermes Agent
Hermes chạy trên Linux, macOS, WSL2 và Android (Termux). Windows nguyên bản không được hỗ trợ — hãy sử dụng WSL2 thay thế. Toàn bộ quá trình thiết lập mất khoảng năm phút.
Cài đặt bằng một dòng lệnh (Khuyến nghị)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Lệnh này xử lý mọi thứ: sao chép kho lưu trữ, thiết lập môi trường ảo Python 3.11, cài đặt các phụ thuộc và cấu hình các thư mục.
Cài đặt thủ công
# 1. Cài đặt uv (trình quản lý gói Python nhanh)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Sao chép kho lưu trữ
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. Tạo môi trường ảo và cài đặt
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
Cấu hình nhà cung cấp LLM của bạn
# Chạy trình hướng dẫn thiết lập
hermes setup
# Hoặc cấu hình thủ công — thêm API key của bạn vào ~/.hermes/.env
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# Chọn mô hình của bạn
hermes model
Hermes hoạt động với bất kỳ LLM nào hỗ trợ ngữ cảnh 64K+. Các lựa chọn phổ biến bao gồm các mô hình từ OpenRouter (hơn 200 tùy chọn), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic và Google.
Tùy chọn: Thêm các key cụ thể cho công cụ
# Tìm kiếm web (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# Tạo ảnh (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
Khởi chạy
# Chế độ CLI
hermes
# Hoặc kết nối với một nền tảng nhắn tin
hermes gateway
Tiến trình gateway kết nối Hermes với Telegram, Discord, Slack, WhatsApp và Signal đồng thời thông qua một tiến trình duy nhất.
v0.7.0 — Bản phát hành Resilience
Bản phát hành lớn mới nhất (03/04/2026) đã bao gồm 168 PR và giải quyết 46 lỗi. Dưới đây là những điểm nổi bật:
Nhà cung cấp bộ nhớ có thể cắm (Pluggable Memory Providers). Bộ nhớ hiện là một hệ thống plugin có thể mở rộng. Các backend của bên thứ ba (vector stores, Honcho, cơ sở dữ liệu tùy chỉnh) triển khai một giao diện nhà cung cấp đơn giản và đăng ký thông qua hệ thống plugin. Bạn không còn bị giới hạn trong một mình SQLite. Xoay vòng kho thông tin xác thực (Credential Pool Rotation). Cấu hình nhiều API key cho cùng một nhà cung cấp. Hermes sẽ tự động xoay vòng chúng bằng chiến lược thread-safe ít sử dụng nhất. Một lỗi 401 sẽ kích hoạt xoay vòng tức thì sang key tiếp theo. Trình duyệt chống phát hiện Camoufox. Một backend trình duyệt cục bộ mới sử dụng Camoufox để duyệt web ẩn danh với các phiên làm việc bền vững và khám phá URL VNC để gỡ lỗi trực quan. Xem trước Diff trực tiếp (Inline Diff Previews). Các thao tác ghi và vá tệp hiện hiển thị các thay đổi (diff) trực tiếp trong luồng hoạt động của công cụ, cung cấp xác nhận trực quan về những gì đã thay đổi trước khi agent tiếp tục. Tính liên tục của phiên API Server. API server truyền trực tiếp các sự kiện tiến trình của công cụ trong thời gian thực và hỗ trợ tiêu đềX-Hermes-Session-Id cho các phiên làm việc bền vững trên các yêu cầu HTTP.
Hermes Agent và OpenClaw — Bạn nên chọn cái nào?
OpenClaw là một framework agent mã nguồn mở lớn khác vào năm 2026. Dưới đây là bảng so sánh trực tiếp.
| Tính năng | Hermes Agent | OpenClaw |
|---|---|---|
| GitHub Stars | 57.000+ | 15.000+ |
| Giấy phép | MIT | MIT |
| Bộ nhớ tự cải thiện | Có (quy trình + tình tiết) | Không (dựa trên tệp, thủ công) |
| Vòng lặp học tập | Tự động tạo kỹ năng sau mỗi 15 lần gọi công cụ | Cài đặt kỹ năng thủ công qua ClawHub |
| Nền tảng chat | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (bao gồm WeChat, Teams, Line, IRC, email) |
| Kỹ năng cộng đồng | Đang phát triển (hệ sinh thái trẻ) | 13.000+ trên ClawHub |
| Lỗ hổng bảo mật CVE | 0 được báo cáo (tính đến tháng 4/2026) | 9 CVE trong 4 ngày (tháng 3/2026, bao gồm CVSS 9.9) |
| Tự động hóa trình duyệt | Tích hợp sẵn (Chromium + Camoufox) | Dựa trên plugin |
| Hỗ trợ mô hình | 200+ qua OpenRouter + nhà cung cấp trực tiếp | Phạm vi tương tự |
| Chi phí điển hình | Miễn phí + $0–15/tháng API | Miễn phí + $5–15/tháng API + tùy chọn $6/tháng hosting |
Hermes Agent tốn bao nhiêu chi phí?
Bản thân Hermes là miễn phí và tự lưu trữ. Chi phí thực sự là việc sử dụng API của LLM.
| Mức độ sử dụng | Chi phí hàng tháng ước tính |
|---|---|
| Nhẹ (vài tác vụ/ngày, mô hình giá rẻ) | $0–3 |
| Trung bình (sử dụng hàng ngày, mô hình tầm trung) | $5–10 |
| Nhiều (luôn bật, mô hình cao cấp) | $10–15 |
| Power user (ủy quyền đa agent, vision, tạo ảnh) | $15–30+ |
Một điều cần biết: khoảng 73% mỗi lần gọi API là chi phí cố định (overhead) từ các định nghĩa công cụ. Điều này có nghĩa là các tác vụ ngắn có chi phí tỷ lệ thuận cao hơn các tác vụ dài. Nếu chi phí là vấn đề, hãy chọn một mô hình có giá mỗi token thấp hơn (DeepSeek và MiniMax M2.7 là những lựa chọn ngân sách phổ biến).
Chạy trên một VPS sẽ tốn thêm $5–10/tháng nếu bạn muốn agent luôn trực tuyến.
Quan hệ đối tác MiniMax AI
Nous Research đã công bố quan hệ đối tác với MiniMax AI vào đầu năm 2026. MiniMax M2.7 hiện là một trong những mô hình được sử dụng nhiều nhất bên trong Hermes Agent. Việc tích hợp được ưu tiên hàng đầu: chọn "MiniMax (global endpoint)" từ danh sách nhà cung cấp và chọn MiniMax-M2.7 làm mô hình. Hai công ty đang hợp tác để tối ưu hóa các bản phát hành trong tương lai dành riêng cho agent này, với kế hoạch cho các tính năng đa phương thức bao gồm thị giác, âm thanh và tiềm năng tích hợp robot.
Các câu hỏi thường gặp
Hermes Agent có hoạt động với các mô hình cục bộ không?
Có. Hermes hoạt động với bất kỳ LLM nào hỗ trợ ngữ cảnh 64K+. Bạn có thể chạy nó với Ollama để vận hành hoàn toàn cục bộ, ngoại tuyến bằng các mô hình như Hermes 3 (dựa trên Llama 3.1). Không cần API key cho các mô hình cục bộ.
Chạy Hermes Agent trên máy chủ có an toàn không?
Kiến trúc bao gồm làm cứng container, cách ly namespace cho các sub-agent và xoay vòng thông tin xác thực. Bản phát hành v0.7.0 đã thêm các bản vá bảo mật sâu. Tính đến tháng 4 năm 2026, Hermes có không có CVE cụ thể cho agent nào được báo cáo — một sự tương phản rõ rệt với việc OpenClaw tiết lộ 9 CVE trong 4 ngày gần đây.
Tôi có thể di chuyển từ OpenClaw sang Hermes Agent không?
Có. Một số lượng ngày càng tăng người dùng đang di chuyển từ OpenClaw sang Hermes, đặc biệt là sau các vụ tiết lộ CVE vào tháng 3 năm 2026. Hermes không có công cụ di chuyển một cú nhấp chuột, nhưng việc thiết lập rất đơn giản. Các kỹ năng OpenClaw của bạn sẽ cần được tạo lại, mặc dù Hermes sẽ tự động học nhiều kỹ năng trong số đó thông qua vòng lặp tự cải thiện của nó.
Hermes Agent được viết bằng ngôn ngữ lập trình nào?
Python. Mã nguồn yêu cầu Python 3.11+ và sử dụng uv làm trình quản lý gói.
Hermes Agent có thể điều khiển nhà thông minh của tôi không?
Có. Hermes có bộ công cụ Home Assistant tích hợp sẵn để kết nối với thực thể Home Assistant của bạn nhằm điều khiển IoT và nhà thông minh.
Hermes Agent khác với ChatGPT hay Claude như thế nào?
ChatGPT và Claude là các mô hình AI hội thoại. Hermes Agent là một framework agent tự chủ sử dụng các LLM (bao gồm GPT và Claude) để thực hiện hành động: chạy lệnh, chỉnh sửa tệp, duyệt web, quản lý tác vụ và xây dựng các kỹ năng có thể tái sử dụng. Khác biệt chính là tính chủ động — Hermes hành động, học hỏi và ghi nhớ xuyên suốt các phiên làm việc.
Lời kết
Hermes Agent là dự án agent mã nguồn mở thú vị nhất của năm 2026 cho đến nay. Vòng lặp học tập tự cải thiện không phải là một lời quảng cáo — đó là một hệ thống cụ thể được xây dựng trên SQLite, FTS5 và các tệp kỹ năng quy trình giúp cải thiện rõ rệt khả năng hoàn thành tác vụ theo thời gian. Vị thế bảo mật mạnh mẽ, tính linh hoạt của mô hình là vô đối và giấy phép MIT có nghĩa là bạn sở hữu mọi thứ.
Hệ sinh thái này vẫn còn non trẻ so với kho kỹ năng trưởng thành của OpenClaw, và chi phí cố định 73% cho mỗi lần gọi API là một vấn đề cần cân nhắc về chi phí thực tế. Nhưng đối với bất kỳ ai muốn một AI agent thực sự trở nên tốt hơn khi bạn sử dụng nó càng nhiều, Hermes Agent là ứng cử viên hàng đầu rõ rệt.
Bạn muốn sức mạnh của Hermes Agent mà không cần thiết lập máy chủ? Y Build giống như một phiên bản ưu tiên di động của Hermes Agent — cùng khả năng tự động hóa AI và xây dựng sản phẩm, nhưng bạn không cần VPS, terminal hay bất kỳ nền tảng kỹ thuật nào. Xây dựng và triển khai ngay từ điện thoại của bạn.