Guia do Hermes Agent: O Agente de IA de Código Aberto que se Autoaperfeiçoa (2026)
Guia completo do Hermes Agent da Nous Research: etapas de instalação, memória autoaperfeiçoável, mais de 40 ferramentas, preços e como ele se compara ao OpenClaw em 2026.
O Hermes Agent da Nous Research é um agente de IA de código aberto, com licença MIT, que lembra do que aprende, cria habilidades reutilizáveis a partir da experiência e roda em praticamente qualquer LLM. Desde o seu primeiro lançamento em 25 de fevereiro de 2026, ele ultrapassou 57.000 estrelas no GitHub e se tornou o framework de agentes de código aberto de crescimento mais rápido do ano.
Este guia cobre tudo o que você precisa saber: o que o Hermes Agent realmente faz, como instalá-lo, quanto custa, como funciona seu sistema de memória autoaperfeiçoável e se ele faz sentido para o seu fluxo de trabalho.
TL;DR — Hermes Agent em um Relance
| Detalhe | Informação |
|---|---|
| Desenvolvedor | Nous Research |
| Licença | MIT (totalmente open-source, uso comercial permitido) |
| Estrelas no GitHub | 57.000+ |
| Última Versão | v0.7.0 "Resilience Release" (3 de abril de 2026) |
| Plataformas Suportadas | Linux, macOS, WSL2, Android (Termux) |
| Canais de Chat | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| Suporte a LLM | 200+ modelos via OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google |
| Ferramentas Integradas | 40+ (web, terminal, arquivo, navegador, visão, geração de imagem, TTS, cron, delegação) |
| Memória | Persistente entre sessões (SQLite + FTS5) |
| Autoaperfeiçoável | Sim — criação de habilidades procedurais a partir da experiência |
| Custo | Grátis (auto-hospedado) + $0–15/mês em uso de API |
O Que Torna o Hermes Agent Diferente
A maioria dos agentes de IA são stateless. Você lhes dá uma tarefa, eles a executam (ou tentam), e a próxima conversa começa do zero. O Hermes Agent quebra esse padrão com três capacidades principais que o definem.
Memória Persistente Entre Sessões
Cada conversa é gravada em um banco de dados SQLite e indexada com a busca de texto completo FTS5. Quando uma tarefa semelhante surge mais tarde, o Hermes pesquisa seu próprio histórico em vez de carregar sessões antigas inteiras na janela de contexto. Os resultados recuperados passam por uma sumarização de LLM para que apenas o contexto relevante seja injetado. O resultado: o agente se torna mais útil quanto mais você o utiliza.
Loop de Aprendizado Autoaperfeiçoável
A cada 15 chamadas de ferramentas, o Hermes executa um checkpoint de autoavaliação. Se o trabalho envolveu um procedimento reutilizável, ele cria ou corrige automaticamente uma habilidade (skill) — um arquivo markdown armazenado em ~/.hermes/skills/. Essas habilidades procedurais capturam como fazer algo, não apenas o que aconteceu. Na próxima vez que um problema semelhante aparecer, o Hermes carrega a habilidade relevante e a executa de forma mais eficiente.
Esta é a principal diferença em relação a outros agentes. O Hermes separa a memória procedural (métodos) da memória episódica (eventos), e ambas persistem entre as sessões.
Mais de 40 Ferramentas Integradas em Todas as Categorias
O Hermes já vem com um amplo registro de ferramentas prontas para o uso:
- Operações de arquivo — ler, escrever, pesquisar e editar arquivos
- Terminal — executar comandos shell, capturar saída
- Busca na web — buscar informações em tempo real na internet
- Automação de navegador — navegar, clicar, capturar telas (baseado em Chromium)
- Visão e geração de imagens — análise visual, criação de imagens via FAL
- Execução de código — executor de código em sandbox
- Busca de memória e sessão — pesquisar conversas anteriores
- Delegação — criar sub-agentes para tarefas paralelas
- Tarefas Cron — agendar tarefas recorrentes
- Home Assistant — IoT e controle de casa inteligente
- TTS — saída de texto para fala
- Todo — rastreamento de tarefas
- RL (aprendizado por reforço) — autotreinamento via Atropos
hermes tools.
Como Instalar o Hermes Agent
O Hermes roda em Linux, macOS, WSL2 e Android (Termux). Windows nativo não é suportado — use o WSL2 em vez disso. Toda a configuração leva cerca de cinco minutos.
Instalação em Uma Única Linha (Recomendado)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Isso cuida de tudo: clonagem do repositório, configuração de um ambiente virtual Python 3.11, instalação de dependências e configuração de diretórios.
Instalação Manual
# 1. Instale o uv (gerenciador de pacotes Python rápido)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Clone o repositório
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. Crie o ambiente virtual e instale
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
Configure seu Provedor de LLM
# Execute o assistente de configuração
hermes setup
# Ou configure manualmente — adicione sua chave de API em ~/.hermes/.env
echo "OPENROUTER_API_KEY=sua-chave-aqui" >> ~/.hermes/.env
# Escolha seu modelo
hermes model
O Hermes funciona com qualquer LLM que suporte contexto de 64K+. As escolhas populares incluem modelos do OpenRouter (200+ opções), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic e Google.
Opcional: Adicionar Chaves Específicas de Ferramentas
# Busca na web (Firecrawl)
echo "FIRECRAWL_API_KEY=sua-chave" >> ~/.hermes/.env
# Geração de imagem (FAL)
echo "FAL_KEY=sua-chave" >> ~/.hermes/.env
Iniciar
# Modo CLI
hermes
# Ou conecte-se a uma plataforma de mensagens
hermes gateway
O processo do gateway conecta o Hermes ao Telegram, Discord, Slack, WhatsApp e Signal simultaneamente através de um único processo.
v0.7.0 — A Versão de Resiliência (Resilience Release)
O último grande lançamento (3 de abril de 2026) entregou 168 PRs e resolveu 46 problemas. Aqui estão os destaques:
Provedores de Memória Plugáveis. A memória agora é um sistema de plugins extensível. Backends de terceiros (vector stores, Honcho, bancos de dados personalizados) implementam uma interface de provedor simples e se registram via sistema de plugins. Você não está mais limitado apenas ao SQLite. Rotação de Pool de Credenciais. Configure múltiplas chaves de API para o mesmo provedor. O Hermes alterna entre elas automaticamente usando uma estratégia de "menos utilizada" que é thread-safe. Uma falha 401 aciona a rotação instantânea para a próxima chave. Navegador Anti-Detecção Camoufox. Um novo backend de navegador local usando Camoufox para navegação furtiva com sessões persistentes e descoberta de URL VNC para depuração visual. Pré-visualizações de Diff Inline. As operações de escrita e correção (patch) de arquivos agora mostram diffs inline no feed de atividades da ferramenta, oferecendo confirmação visual do que mudou antes do agente prosseguir. Continuidade de Sessão do Servidor de API. O servidor de API transmite eventos de progresso da ferramenta em tempo real e suporta cabeçalhosX-Hermes-Session-Id para sessões persistentes em requisições HTTP.
Hermes Agent vs. OpenClaw — Qual Você Deve Escolher?
O OpenClaw é o outro grande framework de agentes de código aberto em 2026. Aqui está uma comparação direta.
| Recurso | Hermes Agent | OpenClaw |
|---|---|---|
| Estrelas no GitHub | 57.000+ | 15.000+ |
| Licença | MIT | MIT |
| Memória Autoaperfeiçoável | Sim (procedural + episódica) | Não (baseada em arquivos, manual) |
| Loop de Aprendizado | Criação automática de habilidades a cada 15 chamadas | Instalação manual de habilidades via ClawHub |
| Plataformas de Chat | 6 (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | 50+ (incluindo WeChat, Teams, Line, IRC, e-mail) |
| Habilidades da Comunidade | Crescendo (ecossistema jovem) | 13.000+ no ClawHub |
| CVEs de Segurança | 0 reportados (até abril de 2026) | 9 CVEs em 4 dias (março de 2026, incl. CVSS 9.9) |
| Automação de Navegador | Integrada (Chromium + Camoufox) | Baseada em plugins |
| Suporte a Modelos | 200+ via OpenRouter + provedores diretos | Faixa semelhante |
| Custo Típico | Grátis + $0–15/mês de API | Grátis + $5–15/mês de API + opcional $6/mês de hospedagem |
Quanto Custa o Hermes Agent?
O Hermes em si é gratuito e auto-hospedado. O custo real é o uso da API de LLM.
| Nível de Uso | Custo Mensal Estimado |
|---|---|
| Leve (algumas tarefas/dia, modelo barato) | $0–3 |
| Moderado (uso diário, modelo intermediário) | $5–10 |
| Pesado (sempre ligado, modelo premium) | $10–15 |
| Power user (delegação multi-agente, visão, ger. de imagem) | $15–30+ |
Uma coisa importante a saber: cerca de 73% de cada chamada de API é um overhead fixo das definições das ferramentas. Isso significa que tarefas curtas custam proporcionalmente mais do que tarefas longas. Se o custo for uma prioridade, escolha um modelo com preço por token mais baixo (DeepSeek e MiniMax M2.7 são opções populares de baixo custo).
Rodar em um VPS adiciona de $5 a $10/mês se você quiser que o agente esteja sempre online.
Parceria com a MiniMax AI
A Nous Research anunciou uma parceria com a MiniMax AI no início de 2026. O MiniMax M2.7 é agora um dos modelos mais utilizados dentro do Hermes Agent. A integração é de primeira classe: selecione "MiniMax (global endpoint)" na lista de provedores e escolha MiniMax-M2.7 como o modelo. As duas empresas estão colaborando para otimizar lançamentos futuros especificamente para o agente, com planos para recursos multimodais, incluindo visão, áudio e, potencialmente, integração com robótica.
Perguntas Frequentes (FAQ)
O Hermes Agent funciona com modelos locais?
Sim. O Hermes funciona com qualquer LLM que suporte contexto de 64K+. Você pode executá-lo com o Ollama para operação totalmente local e offline usando modelos como o Hermes 3 (baseado no Llama 3.1). Nenhuma chave de API é necessária para modelos locais.
É seguro rodar o Hermes Agent em um servidor?
A arquitetura inclui endurecimento de containers, isolamento de namespace para sub-agentes e rotação de credenciais. A versão v0.7.0 adicionou correções profundas de segurança. Até abril de 2026, o Hermes possui zero CVEs específicos de agente relatados — um forte contraste com a recente divulgação de 9 CVEs em 4 dias do OpenClaw.
Posso migrar do OpenClaw para o Hermes Agent?
Sim. Um número crescente de usuários está migrando do OpenClaw para o Hermes, particularmente após as divulgações de CVE em março de 2026. O Hermes não possui uma ferramenta de migração de um clique, mas a configuração é direta. Suas habilidades do OpenClaw precisarão ser recriadas, embora o Hermes aprenda muitas delas automaticamente através de seu loop de autoaperfeiçoamento.
Em qual linguagem de programação o Hermes Agent foi escrito?
Python. A base de código requer Python 3.11+ e utiliza o uv como seu gerenciador de pacotes.
O Hermes Agent pode controlar minha casa inteligente?
Sim. O Hermes possui um conjunto de ferramentas integrado para o Home Assistant que se conecta à sua instância do Home Assistant para controle de IoT e dispositivos inteligentes.
Como o Hermes Agent é diferente do ChatGPT ou Claude?
ChatGPT e Claude são modelos de IA conversacional. O Hermes Agent é um framework de agente autônomo que utiliza LLMs (incluindo GPT e Claude) para realizar ações: executar comandos, editar arquivos, navegar na web, gerenciar tarefas e construir habilidades reutilizáveis. A principal diferença é a agência — o Hermes age, aprende e lembra através das sessões.
Considerações Finais
O Hermes Agent é o projeto de agente de código aberto mais interessante de 2026 até agora. O loop de aprendizado autoaperfeiçoável não é uma promessa de marketing — é um sistema concreto construído em SQLite, FTS5 e arquivos de habilidades procedurais que melhora mensuravelmente a conclusão de tarefas ao longo do tempo. A postura de segurança é forte, a flexibilidade de modelos é incomparável e a licença MIT significa que você é dono de tudo.
O ecossistema ainda é jovem comparado ao mercado de habilidades maduro do OpenClaw, e o overhead fixo de 73% por chamada de API é uma consideração de custo real. Mas para quem deseja um agente de IA que genuinamente melhora quanto mais você o usa, o Hermes Agent é o líder absoluto.
Quer o poder do Hermes Agent sem a configuração do servidor? O Y Build é como uma versão mobile-first do Hermes Agent — as mesmas capacidades de automação de IA e construção de produtos, mas você não precisa de um VPS, de um terminal ou de qualquer conhecimento técnico. Construa e lance direto do seu celular.