হার্মিস এজেন্ট গাইড: সেলফ-ইমপ্রুভিং ওপেন-সোর্স এআই এজেন্ট (২০২৬)
Nous Research-এর হার্মিস এজেন্ট-এর পূর্ণাঙ্গ গাইড: ইনস্টলেশন ধাপ, সেলফ-ইমপ্রুভিং মেমরি, ৪০+ টুলস, মূল্য এবং ২০২৬ সালে OpenClaw-এর সাথে তুলনা।
Nous Research-এর Hermes Agent হলো একটি ওপেন-সোর্স, MIT-লাইসেন্সপ্রাপ্ত এআই এজেন্ট যা যা শেখে তা মনে রাখে, অভিজ্ঞতা থেকে পুনরায় ব্যবহারযোগ্য দক্ষতা (skills) তৈরি করে এবং প্রায় সব LLM-এই চলে। ২৫ ফেব্রুয়ারি, ২০২৬-এ প্রথম প্রকাশের পর থেকে, এটি ৫৭,০০০-এর বেশি GitHub স্টার অতিক্রম করেছে এবং বছরের দ্রুততম বর্ধনশীল ওপেন-সোর্স এজেন্ট ফ্রেমওয়ার্ক হয়ে উঠেছে।
এই গাইডটিতে আপনার যা জানা দরকার তার সবই রয়েছে: Hermes Agent আসলে কী করে, কীভাবে এটি ইনস্টল করবেন, এর খরচ কত, কীভাবে এর সেলফ-ইমপ্রুভিং মেমরি সিস্টেম কাজ করে এবং আপনার কাজের জন্য এটি উপযুক্ত কি না।
এক নজরে হার্মিস এজেন্ট (TL;DR)
| বিবরণ | তথ্য |
|---|---|
| ডেভেলপার | Nous Research |
| লাইসেন্স | MIT (সম্পূর্ণ ওপেন-সোর্স, বাণিজ্যিক ব্যবহার সম্ভব) |
| GitHub স্টার | ৫৭,০০০+ |
| সর্বশেষ ভার্সন | v0.7.0 "Resilience Release" (৩ এপ্রিল, ২০২৬) |
| সাপোর্টেড প্ল্যাটফর্ম | Linux, macOS, WSL2, Android (Termux) |
| চ্যাট চ্যানেল | Telegram, Discord, Slack, WhatsApp, Signal, CLI |
| LLM সাপোর্ট | OpenRouter, DeepSeek, Kimi, MiniMax, OpenAI, Anthropic, Google-এর মাধ্যমে ২০০+ মডেল |
| বিল্ট-ইন টুলস | ৪০+ (web, terminal, file, browser, vision, image gen, TTS, cron, delegation) |
| মেমরি | পার্সিস্টেন্ট ক্রস-সেশন (SQLite + FTS5) |
| সেলফ-ইমপ্রুভিং | হ্যাঁ — অভিজ্ঞতা থেকে প্রসিডিউরাল স্কিল তৈরি করে |
| খরচ | ফ্রি (সেলফ-হোস্টেড) + API ব্যবহারের জন্য মাসে $০–১৫ |
হার্মিস এজেন্ট কেন আলাদা
বেশিরভাগ এআই এজেন্ট 'স্টেটলেস' (stateless)। আপনি তাদের একটি কাজ দেন, তারা সেটি করে (বা চেষ্টা করে), এবং পরের কথোপকথন আবার শূন্য থেকে শুরু হয়। Hermes Agent এই ধারাটি ভেঙে তিনটি মূল বৈশিষ্ট্যের মাধ্যমে নিজেকে আলাদা করে তুলেছে।
পার্সিস্টেন্ট ক্রস-সেশন মেমরি
প্রতিটি কথোপকথন একটি SQLite ডাটাবেসে লেখা হয় এবং FTS5 ফুল-টেক্সট সার্চের মাধ্যমে ইনডেক্স করা হয়। পরবর্তীতে যখন একই ধরণের কোনো কাজ আসে, Hermes পুরো পুরনো সেশন কন্টেক্সট উইন্ডোতে লোড করার পরিবর্তে নিজস্ব ইতিহাস অনুসন্ধান করে। প্রাপ্ত ফলাফলগুলো LLM সামারাইজেশনের মাধ্যমে ফিল্টার হয়ে আসে যাতে শুধুমাত্র প্রাসঙ্গিক কন্টেক্সট ইনজেক্ট করা হয়। ফলাফল: আপনি যত বেশি এটি ব্যবহার করবেন, এজেন্টটি তত বেশি কার্যকর হয়ে উঠবে।
সেলফ-ইমপ্রুভিং লার্নিং লুপ
প্রতি ১৫টি টুল কলের পর, Hermes একটি সেলফ-ইভালুয়েশন চেকপয়েন্ট চালায়। যদি কাজটি এমন হয় যা পুনরায় ব্যবহারযোগ্য, তবে এটি স্বয়ংক্রিয়ভাবে একটি 'স্কিল' তৈরি বা প্যাচ করে — যা ~/.hermes/skills/ ডিরেক্টরিতে একটি markdown ফাইল হিসেবে জমা থাকে। এই প্রসিডিউরাল স্কিলগুলো শুধুমাত্র কী ঘটেছিল তা নয়, বরং কোনো কাজ কীভাবে করতে হয় তাও মনে রাখে। পরের বার একই ধরণের সমস্যা দেখা দিলে, Hermes সংশ্লিষ্ট স্কিলটি লোড করে এবং আরও দক্ষতার সাথে কাজ সম্পন্ন করে।
অন্যান্য এজেন্টের সাথে এটিই এর মূল পার্থক্য। Hermes প্রসিডিউরাল মেমরি (পদ্ধতি) এবং এপিসোডিক মেমরি (ঘটনা) আলাদা রাখে এবং উভয়ই সেশন জুড়ে স্থায়ী হয়।
৪০+ বিল্ট-ইন টুলস
Hermes সরাসরি ব্যবহারের জন্য একটি বিশাল টুল রেজিস্ট্রি সহ আসে:
- ফাইল অপারেশনস — ফাইল পড়া, লেখা, সার্চ করা এবং এডিট করা
- টার্মিনাল — শেল কমান্ড চালানো এবং আউটপুট ক্যাপচার করা
- ওয়েব সার্চ — ইন্টারনেট থেকে লাইভ তথ্য সংগ্রহ করা
- ব্রাউজার অটোমেশন — নেভিগেট, ক্লিক এবং স্ন্যাপশট নেওয়া (Chromium-ভিত্তিক)
- ভিশন এবং ইমেজ জেনারেশন — ভিজ্যুয়াল অ্যানালাইসিস এবং FAL-এর মাধ্যমে ছবি তৈরি
- কোড এক্সিকিউশন — স্যান্ডবক্সড কোড রানার
- মেমরি ও সেশন সার্চ — অতীতের কথোপকথন অনুসন্ধান করা
- ডেলেগেশন — প্যারালাল টাস্কের জন্য সাব-এজেন্ট তৈরি করা
- ক্রন জবস — পুনরাবৃত্তিমূলক কাজের সময়সূচী নির্ধারণ করা
- Home Assistant — IoT এবং স্মার্ট হোম নিয়ন্ত্রণ
- TTS — টেক্সট-টু-স্পিচ আউটপুট
- Todo — টাস্ক ট্র্যাকিং
- RL (reinforcement learning) — Atropos-এর মাধ্যমে সেলফ-ট্রেনিং
hermes tools কমান্ডের মাধ্যমে কোন টুলসেটগুলো সক্রিয় থাকবে তা কনফিগার করতে পারেন।
হার্মিস এজেন্ট কীভাবে ইনস্টল করবেন
Hermes Linux, macOS, WSL2 এবং Android (Termux)-এ চলে। নেটিভ উইন্ডোজ সমর্থিত নয় — পরিবর্তে WSL2 ব্যবহার করুন। পুরো সেটআপ করতে প্রায় পাঁচ মিনিট সময় লাগে।
ওয়ান-লাইন ইনস্টল (সুপারিশকৃত)
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
এটি সবকিছু সামলায়: রেপো ক্লোন করা, Python 3.11 ভার্চুয়াল এনভায়রনমেন্ট সেটআপ করা, ডিপেন্ডেন্সি ইনস্টল করা এবং ডিরেক্টরি কনফিগার করা।
ম্যানুয়াল ইনস্টল
# 1. uv ইনস্টল করুন (দ্রুত পাইথন প্যাকেজ ম্যানেজার)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. রিপোজিটরি ক্লোন করুন
git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
# 3. ভার্চুয়াল এনভায়রনমেন্ট তৈরি এবং ইনস্টল করুন
uv venv --python 3.11
source .venv/bin/activate
uv pip install -e ".[all]"
আপনার LLM প্রোভাইডার কনফিগার করুন
# সেটআপ উইজার্ড চালান
hermes setup
# অথবা ম্যানুয়ালি কনফিগার করুন — ~/.hermes/.env ফাইলে আপনার API key যোগ করুন
echo "OPENROUTER_API_KEY=your-key-here" >> ~/.hermes/.env
# আপনার মডেল বেছে নিন
hermes model
Hermes এমন যেকোনো LLM-এর সাথে কাজ করে যা 64K+ কন্টেক্সট সাপোর্ট করে। জনপ্রিয় পছন্দের মধ্যে রয়েছে OpenRouter (২০০+ অপশন), DeepSeek, MiniMax M2.7, Kimi, OpenAI, Anthropic এবং Google।
ঐচ্ছিক: টুল-স্পেসিফিক কী যোগ করুন
# ওয়েব সার্চ (Firecrawl)
echo "FIRECRAWL_API_KEY=your-key" >> ~/.hermes/.env
# ইমেজ জেনারেশন (FAL)
echo "FAL_KEY=your-key" >> ~/.hermes/.env
লঞ্চ করুন
# CLI মোড
hermes
# অথবা মেসেজিং প্ল্যাটফর্মে কানেক্ট করুন
hermes gateway
গেটওয়ে প্রসেসটি একটি একক প্রক্রিয়ার মাধ্যমে Hermes-কে একই সাথে Telegram, Discord, Slack, WhatsApp এবং Signal-এর সাথে যুক্ত করে।
v0.7.0 — দি রেজিলিয়েন্স রিলিজ (The Resilience Release)
সর্বশেষ বড় রিলিজটি (৩ এপ্রিল, ২০২৬) ১৬৮টি PR এবং ৪৬টি ইস্যু সমাধান করেছে। এর প্রধান আকর্ষণগুলো হলো:
প্লাগেবল মেমরি প্রোভাইডার্স। মেমরি এখন একটি এক্সটেনসিবল প্লাগইন সিস্টেম। থার্ড-পার্টি ব্যাকএন্ড (ভেক্টর স্টোর, Honcho, কাস্টম ডাটাবেস) এখন একটি সহজ প্রোভাইডার ইন্টারফেসের মাধ্যমে যুক্ত হতে পারে। আপনি এখন আর শুধু SQLite-এ সীমাবদ্ধ নন। ক্রেডেনশিয়াল পুল রোটেশন। একই প্রোভাইডারের জন্য একাধিক API key কনফিগার করুন। Hermes একটি থ্রেড-সেফ 'লিস্ট-ইউজড' কৌশলের মাধ্যমে স্বয়ংক্রিয়ভাবে সেগুলো রোটেট করবে। কোনো ৪০১ এরর হলে সাথে সাথে পরবর্তী কী-তে চলে যাবে। ক্যামোফক্স অ্যান্টি-ডিটেকশন ব্রাউজার (Camoufox Anti-Detection Browser)। পার্সিস্টেন্ট সেশন এবং ভিজ্যুয়াল ডিবাগিংয়ের জন্য VNC URL ডিসকভারি সহ একটি নতুন লোকাল ব্রাউজার ব্যাকএন্ড। ইনলাইন ডিফ প্রিভিউ (Inline Diff Previews)। ফাইল রাইট এবং প্যাচ অপারেশন এখন টুল অ্যাক্টিভিটি ফিডে ইনলাইন ডিফ দেখায়, যা এজেন্ট পরবর্তী ধাপে যাওয়ার আগেই কী পরিবর্তন হয়েছে তার ভিজ্যুয়াল কনফার্মেশন দেয়। API সার্ভার সেশন কন্টিনিউটি। API সার্ভার এখন রিয়েল-টাইমে টুল প্রগ্রেস ইভেন্ট স্ট্রিম করে এবং HTTP রিকোয়েস্ট জুড়ে পার্সিস্টেন্ট সেশনের জন্যX-Hermes-Session-Id হেডার সাপোর্ট করে।
Hermes Agent বনাম OpenClaw — আপনি কোনটি বেছে নেবেন?
২০২৬ সালে OpenClaw হলো অন্য একটি প্রধান ওপেন-সোর্স এজেন্ট ফ্রেমওয়ার্ক। এখানে একটি সরাসরি তুলনা দেওয়া হলো:
| ফিচার | হার্মিস এজেন্ট | OpenClaw |
|---|---|---|
| GitHub স্টার | ৫৭,০০০+ | ১৫,০০০+ |
| লাইসেন্স | MIT | MIT |
| সেলফ-ইমপ্রুভিং মেমরি | হ্যাঁ (প্রসিডিউরাল + এপিসোডিক) | না (ফাইল-ভিত্তিক, ম্যানুয়াল) |
| লার্নিং লুপ | প্রতি ১৫ টুল কলেই অটোমেটিক স্কিল তৈরি | ClawHub-এর মাধ্যমে ম্যানুয়াল স্কিল ইনস্টলেশন |
| চ্যাট প্ল্যাটফর্ম | ৬টি (Telegram, Discord, Slack, WhatsApp, Signal, CLI) | ৫০+ (WeChat, Teams, Line, IRC, email সহ) |
| কমিউনিটি স্কিলস | ক্রমবর্ধমান (নতুন ইকোসিস্টেম) | ClawHub-এ ১৩,০০০+ |
| সিকিউরিটি CVEs | ০টি (এপ্রিল ২০২৬ পর্যন্ত) | ৪ দিনে ৯টি CVE (মার্চ ২০২৬, CVSS 9.9 সহ) |
| ব্রাউজার অটোমেশন | বিল্ট-ইন (Chromium + Camoufox) | প্লাগইন-ভিত্তিক |
| মডেল সাপোর্ট | ২০০+ (OpenRouter + সরাসরি প্রোভাইডার) | প্রায় একই রকম |
| সাধারণ খরচ | ফ্রি + $০–১৫/মাস API | ফ্রি + $৫–১৫/মাস API + ঐচ্ছিক $৬/মাস হোস্টিং |
হার্মিস এজেন্ট-এর খরচ কত?
Hermes নিজে ফ্রি এবং সেলফ-হোস্টেড। প্রকৃত খরচ হলো LLM API ব্যবহার।
| ব্যবহারের মাত্রা | আনুমানিক মাসিক খরচ |
|---|---|
| হালকা (দিনে কিছু কাজ, সস্তা মডেল) | $০–৩ |
| মাঝারি (প্রতিদিন ব্যবহার, মিড-টায়ার মডেল) | $৫–১০ |
| ভারী (সবসময় চালু, প্রিমিয়াম মডেল) | $১০–১৫ |
| পাওয়ার ইউজার (মাল্টি-এজেন্ট ডেলেগেশন, ভিশন, ইমেজ জেন) | $১৫–৩০+ |
একটি বিষয় মনে রাখা দরকার: প্রতিটি API কলের প্রায় ৭৩% খরচ হয় টুল ডেফিনিশনের ফিক্সড ওভারহেড থেকে। এর মানে ছোট কাজগুলোতে দীর্ঘ কাজের তুলনায় আনুপাতিকভাবে বেশি খরচ হয়। খরচ কমাতে চাইলে কম প্রতি-টোকেন মূল্যের মডেল বেছে নিন (DeepSeek এবং MiniMax M2.7 বাজেট অপশন হিসেবে জনপ্রিয়)।
আপনি যদি এজেন্টকে সবসময় চালু রাখতে চান, তবে VPS-এর জন্য মাসে আরও $৫–১০ যোগ হতে পারে।
MiniMax AI পার্টনারশিপ
Nous Research ২০২৬-এর শুরুতে MiniMax AI-এর সাথে একটি অংশীদারিত্ব ঘোষণা করেছে। MiniMax M2.7 এখন Hermes Agent-এর মধ্যে সবচেয়ে বেশি ব্যবহৃত মডেলগুলোর একটি। এর ইন্টিগ্রেশন খুবই উন্নত: প্রোভাইডার লিস্ট থেকে "MiniMax (global endpoint)" এবং মডেল হিসেবে MiniMax-M2.7 বেছে নিন। এই দুটি কোম্পানি ভবিষ্যতের রিলিজগুলোকে বিশেষভাবে এজেন্টের জন্য অপ্টিমাইজ করতে একসাথে কাজ করছে, যেখানে ভিশন, অডিও এবং সম্ভাব্য রোবোটিক্স ইন্টিগ্রেশন সহ মাল্টিমোডাল ফিচারের পরিকল্পনা রয়েছে।
সচরাচর জিজ্ঞাস্য (FAQ)
হার্মিস এজেন্ট কি লোকাল মডেলের সাথে কাজ করে?
হ্যাঁ। Hermes এমন যেকোনো LLM-এর সাথে কাজ করে যা 64K+ কন্টেক্সট সাপোর্ট করে। আপনি Hermes 3 (Llama 3.1 ভিত্তিক) এর মতো মডেল ব্যবহার করে সম্পূর্ণ লোকাল এবং অফলাইন অপারেশনের জন্য এটি Ollama-এর সাথে চালাতে পারেন। লোকাল মডেলের জন্য কোনো API কী-এর প্রয়োজন নেই।
হার্মিস এজেন্ট কি সার্ভারে চালানো নিরাপদ?
এর আর্কিটেকচারে কন্টেইনার হার্ডেনিং, সাব-এজেন্টদের জন্য নেমস্পেস আইসোলেশন এবং ক্রেডেনশিয়াল রোটেশন অন্তর্ভুক্ত রয়েছে। v0.7.0 রিলিজটিতে গভীর সিকিউরিটি ফিক্স যুক্ত করা হয়েছে। এপ্রিল ২০২৬ পর্যন্ত, Hermes-এর কোনো এজেন্ট-স্পেসিফিক CVE নেই — যা OpenClaw-এর সাম্প্রতিক সিকিউরিটি ইস্যুগুলোর তুলনায় অনেক বেশি নিরাপদ।
আমি কি OpenClaw থেকে হার্মিস এজেন্টে মাইগ্রেট করতে পারি?
হ্যাঁ। বিশেষ করে ২০২৬ সালের মার্চের CVE ডিসক্লোজারের পর অনেক ব্যবহারকারী OpenClaw থেকে Hermes-এ চলে আসছেন। Hermes-এ কোনো ওয়ান-ক্লিক মাইগ্রেশন টুল নেই, তবে সেটআপ করা বেশ সহজ। আপনার OpenClaw স্কিলগুলো পুনরায় তৈরি করতে হবে, তবে Hermes তার সেলফ-ইমপ্রুভিং লুপের মাধ্যমে এর অনেকগুলো স্বয়ংক্রিয়ভাবে শিখে নেবে।
হার্মিস এজেন্ট কোন প্রোগ্রামিং ভাষায় লেখা?
Python। এর কোডবেসের জন্য Python 3.11+ প্রয়োজন এবং এটি প্যাকেজ ম্যানেজার হিসেবে uv ব্যবহার করে।
হার্মিস এজেন্ট কি আমার স্মার্ট হোম নিয়ন্ত্রণ করতে পারে?
হ্যাঁ। Hermes-এ একটি বিল্ট-ইন Home Assistant টুলসেট রয়েছে যা আপনার স্মার্ট হোম বা IoT ডিভাইস নিয়ন্ত্রণের জন্য Home Assistant ইনস্ট্যান্সের সাথে কানেক্ট হতে পারে।
হার্মিস এজেন্ট ChatGPT বা Claude থেকে কীভাবে আলাদা?
ChatGPT এবং Claude হলো কনভারসেশনাল এআই মডেল। Hermes Agent হলো একটি অটোনমাস এজেন্ট ফ্রেমওয়ার্ক যা LLM-কে (GPT এবং Claude সহ) ব্যবহার করে কাজ সম্পন্ন করে: কমান্ড চালানো, ফাইল এডিট করা, ওয়েব ব্রাউজ করা এবং পুনরায় ব্যবহারযোগ্য দক্ষতা তৈরি করা। মূল পার্থক্য হলো 'এজেন্সি' — Hermes সেশন জুড়ে কাজ করে, শেখে এবং মনে রাখে।
শেষ কথা
হার্মিস এজেন্ট হলো ২০২৬ সালের এখন পর্যন্ত সবচেয়ে আকর্ষণীয় ওপেন-সোর্স এজেন্ট প্রজেক্ট। এর সেলফ-ইমপ্রুভিং লার্নিং লুপ কোনো মার্কেটিং গিমিক নয় — এটি SQLite, FTS5 এবং প্রসিডিউরাল স্কিল ফাইলের ওপর ভিত্তি করে তৈরি একটি বাস্তব সিস্টেম যা সময়ের সাথে সাথে টাস্ক কমপ্লিশন রেট বৃদ্ধি করে। এর সিকিউরিটি ব্যবস্থা শক্তিশালী, মডেল ফ্লেক্সিবিলিটি অতুলনীয় এবং MIT লাইসেন্সের মানে হলো এর সবকিছুর মালিক আপনি নিজেই।
OpenClaw-এর তুলনায় এর ইকোসিস্টেম এখনও নতুন, এবং প্রতি API কলে ৭৩% ফিক্সড ওভারহেড একটি বিবেচ্য বিষয়। তবে যারা এমন একটি এআই এজেন্ট চান যা ব্যবহারের সাথে সাথে ক্রমাগত আরও দক্ষ হয়ে ওঠে, তাদের জন্য Hermes Agent এই মুহূর্তে সবার চেয়ে এগিয়ে।
সার্ভার সেটআপ ছাড়াই হার্মিস এজেন্টের ক্ষমতা ব্যবহার করতে চান? Y Build হলো হার্মিস এজেন্টের একটি মোবাইল-ফার্স্ট ভার্সনের মতো — একই রকম এআই অটোমেশন এবং প্রোডাক্ট-বিল্ডিং ক্ষমতা, কিন্তু এর জন্য আপনার কোনো VPS, টার্মিনাল বা টেকনিক্যাল ব্যাকগ্রাউন্ডের প্রয়োজন নেই। আপনার ফোন থেকেই সবকিছু তৈরি এবং শিপ করুন।