龙虾已成过去式?梳理那些让你产能100x的Hermes Agent工具
2 月 25 日,一个叫 Nous Research 的团队在 GitHub 上悄悄推了一个 v0.1.0。最早 Hermes 这个模型只有一行安装命令和一句话的产品定位:「An agent that grows with you」。
当时很少有人就注意到它,即使 Nous Research 在模型圈有一定声誉,他们的 Hermes 系列模型在 HuggingFace 上已经积累了 3300 万次下载,但整个开发者社区的关注度都在被奉若神明的 OpenClaw「小龙虾」上。33 天超过 React 成为历史第一,「小龙虾」成为了 GitHub 有史以来涨星最快的项目,高峰期每小时 710 颗星,但就在此时有安全研究人员在同一时间窗口内,以平均每天 2.2 个 CVE 的速度持续披露漏洞,63 天累计 138 个安全漏洞。整个社区开始重新思考一个问题:这东西到底能不能用在生产环境?
在这样的背景下,同为竞品的 Hermes Agent 终于有了可趁之机,也迎来了自己的第一个快速增长期。
Hermes 在自己的代码里写进了一键从 OpenClaw 迁移的工具,那批从 OpenClaw 出走的开发者,需要一个地方落脚,Hermes Agent 成了一个口口相传的好选择。

于是 从 3 月初开始,Hermes Agent 杀进了 GitHub Trending,最高冲到第 11 位,星数突破 2200。AwesomeAgents 把它称为「2026 年迄今最具野心的开源 Agent 发布」,目前 Hermes 的 github 有 69.9k 的 Star 和 9k 的 Fork。
今天律动 BlcokBeats 和大家聊一聊这个 Agent 有何不同之处。
Hermes Agent 是什么?
Hermes Agent 是由 Nous Research 构建的一款自我进化 AI 智能体,也是目前唯一内置学习闭环的 Agent。
它能从使用经验中自动创建技能、在使用过程中持续改进这些技能、主动将知识固化为可复用资产、检索自己过去的对话历史,并在多次会话中不断加深对你这个用户的理解。
所以简单来说,Hermes Agent 最大的优点就是:越用越聪明,越用越顺手。
它的定位,不是绑定在 IDE 里的编程助手,也不是对某个单一 API 的聊天封装,而是一个真正驻留在你的服务器上、能记住它学到的东西、运行时间越长能力越强的自主 Agent。
Nous Research 从一开始就将自己定位为开源优先、去中心化方向的 AI 实验室,目标是构建用户可自主控制的 AI,而不是将智能集中在少数几家封闭公司手中。他们早期的工作集中在 Hermes 模型系列,同时在基础设施和系统层面大量投入,还探索了跨全球分布式消费级 GPU 进行模型训练的 DisTrO 技术,以及 WorldSim、Doomscroll 等多智能体交互、长程行为的仿真环境。
Hermes Agent 这个团队,是曾打造了 Nomos、Psyche 一系列模型背后的同一批人。
好用的工具有哪些?
Hermes Agent 的最核心机制是它的记忆系统和技能系统。Agent 维护两个精简的核心文件:MEMORY.md 存储环境信息、约定和从过去任务中总结的经验;USER.md 存储你的偏好和沟通风格。这两个文件在每次会话开始时自动注入系统提示,相当于 Agent 的「长期工作记忆」。此外,所有历史会话都存入 SQLite 全文搜索数据库,让 Agent 能检索数周前的对话内容。

在技能系统方面,每次完成复杂任务(通常是 5 次以上工具调用),Agent 会自主创建一份结构化的 Markdown「技能文档」,记录操作步骤、已知内容和验证方式,供未来复用。技能文件遵循渐进披露模式:Agent 默认只看技能名称和描述(约 3000 token),需要时才加载某条技能的完整内容,以此控制 token 消耗。
工具层面,Hermes Agent 内置超过 40 种工具,涵盖网页搜索、浏览器自动化、视觉理解、图像生成、文字转语音,还支持通过自然语言设置定时任务,让 Agent 在无人值守的情况下自动执行报告生成、数据备份、系统监控等周期性工作。
其中最受欢迎的工具,也就是社区用户在实际使用中频率最高、反馈最多,以及根据 Hermes 的功能架构和开发者社区的典型需求,排在前面的是这几个工具:
Hindsight 是目前生态内最火的单一工具,是 Hermes 官方推荐的长期记忆插件。它在每次 LLM 调用前自动召回相关上下文,支持本地 PostgreSQL 或云端部署,已作为原生 Memory Provider 集成进 Hermes。
Anthropic-Cybersecurity-Skills 是生态内 Stars 最高的技能包,收录了 753+ 条结构化网络安全技能,完整映射 MITRE ATT&CK 框架,适合安全研究与渗透测试场景。
mission-control 是目前生态内最热门的 Agent 编排仪表盘,支持 Agent 舰队管理、任务分发、成本追踪和多 Agent 协同工作流,被社区推荐为生产级部署的标配。
Hermes Agent Self-Evolution 是一个进化式自我改进技术,使用 DSPy + GEPA 来优化技能、提示和代码。
Hermes Workspace 是 Hermes 原生工作区,集成聊天界面、终端和技能管理器,是最受欢迎的图形化入口。
此外,它还可以派生出独立的子 Agent,每个子 Agent 拥有自己的对话上下文、独立终端和 Python RPC 脚本,从而实现零上下文成本的并行流水线。
在基础设施灵活性上,支持六种终端后端:本地运行、Docker、SSH 远程、Daytona 无服务器、Singularity 容器和 Modal 云函数。Daytona 和 Modal 在空闲时会休眠,成本几乎为零。你可以在 5 美元的 VPS 或 GPU 集群上运行它,通过 Telegram 下达指令,让它在你从不直接 SSH 进入的云服务器上工作。
Hermes Agent 目前与 OpenClaw 构成最直接的竞争关系,两者都是面向开发者的开源 Agent 框架。
两者的架构哲学截然不同:OpenClaw 的设计核心是一个「控制平面」,一个统一的长期运行进程,负责管理会话、路由、工具执行和状态,所有东西都流经这个中央控制器。Hermes 则以 Agent 自身的执行循环为核心,把网关、定时调度器、工具运行时等全部围绕这个「做、学、改进」的反复循环来构建。
在技能系统上两者差异尤其显著:OpenClaw 的技能大多是人工编写的,从 workspace、personal、shared 或插件等不同层级加载;Hermes 的思路则是让 Agent 自己从经验中生成技能,形成真正的自主学习闭环。
如何安装与使用
上手极其简单。一行命令「curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash」即可完成安装,支持 Linux、macOS 和 WSL2,Hermes Agent 会自动完成全部配置,无需手动操作。

Hermes 官网
Hermes Agent 安装完成后,运行「hermes setup」启动引导向导,选择你的模型提供商(支持 Nous Portal、OpenRouter、OpenAI 或任何自定义端点),接入你的消息平台(Telegram、Discord、Slack 或 WhatsApp),然后开始第一次对话。从第一次交互开始,Hermes Agent 就立即进入学习模式,开始构建记忆、创建技能、每次会话后都变得更有能力。
日常使用的核心命令包括:
hermes(开始对话)、
hermes model(选择 LLM 提供商和模型)、
hermes tools(配置启用哪些工具)、
hermes gateway(启动消息网关,接入 Telegram、Discord 等平台)、
hermes setup(运行完整的设置向导,一次性配置所有内容)、
hermes claw migrate(从 OpenClaw 迁移)、
hermes update(更新到最新版本)、
hermes doctor(诊断问题);
Hermes Agent 适合的场景包括:需要跨会话记住上下文并持续改进能力的通用 AI 助手;需要组合使用工具、插件、MCP 服务器、浏览器或 Shell 的自定义 Agent 工作流;在本地硬件、云 VM 或低成本无服务器基础设施上部署 Agent;以及需要跨平台保持可搜索对话历史和习得技能的持久助手场景。
更具体而言,可以用它在 Telegram 上与它对话的同时让它在云 VM 上执行任务、设置自动化并将报告推送到任意平台、让它接管周期性任务;也可以将它接入 Slack 或 Discord 为整个团队提供 AI 协作支持;或者利用其轨迹导出功能,为下一代 tool-calling 模型的 RL 训练生成训练数据。
猜你喜欢

飙升50倍,FDV超过100亿美元,为什么选择RaveDAO?

10亿枚DOT凭空铸造,但黑客只赚了23万美元

解析Noise新推出的Beta版本,如何在链上「炒热度」?

向AI宣战?火烧奥特曼住所背后的末日叙事

加密VC将死?市场淘汰周期已经开启

图解Claude越用越笨:省钱的代价,是API账单涨了100倍

边缘地带的回归:一场围绕海权、能源与美元的再博弈

Arthur Hayes最新访谈:普通投资者如何应对伊朗战争?

刚刚,Sam Altman又被袭击了,这次直接是开枪

海峡封锁,稳定币补位|Rewire新闻早报

从高预期到争议反转,Genius空投「砍70%」引社区不满

北京大兴的小米汽车工厂,成了美国精英阶层的新耶路撒冷

瘦Harness,胖Skill:100倍AI生产力的真正来源

奥特曼不怕豪宅遭袭,他还有一座地堡

美伊谈判告吹,比特币上演7万关口保卫战

封锁霍尔木兹之后,战争何时才能结束?

用马斯克的「西方微信」X Chat前,要先了解这三个问题
X Chat 本周五开放 App Store 下载。媒体已经把功能清单跑完了一遍,阅后即焚、截图拦截、481 人群组、Grok 集成、无需手机号注册,被普遍定位为「西方微信」。但有三个问题,几乎没有报道说清楚过。
X 的官方帮助页面上有一句话,至今还挂在 X 官网帮助页上:「如果恶意内部人员或 X 本身因法律程序而导致加密对话遭到泄露,发件人和收件人均将毫不知情。」
不是。差异在密钥放在哪里。
Signal 的端对端加密,密钥从不离开你的设备。X、法院、任何外部方都不持有你的密钥,Signal 的服务器根本没有能解密你消息的东西,被传票了也只能交出注册时间戳和上次连接时间,历史上已有传票记录为证。
X Chat 用的是 Juicebox 协议。这套方案把密钥切成三份,分别存放在 X 自己运营的三台服务器上。用 PIN 码恢复密钥时,系统从 X 的服务器取回这三份分片重新拼合。无论 PIN 码多复杂,密钥的实际保管方是 X,不是用户。
这就是「帮助页那句话」的技术背景:因为密钥在 X 的服务器上,X 具备在用户不知情的情况下响应法律程序的能力。Signal 没有这个能力,不是因为政策,是因为它手里根本没有密钥。
上图对比了 Signal、WhatsApp、Telegram 和 X Chat 六个维度的安全机制。X Chat 是四者中唯一由平台方持有密钥的,也是唯一没有前向保密(Forward Secrecy)的。
前向保密的意义在于,即便某个时间点的密钥泄露,历史消息也无法被解密,因为每条消息的密钥都不一样。Signal 的 Double Ratchet 协议在每条消息后自动更新密钥,X Chat 没有这个机制。
约翰斯·霍普金斯大学密码学教授马修·格林(Matthew Green)在 2025 年 6 月对 X Chat 架构进行分析后,给出的评价是:「If we judge XChat as an end-to-end encryption scheme, this seems like a pretty game-over type of vulnerability.」他后来又补了一句,「I would not trust this any more than I trust current unencrypted DMs.」
从 2025 年 9 月 TechCrunch 的报道,到 2026 年 4 月上架,这套架构没有任何改变。
马斯克在 2026 年 2 月 9 日发推承诺,X Chat 上架前将进行严格安全测试(「rigorous security tests of X Chat」),并开源全部代码(「open source all the code」)。
截至 4 月 17 日上架,没有独立第三方审计完成,GitHub 上没有官方代码仓库,App Store 的隐私标签显示 X Chat 收集位置、联系信息、搜索历史等五类以上数据,与上架营销文案「No Ads, No Trackers」的表述直接矛盾。
不是持续监控,但有一个明确的入口。
X Chat 的每条消息上,用户可以长按选择「Ask Grok」。点击这个按钮时,该条消息以明文形式传递给 Grok,从加密状态变为非加密状态就发生在这一步。
这个设计不是漏洞,是功能。但 X Chat 的隐私政策中没有说明这些明文数据是否会用于 Grok 的模型训练,也没有说明 Grok 是否会存储这段对话内容。用户主动点击「Ask Grok」,等于主动把那条消息的加密保护解除了。
还有一个结构性问题:这个按钮会以多快的速度从「可选功能」变成「默认习惯」。Grok 的回复质量越高,用户依赖它的频率就越高,流出加密保护的消息比例也随之升高。X Chat 的实际加密强度,从长期来看不只取决于 Juicebox 协议的设计,也取决于用户点击「Ask Grok」的频率。
X Chat 首发仅支持 iOS,Android 版只写「coming soon」,没有时间表。
全球智能手机市场,Android 占约 73%,iOS 约 27%(IDC/Statista,2025 年)。WhatsApp 的 31.4 亿月活用户中,73% 在 Android 上(据 Demand Sage)。在印度,WhatsApp 覆盖了 8.54 亿用户,印度的 Android 渗透率超过 95%。在巴西是 1.48 亿用户、81% Android,印度尼西亚是 1.12 亿用户、87% Android。
WhatsApp 在全球通讯市场的统治地位,是建立在 Android 上的。Signal 的月活约 8,500 万,也主要依赖 Android 国家的隐私意识用户。
X Chat 绕开了这个战场,有两种解读。一是技术债,X Chat 用 Rust 构建,跨平台支持并不容易,iOS 优先可能是工程节奏。二是战略选择,美国市场 iOS 占有率接近 55%,X 的核心用户群在美国,iOS 优先等于集中打自己的基本盘,而不是去 Android 主导的新兴市场和 WhatsApp 正面交手。
两种解读并不互斥,结果是一样的:X Chat 首发,主动放弃了全球 73% 的智能手机用户。
这件事已经有人描述过了:X Chat 加上 X Money 加上 Grok,三个系统构成数据闭环,平行于现有基础设施,逻辑上和微信生态相同。这个判断不是新的,但在 X Chat 上线这个节点,值得把接线图再看一遍。
X Chat 产生通讯元数据,包括谁在和谁聊、聊多久、多频繁,这些数据流入 X 平台的身份系统。消息内容的一部分通过 Ask Grok 功能进入 Grok 的处理链。资金流动由 X Money 处理:3 月完成外部公测,4 月对外开放,通过 Visa Direct 实现法币点对点转账,Fireblocks 高管确认加密货币支付计划在年底上线,目前已持有美国 40 个以上州的货币传输许可证。
微信的每项功能在中国监管框架内运作。马斯克的系统在西方监管框架内运作,但他同时担任政府效率部(DOGE)的负责人。这不是微信复制,是同一套逻辑在不同政治条件下的重演。
区别在于,微信从来没有在主界面上说它是「端对端加密的」,X Chat 说了。「端对端加密」在用户认知中意味着没有人能看到你的消息,包括平台方。X Chat 的架构设计达不到这一认知预期,但它使用了这个词。
X Chat 把「这个人是谁、他和谁说话、他的钱从哪来去哪」的三条数据线汇总在一家公司手里。
帮助页那句话,从来都不只是技术说明。

