2025 年 AI Agent 框架市场规模达到 78.4 亿美元,预计 2030 年将增长到 526 亿美元(Grand View Research,2025)。在这个层面上,两位名字提出了 2026 年的大部分讨论:OpenClaw(35.9 万 GitHub Star,TypeScript)和 Nous Research 出品的 Hermes Agent(10 万 + GitHub Star,Python)。
选择框架不仅仅是工具偏好问题,它决定了你的代理人如何学习、如何扩展、如何保护自己。这篇文章从 10 个维度拆解了这两个框架的差异——基于双边项目数据、独立安全和社区审计反馈。
TL;博士
- OpenClaw以网关为中心,擅长多渠道消息路由。Slack、Discord、WhatsApp、Web互接,社区技能库超过44000个。适合需要快速打通多个平台的团队。
- Hermes Agent 以代理为中心,擅长速度进化。它从每次任务中学习,自动创建和优化技能,重复任务可提升40%。适合运行高频重复工作流的团队。
- 安全差距悬殊。 OpenClaw上线三个月就出现了超过100个CVE和137个安全公告。Hermes代理目前零代理层面CVE,但默认配置是全开权限,需要手动海豚。
- **两者可以很好的工作。**通过MCP和A2A协议,OpenClaw负责路由路由,Hermes负责智能执行。
多元设计哲学
**Gartner 预测到 2026 年底,40% 的企业应用将集成专用 AI Agent——而 2025 年这个比例还不到 5%。**当团队开始把 Agent 部署到生产环境时,框架决定了 Agent 今天能做什么,更决定了它明天能发展成什么。
OpenClaw 在 2025 年底发布,60 黎明打破了 React 保持了十年的 GitHub Star 增长,目前记录拥有 320 万月活用户和 50 多个运行实例。其核心判断:**最难的问题是路由和控制。**把消息从所有渠道转发到正确的代理手中,配上正确的工具,然后让 LLM 处理剩下的事情。
Hermes Agent 由 Nous Research 于 2026 年 2 月 25 日发布,七周内积累了 9.56 万 GitHub Star,建立了 3 万人的 Reddit 子社区。它的口号——“与你一起成长的 Agent”——反映了另一个判断:**最难的是记忆和自我进化。**一个能够记住的特工技能,比一个只是被窃取的特工价值更重要。
架构:网关中心 vs Agent 中心
**OpenClaw 把网关放在中央,Hermes 把代理本身放在中央。**这不是语言选择问题——这是对“什么东西应该在 AI 代理系统中央”的不同答案。
OpenClaw:网关即中心
OpenClaw 是一个 Node.js 22+ 单进程,默认绑定 C0 。网关拥有所有消息入口——WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WebChat——同时充当路由、认证、限流和会话管理的中央控制面。
它的核心创新允许是车道队列系统:默认执行串行,只有显式标记为低风险的任务才允许添加。每个会话同一时刻只一个活跃执行,避免竞态条件。高峰可配,主通道默认4个,子代理通道默认8个。
消息流是一个一致的循环:通道队列标准化输入 → 网关路由到会话 → 代理加载上下文和技能 → 发送到 LLM → 执行工具调用 → 流式输出 → 持久化状态。网关拥有每个通道。
###爱马仕代理:代理即中心
Hermes 是一个 Python 3.11+ 运行时,C0 类是接触的计算单元。Prompt Builder从人格、记忆、技能和模型指令中构建起来。运行时解析器把提供者/模型组合映射到 API 配置,支持 18 个以上的 LLM 作品,系统设计上就是模型关联的。中央工具卸载管理 47 个注册工具,分配在 19 个工具集中,每个工具在导入时注册。
Hermes 提供六种执行环境:本地、Docker、SSH、Daytona、Singularity 和 Modal。无服务器选项(Daytona、Modal)在闲置时成本接近零。
实践中的差异
OpenClaw通过中央网关给运营团队的可视性和控制力——审计日志、限流、模型切换都完全在一点完成。Hermes把更多的自主权变动代理本身,运行解析器和工具工具应用于代理的决策,而不是中央控制器的规则。
对于需要跨渠道部署的客服机器人,OpenClaw 的网关模式更自然。对于需要学习和改进的内部自动化任务,Hermes 的代理优先架构更合适。
学习能力:自主进化 vs 无状态会话
**这是框架最尖锐的区别,也是两个最可能决定哪个适合你的维度。**一个能自主学习和改进,另一个都是全新开始。
Hermes 的五步学习循环
Hermes 在每个非简单任务上执行重构的学习流程:
- 接收用户消息或定时触发
- 检索 通过FTS5全文搜索查询持久化记忆(1万+文档下约10ms延迟)获取相关的过往技能和记忆
- 推理和执行 LLM规划任务并调用工具
- 记录结果:如果任务涉及5次以上工具调用,agent自动生成技能文件(遵循打开agentskills.io标准)
- 持久化:技能编入记忆索引,后续会话可用
大约每 15 次工具调用,Hermes 就会反思:哪些有效、哪些失败,自动生成或更新技能文件。结果可计算:Nous Research 的基准测试显示,拥有 20 个以上自创技能的代理完成任务研究的速度比全新的实例快 40%,且无需手动调整提示。
但改进是相关领域的。从 GitHub PR 中生成的技能,不会自动转用数据库迁移规划上。40% 的速度提升在持续使用的垂直领域中最明显。
OpenClaw 的无状态模型
OpenClaw 的每个会话都从零开始,依赖开发者或社区手动创建和注册技能。代理访问相同的工具和指令,但不会构建地积累经验。
Session 状态以 JSONL 格式存储在 C0 ,每行代表消息或事件。当日志增长到模型上限时,旧消息会被“压缩”。项目文档明确划出了红线:“Session 是用来一条推理的,而不是用来存储的。”
持久化层(DuckDB、workspace文件系统)可以存储持久数据,但代理没有自主从经验中提取机制、测试和优化可复用的流程。
成本权衡
学习循环不是免费的。Hermes 的思考和优化额外消耗约 15-25% 的代币。但这个成本会被摊销:一旦技能,未来执行类似的任务时消耗完整的推理链,同时节省时间和代币。AWS 成本分析模块显示,有状态 AI 应用的操作成本通常是无状态等价物的 2-3 倍,但技能复用的累积效率提升可以考虑这部分加速。
生态系统:市场广度 vs 自我生成
OpenClaw的44000+技能 vs Hermes的118个内置技能+自主生成——这反映了两种完全不同的生态策略。
OpenClaw:市场模式
ClawHub 目前托管超过 44000 个社区技能,2025 年 11 月这个数字还是 850——五个月增长约 50 倍。分类主题代码和 IDE(22.7%)、Web 开发(17.6%)、DevOps 和云(7.5%)、研究(6.6%)和浏览器自动化(6.2%)。项目有超过 1800 名贡献者和73200个叉子。
但规模随之而来的问题。OpenClaw的“留存率”——初次接触后继续深度使用的用户比例——只有17%。市场采用开放发布模式,只要求GitHub账号注册满一周,这造成了后续安全部分会详述的严重安全隐患。
Hermes Agent:自我生成模式
Hermes 附带 118 个精选内置技能,涵盖网页控制、Gmail/日历/云端硬盘/通讯记录/表格/文档集成、Spotify 控制、YouTube 统计处理、arXiv 学术论文检索、GitHub PR 工作流和 Excalidraw 制图。社区规模较小(515 名贡献者,10 万 + 星),但增长很快——两个月内增加了 4.7 万星。
关键区别在于自我生成。由于代理人在日常使用中自己创建技能,生态差距会随着时间缩小。运行了数周的 Hermes 实例会积累一套任何市场无法复制的领域技能——因为它们编码了该团队自己的工作流程、偏好和工具配置。
记忆架构:三层持久化 vs SOUL.md
记忆是区分“好代理人”和“和你一起成长的代理人”的基础设施。
Hermes的三层记忆
**第一层:系统提示记忆(MEMORY.md 和 USER.md)。**每个会话都会填充一次冻结快照。MEMORY.md(2200字符上限,约800 token)存储环境事实修改约定、已完成和工作。USER.md(1375字符上限,约500 token)存储沟通偏好、工作风格和期望。
**第二层:情景记忆(技能)。**每个任务完成后,Hermes 向 ChromaDB 支持数据库书写格式记录,包含任务描述、工具调用、有效的做法和失败原因。新任务时,它会提示化请求并做语义相似度搜索,高匹配结果注入到规划提示中。
**第三层:会话搜索。**所有会话记录到SQLite数据库(C0),启用FTS5全文索引。代理通过C1工具访问,可以回答“上次我们讨论过X吗?”或“上周的认证服务问题结论是什么?”此类问题。
系统还支持8个外部记忆提供者插件(包括Mem0、Honcho和Hindsight),架构上是可插拔的。
OpenClaw 的 SOUL.md
OpenClaw 使用 SOUL.md 作为身份层——一个 Markdown 配置文件,定义了代理的人格、价值观、语言和行为边界。它在每个会话开始时第一个被注入上下文。额外的工作区文件(AGENTS.md、USER.md)提供补充信息。
压缩系统处理下部窗口压力。当会话接近代币上限(某些模型约20.5万代币)时,旧消息会被转发预示对话继续。会话重置选项包括每日重置周一(凌晨4:00)、闲置重置和手动重置。
最大的瓶颈是下游消耗。在复杂工作区中,工作区文件注入每次消耗约 35600 个代币。持续日志记录一周后,代理占了一半的下游窗口花在翻阅旧日志上。对需要长期记忆的工作流来说,这是一个根本性的扩展瓶颈。
安全性:CVE历史和供应链风险
安全性可能是生产环境中这两个平台之间最关键的差距——是结构性的,而不是边缘性的。
OpenClaw 的 CVE 记录
安全研究员 Joel Gamblin 的公开追踪器在 2026 年 2 月 2 日到 4 月 4 日之间记录了 137 个安全公告,大约每 15 小时一个。CertiK 的系统性分析记录了超过 280 个 GitHub 安全公告、超过 100 个 CVE 和 13.5 万个公开的实例。
关键漏洞包括:
- **CVE-2026-25253(ClawBleed):**一键远程代码执行,通过跨站点WebSocket劫持实现。恶意网站可窃取认证令牌并获得网关完全控制权。
- CVE-2026-32922: Token轮转提权(CVSS 9.9)可升级为远程代码执行——OpenClaw历史上最严重的漏洞。
- CVE-2026-33579: 雅典命令路径中的提权漏洞。
2026 年 3 月单月出现超过 15 个 CVE,其中至少三个评分达到 CVSS 9.4 以上,有九十四个集中披露。
ClawHub 供应链攻击
ClawHub 市场遭遇了代号“ClawHavoc”的供应链攻击。初步审计发现 341 个恶意技能;更新后的扫描报告超过 1184 个恶意包。单名攻击者(“hightower6eu”)一次自动化攻击中提交了 354 个恶意包。恶意部署了 macOS 上的 Atomic Stealer(AMOS)和 Windows 上的 Vidar信息窃取器,目标锁定浏览器和加密货币钱包。
结构性问题是ClawHub的技能在拥有完整的系统访问权限运行时,没有沙箱。恶意技能可以写入代理的记忆和配置文件,注入跨会话持久化的指令。Snyk的ToxicSkills审计发现36.82%的技能存在安全缺陷。
Hermes Agent的安全状况
2026年6月,Hermes Agent 零代理层面CVE。对v0.8.0的独立安全审计(812个Python文件,约36.4万行代码)没有发现恶意软件或数据泄露,评价代码“意图良好”。但同时审计默认配置中发现了4个和9个高危问题——最终是默认安全策略是全部放行。
Hermes的纵深防御安全模型包括:
- ** 跳转命令系统:** 模式匹配检测破坏性命令并触发回调
- 箱沙选项: 六种终端控制台可以命令执行环境
- **预算保护:**敏感环境变量不会提交给子进程
118个精选技能的模型自然减少了攻击面。自主生成的技能由代理自己创建,完全消除了第三方供应链的入口。
###安全底线
平台开箱并不安全。区别两个工作的性质不同:OpenClaw 需要审查每一个第三方技能;Hermes 需要收紧默认的“全部放行”权限模型。
对比总表
| 维度 | 开爪 | 爱马仕代理 | 优势 |
|---|---|---|---|
| 架构 | 网关优先,TypeScript/Node.js 22+ | 代理优先,Python 3.11+ | 依赖技术栈 |
| 学习能力 | 无状态;无自主技能创建 | 自我进化;20+技能后重复任务快 40% | 爱马仕 |
| 生态规模 | 44000+ ClawHub 技能,35.9 万星 | 118个精选+自主生成,10万个+星 | OpenClaw(广度) |
| 记忆 | SOUL.md session 注入;上下文压缩 | 三持久层化:即时记忆+情境技巧+全文搜索 | 爱马仕 |
| 安全 | 100+ CVE,137 公告;1184 个恶意包 | 零代理 CVE;默认 ALLOW-ALL 需胶原 | 爱马仕 |
| 技能来源 | 社区市场+手动创建 | 自主生成+118内置+社区 | 查看场景 |
| ** 建设复杂度** | 2-5分钟启动,30-90分钟VPS | 一行curl安装,纯自托管 | 开爪 |
| 多代理 | 内置编辑器,不同协作模式 | ACP委托+多配置 | 开爪 |
| 成本 | 自托管$40-80/月,托管的$59/月 | $6-65/月(看模型),学习循环摊薄成本 | Hermes(规模化后) |
| 混合兼容 | MCP + A2A,可做接入网关 | MCP + ACP + A2A,可做学习课堂 | 两者 |
架构体验
OpenClaw 的开始
OpenClaw 提供了最快的上手路径:
- 最快: 2分钟,用Ollama( C0 )
- 标准: 约 5 分钟完成安装、配置以及首次对话
- 自托管Docker: 10-15分钟
- 完整的VPS部署: 30-90分钟
配置引导完成提供商并快速交付可用的聊天。主要前提是 Node.js 22+ 和一个 API 密钥。OpenClaw Cloud 完全免架构去,每月 59 美元(首月 29 美元)。
长期挑战是维护。OpenClaw 每月发布 1-2 个大版本,间隔添加破坏性变更。社区提示生产级自托管实例的 DevOps 开支每年在 1 万到 2 万美元之间。
Hermes Agent 的开始
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash单行命令处理所有依赖(Python、Node.js、ripgrep、ffmpeg)、仓库克隆、虚拟环境、全局C0命令和LLM提供程序配置。安装后,C1配置LLM,C2管理工具集,C3连接消息平台。
Hermes 需要 6.4 万代币上下文窗口的模型,不满足在启动时至少直接拒绝。支持 Linux、macOS、WSL2 和 Android(Termux)。不支持原生 Windows。没有托管选项,纯自托管。
混合方案:一起用
**框架今天就可以协作。**两者都支持MCP协议用于工具发现和调用。A2A(Agent-to-Agent)协议——由Google开发,现已创建归Linux基金会管理,得到微软、AWS、Cisco和Salesforce的支持——进一步扩展了互操作能力。
推荐的混合架构:OpenClaw作为集成网关,处理多路由路由、会话管理和限流。Hermes Agent处理实际的执行任务,发挥其学习循环和技能积累的能力。MCP连接工具调用,A2A实现代理间任务委托。
对于已经在使用 OpenClaw 的团队,C0 提供了附带模拟预览的迁移工具。
怎么选
###选张开爪
- 需要快速打通多个渠道(WhatsApp、Telegram、Discord、Slack 等)
- 团队以 TypeScript 为主
- 暂停客服机器人场景
- 想要托管服务免运维
###选爱马仕代理
- 代理需要越用越聪明,重复任务多
- 安全要求高
- 团队是Python/ML背景
- 需要持久化的跨会话记忆
两个都要
- 需要 OpenClaw 的集成广度 + Hermes 的学习深度
- 场景同时覆盖客户交互和内部自动化
- 有团队能力维护两套系统
数据来源:官方文档、GitHub 仓库、独立安全审计(Snyk ToxicSkills、CertiK)、Joel Gamblin 的 CVE 追踪、Nous Research 基准测试和社区分析。本文仅提供信息参考,不构成对任一平台的推荐。Nestify 融合了两种架构的思路,把它变成家庭用户可以直接使用的简单功能——你不需要关心背后跑什么代理,只需感受需要省下的时间。
