Hermes Agent 2026年6月18日 约 28 分钟 Skills GEPA

Hermes Agent Skills
进阶全攻略:从入门到自我进化

SKILL.md · Skill Bundles · 条件激活 · Tap 发布 · GEPA + DSPy · 远程 Mac 验收

Hermes Agent Skills 系统与 GEPA 自进化工作流示意图

谁会需要这篇?你已读过 Hermes 安装教程,却仍在每次对话里重复粘贴部署、PR、审计流程——Token 被占满,Agent 却记不住「怎么做」。结论:Nous Research 的 Hermes Agent 两个月内 GitHub Star 突破 16 万,核心不是更大模型,而是 "the agent that grows with you"——底层正是可标准、可进化、跨会话持久的 Skills 技能系统本文结构:概念对比 → SKILL.md 与渐进加载 → Skill Bundles → 条件激活 → 开源生态与 Tap 发布 → GEPA 五阶段自进化 → Plugin 与编写技巧 → 博客工作流案例 → FAQ;涉及 macOS 脚本验收时可结合 VNCMac 远程 Mac 图形会话。

01

为什么 Hermes Agent 的技能系统值得单独深入研究?

2026 年初,Nous Research 发布 Hermes Agent,成为 AI Agent 领域增速最快的开源项目之一。与传统「一次性 Prompt」不同,Hermes 技能体系是有标准、可进化、跨会话持久的程序性记忆层——教 Agent「如何做某件事」,而非「记住某个事实」。

本文跳过基础入门,直接进入进阶区域:

  1. 1

    渐进加载(Progressive Disclosure):如何在激活前零 Token 消耗,按需展开完整 SKILL.md?

  2. 2

    条件激活(Conditional Activation):根据工具可用性自动显示/隐藏技能,免费与付费 API 智能切换。

  3. 3

    Skill Bundles:一条斜杠命令同时加载多技能,复杂工作流一键触发。

  4. 4

    DSPy + GEPA:不碰模型权重,让 Skills 文本自动进化、越跑越好(每次约 $2–10 API 成本)。

  5. 5

    开源生态:awesome-hermes-skills、hermeshub、kevinnft/ai-agent-skills 等可直接 Tap 订阅。

02

核心概念:Skills ≠ Prompts,Skills ≠ Memory

混淆这三者是新手最常踩的坑。核心记忆口诀:Prompt = 便利贴(当次有效);Memory = 便签本(永久笔记,随时在手边);Skill = SOP 手册(步骤化流程,需要时翻阅)。

维度普通 PromptMemory(记忆)Skills(技能)
持久性当前对话跨会话,永久跨会话,永久
加载时机每次都在上下文中每次会话自动注入按需加载
Token 成本每次消耗小而稳定激活前零消耗
内容类型任意意图描述用户偏好/事实程序性步骤
谁来维护用户手动Agent 自动用户 + Agent 均可
可共享性不方便私有可发布为社区 Tap
03

SKILL.md 格式深度解析与渐进加载

所有 Hermes Skills 遵循 agentskills.io 开放标准,可在 Hermes、Claude Code、Cursor 之间跨平台移植。

SKILL.md frontmatter 示例
---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
## When to Use
## Procedure
## Common Pitfalls
## Verification Checklist

技能目录结构(模块化设计)

~/.hermes/skills/ 推荐布局
my-category/my-skill/
├── SKILL.md              # 核心步骤,建议 ≤500 行
├── references/           # API 参考,按需加载
├── templates/            # 可复用模板
└── scripts/              # Agent 可直接执行的脚本

Progressive Disclosure 三级加载(Token 控制核心)

层级内容触发时机Token 成本
Level 0name + description每次会话开始,所有技能~3K(全部技能合计)
Level 1完整 SKILL.md 正文/skill-name 或 LLM 判断需要取决于文件长度
Level 2references/ scripts/执行时 LLM 判断需要按需,单文件

写作建议:description 是 Level 0 的全部信息,LLM 靠它决定是否加载完整技能。写清「什么时候用」比「是什么」更重要;建议以 Use when... 开头,≤1024 字符。

04

Skill Bundles:一条命令触发完整工作流

Skill Bundles 是 Hermes 2026 新增特性,也是目前最被低估的功能之一。Bundle 是轻量 YAML 文件,把多个相关技能打包成一个斜杠命令;执行 /bundle-name 时,所有列出的技能同时加载

文件位置:~/.hermes/skill-bundles/<slug>.yaml

backend-dev bundle 示例
name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

进阶场景:AI 研究员工作流可打包 arxiv + deep-research + plan + excalidraw;MLOps 部署可打包 vllm + llama-cpp + github-pr-workflow + systematic-debugging

规则行为
同名冲突Bundle 优先于单个 Skill
未安装技能跳过而不报错,加载时提示缺失
Prompt CacheBundle 不修改系统提示,Token 友好
CLI 快速创建
hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"
05

条件激活:智能感知环境

metadata.hermes 下配置四种激活规则,让技能根据当前会话工具可用性自动显示或隐藏

字段行为逻辑
requires_toolsets列出的工具集不存在时,隐藏此技能
requires_tools列出的工具不存在时,隐藏此技能
fallback_for_toolsets列出的工具集存在时,隐藏(作为备选)
fallback_for_tools列出的工具存在时,隐藏(作为备选)

经典场景——免费/付费工具智能切换:当用户配置了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 时,付费 web_search 激活,DuckDuckGo 技能自动从提示词中消失,节省 Token;API 不可用时,备选方案自动浮现。

duckduckgo-search 备选方案
metadata:
  hermes:
    fallback_for_tools: [web_search]   # 有付费 web_search 时自动隐藏

通过 hermes skills TUI,还可为 CLI、Telegram、Discord 等平台独立开关某个技能。

06

Skills Hub 与开源社区生态

官方安装渠道
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
仓库亮点Stars
awesome-hermes-skills生产级合集,含 Deep Research、MLOps、Apple 集成67
hermeshub社区注册中心,安全扫描认证166
ai-agent-skills191 个技能,28 分类,跨 Hermes/Claude/Cursor10
hermes-agent官方仓库,权威来源与编写规范

agentskills.io 开放标准意味着技能资产不绑定单一平台;可用 skills-ref validate ./my-skill 验证格式合规性。

07

发布你自己的 Skill Tap:团队与社区共享

创建 GitHub 仓库作为 Tap,让整个团队甚至社区订阅你的技能集:

Tap 仓库结构与 skills.sh.json
my-skills-tap/
├── skills.sh.json
├── mlops/vllm-deploy/SKILL.md
└── research/paper-summarizer/SKILL.md

# 团队成员一键订阅
hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list

版本管理建议:~/.hermes/skills/ 纳入 Git 版本控制,跨设备 git pull && hermes skills reset 同步后重建内置技能。

08

Self-Evolving Skills:GEPA + DSPy 让技能自动进化

GEPA(Genetic-Pareto Prompt Evolution) 是 2026 年 ICLR Oral 成果,集成于 hermes-agent-self-evolution。核心思路:不微调模型权重,只通过分析执行轨迹、生成变体、多目标帕累托优化来改进技能文本本身。每次优化约 $2–10(纯 API,无需 GPU)。

GEPA 五阶段进化流程

  1. 1

    执行轨迹收集:从 SQLite 读取全量推理轨迹(工具调用、分支、错误)。

  2. 2

    反思式失败分析:LLM 生成「可操作侧信息」——不是「失败了」,而是「为什么失败」。

  3. 3

    靶向变异:针对失败原因,生成 10–20 个 SKILL.md 变体。

  4. 4

    多目标帕累托评估:同时优化成功率 × Token 效率 × 速度。

  5. 5

    人工审查 PR:最优变体 → 生成 PR → 人工批准后上线。

快速上手
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

# 合成数据入门
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

# 真实会话数据(效果更好)
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

四大安全护栏(Guardrails)

  1. 1

    全量测试套件 pytest tests/ -q 必须 100% 通过

  2. 2

    大小限制:Skills ≤ 15KB,工具描述 ≤ 500 字符

  3. 3

    Prompt 缓存兼容性:不能在会话中途修改导致缓存失效

  4. 4

    语义保留检查:不能偏离技能的原始核心目的

阶段优化目标引擎状态
Phase 1Skill 文件(SKILL.md)DSPy + GEPA✅ 已实现
Phase 2工具描述DSPy + GEPA🔲 计划中
Phase 3系统提示片段DSPy + GEPA🔲 计划中
Phase 4工具实现代码Darwinian Evolver🔲 计划中
Phase 5持续改进循环自动化流水线🔲 计划中

由于 Skills 遵循 agentskills.io 标准,可将 Claude Code 或 Gemini CLI 的执行轨迹也喂给 GEPA:--eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions

09

Plugin 技能:扩展 Hermes 的边界

插件将技能打包成命名空间(plugin:skill):不出现在默认 skills_list(减少噪声);只在用户明确调用时激活(Opt-in);插件内技能可相互引用。

plugin.yaml 声明
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

# 加载:skill_view("superpowers:writing-plans")
10

技能编写进阶技巧(工程师视角)

description 决定激活精度:避免 Helps with code. 这类模糊描述;应写清触发条件、处理范围与明确排除场景(Do NOT use for...)。

Pitfalls 是质量分水岭:每个失败模式需包含根因分析与可操作修复步骤,而非泛泛而谈。

技能大小建议
< 500 行全部放在 SKILL.md
500–1000 行详细资料移至 references/
> 1000 行强烈建议拆分;考虑是否是两个技能
> 15KB超过 GEPA 大小限制,必须拆分

skill_manage 让 Agent 自我维护技能:支持 patch / create 动作;在 config.yaml 设置 skills.agent_writes_require_approval: true 开启人工审批门。

11

实战案例:技术博客工作流 Skills

构建 blog-workflow Bundle,打包 SEO 调研、大纲生成、代码验证、双语检查与发布技能:

~/.hermes/skill-bundles/blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

自定义 seo-keyword-research 技能可在 Procedure 中规定:中文长尾用「X 怎么用」「X 教程」;英文用「X tutorial」「how to X」「X vs Y」;交叉参考掘金热榜与 Dev.to trending,输出 3–5 主词 + 10–15 长尾矩阵。

12

远程 Mac 上跑 Hermes Skills 的决策矩阵

Hermes Agent 需要 7×24 常驻 与本地轨迹积累才能让 GEPA 进化生效(参见 三层记忆架构文)。在 Windows/Linux 主力机上写 Skill,macOS 专属 scripts/ 与 Telegram Gateway 验收则建议在远程 Mac 完成。

场景仅 SSHSSH + VNC推荐
编辑 SKILL.md / Bundle YAMLSSH 即可
运行 bash 脚本验收SSH 即可
Telegram / Discord 扫码配对必须 VNC
GEPA 进化 + 人工审 PR可选SSH + 本地审 diff
macOS 钥匙串 / TCC 权限必须 VNC
  1. 1

    租用 Mac Mini M4 月租节点,SSH 安装 Hermes(见安装教程)。

  2. 2

    ~/.hermes/skills/ 创建首个 SKILL.md,skills-ref validate 校验格式。

  3. 3

    创建 Skill Bundle,/bundle-name 验证多技能同时加载。

  4. 4

    VNC 会话中完成 Telegram Gateway 扫码与 hermes doctor 健康检查。

  5. 5

    积累会话轨迹后,在远程节点运行 GEPA evolve_skill,审阅生成的 PR。

延伸阅读

官方资源与社区链接

FAQ

常见问题

Skills 是程序性知识文档(教 Agent 怎么做某事),MCP 是工具接口(给 Agent 额外的工具调用能力)。两者互补:MCP 提供数据库访问,Skill 教 Agent 如何正确执行数据库迁移。

Skill 修改在当前会话不生效,需要 /reset 开启新会话,或安装时加 --now 参数强制刷新(会导致 Prompt Cache 失效,消耗更多 Token)。

通过四大护栏约束(全量测试、大小限制、语义保留、人工 PR 审查),且语义漂移检测确保技能不会偏离原始目的。但仍建议人工 review 每个 PR diff。

复制 SKILL.md~/.claude/skills/,或使用 kevinnft/ai-agent-skills 等支持多 Agent 的安装脚本,一次安装多端可用。

中文字符在大多数 tokenizer 中每字约 1–1.5 token,与英文相近。但 description 字段建议保留英文(或中英双语),因为底层 LLM 对英文 description 的理解和匹配更精确。

结语

Hermes Agent Skills 把「越用越强」从口号变成了可工程化的路径:agentskills.io 标准保证跨平台可移植,Progressive Disclosure 控制 Token,Bundles 与条件激活 让复杂工作流可编排,GEPA 则让技能文本本身可持续进化——而这一切的前提是有一台7×24 在线、能积累会话轨迹的运行环境。

在 Windows/Linux 主力机上写 Skill 没问题,但 Telegram 扫码、macOS 权限弹窗与长期轨迹积累,往往卡在「没有一台常开的 Mac」——自购 Mac mini 要面对折旧与电费,VPS 跑不了原生 Hermes Gateway 的完整工具链。相较之下,按月租用 VNCMac 的 Mac Mini M4 把在线率与基础镜像交给专业服务商,你专注 Skills 编写与 GEPA 进化,用 VNC 完成图形化验收即可。

若你准备把 Hermes 从「装通」推进到「技能体系化」,可先通过下方按钮开通远程 Mac 节点,再对照本文第十二节的五步验收清单与站内 选型文安装教程 串联落地。