SKILL.md · Skill Bundles · Bedingte Aktivierung · Tap-Publishing · GEPA + DSPy · Remote-Mac-Validierung
Für wen? Sie haben die Hermes-Installationsanleitung abgeschlossen, kopieren aber weiterhin Deploy-, PR- und Audit-Anweisungen in jede Konversation — und verbrennen Tokens, während der Agent vergisst, wie er arbeiten soll. Kurzfassung: Nous Research' Hermes Agent überschritt in rund zwei Monaten 160.000 GitHub-Stars — nicht wegen eines größeren Modells, sondern wegen „des Agenten, der mit Ihnen wächst", angetrieben von einem standardisierten, evolvierbaren, sitzungsübergreifenden Skills-System. Was folgt: Konzeptvergleich → SKILL.md und Progressive Loading → Skill Bundles → bedingte Aktivierung → offenes Ökosystem und Tap-Publishing → GEPA-Fünf-Stufen-Selbstevolution → Plugin-Skills und Authoring-Tipps → Blog-Workflow-Fallstudie → FAQ. Für macOS-Skript-Validierung kombinieren Sie dies mit einer VNCMac Remote-Mac-VNC-Sitzung.
Anfang 2026 lieferte Nous Research Hermes Agent aus — eines der am schnellsten wachsenden Open-Source-KI-Agenten-Projekte. Im Gegensatz zu Einmal-Prompts sind Hermes Skills eine standardisierte, evolvierbare, sitzungsübergreifende Schicht prozeduralen Gedächtnisses: Sie lehren den Agenten, wie etwas zu tun ist, nicht welche Fakten zu merken sind.
Dieser Leitfaden überspringt Einsteiger-Setup und geht direkt ins Fortgeschrittene:
Progressive Disclosure: Wie verbrauchen Sie null Tokens vor der Aktivierung und laden die vollständige SKILL.md nur bei Bedarf?
Bedingte Aktivierung: Skills automatisch ein- oder ausblenden je nach Tool-Verfügbarkeit — intelligenter Wechsel zwischen kostenlosen und kostenpflichtigen APIs.
Skill Bundles: Ein Slash-Befehl lädt mehrere verwandte Skills und triggert einen kompletten Workflow.
DSPy + GEPA: Skill-Text ohne Modellgewichte evolvieren — jeder Lauf kostet grob $2–10 API-Gebühren, keine GPU nötig.
Offenes Ökosystem: awesome-hermes-skills, hermeshub, kevinnft/ai-agent-skills und mehr — direkt per Tap abonnieren.
Diese drei zu verwechseln ist der häufigste Anfängerfehler. Eine einfache Eselsbrücke: Prompt = Haftnotiz (gültig nur für diesen Turn); Memory = Notizbuch (dauerhafte Notizen, immer griffbereit); Skill = SOP-Handbuch (Schritt-für-Schritt-Verfahren, bei Bedarf geöffnet).
| Dimension | Einfacher Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktuelle Konversation | Sitzungsübergreifend, dauerhaft | Sitzungsübergreifend, dauerhaft |
| Ladezeitpunkt | Immer im Kontext | Automatisch pro Sitzung injiziert | On Demand |
| Token-Kosten | Jeder Turn | Klein und stabil | Null vor Aktivierung |
| Inhaltstyp | Beliebige Intent-Beschreibung | User-Präferenzen / Fakten | Prozedurale Schritte |
| Wartung | Manuell durch User | Automatisch durch Agent | User + Agent |
| Teilbarkeit | Umständlich | Privat | Als Community-Tap veröffentlichbar |
Alle Hermes Skills folgen dem offenen agentskills.io-Standard — portabel zwischen Hermes, Claude Code und Cursor.
---
name: my-skill
description: |
Use when the user needs to [...].
Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow, test-driven-development]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview
## When to Use
## Procedure
## Common Pitfalls
## Verification Checklistmy-category/my-skill/ ├── SKILL.md # Kernschritte; ≤500 Zeilen halten ├── references/ # API-Docs, on demand geladen ├── templates/ # Wiederverwendbare Vorlagen └── scripts/ # Skripte, die der Agent direkt ausführen kann
| Ebene | Inhalt | Trigger | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description | Bei jedem Sitzungsstart, alle Skills | ~3K (alle Skills zusammen) |
| Level 1 | Vollständiger SKILL.md-Body | /skill-name oder LLM entscheidet Bedarf | Abhängig von Dateilänge |
| Level 2 | references/ scripts/ | LLM entscheidet zur Laufzeit | On demand, pro Datei |
Schreibtipp: description ist das einzige Level-0-Signal — das LLM nutzt es, um zu entscheiden, ob der vollständige Skill geladen wird. Formulieren Sie wann zu nutzen klarer als was es ist; beginnen Sie mit Use when... und bleiben Sie unter 1024 Zeichen.
Skill Bundles sind eine Hermes-Ergänzung aus 2026 und eines der am meisten unterschätzten Features. Ein Bundle ist eine leichtgewichtige YAML-Datei, die mehrere verwandte Skills in einen einzigen Slash-Befehl packt; /bundle-name lädt alle gelisteten Skills auf einmal.
Dateipfad: ~/.hermes/skill-bundles/<slug>.yaml
name: backend-dev description: | Full backend feature workflow — code review, TDD, and PR management. skills: - github-code-review - test-driven-development - github-pr-workflow instruction: | Always write failing tests first before implementation. Never push directly to main.
Fortgeschrittene Szenarien: Ein AI-Research-Workflow könnte arxiv + deep-research + plan + excalidraw bündeln; ein MLOps-Deploy vllm + llama-cpp + github-pr-workflow + systematic-debugging.
| Regel | Verhalten |
|---|---|
| Namenskollision | Bundle hat Vorrang vor einzelnem Skill |
| Fehlender Skill | Ohne Fehler übersprungen; Warnung beim Laden |
| Prompt Cache | Bundle ändert System-Prompt nicht — token-freundlich |
hermes bundles create backend-dev \ --skills github-code-review,test-driven-development,github-pr-workflow \ --instruction "Always write failing tests first"
Unter metadata.hermes konfigurieren Sie vier Aktivierungsregeln, damit Skills je nach Tool-Verfügbarkeit in der aktuellen Sitzung automatisch ein- oder ausgeblendet werden:
| Feld | Logik |
|---|---|
| requires_toolsets | Skill ausblenden, wenn gelistete Toolsets fehlen |
| requires_tools | Skill ausblenden, wenn gelistete Tools fehlen |
| fallback_for_toolsets | Ausblenden, wenn gelistete Toolsets vorhanden (Fallback-Rolle) |
| fallback_for_tools | Ausblenden, wenn gelistete Tools vorhanden (Fallback-Rolle) |
Klassisches Szenario — kostenlos vs. kostenpflichtig: Wenn der User FIRECRAWL_KEY oder BRAVE_SEARCH_KEY konfiguriert, aktiviert sich der kostenpflichtige web_search-Skill und der DuckDuckGo-Fallback verschwindet aus dem Prompt — Tokens gespart. Ist die API nicht verfügbar, taucht der Fallback automatisch wieder auf.
metadata:
hermes:
fallback_for_tools: [web_search] # auto-hide when paid web_search existsÜber die hermes skills-TUI können Sie einzelne Skills pro Plattform — CLI, Telegram, Discord und andere — auch manuell ein- oder ausschalten.
hermes skills install official/research/arxiv hermes skills install https://example.com/SKILL.md --name my-skill hermes skills install github:openai/skills/k8s hermes skills tap add github:my-org/my-skills
| Repository | Highlights | Stars |
|---|---|---|
| awesome-hermes-skills | Production-Grade-Sammlung: Deep Research, MLOps, Apple-Integration | 67 |
| hermeshub | Community-Registry mit Security-Scanning | 166 |
| ai-agent-skills | 191 Skills, 28 Kategorien, cross Hermes/Claude/Cursor | 10 |
| hermes-agent | Offizielles Repo — autoritative Quelle und Authoring-Spec | — |
Der offene agentskills.io-Standard bedeutet: Skill-Assets sind nicht an eine Plattform gebunden. Format-Compliance prüfen mit skills-ref validate ./my-skill.
Legen Sie ein GitHub-Repository als Tap an, damit Ihr Team — oder die Community — Ihr Skill-Set abonnieren kann:
my-skills-tap/ ├── skills.sh.json ├── mlops/vllm-deploy/SKILL.md └── research/paper-summarizer/SKILL.md # Team-Abonnement mit einem Befehl hermes skills tap add github:your-org/your-skills-tap hermes skills tap add github:your-org/private-skills --token $GH_TOKEN hermes skills tap update hermes skills tap list
Versionskontroll-Tipp: Legen Sie ~/.hermes/skills/ unter Git. Nach git pull && hermes skills reset auf einem anderen Gerät Built-in-Skills neu aufbauen, um synchron zu bleiben.
GEPA (Genetic-Pareto Prompt Evolution) ist ein ICLR-Oral-Ergebnis aus 2026, integriert in hermes-agent-self-evolution. Die Kernidee: ohne Fine-Tuning der Modellgewichte Execution Traces analysieren, Varianten generieren und multi-objektive Pareto-Optimierung anwenden, um den Skill-Text selbst zu verbessern. Jeder Optimierungslauf kostet grob $2–10 API-Gebühren — keine GPU nötig.
Execution-Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite lesen — Tool-Aufrufe, Verzweigungen, Fehler.
Reflektive Fehleranalyse: LLM liefert umsetzbare Side Information — nicht nur „es ist fehlgeschlagen", sondern warum.
Gezielte Mutation: 10–20 SKILL.md-Varianten generieren, zielgerichtet auf die Fehlerursache.
Multi-objektive Pareto-Evaluierung: Erfolgsrate × Token-Effizienz × Geschwindigkeit gleichzeitig optimieren.
Menschliches PR-Review: Beste Variante → PR generiert → Merge nach menschlicher Freigabe.
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes
# Synthetischer Dateneinstieg
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source synthetic
# Echte Sitzungsdaten (bessere Ergebnisse)
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source sessiondbVollständige Test-Suite pytest tests/ -q muss zu 100 % bestehen
Größenlimits: Skills ≤ 15KB, Tool-Beschreibungen ≤ 500 Zeichen
Prompt-Cache-Kompatibilität: keine Mid-Session-Edits, die den Cache invalidieren
Semantische Erhaltungsprüfung: darf nicht vom ursprünglichen Skill-Zweck abdriften
| Phase | Optimierungsziel | Engine | Status |
|---|---|---|---|
| Phase 1 | Skill-Dateien (SKILL.md) | DSPy + GEPA | ✅ Shipped |
| Phase 2 | Tool-Beschreibungen | DSPy + GEPA | 🔲 Geplant |
| Phase 3 | System-Prompt-Fragmente | DSPy + GEPA | 🔲 Geplant |
| Phase 4 | Tool-Implementierungscode | Darwinian Evolver | 🔲 Geplant |
| Phase 5 | Kontinuierliche Verbesserungsschleife | Automated Pipeline | 🔲 Geplant |
Da Skills dem agentskills.io-Standard folgen, können Sie auch Claude-Code- oder Gemini-CLI-Execution-Traces in GEPA einspeisen: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions
Plugins packen Skills in einen Namespace (plugin:skill): Sie erscheinen nicht in der Standard-skills_list (weniger Rauschen); sie aktivieren nur bei expliziter User-Anfrage (Opt-in); Skills innerhalb eines Plugins können sich gegenseitig referenzieren.
name: my-hermes-plugin
skills:
- name: writing-plans
path: skills/writing-plans/SKILL.md
- name: editing
path: skills/editing/SKILL.md
# Load: skill_view("superpowers:writing-plans")description steuert Aktivierungspräzision: Vermeiden Sie vage Zeilen wie Helps with code. Nennen Sie Trigger-Bedingungen, Scope und explizite Ausschlüsse (Do NOT use for...).
Pitfalls trennen gute von großartigen Skills: Jeder Fehlermodus braucht Root-Cause-Analyse und eine umsetzbare Lösung — kein generischer Rat.
| Skill-Größe | Empfehlung |
|---|---|
| < 500 Zeilen | Alles in SKILL.md belassen |
| 500–1000 Zeilen | Detailliertes Material nach references/ verschieben |
| > 1000 Zeilen | Stark aufteilen; prüfen, ob es zwei Skills sein sollten |
| > 15KB | Überschreitet GEPA-Größenlimit — muss aufgeteilt werden |
skill_manage lässt den Agenten eigene Skills pflegen: Unterstützt patch- und create-Aktionen. Setzen Sie skills.agent_writes_require_approval: true in config.yaml, um menschliche Freigabe vor Schreibvorgängen auf die Platte zu verlangen.
Bauen Sie ein blog-workflow-Bundle, das SEO-Recherche, Outline-Generierung, Code-Validierung, zweisprachige Checks und Publishing-Skills bündelt:
name: blog-workflow description: Full tech blog writing workflow. skills: - seo-keyword-research - outline-generator - code-example-validator - bilingual-checker - publish-to-platform instruction: | Always research SEO keywords before writing. Ensure all code examples are tested and runnable. Generate both Chinese and English title options.
Ein custom seo-keyword-research-Skill könnte in Procedure festlegen: chinesische Long-Tail-Muster wie „X 怎么用" und „X 教程"; englische Muster wie „X tutorial", „how to X" und „X vs Y"; Querverweis auf Juejin-Trending und Dev.to-Hot-Posts; Ausgabe 3–5 Primary Keywords plus eine 10–15 Long-Tail-Matrix.
Hermes Agent braucht 24/7-Uptime und lokale Trace-Akkumulation, damit GEPA-Evolution funktioniert (siehe unseren Leitfaden zur Drei-Schichten-Speicherarchitektur). Skills können Sie auf Windows oder Linux schreiben, aber macOS-spezifische scripts/ und Telegram-Gateway-Validierung gehören auf einen Remote-Mac.
| Szenario | Nur SSH | SSH + VNC | Empfehlung |
|---|---|---|---|
| SKILL.md / Bundle-YAML bearbeiten | ✅ | ✅ | SSH reicht |
| Bash-Skript-Validierung | ✅ | ✅ | SSH reicht |
| Telegram / Discord QR-Pairing | ❌ | ✅ | VNC erforderlich |
| GEPA-Evolution + manuelles PR-Review | ✅ | Optional | SSH + lokaler Diff-Review |
| macOS Keychain / TCC-Berechtigungen | ❌ | ✅ | VNC erforderlich |
Mac Mini M4 Monatsknoten mieten und Hermes per SSH installieren (siehe Installationsanleitung).
Erste SKILL.md unter ~/.hermes/skills/ anlegen; mit skills-ref validate prüfen.
Skill Bundle erstellen und Multi-Skill-Laden mit /bundle-name verifizieren.
Telegram-Gateway QR-Pairing und hermes doctor-Health-Checks in einer VNC-Sitzung abschließen.
Nach Akkumulation von Sitzungs-Traces GEPA evolve_skill auf dem Remote-Knoten ausführen und den generierten PR reviewen.
Offizielle Referenz von Nous Research.
Lesen →hermes-agent-self-evolution Repository.
Lesen →Cursor / Claude Code SKILL.md-Spec für jeden Agenten.
Lesen →Skills sind prozedurale Wissensdokumente, die einem Agenten beibringen, wie eine Aufgabe auszuführen ist. MCP ist eine Tool-Schnittstelle, die dem Agenten zusätzliche Tool-Aufrufe ermöglicht. Beides ergänzt sich: MCP liefert Datenbankzugriff; ein Skill lehrt den Agenten, wie man eine Migration korrekt durchführt.
Skill-Änderungen greifen nicht in der laufenden Sitzung. Führen Sie /reset aus für einen Neustart, oder installieren Sie mit dem --now-Flag, um einen Refresh zu erzwingen (invalidiert Prompt Cache und kostet mehr Tokens).
Vier Leitplanken begrenzen die Ausgabe: vollständige Test-Suite, Größenlimits, semantische Erhaltung und menschliches PR-Review. Semantische-Drift-Erkennung stellt sicher, dass Skills nicht vom ursprünglichen Zweck abdriften. Prüfen Sie jeden PR-Diff dennoch manuell vor dem Merge.
Kopieren Sie SKILL.md nach ~/.claude/skills/, oder nutzen Sie Multi-Agent-Install-Skripte wie kevinnft/ai-agent-skills für eine Installation über Hermes, Claude Code und Cursor hinweg.
CJK-Zeichen kosten in den meisten Tokenizern grob 1–1,5 Tokens pro Zeichen — vergleichbar mit Englisch. Halten Sie das description-Feld auf Englisch (oder zweisprachig), weil zugrunde liegende LLMs englische Beschreibungen präziser matchen.
Hermes Agent Skills machen aus „wird besser mit der Nutzung" keinen Slogan, sondern einen Engineering-Pfad: der agentskills.io-Standard garantiert plattformübergreifende Portabilität, Progressive Disclosure kontrolliert Token-Ausgaben, Bundles und bedingte Aktivierung orchestrieren komplexe Workflows, und GEPA lässt Skill-Text kontinuierlich evolvieren — alles erfordert einen 24/7-Host, der Sitzungs-Traces akkumuliert.
Skills auf Windows oder Linux zu schreiben ist in Ordnung, aber Telegram-QR-Pairing, macOS-Berechtigungsdialoge und langfristige Trace-Akkumulation scheitern oft an „kein Always-on-Mac". Ein Mac mini bedeutet Abschreibung und Stromkosten; ein VPS kann nicht die vollständige native Hermes-Gateway-Toolchain ausführen. Im Gegensatz dazu überlässt die Miete eines Mac Mini M4 bei VNCMac Uptime und Basis-Image dem Anbieter — Sie konzentrieren sich auf Skill-Authoring und GEPA-Evolution und nutzen VNC für grafische Validierung.
Wenn Sie Hermes von „installiert" zu „skill-systemisiert" bringen wollen, öffnen Sie über den Button unten einen Remote-Mac-Knoten und folgen Sie der Fünf-Schritte-Checkliste aus Abschnitt 12 zusammen mit unserem Architektur-Leitfaden und dem Installations-Tutorial.