KI Skills: Claude Code vs. Codex – Der grosse Vergleich
Ein neues Konzept verändert die Art, wie Entwickler mit KI-Coding-Assistenten arbeiten: Agent Skills. Statt immer wieder dieselben Anweisungen in den Chat zu tippen, verpackt man Workflows, Konventionen und Prozeduren in wiederverwendbare SKILL.md-Dateien – und der Agent lädt sie automatisch, wenn sie relevant sind. Claude Code und OpenAI Codex haben dieses Konzept beide übernommen, setzen es aber auf unterschiedliche Weise um. Dieser Artikel zeigt, was Skills sind, wie sie in beiden Tools funktionieren und wo die entscheidenden Unterschiede liegen.
Was sind Agent Skills?
Agent Skills sind ein offenes Format für wiederverwendbare KI-Agenten-Fähigkeiten. Im Kern ist ein Skill ein Verzeichnis mit einer SKILL.md-Datei, die YAML-Frontmatter und Markdown-Instruktionen enthält. Optionale Dateien wie Scripts, Referenzdokumente und Templates können ergänzt werden.
my-skill/
├── SKILL.md # Pflicht: Metadaten + Instruktionen
├── scripts/ # Optional: ausführbarer Code
├── references/ # Optional: Dokumentation
└── assets/ # Optional: Templates, Ressourcen
my-skill/
├── SKILL.md # Pflicht: Metadaten + Instruktionen
├── scripts/ # Optional: ausführbarer Code
├── references/ # Optional: Dokumentation
└── assets/ # Optional: Templates, Ressourcen
Das Besondere an Skills ist das Prinzip der Progressive Disclosure: Beim Start lädt der Agent nur den Namen und die Beschreibung jedes Skills – gerade genug, um zu wissen, wann er relevant sein könnte. Die vollständigen Instruktionen werden erst geladen, wenn eine Aufgabe zur Beschreibung des Skills passt. Das bedeutet: Hunderte von Skills können installiert sein, ohne den Kontext zu überlasten.
Der Standard wurde ursprünglich von Anthropic entwickelt, dann als offener Standard unter agentskills.io veröffentlicht und von einer wachsenden Zahl von Tools übernommen. Heute unterstützen über 19 Agenten das Format: Claude Code, Codex, Cursor, GitHub Copilot, Windsurf, Gemini CLI, Cline, OpenClaw, VS Code, Roo, Trae, Kiro CLI, Goose und weitere.
Claude Code Skills: Tief integriert, maximal flexibel
Claude Code implementiert den Agent Skills Standard mit mehreren exklusiven Erweiterungen, die über den Basisstandard hinausgehen.
Verzeichnisstruktur und Geltungsbereiche
Skills in Claude Code werden in .claude/skills/<name>/SKILL.md gespeichert und gelten je nach Speicherort für unterschiedliche Scopes:
| Ebene | Pfad | Gilt für |
|---|---|---|
| Enterprise | Managed Settings | Alle Nutzer der Organisation |
| Personal | ~/.claude/skills/<name>/SKILL.md | Alle eigenen Projekte |
| Project | .claude/skills/<name>/SKILL.md | Nur dieses Projekt |
| Plugin | <plugin>/skills/<name>/SKILL.md | Wo Plugin aktiviert ist |
Claude Code unterstützt ausserdem Monorepo-Setups: Skills werden nicht nur im aktuellen Verzeichnis gesucht, sondern auch in allen übergeordneten Verzeichnissen bis zum Repository-Root sowie in verschachtelten Unterverzeichnissen. Wer in packages/frontend/ arbeitet, erhält automatisch auch Skills aus packages/frontend/.claude/skills/.
Invocation: Automatisch und manuell
Skills werden auf zwei Wegen aktiviert. Bei der automatischen Invokation liest Claude die Beschreibungen aller verfügbaren Skills und lädt den passenden, wenn eine Aufgabe zur Beschreibung passt. Bei der manuellen Invokation tippt der Entwickler /skill-name direkt in den Chat.
Mit disable-model-invocation: true im Frontmatter kann ein Skill auf rein manuelle Invokation beschränkt werden – sinnvoll für kritische Aktionen wie Deployments, die nicht versehentlich ausgelöst werden sollen.
Exklusive Features: Was Claude Code besonders macht
1. Subagent-Ausführung (context: fork)
Das mächtigste exklusive Feature von Claude Code ist die Möglichkeit, Skills in einem isolierten Subagenten auszuführen. Mit context: fork im Frontmatter erhält der Skill seinen eigenen Kontext – unabhängig vom Hauptgespräch. Das ermöglicht parallele Agenten-Workflows: Während der Hauptagent weiterarbeitet, führt der Subagent eine aufwendige Analyse oder ein Deployment durch.
---
name: security-audit
description: Führt einen vollständigen Sicherheits-Audit des Codes durch
context: fork
disable-model-invocation: true
---
Analysiere den gesamten Codebase auf Sicherheitslücken:
1. Prüfe alle API-Endpunkte auf Authentication
2. Scanne Dependencies auf bekannte CVEs
3. Überprüfe SQL-Queries auf Injection-Risiken
4. Erstelle einen strukturierten Bericht
---
name: security-audit
description: Führt einen vollständigen Sicherheits-Audit des Codes durch
context: fork
disable-model-invocation: true
---
Analysiere den gesamten Codebase auf Sicherheitslücken:
1. Prüfe alle API-Endpunkte auf Authentication
2. Scanne Dependencies auf bekannte CVEs
3. Überprüfe SQL-Queries auf Injection-Risiken
4. Erstelle einen strukturierten Bericht
2. Dynamische Kontextinjektion (inject:)
Mit dem inject:-Parameter können Skills Live-Daten in ihren Kontext laden, bevor Claude die Instruktionen liest. Das klassische Beispiel ist ein summarize-changes-Skill, der den aktuellen Git-Diff injiziert – so ist die Antwort immer im aktuellen Arbeitsstand verankert, nicht in dem, was Claude aus offenen Dateien erraten kann.
3. Bundled Skills
Claude Code liefert eine Reihe eingebauter Skills mit, die in jeder Session verfügbar sind: /simplify (Code vereinfachen), /batch (Batch-Operationen), /debug (Debugging-Workflow), /loop (iterative Aufgaben) und /claude-api (Claude API-Integration). Diese Skills sind prompt-basiert und können als Vorlage für eigene Skills dienen.
4. Live Change Detection
Änderungen an Skills werden sofort erkannt und in der laufenden Session wirksam – ohne Neustart von Claude Code. Nur wenn ein neues Skills-Verzeichnis erstellt wird, das beim Start noch nicht existierte, ist ein Neustart erforderlich.
Codex Skills: Plugin-orientiert und cloud-nativ
OpenAI Codex implementiert denselben SKILL.md-Standard, ergänzt ihn aber mit einem eigenen Ökosystem für Distribution und App-Integration.
Verzeichnisstruktur und Geltungsbereiche
Codex verwendet .agents/skills/ als Verzeichnisnamen (statt .claude/skills/) und unterstützt sechs Scopes:
| Scope | Pfad | Verwendung |
|---|---|---|
| REPO (CWD) | $CWD/.agents/skills | Microservice-spezifisch |
| REPO (Parent) | $CWD/../.agents/skills | Shared parent folder |
| REPO (Root) | $REPO_ROOT/.agents/skills | Gesamtes Repository |
| USER | $HOME/.agents/skills | Alle Projekte des Nutzers |
| ADMIN | /etc/codex/skills | Systemweit (Machine/Container) |
| SYSTEM | Bundled by OpenAI | Alle Nutzer |
openai.yaml: Das exklusive Konfigurationsformat
Codex erweitert den Standard um eine optionale agents/openai.yaml-Datei, die drei wichtige Funktionen bietet: UI-Metadata (Icon, Farbe, Default-Prompt für die Codex-App), Invocation Policy (implizite Aktivierung ein-/ausschalten) und Tool Dependencies (MCP-Server deklarieren, die Codex automatisch konfiguriert).
Plugins: Skills für die Distribution
Während Skills für die lokale Entwicklung und Repo-spezifische Workflows gedacht sind, bietet Codex mit Plugins ein Distributions-Format für wiederverwendbare Skills. Ein Plugin kann mehrere Skills bündeln, App-Mappings definieren und MCP-Server-Konfigurationen einschliessen. Plugins werden über den $skill-installer installiert.
Eingebaute Werkzeuge
Codex liefert zwei eingebaute Skills, die den Workflow vereinfachen: $skill-creator (interaktiver Assistent zum Erstellen neuer Skills) und $skill-installer (zum Installieren von Skills aus Repositories). Der $plan-Skill unterstützt die Aufgabenplanung.
Context Budget
Codex begrenzt die initiale Skills-Liste auf etwa 2% des Kontextfensters (8.000 Zeichen, wenn das Fenster unbekannt ist). Bei sehr vielen installierten Skills werden Beschreibungen zuerst gekürzt; bei sehr grossen Skill-Sets können einige Skills aus der initialen Liste weggelassen werden.
Der direkte Vergleich
| Merkmal | Claude Code | Codex |
|---|---|---|
| Verzeichnisname | .claude/skills/ | .agents/skills/ |
| Konfigdatei | SKILL.md (YAML+MD) | SKILL.md + openai.yaml |
| Subagent-Ausführung | Ja (context: fork) | Nein (nativ) |
| Dynamische Kontextinjektion | Ja (inject:) | Nein |
| UI-Metadata | Nein | Ja (openai.yaml) |
| MCP-Dependencies | Nein (nativ) | Ja (openai.yaml) |
| Plugin-Distribution | Nein | Ja |
| Eingebaute Skills | /simplify, /batch, /debug, /loop, /claude-api | skill-creator, skill-installer, plan |
| Context Budget | Kein explizites Limit | ~2% Kontextfenster (8.000 Zeichen) |
| Skill deaktivieren | Löschen | config.toml (ohne Löschen) |
| Monorepo-Support | Ja (parent+nested) | Ja (CWD+parent+root) |
| Symlink-Support | Nein (nativ) | Ja |
| Marketplace | Anthropic + Community + Agensi | GitHub-Katalog (~35 Skills) |
| Portabilität | Sehr hoch (20+ Agenten) | Hoch (SKILL.md kompatibel) |
skills.sh: Das offene Skills-Verzeichnis
skills.sh ist die zentrale Plattform für Skills aller kompatiblen Agenten. Mit einem einzigen Befehl lassen sich Skills installieren:
npx skills add <owner/repo>
npx skills add <owner/repo>
Die Plattform unterstützt alle 19+ kompatiblen Agenten und listet Skills nach Themen: Agent Workflows, Frontend/React, Next.js, Testing, Security und mehr. Für Claude Code sind Agent Workflow-, React- und Next.js-Skills besonders beliebt; für Codex dominieren Agent Workflow- und Testing-Skills.
Portabilität: Ein Skill, viele Agenten
Der wichtigste strategische Vorteil des offenen Standards ist die Portabilität. Ein SKILL.md, das für Claude Code geschrieben wurde, funktioniert in den meisten Fällen ohne Änderungen auch mit Codex, Cursor, Gemini CLI, OpenClaw und anderen kompatiblen Agenten. Lediglich Claude Code-spezifische Features wie context: fork und inject: werden von anderen Tools ignoriert oder nicht unterstützt.
Für Entwicklungsteams, die mehrere Tools einsetzen oder in Zukunft wechseln möchten, ist SKILL.md die zukunftssicherste Wahl. Skills können versioniert, in Git eingecheckt und im Team geteilt werden – genau wie Code.
Benchmarks und Preise
Auf dem SWE-bench Verified – dem Goldstandard für reale Software-Engineering-Aufgaben – erzielt Claude Code 72,7% Genauigkeit gegenüber 69,1% bei Codex. Codex punktet dagegen bei cloud-nativen, parallelisierbaren Aufgaben und verursacht nach Nutzererfahrungen etwa 50–75% der Token-Kosten von Claude Code.
| Aspekt | Claude Code | Codex |
|---|---|---|
| SWE-bench Verified | 72,7% | 69,1% |
| Token-Kosten (relativ) | 100% | 50–75% |
| Stärken | Komplexe lokale Codebases, GUI-Automation, parallele Agenten | Cloud-native, parallele Tasks, Produktionsworkflows |
| Abo-Einstieg | Claude Pro (CHF 20/Monat) | ChatGPT Plus (CHF 20/Monat) |
| Abo-Premium | Claude Max (CHF 100/Monat) | ChatGPT Pro (CHF 200/Monat) |
Fazit: Welches Tool für welchen Zweck?
Beide Tools implementieren denselben offenen Standard – und das ist die eigentliche Nachricht. Skills sind kein proprietäres Feature, sondern ein gemeinsames Ökosystem. Die Unterschiede liegen in den Erweiterungen:
Claude Code eignet sich besonders für Entwickler, die komplexe lokale Codebases verwalten, parallele Agenten-Workflows benötigen oder von der dynamischen Kontextinjektion profitieren wollen. Das grössere Skill-Ökosystem und die tiefere Integration in den Entwicklungsworkflow machen es zur ersten Wahl für anspruchsvolle Projekte.
Codex überzeugt durch sein Plugin-System für die Distribution von Skills, die UI-Metadata-Unterstützung für Teams und die günstigeren Token-Kosten. Für cloud-native Workflows und Teams, die Skills als verteilbare Pakete anbieten wollen, ist Codex die bessere Wahl.
Für beide gilt: Wer heute Skills schreibt, investiert in ein zukunftssicheres Format. Mit npx skills add von skills.sh lassen sich in Sekunden produktionsreife Skills installieren – für beide Plattformen gleichermassen.