Zum Inhalt springen

Works with

Claude Code prüfen

Zuletzt aktualisiert: 2026-07-02Lesezeit ca. 4 Min.

Reality Graph ist eine lokale Verifikationsschicht, die neben Claude Code arbeitet: Auftragsgrenzen und Kontext vor dem Run, unabhängige Validierung und ein Belegbericht danach, ein menschliches Gate vor dem Merge. Claude Code bleibt euer Coding-Agent – Reality Graph macht seine Runs verifizierbar.

Inhalt

Warum Claude-Code-Runs Verifikation verdienen

Claude Code gehört zu den fähigsten agentischen Coding-Tools: Es liest Dateien, ändert sie, führt Kommandos aus und iteriert, bis eine Aufgabe fertig aussieht. Genau diese Fähigkeit macht Verifikation wichtig – ein Agent, der schnell viele Dateien anfassen kann, produziert Änderungen schneller, als irgendjemand sie reviewt. Und seine Zusammenfassung dessen, was er getan hat, schreibt dasselbe Modell, das es getan hat.

Nichts davon ist ein Claude-Code-spezifischer Makel. Es ist das allgemeine Verification-Debt-Problem in konzentrierter Form: Je fähiger der Agent, desto stärker verschiebt sich der Engpass vom Erzeugen der Änderungen zum Dahinterstehen.

Was Claude Code mitbringt – und was offen bleibt

Claude Code liefert selbst echte Kontrollflächen, und Teams sollten sie nutzen: Berechtigungs-Prompts vor Änderungen und Kommandos, konfigurierbare erlaubte Tools, Projekt-Anweisungen per CLAUDE.md, Hooks für eigene Checks. Gut eingesetzt verhindern sie eine ganze Klasse von Überraschungen.

Was sie nicht abdecken, ist der Verifikations-Loop um den Run:

  • Der Auftrag ist kein Artefakt. Die Aufgabe lebt meist im Prompt – nach dem Run existiert nichts Schriftliches, wogegen sich das Ergebnis prüfen ließe.
  • Selbst-Review ist kein unabhängiger Review. Tests, die der Agent schrieb, vom Agenten ausgeführt, vom Agenten zusammengefasst – nützlich, aber zirkulär.
  • Belege verdunsten. Was validiert und was übersprungen wurde, steht in einem Terminal-Scrollback, das nächste Woche weg ist.
  • Das Gate ist informell. Übernommen wird nach Gefühl – nicht gegen eine Checkliste, die ein Reviewer oder Auditor sehen könnte.

Der Workflow, Seite an Seite

So sieht ein verifizierter Claude-Code-Run mit Reality Graph aus:

  1. Davor: Der Auftrag wird in Reality Graph definiert – Ziel, Grenzen (welche Dateien und Verhalten tabu sind) und ein Validierungsplan. Das dauert Minuten und wird zur Referenz für alles danach.
  2. Run: Claude Code arbeitet exakt wie gewohnt – gleiche Prompts, gleiche Berechtigungen, gleiches Tempo. Reality Graph steht nicht zwischen euch und dem Agenten.
  3. Danach: Das Ergebnis wird gegen die deklarierten Grenzen geprüft, der Validierungsplan läuft (Tests, Typen, Lint, Build – Checks, die der Agent nicht verfasst hat), und ein Prüfbericht hält Auftrag, Änderungen, Validierungsergebnisse und offene Fragen fest.
  4. Gate: Ein Mensch übernimmt oder verwirft die Änderung – mit den Belegen vor Augen. Nichts committet automatisch.

Der „Davor“-Schritt ist ein kleines, schriftliches Artefakt – so sieht es aus:

auftrag.md

Beispiel – keine echten Run-Daten
Ziel:         Korrekten Retry-After-Header bei 429-Antworten liefern
Grenzen:      nur api/middleware/* · Rate-Limit-Logik unangetastet
Validierung:  Unit-Tests (vor dem Run geschrieben) · Typen · Lint · Build
Belege:       Bericht erwartet unter runs/2026-07-02-rate-limit.md
Gate:         menschliches Review vor dem Merge · kein Auto-Commit
PhaseClaude Code alleinMit Verifikationsschicht
Vor dem RunDer Auftrag lebt im Prompt und im Kopf.Ziel, Grenzen und Validierungsplan stehen schriftlich fest und werden zur Referenz.
Während des RunsVolles Tempo, volle Autonomie innerhalb der Berechtigungen.Unverändert – die Schicht steht nicht zwischen euch und dem Agenten.
Nach dem RunEin Diff und die Selbst-Zusammenfassung des Agenten.Grenz-Check, Validierung, die der Agent nicht verfasst hat, und ein Prüfbericht.
Merge-EntscheidungVertrauen plus die Review-Zeit, die gerade da ist.Ein Mensch entscheidet am Gate – mit Belegen vor Augen.
Was jede Phase eines Claude-Code-Runs durch eine Verifikationsschicht daneben gewinnt: schriftlicher Auftrag davor, unverändertes Tempo währenddessen, unabhängige Validierung und Belege danach.

Alles bleibt in eurer Umgebung – local-first by design.

Wo Reality Graph ansetzt

Reality Graph ist in privater Beta und wird täglich in echten Claude-Code-Workflows entwickelt – und selbst damit gebaut (Dogfooding). Early Access ist für eine kleine Gruppe von Teams offen. Claude Code ist ein Produkt von Anthropic; Reality Graph ist unabhängig und nicht mit Anthropic verbunden.

Was es macht

  • Macht den Auftrag vor dem Claude-Code-Run zum verifizierbaren Artefakt
  • Prüft Ergebnisse nach dem Run gegen die deklarierten Grenzen
  • Führt euren Validierungsplan aus und erzeugt einen Prüfbericht pro Run
  • Menschliches Freigabe-Gate – advisory by default, kein Auto-Commit

Was es nicht macht

  • Claude Code ersetzen – es arbeitet daneben, tool-agnostisch
  • In den Run selbst eingreifen oder ihn verändern
  • Euer Repository an einen Review-Dienst senden
  • Claude-Code-Output „garantiert sicher“ machen – Verifikation senkt Risiko, sie schafft es nicht ab

Wenn diese Grenzen zu eurem Team passen:

FAQ

Was heißt „Claude Code prüfen“ konkret?
Die Änderungen eines Claude-Code-Runs gegen den erteilten Auftrag prüfen – Scope, betroffene Dateien, Validierungsplan, Tests – und Belege anhängen, bevor ein Mensch die Änderung übernimmt. Die eigene Zusammenfassung des Agenten ist ein Ausgangspunkt, nicht die Verifikation.
Prüft Claude Code seine Arbeit nicht selbst?
Claude Code kann Tests laufen lassen, sich selbst checken und zusammenfassen, was es getan hat – das ist wirklich nützlich. Aber ein Generator, der den eigenen Output prüft, teilt die eigenen blinden Flecken. Unabhängige Verifikation ergänzt, was Selbst-Review nicht kann: den Abgleich mit eurem aufgeschriebenen Auftrag, Validierung, die das Modell nicht verfasst hat, und eine Entscheidung durch einen Menschen.
Ist Reality Graph ein Anthropic-Produkt oder mit Anthropic verbunden?
Nein. Reality Graph ist ein unabhängiges Produkt von Philogic Labs. Claude Code ist ein Produkt von Anthropic. Reality Graph arbeitet neben Claude Code genauso wie neben Cursor oder GitHub Copilot – als tool-agnostische Verifikationsschicht.
Wie nutzen Teams Claude Code heute sicher, auch ohne Zusatz-Tooling?
Die Basics tragen weit: Aufgaben klein und schriftlich halten, die Berechtigungs-Prompts von Claude Code bewusst nutzen statt durchzuwinken, Diffs gegen den Auftrag statt aus dem Gedächtnis reviewen, Tests im Loop behalten, die der Agent nicht selbst geschrieben hat – und nie etwas automatisch committen lassen. Eine Verifikationsschicht systematisiert genau diese Gewohnheiten.
Bremst Reality Graph Claude Code aus?
Der Run selbst bleibt unberührt – Reality Graph ergänzt Struktur davor (schriftlicher Auftrag und Validierungsplan) und Verifikation danach (Checks und ein Belegbericht). Die Minuten dort sind die, die das generierte Tempo dauerhaft tragfähig machen.
Mit welchen anderen Tools funktioniert das?
Derselbe Verifikations-Loop gilt für Cursor, GitHub Copilot und andere LLM-gestützte Coding-Tools – Teams nutzen im Schnitt vier verschiedene KI-Coding-Tools, und eine Verifikationsschicht hilft nur, wenn sie über alle hinweg funktioniert. Claude Code ist schlicht das Tool, um das es auf dieser Seite geht.

Weiterlesen

Quellen

Die Beta verfolgen – oder testen, sobald sie öffnet?

Early Access anfragen