Konzept
Proof-Carrying Coding
Zuletzt aktualisiert: 2026-07-02Lesezeit ca. 4 Min.
Proof-Carrying Coding ist das Prinzip, dass jede Änderung – besonders eine KI-generierte – zusammen mit den Belegen für ihre Übernahme ankommt: Auftrag, Checks, Ergebnisse, Übersprungenes. Es leiht sich die Architektur von Neculas Proof-Carrying Code (1997): Nicht vertraute Produzenten hängen an, was Empfänger billig prüfen können – denn Belege zu prüfen kostet Minuten, Arbeit zu rekonstruieren Stunden. Die „Proofs“ sind hier Belege, keine formalen Beweise – schwächere Garantie, viel größerer Geltungsbereich, dieselbe Ökonomie.
Inhalt
Die Idee von 1997: Vertrauen durch prüfbare Artefakte
In Proof-Carrying Code (POPL 1997, später als einflussreichstes Paper seines Jahrgangs ausgezeichnet) löste George Necula ein adversariales Vertrauensproblem elegant: Ein Host muss ein Binary aus nicht vertrauter Quelle ausführen. Statt der Quelle zu vertrauen oder das Binary mühsam zu analysieren, hängt die Quelle einen formalen Sicherheitsbeweis an – und der Host lässt einen kleinen, schnellen Beweis-Checker laufen. Die tiefe Einsicht ist asymmetrischer Aufwand: Den Beweis zu konstruieren ist teuer und Sache des Produzenten; ihn zu prüfen ist billig und Sache des Konsumenten. Der Host bleibt souverän, ohne die Arbeit des Produzenten zu wiederholen.
Die Übertragung aufs KI-Coding – ehrlich als Analogie markiert
KI-Coding stellt die Vertrauenslage fast exakt nach: Ein produktiver, nicht voll vertrauter Produzent (das Modell) liefert Arbeit an einen Empfänger (euer Team), der sie sich nicht leisten kann nachzubauen. Bei 96 % Misstrauen und nur 48 % konsequenter Prüfung lösen die meisten Teams das Dilemma derzeit, indem sie trotzdem vertrauen. Proof-Carrying Coding löst es auf die Art von 1997 – mit einem ehrlichen Unterschied, der ausgesprochen gehört statt versteckt:
| Proof-Carrying Code (1997) | Proof-Carrying Coding (2026) | |
|---|---|---|
| Nicht vertrauter Produzent | Code-Lieferant (möglicherweise feindlich) | Das generierende Modell / der Agent |
| Angehängtes Artefakt | Formaler, maschinell prüfbarer Sicherheitsbeweis | Beleg-Nachweis: Auftrag, Checks, Ergebnisse, Übersprungenes |
| Job des Empfängers | Einen kleinen Beweis-Checker laufen lassen | Belege prüfen, Trade-offs beurteilen |
| Abgedeckte Eigenschaft | Enge Sicherheitseigenschaften, mit Gewissheit | Auftragstreue und Validierung, mit Konfidenz |
| Die Ökonomie | Prüfen ≪ Beweisen | Belege prüfen ≪ den Run rekonstruieren |
Die unterste Zeile macht die Analogie tragend statt dekorativ: In beiden Systemen existiert das ganze Design, weil Verifikation radikal billiger ist als Reproduktion. Belege, deren Prüfung mehr kostet als die Arbeit zu wiederholen, wären wertlos – das ist zugleich die Qualitätslatte dafür, was in den Nachweis gehört.
Was das Prinzip praktisch verlangt
- Produzenten hängen an, immer. Jeder KI-Run liefert seine Änderung plus seinen Nachweis – den schriftlichen Auftrag, die gelaufenen Validierungen, ihre Ergebnisse, das Übersprungene. Kein Nachweis, keine Review-Anfrage.
- Empfänger prüfen statt zu rekonstruieren. Das Review beginnt bei den Belegen: Umfang gegen Grenzen, Kriterien gegen Ergebnisse. Urteils-Zeit fließt in Architektur und Trade-offs, nicht in Archäologie.
- Nichts mergt auf bloßes Vertrauen. „Der Agent sagt, es besteht“ ist eine Behauptung, kein Beleg – Validierung außerhalb der generierenden Session macht den Nachweis prüfbar.
- Der Nachweis bleibt. Beim Code gespeichert akkumulieren die Nachweise zum Audit-Trail, den niemand nachträglich schreiben musste. Die Struktur des Artefakts samt gekennzeichnetem Beispiel steht auf der Prüfbericht-Seite.
Das Revival 2026 – und die ehrlichen Grenzen
Das formale Ende der Idee wird gerade für Agenten neu gebaut: Forschung von 2026 zu Proof-Carrying Agent Actions lässt Agenten-Aktionen maschinell prüfbare Begründungen tragen, die ein Gate vor der Ausführung verifiziert – Neculas Architektur, neu gerichtet auf Laufzeit-Governance. Das pragmatische Ende, oben beschrieben, ist heute einsetzbar. Seine Grenzen verdienen dieselbe Klarheit: Belege erhöhen Konfidenz, sie beweisen keine Korrektheit; ein Nachweis kann vollständig sein und die Architektur trotzdem falsch – deshalb bleibt das menschliche Gate; und die Qualität des ganzen Schemas ist durch die Qualität des Auftrags begrenzt – vage Mandate produzieren unfalsifizierbare Belege.
Wo Reality Graph ansetzt
Proof-Carrying Coding ist Reality Graphs Arbeitsprinzip als Konzept ausgesprochen: Jeder Run wird gegen seinen schriftlichen Auftrag verifiziert, und die Änderung reist mit ihrem Prüfbericht – als Nebenprodukt erzeugt, in Minuten geprüft, beim Code gespeichert, local-first. Das Prinzip steht ohne jedes bestimmte Tool; das Tool existiert, weil das Prinzip bei KI-Volumen von Hand mühsam durchzuhalten ist.
Dieses Prinzip gibt euch
- Reviews, die bei verifizierten Fakten beginnen statt bei Archäologie
- Die Verifikations-Asymmetrie, die pro Änderung für euch arbeitet
- Einen Audit-Trail, der als Nebenprodukt akkumuliert
- Eine 30 Jahre alte, preisgekrönte Architektur als Fundament
Es gibt euch nicht
- Formale Beweise – die Belege stiften Konfidenz, keine Gewissheit
- Einen Ersatz für die menschliche Merge-Entscheidung
- Wert aus vagen Aufträgen – prüfbare Mandate sind die Voraussetzung
- Neculas Garantien – die Analogie ist ehrlich damit, eine zu sein
Wenn diese Grenzen zu eurem Team passen:
FAQ
- Was ist Proof-Carrying Coding und wie funktioniert es in der Praxis?
- Proof-Carrying Coding ist das Prinzip, dass jede Code-Änderung – besonders KI-generierte – zusammen mit den Belegen ankommt, die für ihre Übernahme nötig sind: der schriftliche Auftrag, die gelaufenen Checks, ihre Ergebnisse und das Übersprungene. Der Empfänger prüft die Belege, statt die Arbeit zu rekonstruieren – was dramatisch billiger ist. Praktisch heißt das: ein Beleg-Nachweis pro Run, gespeichert bei der Änderung, und ein Review, das bei verifizierten Fakten beginnt.
- Woher stammt der Begriff?
- Von George Neculas Proof-Carrying Code (POPL 1997): ein Mechanismus, bei dem ein Host ein Programm aus nicht vertrauter Quelle sicher ausführen kann, weil das Programm einen formalen, maschinell prüfbaren Sicherheitsbeweis mitbringt – und einen Beweis zu prüfen ist weit billiger, als ihn zu konstruieren. Proof-Carrying Coding leiht sich die Architektur, nicht den Formalismus: Der Produzent einer Änderung hängt an, was der Empfänger braucht, um ihr billig zu vertrauen.
- Sind das echte Beweise wie bei Necula?
- Nein, und der Unterschied verdient den klaren Satz. Neculas Beweise waren formal und maschinell verifiziert – enge Sicherheitseigenschaften mit mathematischer Gewissheit. Die Belege im Proof-Carrying Coding – Auftragstreue, Testergebnisse, Grenz-Checks – sind schwächer: Sie erhöhen Konfidenz statt Gewissheit zu stiften, decken dafür aber die viel breitere Frage ab, ob eine Änderung tut, was beauftragt war. Schwächere Garantie, größerer Geltungsbereich; die Ökonomie überträgt sich unversehrt.
- Warum ist die Asymmetrie so wichtig?
- Weil sie entscheidet, ob sich Belege lohnen. Einen angehängten Nachweis zu prüfen kostet einen Reviewer Minuten; zu rekonstruieren, was ein KI-Run getan hat – Absicht aus dem Diff zurückentwickeln, Checks nachfahren, Übersprungenes erraten –, kostet eine Stunde, pro Review-Runde. Wenn Prüfen viel billiger ist als Reproduzieren, amortisiert sich das Anhängen sofort. Diese Asymmetrie war Neculas Einsicht 1997 und ist heute der ganze Business Case.
- Was unterscheidet das vom Prüfbericht?
- Der Prüfbericht ist das Artefakt – was pro Run festgehalten wird, in welcher Struktur, mit gekennzeichnetem Beispiel. Proof-Carrying Coding ist das Prinzip, dem das Artefakt dient: Produzenten hängen an, Empfänger prüfen, nichts wird auf bloßes Vertrauen übernommen. Man kann beide in beliebiger Reihenfolge lesen; die Bericht-Seite zeigt das Wie, diese Seite begründet das Warum.
- Wendet das jemand formal auf KI-Agenten an?
- Ja – die Idee erlebt ein sichtbares Revival. Forschung von 2026 zu Proof-Carrying Agent Actions überträgt Neculas Architektur auf Laufzeit-Governance von Agenten-Systemen: Aktionen tragen maschinell prüfbare Begründungen, die ein Gate vor der Ausführung verifiziert. Das formale Ende des Spektrums wird für Agenten neu gebaut, während das pragmatische Ende – Änderungen mit Belegen – heute in jedem Team einsetzbar ist.
Weiterlesen
Quellen
- Necula – Proof-Carrying Code, POPL 1997 (ACM; Most-Influential-Paper-Award 2007, englisch)
- arXiv – Proof-Carrying Agent Actions: modell-agnostische Laufzeit-Governance für Agenten-Systeme (2026, englisch)
- Sonar – State of Code: 96 % Misstrauen, 48 % konsequente Prüfung – die Vertrauenslücke, die Belege schließen (2026, englisch)