C
Security

Microsoft veröffentlicht RAMPART und Clarity: Open-Source für sichere KI-Agenten

Microsoft stellt mit RAMPART und Clarity zwei neue Open-Source-Tools vor. Sie sollen Entwicklern helfen, KI-Agenten schon während der Entwicklung auf Sicherheit zu testen und Designfehler frühzeitig zu vermeiden.

CR
Codekiste Redaktion20. Mai 2026

Vom Chatbot zum autonomen Agenten: Die Sicherheitslücken von morgen

Die Ära der reinen Text-Chatbots ist vorbei. KI-Systeme evolveieren zu autonomen Agenten, die E-Mails lesen, Termine buchen, auf Dateisysteme zugreifen und APIs ansteuern. Mit jedem neuen Tool, das ein KI-Agent nutzt, wächst die Angriffsfläche exponentiell. Was passiert, wenn ein Agent über eine manipulierte Webseite eine Cross-Prompt-Injection erfährt und plötzlich vertrauliche Daten exfiltriert? Genau hier setzt Microsoft an und veröffentlicht mit RAMPART und Clarity zwei Open-Source-Tools, die den Lebenszyklus von KI-Sicherheit grundlegend verändern sollen.

RAMPART: Pytest-native Red Teaming für den Entwickleralltag

Das erste Tool, RAMPART (Risk Assessment and Measurement Platform for Agentic Red Teaming), schließt eine entscheidende Lücke im Entwicklungsprozess. Bisher war das Red Teaming von KI-Systemen oft eine nachgelagerte Disziplin – ein Security-Researcher prüft das fertige Produkt im Black-Box-Verfahren. Genau für diesen Zweck hatte Microsoft vor über zwei Jahren PyRIT (Python Risk Identification Tool) veröffentlicht.

RAMPART geht einen anderen Weg: Es richtet sich an Entwickler während der Erstellung des Systems. Das Framework ist Pytest-native. Wer in Python entwickelt, kennt Pytest als Standardwerkzeug für Unit- und Integrationstests. RAMPART integriert sich nahtlos in diesen Workflow. Entwickler können Safety- und Security-Tests schreiben, als würden sie reguläre Softwaretests anlegen.

Getestet werden können sowohl adversarial als auch benigne Szenarien. Das Spektrum reicht von Cross-Prompt-Injections – bei denen untrusted Data über eine E-Mail oder Webseite indirekt in das System einsickert – bis hin zu unbeabsichtigten Verhaltensregressionen und Datenexfiltration. Um RAMPART an einen bestehenden KI-Agenten anzudocken, wird lediglich ein simpler Adapter benötigt. Die Testergebnisse werden anschließend automatisch evaluiert und reportet.

Clarity: Das kritisches Gegenüber vor der ersten Code-Zeile

Während RAMPART die technische Testebene abdeckt, setzt Clarity noch früher an: auf der Konzeptionsebene. Microsoft beschreibt Clarity als ein „structured sounding board“ – einen strukturierten Prüfspiegel für Entwickler und Product Manager.

Oft werden kritische Architektur-Entscheidungen getrofen, bevor überhaupt eine Zeile Code geschrieben ist. Etwa: Welche Tools darf der Agent nutzen? Welche Daten darf er lesen? Clarity fungiert als ein KI-gestützter „Thinking Partner“, der gezielt widerspricht („pushes back“). Das Tool führt Teams durch die Problemerklärung, Lösungsfindung, Fehleranalyse und Entscheidungsverfolgung.

Ram Shankar Siva Kumar, Gründer von Microsofts AI Red Team, bringt es auf den Punkt: „Wir wollten Product Managern und Ingenieuren eine Möglichkeit geben, ihre Annahmen gleich zu Projektbeginn auf die Probe zu stellen – wenn ein Kurswechsel noch billig ist und das richtige Gespräch Monate an Nacharbeit sparen kann.“

Einordnung: Shift-Left für KI – vom Event zum Prozess

Die Veröffentlichung beider Tools ist mehr als nur ein Feature-Drop; sie signalisiert einen Reifeschritt in der KI-Entwicklung. In der klassischen Softwareentwicklung hat das „Shift-Left“-Paradigma längst Einzug gehalten: Sicherheitstests und Qualitätssicherung werden so früh wie möglich im Entwicklungszyklus angesiedelt. Bei KI-Systemen fand dies bisher kaum statt, da das Verhalten von LLMs schwer zu testen war.

Microsoft versucht nun, das Red Teaming von einem punktuellen Event (vor dem Launch) in einen kontinuierlichen Prozess zu überführen. Aus einmaligen Reviews werden laut Siva Kumar „lebendige Artefakte“, die das Team über den gesamten Lebenszyklus hinweg nutzen kann.

Kritische Analyse: Gute Werkzeuge, aber wer wendet sie an?

Der Ansatz von Microsoft ist strategisch klug. Mit der Pytest-Nativität von RAMPART senkt Microsoft die Einstiegshürde massiv. Entwickler müssen keine neuen, proprietären Pipelines lernen, sondern können Sicherheits-Tests in ihre bestehenden CI/CD-Workflows integrieren. Das ist ein enormer Mehrwert gegenüber rein manuellen Prompt-Injection-Skripten.

Auch Clarity trifft einen Nerv. Die größte Gefahr bei KI-Agenten ist nicht zwingend ein fehlerhaftes Modell, sondern ein fehlerhaftes Design – etwa ein Agent, der übermäßig viele Berechtigungen erhält, ohne dass die Implikationen durchdacht wurden. Ein Tool, das Teams zwingt, Annahmen zu dokumentieren und zu hinterfragen, ist ein wichtiger kultureller Hebel.

Dennoch gibt es offene Fragen. Bei Clarity stellt sich die Frage nach der Qualität des „Widerspruchs“. Wie gut muss das zugrundeliegende Modell sein, um echte Architektur-Schwachstellen aufzudecken, anstatt nur oberflächliche Einwände zu wiederholen? Wenn Clarity nur als Echo-Chamber dient, die bestehende Annahmen leichtfertig bestätigt, verfehlt es seinen Zweck. Zudem ist Open-Sourcing bei Sicherheitstools ein zweischneidiges Schwert: Zwar fördert es Transparenz und Community-Prüfungen, doch auch Angreifer können die Test-Suiten von RAMPART studieren, um zu verstehen, wie Unternehmen ihre Agenten absichern.

Fazit: Microsoft legt mit RAMPART und Clarity wichtige Bausteine vor, um KI-Sicherheit vom Forscher-Labor in den Entwickler-Alltag zu holen. Die Werkzeuge sind da – nun liegt es an der Community und den Entwicklerteams, sie nicht nur als optionales Add-on, sondern als festen Bestandteil ihres KI-Entwicklungsprozesses zu etablieren.


Quelle: The Hacker News

QUELLEN
The Hacker News
Pro-Feature

Melde dich an und werde Pro-Mitglied, um dieses Feature zu nutzen.

Anmelden
CR
Codekiste Redaktion

Automatisierte Content-Kuratierung für tech-news.

Kommentare

WEITERLESEN
Security

ChatGPhish: Wenn ChatGPT selbst zur Phishing-Falle wird

Security

KI als Hacker: LLM-Agent nutzt Marimo-Lücke für Daten-Exfiltration

Security

KI als Tatwaffe: Wie GREYVIBE die Ukraine attackiert