Anthropic könnte kurz vor dem Start des neuen Modells Claude Mythos stehen. Das Project Glasswing zum Test des Modells wurde schon ausgeweitet. Mythos sorgt indes auch für Angst, weil die Modellintelligenz für große Cyberangriffe sorgen könnte. Die Angst vor KI schürt Anthropic sogar selbst.

Anthropic testet Claude Mythos in einer kontrollierten Umgebung mit 200 Organisationen weltweit, um Cybersicherheitslücken zu identifizieren. Das Modell fand bereits über 10.000 kritische Schwachstellen – ein zweischneidiges Schwert für die digitale Sicherheit. (Foto: PhotoGranary02 / Shutterstock)

Eine neue Ära durch Claude Mythos

Anthropic hat mit Claude Mythos nach Claude Opus 4.8 ein extrem intelligentes KI-Modell entwickelt, das enorme Fähigkeiten mitbringt, aber auch große Ängste auslöst – weit über die KI-Szene hinaus. Jetzt gibt es Hinweise auf einen bevorstehenden Release für die Öffentlichkeit. Dabei hat Anthropic selbst kürzlich für eine Verlangsamung der KI-Entwicklung geworben, um Risiken zu minimieren. Doch es ist kompliziert. Denn jedes hochentwickelte System lässt sich auch für bösartige Zwecke nutzen.

Kommt Mythos für alle?

Der renommierte Tech-Journalist Alex Heath schrieb in seinem Newsletter Sources als Erster über Anthropics Veröffentlichungspläne für Claude Mythos. Demnach soll schon am 10. Juni eine öffentliche Version des neuen Modells zur Verfügung stehen. Eine offizielle Bestätigung vonseiten Anthropics gibt es bisher dazu nicht.

Das Modell Claude Mythos ist bei Anthropic bislang als Preview für erste Testpartner:innen verfügbar. Unter den ersten 50 davon waren auch Google, Microsoft und andere große Namen. Inzwischen hat Anthropic das sogenannte Project Glasswing für 150 zusätzliche Organisationen in 15 Ländern erweitert. Dabei wird das neue KI-Modell in einer kontrollierten Umgebung und mit Einfluss von Sicherheitsunternehmen, der US-Regierung und Open-Source-Software-Maintainern getestet.

Mehr als nur Cybersicherheit

Die Testorganisationen stammen zwar aus verschiedenen Branchen, haben aber laut Anthropic gemein, dass ein Angriff auf die Cybersicherheit Auswirkungen auf über 100 Millionen Menschen und die Sicherheit im Land sowie weltweit haben könnte. Im Rahmen von Project Glasswing sollen insbesondere Sicherheitslücken mit dem Modell identifiziert und für eine Optimierung der Cybersicherheit in den Fokus gerückt werden. Laut Anthropic wurden schon im ersten Test über 10.000 kritische Sicherheitslücken gefunden.

Die Ängste um Claude Mythos

Das, was wie ein Vorteil für große Organisationen und Unternehmen klingt, wird zu einem massiven Problem für die digitale Wirtschaft. Wenn Claude Mythos besser denn je Cybersicherheitslücken erkennen kann, ist ein Missbrauch des Modells – oder der Einsatz ähnlich intelligenter Modelle zu arglistigen Zwecken – extrem beunruhigend. Hauptsächlich der Finanzsektor fürchtet schon Angriffe, weil Claude Mythos nicht nur lange unentdeckte Lücken im System finden, sondern potenziell auch Angriffsszenarien schreiben kann.

Angela Göpfert aus der ARD-Finanzredaktion schreibt für die Tagesschau, dass Angreifer:innen in einem solchen Worst-Case-Szenario Finanzströme in Milliardenhöhe manipulieren könnten, was das Vertrauen in die Finanzsysteme zum Einbruch bringen könnte. Finanzunternehmen und -behörden müssen sich auf KI-Entwicklungen einstellen, aber noch hat die EU-Behörde für Cybersicherheit (ENISA) keinen Zugriff auf Mythos, wenngleich es Verhandlungen gibt.

Bedrohungen überall

Nicht nur die Finanzbranche wäre indes bedroht, wenn hochintelligente KI-Modelle für Angriffszwecke eingesetzt werden. Auch aufgrund der großen Gefahren und Bedenken in verschiedenen Branchen wollte Anthropic das Modell zunächst nicht für die Öffentlichkeit bereitstellen und schrieb:

„Project Glasswing and the capabilities of Claude Mythos Preview have sparked broad conversations—both within the software industry and with governments—about how AI is changing cybersecurity. These conversations have informed how we’ve expanded the program. They’ve also shaped our thinking about the very purpose of Project Glasswing.“

Ein Widerspruch?

Es gibt ein Problem. Selbst wenn Anthropic das Modell Claude Mythos zurückhält, muss sich die Digitalwelt auf intelligente Modelle und etwaige Angriffe einstellen. Anthropic geht davon aus, dass es in den nächsten sechs bis zwölf Monaten mehrere Modelle mit der Intelligenz von Mythos geben wird. Und die Unternehmen dahinter könnten sie mit weniger Sicherheitsregeln veröffentlichen als bei Anthropic für Claude Mythos geplant.

Diesem Argument folgt auch eine klare Empfehlung: „In that world, cyberattacks could occur much more often, and in much more unpredictable forms. It’s imperative that cyberdefenders adapt to maintain pace.“

Versuch, die Sicherheit zu stärken

Darum möchte das KI-Unternehmen Mythos eben doch schon bald für die Öffentlichkeit bereitstellen. Immerhin kann es dank der Intelligenz auch dabei helfen, Patches für Sicherheitslücken zu erstellen. Allerdings soll der Release nur mit erhöhten Sicherheitsvorkehrungen einhergehen. In diesem Kontext möchte Anthropic zudem das Cyber Verification Program erweitern und mehr Organisationen sicheren Zugang zu KI-Systemen gewähren.

Ein Sicherheitsmodell für die Zukunft

Das kürzlich gelaunchte Beta-Programm Claude Security soll bei der Absicherung von Codebases helfen, während einige Sicherheitstools aus dem Project Glasswing für mehr Organisationen bereitgestellt werden. Die Idee: Statt KI-Entwicklungen zu stoppen, sie besser in den Griff bekommen und die Sicherheit im digitalen Raum zu stärken.

Anthropics Warnung vor schneller KI-Entwicklung

Die Ängste, die viele Organisationen und Menschen gegenüber der rasenden KI-Entwicklung hegen, sind vielfältig: Arbeitslosigkeit, Verlust klassischer Geschäftsmodelle, Cyberangriffe und vieles mehr. Anthropic selbst betreibt diese Debatte nicht nur, da Mitgründer Christopher Olah Papst Leo XIV. in seiner Kritik an KI unterstützt hat. Das Unternehmen warnt in einem umfassenden Beitrag vor den negativen Effekten der KI-Entwicklung in rasantem Tempo.

Autonome Entwicklung

Laut Anthropics Warnung könnten KI-Systeme in Zukunft autonom ihre eigenen Nachfolgemodelle kreieren. Zwar sei man noch nicht an diesem Punkt des sogenannten Recursive Self Improvements angelangt, doch es könne dazu kommen. Ein Beleg für das rasante Fortschreiten der KI-Evolution ist, dass Claude in seiner Entwicklung stark vorangeschritten ist.

Zuverlässiger Code?

„Claude-written code was somewhat worse than human-written code at Anthropic in late 2025, is roughly at parity today, and we expect it to be strictly better within the year", schreibt das Team im Beitrag. Um die Gefahrenpotenziale von KI-Modellen und -Systemen besser analysieren und eindämmen zu können, würde Anthropic gerne eine Verlangsamung der Entwicklung fördern. Das Unternehmen selbst könnte diese ohne Weiteres umsetzen, aber das hätte nur den Effekt, dass die Konkurrenz davonzieht.

Ein globales Problem

Wenn es keine einheitliche, global durch rechtliche Rahmenbedingungen geschaffene KI-Bremse gibt, bleibt die Situation ausges