Claude Mythos hat Cybersecurity für immer verändert

Ein 27 Jahre alter Bug. Versteckt in OpenBSD — weithin als das sicherheitsgehärtetste Betriebssystem der Welt angesehen. Übersehen von jedem menschlichen Forscher, jedem automatisierten Scanner, jedem Fuzzer, jedem Penetrationstester, der diese Codebasis in fast drei Jahrzehnten je berührt hat.

Anthropic's Claude Mythos fand ihn in Stunden.

Nicht durch einen cleveren Trick oder eine neuartige Technik. Das Modell wurde nicht einmal für Cybersecurity-Arbeit trainiert. Anthropic baute Mythos, um außergewöhnlich gut Code zu schreiben, und der Nebeneffekt — die zufällige Konsequenz davon, etwas Brillantes beim Konstruieren von Software zu schaffen — war, dass es ebenso brillant darin wurde, Software auseinanderzunehmen.

Dieses Paradoxon macht diese Geschichte wirklich beunruhigend. Und wirklich aufregend. Denn was Anthropic gerade in Händen hält, ist nicht nur ein besseres Werkzeug. Es ist eine Fähigkeit, die neu definieren könnte, wer in der Cybersecurity den Vorteil hat — Angreifer oder Verteidiger — für das nächste Jahrzehnt.

Ich verfolge AI-Modell-Veröffentlichungen obsessiv, seit ich Vollzeit mit Claude Code arbeite. Ich habe Opus 4.6 bei der Veröffentlichung bewertet und Wochen damit verbracht, seine Grenzen auszutesten. Ich schrieb über die Absicherung von AI-Agents, nachdem ich beinahe meine eigene Infrastruktur mit einem falsch konfigurierten autonomen Setup zerstört hätte. Als Anthropic also am 7. April 2026 Mythos und Project Glasswing ankündigte, las ich nicht nur die Pressemitteilung — ich vertiefte mich in die technischen Offenlegungen, die Benchmark-Daten, die Partnerliste und die unbequemen Fragen, die in der Berichterstattung zum Launch niemand zu stellen wagte.

Hier ist, was ich herausfand. Und hier ist, warum ich denke, dass jeder Entwickler, nicht nur Sicherheitsspezialisten, aufpassen muss.

Das Schlosserproblem: Warum ein Codierungsmodell alles aufbricht

Die Analogie, die Anthropic intern immer wieder verwendet, ist die Schlosseranalogie, und sie ist treffend genug, um sie richtig zu entfalten.

Man trainiert jemanden, die kompliziertesten, präzisesten Schlösser zu bauen, die man sich vorstellen kann. Sie verstehen die internen Mechanismen auf molekularer Ebene — jeden Stift, jeden Zuhaltungsbolzen, jede Toleranz. Irgendwann überschreitet dieses Wissen eine Schwelle. Die Person versteht nicht nur, wie man Schlösser baut. Sie versteht, wie man sie überwindet.

Claude Mythos wurde nicht mit Exploit-Datenbanken trainiert. Es wurde nicht mit CVE-Berichten oder Penetrationstest-Methodologien gefüttert. Anthropic trainierte es, außergewöhnlichen Code zu schreiben — Software auf einer Tiefe zu verstehen, die frühere Modelle nicht erreichen konnten. Und irgendwo in diesem Training entwickelte Mythos eine emergente Fähigkeit: Es konnte Code betrachten und die strukturellen Schwächen erkennen, die Menschen seit Jahren übersehen.

Das ist der Teil, der Sie aufhorchen lassen sollte. Die Cybersecurity-Fähigkeiten waren kein Feature. Sie waren ein Nebeneffekt. Anthropic hatte nicht vor, eine Hacker-AI zu bauen. Sie wollten eine bessere Codierungs-AI bauen, und das Hacken kam gratis dazu.

Die Implikationen sind unbequem für jeden, der angenommen hat, dass AI-Cybersecurity-Bedrohungen von Modellen kommen würden, die speziell für offensive Sicherheit entwickelt wurden. Das wird nicht der Fall sein. Sie werden von Modellen kommen, die einfach wirklich, wirklich gut darin sind, Code zu verstehen.

Diese 27 Jahre alte OpenBSD-Schwachstelle? Sie befand sich in der SACK-Implementierung — dem TCP Selective Acknowledgment-Mechanismus. Mythos erkannte, dass ein Angreifer jeden OpenBSD-Host, der über TCP antwortet, zum Absturz bringen konnte, indem er einen Fehler in der Verarbeitung von SACK-Optionen ausnutzte. Kein Mensch war an der Entdeckung oder der Exploit-Kette nach der anfänglichen Anweisung beteiligt. Das Modell fand es, verstand es und demonstrierte es autonom.

Und OpenBSD war nicht das einzige Ziel.

Die Zahlen, bei denen ich aufhörte zu scrollen

Ich habe auf dieser Seite viele AI-Benchmarks behandelt. Die meisten sind etwa fünf Minuten interessant, bevor das nächste Modell den Spitzenreiter überholt. Aber die Mythos-Benchmark-Ergebnisse sind nicht nur inkrementell besser — sie repräsentieren eine Lücke, die breit genug ist, um als andere Kategorie zu gelten.

Auf SWE-bench Verified, dem wichtigsten Industriemaßstab für reale Software-Engineering-Fähigkeiten, erzielte Mythos 93,9%. Zum Vergleich: Opus 4.6 — das Modell, das ich täglich benutze und aufrichtig schätze — erzielt 80,8%. Das ist eine Lücke von 13,1 Punkten. Bei einem Benchmark, bei dem Modelle im vergangenen Jahr um Bruchteile von Prozentpunkten gekämpft haben, sprang Mythos eine ganze Klasse nach oben.

SWE-bench Pro — die schwierigste Stufe dieses Benchmarks, bei der Probleme mehrstufiges Denken über komplexe Codebases erfordern — erzählt eine noch dramatischere Geschichte. Mythos: 77,8%. Opus 4.6: 53,4%. Das ist kein inkrementeller Gewinn. Das ist der Unterschied zwischen einem Junior-Entwickler und einem Senior-Architekten.

Auf SWE-bench Multilingual, das Codeverständnis über Programmiersprachen hinweg testet: Mythos 87,3%, Opus 4.6 bei 77,8%.

Aber die Zahl, die für dieses Gespräch am meisten zählt, ist der CyberGym-Benchmark — eine spezialisierte Bewertung, die die Fähigkeit eines Modells misst, Software-Schwachstellen zu identifizieren und auszunutzen. Mythos erzielte 83,1%. Opus 4.6 erzielte 66,6%. Eine Lücke von 16,5 Punkten bei einem Cybersecurity-spezifischen Benchmark.

Um diese 83,1% in Perspektive zu setzen: Die CyberGym-Bewertung umfasst Aufgaben, die professionelle Sicherheitsforscher — Menschen, die dies beruflich tun, mit jahrelanger Erfahrung — nicht durchgängig lösen. Mythos ist nicht nur wettbewerbsfähig mit menschlichen Experten. Bei einem bedeutenden Teil dieser Aufgaben übertrifft es sie.

Das ist der Punkt, an dem dies aufhörte, eine interessante Benchmark-Geschichte zu sein, und begann, eine Geschichte über die Zukunft der gesamten Cybersecurity-Branche zu werden.

Die Bugs, die Menschen nicht finden konnten

Benchmarks sind Abstraktionen. Was mich überzeugte, dass dies real ist, waren die spezifischen Schwachstellen, die Mythos in Produktionssoftware fand, die täglich von Milliarden Menschen genutzt wird.

Der OpenBSD SACK-Bug (27 Jahre alt)

Ich habe diesen bereits erwähnt, aber die Details sind wichtig. Die gesamte Reputation von OpenBSD ist auf Sicherheit aufgebaut. Ihr Entwicklungsprozess umfasst rigorose Code-Audits. Ihr Team betreibt eines der paranoidsten, sicherheitsbewusstesten Open-Source-Projekte, die es gibt. Das OpenBSD-Projekt hatte in seiner gesamten Geschichte nur zwei Remote-Holes in seiner Standardinstallation — das ist der Marketing-Slogan, für den sie berühmt sind.

Mythos fand einen Remote-Crash-Bug in dieser Codebasis. Nicht in einem obskuren, selten genutzten Subsystem. Im TCP-Stack — einem der am gründlichsten untersuchten Netzwerkcode-Stücke im Betriebssystem. Die Schwachstelle hatte dort seit etwa 1999 gelegen, durch Hunderte von Code-Audits, durch Jahrzehnte der sicherheitsbewusstesten Entwicklungskultur in der Open-Source-Welt.

Kein automatisiertes Tool fand es. Kein menschlicher Forscher fand es. Ein AI-Modell, das trainiert wurde, guten Code zu schreiben, fand es als Nebeneffekt des Verständnisses, wie guter Code aussieht.

Die FFmpeg-Schwachstelle (16 Jahre alt)

Diese ist technisch gesehen beeindruckender, und hier ist der Grund. FFmpeg ist das Rückgrat der Videoverarbeitung im Internet. Wenn Sie im vergangenen Jahrzehnt ein Video online angesehen haben, hat FFmpeg es wahrscheinlich irgendwann berührt. Netflix nutzt es. YouTube nutzt es. VLC, OBS, Handbrake — die Liste ist enorm.

Die Schwachstelle, die Mythos entdeckte, wurde übersehen, obwohl automatisierte Testtools die betreffende Codezeile fünf Millionen Mal getroffen hatten. Fünf Millionen. Die Fuzzer liefen. Die statischen Analysatoren liefen. Die Testsuiten deckten den Codepfad ab. Und der Bug überlebte all das, weil er nicht die Art von Schwachstelle war, die Mustererkennungstools finden.

Dies ist die entscheidende Erkenntnis: Traditionelle Schwachstellenscanner suchen nach bekannten Mustern. Sie gleichen mit Datenbanken bekannter Schwachstellentypen ab. Sie prüfen auf Pufferüberläufe, SQL-Injektionen, Use-after-free-Bedingungen — den Katalog bekannter Angriffsklassen.

Mythos betreibt keine Mustererkennung. Es versteht Code. Es denkt darüber nach, was der Code tun soll, was er tatsächlich tut und wo die Lücke zwischen diesen beiden Dingen eine ausnutzbare Bedingung schafft. Das ist ein grundlegend anderer Ansatz, und er fängt eine völlig andere Klasse von Bugs.

Linux-Rechteeskalation

Mythos identifizierte auch Bugs im Linux-Kernel, die Rechteeskalation ermöglichen — die Fähigkeit eines normalen Benutzers, Root-Zugriff zu erlangen. Die Einzelheiten unterliegen noch der verantwortungsvollen Offenlegung, was genau so sein sollte. Aber das Muster ist konsistent: alte Bugs, gut auditierter Code, von jeder bestehenden Methode übersehen.

Schwachstellenverkettung

Hier ist der Teil, der mich wirklich beunruhigt hat. Mythos findet nicht nur einzelne Schwachstellen isoliert. Es verkettet sie. Es nimmt mehrere kleine, scheinbar niedrig eingestufte Probleme — die Art, die in einem typischen Sicherheitsaudit als "niedrige Priorität" markiert würde — und kombiniert sie zu vollständigen Angriffspfaden.

Eine kleine Informationsoffenlegung hier. Eine Race Condition dort. Eine etwas zu großzügige Dateiberechtigung woanders. Einzeln würde keines davon einen Alarm auslösen. Zusammen bilden sie eine vollständige Kill Chain vom Erstzugriff bis zur vollständigen Systemkompromittierung.

Genau so operieren raffinierte menschliche Angreifer. Sie verlassen sich nicht auf einzelne dramatische Exploits. Sie verketten kleine Schwächen. Und jetzt kann eine AI das autonom tun, schneller als jedes menschliche Team.

Die Frage, zu der ich immer wieder zurückkehre: Wenn Anthropics Modell das kann, wozu sind dann andere Modelle fähig — die, die ohne Anthropics Sicherheitsframework entwickelt werden? Wir kommen gleich auf diesen unbequemen Gedanken zurück.

Project Glasswing: Die 100-Millionen-Dollar-Wette auf Verteidigung

Anthropic tat etwas, das ich aufrichtig respektiere, mit der Mythos-Ankündigung. Sie hätten es öffentlich veröffentlichen können — stellen Sie sich die Presseberichterstattung vor, die Benchmark-Prahlrechte, die API-Einnahmen. Stattdessen betrachteten sie, was sie gebaut hatten, verstanden die Dual-Use-Implikationen und entschieden sich für Beschränkung.

Project Glasswing ist das Ergebnis. Angekündigt am 7. April 2026, ist es ein strukturiertes Bereitstellungsprogramm, das Mythos in die Hände von Verteidigern legt und es von der breiten Öffentlichkeit fernhält. Die Partnerliste liest sich wie ein Who's-who der Technologie-Infrastruktur:

Amazon (AWS) — Cloud-Infrastruktursicherheit
Apple — Geräte- und Ökosystemsicherheit
Broadcom — Halbleiter und Unternehmenssoftware
Cisco — Netzwerkinfrastruktur
CrowdStrike — Endpunktsicherheit und Bedrohungsintelligenz
Google — Cloud- und Verbraucherdienste
JPMorganChase — Finanzsystemsicherheit
Linux Foundation — Open-Source-Software-Lieferkette
Microsoft — Betriebssysteme und Cloud-Plattformen
Nvidia — GPU-Infrastruktur und AI-Systeme
Palo Alto Networks — Netzwerksicherheit

Das sind 12 Kernpartner, mit mehr als 40 weiteren Organisationen, die unter verschiedenen Beschränkungsstufen Zugang erhalten. Das Modell wird zum Scannen sowohl eigener als auch Open-Source-Softwaresysteme auf Code-Schwachstellen eingesetzt.

Das finanzielle Engagement ist beträchtlich. Anthropic stellt 100 Millionen Dollar an Nutzungskrediten für defensive Sicherheitsarbeit bereit. Zusätzlich 4 Millionen Dollar an direkten Spenden an Open-Source-Sicherheitsorganisationen — 2,5 Millionen Dollar an Alpha-Omega und OpenSSF über die Linux Foundation und 1,5 Millionen Dollar an die Apache Software Foundation.

Die 100 Millionen Dollar an Krediten sind keine Wohltätigkeit. Ein Modell dieser Größe gegen massive Codebases laufen zu lassen, kostet echte Rechenleistung. Aber das Signal, das es sendet, ist wichtig: Anthropic subventioniert die defensive Nutzung einer Fähigkeit, die enorm profitabel wäre, wenn sie an den Meistbietenden verkauft würde.

Es gibt auch eine Transparenzverpflichtung. Anthropic hat erklärt, dass sie innerhalb von 90 Tagen öffentlich die Erkenntnisse aus Project Glasswing teilen werden. Nicht die Schwachstellen selbst — das wäre unverantwortlich — sondern die Methodologien, Muster und defensiven Erkenntnisse, die sich aus dem Scannen von Produktionscode im großen Maßstab mit einem Modell dieses Kalibers ergeben.

Wenn Sie es vorziehen, dass ein professionelles Team die Sicherheitslage Ihres Unternehmens bewertet, während diese AI-Fähigkeiten reifen, arbeite ich mit xCyberSecurity an genau solchen Aufträgen — Schwachstellenbewertungen, Penetrationstests und Sicherheitsaudits, die die neue AI-Bedrohungslandschaft berücksichtigen.

Warum ich denke, dass dies die Gleichung für jeden Entwickler verändert

Hier möchte ich persönlich werden, denn diese Geschichte handelt nicht nur von Anthropic und ihren Partnern. Sie handelt von Ihnen und mir und jedem, der gerade Code schreibt.

Ich denke seit der Mythos-Ankündigung anders über meine eigenen Codebases nach. Nicht weil mein Code besonders ist — denn das ist er nicht. Sondern weil das Sicherheitsmodell, unter dem ich gearbeitet habe, das Modell, unter dem die meisten Entwickler arbeiten, gerade veraltet ist.

Dieses Modell funktioniert so: Sie schreiben Code, lassen Ihren Linter laufen, nutzen Dependabot, um bekannte Schwachstellen in Abhängigkeiten zu erkennen, zahlen vielleicht für ein statisches Analysetool wie Snyk oder SonarQube, und wenn Sie es ernst meinen, lassen Sie einmal im Jahr einen Penetrationstest durchführen. Sie akzeptieren ein gewisses Restrisiko, weil es theoretisch unmöglich ist, jede Schwachstelle zu finden.

Mythos hat gerade bewiesen, dass es nicht unmöglich ist. Es ist ein Rechenproblem.

Der 16 Jahre alte FFmpeg-Bug, der fünf Millionen automatisierte Tests überlebte? Er existierte, weil die Testtools den Code nicht verstanden — sie führten nur Eingaben aus und prüften Ausgaben. Mythos verstand den Code. Das ist die Verschiebung. Wir bewegen uns vom Testen zum Verstehen, und die Auswirkungen kaskadieren durch jede Schicht, wie wir über Softwaresicherheit denken.

Was dies für Solo-Entwickler bedeutet

Ihre Abhängigkeiten sind gerade zu Ihrer größten Schwachstelle geworden. Nicht neue Abhängigkeiten — die, die Sie seit Jahren haben und über die Sie nicht mehr nachdenken. Die ausgereiften, "kampferprobten" Bibliotheken, die jeder nutzt, weil sie schon ewig existieren. Genau dort findet Mythos Bugs, weil Langlebigkeit ein falsches Sicherheitsgefühl erzeugte.

Der praktische Rat: Achten Sie in den nächsten 90 Tagen auf Patches. Wenn Project Glasswing-Partner beginnen, kritische Open-Source-Infrastruktur zu scannen, erwarten Sie eine Welle von Sicherheitsupdates für Bibliotheken, die Sie bedenkenlos genutzt haben. Aktualisieren Sie aggressiv. Warten Sie nicht, bis Ihr Abhängigkeitsprüfer sie markiert.

Was dies für kleine Unternehmen bedeutet

Fortune-500-Unternehmen haben seit Jahrzehnten Zugang zu dedizierten Sicherheitsteams und teurer Tooling. Der Rest von uns hat sich mit automatisierten Scannern und Hoffnung beholfen. Der Open-Source-Fokus von Project Glasswing bedeutet, dass ein Teil dieser Fortune-500-Qualitätsprüfung bald den Software-Stack erreicht, auf dem Sie aufbauen — kostenlos.

Aber die Schwachstellenoffenlegungen werden schnell kommen. Wenn Sie WordPress, WooCommerce oder eine andere auf Open-Source-Grundlagen aufgebaute Anwendung betreiben, brauchen Sie eine Patching-Strategie, die in Tagen reagieren kann, nicht in Wochen. Das Fenster zwischen Offenlegung und Ausnutzung wird sich dramatisch verkleinern, weil Angreifer ebenfalls ihre eigenen AI-Fähigkeiten aufbauen.

Was dies bedeutet, wenn Sie AI-Systeme bauen

Das ist der Punkt, der mich nachts wach hält. Wenn ein auf Codierung fokussiertes AI-Modell versehentlich Cybersecurity-Fähigkeiten entwickelt hat, was passiert, wenn die nächste Generation von Modellen noch besser im Programmieren ist? Die Fähigkeitskurve verlangsamt sich nicht. Opus 4.6 zu Mythos repräsentiert einen 13-Punkte-Sprung auf SWE-bench. Wie sieht das Modell nach Mythos aus?

Jedes AI-System, das ich baue, jeder Agent, den ich einsetze — ich denke jetzt darüber nach, was passiert, wenn etwas mit Mythos-Level-Fähigkeit es auf Schwächen untersucht. Mein Leitfaden zur Absicherung von AI-Agents behandelte Hardware-Isolation, VM-Containment und Netzwerksegmentierung. Diese Prinzipien halten stand. Aber das Bedrohungsmodell ist gerade anspruchsvoller geworden.

Die unbequemen Fragen, die niemand stellt

Ich möchte Anthropic hier gegenüber fair sein. Sie haben dies besser gehandhabt als jedes Unternehmen eine Dual-Use-AI-Fähigkeitsentdeckung gehandhabt hat. Die eingeschränkte Veröffentlichung, das Partnerprogramm, das finanzielle Engagement für Verteidigung, die Transparenz-Timeline — es ist eine Vorlage, der andere Unternehmen folgen sollten.

Aber es gibt Fragen, die der optimistische Rahmen nicht beantwortet.

Erstens: das Geist-aus-der-Flasche-Problem. Anthropic hat Mythos nicht für Cybersecurity trainiert. Die Fähigkeit entstand aus dem Training eines besseren Codierungsmodells. Das bedeutet, dass jedes AI-Labor, das die Grenzen der Codegenerierung verschiebt, potenziell dieselbe Fähigkeit erschafft, ob sie es realisieren oder nicht. Das nächste Modell von OpenAI. Die nächste Gemini-Iteration von Google. Die nächste Open-Source-Veröffentlichung von Meta. Wenn großartigen Code zu schreiben und großartige Exploits zu finden zwei Seiten derselben Medaille sind, dann wird sich diese Fähigkeit unabhängig davon verbreiten, was Anthropic tut.

Zweitens: das 12-24-Monate-Fenster. Forscher, denen ich folge, schätzen, dass kleinere, Open-Source-Modelle innerhalb von 12 bis 24 Monaten Mythos-Level-Cybersecurity-Fähigkeiten erreichen werden. Das ist kein Leak-Problem — es ist eine natürliche Fähigkeitsprogression. Wenn das passiert, wird das Modell des "eingeschränkten Zugangs" irrelevant. Man kann eine Fähigkeit nicht abschotten, die aus allgemeinem Training entsteht.

Drittens: die Asymmetriefrage. Project Glasswing gibt Verteidigern einen Vorsprung. Aber wie lang ist dieser Vorsprung? Wenn ein gut finanzierter Angreifer ein Open-Source-Modell auf Exploit-Daten feinabstimmt und auch nur 70% von Mythos' Fähigkeit erreicht, verengt sich die Asymmetrie zwischen Angriff und Verteidigung schnell. Verteidigung erfordert das Finden und Beheben jeder Schwachstelle. Angriff erfordert das Finden von einer.

Viertens: Was ist mit den Schwachstellen, die Mythos gefunden hat, aber noch nicht offengelegt wurden? Anthropic sagt "Tausende von Zero-Day-Schwachstellen, viele davon kritisch" — in "jedem großen Betriebssystem und jedem großen Webbrowser." Das sind Tausende von unbehobenen Sicherheitslücken, auf denen Anthropic und seine Partner derzeit sitzen und durch verantwortungsvolle Offenlegung arbeiten. Der Offenlegungsprozess braucht Zeit. Patches brauchen Zeit. Bereitstellung braucht Zeit. In diesem Fenster existieren diese Schwachstellen. Jeder, der sie unabhängig entdeckt — Mensch oder AI — könnte sie ausnutzen.

Dies sind keine Argumente gegen das, was Anthropic tut. Es sind Argumente für Dringlichkeit. Das Verteidigungsfenster ist jetzt offen, und es bleibt nicht für immer offen.

Was passiert, wenn dies nach unten durchsickert

Die interessanteste Langzeitgeschichte handelt nicht von Mythos selbst — sie handelt davon, was passiert, wenn diese Fähigkeiten für jeden zugänglich werden. Und basierend auf der Entwicklungstrajektorie von AI ist das eine Frage des Wann, nicht des Ob.

Hier ist, was ich in den nächsten 12 bis 18 Monaten erwarte:

AI-gestützte Schwachstellen-Scan-Tools werden Mainstream. Nicht auf Mythos-Niveau, aber bedeutend besser als aktuelle statische Analyse. Unternehmen wie Snyk, Veracode und SonarQube bauen mit ziemlicher Sicherheit gerade AI-gesteuerte Scan-Funktionen. Die Messlatte für "ausreichend gute" Sicherheitstools wird dramatisch steigen.

Das Open-Source-Sicherheitsökosystem wird beispiellose Aufmerksamkeit erhalten. Die Linux Foundation, Apache Software Foundation und andere Organisationen, die Glasswing-Finanzierung und -Zugang erhalten, werden ihre kritischsten Projekte mit Mythos-Level-Fähigkeit scannen. Erwarten Sie eine Flut von Patches — und ein deutlich sichereres Open-Source-Fundament als Ergebnis.

Die Ökonomie von Bug Bounties wird sich verschieben. Wenn eine AI Schwachstellen schneller und umfassender finden kann als menschliche Forscher, ändert sich das Wertversprechen traditioneller Bug-Bounty-Programme. Ich glaube nicht, dass menschliche Sicherheitsforscher überflüssig werden — Kontext, Urteilsvermögen und kreative Ausnutzung zählen weiterhin — aber die niedrig hängenden Früchte, die vielen Bounty-Jägern die Rechnungen bezahlen, werden zuerst von Maschinen gepflückt.

Compliance-Frameworks werden sich anpassen. Wenn AI-gestützte Schwachstellenerkennung zum Sorgfaltsstandard wird, wird das Nicht-Nutzen zur Fahrlässigkeit. Es würde mich nicht überraschen, innerhalb von 18 Monaten aktualisierte HIPAA-, SOC-2- und PCI-DSS-Richtlinien zu sehen, die AI-unterstütztes Sicherheits-Scanning ausdrücklich als Basiserwartung adressieren.

Die "Shift Left"-Bewegung bekommt einen Turbo. Statt Schwachstellen nach dem Deployment zu finden, werden AI-Modelle sie während des Code-Reviews abfangen — bevor der Code jemals die Produktion erreicht. Stellen Sie sich ein Pull-Request-Review vor, das nicht nur Stilprobleme und Testabdeckungslücken erkennt, sondern tatsächliche Zero-Day-Klasse-Schwachstellen in Ihrer Implementierung. Dorthin führt der Weg.

Meine ehrliche Meinung: Zwischen Ehrfurcht und Unruhe

Ich baue seit über einem Jahr mit Anthropics Modellen. Claude Code veränderte, wie ich arbeite. Opus 4.6 veränderte, was ich für möglich hielt. Mythos verändert etwas Grundlegenderes — es verändert, was ich über die Beziehung zwischen AI-Fähigkeit und AI-Risiko denke.

Anthropic's Responsible Scaling Policy wird hier ernsthaft auf die Probe gestellt. Sie identifizierten eine Fähigkeit, die echtes offensives Risiko birgt, wählten Einschränkung statt Einnahmen, bauten eine Koalition von Verteidigern, stellten bedeutende Ressourcen für defensive Nutzung bereit und legten Transparenz-Timelines fest. Das ist das Drehbuch. So sieht verantwortungsvolle AI-Bereitstellung aus, wenn es wirklich darauf ankommt.

Aber ich bin auch ehrlich genug zuzugeben, dass die Mythos-Geschichte mich auf eine Weise nervös macht, die frühere Modell-Veröffentlichungen nicht taten. Nicht weil Anthropic etwas falsch macht — ganz im Gegenteil. Weil sie demonstriert haben, dass Codierungsfähigkeit und Hacking-Fähigkeit bei ausreichender Skalierung dasselbe sind. Und Codierungsfähigkeit ist das, was jedes AI-Labor auf der Erde zu verbessern versucht.

Die Verteidiger haben einen Vorsprung. Project Glasswing gibt kritischen Infrastrukturorganisationen Zugang zum Scannen und Patchen, bevor Angreifer gleichwertige Tools bauen können. Die 100 Millionen Dollar an Krediten, die 4 Millionen Dollar an Open-Source-Spenden, die Koalition von mehr als 40 Organisationen — es ist substanziell.

Aber Vorsprünge haben ein Verfallsdatum.

Die praktische Erkenntnis für Menschen wie uns — Entwickler, Erbauer, Menschen, die Software in die Welt schicken — ist einfach. Aktualisieren Sie Ihre Abhängigkeiten. Achten Sie auf die Welle von Patches in den nächsten 90 Tagen. Nehmen Sie Ihre Sicherheitslage ernster als gestern. Und beginnen Sie darüber nachzudenken, wie Ihre Codebasis durch die Augen von etwas aussieht, das Bugs finden kann, die fünf Millionen automatisierte Tests übersehen haben.

Das Zeitalter der AI-gestützten Schwachstellenerkennung ist angebrochen. Was Sie in den nächsten Monaten tun — solange die Verteidiger noch den Vorteil haben — bestimmt, ob Sie geschützt sind, wenn das Spielfeld sich angleicht.

Ich werde die Glasswing-Offenlegungen genau verfolgen und darüber schreiben, was sich ergibt. Wenn Sie der Entwicklung voraus sein wollen, ist dies das Thema zum Verfolgen.

Häufig gestellte Fragen

Was ist Claude Mythos und wie unterscheidet es sich von Claude Opus 4.6?

Claude Mythos ist Anthropics unveröffentlichtes Frontier-AI-Modell, das 93,9% auf SWE-bench Verified erzielt, verglichen mit 80,8% von Opus 4.6. Es wurde für außergewöhnliche Codegenerierung trainiert, was ihm emergente Cybersecurity-Fähigkeiten verlieh — mit einem Score von 83,1% auf dem CyberGym-Schwachstellen-Benchmark gegenüber 66,6% von Opus 4.6. Mythos ist nicht öffentlich verfügbar und ist auf Project Glasswing-Partner beschränkt.

Was ist Project Glasswing?

Project Glasswing ist Anthropics Cybersecurity-Initiative, die 12 Kernpartnern — darunter AWS, Apple, Microsoft, Google und CrowdStrike — frühzeitigen Zugang zu Claude Mythos für defensive Sicherheitsarbeit gewährt. Unterstützt durch 100 Millionen Dollar an Nutzungskrediten und 4 Millionen Dollar an Open-Source-Sicherheitsspenden, konzentriert sich das Programm auf das Finden und Patchen von Schwachstellen in kritischer Software-Infrastruktur. Mehr zu AI-Sicherheitspraktiken finden Sie in meinem Leitfaden zur Absicherung von AI-Agents.

Kann Claude Mythos wirklich Bugs finden, die menschliche Sicherheitsforscher übersehen?

Ja — und die Beweise sind spezifisch. Mythos entdeckte autonom eine 27 Jahre alte Remote-Crash-Schwachstelle in OpenBSDs TCP-Stack und einen 16 Jahre alten Bug in FFmpeg, der fünf Millionen automatisierte Tests überlebte. Anthropic berichtet von Tausenden gefundener Zero-Day-Schwachstellen in großen Betriebssystemen und Browsern, viele mit kritischem Schweregrad.

Wird Claude Mythos der Öffentlichkeit zugänglich sein?

Anthropic hat erklärt, dass sie nicht planen, Mythos Preview allgemein verfügbar zu machen. Das Modell ist auf Project Glasswing-Partner und etwa 40 weitere Organisationen unter kontrolliertem Zugang beschränkt. Anthropics Ziel ist es, Schutzmaßnahmen zu entwickeln, die es ermöglichen, Mythos-Klasse-Fähigkeiten schließlich breiter und sicherer einzusetzen.

Wie betrifft Claude Mythos alltägliche Entwickler?

Erwarten Sie eine bedeutende Welle von Sicherheitspatches für beliebte Open-Source-Bibliotheken in den nächsten 90 Tagen, wenn Glasswing-Partner kritische Infrastruktur scannen. Aktualisieren Sie Ihre Abhängigkeiten aggressiv, verschärfen Sie Ihre Patch-Frequenz und erkennen Sie an, dass AI-gestütztes Schwachstellen-Scanning zur neuen Basislinie für Softwaresicherheit wird — kein optionales Premium-Feature.

Lassen Sie uns zusammenarbeiten

Sie möchten AI-Systeme bauen, Workflows automatisieren oder Ihre technische Infrastruktur skalieren? Ich helfe gerne.

Fiverr (Maßanfertigungen & Integrationen): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (Enterprise-Lösungen): ramlit.com
ColorPark (Design & Branding): colorpark.io
xCyberSecurity (Sicherheitsdienste): xcybersecurity.io