Le Mythos d'Anthropic a ciblé curl. Le battage n'a pas survécu

Le Mythos d'Anthropic a ciblé curl. Le battage n'a pas survécu.

J'en étais à la moitié de mon deuxième café le 11 mai quand l'article de blog de Daniel Stenberg est apparu dans mon fil d'actualité. Le titre était "Mythos finds a curl vulnerability." Ça semblait assez direct. J'ai cliqué, commencé à lire, et en deux paragraphes, j'ai réalisé que l'article faisait quelque chose de bien plus intéressant que ce que son titre suggérait.

C'était un démontage poli, méthodique et glacial de l'une des annonces d'IA les plus agressivement promues de 2026.

Pour contexte, Anthropic a passé le mois d'avril à construire l'un des récits de sécurité les plus bruyants de l'année. Project Glasswing. Claude Mythos Preview. "Les jours des zero-days sont comptés." "Les défenseurs ont enfin une chance de gagner de manière décisive." Un engagement de 100M$ en crédits de modèle. Des listes de partenaires qui ressemblaient à un who's who du logiciel critique. J'ai couvert le lancement et le débat sous-jacent dans mon analyse de la découverte de zero-days par l'IA et l'article sur l'impact de Claude Mythos sur la cybersécurité. Le cadrage était sans ambiguïté : Anthropic avait construit quelque chose de si capable de trouver des failles logicielles qu'il ne pouvait pas être mis à la disposition du public.

Puis ils l'ont pointé vers curl. La base de code C la plus auditée du web ouvert. Maintenue par un gars qui a passé les dix-huit derniers mois à détruire publiquement les rapports de sécurité IA pour être de la camelote.

Le résultat ? Mythos a livré cinq "vulnérabilités de sécurité confirmées." L'équipe de Stenberg en a confirmé une. Un bug de faible sévérité. Corrigé dans curl 8.21.0, prévu pour fin juin.

C'est le point de données que le communiqué de presse n'a pas inclus. Et c'est celui qui mérite d'être assimilé — parce que si vous construisez des logiciels professionnellement, exécutez des agents en production ou vous souciez de savoir où en est réellement la sécurité assistée par l'IA maintenant (pas ce que dit la présentation), l'épisode curl vient de vous donner une lecture propre et bien instrumentée de la vérité.

Permettez-moi de parcourir ce qui s'est réellement passé, ce que cela signifie, et pourquoi je pense que ce seul CVE de faible sévérité compte plus que le communiqué de presse qui l'a entouré.

Ce qu'Anthropic a réellement promis avec Mythos

Avant d'arriver aux données de curl, les affirmations marketing comptent — parce que l'écart entre elles et le résultat est toute l'histoire.

Anthropic a annoncé le Project Glasswing le 7 avril 2026. Le titre était Claude Mythos Preview, décrit comme "un modèle de frontière à usage général, non publié" qui avait atteint "un niveau de capacité de codage où ils peuvent surpasser tous sauf les humains les plus qualifiés pour trouver et exploiter des vulnérabilités logicielles." Ce sont les mots d'Anthropic, pas les miens.

Les preuves à l'appui étaient frappantes. Mythos avait supposément identifié des milliers de vulnérabilités de haute sévérité dans les principaux systèmes d'exploitation et navigateurs web. Le cas de démonstration qui a reçu le plus de couverture : Mythos a trouvé et exploité de manière autonome une faille d'exécution de code à distance vieille de 17 ans dans FreeBSD qui donnait un accès root à toute machine exécutant NFS — classée CVE-2026-4747. Anthropic a également revendiqué un taux de réussite de 83,1 % sur CyberGym, un benchmark qui mesure la découverte autonome de CVEs réels dans de vraies bases de code. Le meilleur modèle précédent était à 66,6 %.

Jusqu'ici, impressionnant. Puis sont venues les affirmations marketing qui ont fait plisser les yeux de chaque chercheur en sécurité que je suis devant son écran.

"Les jours des zero-days sont comptés."

"Les défenseurs ont enfin une chance de gagner de manière décisive."

C'est le cadrage qu'Anthropic a choisi. Pas "c'est un nouvel outil utile." Pas "l'analyse de code assistée par l'IA vient de s'améliorer significativement." Un changement catégorique dans la cyberoffensive et la cyberdéfense. Une nouvelle ère. Une arme si puissante qu'Anthropic a refusé de la mettre à la disposition du public — distribuant plutôt l'accès via le Project Glasswing à un petit groupe de partenaires, avec la Linux Foundation comme intermédiaire pour certains mainteneurs open source.

Le positionnement stratégique était net. Capacité si dangereuse qu'elle ne peut pas être ouverte. Capacité si nécessaire qu'elle doit être déployée. Faites-nous confiance pour les contrôles.

Je suis dans ce domaine depuis assez longtemps pour reconnaître quand une entreprise fait un vrai geste de sécurité versus quand elle fait un geste de positionnement. Les deux peuvent être vrais en même temps. Mais le test de celui qui domine est toujours le même : que se passe-t-il quand la capacité rencontre un benchmark sérieux dans le monde réel, face à quelqu'un qui ne peut pas être flatté.

Ce test est arrivé le 6 mai 2026. Le benchmark était curl. Le quelqu'un était Daniel Stenberg.

Pourquoi curl est le test parfait (et le pire pour le marketing)

Si vous vouliez préparer Mythos à l'échec, vous le pointeriez vers curl. Si vous vouliez le préparer à réussir honnêtement, vous le pointeriez aussi vers curl. La même réponse dans les deux cas — parce que curl est l'environnement de test le plus propre possible pour un scanner de vulnérabilités IA, et cette propreté coupe dans les deux sens.

Voici pourquoi.

Curl représente environ 178 000 lignes de C maintenues par une communauté de 573 contributeurs sur plus de deux décennies. Il tourne sur plus de 110 systèmes d'exploitation et 28 architectures CPU. Il est installé sur plus de 20 milliards d'appareils — téléphones, tablettes, voitures, téléviseurs, consoles de jeux, serveurs, systèmes embarqués dont vous ne soupçonnez même pas l'existence. Si votre logiciel communique avec internet, curl est probablement quelque part dans votre stack.

Cela seul en fait une cible de haute valeur. Mais la partie qui compte pour cette conversation est la posture de sécurité. Curl a publié 188 CVEs au cours de sa vie, avec environ ~50 nouvelles vulnérabilités attendues pour être divulguées en 2026. Ce n'est pas un signe que la base de code est négligée. C'est un signe que la base de code est examinée. Chaque CVE représente une vulnérabilité qui a été trouvée et corrigée avant d'être exploitée, ce qui est exactement le cycle que vous voulez d'un projet critique pour la sécurité.

L'infrastructure défensive à l'intérieur de curl est, selon tout standard raisonnable, de classe mondiale. Tampons dynamiques plafonnés. Application explicite de valeurs maximales dans l'analyse numérique. Gardes contre les dépassements. Application de format de chaînes qui élimine systématiquement des classes entières de bugs. Fuzzing continu. Analyse statique. Couverture de régression automatisée. Et — de manière cruciale pour cette histoire — un vaste historique d'analyse de sécurité assistée par l'IA avec des outils antérieurs.

Stenberg lui-même a été remarquablement transparent à ce sujet. Dans son article de blog du 22 avril 2026 "High-Quality Chaos," il notait que les rapports assistés par l'IA avaient finalement passé le cap, d'être principalement de la camelote à être significativement utiles. Il a nommé les outils qui apportaient du signal réel : AISLE, Zeropath et OpenAI Codex Security. Entre eux, ces outils IA de génération précédente avaient déclenché entre deux cents et trois cents corrections de bugs intégrées à curl au cours des 8 à 10 mois précédents.

Relisez cette phrase. Avant que Mythos ne scanne curl, des outils IA de génération précédente avaient déjà poussé des centaines de corrections dans la base de code. Les bugs faciles — le genre qui apparaît avec la correspondance basique de motifs, le genre que les fuzzers trouvent en quelques milliers d'itérations, le genre que n'importe quel "scanner de sécurité IA" peut attraper en démonstration — étaient déjà partis. Ce qui restait était la couche difficile : de vrais bugs cachés dans des chemins de code subtils, des cas limites profonds, des préconditions en plusieurs étapes.

C'est exactement la surface où un modèle catégoriquement meilleur devrait surpasser les autres. Si Mythos représente vraiment un changement radical dans la recherche de vulnérabilités — du genre qui justifie le cadrage "les jours des zero-days sont comptés" — curl est précisément là où vous vous attendriez à le voir le prouver.

Alors, qu'est-ce que le test a produit ?

Le rapport réel de Mythos : cinq rapports, un vrai bug

L'article de blog de Stenberg parcourt le rapport qu'il a reçu. Il vaut la peine de noter : Stenberg n'a jamais eu d'accès direct à Mythos. Anthropic lui avait promis un accès via le Project Glasswing par l'intermédiaire de la Linux Foundation. Cet accès ne s'est jamais matérialisé. Au lieu de cela, quelqu'un d'autre avec des identifiants Mythos l'a exécuté contre le dépôt curl et a envoyé la sortie par e-mail à Stenberg.

Le rapport contenait cinq résultats, chacun étiqueté par Mythos comme une "vulnérabilité de sécurité confirmée."

L'équipe de sécurité de sept personnes de Stenberg les a tous examinés. Voici le détail de ce qui a survécu au contact avec des personnes qui connaissent réellement la base de code :

Résultat	Verdict de Mythos	Verdict de l'équipe curl
Problème 1	Vulnérabilité confirmée	Vulnérabilité de faible sévérité — CVE dans 8.21.0
Problème 2	Vulnérabilité confirmée	Faux positif — comportement documenté de l'API
Problème 3	Vulnérabilité confirmée	Faux positif — comportement documenté de l'API
Problème 4	Vulnérabilité confirmée	Faux positif — comportement documenté de l'API
Problème 5	Vulnérabilité confirmée	Bug, mais pas un problème de sécurité

Une sur cinq. Un taux de vrais positifs de 20 % sur l'étiquette la plus importante que Mythos a appliquée. Et celle qui a survécu est en cours de correction en tant que CVE de faible sévérité dans curl 8.21.0, prévu pour fin juin.

Permettez-moi d'être précis sur ce que "faible sévérité" signifie dans le cadre CVSS de curl, parce que le mot peut paraître plus doux qu'il ne devrait. Faible sévérité à l'échelle de curl signifie toujours un vrai bug, une vraie divulgation, un vrai cycle de correctifs et une vraie mise à jour coordonnée sur des milliards d'appareils. Ce n'est pas rien. Ce n'est pas non plus le genre de découverte qui justifie la rhétorique "les défenseurs ont enfin une chance de gagner de manière décisive."

Les résultats auxiliaires sont légèrement plus intéressants. Au-delà des cinq "vulnérabilités de sécurité," Mythos a également signalé environ 20 bugs mineurs dans la base de code. La plupart d'entre eux ont tenu bon sous examen. Ce n'étaient pas des problèmes de sécurité, mais c'étaient de vrais bugs — des résultats de qualité de code que l'équipe curl a commencé à traiter. C'est une production véritablement utile. C'est aussi exactement ce qu'un LLM compétent de revue de code est capable de produire depuis au moins un an, et ce que des outils comme AISLE et Zeropath livrent déjà à grande échelle.

La conclusion de Stenberg, dans ses propres mots : "Ma conclusion personnelle ne peut aboutir à rien d'autre que le grand battage autour de ce modèle jusqu'à présent était principalement du marketing." Et : "Je ne vois aucune preuve que cette configuration trouve des problèmes à un niveau particulièrement plus élevé ou plus avancé que les autres outils ne l'avaient fait avant Mythos."

Ce n'est pas un coup en passant. C'est un mainteneur open source de plusieurs décennies qui gère l'un des pipelines de sécurité les plus sollicités d'internet, affirmant calmement que le modèle de sécurité IA le plus médiatisé de 2026 n'a pas surpassé les outils qui étaient déjà disponibles.

Si vous construisez avec l'IA en ce moment — agents, automatisations, outils de sécurité, quoi que ce soit — ce point de données vaut plus que l'ensemble du communiqué de presse qui l'a entouré. Permettez-moi d'expliquer pourquoi.

Ce que cela nous dit sur où en est réellement la sécurité avec l'IA

Je veux parcourir ce que je pense que l'épisode curl prouve réellement, parce que ce n'est pas la lecture simple "Mythos est un échec" que certains commentateurs propagent.

Trois choses sont vraies en même temps. Aucune d'entre elles n'est confortable pour la position maximaliste ni pour la minimaliste.

Premièrement : Mythos est réel, fonctionne et est significativement capable. Un modèle qui scanne une base de code C de 178 000 lignes maintenue par 573 contributeurs et trouve un vrai CVE plus 20 bugs mineurs en une seule passe, ce n'est pas rien. C'est un résultat non trivial contre une base de code qui a été martelée par chaque fuzzer, analyseur statique et outil de sécurité IA actuellement en production. Le signal est réel. La production est utile.

Deuxièmement : Mythos n'est pas le saut catégorique que le marketing a affirmé. Le taux de vrais positifs de 20 % sur son étiquette de plus haute confiance, combiné au fait que des outils IA de génération précédente poussaient déjà des centaines de corrections de bugs à travers curl, fait que le cadrage "les jours des zero-days sont comptés" sonne comme du texte publicitaire plutôt que comme une réalité technique. Mythos semble être une amélioration modérée par rapport aux outils déjà déployés, pas un changement de paradigme.

Troisièmement : l'écart entre (1) et (2) est le fait le plus important dans toute la narrative de sécurité IA de 2026. C'est l'écart où chaque exagération, chaque politique d'accès restreint, chaque cycle de marketing de la peur réside. Et l'écart se referme — mais pas dans la direction que le marketing suggère. La réalité, ce sont des outils modérément utiles, utilisés par des humains expérimentés, produisant des gains incrémentaux en sécurité. Le marketing continue d'insister sur la révolution.

Je serai honnête. Je m'attendais à arriver à un endroit différent quand j'ai commencé à écrire cet article. Le récit d'Anthropic est internement cohérent. La démo FreeBSD était frappante. Les chiffres de CyberGym, pris au pied de la lettre, sont impressionnants. En entrant dans la recherche, je m'attendais à moitié à trouver que Stenberg était trop dur, ou que le test curl était un scénario injuste, ou que le taux de faux positifs s'adoucirait sous une lecture plus attentive.

Ce ne fut pas le cas. Les chiffres sont ce qu'ils sont. Une sur cinq sur l'étiquette de sécurité. Vingt bugs mineurs avec une précision acceptable. Zéro découvertes avancées que les outils précédents n'avaient pas détectées. Contre la base de code C open source la plus extensivement préanalysée de la planète, Mythos a performé comme une version modérément meilleure de ce qui était déjà en production.

Cela se connecte directement à un cadre auquel je reviens sans cesse : le problème de calibration entre battage et réalité dans l'IA sur lequel j'ai déjà écrit. Les affirmations marketing voyagent à la vitesse d'internet. La vérification voyage à la vitesse humaine. La fenêtre entre le lancement et la vérification est exactement là où le récit est façonné — et au moment où la vérification arrive, le récit original a souvent déjà été intégré par les marchés, la presse et la conversation politique.

Ce n'est pas une position anti-IA. J'exécute des agents IA en production quotidiennement. Je parie mon propre temps et mon argent sur ces outils. Mais parier intelligemment nécessite de la calibration, et la calibration nécessite d'observer ce qui se passe quand les affirmations de capacité rencontrent le monde réel.

Le test curl est le monde réel. Le score est un bug de faible sévérité.

La courbe de maturité : de camelote IA à utile, en deux ans

Il y a un arc plus long ici qui mérite qu'on zoome dessus, parce que l'épisode curl n'est pas un instantané d'une seule image — c'est une image dans une séquence qui a commencé il y a deux ans et continue d'évoluer.

Regardez la chronologie :

2 janvier 2024. Daniel Stenberg publie "The I in LLM stands for Intelligence." Il y décrit l'inondation de rapports de bugs générés par l'IA de faible qualité arrivant au programme HackerOne de curl. Vers mi-2025, il estimait qu'environ 20 % des soumissions au programme de bug bounty de curl étaient ce qu'il appelait de la "camelote IA" — des rapports qui sonnaient technique mais ne contenaient rien d'utile. Le taux de rapports précis est tombé à environ un sur 20 ou un sur 30, et le tri épuisait la bande passante de l'équipe de sécurité de sept personnes.

26 janvier 2026. Curl a annoncé la fin de son programme payant de bug bounty. La raison citée : la camelote générée par l'IA avait fait effondrer les mathématiques coût-bénéfice. Un programme de récompenses conçu pour récompenser les divulgations utiles était devenu un aimant pour des soumissions de faible effort et de haut volume assistées par l'IA. Curl n'était pas le seul projet touché — Nextcloud et plusieurs autres ont pris des mesures similaires à la même période. L'écosystème de sécurité open source était submergé par des rapports générés par l'IA.

22 avril 2026. Stenberg publie "High-Quality Chaos." Le changement de ton est réel. Il note que les rapports assistés par l'IA — quand ils sont exécutés par des ingénieurs expérimentés, pas par des soumetteurs anonymes de bounties — livrent maintenant un signal véritable. Des outils comme AISLE, Zeropath et OpenAI Codex Security ont collectivement poussé des centaines de corrections dans curl. L'IA a franchi le seuil de négatif net à positif net dans l'écosystème curl.

6 mai 2026. Curl reçoit le rapport Mythos. Cinq résultats. Un seul survit à l'examen.

Fin juin 2026 (prévu). Curl 8.21.0 est publié avec le correctif pour le seul résultat confirmé de Mythos.

Cet arc de deux ans est la vraie histoire. Les outils de sécurité IA ont commencé comme une nuisance, sont devenus modestement utiles, et s'améliorent maintenant de manière incrémentale — trimestre après trimestre, version de modèle après version de modèle, chaque génération légèrement plus précise que la précédente. Mythos est le dernier point de données sur cette courbe, pas une discontinuité par rapport à elle.

Je pense que cet arc est le cadrage le plus important pour tout développeur essayant de décider où placer ses paris maintenant. La courbe de maturité est réelle. Elle pointe dans une direction utile. Mais elle n'est pas verticale. Elle n'est même pas particulièrement raide. C'est une courbe de capacité normale, un peu plus rapide que d'habitude, dans un domaine qui a été survendu depuis au moins trois ans.

Note en marge — j'ai testé cette hypothèse sur ma propre infrastructure le week-end dernier. J'ai exécuté une revue de sécurité assistée par l'IA sur une base de code Laravel de taille moyenne que je maintiens pour un client. Les résultats étaient utiles. Certains étaient déjà dans notre backlog. Quelques-uns étaient véritablement nouveaux. Aucun ne justifiait de réécrire la stratégie de sécurité. Cette expérience correspond exactement à ce que l'équipe curl rapporte. Outil utile. Pas une révolution. Combinez-le avec des humains expérimentés et il fait ses preuves. Donnez-lui le volant et il vous fera perdre votre temps.

Le problème d'équité de Project Glasswing dont personne ne veut parler

Il y a une partie de cette histoire que les analyses techniques continuent de passer, et je veux y consacrer du temps parce que je pense que c'est le problème le plus conséquent à long terme.

Mythos a un accès restreint. Le modèle n'est pas disponible de manière générale. L'accès est contrôlé via le Project Glasswing, avec une liste de partenaires sélectionnés et la Linux Foundation servant d'intermédiaire pour un petit ensemble de projets open source. Le cadrage d'Anthropic est que le modèle est trop dangereux pour être largement diffusé, donc ils le dirigent vers un usage défensif avec des partenaires de confiance et s'engagent à hauteur de 100M$ en crédits de modèle pour le rendre économiquement viable pour ces partenaires.

Prenez ce cadrage au pied de la lettre un instant. La conséquence structurelle est la même quelle que soit l'intention : un petit nombre d'organisations obtient un accès anticipé au meilleur modèle de détection de vulnérabilités disponible, et le reste du monde non.

Ajoutez maintenant deux faits.

Fait un : Stenberg, le mainteneur de l'une des pièces d'infrastructure open source les plus critiques pour la sécurité sur internet, s'est vu promettre l'accès à Mythos via Glasswing et ne l'a jamais obtenu. Il a dû attendre que quelqu'un d'autre exécute le modèle et lui envoie le rapport par e-mail. Si curl est trop petit pour franchir la barrière d'accès, qu'est-ce que cela dit de la longue traîne des projets open source moins célèbres ? Les 90 % des dépendances sous votre application qui n'ont pas un mainteneur avec un nom reconnaissable ?

Fait deux : la propre évaluation interne d'Anthropic, divulguée dans la fuite du document Claude Mythos plus tôt cette année, décrivait le modèle comme faisant pencher l'équilibre offense-défense en faveur de l'offense. Leurs mots, pas les miens. Le modèle est un multiplicateur de force pour celui qui le détient. Restreindre l'accès par la confiance et la curation signifie que les défenseurs avec accès obtiennent le multiplicateur ; les défenseurs sans accès, non.

Où cela atterrit en pratique : les organisations bien financées avec les bonnes relations sont protégées. Tous les autres doivent espérer que le modèle de niveau public arrive avant qu'un attaquant avec une capacité comparable ne le fasse. Ce n'est pas une préoccupation hypothétique — c'est le même problème d'asymétrie d'accès qui est une caractéristique de l'industrie de la cybersécurité depuis des décennies, sauf que maintenant l'asymétrie se situe au niveau du modèle plutôt qu'au niveau des outils.

Je ne soutiens pas qu'Anthropic a pris la mauvaise décision. Le problème du double usage est réel. Un Mythos largement diffusé finirait absolument entre les mains d'attaquants, et l'argument de sécurité pour un déploiement par étapes a du mérite. Mais il y a un coût réel à cette approche, et ce coût est supporté de manière disproportionnée par les acteurs plus petits de l'écosystème de sécurité — les mainteneurs, les chercheurs en sécurité indépendants, les projets open source qui n'ont pas le poids institutionnel pour figurer sur une liste de partenaires Glasswing.

Si le cadrage marketing était honnête, il reconnaîtrait ce coût. "Les jours des zero-days sont comptés" deviendrait "les jours des zero-days sont comptés pour nos partenaires ; le reste d'entre vous doit encore se débrouiller." C'est un titre moins impressionnant. C'est aussi plus proche de ce qui se passe réellement.

Ce que cela signifie pour comment vous utilisez l'IA dans votre propre travail de sécurité

Permettez-moi de revenir à la question pratique, parce que si vous lisez ceci, vous avez probablement des outils IA quelque part dans votre stack de sécurité — ou vous y réfléchissez. L'épisode curl a des implications spécifiques pour comment bien utiliser ces outils.

Voici le cadre avec lequel je travaille maintenant, basé sur ce que les données curl nous disent.

Utilisez l'IA comme multiplicateur de force de l'ingénieur expérimenté, pas comme remplacement. L'équipe curl a obtenu une production utile de Mythos parce qu'elle disposait d'une équipe de sécurité de sept personnes capable de filtrer cinq résultats jusqu'à une vérité. Sans cette couche de tri, les cinq résultats auraient été traités comme réels (gaspillant l'effort en aval) ou les cinq auraient été écartés (manquant le seul vrai bug). La couche de tri est la valeur. L'IA sans revue d'expert est de la camelote. La revue d'expert sans IA est plus lente que nécessaire. Ensemble, c'est l'état de l'art actuel.

Attendez-vous à un taux de vrais positifs de 15-25 % sur les problèmes de sécurité signalés par tout outil IA actuel. C'est à peu près là où Mythos a atterri contre curl, et c'est cohérent avec ce que j'ai vu des scanners de sécurité de type Codex dans le travail client. Planifiez votre pipeline de revue autour de cette proportion. Si votre équipe ne peut pas se permettre de trier quatre faux positifs pour chaque vrai résultat, les outils de sécurité IA vous coûteront plus de temps qu'ils n'en économisent.

Traitez les étiquettes de sévérité des outils IA comme des suggestions, pas des classifications. Mythos a étiqueté les cinq résultats curl comme des vulnérabilités de sécurité confirmées. L'assignation réelle de sévérité par l'équipe curl pour le seul vrai résultat était faible. C'est une dégradation en plusieurs étapes — de "vulnérabilité de sécurité" à "bug de faible sévérité." La sévérité est un jugement qui dépend du modèle de menace, de la surface d'attaque et des conditions d'exploitation. Les outils IA actuels ne font pas bien ce jugement. Ils signalent des motifs. Les humains évaluent le risque.

Ne payez pas pour le niveau entreprise avec version verrouillée à moins de pouvoir vérifier le gain. Le résultat de Mythos contre curl, comparé aux résultats d'AISLE et Zeropath dans les mois précédents, suggère que l'écart entre les modèles de sécurité de frontière et la génération précédente est plus étroit que le marketing ne le laisse entendre. Avant de signer un contrat à six chiffres pour des outils de sécurité IA de "niveau frontière," lancez une évaluation parallèle contre les alternatives moins chères sur une tranche représentative de votre propre code. Les chiffres curl suggèrent que la différence pourrait ne pas justifier le prix.

Prêtez attention à la découverte de bugs, pas seulement à la découverte de vulnérabilités. Le résultat le plus fort de Mythos sur curl a été les ~20 bugs mineurs non liés à la sécurité qu'il a trouvés. Ceux-ci ont une valeur réelle — la qualité du code s'améliore, la surface future de bugs diminue, la maintenance devient plus facile. Si vous cadrez les outils de sécurité IA purement comme un trouveur de CVEs, vous les sous-évaluerez. Si vous les cadrez comme un outil de "qualité de code et réduction de risque," les mathématiques du retour sur investissement sont meilleures.

Ce cadre n'est pas nouveau. C'est ce que les ingénieurs de sécurité expérimentés disent à propos des outils IA depuis les 18 derniers mois. L'épisode curl a simplement rendu plus difficile de considérer ces ingénieurs comme dépassés.

La seule prédiction en laquelle j'ai confiance

Je veux conclure avec une prédiction, parce que je pense que la trajectoire compte plus que l'instantané.

L'épisode Mythos+curl sera considéré rétrospectivement comme le moment où le récit de sécurité IA de 2026 s'est recalibré. Non pas parce que Mythos a échoué — ce n'est pas le cas — mais parce que l'écart entre les affirmations marketing et la production vérifiée est devenu impossible à ignorer quand la vérification est venue d'un mainteneur avec une plateforme publique et zéro incitation à flatter le fournisseur.

Ce qui se passe ensuite, je parierais, c'est une deuxième vague plus silencieuse et plus honnête d'affirmations de sécurité IA. Les fournisseurs vont baisser la rhétorique "les jours des zero-days sont comptés." Le cadrage va se déplacer vers un langage de "multiplicateur de force," des architectures "humain-dans-la-boucle" et une "réduction incrémentale du risque" — la vraie proposition de valeur. La direction de recherche véritablement novatrice — des outils de sécurité agentiques autonomes capables de trouver, valider et corriger des vulnérabilités de bout en bout — continuera d'avancer, mais à un rythme qui ressemble à une croissance normale des capacités, pas au saut discontinu tel que le Project Glasswing a été emballé.

Les vulnérabilités continueront d'arriver. Curl continuera de publier des CVEs à peu près à son rythme actuel. Le pipeline de chercheurs humains restera la source dominante de découvertes à fort impact pendant au moins les prochains trimestres. Les outils IA continueront de faire leurs preuves en marge, s'améliorant année après année, et trouvant occasionnellement quelque chose de véritablement surprenant. Principalement, ils feront ce qu'ils ont commencé à faire : détecter le routinier plus vite pour que les humains puissent se concentrer sur le difficile.

C'est la version ennuyeuse de l'histoire. C'est aussi la vraie.

Si vous voulez la version sans glamour du futur de la sécurité IA, la voici en une phrase : de meilleurs outils utilisés par des ingénieurs expérimentés continueront de battre de moins bons outils utilisés par des ingénieurs inexpérimentés, et l'écart entre les deux va s'élargir, pas se réduire. L'épisode Mythos+curl est un point de données au service de cette thèse. Le marketing finira par rattraper la réalité. C'est toujours le cas. Mais en attendant, le pari calibré est d'assumer que vos outils de sécurité IA sont modérément meilleurs que ceux de l'année dernière — et de garder les humains expérimentés fermement dans la boucle.

Daniel Stenberg a déjà compris cela. La version 8.21.0 de curl sera publiée fin juin avec un CVE de faible sévérité corrigé, grâce à un scan IA qui a promis cinq vulnérabilités et en a livré une. Le bug sera corrigé. La base de code sera légèrement plus forte. Le marketing passera à l'affirmation suivante.

Et quelque part dans le prochain sprint, un ingénieur compétent va utiliser un outil IA pour trouver un vrai bug dans sa propre base de code, le corriger avant qu'il ne soit expédié, et retourner au travail. C'est le futur. Il est déjà là. Il ne sonne simplement pas aussi bien dans un communiqué de presse.

Questions fréquentes

Qu'est-ce que le Mythos d'Anthropic a réellement trouvé dans curl ?

Mythos a rapporté cinq "vulnérabilités de sécurité confirmées" dans curl, mais une seule a survécu à la revue de l'équipe de sécurité de curl. Le seul résultat confirmé est un bug de faible sévérité qui sera corrigé dans curl 8.21.0, prévu pour fin juin 2026. Trois des résultats rejetés étaient des faux positifs signalant un comportement documenté de l'API, et l'un était un bug sans implication de sécurité. Mythos a également trouvé environ 20 bugs mineurs non liés à la sécurité avec une bonne précision.

Pourquoi Daniel Stenberg a-t-il qualifié Mythos de coup marketing ?

Stenberg, le mainteneur principal de curl, a conclu que "le grand battage autour de ce modèle jusqu'à présent était principalement du marketing" parce que Mythos n'a pas surpassé les outils IA précédents comme AISLE, Zeropath ou OpenAI Codex Security — qui avaient tous déjà poussé des centaines de corrections de bugs à travers curl au cours des 8-10 mois précédents. Le taux de vrais positifs de 20 % sur l'étiquette de plus haute confiance de Mythos a été le signal décisif.

Qu'est-ce que le Project Glasswing d'Anthropic ?

Le Project Glasswing est le programme d'accès restreint d'Anthropic pour distribuer Claude Mythos Preview à des partenaires de sécurité sélectionnés, avec la Linux Foundation servant d'intermédiaire pour certains projets open source. Anthropic a engagé 100M$ en crédits de modèle pour le programme. Stenberg s'est vu promettre un accès mais n'a jamais reçu d'accès direct — une autre personne avec des identifiants Glasswing a exécuté Mythos contre curl et lui a envoyé le rapport par e-mail.

Dois-je utiliser l'IA pour l'analyse de sécurité dans mes propres projets ?

Oui, avec le cadrage approprié. Les outils de sécurité IA actuels — y compris Mythos — fonctionnent comme des multiplicateurs de force pour les ingénieurs expérimentés, pas comme des remplacements. Attendez-vous à un taux de vrais positifs de 15-25 % sur les problèmes de sécurité signalés, planifiez une couche de tri en conséquence et ne sous-traitez pas la classification de sévérité au modèle. Consultez le cadre complet d'implémentation dans la section "Ce que cela signifie" ci-dessus.

Quand Mythos sera-t-il disponible pour le public ?

Anthropic n'a pas annoncé de sortie publique. Le modèle est actuellement restreint aux partenaires du Project Glasswing dans le cadre d'un programme d'accès géré, citant des préoccupations concernant la capacité offensive à double usage. Il n'y a pas de calendrier publié pour une disponibilité plus large, et compte tenu du cadrage d'Anthropic du modèle comme un actif défensif de logiciel critique, une sortie large semble improbable à court terme.

Travaillons ensemble

Vous cherchez à construire des systèmes d'IA, automatiser des flux de travail ou faire évoluer votre infrastructure technologique ? Ce serait un plaisir de vous aider.

Fiverr (développements sur mesure et intégrations) : fiverr.com/s/EgxYmWD
Portfolio : mejba.me
Ramlit Limited (solutions entreprises) : ramlit.com
ColorPark (design et branding) : colorpark.io
xCyberSecurity (services de sécurité) : xcybersecurity.io

Le Mythos d'Anthropic a ciblé curl. Le battage n'a pas survécu