La Fuite de 512K Lignes de Claude : Ce Qu'Anthropic Ne Voulait Pas Que Vous Voyiez
Une entrée manquante dans .npmignore. C'est tout. C'est ce qui séparait les secrets les plus jalousement gardés d'Anthropic de chaque développeur disposant d'une commande npm install.
Le 31 mars 2026, à 00:21 UTC, quelqu'un de l'équipe de publication d'Anthropic a poussé Claude Code v2.1.88 vers le registre npm. Bun — le runtime JavaScript qu'Anthropic a acquis fin 2025 — génère des source maps par défaut. Personne ne les a exclus du paquet. En trois heures, 512 000 lignes de TypeScript non obfusqué réparties sur environ 1 900 fichiers étaient mirrorées, forkées et disséquées par des dizaines de milliers de développeurs dans le monde entier. Une réécriture clean-room a atteint 50 000 étoiles GitHub en deux heures — probablement le dépôt à la croissance la plus rapide de l'histoire de GitHub.
Anthropic a confirmé l'authenticité de la fuite sans nier un seul détail. Et ce que ces 512 000 lignes ont révélé n'était pas simplement de la plomberie interne et des flags de débogage. C'était une vision entièrement différente de ce à quoi ressemble le développement assisté par IA — une vision où votre agent de codage ne dort jamais, rêve pendant votre absence, et opère à un niveau de capacité si dangereux qu'il ne peut pas être diffusé au public.
J'ai passé les cinq derniers jours à lire chaque analyse crédible, à recouper les références du code fuité avec les déclarations confirmées d'Anthropic, et à cartographier ce que cela signifie pour les développeurs qui construisent avec Claude au quotidien. Voici ce que j'ai trouvé — et pourquoi certaines découvertes m'ont véritablement troublé.
Comment 512 000 Lignes Sont Sorties par la Grande Porte
La mécanique de cette fuite mérite attention, car elle révèle quelque chose d'important sur l'état de l'infrastructure IA en 2026.
Claude Code est construit sur Bun, qui compile le TypeScript en JavaScript empaquété pour la distribution. Pratique standard. Mais Bun génère par défaut des fichiers .map de source maps — des fichiers détaillés qui associent la sortie compilée au code source original. Chaque nom de variable, chaque commentaire interne, chaque feature flag non publié, préservé en toute fidélité.
La correction aurait été une seule ligne dans .npmignore :
*.map
Ou un champ files dans package.json qui aurait explicitement mis en liste blanche uniquement la sortie compilée. L'une ou l'autre approche prend environ quinze secondes à implémenter. Aucune n'a été faite.
Entre 00:21 et 03:29 UTC le 31 mars, quiconque installait ou mettait à jour Claude Code via npm téléchargeait une source map de 59,8 Mo contenant l'intégralité de la base de code. The Hacker News a rapporté qu'une version trojanisée du client HTTP est apparue dans cette fenêtre — un cheval de Troie d'accès à distance multiplateforme profitant du chaos. Anthropic a retiré le paquet, mais le code source était déjà partout.
Voici la partie qui devrait mettre mal à l'aise tout responsable ingénierie : il s'agit de la deuxième faille de sécurité majeure d'Anthropic en une seule semaine. Fortune a rapporté que quelques jours plus tôt, un système de gestion de contenu mal configuré avait laissé fuiter un brouillon d'article de blog sur un modèle non publié appelé Mythos. Deux fuites. Une semaine. De la part de l'entreprise qui fait de la sécurité IA son identité fondamentale.
Je ne souligne pas cela pour enfoncer le clou. Je le souligne parce que l'ironie est instructive. L'entreprise qui construit les modèles d'IA les plus soucieux de la sécurité dans l'industrie a été mise à terre par .npmignore et une mauvaise configuration de CMS. La sécurité de l'infrastructure n'est pas une question de philosophie — c'est une question de checklists. Et Anthropic a raté la checklist deux fois.
Mais qu'est-ce qui est ressorti de la fuite ? C'est là que les choses deviennent véritablement fascinantes.
Les Noms de Code Internes : Fenck, Capra, Tangu et Numbat
Enfouis dans le code source se trouvaient des noms de code internes pour les niveaux de modèles de Claude. Si vous avez suivi les conventions de nommage d'Anthropic, trois d'entre eux étaient attendus :
- Opus = Fenck
- Sonnet = Capra
- Haiku = Tangu
Standard. Chaque entreprise d'IA utilise des noms de code internes pour découpler la marque produit des références d'ingénierie. Ce qui a attiré l'attention de tout le monde était un quatrième nom : Numbat. Il apparaît dans la base de code sans modèle public correspondant, sans documentation, sans matériel marketing. Juste des références dans le code qui confirment son existence.
Le code source fuité contenait également des chaînes de version pour Opus 4.7 et Sonnet 4.8 — aucun des deux n'a été annoncé. Ils n'étaient pas enfouis dans des fichiers de test commentés. Ils apparaissaient dans la logique de validation de version et les vérifications de compatibilité, suggérant qu'ils sont activement développés et testés en interne.
Les marchés de prédiction ont réagi vite. Polymarket estime actuellement la probabilité que Claude 4.7 soit lancé avant le 30 juin 2026 à environ 59 %. Étant donné la cadence récente d'Anthropic — Opus 4.6 est sorti le 5 février, Sonnet 4.6 a suivi le 17 février — un lancement mi-2026 pour la prochaine génération n'est pas de la spéculation. C'est la trajectoire attendue.
Mais Opus 4.7 et Sonnet 4.8 ne sont même pas la découverte la plus intéressante. Pas de loin.
Mythos et le Niveau Capybara : Le Modèle Trop Dangereux Pour Être Publié
Le brouillon d'article de blog qui a fuité quelques jours avant le dump du code source faisait référence à quelque chose qu'Anthropic appelait Claude Mythos, opérant sous un nouveau niveau appelé Capybara (référencé en interne comme "Capiara" dans certains chemins de code). Ce n'est pas une mise à jour mineure. Fortune a obtenu la description interne d'Anthropic : un modèle représentant un « saut qualitatif » en capacités, « plus grand et plus intelligent que nos modèles Opus — qui étaient, jusqu'à présent, nos plus puissants. »
Laissez cela infuser. Le langage interne d'Anthropic décrit Capybara comme un niveau au-dessus d'Opus. Pas un remplacement — un ajout. Un quatrième niveau qui se situe au sommet de la pile de capacités, conçu pour des tâches gourmandes en calcul qui dépassent ce que même Opus peut gérer.
Les chiffres des benchmarks tirés de la documentation fuitée racontent l'histoire :
| Benchmark | Claude Opus 4.6 | Claude Mythos (Capybara) | Amélioration |
|---|---|---|---|
| S.E. Bench Verified | 80,8 % | 87,4 % | +6,6 % |
| Terminal Bench 2.0 | 65,4 % | 78,4 % | +13,0 % |
| GPQA Diamond | Milieu des 80 (est.) | Saut significatif | — |
Ces chiffres de Terminal Bench sont stupéfiants. Une amélioration de 13 points de pourcentage sur un benchmark qui mesure l'exécution réelle de commandes terminal et les tâches d'administration système. Pour contexte, l'écart entre GPT-5.4 et Opus 4.6 sur S.E. Bench est inférieur à un point de pourcentage (80,0 % vs 80,8 %). Mythos ne comble pas les écarts — il en crée de nouveaux.
Le modèle serait livré avec une fenêtre de contexte native de 1 million de tokens. Pas un ajout de contexte étendu boulonné après coup. Natif. Intégré dans l'architecture dès la conception.
Alors pourquoi n'en avez-vous pas entendu parler jusqu'à maintenant ? Parce qu'Anthropic ne le publiera pas.
Selon de multiples sources analysant les matériaux fuités, Mythos a démontré une capacité qui a franchi une ligne avec laquelle Anthropic n'était pas à l'aise : il peut découvrir et exploiter des vulnérabilités logicielles plus vite que les équipes de sécurité humaines ne peuvent les corriger. Les capacités de cybersécurité du modèle étaient si avancées qu'Anthropic a restreint l'accès à une poignée de clients de cyberdéfense en accès anticipé — des organisations de confiance pour utiliser les capacités offensives de l'IA uniquement à des fins défensives.
C'est un moment charnière pour l'industrie de l'IA. Nous sommes passés de « l'IA pourrait éventuellement être dangereuse » à « nous avons construit quelque chose de si capable que nous ne pouvons pas le publier. » Anthropic a pris une décision commerciale délibérée de laisser de l'argent sur la table — potentiellement des sommes énormes — parce que les implications sécuritaires d'un accès généralisé à Mythos étaient trop importantes.
Que vous fassiez confiance au jugement d'Anthropic ici dépend de vos opinions plus larges sur la gouvernance de l'IA. Mais le fait qu'une entreprise à but lucratif ait volontairement retenu son produit le plus capable vous dit quelque chose sur ce qu'elle a vu lors des tests. Si vous gérez quelque type d'infrastructure de production que ce soit, c'est votre signal pour prendre votre posture de sécurité au sérieux — car les capacités offensives que Mythos représente finiront par se propager, que ce soit d'Anthropic ou d'un concurrent avec moins de garde-fous. Pour une plongée plus profonde dans les capacités de sécurité de Claude dans le modèle actuel, consultez mon analyse sur comment les améliorations de sécurité de Claude Code fonctionnent en pratique.
KAIROS : L'Agent Qui Ne Dort Jamais
La fuite du code source a révélé quelque chose qui, pour moi personnellement, était plus intéressant que Mythos : une fonctionnalité non publiée appelée KAIROS.
Le nom vient du grec ancien — kairos signifie « le moment opportun », par opposition à chronos (le temps séquentiel). C'est un nom approprié pour ce que le code décrit : un mode daemon autonome où Claude Code opère comme un agent persistant en arrière-plan.
Voici comment fonctionne KAIROS selon l'implémentation fuitée :
1. Le Système Heartbeat KAIROS fonctionne sur un heartbeat basé sur des ticks, vérifiant à intervalles réguliers s'il doit agir. Pensez-y comme un cron job, mais intelligent — il n'exécute pas simplement selon un calendrier, il évalue si l'action est justifiée en fonction de l'état actuel du projet.
2. Budget d'Action Proactive L'agent dispose d'une fenêtre d'action proactive de 15 secondes par tick. C'est une contrainte délibérément serrée. Assez de temps pour lancer un test, vérifier une CI pipeline, ou scanner des problèmes — mais pas assez pour dérailler et réécrire votre base de code pendant que vous allez chercher un café.
3. Changement de Mode Contextuel Quand KAIROS détecte que l'utilisateur a changé de focus (basculé vers une autre fenêtre, devenu inactif, s'est éloigné), il active le mode autonome. Quand l'utilisateur revient, il repasse en mode collaboratif — montrant ce qu'il a fait pendant votre absence et attendant votre input avant de prendre d'autres actions.
4. Outils Daemon Exclusifs
Le code fuité fait référence à des outils auxquels seul KAIROS peut accéder : PushNotification (pour vous alerter quand quelque chose d'important se passe), SubscribePR (pour surveiller l'activité des pull requests), et plusieurs autres conçus pour l'opération en arrière-plan.
Si vous avez suivi mes écrits sur l'architecture d'essaim d'agents de Claude Code, KAIROS représente l'évolution naturelle de ce modèle. L'architecture d'essaim a donné à Claude la capacité de coordonner plusieurs sous-agents sur des tâches complexes. KAIROS donne à ces agents la capacité de continuer à travailler quand vous ne regardez pas.
Imaginez ceci : vous travaillez sur un feature branch. Vous poussez vos changements et fermez votre portable pour déjeuner. Pendant votre absence, KAIROS remarque que la CI pipeline a échoué. Il lit les logs d'erreur, identifie un test instable, examine si l'instabilité est liée à vos changements ou préexistante, et ouvre une PR avec une correction. Quand vous revenez, il y a une notification : « Test instable corrigé dans auth_middleware_spec.rb — CI passante sur votre branch maintenant. Voulez-vous que je fasse le merge ? »
Ce n'est pas un workflow hypothétique que j'invente. C'est ce que l'architecture du code fuité décrit. L'infrastructure est construite. Les outils sont définis. La logique de changement de mode est implémentée. C'est juste pas encore livré.
Les implications pour les développeurs solo sont énormes. KAIROS vous donne essentiellement un développeur junior qui travaille pendant que vous dormez, ne mange rien, et ne se plaint jamais d'être assigné à la correction de tests instables. Pour les équipes, c'est un multiplicateur de force qui gère le travail de maintenance que personne ne veut faire mais dont tout le monde a besoin.
Autodream : Apprendre à l'IA à Dormir
Si KAIROS est l'agent qui ne dort jamais, Autodream est le système qui lui apprend à rêver.
Quiconque a travaillé avec des agents de codage IA lors de longues sessions connaît le problème : l'entropie de contexte. Plus une session dure, plus la compréhension de l'agent de votre projet se dégrade. Il commence à oublier les décisions prises en début de session. Il contredit des instructions d'il y a vingt minutes. La compaction — où l'agent résume son contexte pour libérer des tokens — perd des nuances importantes. À la deuxième heure, vous travaillez essentiellement avec un agent amnésique.
Autodream attaque ce problème à sa racine. Quand l'utilisateur devient inactif, Autodream lance un sous-agent forké qui exécute un processus de consolidation de mémoire. Les parallèles avec le sommeil humain sont intentionnels et étonnamment précis :
Fusionner les Observations Chevauchantes Si l'agent principal a observé le même pattern dans trois fichiers différents au cours de la session, Autodream les consolide en une seule observation confiante. « Le projet utilise le pattern repository pour tout accès à la base de données » au lieu de trois notes séparées sur des fichiers individuels.
Éliminer les Contradictions Les longues sessions accumulent du contexte contradictoire. Tôt dans la session, l'agent pourrait noter « ce projet utilise des REST APIs. » Plus tard, après avoir travaillé dans un module différent, il pourrait observer « ce projet utilise GraphQL. » Autodream résout cela : « Le projet utilise REST pour les APIs publiques et GraphQL pour la communication interne entre services. »
Convertir les Suppositions Vagues en Faits Confirmés Le contexte brut de session est plein d'observations prudentes : « Ce fichier pourrait être le point d'entrée » ou « Ce pattern ressemble à ce qui pourrait être le middleware d'authentification. » Autodream évalue ces observations par rapport à toute la base de code et les confirme comme faits ou les rejette.
L'implémentation est architecturalement élégante. Le sous-agent de rêve reçoit un accès bash en lecture seule — il peut inspecter votre code mais jamais le modifier. L'accès en écriture est limité exclusivement aux fichiers de mémoire. Cela signifie qu'Autodream peut consolider et clarifier la compréhension de l'agent de votre projet sans aucun risque de modifier accidentellement votre code source pendant un processus en arrière-plan.
Si vous avez lu mon article sur la construction de systèmes d'IA auto-améliorants avec Claude Code, Autodream est ce concept poussé à sa conclusion logique. Au lieu que le développeur construise manuellement des boucles de réflexion, l'agent gère sa propre maintenance mémoire. Le système s'améliore lui-même en élaguant le mauvais contexte et en renforçant le bon — de manière autonome, en arrière-plan, pendant que vous faites quelque chose de complètement différent.
C'est la fonctionnalité qui m'enthousiasme le plus de toute la fuite. Pas parce que c'est la plus spectaculaire — les benchmarks de Mythos sont plus impressionnants sur le papier — mais parce que l'entropie de contexte est le plus grand point de douleur dans mon workflow quotidien assisté par IA. Un modèle qui consolide sa propre mémoire pendant les temps morts résout un problème contre lequel je me bats chaque jour.
Le Paysage des Modèles IA en 2026 : Où en Est Chacun ?
La fuite du code source de Claude ne s'est pas produite dans le vide. Elle est tombée dans un paysage IA où trois entreprises sont engagées dans une course de plus en plus serrée. Voici la situation début avril 2026 :
| Modèle | S.E. Bench Verified | Force Principale | Fenêtre de Contexte |
|---|---|---|---|
| Claude Opus 4.6 | 80,8 % | Travail d'interface, décisions architecturales, compréhension esthétique | 200K (1M disponible) |
| GPT-5.4 | 80,0 % | Environnements terminal, DevOps, vitesse d'exécution brute | 1M |
| Gemini 3.1 Pro | 80,6 % | Meilleur rapport qualité-prix | 1M natif |
| Claude Mythos (non publié) | 87,4 % | Tout — particulièrement la cybersécurité | 1M natif |
L'écart entre les trois meilleurs modèles publiquement disponibles est infime. Moins d'un point de pourcentage les sépare sur le benchmark de codage le plus respecté. Ce n'est pas une course où un seul modèle « gagne. » C'est une course où la meilleure stratégie est d'associer le bon modèle à la bonne tâche.
GPT-5.4 excelle dans les workflows intensifs en terminal — DevOps, automatisation d'infrastructure, tâches d'administration système où la vitesse brute d'exécution de commandes compte plus que l'esthétique du code. J'ai couvert cela en détail dans mon premier aperçu de GPT-5.4.
Gemini 3.1 Pro offre la meilleure proposition de valeur. Si votre goulot d'étranglement est le coût des API plutôt que la capacité brute, le modèle de Google délivre 80,6 % de performance sur S.E. Bench pour une fraction de ce que coûte Opus par token. Mon avis sur Gemini 3.1 Pro détaille les cas d'utilisation spécifiques où il surpasse des modèles deux fois plus chers.
Opus 4.6 reste mon outil quotidien pour tout ce qui implique la génération d'interface, les décisions architecturales complexes, ou les tâches où la sortie doit paraître soignée et cohérente. Sa compréhension esthétique — la capacité à générer du code qui produit des résultats visuellement cohérents — reste inégalée. Mon test pratique d'Opus 4.6 couvre cela en détail.
Mais la tendance que j'observe ne concerne pas quel modèle est le « meilleur. » La tendance est l'orchestration de l'intelligence — utiliser différents modèles pour différentes sous-tâches au sein du même projet, en se basant sur leurs forces spécifiques. L'architecture daemon de KAIROS dans le code fuité supporte effectivement ce modèle. L'agent en arrière-plan pourrait théoriquement dispatcher différents niveaux de modèle pour différents types de tâches en arrière-plan : Haiku pour les vérifications rapides de lint, Sonnet pour l'analyse de tests, Opus pour la revue architecturale.
Nous passons de « quel modèle d'IA devrais-je utiliser ? » à « comment composer un système d'IA à partir de multiples modèles spécialisés ? » C'est une question fondamentalement différente, et elle requiert un ensemble de compétences fondamentalement différent.
Ce Que les Noms de Code Internes Nous Révèlent sur la Feuille de Route d'Anthropic
Permettez-moi de relier quelques points que je n'ai vu personne d'autre exposer clairement.
Le code fuité fait référence à quatre noms de code de modèles : Fenck (Opus), Capra (Sonnet), Tangu (Haiku), et le mystérieux Numbat. Plus le niveau Capybara pour Mythos. Cela fait cinq identifiants internes pour une entreprise qui livre actuellement trois niveaux publics.
Voici ce que je pense qu'il se passe.
Anthropic restructure sa gamme de modèles. Le système actuel à trois niveaux (Haiku / Sonnet / Opus) a été conçu quand les modèles avaient des niveaux de capacité clairs. Mais alors que l'écart de performance entre les niveaux se réduit — Sonnet 4.6 gère des tâches qui nécessitaient Opus 3.5 il y a seulement un an — la logique de niveaux doit évoluer.
Capybara (Mythos) ajoute un plafond au-dessus d'Opus pour les tâches gourmandes en calcul et à haut enjeu. Numbat comble probablement un vide quelque part dans l'offre actuelle — peut-être un niveau entre Haiku et Sonnet optimisé pour les tâches à haut débit et faible latence où Haiku est trop limité mais Sonnet est excessif. Pensez aux charges de travail intensives en API où vous faites des milliers d'appels au modèle par minute et avez besoin d'une qualité constante sans le coût du niveau Sonnet.
Les chaînes de version pour Opus 4.7 et Sonnet 4.8 confirment que la cadence de développement d'Anthropic est rapide. Ils ne se reposent pas sur le 4.6. Avec une probabilité de 59 % sur les marchés de prédiction que le 4.7 sortira avant juillet, la prochaine génération est probablement en phase finale de tests maintenant.
Pour les développeurs construisant sur l'API de Claude, cela signifie que votre logique de sélection de modèle doit être flexible. Coder en dur claude-opus-4-6-20260205 dans votre application va vous pénaliser dans quelques mois. Construisez des couches d'abstraction. Utilisez des alias de modèle. Concevez vos systèmes pour échanger les modèles sans réécrire le code d'intégration.
Que Devraient Réellement Faire les Développeurs Avec Ces Informations ?
J'ai passé cinq jours en immersion dans cette histoire. Voici ce que je change concrètement dans mon propre workflow suite à ce que j'ai appris.
1. Préparez-vous aux Agents Autonomes — Ils Arrivent Plus Vite Que Prévu
KAIROS n'est pas un prototype de recherche. Le code fuité montre une implémentation de niveau production avec des contraintes de sécurité, un changement de mode et des permissions d'outils. Quand cela sortira — et cela sortira, probablement en 2026 — le workflow du développeur changera fondamentalement. Commencez à réfléchir aux parties de votre workflow qui pourraient bénéficier d'un agent en arrière-plan : surveillance de CI, triage de revue de code, analyse de mise à jour de dépendances, scan de sécurité.
Si vous préférez que quelqu'un construise ces workflows d'agents autonomes de zéro, j'accepte des projets d'intégration et d'automatisation IA. Vous pouvez voir ce que j'ai construit sur fiverr.com/s/EgxYmWD.
2. Renforcez Votre Posture de Sécurité — Maintenant
Mythos peut trouver des vulnérabilités plus vite que les défenseurs humains ne peuvent les corriger. Cette capacité existe aujourd'hui, même si elle est restreinte. D'autres laboratoires construisent des capacités similaires. Les outils offensifs d'IA vont se propager. Si votre application a des dépendances non corrigées, des serveurs mal configurés, ou ce genre de dette de sécurité négligée que « personne n'a le temps de corriger », la fenêtre pour la corriger discrètement se referme.
Lancez npm audit sur chaque projet. Mettez à jour vos dépendances. Activez le scan de sécurité automatisé dans votre CI pipeline. Ce n'est plus optionnel — ce sont des fondamentaux de survie.
3. Apprenez l'Orchestration de l'Intelligence
L'ère où l'on choisit un modèle d'IA et on l'utilise pour tout touche à sa fin. Les développeurs qui prospéreront en 2026 et au-delà sont ceux qui sauront composer des systèmes à partir de multiples modèles spécialisés. Commencez à expérimenter le routage de différents types de tâches vers différents modèles. Utilisez Haiku pour la classification et le triage. Utilisez Sonnet pour la génération et l'itération. Utilisez Opus pour la revue et l'architecture. Développez la mémoire musculaire maintenant pendant que les outils mûrissent encore.
4. Concevez pour la Persistance de Mémoire
Autodream révèle la réponse d'Anthropic à l'entropie de contexte — et c'est une bonne réponse. Mais même avant sa sortie, vous pouvez concevoir vos workflows autour du même principe. Utilisez des fichiers CLAUDE.md, des banques de mémoire et des résumés de session pour donner à votre agent un contexte persistant. Quand Autodream sortira, il améliorera ce que vous avez déjà construit. Vous n'attendez pas la fonctionnalité — vous construisez les fondations sur lesquelles elle reposera.
5. Surveillez Numbat
Quel que soit ce que Numbat s'avère être, il représente le pari d'Anthropic sur un manque de capacité dans l'offre actuelle. Si c'est un niveau à haut débit entre Haiku et Sonnet, cela pourrait changer drastiquement l'économie des applications intensives en IA. Gardez un œil sur les notes de version d'Anthropic. Quand Numbat apparaîtra, les adopteurs précoces qui ont déjà des couches d'abstraction de modèle en place pourront l'intégrer immédiatement.
La Vue d'Ensemble : Ce Que la Pire Semaine d'Anthropic Révèle sur le Meilleur Avenir de l'IA
Prenez du recul par rapport aux fonctionnalités spécifiques et aux chiffres de benchmark. Que nous dit réellement cette fuite sur la direction que prend le développement de l'IA ?
Trois choses ressortent.
L'IA autonome n'est pas un état futur — c'est un problème d'ingénierie en cours de résolution. KAIROS et Autodream ne sont pas conceptuels. Ils sont implémentés. Les contraintes de sécurité sont définies. La logique de changement de mode fonctionne. Le seul écart entre ici et le déploiement est les tests, le raffinement et la tolérance au risque d'Anthropic. La question n'est pas « les agents IA vont-ils fonctionner de manière autonome ? » C'est « quand les entreprises se sentiront-elles assez en sécurité pour les lancer ? »
La tension entre sécurité et capacité est réelle et s'aiguise. Anthropic a construit un modèle qui surpasse tout sur le marché avec une large avance, puis l'a enfermé dans un coffre-fort parce que les implications de cybersécurité étaient trop sérieuses. Cette tension — construire la chose la plus capable possible, puis décider de la publier ou non — va définir les deux prochaines années du développement de l'IA. Chaque grand laboratoire fait face au même compromis. La façon dont ils le résolvent façonnera l'industrie plus que toute amélioration de benchmark.
Le fossé n'est pas l'intelligence du modèle — c'est le système autour du modèle. Les benchmarks de Mythos sont impressionnants. Mais les fonctionnalités qui changeraient mon quotidien ne concernent pas l'intelligence brute. Elles concernent KAIROS qui lance des tests pendant que je dors. Autodream qui consolide la mémoire de mon agent pendant que je déjeune. PushNotification qui m'alerte quand mon agent en arrière-plan a trouvé quelque chose d'important. Le modèle est un composant. Le système est le produit.
Ce dernier point est celui vers lequel je reviens sans cesse. Nous avons été tellement focalisés sur quel modèle obtient le meilleur score sur quel benchmark que nous avons raté la vraie course. La vraie course est de savoir qui construit le meilleur système autour du modèle — la boucle autonome, la persistance de mémoire, l'orchestration intelligente.
D'après ce que j'ai vu dans ces 512 000 lignes, Anthropic est plus avancé dans cette course que je ne l'attendais. Bien plus avancé.
L'erreur .npmignore a coûté à Anthropic sa surprise concurrentielle. Mais pour les développeurs comme vous et moi, elle nous a donné quelque chose de précieux : une vue claire de la route à suivre. Et cette route mène à un endroit précis — vers des systèmes d'IA qui ne se contentent pas de répondre quand on leur demande, mais anticipent, agissent et s'améliorent pendant que nous ne regardons pas.
La question n'est pas de savoir si vous êtes prêt pour cet avenir. La question est de savoir si vous construisez dans cette direction maintenant — ou si vous serez en train de courir pour rattraper votre retard quand il arrivera.
Questions Fréquemment Posées
Qu'est-ce qui a exactement été fuité lors de l'incident du code source de Claude ?
Le 31 mars 2026, 512 000 lignes du code source TypeScript de Claude Code ont été exposées via des source maps npm en raison d'une entrée manquante dans .npmignore. La fuite a révélé des noms de code internes de modèles, des fonctionnalités non publiées comme KAIROS et Autodream, et des références à des versions de modèles à venir incluant Opus 4.7 et Sonnet 4.8. Pour le détail complet de chaque découverte, consultez les sections ci-dessus.
Qu'est-ce que Claude Mythos et quand sera-t-il disponible ?
Claude Mythos est le modèle ultra-niveau non publié d'Anthropic opérant sous la classification de niveau « Capybara », avec un score de 87,4 % sur S.E. Bench Verified comparé aux 80,8 % d'Opus 4.6. Il est actuellement restreint à des clients de cyberdéfense sélectionnés en raison de sa capacité à découvrir des vulnérabilités plus vite que les équipes humaines ne peuvent les corriger. Aucune date de sortie publique n'a été annoncée.
Qu'est-ce que KAIROS dans Claude Code ?
KAIROS est un mode daemon autonome non publié qui permet à Claude Code de fonctionner comme un agent persistant en arrière-plan. Il utilise un système heartbeat avec un budget d'action proactive de 15 secondes, bascule entre les modes autonome et collaboratif en fonction de la présence de l'utilisateur, et inclut des outils exclusifs comme PushNotification et SubscribePR pour les opérations en arrière-plan.
Comment fonctionne Autodream dans Claude Code ?
Autodream est un système de consolidation de mémoire en arrière-plan qui lance un sous-agent forké pendant les périodes d'inactivité de l'utilisateur. Il fusionne les observations chevauchantes, élimine les contradictions dans le contexte de session, et convertit les suppositions vagues en faits confirmés — le tout avec un accès en lecture seule au code et un accès en écriture limité exclusivement aux fichiers de mémoire.
Claude Opus 4.7 est-il confirmé ?
Opus 4.7 et Sonnet 4.8 sont apparus dans la logique de validation de version au sein du code source fuité, confirmant un développement interne actif. Les marchés de prédiction estiment la probabilité à environ 59 % que Claude 4.7 soit lancé avant le 30 juin 2026, bien qu'Anthropic n'ait fait aucune annonce officielle.
Travaillons Ensemble
Vous cherchez à construire des systèmes d'IA, automatiser des workflows ou faire évoluer votre infrastructure technique ? Je serais ravi de vous aider.
- Fiverr (développements sur mesure et intégrations) : fiverr.com/s/EgxYmWD
- Portfolio : mejba.me
- Ramlit Limited (solutions entreprise) : ramlit.com
- ColorPark (design et branding) : colorpark.io
- xCyberSecurity (services de sécurité) : xcybersecurity.io