Claude's 512K-Regels Lek: Wat Anthropic Niet Wilde Dat Je Zag

Een ontbrekende .npmignore-regel. Dat is alles. Dat was het enige dat Anthropic's best bewaakte geheimen scheidde van elke ontwikkelaar met een npm install-commando.

Op 31 maart 2026, om 00:21 UTC, pushte iemand van Anthropic's release-team Claude Code v2.1.88 naar de npm registry. Bun — de JavaScript-runtime die Anthropic eind 2025 overnam — genereert standaard source maps. Niemand sloot ze uit van het pakket. Binnen drie uur waren 512.000 regels onverduisterde TypeScript verdeeld over ruwweg 1.900 bestanden gespiegeld, geforkt en ontleed door tienduizenden ontwikkelaars wereldwijd. Een clean-room herschrijving bereikte 50.000 GitHub-sterren in twee uur — waarschijnlijk de snelstgroeiende repository in de geschiedenis van GitHub.

Anthropic bevestigde de authenticiteit van het lek zonder een enkel detail te ontkennen. En wat die 512.000 regels onthulden was niet alleen wat interne leidingen en debug-vlaggen. Het was een geheel andere visie op hoe AI-ondersteunde ontwikkeling eruitziet — een waar je codeeragent nooit slaapt, droomt terwijl je weg bent, en opereert op een capaciteitsniveau dat zo gevaarlijk is dat het niet aan het publiek vrijgegeven kan worden.

Ik heb de afgelopen vijf dagen besteed aan het lezen van elke geloofwaardige analyse, het kruisverwijzen van de gelekte codereferenties met Anthropic's bevestigde verklaringen, en het in kaart brengen van wat dit betekent voor ontwikkelaars die dagelijks met Claude bouwen. Dit is wat ik vond — en waarom sommige dingen me oprecht verontrustten.

Hoe 512.000 Regels Door de Voordeur Naar Buiten Liepen

De mechanica van dit lek verdient aandacht, omdat het iets belangrijks onthult over de staat van AI-infrastructuur in 2026.

Claude Code is gebouwd op Bun, dat TypeScript compileert naar gebundeld JavaScript voor distributie. Standaardpraktijk. Maar Bun genereert standaard .map source map-bestanden — gedetailleerde bestanden die de gecompileerde uitvoer terugkoppelen naar de originele broncode. Elke variabelenaam, elk intern commentaar, elke niet-uitgebrachte feature flag, bewaard in volledige getrouwheid.

De oplossing zou een enkele regel in .npmignore zijn geweest:

*.map

Of een files-veld in package.json dat expliciet alleen de gecompileerde uitvoer op de witte lijst zette. Beide benaderingen kosten ongeveer vijftien seconden om te implementeren. Geen van beide werd gedaan.

Tussen 00:21 en 03:29 UTC op 31 maart downloadde iedereen die Claude Code via npm installeerde of bijwerkte een 59,8 MB source map met de volledige codebase. The Hacker News meldde dat er binnen dat tijdsvenster een getrojaniseerde versie van de HTTP-client verscheen — een cross-platform remote access trojan die meeliftte op de chaos. Anthropic trok het pakket terug, maar de broncode was al overal.

Hier is het deel dat elke technisch leider ongemakkelijk zou moeten maken: dit is het tweede grote beveiligingsprobleem van Anthropic in één enkele week. Fortune meldde dat slechts dagen eerder een verkeerd geconfigureerd contentmanagementsysteem een concept-blogpost had gelekt over een niet-uitgebracht model genaamd Mythos. Twee lekken. Eén week. Van het bedrijf dat AI-veiligheid als kernidentiteit heeft.

Ik wijs hier niet op om erbovenop te stapelen. Ik wijs erop omdat de ironie leerzaam is. Het bedrijf dat de meest veiligheidsbewuste AI-modellen in de industrie bouwt, werd te gronde gericht door .npmignore en een CMS-misconfiguratie. Infrastructuurbeveiliging gaat niet over filosofie — het gaat over checklists. En Anthropic miste de checklist twee keer.

Maar wat kwam er uit het lek? Daar wordt het pas echt fascinerend.

De Interne Codenamen: Fenck, Capra, Tangu en Numbat

Verborgen in de broncode zaten interne codenamen voor Claude's modelniveaus. Als je Anthropic's naamgevingsconventies hebt gevolgd, waren drie hiervan verwacht:

Opus = Fenck
Sonnet = Capra
Haiku = Tangu

Standaardstof. Elk AI-bedrijf gebruikt interne codenamen om productbranding los te koppelen van engineeringreferenties. Wat ieders aandacht trok was een vierde naam: Numbat. Het verschijnt in de codebase zonder corresponderend openbaar model, geen documentatie, geen marketingmateriaal. Alleen referenties in de code die bevestigen dat het bestaat.

De gelekte broncode bevatte ook versiereeksen voor Opus 4.7 en Sonnet 4.8 — geen van beide is aangekondigd. Deze waren niet begraven in uitgecommentarieerde testbestanden. Ze verschenen in versievalidatielogica en compatibiliteitscontroles, wat suggereert dat ze actief intern worden ontwikkeld en getest.

Voorspellingsmarkten reageerden snel. Polymarket schat de kans dat Claude 4.7 voor 30 juni 2026 verschijnt op ruwweg 59%. Gezien Anthropic's recente cadans — Opus 4.6 verscheen op 5 februari, Sonnet 4.6 volgde op 17 februari — is een release medio 2026 voor de volgende generatie geen speculatie. Het is het verwachte traject.

Maar Opus 4.7 en Sonnet 4.8 zijn niet eens de meest interessante vondst. Bij lange na niet.

Mythos en het Capybara-Niveau: Het Model Dat Te Gevaarlijk Is Om Uit Te Brengen

De concept-blogpost die dagen voor de broncodelek uitlekte, verwees naar iets dat Anthropic Claude Mythos noemde, opererend onder een nieuw niveau genaamd Capybara (intern gerefereerd als "Capiara" in sommige codepaden). Dit is geen kleine upgrade. Fortune verkreeg Anthropic's interne beschrijving: een model dat een "stapsgewijze verandering" in capaciteiten vertegenwoordigt, "groter en intelligenter dan onze Opus-modellen — die tot nu toe onze krachtigste waren."

Laat dat even bezinken. Anthropic's eigen interne taal beschrijft Capybara als een niveau boven Opus. Geen vervanging — een toevoeging. Een vierde niveau dat bovenaan de capaciteitsstapel zit, ontworpen voor rekenintensieve taken die voorbij gaan aan wat zelfs Opus aankan.

De benchmarkcijfers uit de gelekte documentatie vertellen het verhaal:

Benchmark	Claude Opus 4.6	Claude Mythos (Capybara)	Verbetering
S.E. Bench Verified	80,8%	87,4%	+6,6%
Terminal Bench 2.0	65,4%	78,4%	+13,0%
GPQA Diamond	Midden-80 (geschat)	Significante sprong	—

Die Terminal Bench-cijfers zijn verbijsterend. Een verbetering van 13 procentpunten op een benchmark die praktische terminalcommando-uitvoering en systeembeheer meet. Ter context: het verschil tussen GPT-5.4 en Opus 4.6 op S.E. Bench is minder dan één procentpunt (80,0% vs 80,8%). Mythos sluit geen kloven — het creëert nieuwe.

Het model wordt naar verluidt geleverd met een native contextvenster van 1 miljoen tokens. Geen uitgebreid context-toevoeging achteraf. Native. Ingebouwd in de architectuur vanaf de basis.

Dus waarom heb je er tot nu toe niet van gehoord? Omdat Anthropic het niet publiek uitbrengt.

Volgens meerdere bronnen die de gelekte materialen analyseren, demonstreerde Mythos een vermogen dat een grens overschreed waar Anthropic niet comfortabel mee was: het kan softwarekwetsbaarheden sneller ontdekken en exploiteren dan menselijke beveiligingsteams ze kunnen patchen. De cybersecuritycapaciteiten van het model waren zo geavanceerd dat Anthropic de toegang beperkte tot een handvol early-access cyberverdedigingsklanten — organisaties die vertrouwd worden om offensieve AI-capaciteiten alleen voor defensieve doeleinden te gebruiken.

Dit is een cruciaal moment voor de AI-industrie. We zijn verschoven van "AI zou ooit gevaarlijk kunnen zijn" naar "we hebben iets zo capabel gebouwd dat we het niet kunnen uitbrengen." Anthropic nam een bewuste zakelijke beslissing om geld op tafel te laten liggen — potentieel enorme hoeveelheden geld — omdat de veiligheidsimplicaties van wijdverspreide Mythos-toegang te significant waren.

Of je Anthropic's oordeel hier vertrouwt, hangt af van je bredere opvattingen over AI-governance. Maar het feit dat een winstgevend bedrijf vrijwillig zijn meest capabele product achterhield, vertelt je iets over wat ze tijdens het testen zagen. Als je enige vorm van productie-infrastructuur draait, is dit je signaal om je beveiligingshouding serieus te nemen — want de offensieve capaciteiten die Mythos vertegenwoordigt zullen uiteindelijk verspreiden, of dat nu van Anthropic komt of van een concurrent met minder waarborgen. Voor een diepere duik in Claude's beveiligingscapaciteiten in het huidige model, bekijk mijn analyse van hoe Claude Code's beveiligingsupgrades in de praktijk werken.

KAIROS: De Agent Die Nooit Slaapt

Het lek van de broncode onthulde iets dat voor mij persoonlijk interessanter was dan Mythos: een niet-uitgebrachte functie genaamd KAIROS.

De naam komt uit het Oudgrieks — kairos betekent "het juiste moment," in tegenstelling tot chronos (sequentiële tijd). Het is een passende naam voor wat de code beschrijft: een autonome daemon-modus waarin Claude Code opereert als een persistent achtergronddienst.

Zo werkt KAIROS op basis van de gelekte implementatie:

1. Het Heartbeat-Systeem KAIROS draait op een tick-gebaseerd heartbeat, dat op regelmatige intervallen incheckt om te beoordelen of actie ondernomen moet worden. Zie het als een cron job, maar dan intelligent — het voert niet alleen uit op een schema, het evalueert of actie gerechtvaardigd is op basis van de huidige projectstatus.

2. Proactief Actiebudget De agent heeft een proactief actievenster van 15 seconden per tick. Dat is een bewust strakke beperking. Genoeg tijd om een test te draaien, een CI pipeline te controleren, of te scannen op problemen — maar niet genoeg om op hol te slaan en je codebase te herschrijven terwijl je koffie haalt.

3. Contextbewuste Modusomschakeling Wanneer KAIROS detecteert dat de gebruiker van focus is veranderd (overgeschakeld naar een ander venster, inactief geworden, weggelopen), activeert het de autonome modus. Wanneer de gebruiker terugkeert, schakelt het terug naar de samenwerkingsmodus — het toont wat het deed terwijl je weg was en wacht op je input voordat het verdere actie onderneemt.

4. Exclusieve Daemon-Tools De gelekte code verwijst naar tools die alleen KAIROS kan gebruiken: PushNotification (om je te waarschuwen wanneer er iets belangrijks gebeurt), SubscribePR (om pull request-activiteit te monitoren), en diverse andere ontworpen voor achtergrondoperatie.

Als je mijn schrijven hebt gevolgd over Claude Code's agent swarm-architectuur, vertegenwoordigt KAIROS de natuurlijke evolutie van dat patroon. De swarm-architectuur gaf Claude de mogelijkheid om meerdere sub-agents te coördineren bij complexe taken. KAIROS geeft die agents de mogelijkheid om door te werken wanneer je niet kijkt.

Stel je dit voor: je werkt aan een feature-branch. Je pusht je wijzigingen en klapt je laptop dicht voor de lunch. Terwijl je weg bent, merkt KAIROS dat de CI pipeline is gefaald. Het leest de foutlogs, identificeert een flaky test, onderzoekt of de flake gerelateerd is aan jouw wijzigingen of al eerder bestond, en opent een PR met een fix. Wanneer je terugkomt, is er een melding: "Flaky test gefixed in auth_middleware_spec.rb — CI slaagt nu op je branch. Wil je dat ik merge?"

Dat is geen hypothetische workflow die ik verzin. Dat is wat de gelekte codearchitectuur beschrijft. De infrastructuur is gebouwd. De tools zijn gedefinieerd. De modusomschakelingslogica is geïmplementeerd. Het is alleen nog niet uitgebracht.

De implicaties voor solo-ontwikkelaars zijn enorm. KAIROS geeft je in feite een junior ontwikkelaar die werkt terwijl je slaapt, niets eet, en nooit klaagt over het toegewezen krijgen van flaky tests om te fixen. Voor teams is het een krachtversterker die het onderhoudswerk afhandelt dat niemand wil doen maar iedereen nodig heeft.

Autodream: AI Leren Slapen

Als KAIROS de agent is die nooit slaapt, is Autodream het systeem dat hem leert dromen.

Iedereen die met AI-codeeragents heeft gewerkt tijdens lange sessies kent het probleem: context-entropie. Hoe langer een sessie duurt, hoe meer het begrip van de agent van je project degradeert. Het begint vroege beslissingen te vergeten. Het spreekt instructies van twintig minuten geleden tegen. Compactie — waarbij de agent zijn context samenvat om tokens vrij te maken — verliest belangrijke nuance. Tegen uur twee werk je in feite met een agent die geheugenverlies heeft.

Autodream pakt dit probleem bij de wortel aan. Wanneer de gebruiker inactief wordt, spawnt Autodream een geforkte sub-agent die een geheugenconsolidatieproces uitvoert. De parallellen met menselijke slaap zijn opzettelijk en verrassend precies:

Overlappende Observaties Samenvoegen Als de hoofdagent hetzelfde patroon in drie verschillende bestanden observeerde tijdens de sessie, comprimeert Autodream die tot een enkele, zekere observatie. "Het project gebruikt het repository-patroon voor alle databasetoegang" in plaats van drie afzonderlijke notities over individuele bestanden.

Tegenstrijdigheden Elimineren Lange sessies accumuleren tegenstrijdige context. Vroeg in de sessie merkt de agent misschien op "dit project gebruikt REST API's." Later, na het werken in een andere module, observeert het misschien "dit project gebruikt GraphQL." Autodream lost dit op: "Het project gebruikt REST voor publieke API's en GraphQL voor interne servicecommunicatie."

Vage Aannames Omzetten in Vaststaande Feiten Ruwe sessiecontext zit vol voorzichtige observaties: "Dit bestand zou het ingangspunt kunnen zijn" of "Dit patroon ziet eruit alsof het de auth middleware zou kunnen zijn." Autodream evalueert deze tegen de volledige codebase en bevestigt ze als feiten of verwijdert ze.

De implementatie is architecturaal elegant. De dream-sub-agent ontvangt alleen-lezen bash-toegang — het kan je code inspecteren maar nooit wijzigen. Schrijftoegang is exclusief beperkt tot geheugenbestanden. Dit betekent dat Autodream het begrip van de agent van je project kan consolideren en verduidelijken zonder enig risico op het per ongeluk wijzigen van je broncode tijdens een achtergrondproces.

Als je mijn stuk hebt gelezen over het bouwen van zelfverbeterende AI-systemen met Claude Code, is Autodream dat concept naar zijn logisch eindpunt gebracht. In plaats van dat de ontwikkelaar handmatig reflectielussen bouwt, handelt de agent zijn eigen geheugenonderhoud af. Het systeem verbetert zichzelf door slechte context te snoeien en goede context te versterken — autonoom, op de achtergrond, terwijl je iets heel anders aan het doen bent.

Dit is de functie waar ik het meest enthousiast over ben uit het hele lek. Niet omdat het het meest opvallend is — Mythos' benchmarks zijn op papier indrukwekkender — maar omdat context-entropie het grootste pijnpunt is in mijn dagelijkse AI-ondersteunde workflow. Een model dat zijn eigen geheugen consolideert tijdens downtime lost een probleem op waar ik elke dag mee worstel.

Het AI-Modellandschap van 2026: Waar Staat Iedereen Nu?

Het Claude source code lek gebeurde niet in isolatie. Het viel in een AI-landschap waar drie bedrijven verwikkeld zijn in een steeds strakkere race. Hier is de stand van zaken per begin april 2026:

Model	S.E. Bench Verified	Belangrijkste Kracht	Contextvenster
Claude Opus 4.6	80,8%	UI-werk, architecturale beslissingen, esthetisch begrip	200K (1M beschikbaar)
GPT-5.4	80,0%	Terminalomgevingen, DevOps, ruwe uitvoersnelheid	1M
Gemini 3.1 Pro	80,6%	Beste prijs-prestatieverhouding	1M native
Claude Mythos (niet uitgebracht)	87,4%	Alles — met name cybersecurity	1M native

Het verschil tussen de top drie publiek beschikbare modellen is flinterdun. Minder dan één procentpunt scheidt ze op de meest gerespecteerde codeerbenchmark. Dat is geen race waar één model "wint." Het is een race waar de beste strategie is het juiste model aan de juiste taak te koppelen.

GPT-5.4 blinkt uit in terminalzware workflows — DevOps, infrastructuurautomatisering, systeembeheertaken waar ruwe uitvoersnelheid er meer toe doet dan code-esthetiek. Ik heb dit uitgebreid behandeld in mijn GPT-5.4 eerste blik.

Gemini 3.1 Pro biedt de beste waardepropositie. Als je bottleneck API-kosten zijn in plaats van ruwe capaciteit, levert Google's model 80,6% S.E. Bench-prestaties tegen een fractie van wat Opus per token kost. Mijn Gemini 3.1 Pro review beschrijft de specifieke use cases waar het modellen verslaat die twee keer zo duur zijn.

Opus 4.6 blijft mijn dagelijkse werkpaard voor alles wat te maken heeft met UI-generatie, complexe architecturale beslissingen, of taken waar de uitvoer er gepolijst en samenhangend uit moet zien. Zijn esthetisch begrip — het vermogen om code te genereren die visueel coherente resultaten oplevert — is nog steeds ongeëvenaard. Mijn hands-on review van Opus 4.6 behandelt dit in detail.

Maar de trend die ik volg gaat niet over welk model het "beste" is. De trend is intelligentie-orchestratie — het gebruik van verschillende modellen voor verschillende subtaken binnen hetzelfde project, gebaseerd op hun specifieke sterktes. De KAIROS daemon-architectuur in de gelekte code ondersteunt dit patroon daadwerkelijk. De achtergrondagent zou theoretisch verschillende modelniveaus kunnen inzetten voor verschillende soorten achtergrondtaken: Haiku voor snelle lint-controles, Sonnet voor testanalyse, Opus voor architectuurbeoordeling.

We verschuiven van "welk AI-model moet ik gebruiken?" naar "hoe stel ik een AI-systeem samen uit meerdere gespecialiseerde modellen?" Dat is een fundamenteel andere vraag, en het vereist een fundamenteel andere vaardigheden.

Wat de Interne Codenamen Ons Vertellen Over Anthropic's Roadmap

Laat me een paar punten verbinden die ik niemand anders duidelijk heb zien uiteenzetten.

De gelekte code verwijst naar vier modelcodenamen: Fenck (Opus), Capra (Sonnet), Tangu (Haiku), en de mysterieuze Numbat. Plus het Capybara-niveau voor Mythos. Dat zijn vijf interne identificatoren voor een bedrijf dat momenteel drie publieke niveaus uitbrengt.

Dit is wat ik denk dat er gebeurt.

Anthropic herstructureert zijn modelaanbod. Het huidige drie-niveausysteem (Haiku / Sonnet / Opus) werd ontworpen toen modellen duidelijke capaciteitsniveaus hadden. Maar naarmate de prestatieverschillen tussen niveaus kleiner worden — Sonnet 4.6 handelt taken af waarvoor slechts een jaar geleden Opus 3.5 nodig was — moet de niveaulogica evolueren.

Capybara (Mythos) voegt een plafond toe boven Opus voor rekenintensieve, hoge-inzet-taken. Numbat vult waarschijnlijk een gat ergens in het huidige aanbod — misschien een niveau tussen Haiku en Sonnet geoptimaliseerd voor hoge-doorvoer, lage-latentie taken waar Haiku te beperkt is maar Sonnet overdreven. Denk aan API-zware workloads waar je duizenden modelaanroepen per minuut maakt en consistente kwaliteit nodig hebt zonder Sonnet-niveau kosten.

De versiereeksen voor Opus 4.7 en Sonnet 4.8 bevestigen dat Anthropic's ontwikkelingscadans snel is. Ze rusten niet op 4.6. Met een voorspellingsmarktkans van 59% dat 4.7 voor juli verschijnt, is de volgende generatie waarschijnlijk nu in een laat teststadium.

Voor ontwikkelaars die bouwen op Claude's API betekent dit dat je modelselectielogica flexibel moet zijn. Het hard coderen van claude-opus-4-6-20260205 in je applicatie gaat je binnen maanden bijten. Bouw abstractielagen. Gebruik modelaliassen. Ontwerp je systemen om modellen te wisselen zonder integratiecode te herschrijven.

Wat Moeten Ontwikkelaars Hier Eigenlijk Mee Doen?

Ik heb vijf dagen diep in dit verhaal gezeten. Dit is wat ik daadwerkelijk verander aan mijn eigen workflow op basis van wat ik heb geleerd.

1. Bereid Je Voor op Autonome Agents — Ze Komen Sneller Dan Verwacht

KAIROS is geen onderzoeksprototype. De gelekte code toont een productierijpe implementatie met veiligheidsbeperkingen, modusomschakeling en toolpermissies. Wanneer dit uitkomt — en het zal uitkomen, waarschijnlijk in 2026 — verandert de ontwikkelaarsworkflow fundamenteel. Begin na te denken over welke delen van je workflow baat zouden hebben bij een achtergrondagent: CI-monitoring, code review-triage, analyse van dependency-updates, beveiligingsscanning.

Als je liever hebt dat iemand deze autonome agentworkflows vanaf nul bouwt, neem ik AI-integratie- en automatiseringsprojecten aan. Je kunt zien wat ik heb gebouwd op fiverr.com/s/EgxYmWD.

2. Verbeter Je Beveiligingshouding — Nu Meteen

Mythos kan kwetsbaarheden sneller vinden dan menselijke verdedigers ze kunnen patchen. Die capaciteit bestaat vandaag, zelfs als het beperkt is. Andere labs bouwen vergelijkbare capaciteiten. Offensieve AI-tools zullen zich verspreiden. Als je applicatie ongepatchte dependencies heeft, verkeerd geconfigureerde servers, of het soort slordige beveiligingsschuld dat "niemand tijd heeft om te fixen," dan sluit het venster om dat stilletjes te fixen.

Draai npm audit op elk project. Werk je dependencies bij. Schakel geautomatiseerde beveiligingsscanning in je CI pipeline in. Dit is niet meer optioneel — het zijn overlevingsbasisbehoeften.

3. Leer Intelligentie-Orchestratie

Het tijdperk van één AI-model kiezen en het overal voor gebruiken loopt ten einde. De ontwikkelaars die in 2026 en daarna zullen floreren zijn degenen die systemen kunnen samenstellen uit meerdere gespecialiseerde modellen. Begin te experimenteren met het routeren van verschillende taaktypen naar verschillende modellen. Gebruik Haiku voor classificatie en triage. Gebruik Sonnet voor generatie en iteratie. Gebruik Opus voor review en architectuur. Bouw het spiergeheugen nu op terwijl de tooling nog volwassen aan het worden is.

4. Ontwerp voor Geheugenpersistentie

Autodream onthult Anthropic's antwoord op context-entropie — en het is een goed antwoord. Maar zelfs voordat het uitkomt, kun je je workflows rond hetzelfde principe ontwerpen. Gebruik CLAUDE.md-bestanden, geheugenbanken en sessiesamenvattingen om je agent persistente context te geven. Wanneer Autodream wel uitkomt, verbetert het wat je al hebt gebouwd. Je wacht niet op de functie — je bouwt het fundament waar het op komt te staan.

5. Houd Numbat in de Gaten

Wat Numbat ook blijkt te zijn, het vertegenwoordigt Anthropic's gok op een capaciteitskloof in het huidige aanbod. Als het een hoge-doorvoer-niveau is tussen Haiku en Sonnet, kan het de economie van AI-zware applicaties drastisch veranderen. Houd Anthropic's release notes in de gaten. Wanneer Numbat opduikt, kunnen early adopters die al modelabstractielagen hebben onmiddellijk integreren.

Het Grotere Plaatje: Wat Anthropic's Slechtste Week Onthult Over AI's Beste Toekomst

Stap even terug van de specifieke functies en benchmarkcijfers. Wat vertelt dit lek ons eigenlijk over waar AI-ontwikkeling naartoe gaat?

Drie dingen vallen op.

Autonome AI is geen toekomstige staat — het is een engineeringprobleem dat nu wordt opgelost. KAIROS en Autodream zijn niet conceptueel. Ze zijn geïmplementeerd. De veiligheidsbeperkingen zijn gedefinieerd. De modusomschakelingslogica werkt. De enige kloof tussen hier en deployment is testen, verfijning en Anthropic's risicotolerantie. De vraag is niet "gaan AI-agents autonoom werken?" Het is "wanneer voelen de bedrijven zich veilig genoeg om het uit te brengen?"

De spanning tussen veiligheid en capaciteit is echt en wordt scherper. Anthropic bouwde een model dat alles op de markt met ruime marge overtreft, en sloot het vervolgens op in een kluis omdat de cybersecurityimplicaties te serieus waren. Die spanning — het meest capabele ding bouwen dat mogelijk is, en dan beslissen of je het uitbrengt — gaat de komende twee jaar van AI-ontwikkeling bepalen. Elk groot lab staat voor dezelfde afweging. Hoe ze het oplossen zal de industrie meer vormgeven dan welke benchmarkverbetering dan ook.

De slotgracht is niet modelintelligentie — het is het systeem rond het model. Mythos' benchmarks zijn indrukwekkend. Maar de functies die mijn dagelijks leven zouden veranderen gaan niet over ruwe intelligentie. Ze gaan over KAIROS die tests draait terwijl ik slaap. Autodream die het geheugen van mijn agent consolideert terwijl ik lunch. PushNotification die me waarschuwt wanneer mijn achtergrondagent iets belangrijks heeft gevonden. Het model is een component. Het systeem is het product.

Dat laatste punt is waar ik steeds op terugkom. We zijn zo gefocust geweest op welk model het hoogst scoort op welke benchmark dat we de echte race hebben gemist. De echte race is wie het beste systeem rond het model bouwt — de autonome lus, de geheugenpersistentie, de intelligente orchestratie.

Op basis van wat ik zag in die 512.000 regels is Anthropic verder in die race dan ik verwachtte. Veel verder.

De .npmignore-fout kostte Anthropic zijn concurrentieverrassing. Maar voor ontwikkelaars zoals jij en ik gaf het ons iets waardevols: een duidelijk zicht op de weg vooruit. En die weg leidt ergens specifiek naartoe — naar AI-systemen die niet alleen reageren wanneer gevraagd, maar anticiperen, handelen en verbeteren terwijl we niet kijken.

De vraag is niet of je klaar bent voor die toekomst. De vraag is of je er nu naartoe bouwt — of dat je je een weg uit de achterstand moet banen wanneer het arriveert.

Veelgestelde Vragen

Wat werd er precies gelekt bij het Claude source code-incident?

Op 31 maart 2026 werden 512.000 regels van Claude Code's TypeScript-broncode blootgesteld via npm source maps door een ontbrekende .npmignore-regel. Het lek onthulde interne modelcodenamen, niet-uitgebrachte functies zoals KAIROS en Autodream, en verwijzingen naar aankomende modelversies waaronder Opus 4.7 en Sonnet 4.8. Voor de volledige uitsplitsing van elke ontdekking, zie de secties hierboven.

Wat is Claude Mythos en wanneer wordt het beschikbaar?

Claude Mythos is Anthropic's niet-uitgebrachte ultra-niveau model dat opereert onder de "Capybara"-niveauclassificatie, met een score van 87,4% op S.E. Bench Verified vergeleken met Opus 4.6's 80,8%. Het is momenteel beperkt tot geselecteerde cyberverdedigingsklanten vanwege zijn vermogen om kwetsbaarheden sneller te ontdekken dan menselijke teams ze kunnen patchen. Er is geen publieke releasedatum aangekondigd.

Wat is KAIROS in Claude Code?

KAIROS is een niet-uitgebrachte autonome daemon-modus waarmee Claude Code als persistent achtergrondagent kan opereren. Het gebruikt een heartbeat-systeem met een proactief actiebudget van 15 seconden, schakelt tussen autonome en samenwerkingsmodi op basis van gebruikersaanwezigheid, en bevat exclusieve tools zoals PushNotification en SubscribePR voor achtergrondoperaties.

Hoe werkt Autodream in Claude Code?

Autodream is een geheugenconsolidatiesysteem op de achtergrond dat een geforkte sub-agent spawnt tijdens inactieve periodes van de gebruiker. Het voegt overlappende observaties samen, elimineert tegenstrijdigheden in sessiecontext, en zet vage aannames om in bevestigde feiten — allemaal met alleen-lezen codetoegang en schrijftoegang beperkt tot alleen geheugenbestanden.

Is Claude Opus 4.7 bevestigd?

Opus 4.7 en Sonnet 4.8 verschenen in versievalidatielogica binnen de gelekte broncode, wat actieve interne ontwikkeling bevestigt. Voorspellingsmarkten schatten de kans op ruwweg 59% dat Claude 4.7 voor 30 juni 2026 verschijnt, hoewel Anthropic geen officiële aankondiging heeft gedaan.

Laten We Samenwerken

Wil je AI-systemen bouwen, workflows automatiseren of je technische infrastructuur opschalen? Ik help je graag.

Fiverr (maatwerk & integraties): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (enterprise-oplossingen): ramlit.com
ColorPark (ontwerp & branding): colorpark.io
xCyberSecurity (beveiligingsdiensten): xcybersecurity.io

Claude's 512K-Regels Lek: Wat Anthropic Niet Wilde Dat Je Zag