Opus 4.6 hallucinaties piekten, OpenAI lanceerde een $100 Pro-abonnement en Claude Code heeft een verborgen token-toeslag. Mijn analyse van april 2026.
23 min
Leestijd
4,426
Woorden
Apr 12, 2026
Gepubliceerd
Geschreven door
Engr Mejba Ahmed
Artikel delen
AI-industrie april 2026: wat er misging en waarom\n\nIk zat midden in een sessie in Claude Code op een donderdagavond -- bezig met het opleveren van een feature voor een klantproject, Opus 4.6 draaide soepel zoals het al weken deed -- toen de antwoorden begonnen te ontsporen. Niet catastrofaal. Subtiel. Het soort afdwaling waarbij je drie prompts diep zit voordat je doorhebt dat het model functie-parameters hallucineert die niet bestaan. Ik controleerde het dubbel. Herstartte de sessie. Hetzelfde probleem. Het model dat ik twee weken eerder nog prees, voelde alsof het van de ene op de andere dag was gelobotomiseerd.\n\nAchteraf bleek ik het me niet in te beelden. En dat was nog maar het begin van wat de meest chaotische week in AI dit jaar zou worden.\n\nApril 2026 trof de AI-industrie als een drukgolf. Kwaliteitsrapporten over Opus 4.6 kelderden. OpenAI bracht een nieuwe prijslaag uit die ontworpen was om gefrustreerde Anthropic-gebruikers weg te kapen -- precies op het moment dat die gebruikers het meest gefrustreerd waren. Een verborgen "token-toeslag" in Claude Code begon sneller door rate limits te branden dan iemand had verwacht. MiniMax bracht een model uit dat ze "open source" noemden, maar dat... niet echt open source is. En Anthropic begon -- te midden van al deze chaos -- stilletjes een developer-ecosysteem op te bouwen dat eruitziet alsof het de volgende Google AI Studio wil worden.\n\nIk heb de afgelopen week elke grote ontwikkeling gevolgd, getest wat ik kon, en gesproken met andere developers in de loopgraven. Hier is mijn eerlijke analyse van wat er gebeurde, wat het betekent, en wat je er daadwerkelijk aan zou moeten doen.\n\n## Opus 4.6 liep tegen een muur -- en de cijfers zijn lelijk\n\nLaat ik er direct over zijn, want de community is verdeeld tussen "het is prima, je verbeeldt het je" en "het model is volledig kapot." De waarheid ligt ergens genuanceerder, en ik heb de data om het te onderbouwen.\n\nVanaf begin april begonnen developers kwaliteitsdegradatie te melden in Opus 4.6 via GitHub-issues, Reddit-threads en Discord-kanalen. Antwoorden voelden minder scherp. Redeneerketens die voorheen waterdicht waren, begonnen gaten te vertonen. En de hallucinaties -- de zelfverzekerde, specifieke, foute antwoorden -- piekten merkbaar.\n\nToen kwamen de Bridgebench-cijfers, en het beeld werd een stuk moeilijker te negeren.\n\nBridgebench is een benchmark voor hallucinatie-nauwkeurigheid die bijhoudt hoe vaak modellen plausibel klinkende maar feitelijk onjuiste beweringen genereren. De score van Opus 4.6 daalde van 83,3% naar 68,3% -- een val van 15 punten in een enkele week. De ranking stortte van de 2e naar de 10e plaats. Dat is geen kleine schommeling. Dat is een model dat meetbaar slechter presteert op een metriek die Anthropic's eigen marketing als sterkte benadrukt.\n\nIk merkte het het meest bij iteratieve codeertaken. Het soort werk waarbij je iets complex bouwt over twintig of dertig uitwisselingen. Opus 4.6 hield context prachtig vast tijdens die lange sessies -- ik prees precies die capaciteit in mijn hands-on review. Nu? Rond uitwisseling vijftien begint het model architectuurbeslissingen uit uitwisseling drie te vergeten. Functie-signatures driften af. Variabelenamen veranderen zonder uitleg. Het is alsof je praat met iemand die steeds vergeet wat je vijf minuten geleden besprak.\n\n### Neft Anthropic Opus opzettelijk?\n\nHier wordt de speculatie interessant -- en hier moet ik eerlijk zijn over wat bevestigd is versus wat theorie is.\n\nDe community-hypothese die aan kracht wint, is dat Anthropic Opus 4.6 "destilleert" -- in feite een goedkopere, lichtere versie van het model draait terwijl het dezelfde naam behoudt. De motivatie zou eenvoudig zijn: rekenkosten verlagen, capaciteit beheren, en misschien -- beweren sommigen -- kunstmatige ontevredenheid creëren die de uiteindelijke lancering van Opus 4.7 indrukwekkender doet lijken in vergelijking.\n\nIk wil hier voorzichtig zijn. Er is geen hard bewijs voor opzettelijke degradatie. Wat we wel weten is dat Opus 4.7 is gesignaleerd in gelekte Claude Code-bronbestanden, samen met verwijzingen naar Sonnet 4.8 en een niet-uitgebracht model met de codenaam "Mythos." Een broncode-lek uit maart 2026 onthulde interne verwijzingen naar deze modellen, wat suggereert dat ze actief worden getest. Anthropic heeft dus absoluut een opvolger in de pijplijn.\n\nZouden ze het huidige model kunnen afknijpen om kosten te beheren terwijl ze het volgende voorbereiden? Het is aannemelijk. Hebben ze het bevestigd? Absoluut niet. Anthropic's officiële reactie wijst op standaard zwaardere reasoning als een factor, en ze hebben "incidenten" erkend die de prestaties beïnvloeden.\n\nWat ik je kan vertellen uit mijn eigen tests: de degradatie is echt, het is meetbaar, en het is het ergst bij precies de taken waar power users het meest om geven -- lange-context codering, multi-step reasoning en iteratief probleemoplossen.\n\n### De rate limit-klem\n\nOm het nog erger te maken, melden Max Plan-abonnees meer restrictieve rate limits. Je betaalt $100 of $200 per maand voor een model dat tegelijkertijd slechter wordt en moeilijker in volume te gebruiken. Dat is een slechte combinatie, en het duwt developers naar alternatieven op een manier die drie weken geleden ondenkbaar was.\n\nWat ons brengt bij een timing die bijna te perfect is.\n\n## OpenAI ruikt bloed: de $100 ChatGPT Pro-laag\n\nOp 9 april 2026 -- midden in de kwaliteitscrisis van Opus 4.6 -- lanceerde OpenAI een nieuwe ChatGPT Pro-laag van $100/maand. De timing was geen toeval. De berichtgeving van CNBC maakte het expliciet: OpenAI ontwierp deze laag om Anthropic direct uit te dagen, gericht op developers die elders tegen rate limits aanliepen.\n\nDit bevat de Pro-laag: vijf keer het Codex-gebruik vergeleken met het Plus-abonnement van $20/maand. Dat is significant -- Codex is OpenAI's AI-coderingsagent, hun directe concurrent van Claude Code. En tot en met 31 mei draaien ze een promotie: 10x het Codex-gebruik van het Plus-abonnement. Tijdelijk, zeker. Maar tijdelijke gulheid op exact het moment dat de gebruikers van je concurrent gefrustreerd zijn, is strategisch briljant.\n\nDe prijsladder ziet er nu zo uit: $20/maand Plus, $100/maand Pro, $200/maand Pro met een 20x gebruikslimiet. OpenAI creëerde een tussenlaag die overeenkomt met het prijspunt van Anthropic's Max-abonnement, terwijl het dramatisch meer Codex-toegang biedt tijdens de promotieperiode.\n\nIk ben niet volledig overgestapt. Maar ik ben aan het testen. En het feit dat ik überhaupt aan het testen ben, zegt iets over hoe hard de Opus-degradatie mijn vertrouwen heeft geschud. Twee weken geleden zou ik gelachen hebben bij het idee om terug te gaan naar OpenAI voor codeerwerk. Opus 4.6 was zo goed. Nu draai ik parallelle workflows om te zien of Codex aankan wat Opus momenteel moeilijk vindt.\n\nHet eerlijke oordeel tot nu toe: Codex is beter bij korte, goed afgebakende taken. Opus -- zelfs gedegradeerd -- is nog steeds superieur voor complex, multi-step architectuurwerk wanneer het een goede sessie heeft. Het probleem is dat "wanneer het een goede sessie heeft" vroeger "altijd" was, en nu meer "60% van de tijd."\n\nDie onbetrouwbaarheid is de echte schade. Ik kan werken met een model dat consistent trager is. Ik kan niet efficiënt werken met een model dat onvoorspelbaar slechter is.\n\n## De Claude Code token-toeslag waar niemand je over vertelde\n\nDeze vloog onder de radar terwijl iedereen discussieerde over modelkwaliteit, en het beïnvloedt je dagelijkse workflow mogelijk meer dan welke benchmarkverandering dan ook.\n\nDevelopers melden dat Claude Code-sessies sneller door rate limits branden dan verwacht -- significant sneller. De community noemt het een "token-toeslag": ruwweg 20.000 extra build tokens die per verzoek worden geïnjecteerd, server-side, voordat je daadwerkelijke prompt wordt verwerkt.\n\nWaar komen deze fantoomtokens vandaan? Wanneer je Claude Code gebruikt met tools ingeschakeld -- webzoeken, code-uitvoering, MCP-connectors -- voegt Anthropic automatisch systeemprompts toe die die mogelijkheden activeren. Deze systeemprompts verbruiken input tokens. En ze worden bij elk verzoek toegevoegd, ongeacht of je die tools in dat specifieke bericht actief gebruikt of niet.\n\nDe praktische impact is bruut. Als je webzoeken, code-uitvoering en een paar MCP-tools hebt ingeschakeld, verbrand je mogelijk 20.000+ tokens overhead per verzoek, alleen al aan systeemprompt-infrastructuur. Over een intensieve codeersessie -- vijftig, zestig verzoeken -- is dat meer dan een miljoen tokens overhead die je nooit hebt gevraagd en nooit hebt gezien.\n\nHier is de workaround die de community heeft gevonden: je kunt downgraden naar een oudere Claude Code-versie. Specifiek zou het draaien van npx [email protected] het opgeblazen tokengebruik vermijden. De trade-off is duidelijk -- je verliest verbeteringen die in nieuwere versies zijn gekomen. Maar als je halverwege je werkdag al tegen rate limits aanloopt, is het het testen waard.\n\nIk moet opmerken: Anthropic heeft dit niet officieel als probleem erkend. De token-overhead van tool-systeemprompts is gedocumenteerd gedrag, maar de omvang -- en het feit dat het schaalt met elke ingeschakelde tool ongeacht gebruik -- voelt als een implementatieprobleem, niet als een bewuste ontwerpkeuze. Mijn advies: als je op een Max-abonnement zit en je rate limits krapper aanvoelen dan ze zouden moeten, schakel dan tools uit die je niet actief gebruikt. Het elimineert de overhead niet, maar vermindert het aanzienlijk.\n\n## Anthropic's grotere spel: van modelbedrijf naar platformbedrijf\n\nTerwijl het Opus-kwaliteitsdrama Twitter domineert, gebeurt er iets veel strategisch belangrijkers bij Anthropic. Ze bouwen een developer-platform -- en het is ambitieuzer dan de meeste mensen beseffen.\n\nDenk eens na over wat Anthropic achttien maanden geleden was: een bedrijf dat modellen maakte. Goede modellen, maar alleen modellen. Je benaderde ze via een API, of via de chatinterface van Claude.ai, en dat was het zo'n beetje.\n\nKijk naar wat ze nu bouwen.\n\nClaude Code is niet langer alleen een CLI -- het is een VS Code-extensie met inline diffs, planreview en gespreksgeschiedenis. Claude Cowork werd algemeen beschikbaar op macOS en Windows met enterprise-grade analytics, OpenTelemetry-ondersteuning en rolgebaseerde toegangscontroles. Ze hebben plugin-marktplaatsen uitgerold -- Knowledge Work Plugins in elf categorieën, Financial Services Plugins met 41 gespecialiseerde vaardigheden. MCP-connectors transformeren Claude van een chatbot naar een integratiehub.\n\nEn nu wordt er gesproken over een volledig AI-studioplatform -- iets vergelijkbaar met Google AI Studio -- voor het bouwen van complete applicaties met Claude als ruggengraat. Multi-repository management in Claude Code Desktop. De infrastructuur voor full-stack ontwikkeling waarbij Claude je workflow niet ondersteunt, maar je workflow IS.\n\nDit is het echte verhaal van april 2026, verborgen achter de flitsendere koppen over modeldegradatie. Anthropic voert een platformstrategie uit. Ze willen niet alleen dat je hun model gebruikt -- ze willen dat je je volledige ontwikkelpijplijn binnen hun ecosysteem bouwt. Plugin-marktplaatsen, desktop-apps, enterprise-connectors, kantoorintegraties. Dat is een slotgracht. Zelfs als Opus 4.6 een moeilijke maand heeft, worden de overstapkosten om Anthropic's ecosysteem te verlaten elke week hoger.\n\nOf dat opwindend of alarmerend is, hangt af van hoeveel vertrouwen je hebt in een enkel bedrijf dat je ontwikkelinfrastructuur bezit. Ik neig naar opwinding -- maar met mijn ogen wijd open voor de lock-in-implicaties.\n\n## Claude for Word: Anthropic's gedurfde enterprise-zet\n\nAls we het toch over ecosysteemuitbreiding hebben -- Claude for Word verscheen in bèta op 10 april 2026, en de enterprise-wereld nam direct notitie.\n\nDe integratie is geavanceerder dan ik verwachtte. Claude leeft in een permanente zijbalk in Microsoft Word en kan documenten opstellen, bewerken en herzien met behoud van de oorspronkelijke opmaak. De kernfunctie die dit onderscheidt van "plak het gewoon in ChatGPT": elke AI-gegenereerde bewerking verschijnt als Microsoft Words bijgehouden wijzigingen. Voor iedereen die werkt in juridische, compliance- of gereguleerde sectoren is dat geen leuke extra -- het is een vereiste. Je hebt een audit trail nodig. Claude for Word biedt er een natively.\n\nHet wordt beter. Claude kan door commentaar-threads werken -- de verankerde tekst lezen, bewerkingen doorvoeren en antwoorden met wat het heeft gewijzigd. Als je ooit een opmerking hebt achtergelaten met "deze paragraaf moet duidelijker" en wenste dat iemand het gewoon zou fixen, dan is dat precies wat dit doet.\n\nMomenteel beschikbaar voor Team- en Enterprise-abonnementen. Enterprise-implementaties kunnen via Amazon Bedrock, Google Cloud Vertex AI of Microsoft Azure worden gerouteerd -- wat betekent dat organisaties de add-in kunnen gebruiken zonder een apart Claude-account. Dat is slim. Het elimineert het grootste enterprise-bezwaar: "we kunnen er geen leverancier bij hebben."\n\nDe marktreactie was veelzeggend. Toen de eerste Claude for Office-integraties eerder dit jaar werden uitgerold, daalde Thomson Reuters 16%, RELX viel 14% en Wolters Kluwer verloor 13% in een enkele handelssessie. Naar schatting $285 miljard aan marktwaarde werd weggevaagd bij software- en legal tech-bedrijven. Dat is geen hype -- dat is de markt die een echte concurrentiedreiging inprijst.\n\nEn de integratie reikt verder dan Word. Claude for Word verbindt met Claude for Excel en Claude for PowerPoint, zodat een enkel gesprek zich over alle drie geopende documenten kan uitstrekken. Bouw de analyse in Excel, schrijf het rapport in Word, maak de presentatie in PowerPoint -- allemaal binnen één Claude-sessie.\n\nAls je liever iemand hebt die AI-gedreven documentworkflows voor je organisatie bouwt, neem ik dergelijke integratieprojecten aan. Je kunt zien wat ik heb gebouwd op fiverr.com/s/EgxYmWD.\n\n## MiniMax M2.7: "open source" verdient aanhalingstekens\n\nMiniMax bracht M2.7 uit begin april en noemde het meteen "volledig open source." De Hugging Face-community riep binnen enkele uren alarm.\n\nDit is wat M2.7 werkelijk is: een Mixture-of-Experts-model met 230 miljard parameters, waarvan slechts 10 miljard parameters actief per token, 256 experts en ondersteuning voor 200K contextlengte. De weights staan op Hugging Face. Je kunt ze downloaden. Tot zover klinkt het open source.\n\nBehalve dat de licentie commercieel gebruik beperkt zonder autorisatie van MiniMax. Dat is geen open source. Dat is source-available met een commerciële beperking. De Open Source Initiative is al tientallen jaren glashelder over dit onderscheid, en "open source" op een model plakken met commerciële beperkingen is -- op zijn best -- misleidende marketing.\n\nDe prestatiecijfers zijn echter oprecht interessant. Op SWE-Pro, dat meerdere programmeertalen omvat, scoorde M2.7 56,22% -- gelijk aan GPT-5.3 Codex. Dat is opmerkelijk voor een model buiten de drie grote aanbieders. En de zelfevolutie-capaciteit is indrukwekkend: M2.7 doorliep een autonome verbeteringslus van meer dan 100 rondes, ontdekte zelfstandig effectieve optimalisaties en behaalde een prestatieverbetering van 30% op interne evaluaties. Een model dat zichzelf daadwerkelijk kan verbeteren, is een ander soort ding dan een model dat alleen vragen beantwoordt.\n\nDe valkuil -- en er is altijd een valkuil -- is de hardwarevereiste. Het lokaal draaien van M2.7 vereist serieuze hardware. We hebben het over 4x DGX Sparks of vergelijkbare opstellingen. BF16 weights bij 200K context is niet iets wat je MacBook Pro aankan, hoeveel RAM je ook hebt. Dit is een model voor organisaties met rekenbudgetten, niet voor indie-developers die in weekenden experimenteren.\n\nVoor iedereen die het via de API draait, doet de licentiekwestie er minder toe. Maar als je van plan bent om het zelf te hosten voor commerciële toepassingen, lees de licentie zorgvuldig voordat je er iets bovenop bouwt. "Open source" is dit niet.\n\n## Gem Opus 426B: open-source distillatie wordt angstaanjagend goed\n\nTerwijl MiniMax losjes omgaat met licentievoorwaarden, doet de open-source community iets werkelijk opmerkelijks met Google's Gemma 4-architectuur.\n\nGem Opus -- technisch "Gemma 4 26B A4B x Claude Opus 4.6" -- is een gefinetuned versie van Google's Gemma 4 die is getraind op reasoning-distillatie uit Claude Opus 4.6-interacties. Het kernidee: neem een kleiner, open model en leer het te denken als Opus door het te voeden met datasets waarbij de reasoning effort expliciet op hoog was ingesteld.\n\nDe resultaten zijn op een fascinerende manier gemengd. Bij dataredenering en analytische taken presteert Gem Opus dramatisch boven zijn gewichtsklasse. De redeneerketens voelen kwalitatief anders aan dan basis Gemma 4 -- gestructureerder, grondiger, bereidwilliger om randgevallen te verkennen voordat het zich aan een antwoord committeert.\n\nBij lange codeer- en debugtaken? Het valt uit elkaar. De distillatie heeft de redeneerpatronen van Opus vastgelegd, maar niet het vermogen om complexe multi-file codebases in het werkgeheugen vast te houden. Wat logisch is -- je kunt een kleiner model leren hoe het moet denken, maar je kunt het niet eenvoudig de ruwe capaciteit geven om evenveel informatie tegelijkertijd te verwerken.\n\nHet hardwareverhaal is veel toegankelijker dan het aanbod van MiniMax. Gemma 4 26B A4B heeft 25,2 miljard totale parameters maar slechts 3,8 miljard actief per token, met een 256K contextvenster. Community-leden draaien het op dubbele 3090 GPU's. Dat is duur voor een hobbyist, zeker -- maar het is een opstelling die je daadwerkelijk thuis kunt bouwen. De kloof tussen "wat de grote labs produceren" en "wat je op je eigen hardware kunt draaien" blijft krimpen, en Gem Opus is een van de interessantste datapunten in die trend.\n\nMijn visie: als je use case analytisch is -- dataverwerking, rapportgeneratie, onderzoekssynthese -- is Gem Opus het testen waard als kosteneffectief alternatief voor API-gebaseerde modellen. Als je langdurige codeerondersteuning nodig hebt, is het er nog niet.\n\n## GPT Image Gen 2: het lek dat een stille lancering werd\n\nOpenAI's volgende generatie beeldmodel heeft zich in het volle zicht verstopt.\n\nDrie anonieme modellen verschenen op het Arena AI-evaluatieplatform onder codenamen die zo uit een bouwmarkt kwamen: Masking Tape Alpha, Gaffer Tape Alpha en Packing Tape Alpha. Community-testers merkten onmiddellijk iets ongewoons op. Deze modellen rendeerden tekst in afbeeldingen met bijna-perfecte nauwkeurigheid -- bedrijfslogo's, handgeschreven notities, zelfs de juiste tijd op een wijzerplaat. Tekstrendering is de achilleshiel van AI-beeldgeneratie geweest sinds DALL-E voor het eerst verscheen. Deze "tape"-modellen hebben het gekraakt.\n\nHalf april 2026 melden bloggers en vroege testers dat ChatGPT GPT Image 2 al uitrolt naar een subset gebruikers in een geleidelijke release. Nog geen officiële aankondiging. Geen persbericht. Gewoon stille beschikbaarheid die dag na dag uitbreidt.\n\nWat we weten uit de tests: significant verbeterde promptnaleving (het genereert wat je daadwerkelijk vroeg, niet zijn interpretatie van wat je bedoelde), realistische details die niet in de uncanny valley vallen, en consistentie over meerdere generaties vanuit dezelfde prompt. Dat laatste punt is belangrijk voor iedereen die aan productieontwerp werkt -- je moet kunnen itereren, en iteratie vereist consistentie.\n\nDe timing is strategisch logisch. Sora -- OpenAI's videogeneratiemodel -- werd in maart 2026 stopgezet, waardoor rekencapaciteit vrijkwam. Het omleiden van die capaciteit naar verbeteringen in beeldgeneratie is een logische allocatie. Brancheanalisten verwachten een formele aankondiging tussen april en juni 2026.\n\nVoor makers en ontwerpers is dit waarschijnlijk de meest praktisch impactvolle aankondiging van de maand. Discussies over modelkwaliteit en herschikkingen van prijslagen raken developers. Betere beeldgeneratie raakt iedereen die visueel communiceert -- en in 2026 is dat iedereen.\n\n## Het verhaal waar niemand over wil praten: menselijke lichamen die robot-AI trainen\n\nIk moet hier van toon wisselen, want dit verhaal is oncomfortabel en belangrijk, en de meeste AI-berichtgeving negeert het.\n\nIn faciliteiten in India en Nigeria binden honderden werknemers iPhones en op het hoofd gemonteerde camera's op hun voorhoofd en brengen uren door met het uitvoeren van repetitieve taken: handdoeken vouwen, dozen stapelen, alledaagse objecten manipuleren. Elke vingerbuiging, elke armreik, vastgelegd in gedetailleerde video. Deze opnames worden naar AI-labs in de Verenigde Staten gestuurd, waar neurale netwerken elke nuance ontleden om humanoïde robots te leren hoe ze met de fysieke wereld moeten omgaan.\n\nMIT Technology Review heeft dit uitgebreid behandeld -- het is een significant segment van de gig-economie geworden. De vergoeding in India's datafabrieken ligt rond de $230-250 per maand voor voltijdse diensten van repetitieve motion capture. Dat is ruwweg 19.000-21.000 rupees.\n\nDe ethische dimensie is onmogelijk te negeren. Deze werknemers trainen systemen die zijn ontworpen om precies de fysieke taken uit te voeren die ze worden betaald om te demonstreren. Ze nemen de precieze bewegingen op die, als de roboticabedrijven slagen, hun arbeid overbodig zullen maken. Het is een meer viscerale versie van dezelfde dynamiek die kenniswerkers treft -- je expertise wordt gebruikt om het systeem te bouwen dat je vervangt.\n\nDe vragen rond data-eigendom zijn even netelig. Wie bezit de specifieke bewegingsdata van de precieze vingerbewegingen van een werknemer? De werknemer? Het opdrachtbedrijf? Het AI-lab dat het verwerkt? Deze video's leggen onbedoeld gezichten, woningen en persoonlijke details vast, die in datasets terechtkomen met minimaal regelgevend toezicht.\n\nDe markt voor AI-trainingsdata zal naar verwachting $8 miljard bereiken in 2030, met India als spil van de toeleveringsketen. Meer dan $6 miljard werd alleen al in 2025 geïnvesteerd in humanoïde robots.\n\nIk heb hier geen pasklaar antwoord. Ik gebruik dagelijks AI-tools. De modellen waarop ik vertrouw, zijn getraind op door mensen gegenereerde data, waarvan een groot deel geproduceerd door onderbetaalde werknemers in ontwikkelingslanden. Doen alsof dit geen onderdeel is van de toeleveringsketen zou oneerlijk zijn. Maar het erkennen zonder er iets aan te doen is nauwelijks beter.\n\nOp zijn minst denk ik dat iedereen die met AI bouwt, zou moeten begrijpen hoe de volledige productieketen eruitziet -- niet alleen het API-endpoint, maar de menselijke arbeid aan het andere einde. De keuzes die we maken over welke bedrijven we met onze uitgaven steunen, onderschrijven impliciet hun arbeidspraktijken. Dat verdient meer kritische aandacht dan het krijgt.\n\n## Wat er komt: Google I/O en DeepSeek V4\n\nTwee evenementen aan de horizon zouden alles wat ik net beschreef kunnen herschikken.\n\nGoogle I/O begint op 19 mei 2026. De verwachte aankondigingen omvatten Gemini 3.5 (of mogelijk Gemini 4 -- de naamgeving is niet bevestigd), plus Android 17 en nieuwe AI-functies in Google's productsuite. Lekken suggereren dat Gemini 3.5 betekenisvolle verbeteringen toont in instructie-opvolging en creatieve taken, hoewel de consistentie van visuele output naar verluidt wisselend blijft. Als Google een model levert dat oprecht concurreert met Opus 4.6 op zijn piek -- nadruk op piek, niet de huidige gedegradeerde staat -- verandert dat de concurrentierekensom volledig.\n\nDeepSeek V4 is de joker. Geruchten plaatsen de release ergens rond eind april of begin mei 2026. DeepSeek V4 Lite is al verschenen via onofficiële kanalen en zou Gemini 3.1 overtreffen op bepaalde benchmarks. DeepSeek's trackrecord van het leveren van echte prestaties tegen lagere kosten maakt V4 het nauwlettend volgen waard -- vooral als je gefrustreerd bent over de prijs-kwaliteitsdynamiek bij Anthropic en OpenAI.\n\nTussen Google I/O, DeepSeek V4, de mogelijke lancering van Opus 4.7 en wat OpenAI als volgende doet, zou mei 2026 april rustig doen lijken. De concurrentiedruk doet wat concurrentie altijd doet -- iedereen dwingen sneller te leveren en agressiever te prijzen. Voor developers is dat uiteindelijk een overwinning. De korte-termijnchaos is de prijs van vooruitgang op de lange termijn.\n\n## Mijn eerlijke scorekaart: wat je deze week daadwerkelijk moet doen\n\nHier kom ik uit na het volgen van dit alles gedurende de afgelopen zeven dagen.\n\nAls je op Anthropic's Max Plan zit en kwaliteitsproblemen ervaart: Stap niet woedend over, maar begin wel een parallelle evaluatie. Open een ChatGPT Pro-proefperiode als je dat nog niet hebt gedaan. Test je specifieke workflows -- geen benchmarks, JOUW daadwerkelijke taken -- tegen Codex. De promotie van 10x gebruik tot en met 31 mei geeft je ruim de mogelijkheid om een eerlijke vergelijking te maken.\n\nAls je door Claude Code rate limits brandt: Controleer hoeveel tools je hebt ingeschakeld. Schakel alles uit wat je niet actief gebruikt in de huidige sessie. Overweeg om npx [email protected] te testen als de token-overhead je workflow doodt. Houd in de gaten of de volgende Claude Code-update dit adresseert.\n\nAls je in een enterprise werkt met documentintensieve workflows: Zet je nu op de wachtlijst voor de Claude for Word-bèta. De integratie met bijgehouden wijzigingen alleen al is het waard voor juridische, compliance- en redactionele teams. De cross-applicatie threading met Excel en PowerPoint is het soort productiviteitsvermenigvuldiger dat de enterprise-prijzen rechtvaardigt.\n\nAls je open modellen evalueert: Gem Opus (Gemma 4 26B finetuned) is de meest interessante optie voor analytische taken. MiniMax M2.7 is krachtig, maar lees de licentie voordat je erop bouwt. Geen van beide vervangt API-gebaseerde modellen voor serieus codeerwerk -- nog niet.\n\nAls je om de ethische koers van de industrie geeft: Volg de berichtgeving van MIT Technology Review over AI-trainingsarbeid. Vraag de bedrijven die je steunt naar hun dataverzameling. Het is niet comfortabel, maar het is noodzakelijk.\n\nDe kop voor april 2026 is niet een enkele ontwikkeling. Het is dat de AI-industrie te snel beweegt voor welke aanbieder dan ook om een comfortabele voorsprong te behouden. Anthropic's Opus was drie weken geleden onaantastbaar. Nu is het verslaanbaar. OpenAI had moeite om te concurreren op codering. Nu zijn ze prijsconcurrerend en aan het verbeteren. Open-source modellen die achttien maanden geleden een grap zouden zijn geweest, evenaren propriëtaire benchmarks.\n\nDe oncomfortabele waarheid -- en de opwindende -- is dat betrouwbaarheid capaciteit heeft vervangen als dat wat het meest telt. We hebben genoeg ruwe intelligentie in deze modellen. Wat we niet hebben, is consistentie. Het team dat betrouwbaarheid als eerste oplost, wint niet alleen de huidige race. Ze herdefiniëren wat AI-tools kunnen worden toevertrouwd.\n\nEn vertrouwen, eenmaal verdiend, is het moeilijkst te repliceren concurrentievoordeel.\n\n## Veelgestelde vragen\n\n### Wordt Opus 4.6 echt slechter of verbeeld ik het me?\n\nJe verbeeldt het je niet. De hallucinatie-nauwkeurigheid op Bridgebench daalde van 83,3% naar 68,3% in een week, en GitHub-issues bevestigen wijdverspreide kwaliteitsdegradatie bij iteratieve codeertaken. Anthropic heeft bijdragende factoren erkend, waaronder standaard zwaardere reasoning. Voor een diepere blik op wat er veranderde, zie de sectie over Opus 4.6-kwaliteit hierboven.\n\n### Wat is de Claude Code token-toeslag en hoe vermijd ik die?\n\nClaude Code injecteert ruwweg 20.000 extra systeemprompt-tokens per verzoek wanneer tools zijn ingeschakeld, waardoor je rate limit sneller wordt verbruikt. Schakel ongebruikte tools uit om overhead te verminderen, of downgrade naar versie 2.1.98 via npx [email protected] om opgeblazen gebruik te vermijden. Zie de sectie over token-toeslag hierboven voor de volledige uitleg.\n\n### Is het nieuwe ChatGPT Pro $100-abonnement het waard om over te stappen vanaf Claude Max?\n\nHet Pro-abonnement biedt 5x Codex-gebruik ten opzichte van Plus, met een tijdelijke 10x-promotie tot en met 31 mei 2026. Het is het sterkst voor goed afgebakende codeertaken, terwijl Opus beter blijft voor complex multi-step werk wanneer het goed presteert. Voer een parallelle evaluatie uit op je specifieke workflows voordat je je vastlegt.\n\n### Wanneer wordt Opus 4.7 verwacht?\n\nOpus 4.7 is gesignaleerd in gelekte Claude Code-bronbestanden naast Sonnet 4.8 en een model met de codenaam "Mythos." Er is geen officiële releasedatum. Speculatie in de community wijst op een lancering op korte termijn of een gebundelde Claude 5-release in mei-juni 2026.\n\n### Is MiniMax M2.7 echt open source?\n\nNee. Ondanks marketingclaims beperkt de licentie commercieel gebruik zonder autorisatie van MiniMax. De weights zijn publiek beschikbaar op Hugging Face, waardoor het source-available is, maar de commerciële beperking diskwalificeert het van de definitie van het Open Source Initiative.\n\n## Laten we samenwerken\n\nOp zoek naar het bouwen van AI-systemen, het automatiseren van workflows of het opschalen van je technische infrastructuur? Ik help graag.\n\n* Fiverr (maatwerk & integraties): fiverr.com/s/EgxYmWD\n* Portfolio: mejba.me\n* Ramlit Limited (enterprise-oplossingen): ramlit.com\n* ColorPark (design & branding): colorpark.io\n* xCyberSecurity (beveiligingsdiensten): xcybersecurity.io\n\n
Vond u dit artikel leuk?
Uw steun helpt mij meer diepgaande technische content, open-source tools en gratis bronnen voor de ontwikkelaarsgemeenschap te maken.
Engr. Mejba Ahmed builds AI-powered applications and secure cloud systems for businesses worldwide. With 10+ years shipping production software in Laravel, Python, and AWS, he's helped companies automate workflows, reduce infrastructure costs, and scale without security headaches. He writes about practical AI integration, cloud architecture, and developer productivity.