Waarom AI-abonnementen binnenkort commodity worden

Ik zat op een dinsdag aan mijn bureau en keek naar vier verschillende AI-factureringsdashboards geopend in vier verschillende tabbladen, en ik realiseerde me dat ik precies de klant was geworden waarvoor de AI-industrie was gebouwd om inkomsten te genereren.

Claude Max, $ 100. Codex Plus, $ 20. Een DeepSeek API-sleutel met ongeveer $ 20 aan tegoed erop. Een OpenRouter-account met nog eens $ 15. Een Kimi K2.6-proefversie die via OpenCode liep en die ik vergeten was, was nog steeds actief. Ik telde het op en het getal bezorgde me een ongemakkelijk gevoel op een manier die ik nog niet helemaal begreep - niet omdat het veel geld was, maar omdat ik voor het eerst in twee jaar echt niet kon vertellen welke van die abonnementen ik nodig had.

Dat is het probleem met de commoditisering van AI-abonnementen. Het kondigt zichzelf niet aan. Het komt niet over als een prijzenoorlog of een dramatische lanceringsgebeurtenis. Het manifesteert zich als een langzaam, sluipend vermoeden dat datgene waarvoor je bovenaan de stapel hebt betaald, niet daadwerkelijk datgene is dat de waarde onderaan de stapel creëert. En als dat waar is – als het model zelf een commodity wordt terwijl de applicatielaag alle marge opslokt – dan zou de abonnementsstapel die ik twee jaar lang heb opgebouwd een probleem kunnen oplossen dat op het punt staat te bestaan.

Ik ga je vertellen waar ik eigenlijk voor betaal, wat ik daadwerkelijk krijg, waarom ik denk dat de open-weight-modellen de kloof snel genoeg hebben gedicht om het prijsmodel te doorbreken dat de grenslaboratoria financiert, en waar volgens mij de echte slotgrachten in beweging zijn. Een deel hiervan zal op ketterij lijken als je diep in het Claude- of OpenAI-ecosysteem zit. Ik ook. Daarom schrijf ik het.

De stapel waarvoor ik eigenlijk betaal

Laat ik het zo uitleggen dat we met dezelfde cijfers werken.

Ik betaal $100 per maand voor Claude Max 5x, wat me elke vijf uur ongeveer 225 berichten oplevert op Sonnet 4.7 en een veel kleinere envelop op Opus 4.7. Dat is het plan dat ik gebruik voor ontwerpgericht werk, schrijven in lange vorm en de projecten waarbij ik het specifieke smaakprofiel van Opus in de output wil hebben. Er is een niveau van Max 20x van $ 200 dat ik twee keer heb ingeschakeld en beide keren weer heb uitgeschakeld omdat ik de uitgaven op een stabiele basis niet kon rechtvaardigen.

Ik betaal $ 20 per maand voor ChatGPT Plus, waardoor ik toegang krijg tot Codex met het GPT-5.5-model en – tot en met 31 mei 2026 – een tijdelijke boost van 25x op de Codex-limiet van 5 uur, die terugvalt naar 5x zodra de promotie eindigt. Dat is het plan dat ik gebruik voor backend-code, datapijplijnen, ML-steigers en het soort grindwerk waarbij de efficiëntie van GPT-5.5 echt meetbaar is. Ik heb de onderlinge confrontatie gedetailleerd besproken toen ik schreef over Codex versus Claude Code, en de kloof die ik daar noemde is sindsdien alleen maar groter geworden.

Dan is er de wisselende cast van API-sleutels. DeepSeek, momenteel beschikbaar op V4 Pro tegen sterk gereduceerde promotieprijzen tot en met 31 mei. Kimi K2.6 tot en met OpenRouter voor $0,60 per miljoen inputtokens en $2,50 per miljoen output. Een handvol gratis modellen op OpenRouter die een beperkte snelheid krijgen van twintig verzoeken per minuut, maar prima werken voor batchtaken die niet tijdgevoelig zijn. Ik bewaar deze deels als reserve voor wanneer Anthropic of OpenAI een incident op de statuspagina tegenkomt, en deels omdat ik genoeg experimenten per maand uitvoer om ze daadwerkelijk te gebruiken.

De totale schade, vóór tokenuitgaven, ligt ergens tussen de €135 en €160 per maand, afhankelijk van wat ik heb getest. Voeg het API-gebruik toe en een gemiddelde maand komt uit in het bereik van $200-$280. Dat is het nummer op de spreadsheet waar ik dinsdag naar keek.

Dit is wat mij opviel toen ik de analyse verdiepte: de propriëtaire abonnementen waren goed voor ongeveer 78% van de kosten en ongeveer 60% van de werkelijke redeneringstokens die ik die maand gebruikte. Niet 60% van de waarde – 60% van de tokens. Het goedkope spul droeg meer van de lading dan ik had aangenomen.

Dat is het moment waarop de vraag ophield te zijn: "hoe optimaliseer ik mijn AI-stack?" en begon te vragen: "Waar betaal ik eigenlijk deze topabonnementen voor?"

Het inhaalprobleem

Om te begrijpen waarom deze vraag ertoe doet, moet je kijken naar waar de open-weight-modellen nu staan en waar ze een jaar geleden stonden.

In mei 2025 was het gesprek eenvoudig. Claude en GPT vormden de grens. Open-weight-modellen zoals Mistral en de vroege Qwen- en DeepSeek-releases haalden specifieke benchmarks in, maar verloren zwaar op het werk dat er toe deed: redeneren in lange context, gebruik van agentische tools, het soort meerstaps-engineeringtaken waar echte ontwikkelaars om geven. $ 100 per maand betalen voor Claude was een no-brainer omdat het op één na beste alternatief niet echt een alternatief was.

Die kloof is in 2026 niet alleen kleiner geworden. Op een aantal specifieke benchmarks is deze kloof zelfs volledig gedicht.

Artificial Analysis rangschikt DeepSeek V4 Pro op plaats 52 op de Intelligence Index – het #2 open-weight redeneermodel, na Kimi K2.6 – en het model kost ongeveer $1.071 om de volledige benchmarksuite uit te voeren, tegenover $4.811 voor Claude Opus 4.7. Dat is een kostenverschil van 4,5x bij een onderlinge intelligentievergelijking. Op SWE-Bench Verified, de meest geciteerde coderingsevaluatie op het scorebord, scoort DeepSeek V4 Pro Max 80,6%, Kimi K2.6 scoort 80,2% en MiniMax M2.5 belandt op 80,2% – allemaal binnen een procentpunt van de 80,8% van Claude Opus 4.6. HumanEval is op dit punt feitelijk verzadigd; Kimi K2.5 leidde met 99,0% voordat de benchmark ophield met het zinvol discrimineren tussen topmodellen.

Lees die cijfers aandachtig. De modellen met open gewicht verslaan de gepatenteerde modellen niet. Ze matchen ze op de benchmarks waarvoor de gepatenteerde modellen speciaal zijn ontworpen om te winnen, tegen een fractie van de kosten. En het kostenverhaal is het deel dat feitelijk destabiliseert.

DeepSeek V3.2 verlaagde de API-prijzen met de helft eind 2025 tot $ 0,028 per miljoen cache-hit-invoertokens en $ 0,42 per miljoen output. V4 Pro heeft momenteel een promotiekorting van 75% tot en met 31 mei 2026. Kimi K2.6 kost $ 0,60 input en $ 2,50 output. Ter vergelijking: Claude Opus 4.7 is ongeveer 8-10x duurder op het gebied van uitvoertokens dan Kimi, en ongeveer 30x duurder dan DeepSeek V4 op het gebied van invoer. Een SaaS-workload die 100 miljoen tokens per maand verwerkt – niet ongebruikelijk voor een agentische applicatie – betaalt ongeveer $310 met Kimi versus $4.000+ met GPT-5.4 of Opus 4.7.

Dit is de kip-en-ei-cyclus waar niemand aan de top van de stapel over wil praten. De grenslaboratoria trainen een duur nieuw model. Ze vragen er een premie voor omdat ze de opleidingskosten moeten terugverdienen en de volgende generatie moeten financieren. De open-weight labs reverse-engineeren de technieken, leveren een model dat 90-95% zo capabel is tegen de prijs, en de marktroutes dienovereenkomstig. Tegen de tijd dat het eigen laboratorium versie N+1 aankondigt, hanteert het open-weight-model al een prijsstelling die het grootste deel van de inkomstenmogelijkheden van de vorige generatie doet verdwijnen.

Dat is geen vijfjarige trend. Dat is de cyclus waarin we ons al bevinden.

De Android iOS-analogie en waarom deze kapot gaat

De schoonste analogie die ik heb gehoord voor wat er gebeurt, is de Android-versus-iOS-dynamiek uit de jaren 2010. Het eigen AI is iOS: gecontroleerd, gepolijst, verticaal geïntegreerd, duur. Open-weight AI is Android - flexibel, aanpasbaar, gefragmenteerd, goedkoop. iOS had tien jaar lang een voorsprong omdat Apple's hardware-software-integratie een lock-in creëerde die de openheid van Android niet kon repliceren op hetzelfde kwaliteitsniveau.

De analogie werkt, totdat je het gedeelte opmerkt waar het volledig kapot gaat.

De iOS-gracht van Apple was hardware. Je kunt iOS niet op een Samsung-telefoon draaien. De verticale integratie die de iPhone premium maakte, werd beschermd door de letterlijke fysieke chips in het apparaat. Apple controleerde de Photonic Engine, de Neural Engine en de Secure Enclave – en die hardware lock-in zorgde ervoor dat de prijsstelling van het platform vijftien jaar lang intact bleef.

Er is geen gelijkwaardige slotgracht in de AI-gevolgtrekking.

Een Kimi K2.6-model dat draait op een Nvidia H200 in een datacenter in Singapore produceert tokens die functioneel identiek zijn aan een Kimi K2.6-model dat draait op een Huawei Ascend 950PR in Shenzhen, die functioneel identiek zijn aan een Kimi K2.6-model dat draait op welk cluster dan ook. OpenRouter stuurt het verzoek toevallig naar die dag. De "hardware" is vervangbaar. Het ‘besturingssysteem’ – de modelgewichten – is te downloaden. De "app store" – de API-gateway – wordt gecommoditiseerd door diensten als OpenRouter, die tientallen providers achter één enkele sleutel samenbrengen.

Als Apple gedwongen was iOS te leveren als een downloadbare ISO die op elke handset met de juiste specificaties kon draaien, zou iOS er in 2015 heel anders hebben uitgezien. Dat is de positie waarin de eigen AI-labs zich vandaag de dag bevinden. Hetgeen waarvoor ze een premie proberen te vragen, kan worden gerepliceerd door een concurrent met $ 5,6 miljoen aan rekenkracht, en het resulterende model kan worden bediend door iedereen met een GPU en een API-eindpunt.

Dit is de reden waarom de analogie die ik nu feitelijk gebruik niet iOS versus Android is. Het is Apple versus iedereen op de laptopmarkt van eind jaren 2000. Apple maakte nog steeds prachtige machines. Apple had nog steeds een premie. Maar op het moment dat de onderliggende componenten – de chips, de beeldschermen, de besturingssystemen – breed beschikbaar kwamen voor andere fabrikanten, daalde het marktaandeel van Apple tot enkele cijfers en bleef daar tien jaar lang. Apple overleefde niet vanwege de hardware, maar vanwege het applicatie-ecosysteem, de ontwikkelaarstools, de ontwerptaal en het merkverhaal. De hardware werd tafelpalen.

Dat is waar de AI-labs naartoe gaan. Het model wordt tafelinzet. De vraag is wat er daarna overblijft.

Waar ik denk dat de echte slotgrachten zijn

Dit is het onderdeel waar ik al weken over nadenk, omdat het bepaalt wat de transitie overleeft.

Ik zie vier echte grachten ontstaan, en slechts één daarvan is waarvoor ik momenteel betaal.

De eerste gracht is de applicatielaag. Dit is Claude Code. Dit is Codex. Dit is de integratie van het model in een specifieke workflow met specifieke tools, specifieke UX-beslissingen, specifieke ontwerpkeuzes over wanneer om bevestiging te vragen versus wanneer autonoom te handelen. Als ik $ 100 per maand betaal voor Claude Max, is het deel dat ik eigenlijk niet kan repliceren met een DeepSeek API-sleutel niet het model - het zijn de acht maanden van [Claude Code workflow verfijningen] (/claude-code-advanced-workflow-guide) Anthropic heeft herhaald, de agent vaardigheden ecosysteem, de slash-opdrachten, de manier waarop de agent langlopende taken afhandelt. Anthropic verkoopt geen tokens. Ze verkopen een codeeromgeving die tokens gebruikt.

Dat onderscheid zal de komende twee jaar elke maand belangrijker worden.

De tweede uitdaging is de compliance-infrastructuur. Werklasten in de gezondheidszorg, de financiële wereld, de juridische sector en de overheid zijn bezorgd over zaken die DeepSeek en Kimi niet gemakkelijk kunnen bieden: garanties op gegevenslocatie, audittrails, SOC 2-attest, grondwettelijk AI-veiligheidsbeleid, het soort papierwerk waarmee een Fortune 500-inkoopteam een vakje kan aanvinken. Anthropic heeft naar verluidt 70% van de rechtstreekse zakelijke matchups gewonnen tegen OpenAI voor nieuwe AI-kopers, en een betekenisvol deel daarvan is de volwassenheid van het bestuur, niet de kwaliteit van het ruwe model. Dit is de gracht die meegroeit met de complexiteit van de regelgeving, en het is degene die open-weight-laboratoria het moeilijkst kunnen repliceren, omdat het regelgevende werk fundamenteel orthogonaal is aan het modelwerk.

De derde gracht is het ecosysteem. Dit is het Model Context Protocol. Dit zijn de integraties met Slack, Notion, Figma, Canva, GitHub, elke database die er toe doet. Dit is de ontwikkelaarsdocumentatie, de SDK-kwaliteit, de aanwezigheid op de conferentie, de manier waarop tools van derden rond een platform oplichten. Apple heeft de laptopoorlog gewonnen tegen het ecosysteem, niet tegen de hardware. De AI-labs die het komende decennium zullen winnen, zullen winnen op het gebied van ecosysteem, niet op modelintelligentie. En het opbouwen van ecosystemen duurt jaren, wat betekent dat de eigen laboratoria een echte, maar in de tijd beperkte voorsprong hebben.

De vierde gracht is merk en vertrouwen. Als ik iets bouw voor een betalende klant, gebruik ik standaard Claude of GPT, niet omdat ze meetbaar beter zijn in de specifieke taak, maar omdat als er iets misgaat, ik de keuze kan verdedigen. "Ik heb Claude gebruikt" is een verdedigbaar antwoord tijdens een klantbijeenkomst. "Ik gebruikte DeepSeek" vereist een uitleg van vijftien minuten over waarom een Chinees model met open gewicht geschikt is voor hun HIPAA-workflow. Die verdedigbaarheid is echt geld waard, en het is een gracht waar de eigen laboratoria te weinig in investeren om over te praten, omdat ze het als vanzelfsprekend beschouwen.

Waar ik $100 per maand voor betaal, als ik eerlijk ben, zijn slotgracht één en drie. Het model is niet langer het product. Het harnas is het product, de integraties zijn het product, het ecosysteem is het product. Al het andere kan worden gerepliceerd door een open model voor 1/10th de prijs.

Dat is een fundamenteel ander bedrijf dan het bedrijf dat Anthropic en OpenAI in 2024 aan het opbouwen waren.

Wat dit betekent voor Anthropic en OpenAI

De grenslaboratoria weten dit. Als je oplet, kun je het zien in hun productstrategie.

Anthropic behaalde in maart 2026 een omzet van $30 miljard op jaarbasis, een stijging van ongeveer 1.400% op jaarbasis. OpenAI staat op ongeveer $25 miljard ARR. Dat zijn buitengewone cijfers, maar het gaat om de samenstelling. Een groeiend deel van de omzet van beide bedrijven komt uit bedrijfscontracten en platformintegraties – de applicatielaag en de compliancelaag – en niet uit de verkoop van individuele API-tokens. Anthropic en OpenAI hebben begin mei beide joint ventures gelanceerd voor zakelijke AI-diensten. Geen van deze ondernemingen gaat over het verkopen van tokens. Ze gaan over het verkopen van implementaties.

De strategische verschuiving is duidelijk: stop met concurreren op basis van ruwe modelintelligentie, waar de open-weight-laboratoria u kunnen matchen voor de prijs, en begin te concurreren op de laag boven het model waar u kosten kunt vragen voor resultaten in plaats van voor gevolgtrekkingen. Claude Code heeft niet dezelfde prijs als een model API. Het is geprijsd als een ontwikkelaarstool. Codex heeft niet dezelfde prijs als een model API. De prijs is vergelijkbaar met een codeerabonnement. Wat steeds meer gecommoditiseerd wordt, is het deel dat steeds vaker wordt gebundeld in plaats van als regelitem te worden verkocht.

Dit is ook de reden waarom de bundeling van belang is. Als ik voor $ 100 per maand Sonnet 4.7 en Opus 4.7 toegang plus Claude Code plus de marktplaats voor agentenvaardigheden plus MCP-integraties plus de desktop-app plus spraakmodus plus een tiental andere dingen koop, brengt Anthropic mij geen kosten in rekening voor het model. Anthropic brengt mij kosten in rekening voor de bundel, en het model is het deel van de bundel dat het minst verdedigbaar wordt. Haal de bundel uit elkaar en het model alleen al is misschien $20 per maand waard bij de huidige open-weight benchmarks. Haal de bundel uit elkaar en de applicatielaag alleen al is gemakkelijk €80-€120 per maand waard. De bundeling is niet toevallig. Het is de overlevingsstrategie.

Het risico is wat er gebeurt als een derde partij een voldoende goede applicatielaag bovenop een open-weight-model bouwt. Dat is niet meer hypothetisch. OpenCode is een geloofwaardige concurrent van Claude Code die op backends met meerdere modellen draait. Met het OpenCode Go-abonnement krijg je vier parallelle agents en toegang tot V4 Pro, V4 Flash en verschillende andere open-weight-modellen voor $ 5 in de eerste maand en $ 10 per maand daarna. Dat is een korting van 90% op een stapel die het meeste doet van wat Claude Code doet. De applicatielaaggracht is reëel, maar niet oneindig. Het open-source-ecosysteem gaat er op dezelfde manier mee aan de slag als aan de modellaag.

Dit is waar het interessant wordt voor de existentiële vraag. Als Adobe – om het voorbeeld te gebruiken waar ik steeds op terugkom – een verfijnde DeepSeek V4 Pro in Photoshop verpakt en deze levert als "Adobe Intelligence" met volledige ontwerpsysteemintegratie en een gepolijste UX, wat verkoopt Anthropic dan precies dat ik niet van Adobe kan krijgen? Wat verkoopt OpenAI dat ik niet kan krijgen van een vergelijkbaar gemotiveerde concurrent met diepgaande distributie? Het model wordt onzichtbaar. De applicatielaag is waar de klant voor betaalt. En elk applicatiebedrijf ter wereld heeft nu een pad om zijn eigen pad te bouwen.

Wat ik doe met mijn abonnementsstapel

Laat ik specifiek zijn over wat er verandert in mijn eigen situatie, omdat het strategische beeld er alleen toe doet als het daadwerkelijk gedrag verandert.

Ik bewaar Claude Max voorlopig. De waarde van de applicatielaag is reëel, de ontwerpsmaak in de uitvoer van Opus 4.7 is nog steeds echt beter dan alles wat ik kan krijgen van open-weight-modellen, en Claude Code's [agent skills-systeem] (/agent-skills-advanced-claude-code) doet dingen die ik elders niet kan reproduceren. Maar ik houd de prijzen nauwlettend in de gaten. Als Anthropic de Max-laag verhoogt of de waarde verzwakt, downgrade ik naar Pro en leid ik het zware werk via OpenRouter.

Ik behoud Codex Plus om dezelfde reden. De promotielimiet van 25x tot en met 31 mei maakt het plan van $ 20 op dit moment een absurd goede prijs, en de efficiëntie van GPT-5.5 in de agentische coderingslus is de beste in zijn klasse voor het soort backend-werk dat ik doe. Na 31 mei dalen de limieten terug naar 5x en zal ik opnieuw evalueren.

Ik verhoog opzettelijk mijn uitgaven voor OpenRouter en DeepSeek. Ik wil voldoende operationele kennis hebben van de open-weight stack, zodat ik, als de propriëtaire abonnementen geen zin meer hebben, het grootste deel van mijn werklast kan overzetten met een weekend vol inspanning in plaats van een kwart van de migratiepijn. Dit is een strategische afdekking, geen onmiddellijke kostenoptimalisatie. De kostenoptimalisatie is een neveneffect. Ik heb de gratis Claude Code proxy-aanpak in detail besproken als je dezelfde fallback-infrastructuur wilt opzetten.

Ik gebruik OpenCode parallel voor minimaal één project per maand. Niet omdat ik Claude Code uitschakel – dat doe ik niet – maar omdat de kloof tussen de open-source codeeragenten en de propriëtaire agenten sneller kleiner wordt dan de meeste mensen beseffen, en de dag dat een externe agent binnen 95% van de UX van Claude Code komt, is de dag dat een aanzienlijk deel van de omzet van Anthropic in gevaar komt. Ik wil weten wanneer die dag is, en ik weet het liever vroeg dan laat.

Ik voeg geen nieuwe eigen abonnementen toe totdat ik een gracht zie die dit rechtvaardigt. Gemini Advanced, Cursor Pro, de verschillende zakelijke AI-tools: geen van deze heeft me een applicatielaag laten zien die voldoende verschilt van wat ik al heb. Totdat dat verandert, zal de stapel met open gewicht elke nieuwe werklast absorberen die geen specifieke reden heeft om op een eigen platform te leven.

Dat is de discipline die ik in mijn eigen gebruik inbouw. Schrijf u in waar de applicatielaag waarde creëert die ik nergens anders kan vinden. Betaal tokens waarbij het model het enige is dat er toe doet. Voer overal waar ik kan modellen met een open gewicht uit zonder dat dit ten koste gaat van de uitvoerkwaliteit. En beoordeel de hele stapel elk kwartaal opnieuw, omdat de prijs-per-kwaliteitcurve zo snel beweegt dat de optimale toewijzing van het afgelopen kwartaal de overbesteding van dit kwartaal is.

Wat dit betekent voor solo-ontwikkelaars en kleine teams

Als je een solo-ontwikkelaar bent of een klein team leidt, is hier de praktische versie.

Begin met één eigen abonnement, niet drie. Kies de applicatielaag waarin je gaat werken. Voor de meeste bouwers op dit moment is dat Claude Code met het $20 Pro-abonnement of Codex met het $20 Plus-abonnement. Je hebt ze niet allebei nodig. Kies degene waarvan de UX past bij uw manier van werken, leg u hier minimaal een maand aan vast en stop met het wekelijks openen van vergelijkingswinkels.

Voeg een enkel toegangspunt met open gewicht toe als reserve. OpenRouter is de schoonste inzending: één account, één API-sleutel, tientallen modellen, [gratis modellen voor werk met lage inzet] (/claude-code-openrouter-free-models). Besteed $ 20 om credits te laden en elke werklast die niet latentie- of kwaliteitskritisch is, door te sturen via Kimi K2.6 of DeepSeek V4. Het zal je verbazen hoeveel van je dagelijkse werk in dat profiel past.

Gebruik de besparingen om te betalen voor hulpmiddelen die de verbinding versterken. De applicatielaag is waar de gracht zich bevindt, en dat omvat tools die geen AI-abonnementen zijn. Een goed observatieplatform. Een echte proefopstelling. Een vectordatabase met de juiste hybride zoekfunctie. De invloed die je krijgt van die verbindingen met welk model je ook gebruikt, en ze verliezen geen waarde als de modellaag onder je beweegt.

Let op de consolidatie. De huidige prijsstelling is instabiel. Ik verwacht dat binnen twaalf maanden ten minste één groot eigen laboratorium op agressieve wijze zal bundelen, ten minste één groot applicatiebedrijf een geloofwaardig verticaal AI-product op open-weight-infrastructuur zal leveren, en ten minste één open-weight-laboratorium een model zal uitbrengen dat de resterende kloof op het gebied van agentisch werk met lange context zal dichten. Wanneer een van deze dingen gebeurt, zal de optimale abonnementsstapel verschuiven, en de enige manier om daar achter te komen is door goed genoeg op te letten zodat je opnieuw kunt evalueren wanneer de signalen binnenkomen.

Als je een team van drie tot tien mensen leidt, heb je een andere calculus. Centraliseer uw modeltoegang via één enkele gateway — OpenRouter of uw eigen routeringslaag — zodat u van provider kunt wisselen zonder de applicatiecode aan te raken. Onderhandel over bedrijfsprijzen met het lab dat u de beste applicatielaagwaarde biedt, omdat de volumekortingen aan de bedrijfseigen kant nog steeds betekenisvol zijn. Houd ten minste één model met open gewicht warm tijdens de productie, zelfs als deze slechts 10% van het verkeer verwerkt. Op de dag dat je ervoor moet kiezen, wil je het integratiewerk niet voor de eerste keer doen.

Voor grotere teams luidt het antwoord steeds vaker dat het model een inkoopbeslissing is en geen technische beslissing. Het engineeringswerk bevindt zich in de applicatielaag. Dat is het deel dat differentiatie creëert. Degene die in 2026 uw AI-abonnementsbeslissingen neemt, zou dezelfde persoon moeten zijn die uw beslissingen over ontwikkelaarstools neemt, omdat de grens tussen deze twee feitelijk is verdwenen.

Het grotere geheel

Ik denk niet dat Anthropic of OpenAI zullen verdwijnen. De bedrijven zijn te goed gepositioneerd, de grachten in de applicatielaag zijn te reëel en de merkpremie is te waardevol om snel te verdampen. Maar ik denk wel dat het bedrijf dat ze in 2027 runnen er anders uit zal zien dan het bedrijf dat ze nu runnen.

Het traditionele AI-abonnementsmodel – betaal ons een vast maandelijks bedrag voor toegang tot ons model, en het model is het product – staat ernstig onder druk. Het werkt nu omdat de applicatielaag in het abonnement is gebundeld en de meeste gebruikers deze twee niet gemakkelijk kunnen scheiden. Terwijl open-weight-modellen de capaciteitskloof blijven dichten, zal de bundel van beide kanten onder druk komen te staan: derde partijen die concurrerende applicatielagen bouwen bovenop goedkope open-weight-modellen, en slimme gebruikers die werklasten routeren naar welke provider dan ook die voor een bepaalde taak de beste prijs-kwaliteitverhouding levert.

Ik denk dat de toekomst waar we naartoe gaan bestaat uit honderden winnaars, niet twee of drie. Verschillende applicatielagen voor verschillende branches. Verschillende modellen met open gewicht voor verschillende kostengevoeligheidsprofielen. Verschillende orkestratietools die tussen deze tools routeren op basis van de taak. De grenslaboratoria zullen er nog steeds toe doen – ze zullen nog steeds de modellen trainen die de open-gewichtslaboratoria aan reverse-engineering doen, ze zullen nog steeds de meest gepolijste applicatielagen verkopen, ze zullen nog steeds premies eisen in gereguleerde industrieën. Maar ze zullen een segment zijn van een veel bredere markt, niet de hele markt.

Dat is naar mijn mening een gezondere sector. Het is een meer competitieve industrie. Het is een sector waar het erom gaat wat je bovenop het model bouwt, en niet of je toevallig de eigenaar van het model bent. En het is een sector waarin de abonnementenstapel die ik vandaag gebruik – drie propriëtaire abonnementen, drie API-sleutels, een half dozijn tools – er binnen achttien maanden uit zal zien als een artefact uit een vroeger tijdperk.

Ik betaal tegenwoordig voor propriëtaire abonnementen omdat de applicatielaag nog steeds de waarde heeft, en de propriëtaire labs nog steeds de beste applicatielagen bouwen. Ik blijf betalen zolang dat waar is. Maar ik ben de spierkracht aan het opbouwen om over te stappen op het moment dat dat niet het geval is, omdat het alternatief – een stapel abonnementen in de vergetelheid brengen omdat het veranderen ervan als te veel werk voelde – de duurste fout is die ik kan maken in een markt die zo snel evolueert.

Kijk dus naar je eigen stapel. Tel op wat u betaalt. Vraag uzelf af met welke abonnementen u een model koopt en met welke abonnementen u een applicatielaag koopt. Annuleer degenen die alleen een model voor u kopen. Gebruik de besparingen om te betalen voor degenen die een workflow voor u kopen die u echt niet zelf zou kunnen bouwen. En voer parallel een open-weight-model uit, ook al is het maar voor één werklast, ook al is het maar voor een middag per week – want op de dag dat de wiskunde omslaat, wil je al weten hoe je in die wereld moet leven.

Dat is de weddenschap die ik sluit. Het model wordt een commodity. De applicatielaag is het product. En de abonnementsstapel die u op 6 mei 2026 gebruikt, is vrijwel zeker niet de abonnementsstapel die u op 6 mei 2027 zou moeten gebruiken.

Veelgestelde vragen

Zijn AI-abonnementen in 2026 nog steeds de moeite waard?

Ja, maar om een beperktere reden dan twee jaar geleden. Het model zelf is nu een commodity - opties met een open gewicht zoals DeepSeek V4 Pro en Kimi K2.6 komen overeen met de eigen grens op de meeste coderingsbenchmarks voor 1/10th de kosten. Waar je eigenlijk voor betaalt voor $100/month is de applicatielaag: Claude Code, Codex, de vaardigheden van de agenten, de integraties, de gepolijste UX. Als de applicatielaag waarde creëert die u niet kunt repliceren, is het abonnement de moeite waard. Als dit niet het geval is, routeer dan via OpenRouter.

Wat is de applicatielaag in AI?

De applicatielaag bestaat uit alles rond een basis-AI-model dat er een bruikbaar product van maakt: het harnas van codeeragenten, de workflow-integraties, de UX-beslissingen, het veiligheidsbeleid, de ontwikkelaarstools, het ecosysteem van plug-ins van derden. Claude Code en Codex zijn applicatielagen die bovenop de Claude- en GPT-modellen zijn gebouwd. Nu modelintelligentie steeds meer gemeengoed wordt, is de toepassingslaag de plek waar de duurzame gracht leeft.

Hoeveel bespaar ik echt met modellen met een open gewicht?

Op ruwe tokenkosten, ongeveer 4-30x, afhankelijk van het model en de werklast. Claude Opus 4.7 kost ongeveer $4.811 om de Artificial Analysis Intelligence Index-suite uit te voeren, tegenover $1.071 voor DeepSeek V4 Pro. Een werklast van 100 miljoen tokens per maand bedraagt ongeveer $310 op Kimi K2.6 versus $4.000+ op GPT-5.4. Het addertje onder het gras is dat je voor onbewerkte tokens betaalt: je krijgt de applicatielaag (Claude Code, Codex) niet zonder deze zelf te bouwen of zoiets als OpenCode te gebruiken.

Moet ik Claude Max of Codex Plus annuleren?

Annuleer niet beide, maar je hebt ze waarschijnlijk niet allebei nodig. Kies de applicatielaag die past bij uw manier van werken – Claude Max als u design-forward en long-form werk doet, Codex Plus als u backend-, ML- en datapijplijnwerk doet – en leid al het andere door een open-weight model op OpenRouter. De huidige 25x Codex-promotie tot en met 31 mei 2026 maakt het $ 20 Plus-abonnement uitzonderlijke waarde als Codex past bij uw workflow.

Wat is OpenRouter en hoe past het daarin?

OpenRouter is een enkel API-eindpunt dat u toegang geeft tot meer dan 300 AI-modellen (eigen en open-weight) zonder maandelijkse kosten. U voegt credits toe en betaalt per token tegen bijna de ruwe providerprijzen. Het is de schoonste manier om terug te vallen op open-weight-modellen zonder meerdere API-sleutels te beheren, en de gratis laag (beperkt tot 20 verzoeken per minuut, 200 per dag) is voldoende voor batchwerk met lage inzet. Ik gebruik het als de routeringslaag achter elke werklast die niet op een eigen platform hoeft te staan.

Laten we samenwerken

Wilt u AI-systemen bouwen, workflows automatiseren of uw technische infrastructuur schalen? Ik help je graag.

Fiverr (aangepaste builds en integraties): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (ondernemingsoplossingen): ramlit.com
ColorPark (ontwerp en branding): colorpark.io
xCyberSecurity (beveiligingsdiensten): xcybersecurity.io

Waarom AI-abonnementen binnenkort commodity worden