Codeex Review: ik bouwde een AI-systeem voor YouTube-comments

Ik negeerde Codeex bijna. Nog een AI-desktopapp, nog een reeks gedurfde beweringen over "het automatiseren van je hele workflow", nog een GPT-wrapper die zich voordoet als een platform. Ik had Claude Code prima aan het neuriën, agenten deden echt werk, en ik zat diep in een Vercel-implementatie toen een vriend een enkele regel in Slack dropte: "Dit ding heeft zojuist een werkende app voor me gebouwd vanuit een spreadsheet, mijn browser geopend, geïmplementeerd en een wekelijkse cron gepland - in één chat."

Ik sloot het tabblad Implementeren en downloadde die avond de super-app Codeex AI.

Elf dagen later had ik iets gebouwd waar ik al zes maanden mee bezig was: een YouTube Comment Intelligence System dat de laatste 200 reacties van mijn kanaal haalt, rangschikt op signaal, een Excel-werkmap met meerdere tabbladen met grafieken genereert, een localhost-dashboard verzendt, het implementeert op een openbare Vercel-URL en het geheel elke maandagochtend ververst terwijl ik nog slaap. Geen lijmscripts. Geen kopiëren en plakken tussen vijf tools. Eén gesprek, één projectmap en een huisdierenanimatie in de hoek van het venster die me vertelt wat er op de achtergrond draait.

Dit is de post waarvan ik wenste dat iemand mij deze had gegeven voordat ik begon. Het is een echt buildlogboek, een eerlijke recensie en een side-by-side met Claude Code - omdat de vraag die ik steeds kreeg van lezers in mijn inbox niet was: "is Codeex goed?" Het was "moet ik hiervoor Claude Code laten vallen?" Het antwoord is interessanter dan ja of nee.

Waarom Codeex mijn aandacht trok toen ik niet keek

De toonhoogte op elke AI desktop-app klinkt hetzelfde. Ze beloven allemaal dat ze uw bestanden zullen lezen, op uw knoppen zullen klikken, uw code zullen schrijven en doorgaans vijftien van uw tools zullen vervangen door één chatvenster. De meeste vallen ineen bij contact met een echte workflow.

Wat mij naar de Codeex AI super-app trok, was een specifieke demo die een bouwer die ik vertrouw, heeft gepost. Hij wees Codeex naar een map met CSV's en vroeg hem "een dashboard voor me te bouwen, het te implementeren en me een wekelijkse samenvatting te e-mailen." De video was achttien minuten lang en ongesneden. Tegen minuut veertien was het dashboard live op een publieke URL en werd er een cronjob gepland. Hij heeft zijn toetsenbord de afgelopen zes minuten niet aangeraakt. Codeex voerde zelfstandig browseracties uit en navigeerde door GitHub, Vercel en Gmail als een junior ontwikkelaar die al zes maanden bij het bedrijf werkte.

Dat soort ononderbroken autonomie is zeldzaam. Cursor is goed in coderen. Claude Code kan goed nadenken. De meeste 'agent'-apps vallen uit elkaar zodra ze de IDE moeten verlaten en een echte browser of een echte spreadsheet moeten aanraken. Codeex niet. Dus heb ik een weekend vrijgemaakt en het getest op de manier waarop ik elk gereedschap test dat ik hier behandel: door iets te bouwen dat ik echt nodig had, helemaal opnieuw, zonder dat redding voor andere tools was toegestaan.

Dat iets was het YouTube-reactiesysteem. Dit is de vangst die ik vooraf zal verklappen: tegen uur drie overtrad ik de regel en opende ik Claude Code toch. Ik zal later uitleggen waarom – en waarom ik ze nu naast elkaar laat lopen in plaats van te kiezen.

Wat Codeex eigenlijk is als je het opent

Codeex is een desktopchat-app die een door OpenAI aangedreven agent (die momenteel GPT 5.4 en GPT 5.5 in de modelschakelaar toont) omhult met een reeks mogelijkheden die de meeste chat-apps niet hebben: echte lokale bestandstoegang, muis- en toetsenbordautomatisering, browsernavigatie, app-bediening en een receptsysteem genaamd Skills dat je kunt oproepen met slash-opdrachten. De interface is eenvoudig: de linkerzijbalk bevat uw projecten en chats, het rechterpaneel is het gesprek en een bovenste balk geeft u de modelschakelaar plus twee schuifregelaars.

Die twee schuifregelaars zijn belangrijker dan de meeste recensies vermelden. De eerste is snelheid, de tweede is intelligentie. Intelligentie heeft vier benoemde niveaus: laag, gemiddeld, hoog en extra hoog. Ze brengen in kaart hoeveel gedachten het model verbrandt voordat het handelt. Laag is snel en dom. Extra high zal twee minuten zitten en nadenken voordat hij een enkel bestand schrijft. Ik kom erachter wanneer ze allemaal correct zijn in de build-walkthrough, omdat het kiezen van het verkeerde niveau de grootste reden is waarom mensen klachten over "Codeex is te langzaam" of "Codeex heeft mijn project te veel ontwikkeld" in de Discord posten.

Wat mij op de eerste dag verraste, was de breedte. Codeex bewerkt niet alleen bestanden. Het zal:

Open Excel en schrijf naar specifieke cellen, genereer grafieken, beheer meerdere tabbladen
Stuur uw browser van begin tot eind: vul formulieren in, klik op knoppen, scrap een pagina, verifieer een implementatie
Lees en schrijf elk bestand op uw computer waartoe uw gebruiker toegang heeft
Roep externe API's en plug-ins aan (voor sommige moet u uw eigen API-sleutel in de .env.local van het project plaatsen)
Voer echte GUI-apps uit, inclusief, op hilarische wijze, videogames tijdens een van mijn stresstests
Voer een huisdierfunctie in de hoek uit die animeert terwijl achtergrondtaken actief zijn, zodat je echt weet of hij nog leeft

Dat laatste klinkt gimmickachtig totdat je negentig seconden naar een chatvenster hebt zitten kijken en je afvraagt of de agent is gecrasht. Het geanimeerde huisdier is de indicator voor 'lopende taken' waarvan ik niet wist dat ik deze nodig had. Het is klein, maar het is het soort detail dat aangeeft dat het team begrijpt hoe het voelt om deze tool voor echt werk te gebruiken.

Het andere onderdeel dat de moeite waard is om te begrijpen voordat we iets gaan bouwen, is het Skill-systeem. Een vaardigheid in Codeex is een prijsverlagingsrecept - letterlijk een .md-bestand dat een uit meerdere stappen bestaande workflow beschrijft, welke hulpmiddelen daarvoor nodig zijn en welke vorm de uitvoer moet aannemen. U kunt ze opslaan als globale vaardigheden (beschikbaar voor elk project) of lokale vaardigheden (beperkt tot één project). Je roept ze op met een slash-commando in de chat. Dit klinkt bekend als je agentvaardigheden in Claude Code hebt gebruikt, en dat zou ook moeten gebeuren: het patroon is hetzelfde, de implementatie heeft alleen de smaak van OpenAI.

Die convergentie is een van de meest interessante dingen die momenteel in de tooling van agenten gebeuren: elke serieuze speler komt terecht op dezelfde primitief, namelijk 'een klein prijsverlagingsrecept dat het model vertelt hoe het zich moet gedragen voor een specifieke taak'. Het wordt een standaard, ongeacht of iemand het toegeeft.

Codeex versus Claude Code versus cloudcode: de eerlijke vergelijking

Drie instrumenten, drie filosofieën. Voordat ik je de build laat zien, is hier het overzicht dat ik een vriend bij de koffie zou geven:

Cloud Code (het gehoste, beheerde agentproduct van Anthropic) draait op Opus en Sonnet, bevindt zich in de cloud en is gebouwd rond langdurig werk onder toezicht. Je geeft het een doelpunt, het gaat af en komt terug met een resultaat. Het beste voor taken waarbij u hands-off uitvoering op een externe box wilt.

Claude Code is de lokale CLI die de meeste lezers hier al kennen: Opus of Sonnet, terminalgestuurd, aangesloten op uw repository, met hooks, vaardigheden en de agent-SDK. Het is degene die ik de hele dag gebruik voor zwaar codewerk, en degene die ik standaard gebruik als het denken belangrijker is dan het doen.

Codeex is een desktop GUI-app op de chatmodellen van OpenAI, geoptimaliseerd voor hands-on, multi-tool uitvoering met een sterke voorkeur voor pragmatisch, ‘get-it-done’-gedrag. Het komt het dichtst in de buurt van "een OS-laag voor AI-werk" - wat betekent dat het niet alleen code bewerkt, maar ook je machine bestuurt.

Na elf dagen is dit het patroon waarop ik terechtkwam:

Baan	Beste hulpmiddel	Waarom
Brainstormen, architecturale beslissingen, "wat moet ik bouwen"	Claude Code	Opus-redeneerdiepte ligt nog steeds in het verschiet voor dubbelzinnige ontwerpvragen
Lange inhoud, complex promptontwerp, SEO-schrijven	Claude Code	Beter volgen van instructies over subtiele stem- en structurele regels
Uitvoering in meerdere stappen die betrekking heeft op bestanden, browsers, API's, implementaties	Codeex	Nauwere lussen, minder handen vasthouden, browserautomatisering werkt echt
Foutopsporing in een vastgelopen pijplijn, "waarom wordt deze niet uitgevoerd"	Codeex	Pragmatisch, zal gewoon dingen proberen en terugrapporteren
Code review en refactor van een bestaande codebase	Claude Code	Repo-contextbewustzijn is scherper
Een nieuw project bouwen van een lege map naar een geïmplementeerde URL	Codeex	Het end-to-end orkest

rantsoen is waar het schijnt |

Ze zijn complementair, geen concurrenten. Ik houd Claude Code nu open in iTerm en Codeex open op de tweede monitor. Claude Code denkt, Codeex doet. Toen ik probeerde een van beide beide taken te laten uitvoeren, verloor ik tijd in beide richtingen. Als je een dieper idee wilt van waar de sterke punten van Claude Code nog steeds domineren, behandelt mijn Claude Code 32 power user hacks post de bewegingen die Codeex echt niet kan repliceren.

Laten we nu bouwen.

De build: een YouTube commentaarinformatiesysteem, van lege map tot live URL

Het doel: de laatste ~200 reacties uit mijn kanaal halen, deze analyseren, een gestructureerd Excel-rapport met grafieken en tabbladen uitvoeren, een localhost-dashboard bouwen voor live verkenning, dat dashboard implementeren op een openbare Vercel-URL en een wekelijkse automatische vernieuwing plannen die de hele pijplijn opnieuw uitvoert.

In Claude Code zou ik dit plannen als ongeveer twaalf subtaken verdeeld over vier agenten. In Codeex deed ik het in één chat met acht aanwijzingen. Hier is precies hoe.

Stap 1: Projectconfiguratie en het agents.mmd-onboardingbestand

Ik heb een lege map op mijn bureaublad gemaakt met de naam youtube-comment-intel en deze als een nieuw project naar Codeex gesleept. Het eerste waar Codeex naar zoekt in elke projectroot is een onboarding-markdown-bestand. De conventie is agents.mmd: een klein bestand dat de agent vertelt wie het is, wat het project doet, welke conventies moeten worden gevolgd en waar de belangrijke bestanden zich bevinden.

De mijne begon als vijf regels:

Goal: pull recent comments from YouTube channel UC..., analyze sentiment
and topics, output Excel report + dashboard, deploy weekly.

API keys live in .env.local
Source code lives in /src
Output reports live in /reports

Codeex lees het voordat u iets anders doet. Dat is de moeite waard om even bij stil te staan: de meeste AI-desktopapps zullen doorgaan met hun eigen aannames. Codeex zoekt actief naar het agents.mmd-bestand op de manier waarop Claude Code zoekt naar CLAUDE.md. Als u uw projectbestanden behandelt als het AI-besturingssysteem (wat betekent dat de prijsverlaging, de env-bestanden en de mapstructuur de bron van de waarheid zijn die elk AI-gereedschap kan lezen), wordt uw werk overdraagbaar tussen verschillende gereedschappen in plaats van opgesloten in één.

Dit is de meest onderschatte best practice die ik de afgelopen zes maanden heb geïnternaliseerd. agents.mmd van mijn YouTube-project was zonder wijziging leesbaar door Claude Code toen ik later dezelfde map in iTerm opende. De vaardigheidsbestanden die ik in Codeex schreef, waren voor 90% herbruikbaar in Claude Code met kleine aanpassingen aan het formaat. Die overdraagbaarheid gebeurt alleen als je vanaf dag één vasthoudt aan project-files-as-OS.

Stap 2: Gegevensverzameling met YouTube Gegevens API v3

Volgende prompt: "Stel toegang tot YouTube-gegevens API v3 in. We moeten de laatste 200 reacties uit mijn kanaal halen. Begeleid mij bij het verkrijgen van de sleutel en schrijf vervolgens het ophaalscript."

Intelligentieniveau op deze: medium. Planningswerk hoeft niet extra hoog te zijn; het heeft het model nodig om helder te denken, niet uitputtend.

Codeex leidde me stap voor stap door de Google Cloud Console-stroom: maak een project, schakel YouTube-gegevens API v3 in, genereer een API-sleutel en beperk deze tot die API. Het opende de browsertabbladen voor mij met behulp van de browserautomatisering. Ik klikte door, kopieerde de sleutel en Codeex schreef deze rechtstreeks in .env.local zonder ooit de onbewerkte waarde weer te geven in de chat (een kleine beveiligingsmaatregel die ik opmerkte en op prijs stelde).

Vervolgens schreef het het ophaalscript. Knooppunt, axios, gepagineerde aanroepen naar commentThreads.list met part=snippet,replies&maxResults=100, twee pogingen om ~200 te bereiken, onbewerkte JSON gedumpt naar /data/comments-raw.json. De eerste run leverde 197 reacties op. Klaar in minder dan drie minuten, van "laten we de API instellen" tot "we hebben gegevens".

Dit is waar Codeex een voorsprong begint te nemen op pure chattools. De browserautomatisering is geen demo; het is dragend. De agent navigeerde door console.cloud.google.com, klikte door drie modale dialoogvensters en verifieerde dat de sleutel actief was door één keer op API te drukken voordat hij deze in .env.local neerzette. Ik heb gezien hoe Cursor dit probeerde en faalde. Ik heb gezien hoe Claude Code dit probeerde en vroeg me om het handmatig te doen. Codeex heeft het zojuist gedaan.

Stap 3: Het juiste intelligentieniveau kiezen voor de juiste baan

Vóór de volgende stap wil ik de schuifregelaarinstellingen vertragen, omdat dit is waar de meeste Codeex-recensies fout gaan.

Hogere intelligentie is niet altijd beter. Bij extra hoog zal de agent meer tokens uitgeven, meer tijd nodig hebben, en – dit is de sleutel – soms over-engineeren. Ik heb het een keer op extra hoog gevraagd om "een snel script te schrijven om deze commentaarlijst te ontdubbelen." Het leverde me een module van 180 regels op met aangepaste foutklassen, een logger, logica voor opnieuw proberen en een CLI-interface. Voor een script van dertig regels.

Het patroon dat werkt:

Laag / gemiddeld voor planning, brainstormen, eenvoudige bestandsbewerkingen, "hoe moet ik deze kolom noemen"
Hoog voor daadwerkelijke builds waarbij correctheid belangrijk is
Extra hoog voor het opsporen van vreemde fouten, complexe refactoren, alles waarbij u wilt dat het model echt goed nadenkt

Tijdens de bouw heb ik hier voortdurend tussen gewisseld. Plan op medium, bouw op hoog, debug op extra hoog. Als je de schuifregelaar de hele dag op extra hoog laat staan, verbrand je tokens, bereik je sneller contextlimieten en zie je hoe de agent de gouden plaat werkt die deze niet nodig had.

Token- en contextvensterbeheer is het andere stuk dat niemand noemt. GPT 5.5 heeft een genereus contextvenster, maar het is niet oneindig, en zodra je drieduizend regels diep in een enkele chat zit, begint het ophalen te slippen. Ik heb geleerd om voor elke belangrijke fase van het project (data, analyse, dashboard, implementatie) een nieuwe chat te starten, terwijl ik dezelfde projectmap behield. Codeex behoudt de projectcontext (bestandsinhoud, de agents.mmd, eerdere vaardigheden) in chats. De chatgeschiedenis is slechts het werkgeheugen voor één fase, niet de bron van de waarheid.

Stap 4: Het Excel-product dat mij tot een gelovige heeft gemaakt

Het leuke gedeelte. Prompt: "Neem de onbewerkte opmerkingen, voer sentiment + onderwerpclustering uit en bouw een Excel-werkmap voor mij met deze tabbladen: Creator Insights, Veelgestelde vragen, Inhoudsideeën, Ruwe gegevens. Voeg een cirkeldiagram voor sentiment en een staafdiagram voor onderwerpfrequentie toe op het tabblad Inzichten."

Intelligentie: hoog.

Codeex ging aan het werk. Het schreef een Python-script met behulp van pandas en openpyxl, classificeerde elke opmerking in een onderwerpbucket (het koos automatisch zeven clusters - 'tutorialverzoeken', 'toolvragen', 'debat', 'waardering', 'klachten', 'off-topic', 'spam'), kende een sentimentscore toe en genereerde de werkmap.

Toen deed het iets waar ik niet om vroeg en waar ik blij mee was: het opende het Excel-bestand met behulp van GUI-automatisering, controleerde of elk tabblad correct werd weergegeven, maakte een screenshot van het cirkeldiagram en zette de schermafbeelding in de chat als een gezondheidscheck. "Zo ziet het tabblad Inzichten eruit: bevestig dat dit overeenkomt met uw verwachting voordat we verder gaan." Dat is het soort zelfverificatiestap dat Claude Code kan uitvoeren, maar dat meestal moet worden opgedragen. Codeex is er standaard op ingesteld.

De werkmap had een echt signaal. Op het tabblad Veelgestelde vragen kwamen drie vragen naar voren die ik herhaaldelijk kreeg en die me nooit waren opgevallen omdat ze verborgen waren in een commentaarstroom waar ik zelden doorheen blader. Het tabblad Inhoudsideeën haalde twaalf echte video-onderwerpen uit de opmerkingen 'Ik wou dat je X zou behandelen'. Het tabblad Creator Insights liet zien dat het sentiment de afgelopen dertig dagen met 14% was gestegen ten opzichte van de dertig dagen daarvoor.

Dit is het moment waarop ik Codeex niet langer als "een andere GPT-wrapper" beschouwde, maar het als een echt hulpmiddel begon te beschouwen. Het verwerkte niet alleen gegevens; het produceerde in elf minuten iets waarvoor ik een freelancer $300 zou hebben betaald om het te bouwen, en ik bezat elke regel van de code.

Stap 5: Van de workflow een herbruikbare vaardigheid maken

Toen de werkmapgeneratie eenmaal werkte, wilde ik de hele pijplijn omzetten in een herbruikbare vaardigheid, zodat ik volgende maand dezelfde analyse kon activeren met één slash-opdracht.

Prompt: "Converteer deze workflow (ophalen van opmerkingen, voer analyse uit, genereer Excel) naar een Codeex-vaardigheid met de naam /analyze-channel. Sla deze op als een algemene vaardigheid, zodat ik deze ook op andere kanalen kan gebruiken."

Codeex genereerde een markdown Skill-bestand dat de volledige stroom vastlegde: vereiste invoer (kanaal-ID, API-sleutellocatie), gereedschapsafhankelijkheden (axios, panda's, openpyxl), de promptsjabloon die de agent aanstuurt en de verwachte uitvoervorm. Ik heb het opgeslagen in de algemene map Skills.

Ik heb het op een ander kanaal getest (/analyze-channel UC... getypt met de kanaal-ID van een vriend) en de hele pijplijn liep in acht minuten van nul af. Geen opnieuw vragen, geen foutopsporing, geen code kopiëren en plakken van de ene chat naar de andere.

Het Skill-systeem zorgt ervoor dat Codeex in de loop van de tijd sterker wordt. De eerste build is traag omdat je de workflow ontdekt. De tweede keer is het een slash-opdracht. Bij het tiende project dat je hebt gebouwd, heb je een persoonlijke toolkit van /analyze-channel, /deploy-to-vercel, /refresh-dashboard, /audit-seo die je zonder nadenken kunt oproepen. Dit is hetzelfde samengestelde effect dat ervoor zorgde dat Claude Code's vaardigheidssysteem vorig jaar zo'n productiviteitsontgrendeling voor mij maakte.

Mondiale versus lokale kwesties, meer dan mensen zich realiseren. Global Skills zijn universele helpers: /deploy-to-vercel, /init-nextjs-project, /clean-csv. Lokale vaardigheden zijn projectspecifiek: /refresh-youtube-comments leeft alleen in dit project omdat de kanaal-ID, de API-sleutel en het uitvoerformaat projectvormig zijn. Plaats geen projectspecifieke vaardigheden in de algemene map. Ze vervuilen elke chat en verwarren de agent zodat hij ze probeert te gebruiken waar ze niet van toepassing zijn.

Stap 6: Het dashboard bouwen met GPT Image 2 voor de UI-concepten

Volgende prompt: "Bouw een dashboard voor mij dat deze gegevens live visualiseert. Voer het uit op localhost. Gebruik Next.js. Genereer een logo en een hero-illustratie met GPT Image 2 voor de UI."

Intelligentie: hoog met een korte stijging naar extra hoog toen er een probleem met de Tailwind-configuratie moest worden opgelost.

Codeex bedacht een Next.js 15-project, genereerde de lay-out, gebruikte de GPT Image 2-plug-in om een logo te maken (een gestileerde commentaarballon gekruist met een grafiekpictogram - verrassend schoon) en een heldenillustratie. Schreef de haken voor het laden van gegevens die lezen uit dezelfde /data/comments-raw.json die het analysescript schrijft. Vier diagramcomponenten gebouwd – sentimenttaart, onderwerpbalk, tijdreekslijn voor commentaarvolume, tabel met belangrijkste vragen – en deze aangesloten.

Vervolgens slaagde het voor de QA met browserautomatisering. localhost:3000 geopend, gescrolld, op het filter van elk diagram geklikt, de hoverstatussen geverifieerd, schermafbeeldingen gemaakt en deze in de chat geplaatst. "Dashboard wordt correct weergegeven. Eén fout: de vervolgkeuzelijst met onderwerpfilters loopt over op mobiele breedtes onder 375px. Wil je dat ik dit oplos?"

Ja dat deed ik. Het heeft het opgelost. Opnieuw geverifieerd. Klaar.

De browserautomatisering hier is echt beter dan elke andere tool die ik heb getest. Ik heb Toneelschrijver gebruikt. Ik heb Browsergebruik gebruikt. Ik heb de headless-opstellingen gebruikt die Claude Code door MCP kan rijden. De browserlaag van Codeex is sneller, betrouwbaarder op slechte pagina's, en – dit is de killer – herstelt van fouten. Wanneer een pagina bij de eerste poging niet laadde, crashte niet de hele keten. Het probeerde het opnieuw, wachtte langer en ging verder.

Stap 7: GitHub privéopslagplaats naar Vercel automatisch implementeren

Prompt: "Push dit naar een nieuwe privé GitHub-opslagplaats en implementeer het vervolgens in Vercel."

Ik had voor dit project niets geconfigureerd in GitHub of Vercel. Codeex deed de hele stroom:

Geïnitialiseerde git, maakte de eerste commit met een schoon conventioneel commits-bericht
De plug-in GitHub gebruikt (ik moest een persoonlijk toegangstoken één keer in .env.local plaatsen - alleen de eerste keer) om een nieuwe privérepository te maken
Druk op de code en stel de afstandsbediening in
Gebruikte de Vercel-plug-in om de repository te importeren, configureerde de build (deze detecteerde Next.js automatisch), stelde omgevingsvariabelen in vanuit .env.local
Activeerde de eerste implementatie
Bewaakte de implementatielogboeken in realtime en plaatste de live URL toen deze klaar was

Totale tijd vanaf "push dit naar GitHub" tot "hier is uw live URL": vier minuten en twaalf seconden. Het dashboard was live. De opslagplaats was privé. De env-vars zijn correct ingesteld.

Dit is de workflow die ik altijd handmatig deed voor elk zijproject, en het kostte me elke keer vijfenveertig minuten om door de tabbladen te klikken. Nu is het één prompt.

Stap 8: De wekelijkse automatisering die de cirkel sluit

Het laatste deel: plan een wekelijkse vernieuwing waarbij nieuwe opmerkingen worden opgehaald, het Excel-rapport opnieuw wordt gegenereerd, het dashboard opnieuw wordt geïmplementeerd met nieuwe gegevens en alles wordt vastgelegd in GitHub.

Prompt: "Plan een taak om deze hele pijplijn elke maandag om 06.00 uur uit te voeren. Haal nieuwe opmerkingen op, werk Excel bij, vernieuw de dashboardgegevens, voer wijzigingen door in GitHub, activeer een nieuwe implementatie van Vercel. Laat het me weten wanneer deze is voltooid."

Intelligentie: extra hoog voor deze, omdat planning iets is waarbij één fout een stilzwijgend gebroken pijplijn betekent.

Codeex heeft een lokale cron-invoer opgezet die Codeex zelf op maandag om 06.00 uur activeert, het project opent, de /analyze-channel-vaardigheid uitvoert en vervolgens koppelt aan een /refresh-dashboard-vaardigheid die direct is gegenereerd, de gegevensbestanden vastlegt met een bericht met tijdstempel, pusht naar GitHub (die automatisch een Vercel opnieuw implementeren vanwege de GitHub-integratie) en stuurt mij een Slack-melding wanneer dit voltooid is.

Er werd mij ook een vraag gesteld die ik op prijs stelde: "Moet dit in de automatische beoordelingsmodus worden uitgevoerd (waarbij elke stap wordt gepauzeerd voor uw goedkeuring) of in de volledige-toegangsmodus, waarbij het van begin tot eind wordt uitgevoerd zonder bevestiging?" Ik heb de eerste drie weken voor automatische beoordeling gekozen, daarna voor volledige toegang.

Dit toestemmingsmodel is een van de onderdelen van Codeex die ik het meest vertrouw. Standaardmachtigingen vereisen goedkeuring voor alles wat destructief is: het schrijven van bestanden, netwerkaanroepen, git-commits, implementaties. De modus met volledige toegang slaat die controle over. Gebruik volledige toegang zorgvuldig. Ik schakel deze alleen in voor workflows die ik al drie of vier cycli heb begeleid. De eerste keer dat u een agent onbeperkte toegang tot uw machine geeft, komt u er snel achter of u uw aanwijzingen net zo vertrouwt als u denkt.

Wat Codeex fout gaat

Ik ben je het eerlijke deel van deze recensie verschuldigd.

Codeex is te technisch als je de intelligentieschuifregelaar niet beheert. Ik heb dit eerder genoemd. Laat het de hele dag op extra hoog staan en de agent zal je een microservice schrijven als je om een functie vraagt. Let op de schuifregelaar.

Het chatcontextvenster is genereus maar niet oneindig. Bij lange sessies begint het ophalen voorbij de 200K-tokengrens te glijden. De oplossing is om per fase nieuwe chats te starten en te vertrouwen op de projectbestanden als bron van waarheid. Als je de chat als je herinnering beschouwt, word je gebeten.

Sommige plug-ins hebben handmatige API-sleutels nodig. Voor de eerste GitHub-actie, de eerste Vercel-implementatie, de eerste OpenAI-imagegeneratie moest ik telkens een sleutel in .env.local plaatsen. Dit is de juiste veiligheidshygiëne, maar de introductie zou dit duidelijker aan het licht kunnen brengen. Ik verloor twintig minuten bij de eerste GitHub-push omdat ik de prompt met de vraag om het token miste.

De huisdieranimatie is echt nuttig, maar ik zou een moord doen voor het logpaneel 'Wat doet de agent nu'. Het huisdier vertelt me dat er iets gebeurt. Het vertelt mij niet welke stap van de keten. Voor langlopende pijplijnen wil ik een zichtbare takenboom. Dichtstbijzijnde oplossing: vraag Codeex om de stapsgewijze status af te drukken om te chatten. Werkt maar geeft geluid.

De prijs is momenteel OpenAI-economie. GPT 5.4 en 5.5 tokenkosten bij extra hoge intelligentie lopen op als je tientallen sessies per dag uitvoert. Een zware dag voor mij op Codeex brandt meer dan een zware dag op Claude Code onder mijn Anthropic-plan. Het is de moeite waard om te weten of u kostengevoelig bent.

Het is geen Claude Code-vervanging voor redeneerwerk met veel code. Ik heb het geprobeerd. Ik heb verloren. De twee zijn complementair. Kies niet het ene en laat het andere achterwege.

De beste praktijken waarmee ik wou dat ik was begonnen

Elf dagen later is hier de handleiding die ik mijn vroegere zelf zou geven.

Behandel uw projectbestanden als het AI-besturingssysteem. De agents.mmd, de mappenstructuur, de .env.local, de vaardigheden: deze zijn overdraagbaar tussen tools. Bouw ze goed en je kunt wisselen tussen Codeex, Claude Code en wat er daarna komt, zonder werk te verliezen.

Plan altijd eerst in de planmodus. Codeex heeft een expliciete planmodus waarin de agent het volledige werk schetst voordat hij iets aanraakt. Gebruik het. Brainstorm voordat u het uitvoert. Door de planmodus over te slaan, krijg je een dedupe-script van 180 regels.

Kies het intelligentieniveau bewust. Medium voor planning, hoog voor builds, extra hoog voor foutopsporing. Parkeer hem niet.

Behoud de standaardmachtigingen totdat u drie keer toezicht hebt gehouden op de workflow. Stap vervolgens over naar de modus voor volledige toegang, alleen voor die specifieke workflow. Nooit mondiaal.

Schrijf vaardigheden voor alles wat je twee keer doet. De samengestelde opbrengst is enorm. De tweede keer dat u een workflow nodig heeft, moet dit een slash-opdracht zijn.

Voer Codeex en Claude Code uit op verschillende monitoren. Gebruik Claude Code voor denken en architectuur. Gebruik Codeex voor het uitvoeren en orkestreren. Het zijn verschillende tools met verschillende sterke punten.

Gebruik de AI om zijn eigen workflows te analyseren. Zodra een vaardigheid soepel verloopt, vraagt u Codeex zelf om de afwaardering van de vaardigheid te beoordelen en verbeteringen voor te stellen. Het is verrassend goed in het vinden van overbodige stappen en randgevallen die het ad hoc moest afhandelen.

Veelgestelde vragen

Is Codeex beter dan Claude Code?

Geen van beide is strikt genomen beter: ze zijn gebouwd voor verschillende taken. Codeex wint met praktische uitvoering van meerdere tools (browsers, implementaties, bestandspijplijnen). Claude Code wint op het gebied van diep redeneren, codebeoordeling en complex promptontwerp. Ik loop beide dagelijks. Zie 'Codeex versus Claude Code versus Cloud Code' hierboven voor het volledige overzicht.

Wat is agents.mmd in Codeex?

agents.mmd is het onboarding-prijsdownbestand dat Codeex leest vanuit de hoofdmap van uw project. Het vertelt de agent het doel, de conventies, de bestandslocaties en de beperkingen van het project. Het is het Codeex-equivalent van CLAUDE.md en zou het eerste bestand moeten zijn dat u in een nieuw project schrijft.

Heb ik een OpenAI API sleutel nodig om Codeex te gebruiken?

Codeex maakt gebruik van de GPT 5.4- en 5.5-modellen van OpenAI via een eigen abonnement, dus je hebt geen persoonlijke OpenAI-sleutel nodig voor de kernchat. U hebt aparte API-sleutels nodig voor plug-ins zoals GitHub, Vercel of YouTube Gegevens API - die gaan in de .env.local van uw project.

Wat is het verschil tussen de modus voor automatische beoordeling en de modus voor volledige toegang?

De automatische beoordelingsmodus pauzeert vóór elke destructieve actie (schrijven, implementeren, vastleggen) ter goedkeuring. De modus met volledige toegang voert de volledige workflow uit zonder bevestiging. Begin met automatische beoordeling voor elke nieuwe automatisering. Pas pas over op volledige toegang na het begeleiden van drie succesvolle runs.

Kan Codeex browsertaken echt betrouwbaar automatiseren?

Ja, de browserautomatisering is de meest betrouwbare die ik heb getest in agenttools, inclusief op Playwright gebaseerde instellingen en browsergebruik. Het herstelt van mislukte paginaladingen, probeert nieuwe selecties uit te voeren en verifieert acties visueel. Details in het dashboardopbouwgedeelte hierboven.

Wat ik nu ga doen

Het YouTube-reactiesysteem wordt elke maandag om 06.00 uur uitgevoerd. Het dashboard op de openbare Vercel URL ververst zichzelf voordat ik wakker word. Het Excel-rapport staat in mijn Drive met elke week nieuwe tabbladen. Ik heb er al negen dagen niets van aangeraakt.

Dat is de test die ik uitvoer met elk hulpmiddel dat ik hier behandel: is het gebouwd gebleven? Of moest ik hem blijven redden? Codeex geslaagd. De pijplijn draait nog steeds netjes, de gegevens zijn nog steeds vers en de kosten van een van mijn workflows met een hoger hefboomeffect zijn zojuist gedaald tot nul doorlopend onderhoud.

Dit is het gedeelte waar ik wil dat je bij zit. Wat ervoor zorgde dat dit project werkte, was niet Codeex op zichzelf. Het was Codeex plus een projectmap die ik behandelde als het besturingssysteem, plus vaardigheden die ik opzettelijk had ontwikkeld, plus een discipline rond intelligentieniveaus en machtigingen die me vier mislukte pogingen kostte om te leren.

Als je Codeex deze week gaat proberen – en dat zou je ook moeten doen – kies dan een workflow die je al maanden uitstelt omdat de lijm te vervelend was. Open een lege map. Schrijf een agents.mmd van vijf regels. Plan in medium, bouw in hoog, debug in extra hoog. Blijf in automatische beoordeling totdat u het vertrouwt. Sla de workflow op als een vaardigheid. Ga dan de volgende kiezen.

De huisdierenanimatie laat je weten dat het werkt. De live URL laat je weten dat het klaar is.

Laten we samenwerken

Wilt u AI-systemen bouwen, workflows automatiseren of uw technische infrastructuur schalen? Ik help je graag.

Fiverr (aangepaste builds en integraties): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (ondernemingsoplossingen): ramlit.com
ColorPark (ontwerp en branding): colorpark.io
xCyberSecurity (beveiligingsdiensten): xcybersecurity.io