Codex AI Super App : test workflow GPT-5.5

Codex AI Super App : Test de flux de travail GPT-5.5

Un ami m'a envoyé un lien YouTube un mardi à 23h14 avec le message "regarde ça, puis dis-moi que tu es toujours fidèle à ChatGPT". La vidéo était une présentation pas à pas de treize minutes réalisée par un créateur nommé Vaibhav, et sa thèse était que quiconque utilisait encore ChatGPT en 2026 avait déjà un an de retard. La raison, a-t-il affirmé, était un produit appelé Codex – une super application AI sur GPT-5.5 qui pouvait planifier des applications comme un chef de produit, concevoir des interfaces utilisateur en contrôlant un curseur dans les outils de conception, créer des fils de discussion pour exécuter le développement et le marketing en parallèle et créer tranquillement des PowerPoints à partir de votre Gmail chaque matin pendant que vous dormiez.

Je l'ai regardé deux fois. Ensuite, j'ai fermé mon ordinateur portable et je me suis couché ennuyé, car la moitié de ce qu'il montrait, je l'avais déjà testé pendant deux semaines, et l'autre moitié ressemblait au genre de démo qui se brise dès qu'on la déraille.

J'ai donc passé les quatre jours suivants à exécuter la super application Codex AI par rapport aux flux de travail exacts de cette vidéo. L'automatisation de Gmail vers PowerPoint. L'invite « Créez-moi une application pour les rencontres de fondateurs hors ligne ». Le travail parallèle à fil fourchu. La correction de bugs autonome. Je l'ai laissé cuire à travers des données réelles, de vrais échecs et de vraies victoires surprises. J'ai également recherché les affirmations que je n'ai pas pu vérifier - l'outil de conception "Paper" qu'il nomme, le modèle précis GPT-5.5 derrière les appels Codex, les prix qu'il passe sous silence - parce que la moitié de l'écosystème YouTube AI en 2026 est construit sur des noms qui ne correspondent pas tout à fait à ce qui est réellement expédié.

C'est ce qui est réel. C'est ce qui est survendu. Et c'est là que le flux de travail a réellement changé le mien - y compris au moment où un fil de discussion fourchu a expédié une présentation marketing et une application fonctionnelle en même temps, et j'ai réalisé que j'avais complètement mal pensé au travail parallèle de AI.

Commençons par définir le nom et le modèle

Avant de toucher à un seul flux de travail, ce que la vidéo passe sous silence doit être précisé, car si vous recherchez « super application Codex » ou « GPT-5.5 » sans contexte, vous finirez par être confus en trente secondes.

Le produit s'appelle Codex, et oui, il s'agit de OpenAI. Il ne s'agit pas d'un wrapper tiers. Ce n'est pas un projet de fan. L'application de bureau a livré sa refonte de « super application » le 16 avril 2026 sous le nom de Codex Desktop v26.415 selon le journal des modifications des développeurs de OpenAI, et le modèle GPT-5.5 qui alimente la plupart du nouveau comportement de l'agent est devenu généralement disponible dans API le 24 avril 2026 selon Couverture du lancement par TechCrunch. C'est la chronologie. Le cadre de la "super application" dans la vidéo est réel : il provient directement du propre positionnement de OpenAI selon l'histoire de TechCrunch, et la vision de Sam Altman de fusionner ChatGPT, Codex et le navigateur Atlas en un seul produit unifié est désormais une messagerie publique.

Ce que la vidéo ne mentionne pas, c'est que Codex ne s'exécute pas toujours par défaut sur GPT-5.5. Selon la page des modèles Codex de OpenAI, Codex effectue des itinéraires entre GPT-5.5, GPT-5.5 Pro et les anciennes variantes 5-Codex en fonction de la classe de tâches et de votre niveau d'abonnement. Certaines tâches s'exécutent sur GPT-5.5 avec un effort de raisonnement très élevé. Certains fonctionnent sur des points de contrôle plus légers pour maintenir une latence raisonnable. Si vous utilisez ChatGPT Plus, vous obtenez un accès GPT-5.5 mais avec une utilisation limitée. Si vous êtes sur le nouveau niveau Pro à 200 $ /month, vous obtenez l'allocation « 5 fois plus d'utilisation de Codex » annoncée par OpenAI ainsi qu'un premier accès aux modes de raisonnement les plus lourds.

Cela est important car la vidéo montre des démos qui ont presque certainement utilisé les chemins de raisonnement les plus exigeants. Si vous reproduisez ses invites sur un compte Plus, vous n'obtiendrez pas les mêmes vitesses, la même profondeur de planification ou la même récupération d'erreur indulgente. Ce n'est pas un bug, c'est la façon dont le prix du produit est fixé. Mais c'est la partie qui est discrètement ignorée dans les démos virales, et c'est en la ignorant que vous finissez par être déçu.

Encore une précision de nom avant de passer à autre chose. Vaibhav fait à un moment donné une démonstration de Codex "concevant à l'intérieur d'un outil de conception appelé Paper, en contrôlant le curseur et en créant des mises en page en direct". J'ai recherché "Paper" en tant qu'outil de conception intégré à Codex et je n'ai pas pu le vérifier en tant que plugin Codex actuel. Il existe un article de blog Figma sur l'intégration de Codex avec Figma — qui est réel et expédié. Il existe une longue liste d'outils de conception qui fonctionnent via le mode d'utilisation de l'ordinateur de Codex, qui lui permet de cliquer sur n'importe quelle application de bureau. "Paper" pourrait être le nom de Vaibhav pour l'un d'entre eux, pourrait être un produit bêta auquel je n'ai pas accès, ou pourrait être un outil qui me manque tout simplement. Je le signale comme non vérifié plutôt que de prétendre l'avoir confirmé. C'est l'appel honnête.

C'est ici que cela devient intéressant : même avec le routage du modèle, les niveaux de tarification et l'outil de conception non vérifié, les changements de flux de travail sous-jacents dans la vidéo sont réels. La véritable histoire est la façon dont Codex restructure votre façon de travailler. Et ce qui m'a le plus frappé, ce ne sont pas les démos avec lesquelles il dirige. C’était celui que la plupart des téléspectateurs ont probablement ignoré.

Les trois piliers : projets, plugins, automatisations – et pourquoi l'ordre est important

La vidéo présente Codex comme ayant trois fonctionnalités principales : projets, plugins et automatisations. Ce cadrage est correct. Ce qu'il a tort, c'est de les traiter comme des caractéristiques parallèles. Ce n’est pas le cas. Ce sont des couches séquentielles, et le manque d'ordre est la raison pour laquelle la plupart des gens qui essaient Codex rebondissent en une semaine.

Les Projets sont la base. Un projet dans Codex est un espace de travail persistant qui regroupe des fichiers, des conversations, de la mémoire et des autorisations d'accès pour une étendue de travail spécifique. Lorsque je travaille sur un engagement client Laravel, c'est un projet. Lorsque je recherche les versions du modèle AI pour le blog, il s'agit d'un projet distinct. Le projet est ce qui contient le contexte : les fichiers que Codex a lus, les décisions que vous avez prises ensemble, les informations d'identification que vous lui avez accordées, le ton et les conventions qu'il doit suivre. Sans projet, chaque interaction Codex démarre à zéro.

Les Plugins permettent à Codex d'atteindre le reste de votre travail en dehors du projet. Il existe désormais plus de quatre-vingt-dix plugins par annonce du marché des plugins de OpenAI couverte par The Decoder — Slack, Notion, Figma, Gmail, Google Drive, GitHub, GitLab, Atlassian, Render, Neon, Remotion et une longue traîne d'autres. Chaque plugin peut inclure trois éléments pour la même couverture : les compétences (modèles d'invite réutilisables), les applications (points de terminaison d'intégration) et les serveurs MCP (l'accès réel aux données et aux outils). Le plugin permet à Codex non seulement de parler de vos documents Notion, mais également de les lire, d'écrire et de les réorganiser. Sans plugins, Codex est un employé brillant, sans e-mail ni calendrier.

Les automatisations sont la couche que la plupart des gens ignorent – et c'est la couche où réside toute la proposition de valeur de la super application. Une automatisation dans Codex est une exécution d'agent planifiée et sans tête qui se déclenche sur un déclencheur (heure, événement ou webhook) et exécute une tâche définie à l'aide des projets et plugins auxquels elle a accès. Selon page Codex de OpenAI, Codex peut désormais « planifier son travail futur et se réveiller automatiquement pour continuer une tâche à long terme, potentiellement sur plusieurs jours ou semaines ». C'est la ligne qui enterre tranquillement le lede.

Voici pourquoi l'ordre est important. Si vous configurez des plugins avant les projets, les autorisations de vos plugins deviennent compliquées et trop étendues : Codex se retrouve avec des informations d'identification dont il n'a pas besoin, dans des portées qu'il ne devrait pas avoir. Si vous configurez des automatisations avant d'avoir entièrement testé le comportement d'un projet, vous vous réveillerez pour découvrir qu'un agent programmé fait quelque chose de subtilement mal quotidiennement depuis une semaine. J'ai commis les deux erreurs la première semaine. Les réparer m'a appris à configurer Codex de la même manière que vous configureriez un nouvel employé : donnez-lui d'abord un bureau, puis ses outils, puis ses responsabilités récurrentes. Pas l'inverse.

L'autre chose que la vidéo ne dit pas : chaque plugin et chaque automatisation est une surface de sécurité. Le cadre « accès complet » dans la démo de Vaibhav passe sous silence le fait que vous accordez, en pratique, à un agent autonome des étendues OAuth persistantes dans vos systèmes d'entreprise. Je veux que cela soit consigné avant de décrire ce que j'ai construit avec.

C'est la démo avec laquelle Vaibhav s'ouvre, et c'est celle sur laquelle j'étais le plus sceptique. Le pitch : chaque matin, Codex vérifie votre Gmail pour la dernière newsletter, extrait les informations clés, génère un résumé PowerPoint et le dépose dans votre boîte de réception. Il prétend que cela lui fait gagner une heure par jour.

Je l'ai construit. Voici ce qui s'est réellement passé.

L'installation m'a pris vingt-trois minutes. L'authentification du plugin Gmail a été l'étape la plus longue : Codex vous oblige à accorder des étendues avec soin, et le flux OAuth vous guide à travers les dossiers, les étiquettes et les filtres d'expéditeur qu'il doit respecter. Je l'ai limité à une seule étiquette Gmail appelée daily-read dans laquelle j'identifie des newsletters intéressantes. Je ne lui ai pas donné accès à l'intégralité de ma boîte de réception, car je ne suis pas du genre à donner à un agent autonome un accès illimité à Gmail juste pour résumer une newsletter, et vous ne devriez pas l'être non plus.

L'automatisation elle-même était une définition en langage naturel de cinq lignes : "Chaque jour de la semaine à 8h00, recherchez les newsletters dans daily-read des dernières 24 heures, extrayez les trois informations les plus importantes de chacune, générez un seul deck PowerPoint les résumant avec une diapositive par newsletter plus une diapositive de couverture, et envoyez le deck dans ma boîte de réception en pièce jointe."

Je l'ai laissé fonctionner pendant cinq jours ouvrables. Voici le tableau de bord honnête.

Premier jour : cela a parfaitement fonctionné. Trois newsletters, trois diapositives plus la couverture, le formatage était propre, les résumés étaient précis. J'ai lu le jeu en moins de quatre-vingt-dix secondes et je me suis senti suffisant.

Deuxième jour : il a publié un bulletin d'information qui était en fait un résumé hebdomadaire avec sept sujets, et il a résumé l'intégralité du résumé en un seul aperçu, manquant cinq des sept sujets. Le deck était techniquement correct mais pratiquement inutile.

Troisième jour : cela a de nouveau fonctionné parfaitement, mais il incluait un message de sponsor provenant de l'une des newsletters comme s'il s'agissait d'un véritable aperçu. Celui-là m'a fait rire parce qu'il s'agissait d'une erreur tellement évidente du résumé AI : le modèle ne pouvait pas distinguer le contenu éditorial du placement payant lorsque le sponsor était intégré assez proprement.

Quatrième jour : l'exécution de Codex a expiré car Gmail était lent ce matin-là et l'automatisation n'avait aucune logique de nouvelle tentative. Le deck n'est pas arrivé. Je ne l'ai remarqué qu'à 10 heures du matin, date à laquelle j'avais déjà parcouru manuellement les newsletters de toute façon.

Cinquième jour : a parfaitement fonctionné.

Donc le verdict sur l'automatisation de Gmail vers PowerPoint : c'est réel, c'est utile, cela permet de gagner du temps les jours où cela fonctionne, et ce n'est pas une économie d'une heure par jour. Il s'agit plutôt d'un gain de quinze à vingt minutes les jours où il fonctionne correctement, et de zéro ou négatif les jours où il ne fonctionne pas. La vidéo multiplie par environ 3 le gain de temps. Mais il s’agit véritablement du genre de travail en arrière-plan que personne n’effectuait de manière fiable auparavant, et l’affirmation directionnelle selon laquelle cette catégorie d’automatisation est désormais possible sans écrire de code est correcte.

La plus grande leçon de ce test : les automatisations ont besoin d’observabilité. Après le quatrième jour, j'ai ajouté une deuxième automatisation qui enregistre simplement le statut success/failure du premier sur une page Notion, j'ai donc un registre quotidien des exécutions qui ont fonctionné et de celles qui n'ont pas fonctionné. Ce type de méta-automatisation est quelque chose que la vidéo ignore complètement, et c'est la différence entre une automatisation en laquelle vous avez confiance et une automatisation que vous devez garder.

Test 2 : Créer une application Meetups de fondateurs hors ligne avec zéro code

C'est la démo qui devient virale à chaque fois que Vaibhav en remet un extrait. Il invite Codex à créer « une application pour les rencontres hors ligne pour les fondateurs de Bangalore et de San Francisco ». Codex agit comme un chef de produit : il pose des questions de clarification, planifie l'interface utilisateur, conçoit la mise en page dans ce qu'il appelle Paper, puis planifie la construction complète (base de données, itinéraires, composants) avant d'écrire une ligne de code. À mi-chemin de la construction, il utilise une fonction « Steer » pour ajuster la portée en direct sans interrompre l'agent. Codex teste ensuite l'application de manière autonome sur ordinateur et mobile, trouve les bugs, planifie les correctifs, les implémente et reteste. Aucune intervention humaine.

J'ai essayé de le reproduire aussi fidèlement que possible. Mon message : "Créez-moi une application Web d'une seule page où les fondateurs peuvent publier et découvrir des rencontres hors ligne dans leur ville. Devrait prendre en charge la liste des rencontres, la participation aux rencontres et un profil de base par utilisateur. La base de données peut être SQLite pour l'instant. Empilez votre appel."

Voici ce qui s'est réellement passé au cours d'une véritable session de quatre heures.

Codex a commencé par me poser six questions de clarification – exactement le comportement du chef de produit montré dans la vidéo. Les questions étaient bonnes : est-ce que je voulais une authentification, quelles villes devraient être prises en charge au lancement, s'agissait-il d'un marché ou d'un annuaire, que signifiait "rejoindre" (RSVP uniquement ou billetterie payante), de quoi les profils avaient-ils besoin et était-ce hébergé ou local. Je leur ai répondu en deux minutes.

Il a ensuite proposé une pile : Next.js 15 avec App Router, Prisma sur les composants SQLite, Tailwind et shadcn/ui. Cela explique pourquoi : itération rapide, pas de services externes pour la v1, facile à migrer vers Postgres plus tard. J'ai accepté.

La phase de planification était la partie sur laquelle je devais recalibrer mes attentes. Codex a généré un plan de build avec vingt-trois tâches couvrant le modèle de données, les itinéraires, les composants, l'authentification et les tests. C'était bien. Mieux que ce que la plupart des ingénieurs juniors écriraient. Mais cela n’a pas été instantané, comme le laisse entendre la vidéo. La phase de planification à elle seule a pris environ quatre minutes de « réflexion » avec un effort de raisonnement élevé activé, et regarder cette réflexion se produire en temps réel n'est pas aussi excitant que le suggèrent les coupures dans les démos YouTube.

La construction elle-même a duré environ deux heures vingt minutes. Pendant ce temps, Codex a écrit environ 4 200 lignes de code dans 38 fichiers, a exécuté le serveur de développement lui-même et a testé l'application dans son in-app browser en cliquant sur chaque flux. J'ai utilisé l'équivalent de "Steer" - qui, dans l'interface utilisateur actuelle de Codex, est une petite zone de saisie en haut du thread en cours d'exécution qui vous permet d'injecter des ajustements à mi-construction - deux fois. Une fois pour demander une palette de couleurs différente. Une fois pour ajouter un «fondateur vérifié», basculez vers les profils. Les deux ajustements ont été absorbés sans redémarrer la construction.

La boucle autonome de détection et de correction des bogues est réelle et impressionnante. Trois fois au cours de la construction, Codex a détecté des problèmes dans son propre travail – une fois une condition de concurrence critique pour la migration Prisma, une fois une collision de classe Tailwind, une fois une erreur d'hydratation dans un composant du serveur – et les a corrigés sans me le demander. J'ai vu cela se produire. La transcription montre Codex lisant sa propre sortie de console, identifiant l'erreur, planifiant un correctif, appliquant le correctif et réexécutant le test. Cette boucle, plus que toute autre chose dans la version, est ce qui fait que la super application Codex AI se sent catégoriquement différente d'un copilote de codage.

Ce que la vidéo ne montre pas : la version a également produit deux vrais bugs que Codex n'a pas détecté par lui-même. Le flux « Rejoindre une rencontre » a créé un enregistrement RSVP mais n'a pas renvoyé le nouveau nombre de participants, de sorte que l'interface utilisateur a affiché des données obsolètes jusqu'à l'actualisation. Et le formulaire de création de meetup vous permettait de le soumettre avec une chaîne de localisation vide, ce qui cassait la page de découverte. J'ai attrapé les deux manuellement en quinze minutes de clics. Une fois que je les ai signalés, Codex les a corrigés en moins d'une minute chacun. L'autonomie est donc réelle mais limitée : elle détecte ce que ses tests automatisés capturent, et elle manque ce qu'un utilisateur humain capture en utilisant l'application de la même manière qu'un humain utilise une application.

État final de la construction : une application Next.js 15 fonctionnelle que je pourrais de manière réaliste expédier vers une petite version bêta privée. Pas de qualité production. L'authentification s'effectuait uniquement par courrier électronique, sans limitation de débit, ni limite d'erreur appropriée sur les routes destinées aux utilisateurs. Probablement huit heures supplémentaires de peaufinage humain avant de le présenter aux utilisateurs payants. Mais pour un MVP absolu, j'aurais passé deux jours à construire en solo, compressés en un après-midi avec Codex faisant quatre-vingt-cinq pour cent du travail.

L’affirmation directionnelle de la vidéo – selon laquelle vous pouvez créer des applications sans écrire de code – est réelle. L’implication selon laquelle le résultat peut être expédié tel quel ne l’est pas. Quiconque vous dit le contraire vous vend un cours.

Test 3 : Threads fourchus et pourquoi je pensais au parallèle AI

C'est le test où mon cadrage de l'ensemble du message s'est cassé.

Vaibhav fait des démonstrations en créant un fil de discussion Codex à mi-conversation, de sorte qu'un fork continue de créer l'application tandis que le deuxième fork génère un pitch deck de sponsor et une vidéo de lancement pour le même produit. Il montre les deux fourches produisant en parallèle. Temps total écoulé : quelques minutes pour les deux sorties.

J'avais auparavant rejeté les fils fourchus comme un gadget. La façon dont j'y pensais : un agent AI s'exécute sur le calcul, vous pouvez déjà exécuter deux agents dans deux fenêtres, quelle est la différence. Ce cadrage était erroné, et comprendre pourquoi il m'a fallu environ une heure de test.

La différence est le contexte partagé. Lorsque vous créez un fil de discussion dans Codex, les deux branches héritent de l'intégralité de l'historique de la conversation, de l'état du projet, des plugins, des informations d'identification et des artefacts partiellement construits jusqu'au point de création. Il ne s’agit pas de deux sessions distinctes. Il s'agit de deux branches de la même session, ce qui signifie que le fork marketing sait exactement quelles fonctionnalités le fork d'ingénierie propose, le fork d'ingénierie sait à quel positionnement le fork marketing s'engage et toutes les modifications apportées aux artefacts partagés (la mémoire du projet, par exemple) se propagent dans les deux.

Je l'ai testé sur l'application de rencontres des fondateurs du test 2. Une fois la construction terminée, j'ai créé le fil de discussion. Branche A : « Concevoir et générer trois diapositives de pitch deck expliquant ce produit à un sponsor potentiel. » Branche B : "rédigez un script vidéo de lancement de 90 secondes que je pourrais enregistrer sur un enregistrement d'écran de l'application." Je les ai exécutés simultanément.

La branche A a produit trois diapositives – problème, produit, projection de traction – en trois minutes environ. Les diapositives faisaient référence à des fonctionnalités spécifiques que Codex avait créées dix minutes plus tôt : la bascule du fondateur vérifié, la découverte basée sur la ville, le flux RSVP. Il ne s'agit pas de revendications de fonctionnalités génériques. Références réelles aux chemins de code réels.

La branche B a produit un script qui s'ouvrait par "Si vous vous êtes déjà présenté à une soi-disant rencontre de fondateurs et êtes entré dans une salle remplie de personnes présentant leur MLM, cette application est pour vous" - ce qui m'a fait rire aux éclats, car cette ouverture était un rappel direct à une question de clarification à laquelle j'avais répondu quatorze messages plus tôt dans le fil de discussion d'origine, où j'avais expliqué que le différenciateur était la vérification du fondateur. La branche B avait hérité de ce contexte et l'avait utilisé pour écrire un script qui n'aurait pas été possible sans lui.

C'est la perspicacité. Les fils fourchus ne concernent pas le parallélisme. Il s'agit du parallélisme cohérent avec le contexte. Deux agents AI travaillant sur des sous-tâches connexes tout en partageant la même compréhension du projet, de l'utilisateur et des artefacts, sans qu'un agent ait à briefer l'autre. Il s'agit d'un flux de travail qui n'existait pas il y a un an, et c'est ce qui se rapproche le plus de « avoir une équipe AI » que la génération actuelle d'agents a produite. La vidéo a raison, cela change les choses. La vidéo est fausse sur le pourquoi. Ce n'est pas la vitesse. C'est la cohérence.

J'ai maintenant construit trois véritables workflows autour de threads forked au cours des deux dernières semaines : code-and-docs (branche d'ingénierie + branche de documentation de la même spécification), construction et lancement (branche produit + branche marketing du même MVP) et audit-and-fix (branche d'examen de sécurité + branche de remédiation de la même base de code). Tous les trois produisent des sorties qui s'emboîtent d'une manière que deux sessions AI distinctes ne pourraient jamais faire. C'est le déverrouillage.

Où la vidéo est sur-vendue et où elle est sous-vendue

Après quatre jours de tests, voici le partage honnête.

Survendu :

Le cadrage selon lequel « les utilisateurs de ChatGPT prendront du retard d’ici 2026 » relève du marketing. ChatGPT ne va pas disparaître : Codex est construit sur la même famille de modèles, accessible via le même compte, et l'interface conversationnelle est toujours celle où 90 % de l'utilisation occasionnelle de AI se produira dans un avenir prévisible. Codex est une surface différente pour une catégorie de travail différente. Cela ne remplace pas ChatGPT pour l'utilisateur moyen. Il remplace les outils que vous n'avez pas encore pour la catégorie des utilisateurs expérimentés.

Les allégations de gain de temps sont agressives. L’automatisation de la newsletter ne fait pas gagner une heure par jour. La création de l'application ne se fait pas en quelques minutes. La correction de bugs autonome ne détecte pas tous les bugs. Le cadrage « aucune compétence en codage requise » est techniquement vrai pour les chemins heureux et très trompeur pour tout projet qui touche un véritable cas limite. Si vous ne pouvez pas lire une trace de pile, vous vous heurterez à un mur le troisième jour de construction de quelque chose de non trivial.

Le nom de l’outil de conception non vérifié. Comme je l'ai signalé plus tôt, "Paper" en tant qu'outil de conception Codex n'est pas quelque chose que je pourrais confirmer par rapport à la documentation officielle Codex de Codex ou au journal des modifications des développeurs. Le plugin Figma est réel. D'autres outils de conception fonctionnent via le mode d'utilisation de l'ordinateur. Je ne sais pas si "Paper" est un produit spécifique, un outil bêta ou le changement de nom de quelque chose d'autre.

Sous-vendu :

La fonctionnalité Automatisations est enfouie dans la vidéo et constitue le véritable déverrouillage de la super-application. Le travail planifié en arrière-plan qui se réveille sur plusieurs jours ou semaines, avec un accès complet aux plugins et une mémoire persistante, constitue une véritable nouvelle catégorie d'infrastructure de productivité. La plupart des gens l’utiliseront sous-estimé parce qu’ils ne pensent pas à leur travail en termes de tâches planifiées. Ceux qui le feront iront de l’avant.

Le modèle de cohérence contextuelle à thread forké est réduit à une démonstration de « travail parallèle » alors qu'il s'agit en fait d'un modèle de collaboration fondamentalement nouveau avec AI. Je pense qu'il s'agit du changement de flux de travail le plus important de toute la version.

La boucle autonome de détection et de correction des bogues est présentée brièvement, mais ses implications sont énormes. Un agent capable de lire les résultats de sa propre console, d'identifier les problèmes et de s'auto-corriger fait la différence entre un outil que vous supervisez en permanence et un autre sur lequel vous vous enregistrez. Cela change l’économie unitaire de la quantité que vous pouvez construire par jour.

Le marché des plugins en tant qu’architecture de sécurité est à peine mentionné. Selon la couverture du marché des plugins dans The Decoder, chaque plugin est une concession discrète de fonctionnalités, limitée à des données et des outils spécifiques. C'est ainsi que vous renforcez la confiance dans un agent autonome, en rendant chaque fonctionnalité auditable. La vidéo ignore cela parce que ce n'est pas sexy. C’est la partie qui comptera le plus pour l’adoption par l’entreprise.

Le workflow qui a réellement changé le mien

Si je devais choisir un quart de travail parmi ces quatre jours que j'avance jusqu'en mai, c'est celui-ci : je ne pense plus au travail de AI comme à "envoyer une invite, recevoir un résultat". J'y pense comme suit : "configurer un espace de travail, accorder l'accès, planifier des travaux récurrents et vous enregistrer périodiquement."

Cela semble évident une fois écrit. Ce n'est pas ainsi que la plupart des gens utilisent AI en 2026. La plupart des gens vivent encore dans le cycle d'invite et de réponse, traitant chaque interaction AI comme une transaction unique. La contribution réelle de la super application Codex AI est de faire de l'espace de travail l'unité d'interaction. Les projets détiennent un contexte persistant. Les plugins étendent la portée. Les automatisations s'exécutent selon les plannings. Les fils fourchus permettent un parallélisme cohérent. Aucun de ceux-ci ne concerne une seule invite. Tous ces projets concernent des infrastructures durables.

Ce qui va séparer les utilisateurs expérimentés de AI des touristes de AI dans la seconde moitié de 2026 est de savoir s'ils feront ce changement. Les touristes continueront à taper des invites. Les utilisateurs expérimentés exécuteront dix automatisations auxquelles ils pensent à peine, trois projets avec un contexte profond et des flux de travail à threads fourchus qui produisent un travail multi-sorties cohérent en un après-midi.

Je ne vais pas prédire que les utilisateurs de ChatGPT prendront du retard. C'est le genre d'hyperbole YouTube qui vieillit mal. Mais je dirai ceci : si vous utilisez toujours AI en tapant dans une boîte de discussion et en attendant une réponse, vous faites environ 15 % de ce qui est actuellement possible avec le même abonnement que vous payez déjà. Les 85 % restants vivent dans la surface des super-applications. Et ce n'est plus théorique. Il est livré, il fonctionne et il est utilisé par des gens qui vont discrètement surpasser tous ceux qui n'ont pas pris la peine de l'apprendre.

Il y a une question qui mérite d'être posée ce soir : si vous ouvriez Codex maintenant et essayiez de configurer une seule automatisation qui s'exécuterait tous les matins avant votre réveil, que ferait-elle ? Si la réponse est « je ne sais pas », c'est l'écart. Le fermer est le travail.

Questions fréquemment posées

Qu'est-ce que la super application Codex AI ?

La super application Codex AI est l'agent de bureau de OpenAI qui s'exécute principalement sur GPT-5.5, combinant le codage, l'utilisation de l'ordinateur, un in-app browser, des plugins pour des outils comme Slack et Notion, une mémoire persistante et des automatisations planifiées en arrière-plan. Il a expédié sa refonte de super-application sous le nom de Codex Desktop v26.415 le 16 avril 2026 et est inclus dans les forfaits ChatGPT payants plutôt que vendu séparément.

Codex est-il identique à ChatGPT ?

Codex est une application de bureau distincte qui utilise votre compte ChatGPT mais expose une surface différente (accès aux fichiers, contrôle informatique, plugins et automatisations planifiées) construite autour de l'exécution de tâches autonomes plutôt que d'une réponse conversationnelle. ChatGPT reste l'interface conversationnelle web/mobile ; Codex est la couche de bureau agent.

Sur quel modèle Codex fonctionne-t-il réellement ?

Selon la documentation des modèles Codex de OpenAI, Codex effectue des itinéraires entre GPT-5.5, GPT-5.5 Pro et les anciennes variantes 5-Codex en fonction de la classe de tâches et du niveau d'abonnement. Les tâches agents exigeant beaucoup d'efforts s'exécutent généralement sur GPT-5.5 avec un raisonnement très élevé activé, tandis que les tâches plus légères utilisent des points de contrôle plus rapides pour maintenir une latence raisonnable.

Codex peut-il vraiment créer une application complète sans codage ?

Partiellement. Codex peut planifier, échafauder, créer et auto-tester un MVP fonctionnel à partir d'une invite en langage naturel – voir le test 2 ci-dessus pour une véritable session de quatre heures qui a produit une application Next.js 15 fonctionnelle. Mais il ne détecte pas tous les bugs, le résultat est rarement prêt pour la production sans peaufinage, et vous devez toujours lire les traces de la pile lorsque les cas extrêmes interrompent la boucle autonome.

Quelle est la différence entre les projets, les plugins et les automatisations ?

Les projets sont des espaces de travail persistants qui contiennent des fichiers, l'historique des conversations et des informations d'identification pour une portée spécifique. Les plugins sont des intégrations (Slack, Notion, Figma, Gmail et plus de 90 autres) qui étendent la portée de Codex aux outils externes. Les automatisations sont des exécutions d'agents planifiées et sans tête qui exécutent des tâches définies sur un déclencheur. Elles constituent la couche qui donne à Codex l'impression d'être une super application plutôt qu'un chatbot. Pour la répartition complète, voir la section des trois piliers ci-dessus.

Travaillons ensemble

Vous cherchez à créer des systèmes AI, à automatiser les flux de travail ou à faire évoluer votre infrastructure technologique ? J'aimerais aider.

Fiverr (versions et intégrations personnalisées) : fiverr.com/s/EgxYmWD
Portefeuille : mejba.me
Ramlit Limited (solutions d'entreprise) : ramlit.com
ColorPark (conception et image de marque) : colorpark.io
xCyberSecurity (services de sécurité) : xcybersecurity.io

Codex AI Super App : test workflow GPT-5.5

Codex AI Super App : Test de flux de travail GPT-5.5

Commençons par définir le nom et le modèle

Les trois piliers : projets, plugins, automatisations – et pourquoi l'ordre est important

Test 2 : Créer une application Meetups de fondateurs hors ligne avec zéro code

Test 3 : Threads fourchus et pourquoi je pensais au parallèle AI

Où la vidéo est sur-vendue et où elle est sous-vendue

Le workflow qui a réellement changé le mien

Questions fréquemment posées

Qu'est-ce que la super application Codex AI ?

Codex est-il identique à ChatGPT ?

Sur quel modèle Codex fonctionne-t-il réellement ?

Codex peut-il vraiment créer une application complète sans codage ?

Quelle est la différence entre les projets, les plugins et les automatisations ?

Travaillons ensemble

Vous avez apprécié cet article ?

Sujets connexes

Engr Mejba Ahmed

Comments

Leave a Comment

Articles connexes

Codex Product Design Plugin : J'ai testé le workflow complet

AI Roundup du 9 mai 2026 : la course du chatbot vers l’OS est lancée

Test de Codeex : j'ai construit un système IA pour les commentaires YouTube

Comments

Leave a Comment

Expand Your Knowledge

AI School

Certificates

Learning Flashcards

AI Agent Skills

Prêt à transformer

vos idées ?

Engr Mejba Ahmed

Hey there!

Codex AI Super App : Test de flux de travail GPT-5.5

Commençons par définir le nom et le modèle

Les trois piliers : projets, plugins, automatisations – et pourquoi l'ordre est important

Test 1 : L'automatisation de la newsletter Gmail vers PowerPoint

Test 2 : Créer une application Meetups de fondateurs hors ligne avec zéro code

Test 3 : Threads fourchus et pourquoi je pensais au parallèle AI

Où la vidéo est sur-vendue et où elle est sous-vendue

Le workflow qui a réellement changé le mien

Questions fréquemment posées

Qu'est-ce que la super application Codex AI ?

Codex est-il identique à ChatGPT ?

Sur quel modèle Codex fonctionne-t-il réellement ?

Codex peut-il vraiment créer une application complète sans codage ?

Quelle est la différence entre les projets, les plugins et les automatisations ?

Travaillons ensemble

Vous avez apprécié cet article ?

Sujets connexes

Engr Mejba Ahmed

Comments

Leave a Comment

Articles connexes

Codex Product Design Plugin : J'ai testé le workflow complet

AI Roundup du 9 mai 2026 : la course du chatbot vers l’OS est lancée

Test de Codeex : j'ai construit un système IA pour les commentaires YouTube

Comments

Leave a Comment

Expand Your Knowledge

AI School

Certificates

Learning Flashcards

AI Agent Skills

Engr Mejba Ahmed

Hey there!