Claude Code Visual OS : le tableau de bord dont mon équipe avait besoin
J'ai regardé la vidéo de Jack un dimanche après-midi avec un café à moitié vide et la confiance suffisante de quelqu'un qui gère déjà une pile Claude Code fonctionnelle.
Aria écrit mes messages. Hermès dirige mon travail de connaissances personnelles. Codex gère la boucle de codage du deuxième avis. Le MCP de Higgsfield 2 me donne trente modèles d'images et de vidéos à partir d'un seul terminal. J'ai des compétences, des sous-agents, des commandes slash, un coffre-fort Obsidian câblé via Pinecone, une table de journaux Supabase et un CLAUDE.md pour chaque projet. Selon toute mesure raisonnable, j’ai dépassé la phase des machines à sous.
Quarante minutes après le début de la vidéo, cette suffisance avait disparu.
Jack faisait une démonstration de ce qu'il appelle un OS visuel Claude Code : un tableau de bord unique qui connecte chaque modèle, chaque magasin de mémoire, chaque compétence, chaque dépense de jeton et chaque conversation sur sa pile AI dans un seul panneau de contrôle auto-améliorable. Pas un tracker d'utilisation. Pas un tableau de bord de facturation. Une véritable couche opérationnelle avec six piliers et un moteur de « rêve » qui fonctionne toutes les nuits pour suggérer de nouvelles compétences, élaguer celles qui sont mortes, signaler les invites répétitives et repenser tranquillement son flux de travail pendant qu'il dort.
J'ai rembobiné deux fois. Non pas parce que l’idée ne m’était pas familière – j’en roulais des morceaux à la main depuis un an – mais parce que quelqu’un avait finalement dessiné la forme de la chose que j’ai presque continué à construire et à ne jamais terminer.
Ce message est ma réaction. Ce que Jack a construit, qu'est-ce qui est réel à ce sujet en mai 2026 (la fonctionnalité de rêve livrée aux agents gérés Claude chez Code avec Claude le 6 mai - plus à ce sujet), ce que je connecterais réellement à mon propre équipage et l'écart honnête entre la version de démonstration de cette idée et ce qu'il en coûte pour fonctionner réellement.
Si vous jonglez avec trois ou quatre abonnements AI et un cimetière de compétences à moitié testées, c'est le poste que je voulais il y a six mois.
Le vrai problème que personne ne nomme
Avant que le tableau de bord ait un sens, la douleur doit être spécifique. Alors permettez-moi d'être précis sur le mien.
En mai 2026, je paie activement pour Claude Pro Max, OpenAI Pro 200 $ (qui est passé à une allocation 20x Plus sur une base continue), Gemini Advanced, Higgsfield 2 crédits, un index sans serveur Pinecone, un projet Supabase Pro et Obsidian Sync. J'ai Claude Code, Codex CLI, Gemini CLI, Hermes Agent et Cursor installés sur la même machine. Je n'utilise plus Cursor, je ne l'ai tout simplement pas désinstallé. Aria a 11 compétences. Mon dossier personnel .claude/skills/ en contient 27. Je n'en ai pas touché la moitié depuis un mois.
Lorsque quelque chose se brise ou dérive, je n'ai pas de réponse à la question la plus élémentaire à laquelle un constructeur devrait être capable de répondre : quelle partie de ma pile gagne réellement sa place en ce moment ?
Je sais à peu près. Claude Opus 4.7 (sorti le 16 avril, avec le même prix de 5 $/25 $ par million de jetons que la version 4.6, mais avec un nouveau tokenizer qui produit jusqu'à 35 % de jetons en plus pour le même texte saisi - un changement de coût réel caché dans un autocollant "inchangé") écrit mes messages longs. Sonnet 4.6 gère les tâches structurées à 3 $/15 $. Haiku 4.5 à 1 $/5 $ effectue les appels intermédiaires bon marché. La fenêtre contextuelle de 1 million de jetons est disponible au prix standard sur Opus 4.7, Opus 4.6 et Sonnet 4.6, ce qui signifie qu'une demande de 900 000 jetons est facturée au même tarif par jeton qu'une demande de 9 000 jetons. Je connais ces chiffres. Je ne sais pas laquelle de mes compétences utilise quel modèle, ni si l'une d'entre elles appelle silencieusement Opus alors que Haiku aurait fait le travail pour un cinquième du coût.
Voilà la forme du problème. Les agents courent. Les factures arrivent. La sortie est expédiée. Et la couche de visibilité qui me permettrait de dire, en toute confiance, cette compétence a gagné 400 $ de mon temps ce mois-ci et celle-ci est un vampire — cette couche n'existe dans aucun des tableaux de bord officiels Anthropic ou OpenAI. Il n'existe pas dans la console de Pinecone. Cela n’existe nulle part.
Le discours de Jack est que cela devrait être le cas. Et qu’il peut être construit.
C'est ce qui m'a poussé à revenir en arrière.
Qu'est-ce que le système d'exploitation visuel Claude Code de Jack ?
Supprimez le cadre et le système de Jack est un tableau de bord reposant sur six piliers. Les piliers ne sont pas des fonctionnalités : ce sont des sources de données dont le système d'exploitation a besoin pour raisonner sur la vie de votre AI. Le tableau de bord les fusionne. Le moteur du rêve agit sur eux.
Voici les six, tels que Jack les a présentés, avec ma propre lecture à la première personne de la raison pour laquelle chacun est important.
Premier pilier : les modèles
Chaque modèle que vous utilisez, chaque forfait pour lequel vous payez, avec ses coûts, ses limites et son niveau tarifaire actuel, apparaît dans une seule vue. Pas une capture d'écran de votre console Anthropic - une table en direct qui sait que vous payez également pour Codex, Gemini Advanced et Higgsfield, et qui les met côte à côte.
La raison pour laquelle c’est important : le taux de désabonnement des modèles est brutal. Opus 4.7 expédié le 16 avril. Gemini 3.2 Flash est testé sur le terrain dans iOS sans annonce. GPT-5.4 se trouve dans Codex avec un profil de coût différent de celui du produit Web de ChatGPT. Si votre tableau de bord ne sait pas quels modèles vous pouvez appeler, il ne peut pas vous aider à choisir le bon lorsque vous démarrez une session.
Deuxième pilier : la mémoire
Chaque endroit où votre pile stocke le contexte (fichiers locaux, coffres-forts Obsidian, index Pinecone, tables Supabase, bases de données SQL brutes) connectés et visibles.
C'est là que la plupart des piles se cassent. J'avais quatre couches de mémoire en cours d'exécution en mars et une idée floue de ce qu'il y avait dans chacune d'elles. Une requête de recherche acheminée via la mauvaise couche n’est pas seulement plus lente ; il extrait le mauvais contexte dans une invite et empoisonne discrètement la sortie. Le système d'exploitation doit savoir que les faits de ma « voix de marque » se trouvent dans Obsidian, les transcriptions de mon projet se trouvent dans Pinecone et les journaux de mon agent se trouvent dans Supabase, et il doit choisir celui qui convient pour chaque requête sans que j'y pense.
Troisième pilier : Compétences
Chaque compétence individuelle que vous avez écrite, suivie, évaluée et (c'est la partie manquée par la plupart des configurations) élaguée pour plus d'efficacité.
Le système d'exploitation répertorie toutes les compétences. Il vous indique la dernière fois que chacun a été exécuté, à quelle fréquence il a réussi, combien d'argent il a gagné ou économisé et combien cela coûte en jetons par exécution. Les compétences qui n'ont pas été appelées depuis 90 jours sont marquées pour archivage. Les compétences qui sont silencieusement coûteuses sont signalées pour être refactorisées. Les compétences qui réussissent à des taux élevés sont promues.
La plupart des gens traitent leur dossier de compétences comme un placard : des choses entrent, rien n'en sort. Le système d'exploitation le traite comme une liste d'équipe avec des évaluations trimestrielles.
Quatrième pilier : systèmes de connaissances
Des référentiels connectés qui fournissent du matériel de référence que l'agent peut extraire à la demande. Documentation. Remarques. Projets de référence. Listes de lecture. Le résultat de vos séances de rêve.
Il s’agit de la couche qui chevauche la mémoire mais qui est conceptuellement différente. La mémoire est ce que l'agent produit. La connaissance est ce qu'elle peut consulter. Le système d’exploitation suit les deux et rend la différence lisible – car en les confondant, vous vous retrouvez avec un agent qui cite en toute confiance sa propre hallucination d’il y a trois semaines comme source.
Cinquième pilier : utilisation et coût
Consommation de jetons, coûts d'abonnement et impact financier total, répartis par compétence, par projet, par marque, par modèle.
Pas un tableau de bord de facturation. Une couche de vérité financière. Il répond : quelle part de la facture Anthropic de ce mois provient du fait qu'Aria écrit des articles sur mejba.me par rapport aux études de cas de ramlit.com ? Quelle compétence a brûlé le plus de jetons Opus cette semaine ? Mon taux de réussite du cache sur les publications longues est-il réellement de 60 % comme je le pense, ou est-il doucement tombé à 18 % parce que j'ai refactorisé l'invite du système mardi dernier ?
J'ai couvert la version approximative de ce problème dans mon article Claude Code MCP install/cut - chaque serveur MCP que vous chargez facture la location de jetons de contexte, que vous l'utilisiez ou non. Le système d’exploitation rendrait ce loyer lisible sur chaque serveur, chaque compétence, chaque session.
Sixième pilier : le système du rêve
La couche d'analyse automatisée qui surveille ce que vous avez fait hier et suggère des améliorations pour demain. Des invites répétitives qui devraient devenir des compétences. Des compétences qui devraient être fusionnées. Des modèles pour lesquels vous payez trop cher. Mémoire devenue obsolète. De nouveaux outils adaptés à votre flux de travail.
C'est le pilier qui transforme le tableau de bord d'un rapport en un agent. Et c'est ici que le discours de Jack a cessé d'être théorique pour moi — car depuis le 6 mai 2026, Anthropic a en fait intégré une fonctionnalité de rêve dans les agents gérés Claude, et elle fait presque exactement ce que Jack a décrit.
Permettez-moi d'y revenir, car cela change toute la conversation.
La fonctionnalité de rêve est désormais réelle
Anthropic a annoncé rêver lors de la conférence des développeurs Code with Claude à San Francisco le 6 mai 2026. Il est actuellement en aperçu de recherche pour les agents gérés Claude – demandez l'accès via le formulaire des agents gérés sur claude.com. Je n'ai pas encore obtenu l'accès. Mais la documentation publique m'en dit long sur la façon dont Anthropic pense que cette couche devrait fonctionner.
Un « rêve » s'exécute comme un processus en arrière-plan planifié entre les sessions de l'agent. Il lit la mémoire existante ainsi que les transcriptions des sessions précédentes et produit une nouvelle mémoire réorganisée. Les doublons ont fusionné. Entrées obsolètes remplacées par la dernière valeur. Contradictions résolues. De nouvelles idées ont fait surface.
Les articles de la communauté appellent la variante destinée à l'utilisateur Auto Dream ou AutoDream pour Claude Code. La mécanique qui a le plus retenu mon attention : rêver convertit les dates relatives en dates absolues. "Hier, nous avons décidé d'utiliser Redis" devient "Le 15/03/2026, nous avons décidé d'utiliser Redis". C'est le genre de détail qui semble ennuyeux jusqu'à ce que vous ayez vu un agent citer avec confiance une décision « récente » d'il y a six mois et passer un après-midi à démêler la confusion.
La phrase la plus percutante du blog d'Anthropic : "Le rêve fait apparaître des modèles qu'un seul agent ne peut pas voir seul, y compris des erreurs récurrentes, des flux de travail sur lesquels les agents convergent et des préférences partagées au sein d'une équipe."
Relisez-le avec les six piliers de Jack dans votre tête. C'est le sixième pilier décrit par Anthropic lui-même. La société de technologie juridique Harvey rapporte que les taux de réussite de ses agents gérés ont été multipliés par 6 environ lors des tests activés par le rêve sur la rédaction de longs formulaires et la création de documents.
Six. X.
Ce que cela me dit en tant que constructeur, c'est que le système d'exploitation visuel esquissé par Jack n'est pas un fantasme qui nécessite un backend personnalisé que personne ne peut construire. Le pilier le plus difficile – celui que j’aurais soutenu était dans des années en mai – Anthropic vient d’être livré en tant que service géré. Le reste du système d'exploitation est de la plomberie.
Ce qui signifie que la seule question honnête qui reste est : comment pourrais-je réellement connecter cela à mon équipage ?
Comment intégrer le système d'exploitation visuel dans ma pile Aria
Permettez-moi de décrire cela de la même manière que je le décrirais à un ami qui utilise Claude Code depuis six mois et qui est enfin prêt à passer des compétences dans un dossier à une véritable couche de contrôle.
Il y a cinq étapes. Aucun d’entre eux ne nécessite un plan d’entreprise. Tous supposent que Claude Code est déjà installé et qu'au moins un projet avec un répertoire .claude/.
Première étape : Détection du modèle
Le système d'exploitation analyse votre machine et vos comptes lors de la première exécution. Il recherche les CLI installés (Claude Code, Codex, Gemini CLI, Hermes), les fichiers de clés API locaux, les variables d'environnement et les abonnements actifs. Il construit la table des modèles.
Dans mon cas, ce tableau inclurait actuellement Opus 4.7 avec la fenêtre contextuelle 1M, Sonnet 4.6 (le pilote quotidien - 3 $/15 $ avec le même contexte 1 M), Haiku 4.5 (1 $/5 $, le plus économique), GPT-5.4 via Codex, Gemini 3 Pro via Gemini CLI et quel que soit le modèle Higgsfield que j'ai invoqué pour la dernière fois via MCP. Le système d'exploitation n'a pas besoin d'appeler chacun d'entre eux. Il lui suffit de savoir qu'ils existent et ce que chacun coûte.
Pourquoi est-ce important : lorsqu'Aria lance une nouvelle publication pour mejba.me, le système d'exploitation devrait pouvoir jeter un coup d'œil à la tâche et l'acheminer vers le modèle le moins cher qui peut encore faire le travail. Article long de 3 000 mots avec des contraintes de voix de marque ? Opus 4.7 avec mise en cache des invites activée (Anthropic offre jusqu'à 90 % d'économies sur les jetons d'entrée mis en cache, ce qui est énorme lorsque la même invite système circule à chaque session). Extraction structurée courte ? Haïku 4,5 à chaque fois.
Je ne paie pas pour le renseignement. Je paie pour des renseignements appropriés. Le système d'exploitation rend la différence lisible.
Deuxième étape : configuration de la mémoire
Un assistant guidé connecte chaque source de mémoire dont vous disposez. Pour moi cela veut dire :
- Coffre-fort Obsidian chez
~/vault/— règles de marque, contraintes vocales, définitions d'agents, plans de publication - Index sans serveur Pinecone — archives de messages longues, vectorisées pour le rappel sémantique, la source d'où Aria s'inspire lorsqu'elle écrit sur un sujet qu'elle a déjà abordé
- Tableau des journaux Supabase — chaque session d'agent, chaque appel d'outil, chaque nombre de jetons input/output, chaque sélection de modèle
- Local
.claude/skills/et.claude/agents/— les définitions de compétences réelles et les spécifications des sous-agents - Claude Memory API — la nouvelle couche de contexte persistante Anthropic livrée plus tôt cette année
Le système d'exploitation ne remplace rien de tout cela. Cela les relie et donne à chacun un rôle. Obsidian pour les faits que l'agent peut modifier. Pinecone pour le rappel sémantique sur le volume. Supabase pour la piste d'audit. La mémoire API pour la couche qui rêve.
J'ai couvert l'argument architectural plus profond à ce sujet dans mon article Pinecone Nexus sur l'agent RAG — le résultat est que la récupération doit avoir lieu au temps de compilation, et non au moment de la requête, dans la mesure du possible. Le système d’exploitation rend cette distinction opérationnelle.
Troisième étape : Définir la valeur temporelle
C'est l'étape que la plupart des constructeurs sautent et celle qui transforme le tableau de bord d'une couche de vanité en une couche de vérité financière.
Vous dites au système d’exploitation ce que vaut une heure de votre temps. Concrètement. En dollars. Pas "J'aimerais éventuellement gagner 200 /hr ». En ce moment, sur le travail que vous facturez réellement : mon tarif d'agence, mon tarif de conseil, mon tarif de contenu réaliste.
La raison pour laquelle c'est important : le retour sur investissement de chaque compétence est fonction du temps gagné multiplié par votre valeur horaire, moins le coût du jeton. Jusqu'à ce que le système d'exploitation connaisse votre taux horaire, "cette compétence vous a fait gagner 14 minutes" n'est qu'une statistique. Une fois que le système d'exploitation sait que vous facturez 150 $/hour, « cette compétence vous a fait gagner 14 minutes » devient « cette compétence vous a rapporté 35 $ aujourd'hui, pour un coût symbolique de 0,42 $, pour un montant net de 34,58 $ ».
Multipliez cela par 27 compétences et vous obtenez enfin une réponse honnête à la question avec laquelle j'ai commencé cet article : quelle partie de mon stack gagne sa vie ?
Quatrième étape : le moteur de rêve
Planifiez une course de rêve nocturne. Le système d'exploitation alimente les transcriptions de session d'hier et l'état de la mémoire dans un appel Claude Opus 4.7 avec une invite structurée. Le résultat est un rapport de démarque :
- Des invites répétitives qui sont apparues plus de 3 fois cette semaine et devraient devenir une compétence
- Compétences existantes qui se sont déclenchées mais ont échoué, avec leur mode d'échec
- Entrées de mémoire qui contredisent les entrées les plus récentes
- Anomalies de coûts : sessions qui ont brûlé plus de jetons que la médiane de 30 jours pour cette tâche
- Désalignement du modèle — tâches exécutées sur Opus alors que Sonnet ou Haiku auraient suffi
- Nouvelles compétences suggérées basées sur les modèles remarqués par la boucle de rêve
Pour la partie qui correspond à la couche de rêve officielle des agents gérés, vous déléguez à l'aperçu de la recherche d'Anthropic lorsque vous y avez accès. Pour le reste, vous écrivez une compétence de rêve qui lit votre table de journaux Supabase et votre coffre-fort Obsidian et produit la même forme de rapport.
Le schéma est le même dans les deux cas. Les données d'hier deviennent le plan de demain, sans que vous ayez à lire vous-même chaque transcription.
C'est le changement proactif AI que Jack n'arrêtait pas d'encercler dans sa vidéo. Le modèle réactif est "J'ouvre Claude Code, je pense à ce que je veux, je demande." Le modèle proactif est le suivant : "J'ouvre Claude Code, le système d'exploitation a déjà remarqué que trois des cinq derniers mardis, j'ai demandé à Aria de rechercher le même concurrent, et il suggère de l'enregistrer en tant que compétence competitor-scan avec les entrées canoniques verrouillées." L’un d’eux est le jeu. L’autre exploite un système.
Cinquième étape : Le tableau de bord
La couche visible. Tout ce qui précède est restitué dans une seule vue.
En haut de l'écran : le budget symbolique du jour pour tous les modèles, avec le coût à ce jour pour le mois et une projection pour la fin du mois. Une deuxième ligne : sessions actives, compétences en file d'attente, horodatage du dernier rapport de rêve. Une troisième rangée : classement du retour sur investissement des compétences, top 5 par bénéfices nets cette semaine, avec la possibilité d'explorer n'importe lequel d'entre eux.
Un panneau latéral pour l'état de la mémoire : entrées obsolètes, nombre de contradictions, date de dernière consolidation. Un panneau latéral pour l'intelligence des coûts : taux de réussite du cache, taille moyenne du contexte, pourcentage d'appels exécutés sur le modèle optimal. Un panneau latéral pour l'analyse des opportunités : de nouveaux outils que le moteur de rêve vous suggère d'essayer, en fonction du travail que vous avez réellement effectué ce mois-ci, et non en fonction de la publication X que vous avez mise en signet.
C'est la partie de la vidéo de Jack qui m'a tiré de ma chaise. Parce que le tableau de bord n'est pas la question. Le tableau de bord est l'artefact qui prouve que le système d'exploitation qu'il contient fonctionne réellement. Vous pouvez créer tout le reste et le faire fonctionner de manière invisible. Vous créez le tableau de bord de sorte que lorsque quelque chose cesse de fonctionner – ou lorsqu'un client vous demande d'expliquer ce que vous payez – il y ait une page vers laquelle pointer.
Pour le côté fondateur de mon travail, cette page fait la différence entre « nous utilisons AI » et « nous exploitons AI ».
Ce que cela signifie pour la façon dont je dirige mon équipe
C'est ici que le cadrage de Jack m'a forcé à revoir des hypothèses que j'avais cessé de remettre en question.
J'écris sur ma pile depuis un an. Le poste de système d'exploitation agentique à trois couches couvre l'architecture, la mémoire et l'observabilité – les fondations sur lesquelles repose le système d'exploitation visuel. Le mon article AI stack 2026 couvre le tri de niveau S/A/B/C que j'exécute sur les outils. Le post MCP install/cut couvre la couche de coûts au niveau du protocole. Tous les trois étaient honnêtes à l’époque. Aucun d’eux n’a répondu à la question que la vidéo de Jack m’a forcé à poser.
La question : est-ce que j'optimise complètement dans le mauvais cadre ?
Depuis un an, j'optimise les compétences, les agents, les MCP, les invites et les couches de mémoire, un élément à la fois. Aria va mieux. Le dossier des compétences s'agrandit. Les journaux Supabase s'accumulent. Chaque décision individuelle est judicieuse. Mais il n'y a aucune surface où le système peut se regarder et dire le tout a dérivé de son objectif. Aucune surface où je peux regarder le tout et dire ce pilier est un poids mort sans passer un après-midi à spéléologie à travers des bûches.
Le système d’exploitation visuel est cette surface. Non pas parce que les tableaux de bord sont magiques, mais parce que un système sans vision de soi ne peut pas s'améliorer. Rêver est la fin. L'agent lit son propre travail, trouve ses propres modèles, fait apparaître ses propres contradictions. Le tableau de bord n’est que la fenêtre sur cette boucle pour l’humain qui dirige l’organisation.
Cela recadre les six prochains mois de mon travail d’une manière spécifique.
Le dossier de compétences n'est pas un placard, c'est une liste
Chaque compétence Aria nécessite un numéro de retour sur investissement associé d'ici la fin du deuxième trimestre. Je ne sais pas combien gagnent la plupart d’entre eux. C’est inacceptable maintenant que les outils pour le mesurer existent. La première action concrète que cet article génère pour moi : une commande slash skill-audit qui s'exécute tous les vendredis, extrait le nombre d'invocations et les dépenses en jetons par compétence de Supabase, et écrit un rapport Markdown dans un dossier ~/audits/skills/ pour que la boucle de rêve puisse le lire.
Le module d'intelligence des coûts est le gain le moins cher
Je ne connais vraiment pas mon taux de réussite dans le cache. Je sais qu'Anthropic a livré une mise en cache des invites avec jusqu'à 90 % d'économies sur les jetons d'entrée mis en cache. Je sais que j'ai conçu l'invite système d'Aria pour qu'elle soit compatible avec le cache. Je ne l'ai pas validé. Le système d'exploitation visuel force cette validation en affichant le numéro à l'écran.
Construire cette partie est un projet de week-end. Cela permet d'économiser de l'argent dès le premier jour. Il n’y a aucune raison de ne pas le faire.
La couche de rêve est l'endroit où j'arrête d'essayer d'être intelligent
C’est la partie contre laquelle j’aurais argumenté en mars. "Je connais mon flux de travail. Je n'ai pas besoin d'un suggèreur automatique pour me dire quoi faire." J'avais tort. Les motifs que la boucle de rêve fera surface sont des motifs que je ne peux littéralement pas voir parce que je suis à l'intérieur d'eux. Le taux d'achèvement Harvey 6x n'est pas un chiffre marketing - c'est un signal directionnel selon lequel la recherche de modèles par un deuxième agent est un outil beaucoup plus puissant que la recherche de modèles par l'humain qui génère les modèles.
Je demanderai l'accès aux agents gérés pour la version réelle. Pendant que j'attends, j'écrirai ma propre compétence de rêve qui s'exécutera tous les soirs sur les journaux Supabase et produira le même type de rapport que celui produit par la version d'Anthropic. Ce sera pire. Cela ne battra toujours rien.
L'analyse des opportunités est ce qui la rend précieuse pour les clients
Voici l'angle auquel je ne m'attendais pas. Le système d'exploitation visuel n'est pas seulement utile pour moi. Il est utile en tant que livrable pour le type de travail d'agence que j'effectue via ramlit.com. Une petite entreprise ne peut pas se permettre de comprendre sa pile AI de la même manière que j'ai compris la mienne : en payant quarante-trois outils et en supprimant discrètement trente-quatre d'entre eux. Un tableau de bord qui les guide à travers la détection du modèle, la configuration de la mémoire, la définition de la valeur temps et un premier rapport de rêve est l'atout d'intégration le plus efficace que je puisse offrir à un client. Cela compresse une année de mon apprentissage en un mardi après-midi.
C'est le mouvement que je ne voyais pas avant de regarder la vidéo de Jack. Le système d’exploitation visuel est une surface de produit, pas seulement un outil personnel.
Les compromis honnêtes
Avant de vendre quelqu'un à ce sujet, permettez-moi de nommer les choses sur lesquelles je repousserais si un ami me présentait cette vidéo.
Le tableau de bord est une responsabilité de maintenance. Chaque couche que vous visualisez est une couche qui se brise lorsqu'un API en amont change. Les navires anthropiques sont rapides. Pinecone est expédié rapidement. Higgsfield est expédié rapidement. Vous passerez un temps d'ingénierie non nul à maintenir la précision des panneaux. Si vous êtes un opérateur solo, ce temps doit venir de quelque part. Le bénéfice doit compenser le coût. Pour moi, avec plus de 250 publications par an et quatre marques, c'est le cas. Pour quelqu’un qui expédie six messages par an, ce n’est probablement pas le cas.
Le rêve n'est pas infaillible. Le premier mois de rapports de rêves contiendra de mauvaises suggestions. Compétences qu'il propose dont vous n'avez pas besoin. Des consolidations de mémoire qui perdent en nuance. Indicateurs de coûts qui manquent de contexte. Le système d’exploitation n’est pas un décideur, c’est un générateur de candidats. Encore faut-il lire les rapports et choisir. Si vous externalisez le jugement, vous obtiendrez plus rapidement des décisions pires.
La fenêtre contextuelle 1M est une tentation, pas un repas gratuit. Ce n'est pas parce que Sonnet 4.6 et Opus 4.7 accepteront une entrée de 900 000 jetons au prix standard que vous devriez en envoyer une. Le nouveau tokenizer Opus 4.7 peut produire jusqu'à 35 % de tokens en plus pour le même texte saisi, ce qui représente une réelle augmentation des coûts sous le couvert d'un gel des prix. Le système d'exploitation doit vous avertir lorsqu'une session est sur le point de gonfler, et non vous encourager à tout remettre en contexte car la fenêtre peut le contenir.
La centralisation a un mode d'échec. Si le système d'exploitation visuel devient la seule surface en laquelle vous avez confiance, le jour où il éclatera sera le jour où vous ne pourrez plus travailler. Gardez vos compétences, votre coffre-fort Obsidian et vos données brutes Supabase accessibles sans le tableau de bord. Le tableau de bord est une vue, pas une base de données. Perdez cette distinction et vous reconstruisez le problème de verrouillage auquel vous tentiez d’échapper.
Vous n'en avez pas besoin dès le premier jour. La plupart des constructeurs qui lisent cet article doivent d'abord terminer l'architecture de couche un. Dossier de compétences. CLAUDE.md. Un ou deux sous-agents en activité. Le système d'exploitation visuel est la couche quatre ou cinq d'une pile qui doit se trouver sur les couches un à trois pour avoir un sens. Construisez le sol avant de vous préoccuper du plafond.
Cela dit. Le plafond est désormais visible. Et le rêve d'expédition anthropique du 6 mai a rapproché le plafond d'environ un pied par rapport à la veille.
Ce que je fais cette semaine
Des actions concrètes, afin de :
- Demandez l'accès à l'aperçu de la recherche de rêve des agents gérés Claude. Même si l'approbation prend un mois, la demande est déposée ce soir. 2. Écrivez la commande barre oblique
skill-audit. Extrait le nombre d'invocations, les dépenses en jetons et la date de dernière exécution par compétence de mes journaux Supabase. Génère un rapport Markdown dans~/audits/skills/tous les vendredis à 6 heures du matin via un hook cron. 3. Connectez un panneau d'analyse des coûts de base à l'extensionclaude-usageVS Code existante que j'utilise déjà. Taux de réussite du cache, taille moyenne du contexte par compétence et indicateur lorsqu'une compétence appelle Opus pour une tâche qu'Haiku aurait pu gérer. 4. Définissez mon taux horaire dans un seul fichier de configuration que le système d'exploitation peut lire. Pas une cible mouvante. Un numéro. 5.
Écrivez une compétence de rêve v0 qui s'exécute tous les soirs sur les journaux Supabase et génère la même forme de rapport que produit la version de rêve des agents gérés d'Anthropic. Pire que la réalité. Mieux que rien. Expédié ce week-end.
Cinq choses. Aucun d’entre eux ne nécessite un nouvel abonnement. Tous produisent un résultat mesurable au moment où je publie le résumé de la semaine prochaine.
Si même l’un d’entre eux fonctionne, le tableau de bord devient inévitable. Si trois fonctionnent, le système d'exploitation visuel n'est plus une vidéo réalisée par Jack : c'est la couche opérationnelle sur laquelle mon équipe fonctionne.
C'est ce que le café du dimanche après-midi a réellement payé. Ce n'est pas un nouvel outil. Un nouveau cadre pour les outils que je possède déjà.
La boîte de discussion a été la première interface AI. La boucle d'agent était la deuxième. Le système d'exploitation visuel est le troisième. Nous sommes au milieu de cette transition, et les personnes qui le remarquent en premier bénéficient d’un avantage cumulatif d’un an avant que le reste du marché ne rattrape son retard. J'ai l'intention de faire partie de ceux qui l'ont remarqué.
La confiance suffisante avec laquelle j’ai commencé ce post a disparu. Ce qui l'a remplacé est plus utile. C'est une liste de choses à faire.
Questions fréquemment posées
Qu'est-ce qu'un système d'exploitation visuel Claude Code ?
Un système d'exploitation visuel Claude Code est un tableau de bord unifié qui connecte chaque modèle AI, magasin de mémoire, compétence et flux d'utilisation de votre pile Claude Code en une seule surface auto-améliorable. Il suit les dépenses en jetons, calcule le retour sur investissement des compétences et exécute un moteur de rêve nocturne qui fait apparaître des modèles, élimine les compétences mortes et suggère des améliorations du flux de travail. Le concept étend la fonctionnalité de rêve officiellement livrée par Anthropic (6 mai 2026) à une couche de contrôle personnel.
La fonctionnalité de rêve est-elle actuellement disponible dans Claude Code ?
La fonctionnalité de rêve est actuellement en aperçu de recherche pour les agents gérés Claude : demandez l'accès via le formulaire des agents gérés sur claude.com. La variante communautaire appelée Auto Dream pour Claude Code s'exécute localement et consolide les fichiers mémoire entre les sessions, éliminant les notes obsolètes et convertissant les dates relatives en dates absolues. Les deux ont été expédiés publiquement en mai 2026.
Combien coûte l'exécution d'un tableau de bord Claude Code comme celui-ci ?
L'infrastructure de base du tableau de bord n'ajoute presque rien si vous payez déjà pour Claude Pro Max et un niveau Supabase ou Pinecone. Le coût des courses de rêve est d'un appel Opus 4.7 par nuit à environ 5 $ par million de jetons d'entrée, plus des économies de mise en cache rapide allant jusqu'à 90 %. La plupart des constructeurs qui exécutent cela sur une pile solo typique paient entre 5 et 15 $ /month supplémentaires en inférence pour un système qui génère des centaines de retours sur investissement en compétences.
Comment puis-je mesurer le retour sur investissement des compétences dans Claude Code ?
Définissez votre taux horaire en dollars. Enregistrez chaque invocation de compétence avec son nombre de jetons et le temps approximatif économisé. Multipliez le temps gagné par le taux horaire, soustrayez le coût du jeton et affichez le retour sur investissement net par compétence dans le tableau de bord. La saisie du taux horaire est l’étape que la plupart des constructeurs sautent : sans elle, tout autre chiffre de retour sur investissement n’a aucun sens.
Dois-je construire ceci avant ou après avoir une pile Claude Code solide ?
Construisez-le après. Le système d'exploitation visuel est la couche quatre ou cinq d'une pile qui nécessite les couches un à trois (architecture, mémoire, observabilité) en premier. Si vous ne disposez pas encore d'un CLAUDE.md fonctionnel, d'au moins un sous-agent personnalisé et des compétences que vous invoquez de manière récurrente, créez-les avant de vous concentrer sur le tableau de bord. Voir ma version à trois couches du système d'exploitation agent pour connaître l'étage qui vient en premier.
Travaillons ensemble
Vous cherchez à créer des systèmes AI, à automatiser les flux de travail ou à faire évoluer votre infrastructure technologique ? J'aimerais aider.
- Fiverr (versions et intégrations personnalisées) : fiverr.com/s/EgxYmWD
- Portefeuille : mejba.me
- Ramlit Limited (solutions d'entreprise) : ramlit.com
- ColorPark (conception et image de marque) : colorpark.io
- xCyberSecurity (services de sécurité) : xcybersecurity.io