Système d'exploitation du contenu : Claude Code + Higgsfield + Codex
La notification a été reçue à 23h09 un dimanche. Un créateur que je suis avait publié un tutoriel intitulé quelque chose comme "Créer un système d'exploitation à contenu complet avec Claude, Higgsfield 2 et Codex." Je l'ai ajouté à mes favoris, je me suis dit que je le regarderais mardi, puis j'ai ignoré cette promesse dans l'heure. À minuit, la vidéo était ouverte sur un deuxième moniteur, mon terminal sur le premier et un nouveau dossier de projet nommé content-os-test attendant la première commande. Le pitch était suffisamment simple pour être suspect : un CLI, une fenêtre d'invite, des sites Web, des images, des vidéos, des avatars audio et animés sortant tous à l'autre bout. Je n'ai pas cru à la démo. J'avais besoin de l'exécuter.
Ce que je m’apprête à parcourir n’est pas un récapitulatif de cette vidéo. Il s'agit du journal de construction de ma propre version, exécuté dans la pile que j'utilise quotidiennement : Claude Code comme cerveau, le nouveau MCP de Higgsfield 2 pour les visuels, Codex CLI comme environnement d'exécution parallèle lorsque je souhaite un deuxième avis, et une pile de fichiers skill.md qui me permettent de réexécuter n'importe lequel de ces pipelines en un seul. commande. Je crée du contenu multimarque depuis des années sur mejba.me, ramlit.com, colorpark.io et xcybersecurity.io, j'ai donc abordé cela avec des yeux clairs sur ce qui est réel et ce qui est démo-magique.
À la fin d'une session, j'avais une page de destination animée et fonctionnelle, une image de héros 16: 9 générée via Nano Banana 2, une vidéo de héros déclenchée par défilement de cinq secondes, un avatar personnalisé formé sur une poignée de photos téléchargées et trois compétences réutilisables situées dans ~/.claude/skills/ que je peux tirer de n'importe quel projet futur. Le compteur de crédits s'est terminé à 387 brûlés sur 1 000 dans mon pack. Moins cher qu’une seule heure de freelance. Cela vaut plus d'une semaine de changement de contexte entre cinq applications différentes.
Laissez-moi vous montrer exactement comment tout cela s'est produit – et où le terme « système d'exploitation de contenu » commence réellement à signifier quelque chose au lieu d'être un mot à la mode.
Qu'est-ce qu'un système d'exploitation de contenu en réalité en 2026
Je veux être honnête à ce sujet dès le départ, car l'expression est actuellement utilisée de cinq manières différentes dans YouTube. Un système d’exploitation de contenu n’est pas un produit unique que vous pouvez acheter. Il n'existe pas d'application sur l'App Store appelée « Content OS ». Quiconque vous en vend un vous vend un emballage.
Ce que c'est réellement en 2026 : une pile assemblée dans laquelle un environnement d'exécution d'agent contient votre contexte, plusieurs moteurs de génération s'y connectent via un protocole standard et des flux de travail réutilisables transforment les tâches répétitives en commandes sur une seule ligne. Dans ma configuration, les pièces ressemblent à ceci :
- Claude Code est l'orchestrateur. Il contient le contexte de la marque, choisit le modèle à appeler pour quel travail, écrit le HTML et le CSS, enregistre les fichiers aux bons endroits et enchaîne les étapes sans que je clique sur quoi que ce soit. - Higgsfield 2 MCP est le moteur de création. Il expose plus de trente modèles d'images et de vidéos — Nano Banana 2, Soul 2.0, Sora 2, Veo 3.1, Kling 3.0, Seedance 2.0, Flux 2, Wan 2.7, MiniMax Hailuo 02 — via un serveur Model Context Protocol. Selon la page MCP de Higgsfield, le serveur a été officiellement expédié le 30 avril 2026. - Codex CLI est le deuxième moteur d'exécution que je continue d'exécuter pour un travail parallèle.
L'agent de codage de OpenAI exécute GPT-5.4 et je l'utilise lorsque je veux une perspective différente sur le même problème ou lorsque Claude est en cours de refactorisation et que je ne veux pas l'interrompre. J'ai expliqué pourquoi j'exécute Codex et Claude Code en tant que configuration à double agent au lieu d'en choisir un. - Les compétences (fichiers Skill.md) sont les flux de travail. Chacun est un petit fichier de démarque qui apprend à l'agent comment exécuter un pipeline spécifique : "créer une image de héros à la Ghibli", "créer une page de destination du produit", "rendre une vidéo en boucle de défilement de cinq secondes". Une fois qu'une compétence existe, je n'ai plus jamais besoin d'expliquer ce flux de travail.
C'est toute la pile. Remarquez ce qui manque : pas de Figma, pas de Photoshop, pas de Premiere, pas de DaVinci, pas de créateur de site Web séparé, pas d'onglet Runway, pas de Midjourney Discord, pas de tableau de bord ElevenLabs, rien d'Adobe. Chaque modèle dont j'ai besoin est accessible à partir d'un seul terminal car Higgsfield les regroupe et MCP les expose sous forme de commandes.
La raison pour laquelle cela est important est une raison sur laquelle je reviens sans cesse : le taux de désabonnement du modèle AI est brutal. Il y a six mois, aucun des modèles que je viens de lister n'existait sous sa forme actuelle. Nano Banana 2 expédié en février 2026. Sora 2 a remplacé Sora 1. Kling est passé de 2 à 3,0 à 3,06. Seedance est passé de 1,5 à 2,0. Veo est passé de 3 à 3.1. Si vous construisez votre flux de travail autour d’un modèle directement, vous passez la moitié de votre temps à le recâbler. Si vous le construisez autour d'un MCP qui résume les modèles, vous échangez une chaîne et continuez à travailler.
Pourquoi MCP change les mathématiques sur les flux de travail multimodèles
Avant de parcourir l'installation, un petit encadré expliquant pourquoi le protocole de contexte de modèle est spécifiquement important ici. C’est la partie sur laquelle la plupart des tutoriels passent sous silence et c’est la partie qui rend l’ensemble de la pile à l’épreuve du temps.
MCP, initialement publié par Anthropic fin 2024, est un moyen standardisé permettant aux agents AI de communiquer avec des outils externes. Au lieu que chaque outil construise sa propre intégration sur mesure, l'outil s'expose une fois en tant que serveur MCP. Tout agent qui parle MCP — Claude Code, Codex, Cursor, le propre IDE Antigravity d'Anthropic — peut ensuite l'utiliser sans câblage personnalisé.
Lorsque Higgsfield a livré son serveur MCP, cette action a eu un effet discrètement important : elle a rendu chaque modèle sur Higgsfield disponible simultanément pour tous les agents compatibles MCP. J'installe le MCP une fois. Claude Code peut appeler Nano Banana 2. Codex aussi. Il en va de même pour tout futur environnement d’exécution d’agent existant. Si Higgsfield ajoute Veo 4 le mois prochain, je ne change pas mon code. Le MCP l'expose et mes compétences existantes le récupèrent.
C'est la raison pour laquelle je ne parie plus sur les modèles individuels API. J'ai fait construire un flux de travail directement sur le Runway Gen-3 API début 2025. Lorsque Runway a livré le Gen-4 avec un schéma différent, j'ai tout réécrit. Ensuite, j'ai dû réécrire à nouveau lorsque j'ai voulu comparer la sortie de Kling. Là encore pour Veo. L'approche CLI/MCP tue toute cette boucle. MCP de Higgsfield est la couche d'abstraction vers laquelle j'aurais dû construire tout le temps.
L'installation : Higgsfield MCP à l'intérieur de Claude Code
L'installation est vraiment simple, ce qui est rare pour cette catégorie. La page MCP de Higgsfield répertorie trois versions : MCP pour Claude Code, CLI pour n'importe quel agent et un ensemble de compétences. J'y suis allé avec les trois.
Première étape : installez le MCP dans Claude Code. Depuis n’importe quel terminal :
claude mcp add higgsfield -- npx -y @higgsfield/mcp-server
Cela ajoute Higgsfield en tant que serveur MCP à la configuration de Claude Code et extrait le package du serveur de npm. La première fois que vous appelez un outil Higgsfield, il exécute un flux OAuth dans votre navigateur et lie votre compte Higgsfield existant. Aucune clé API à copier et coller. Si vous disposez déjà d'un forfait Higgsfield, vos crédits sont transférés automatiquement.
Deuxième étape : installez le pack de compétences officiel. Cette partie fournit à l'agent des flux de travail prédéfinis pour les séances photo de produits, les vidéos marketing, la formation des personnages et la génération d'images :
npx skills@higgsfield/ai-skills
Le programme d'installation interactif pose trois questions : la portée de l'installation (j'ai choisi global), les compétences à activer (j'ai pris higgsfield-generate, higgsfield-product-photoshoot et higgsfield-soul-id) et à quel agent se lier (Claude Code). La durée totale de l'installation était d'environ quatre-vingt-dix secondes, dont la plupart consistaient en l'extraction de dépendances par NPM.
Troisième étape (facultative mais je le fais) : répétez l'installation de MCP pour Codex. La raison en est les courses parallèles. Si Claude rend une vidéo qui prend quatre minutes, je souhaite continuer à itérer sur la copie dans Codex sans attendre. Codex possède son propre support MCP et le même modèle mcp add y fonctionne avec un indicateur de configuration différent. Le ~/.codex/config.toml habite dans un endroit différent mais le câblage est identique.
Après l'installation, j'ai lancé Claude Code et exécuté /skills pour confirmer l'enregistrement. Trois nouvelles entrées sont apparues : higgsfield-generate, higgsfield-product-photoshoot et higgsfield-soul-id. Plus des commandes utilitaires pour le solde créditeur, l’état des travaux et la liste des actifs. Le CLI était en direct.
Une vérification rapide de la réalité sur les autorisations. Les compétences Higgsfield supposent que l'agent peut écrire des fichiers sur le disque sans demander l'autorisation pour chaque opération. J'exécute ce pipeline avec claude --dangerously-skip-permissions dans un dossier de projet scratch. Pas dans mon monorepo principal. Nulle part je ne peux reconstruire à partir de zéro en cinq minutes. Si vous êtes nerveux, exécutez-le dans un nouveau dossier, vous pourrez ensuite rm -rf. Le drapeau convient lorsque le rayon de souffle est contenu. C'est dangereux quand ce n'est pas le cas.
Premier test : Générer une image de héros 16:9 de style Ghibli avec Nano Banana 2
J'ai choisi le même test que le didacticiel original utilisé : une image 16: 9 de style Studio Ghibli de trois Springer Spaniels anglais. Suffisamment précis pour avoir une bonne réponse claire. Assez stylistique pour qu'un modèle générique produise de la bouillie et qu'un bon produit produise quelque chose de charmant.
J'ai tapé dans Claude :
Générez une image 16:9 de style Ghibli de trois Springer Spaniels anglais courant à travers une prairie de fleurs sauvages à l'heure d'or. Utilisez Nano Banana 2. Enregistrez dans les sorties/hero-spaniels-v1.png.
Claude a acheminé cela via le Higgsfield MCP, a choisi le modèle Nano Banana 2 en fonction de ma mention rapide, dimensionné à 16:9, et a exécuté le travail. Le crédit a atteint 2 crédits par itération sur la résolution standard 2K – Nano Banana 2 est actuellement l’un des modèles les moins chers du catalogue Higgsfield. J'ai demandé quatre itérations, ce qui m'a coûté 8 crédits au total. Quarante-cinq secondes plus tard, j'avais quatre fichiers dans outputs/.
Le premier était franchement époustouflant. Des traits doux peints par Ghibli, trois chiens dessinés distinctement, de la profondeur dans la prairie, le genre de lumière dorée autour de laquelle le Studio Ghibli construit des films entiers. Le deuxième avait un quatrième chien caché en arrière-plan que je pouvais traiter soit comme un bug, soit comme un personnage. Le troisième était un peu boueux. Le quatrième était le gardien.
C'est la partie qui manque aux gens lorsqu'ils pensent au coût génératif de AI. L’unité économique n’est pas « une image » — c’est « un gardien de N ». Sur Nano Banana 2 à 2 crédits par itération je payais l'équivalent d'environ treize centimes par itération et environ cinquante-deux centimes pour le gardien. Pour une image de héros suffisamment bonne pour être publiée sur une véritable page de destination, cinquante-deux cents est le genre de chiffre qui détruit discrètement les budgets photo traditionnels.
J'ai déjà écrit sur comment réfléchir au calcul des coûts sur ces outils, et la version courte est la suivante : le prix du modèle par itération compte moins que le nombre d'itérations dont vous avez besoin pour obtenir un gardien. Les modèles bon marché qui nécessitent huit essais pour atterrir sont plus chers que les modèles de niveau intermédiaire qui atterrissent en deux. Nano Banana 2 atterrit en un ou deux pour la plupart des invites. C'est la valeur.
Le fichier de compétences qui rend cela reproductible
Voici la partie sur laquelle la vidéo originale fait un geste mais ne s'affiche pas. L'intérêt d'exécuter ce pipeline une fois est de ne jamais l'exécuter deux fois de la même manière : chaque flux de travail est enregistré sous le nom skill.md, de sorte que l'exécution suivante est une commande sur une seule ligne.
J'ai enregistré le pipeline de héros Ghibli en tant que compétence chez ~/.claude/skills/ghibli-hero-image/skill.md. Le fichier ressemble à ceci :
---
name: ghibli-hero-image
description: Generate a Ghibli-style hero image at 16:9 using Nano Banana 2 through Higgsfield MCP. Use when the user asks for a soft, painted, animated-film-style hero or banner.
---
When invoked, do the following:
1. Ask the user for the subject of the image (one sentence is enough).
2. Construct a Higgsfield prompt with these locked elements:
- Style: "Studio Ghibli, soft painted strokes, hand-drawn animation aesthetic"
- Lighting: "golden hour, warm directional light"
- Composition: "16:9, cinematic depth, foreground subject + meadow or natural backdrop"
3. Call higgsfield-generate with model = nano-banana-2, aspect = 16:9, iterations = 4.
4. Save outputs to ./outputs/ with filenames hero-{subject-slug}-v1.png through v4.png.
5. Print a summary table: filename, credit cost, prompt used, recommended pick (the agent's best guess at the keeper).
Cost expectation: 8 credits for 4 iterations on Nano Banana 2. Total runtime ~45 seconds.
Avoid: photorealism, hard digital edges, flat color blocks. Reject any output that looks 3D-rendered.
Ce fichier entier compte environ trente lignes. Une fois sur disque, chaque futur héros Ghibli ne constitue qu'une seule commande. Je tape "Utiliser la compétence ghibli-hero-image pour [sujet]" dans Claude et l'agent exécute l'intégralité du pipeline, écrit les sorties et me dit lequel il pense être le gardien. La prochaine fois que je veux une image de héros pour un article de blog colorpark.io, c'est toute l'interaction.
C'est le déverrouillage. Les modèles continueront à affluer. Les pipelines ne devraient pas le faire. Chaque flux de travail réutilisable que vous enregistrez en tant que compétence est un flux de travail dont vous n'avez pas besoin de vous souvenir le mois prochain. J'ai écrit sur la manière dont le système de compétences des agents remodèle tout ce modèle, et les fichiers Skill.md sont le format de fichier le plus efficace que j'ai utilisé l'année dernière.
Création du site Web : inspiration du système de conception de style Spotify
Le test suivant était le plus difficile. La vidéo montrait Jack fournissant à Claude un véritable dépôt de système de conception GitHub comme source d'inspiration et lui demandant de créer une page de destination dans ce style. J'avais envie d'aller plus loin. J'ai choisi le langage de conception de Spotify comme référence - les arrière-plans sombres, l'accent vert, le type d'affichage volumineux, la sensibilité de la couverture de l'album - et j'ai demandé à Claude de concevoir une page de lancement de produit fictive dans cette ambiance.
L'invite que j'ai utilisée :
Créez une page de destination d'une page pour un produit fictif appelé « Vinyl Memory » – un service qui transforme votre historique d'écoute Spotify en un disque vinyle personnalisé. Langage de conception : le site Web de Spotify, mais plus sombre et plus premium. Utilisez une véritable typographie de style Spotify (Spotify Mix ou Inter comme solution de secours), le système de couleurs vert sur presque noir, des espaces généreux et des sections de grille de couverture d'album. Générez un seul index.html avec CSS intégré.
Claude a produit environ 380 lignes de HTML et CSS lors du premier passage. La structure était correcte : un héros avec la maquette du produit, trois blocs de fonctionnalités, une chronologie "comment ça marche", une section de grille d'album montrant des exemples d'enregistrements, un CTA d'inscription par e-mail, un pied de page. Les couleurs étaient proches. La typographie utilisait Inter comme solution de secours car l'agent ne pouvait pas extraire Spotify Mix d'un endroit fiable, ce qui est bien – Inter est un bon remplaçant.
C’est dans le deuxième passage que ça est devenu intéressant. J'ai demandé à Claude de générer trois images de produits pour la section album-grille à l'aide de Higgsfield. L'invite :
Pour la grille de l'album, générez trois pochettes de disque vinyle dans Higgsfield à l'aide de Nano Banana 2. Chacune doit refléter un archétype d'auditeur différent : nuit maussade, conduite estivale, mode de travail concentré. Format carré, 1024x1024. Enregistrez-les dans outputs/grid-1.png via grid-3.png et intégrez-les dans la section album-grid de index.html.
C’est là que l’orchestration gagne sa place. Claude a écrit lui-même les invites sur la base du brief, appelé Higgsfield trois fois (6 crédits au total), a enregistré les fichiers, puis a ouvert le HTML et a mis à jour les attributs src <img> pour pointer vers les nouveaux fichiers. Le temps total entre « construire la section » et « la section est rendue avec de vraies images intégrées » était inférieur à trois minutes. J'ai regardé cela se produire dans la sortie du terminal et je n'ai pas touché le clavier.
La page n’était pas parfaite au pixel près. Le point d'arrêt mobile avait besoin d'être ajusté. L'une des pochettes de l'album avait une main légèrement mal dessinée. L'espacement des héros était un peu serré. Mais cela existait et nous avons parcouru quatre-vingts pour cent du chemin en une seule séance. À titre de comparaison, j'ai passé cinq heures sur des maquettes de page de destination dans Figma pour obtenir les mêmes quatre-vingts pour cent. Les vingt restants sont de l'artisanat. Les quatre-vingts premiers sont désormais un appel de fonction.
Ajout de la vidéo animée du héros accrochée au défilement
La troisième pièce est celle qui a transformé cela de « soigné » en « Je garde cette pile en permanence ». Je voulais une vidéo en boucle de cinq secondes au sommet du héros – un mouvement lent de la caméra sur un disque vinyle en rotation – qui était jouée en défilement. Le genre de traitement pour lequel une vraie agence de design facture trois mille dollars.
J'ai demandé à Claude de générer la vidéo via Higgsfield en utilisant Kling 3.06 :
Générez une vidéo en boucle de 5 secondes à l'aide de Kling 3.06 : une caméra cinématographique lente se déplace sur un disque vinyle noir tournant sur un tourne-disque, un éclairage doux et chaud, des particules de poussière dans l'air, se termine dans une position qui revient proprement en boucle au début. Enregistrer dans les sorties/hero-loop.mp4.
Celui-ci coûte de vrais crédits. Une vidéo de cinq secondes sur Kling 3.06 en qualité standard se situe dans la fourchette de 35 à 45 crédits. Le mien était de 42 crédits. Le rendu a duré environ deux minutes et quarante secondes.
Le résultat était véritablement cinématographique. Tirez la mise au point douce au début. Un lent travelling à travers le disque. Éclairage chaleureux sous un angle de 45 degrés. De minuscules grains de poussière captent la lumière. La boucle s'est déroulée proprement parce que l'invite l'avait demandé. J'ai payé des vidéastes pour filmer des séquences de produits moins convaincantes que celle-ci.
Ensuite, Claude l'a connecté à la page. L'agent a écrit lui-même la logique de lecture déclenchée par le défilement : un petit IntersectionObserver qui met la vidéo en pause lorsque le héros est hors de vue et la lit lorsqu'il est visible, ainsi qu'un décalage de parallaxe qui agrandit légèrement la vidéo lorsque l'utilisateur fait défiler. Une quarantaine de lignes de JavaScript. Inséré dans le index.html existant. Pas de frameworks, pas de bibliothèques au-delà des simples DOM API. Cela a fonctionné du premier coup.
C’est à ce moment-là que le terme « système d’exploitation de contenu » a cessé d’être un langage marketing pour moi. L'agent traitait la génération d'images, la génération de vidéos, la mise en page Web et l'animation JavaScript comme des verbes différents dans la même phrase. Je n’ai jamais eu un seul outil pour faire cela auparavant. Pas Webflow. Pas Framer. Pas WordPress avec vingt plugins. L'agent a continué à construire.
Avatars de personnages : entraînement de l'identification de l'âme à partir de cinq photos
La dernière pièce que j'ai testée était la création de personnages. Soul ID de Higgsfield est le modèle qui vous permet de former une identité numérique à partir d'un petit ensemble de photos, puis de garder cette identité verrouillée pour chaque génération future. Le cas d'utilisation dans la vidéo concernait les avatars personnels pour le contenu. Le cas d'utilisation qui m'intéressait était quelque chose de plus restreint : je voulais un personnage fictif cohérent que je pourrais réutiliser sur plusieurs pages de destination et créations publicitaires sans que ce soit moi ou une personne réelle.
J'ai téléchargé cinq photos d'un modèle d'origine à partir d'une licence que je possédais (payée, utilisée avec autorisation) et j'ai suivi la formation Soul ID :
Entraînez un personnage Soul ID nommé "Eli" à l'aide des photos dans les entrées/eli-references/. Une fois la formation terminée, générez un portrait de héros d'Eli en tenue professionnelle décontractée, avec un éclairage de studio doux, sur un fond gris neutre, 1024 x 1024.
La formation Soul ID dans Higgsfield s'attend généralement à plus de 20 photos de référence pour la plus haute fidélité, mais elle fonctionne sur des ensembles plus petits avec une cohérence moindre. Cinq photos m'ont valu une formation utilisable mais avec quelques dérives sur les angles latéraux. Douze photos lors d'un deuxième test ont produit une cohérence nettement meilleure. La formation elle-même a duré environ cinq minutes et a coûté environ 40 crédits. Higgsfield évalue la création de personnage Soul ID comme un coût unique par personnage et non par génération.
Après l'entraînement, chaque génération Eli a verrouillé le visage. Je pourrais mettre Eli dans un café, dans une configuration de codage, dans un plan publicitaire cinématographique, contre un mur végétal, dans trois conditions d'éclairage différentes, et l'identité serait conservée. C'est la partie qui m'a vraiment surpris. J'ai déjà utilisé des modèles de personnages personnalisés et la cohérence s'est toujours dégradée après une vingtaine de générations. Soul ID détenu jusqu'à cinquante ans.
Pour un opérateur multimarque comme moi, c’est un super pouvoir discret. J'ai maintenant trois personnages Soul ID formés que je fais alterner sur différentes lignes de contenu. Chacun a un « personnage » défini : ce qu’il porte, dans quels types d’environnements il apparaît, l’ambiance de son éclairage. Aucun d’eux n’est de vraies personnes. Aucun d’eux n’est moi. Tous me donnent la cohérence que les modèles humains me donneraient sans la complexité des licences, la planification ou le rythme continu.
Il y a ici une ligne éthique sérieuse que je veux nommer explicitement : n'entraînez pas Soul ID sur des photos de personnes réelles sans leur consentement explicite. Ce n’est pas parce que la technologie vous le permet que tout va bien. Utilisez des stocks avec les licences appropriées, vos propres photos ou des modèles payants qui ont approuvé l'utilisation de AI. L’outil est trop puissant pour être utilisé avec négligence.
Le calcul des prix réels : ce que 1 000 crédits Higgsfield achètent réellement
Le temps pour la partie que personne ne quantifie correctement. J'ai brûlé 387 crédits lors de cette session. Voici la répartition :
-
Génération d'images (Nano Banana 2, itérations multiples) : Environ 60 crédits à travers le héros Ghibli, les couvertures de la grille de l'album et une poignée d'invites de test. À 2 crédits par itération, cela fait 30 itérations au total. - Génération vidéo (Kling 3.06, boucle de 5 secondes) : 42 crédits pour un gardien. J'ai dû régénérer une fois car la première version ne faisait pas de boucle proprement, donc le coût réel était de 84 crédits pour obtenir un clip utilisable. - Formation de personnage Soul ID : 40 crédits pour la formation Eli, puis 40 autres pour un deuxième personnage. - Génération de personnages Soul ID (Eli, 12 générations au cours de la session) : Environ 20 crédits à raison de 1,5 à 2 crédits par sortie. - Rendu de page, opérations de fichiers, génération HTML/CSS : Zéro crédit Higgsfield – c'est tout Claude Code, facturé sur mon abonnement Claude.
-
Diverses expériences d'images et réexécutions : Environ 100 crédits sur divers tests que je n'ai pas détaillés.
Ainsi, 387 crédits m'ont permis d'obtenir une page de destination animée et fonctionnelle, deux avatars de personnages entraînés, une vidéo en boucle de héros de cinq secondes et trois compétences réutilisables. Selon la structure tarifaire actuelle de Higgsfield, où un dollar achète environ 16 crédits, cette session m'a coûté environ 24 $ de crédits.
Les forfaits qui expédient ces crédits ressemblent à ceci dans la tarification 2026 de Higgsfield :
- Niveau gratuit : 150 crédits par mois. De quoi réaliser deux ou trois petites expériences. Utile pour botter les pneus.
- Plan Starter : 15 $ par mois pour le tarif annuel, 200 crédits par mois. Le but de ce niveau est « Je souhaite exécuter de vrais flux de travail de temps en temps » : une session complète de page de destination par mois avec des crédits en réserve.
- Niveau intermédiaire : Environ 39 $ par mois au tarif mensuel le plus élevé, ce qui augmente les crédits d'environ 5 à 6 fois. Le bon niveau si vous exécutez cette pile chaque semaine ou pour le travail client.
- Niveaux supérieurs (Starter Plus, Ultra) : Jusqu'à environ 84 $ par mois pour une utilisation intensive en production avec des allocations de crédits dimensionnées pour la production quotidienne de contenu.
Le calcul qui compte pour la plupart des lecteurs : si vous testez cela une ou deux fois, le niveau gratuit est suffisant. Si vous l'exécutez mensuellement dans le cadre de votre flux de travail, Starter à 15 $ suffit. Si vous l'utilisez pour gérer une petite entreprise de contenu sur plusieurs marques comme je le fais, le niveau intermédiaire est l'endroit où elle vit.
Il y a un coût que la plupart des gens oublient. Claude Code lui-même fonctionne sur un abonnement Claude payant. Vous ne pouvez rien exécuter de tout cela sur le niveau gratuit de Claude. Mon utilisation là-bas représente en moyenne 20 $ supplémentaires de coûts API par mois en plus des crédits Higgsfield, et Anthropic propose un plan /month Claude Pro de 20 $ ainsi que des niveaux plus élevés pour les gros utilisateurs. Intégrez cela au budget.
Compétences que j'ai enregistrées lors de cette session et que vous pouvez voler
Le modèle auquel je reviens sans cesse : la valeur ne réside pas dans une seule session, elle réside dans les compétences réutilisables produites par la session. À la fin de la version, je disposais de trois compétences sur ~/.claude/skills/ que j'utiliserai chaque semaine. Le générateur de héros Ghibli que je vous ai déjà montré. Les deux autres :
Section de héros de produit animée. Une compétence qui, à partir d'une description de produit, génère une image de héros, une vidéo en boucle de cinq secondes et un bloc de héros HTML/CSS réactif complet avec la vidéo connectée à une lecture déclenchée par défilement. Une cinquantaine de lignes de compétences.md. Coût par exécution : environ 50 crédits Higgsfield plus quelques centaines de jetons Claude. Remplace ce qui était autrefois un flux de travail multi-outils de six heures.
Générateur de personnages cohérents avec la marque. Une compétence qui prend un identifiant de personnage Soul ID et un résumé de scène, puis génère une image de personnage cohérente dans plusieurs formats d'image : carré, 4:5 pour Instagram, 9:16 pour les histoires, 16:9 pour YouTube. Environ trente-cinq lignes de compétences.md. Coût par exécution : environ 6 à 10 crédits Higgsfield en fonction du nombre de tailles demandées par le brief.
La raison pour laquelle je continue à insister sur les compétences : chaque fois que j'enregistre un flux de travail en tant que compétence, je rachète du temps sur chaque exécution future. La première exécution est exploratoire et nécessite toute l’attention. La centième séquence correspond à une ligne. Ajoutez à cela que plus d'un an de contenu multimarque et l'effet de levier devient vite stupide. J'ai écrit une version plus longue de ce sujet dans le guide avancé des compétences d'agent si vous voulez le modèle mental complet.
Où cette pile s'effondre (et que faire à ce sujet)
Je veux terminer par une critique honnête car je suis sceptique quant à tout tutoriel qui se termine par "et tout a parfaitement fonctionné". Cette pile a de vraies limites.
L'agent prend des décisions de conception que vous ne prendriez pas. Lorsque je laisse Claude choisir sa propre typographie, son contraste de couleurs ou sa composition d'image sans spécifications de marque claires, le résultat dérive vers une esthétique générique de startup technologique. La solution consiste à rédiger une seule fois un fichier de démarques de spécifications de marque et à l'intégrer à chaque compétence pertinente. Sans cette spécification, vous obtenez la moyenne de chaque page de destination que Claude a jamais vue.
La génération vidéo est encore lente et coûteuse. Cinq secondes de Kling 3.06 représentent deux minutes et demie de temps de rendu et 42 crédits par gardien. Vingt secondes, c'est environ quatre fois plus. Si vous avez besoin d'une vidéo de marque d'une minute, cette pile n'est pas l'endroit où vous la créez : vous assemblez des clips plus courts. Tout ce qui dure plus de dix secondes brise l'économie de l'unité pour le moment.
La cohérence de Soul ID se dégrade avec trop peu de photos de référence. Cinq photos fonctionnent pour une utilisation occasionnelle. Pour le travail client, entraînez-vous avec plus de 20 images sous des angles et des éclairages variés, sinon votre personnage dérivera dans la longue traîne des générations.
MCP tooling is still maturing. I hit one bug where the Higgsfield MCP returned a job ID before the file finished writing to disk, and the next step in my chain tried to read a file that did not exist yet. Claude a finalement réessayé et récupéré. Un workflow plus naïf aurait planté. Intégrez les tentatives à vos compétences.
Gauche des autorisations. L'exécution avec --dangerously-skip-permissions signifie que l'agent peut écrire partout où il a accès. Je conserve cette pile dans un répertoire de travail en bac à sable et copie manuellement les sorties terminées dans de vrais dossiers de projet. La discipline compte.
Le taux de désabonnement des modèles ne s'arrête pas simplement parce que MCP existe. L'abstraction MCP rend l'échange de modèles bon marché. Cela ne rend pas trivial le choix du bon modèle. Il faut quand même savoir que Nano Banana 2 est idéal pour les images stylisées mais plus faible pour les humains photoréalistes, ou que Kling 3.06 gère mieux les mouvements de caméra cinématiques que Veo 3.1 pour le mouvement des produits. Le MCP est le câblage. Le goût est toujours le travail.
Ce que je regarderai ensuite
Trois choses auxquelles je prêterai attention au cours du prochain trimestre.
Veo 3.1 contre Sora 2 pour la vidéo du produit. Les deux ont été expédiés cette année. Les deux sont accessibles via MCP de Higgsfield. Les deux sont excellents. Je n'ai pas encore fait de face-à-face sur la même invite avec la même marque. C'est le prochain test de cette pile, et le résultat déterminera probablement le modèle par défaut de ma compétence "héros animé".
Antigravity, l'IDE d'Anthropic. Antigravity offre un support MCP de première classe et est spécifiquement positionné pour le développement piloté par agents. Si les compétences Higgsfield fonctionnent aussi bien ici que dans Claude Code, le choix entre les deux devient une préférence de flux de travail plutôt qu'une question de capacité. J'ai couvert le Positionnement de l'IDE Anti-Gravity lors de son expédition.
Marchés de compétences. En ce moment, j'écris mes propres fichiers skills.md. L'ensemble de compétences Higgsfield est l'un des premiers cas où un tiers externe expédie des compétences de qualité production sous forme de package. Si cela se transforme en un véritable écosystème – découverte de style npm, gestion des versions, dépendances – l’influence sur chaque créateur individuel augmente d’un autre ordre de grandeur. Je parierais que cela se produira avant la fin de 2026.
Le résumé en une ligne si vous ne vous souvenez que d’une chose : la valeur d’un système d’exploitation de contenu ne réside pas dans un modèle unique. C'est dans le câblage qui rend les modèles remplaçables, les workflows réutilisables et l'agent capable de traiter « image », « vidéo », « page » et « animation » comme des verbes dans la même phrase. Le MCP de Higgsfield est le câblage. Claude Code est l'agent. Les compétences sont les flux de travail. Codex est la deuxième paire de mains. Aucune de ces pièces n’est nouvelle cette semaine. Ce qui est nouveau, c'est qu'ils composent enfin sans se battre.
Que faire dans la prochaine heure
Si vous avez lu jusqu'ici, voici la plus petite chose que vous puissiez faire ce soir et qui comptera dans six mois.
Installez le Higgsfield MCP dans Claude Code. Exécutez une génération d'image via Nano Banana 2. Enregistrez l'invite en tant que fichier Skill.md. C'est tout. Trois étapes. Environ dix minutes. Le niveau gratuit couvre tout cela.
La raison pour laquelle cela est important est la même pour laquelle chaque flux de travail exploité est important : le coût de démarrage est faible et le coût d’attente augmente. Dans six mois, soit vous disposerez d’une bibliothèque de compétences que vous avez perfectionnées au fil de dizaines de courses, soit vous serez là où vous êtes ce soir. La première course est la seule qui demande du courage. Chaque exécution suivante est un appel de fonction.
Je retourne au terminal. Il y a une image de héros pour le prochain message colorpark.io qui doit exister d'ici le matin, et la compétence Ghibli est exactement à deux mots de la rendre.
Questions fréquemment posées
Ai-je besoin à la fois de Codex et de Claude Code pour exécuter cette pile ?
Non : Claude Code seul suffit à exécuter le flux de travail complet Higgsfield MCP. J'exécute Codex CLI en parallèle parce que j'aime avoir un deuxième environnement d'exécution pour itérer sur la copie pendant le rendu de Claude, mais chaque étape de cette version est réalisable dans Claude Code par elle-même. Pour le raisonnement à double agent, consultez la Répartition des workflows Codex et Claude Code ci-dessus.
Combien coûte réellement le système d'exploitation à contenu complet par mois ?
Prévoyez entre 15 $ et 39 $ par mois pour les crédits Higgsfield en fonction du volume d'utilisation, plus un abonnement Claude de 20 $ et plus. Les gros créateurs diffusant du contenu quotidiennement touchent plus de 84 $ par mois sur Higgsfield. La répartition complète se trouve dans la section mathématique des prix ci-dessus.
Mes crédits de plan Higgsfield existants fonctionneront-ils via le MCP ?
Oui. L'authentification s'effectue via votre compte Higgsfield existant et les crédits du forfait existant sont transférés vers le MCP sans aucun changement. Il n'existe pas de pool distinct de « crédits MCP » : il s'agit d'un portefeuille partagé entre l'application Web, le CLI et le MCP.
Qu'arrive-t-il à mon flux de travail lorsque Higgsfield ajoute de nouveaux modèles ?
Rien - c'est le but de l'abstraction MCP. Les nouveaux modèles s'enregistrent du côté de Higgsfield et peuvent être appelés via les mêmes commandes MCP. Vous modifiez une chaîne de nom de modèle dans votre skill.md si vous souhaitez passer à une chaîne plus récente, et votre pipeline existant continue de fonctionner sans changement.
Un non-codeur peut-il réellement exécuter cette pile ?
Généralement oui pour l'installation et les invites, avec une mise en garde honnête : le débogage lorsque l'agent fait quelque chose d'inattendu nécessite une lecture confortable de la sortie du terminal. L'installation comprend trois commandes. Les invites sont en anglais simple. Les compétences sont des fichiers markdown. Mais lorsque le MCP renvoie une erreur ou qu'une compétence se comporte mal, vous devez être prêt à lire ce que le terminal vous dit. Si tout va bien, le reste est accessible.
Travaillons ensemble
Vous cherchez à créer des systèmes AI, à automatiser les flux de travail ou à faire évoluer votre infrastructure technologique ? J'aimerais aider.
- Fiverr (versions et intégrations personnalisées) : fiverr.com/s/EgxYmWD
- Portefeuille : mejba.me
- Ramlit Limited (solutions d'entreprise) : ramlit.com
- ColorPark (conception et image de marque) : colorpark.io
- xCyberSecurity (services de sécurité) : xcybersecurity.io