Launch Your Agent : J'ai Testé le Skill Gratuit d'Anthropic

L'agent tournait depuis dix-neuf minutes et je regardais mes dépenses API grimper en temps réel comme un taximètre coincé dans les embouteillages.

J'avais demandé quelque chose de simple : un résumé quotidien de cinq publications tendance sur Reddit, résumées avec un angle d'accroche pour chacune. Le genre de chose que je réglerais normalement avec un cronjob et quarante lignes de Python. Au lieu de cela, j'avais laissé le nouveau Launch Your Agent skill d'Anthropic m'interviewer, construire l'ensemble du projet et le déployer dans le cloud sans que j'écrive une seule ligne de code. La promesse était magique. La réalité, à la minute dix-neuf, était un tableau de bord Console affichant retry après retry — Reddit continuait de refuser les requêtes de l'agent — et un compteur de tokens qui avait silencieusement dépassé les huit dollars.

Cette tension, entre « j'ai construit un agent cloud en une conversation de cinq minutes » et « cette seule exécution m'a coûté douze dollars et vingt-huit minutes », c'est toute l'histoire. Alors laissez-moi vous donner les deux côtés honnêtement, car la plupart de ce qui a été écrit sur ce skill jusqu'à présent se lit comme si c'était copié du README GitHub sans que personne n'ait réellement lancé la chose.

Voici ce qu'est le Launch Your Agent skill, exactement comment je l'ai installé, ce qu'il a produit, où il a échoué et s'il vaut la peine d'être dirigé vers un vrai flux de travail.

Qu'est-ce que le Launch Your Agent skill, exactement ?

Le Launch Your Agent skill est un ensemble gratuit et open-source de skills Claude Code qui vous interview sur une tâche et transforme vos réponses en un Claude Managed Agent actif, hébergé dans le cloud — sans code nécessaire. Il se trouve sur github.com/anthropics/launch-your-agent sous licence Apache 2.0.

Cette réponse en une phrase est la partie que Google et les moteurs IA citeront, alors laissez-moi mériter le reste de votre scroll en déballant ce que cela signifie réellement — car il y a trois choses distinctes entremêlées ici, et le marketing les brouille.

Chose un : le skill lui-même. Ce n'est pas un produit avec une page de facturation. C'est un dossier de Markdown et de scripts que vous placez dans Claude Code. Quand vous exécutez /launch-your-agent, Claude lit ces instructions et se transforme en intervieweur. Le dépôt contient deux skills : launch-your-agent (le flux principal en quatre phases) et wrap-up (un compagnon qui résume votre agent et suggère des améliorations). Anthropic le livre comme une implémentation de référence — le README dit clairement qu'il « n'est pas maintenu et n'accepte pas de contributions ». C'est important, et j'y reviendrai.

Chose deux : Claude Managed Agents (CMA). C'est l'infrastructure payante réelle vers laquelle le skill déploie. CMA est le runtime hébergé d'Anthropic lancé le 8 avril 2026, qui a reçu son volet hébergement d'agents lors de Code with Claude en mai. Vous écrivez la logique de l'agent ; Anthropic l'exécute dans un conteneur isolé, gère l'état et l'exécution des outils, et vous facture les tarifs standard de tokens de l'API Claude plus 0,08 $ par heure de session. Si vous voulez l'analyse approfondie de la plateforme, j'ai écrit un test pratique complet sur Anthropic Managed Agents et ce que la bêta fait encore mal — cet article porte sur le skill qui fonctionne par-dessus, pas la plateforme en dessous.

Chose trois : l'idée de la « boucle ». C'est le cadre conceptuel qu'Anthropic enveloppe autour de l'ensemble, et c'est la partie qui mérite qu'on ralentisse.

Vous imaginez probablement le skill comme un remplisseur de formulaires sophistiqué. C'est plus intéressant que ça. Restez avec moi.

Le modèle mental : vous n'écrivez pas des prompts, vous écrivez des boucles

Voici le changement qui m'a pris une deuxième exécution pour vraiment le ressentir.

Quand vous écrivez un prompt, vous donnez des instructions à Claude : fais ceci, puis cela, formate-le comme ça. Vous êtes responsable de la qualité du résultat. Si c'est faux, c'est parce que votre prompt était faux.

Une boucle inverse cela. Vous donnez à Claude un objectif, du contexte et un ensemble de critères de succès — et alors Claude est responsable de la qualité. Il planifie, choisit des outils, les exécute, évalue sa propre sortie par rapport aux critères que vous avez donnés, et s'il n'atteint pas le niveau, il réessaie. La boucle continue de tourner jusqu'à ce que la sortie franchisse la barre ou que le budget soit épuisé.

Trois inputs alimentent chaque boucle :

Contexte — les informations de fond dont l'agent a besoin. Pour mon résumé : « le public est composé de constructeurs IA indépendants, priorisez les publications de moins de 24 heures, ignorez les threads de mèmes. »
Objectif — ce que vous voulez réellement produire. « Cinq publications tendance, chacune avec un résumé de deux lignes et un angle d'accroche. »
Critères de succès — comment l'agent sait qu'il a bien travaillé. « Chaque entrée a un lien source fonctionnel, un angle distinct et se lit en moins de quinze secondes. »

Ce troisième input est celui que tout le monde sous-estime. Sans critères de succès explicites, l'agent n'a rien contre quoi s'évaluer, donc la boucle s'arrête trop tôt ou tourne indéfiniment. Le Launch Your Agent skill consacre une bonne partie de son interview à extraire ces critères de vous, et cet interrogatoire est, honnêtement, la chose la plus précieuse qu'il fait — plus à ce sujet ci-dessous.

Pensez-y comme la différence entre donner à un employé junior une checklist versus lui donner une définition de « terminé » et l'autorité de trouver les étapes lui-même. La checklist passe moins bien à l'échelle. La définition de terminé passe à l'échelle, mais seulement si vous l'écrivez avec précision. La boucle, c'est la deuxième chose, productisée.

Maintenant, la théorie c'est bon marché. Laissez-moi vous montrer ce qui s'est passé quand je l'ai vraiment installé.

Comment j'ai installé le Launch Your Agent skill dans Claude Code

J'ai fait cela sur une machine propre — Claude Code v2.1.101, macOS, connecté — spécifiquement pour pouvoir noter chaque étape plutôt que de survoler la partie « et puis ça marche tout seul ». Temps total du clone à la première question d'interview : moins de trois minutes.

Étape 1 — Clonez le dépôt et ouvrez Claude Code. Le dépôt est petit. Pas de npm install, pas d'étape de build, rien à compiler.

# Clonez le dépôt de référence d'Anthropic
git clone https://github.com/anthropics/launch-your-agent
cd launch-your-agent

# Lancez Claude Code depuis le dépôt
claude

La raison pour laquelle vous lancez Claude Code depuis le dépôt est que Claude Code auto-découvre les skills situés dans un répertoire .claude/skills/. Il n'y a pas de commande séparée « installer ce skill » — placez les fichiers au bon endroit, démarrez Claude Code, et il les détecte. C'est toute « l'installation ».

Étape 2 — Invoquez le skill. Dans la session Claude Code, tapez :

/launch-your-agent

Cela lance le skill principal en quatre phases. Le compagnon /wrap-up devient également disponible — vous l'exécutez après que votre agent est en ligne pour obtenir un résumé de statut.

Étape 3 — Connectez une clé API. C'est l'étape que les tutoriels rapides sautent, et c'est celle qui vous coûte réellement de l'argent. Le skill déploie sur Claude Managed Agents, et CMA fonctionne sur votre propre compte Anthropic. Vous avez donc besoin d'une clé API de platform.claude.com → API keys. Créez-en une, et le skill la stocke localement dans un fichier .env — jamais collée dans la transcription du chat, ce qui est le bon choix pour un identifiant.

Conseil de pro : avant de générer cette clé, définissez une limite de dépenses stricte sur la clé API elle-même dans la Console. Je ne l'ai pas fait la première fois. Vous pouvez deviner où cela mène.

Étape 4 — Répondez à l'interview. Une fois la clé en place, le skill commence à poser des questions. C'est là que le vrai travail se passe, et cela mérite sa propre section.

Si vous avez déjà utilisé des skills Claude Code, rien de cela ne vous surprendra — c'est le même modèle de découverte .claude/skills/ que j'ai couvert dans mon analyse des Agent Skills avancées dans Claude Code. Ce qui est nouveau, c'est ce que le skill fait avec ce modèle : il ne vous aide pas à écrire du code, il vous interview vers un déploiement.

L'interview est le vrai produit

Je suis entré en m'attendant à un assistant de configuration glorifié. Ce que j'ai obtenu ressemblait davantage à un PM affûté me coinçant dans un couloir jusqu'à ce que j'admette ce que je voulais vraiment.

Le skill — fonctionnant comme Phase 1 sur quatre (Interview → Stage & Launch → Grade & Iterate → Run Without You) — a travaillé approximativement ces domaines :

Que fait l'agent ? Pas « résume Reddit » mais la forme spécifique du résultat. Il a résisté quand ma première réponse était vague.
Quel est le format de sortie ? Digest Markdown ? Email ? Une ligne dans un tableur ? Il voulait l'artefact, concrètement.
Qui est le public et quelles sont les sources de données ? C'est là que j'ai dit « constructeurs IA indépendants » et « Reddit, spécifiquement r/LocalLLaMA et r/ChatGPT ».
Quels sont les critères de succès et la grille d'évaluation ? La partie que j'ai mentionnée plus tôt. Il m'a forcé à définir à quoi ressemble un bon digest versus un médiocre, en termes contre lesquels il pouvait réellement noter.
À quelle fréquence doit-il tourner ? Quotidien, hebdomadaire, à la demande. J'ai choisi quotidien à 7 heures du matin.

Puis il a fait quelque chose que je n'attendais pas : il a défini une v0 — une première version délibérément minimale — plutôt que d'essayer de construire mon agent de rêve complet dès la première tentative. Il m'a dit, essentiellement, « mettons la plus petite version utile en ligne, évaluons-la, puis progressons ». C'est de la bonne discipline d'ingénierie intégrée dans un skill, et c'est la raison principale pour laquelle un non-programmeur peut utiliser cela sans produire un bazar enchevêtré.

Quand l'interview s'est terminée, le skill a généré un dossier my-agent/. Je veux être précis sur ce qu'il contient, car c'est la partie qui rend la chose lisible plutôt que magique :

Une fiche de construction — la spécification lisible par un humain de ce qui est déployé.
Les payloads API exacts — le JSON littéral que le skill envoie à l'API CMA. Vous pouvez le lire, l'auditer et le réutiliser.
Un script de lancement reprennable — pour que si un déploiement échoue à mi-chemin, vous le relancez au lieu de recommencer.
Un scaffold d'évaluation — le harnais de notation qui score chaque exécution contre vos critères.
Une page de synthèse — un résumé généré de type tableau de bord.
NEXT-DIRECTIONS.md — une feuille de route v1/v2 d'améliorations pour plus tard.

Ce dossier est la différence entre « une IA a fait quelque chose d'opaque dans le cloud » et « voici la définition exacte, inspectable et contrôlable par version de mon agent ». Je ne peux pas assez souligner combien cette transparence des artefacts compte une fois que vous dépensez de l'argent réel pour les exécutions.

Vous avez passé le setup. Maintenant la partie honnête — ce qui s'est passé quand je l'ai réellement laissé tourner.

Ce qui s'est passé quand j'ai lancé mon premier agent

La Phase 2 (Stage & Launch) a poussé mon v0 vers Claude Managed Agents. Dans la Console, un nouvel agent est apparu avec son environnement, et le skill a déclenché la première exécution notée.

Puis je me suis installé pour regarder le tableau de bord, qui affiche l'historique des sessions, les appels API et les résultats par exécution. Et c'est là que l'écart entre démo et réalité s'est ouvert.

La tâche de l'agent avait besoin de données Reddit. L'agent ne pouvait pas obtenir les données Reddit de manière fiable. Les endpoints de Reddit continuaient de refuser les requêtes — limites de débit, blocages d'accès, l'hostilité habituelle que les API publiques montrent à tout ce qui sent l'automatisation. Alors la boucle a fait exactement ce que les boucles font : elle a échoué à une étape, a évalué et a réessayé. Et encore. Chaque retry a brûlé des tokens.

Trois chiffres durs de cette première exécution, et je vous donne les vrais, pas les flatteurs :

~28 minutes de temps réel, presque entièrement consacrées aux retries et à la gestion des erreurs, pas au travail productif.
~12 $ de coût API pour une seule exécution, alimentés par une forte consommation de tokens alors que la boucle mâchait du raisonnement de classe Opus à chaque retry. (Opus 4.8 coûte 5 $ en entrée / 25 $ en sortie par million de tokens, et une boucle qui tourne en rond génère beaucoup de tokens de sortie.)
5 articles tendance dans le digest final — car malgré les difficultés, il a finalement produit un résultat utilisable, avec des liens et des commentaires.

Donc : ça a marché. Ça a aussi coûté plus qu'un mois de certains abonnements SaaS, pour un seul résumé quotidien. Si cela tournait chaque matin sans surveillance, je regarderais environ 360 $ par mois pour un résumé Reddit. Ce n'est pas une faute de frappe, et c'est le genre de calcul que personne ne mentionne dans les fils de lancement.

Voici la partie qui l'a racheté, cependant. La Phase 3 du skill (Grade & Iterate) ne m'a pas simplement remis le gâchis coûteux en haussant les épaules. Elle a noté l'exécution, remarqué que les échecs Reddit étaient le facteur de coût, et recommandé de changer la source de données vers la recherche web uniquement — abandonner la dépendance instable à Reddit, récupérer les discussions tendance via la recherche à la place, réduire à la fois le taux d'erreur et la consommation de tokens. L'agent a diagnostiqué son propre mode de défaillance le plus coûteux et a proposé la correction. C'est la boucle qui prouve sa valeur.

L'avis honnête : où ce skill est brillant et où il mord

J'ai maintenant exécuté cela sur trois idées de tâches différentes — le digest Reddit, un observateur de prix concurrentiels et un résumeur quotidien de changelog pour un dépôt que je suis. Des schémas sont apparus. Laissez-moi vous donner les compromis que personne ne met dans ses titres.

Ce qu'il réussit vraiment :

Le pipeline interview-vers-déploiement est la vraie innovation, pas l'hébergement cloud. J'ai vu beaucoup d'outils « agent IA sans code », et ils échouent tous de la même manière : ils rendent facile de commencer et impossible de savoir si le résultat est bon. Ce skill inverse cela en forçant des critères de succès en amont puis en évaluant contre eux. Les artefacts my-agent/ signifient que vous n'êtes jamais piégé — vous pouvez lire les payloads exacts, les versionner dans git et abandonner complètement le skill tout en gardant l'agent. C'est un design inhabituellement honnête pour quelque chose destiné aux débutants.

Où ça mord — et c'est réel :

La fiabilité des outils tiers est votre problème, pas celui du skill. Le mur Reddit n'était pas un bug dans Launch Your Agent. C'est la réalité que le web ouvert combat l'accès automatisé, et une boucle qui retente les échecs transformera volontiers cette friction en un brasier de tokens à cinq chiffres. Avant de pointer un agent vers une source de données, demandez-vous : cette source laissera-t-elle entrer un bot ? Si la réponse est instable, la boucle le découvrira de la manière coûteuse.

Le modèle de coûts récompense la précision et punit le flou. Un objectif serré avec des critères de succès clairs converge en quelques itérations bon marché. Un objectif vague tourne en rond. Parce que l'agent est responsable de la qualité, une définition floue de « terminé » signifie qu'il continue d'essayer d'atteindre une cible que vous n'avez jamais clairement dessinée. Vos dépenses sont directement proportionnelles à la négligence de vos réponses d'interview. Si vous êtes sérieux pour garder ces factures gérables, mon guide d'optimisation des coûts des agents IA couvre les tactiques de discipline de tokens qui comptent le plus ici.

« Implémentation de référence, non maintenue » est une vraie mise en garde. Le dépôt le dit clairement. C'est Anthropic qui vous montre un modèle, pas qui vous livre un produit supporté. Quand l'API de CMA changera — et une API en bêta publique changera — le skill ne recevra pas de correctif. Vous adoptez un instantané. C'est bien pour apprendre et prototyper. Réfléchissez davantage avant de construire un flux de travail critique pour l'entreprise sur un scaffold explicitement non maintenu.

Si vous préférez que quelqu'un conçoive ces agents pour qu'ils convergent de manière économique et ne se bloquent pas sur des sources de données instables, c'est une bonne partie de ce que je construis pour mes clients — vous pouvez voir le type de travail d'automatisation que j'accepte sur fiverr.com/s/EgxYmWD.

C'est l'expérience. Maintenant laissez-moi dézoomer vers ce que cela signifie pour comment vous devriez réellement utiliser la chose.

Quand ce skill en vaut la peine (et quand un cronjob gagne)

L'erreur que j'ai failli commettre était de traiter Launch Your Agent comme un remplacement pour toute automatisation. Ce n'en est pas un. Voici le cadre de décision auquel je suis arrivé après trois exécutions.

Optez pour le skill quand :

La tâche est véritablement intensive en jugement — résumer, prioriser, trier, écrire — où un script déterministe ne peut pas capturer « bien ». La boucle d'évaluation justifie son coût quand la qualité est subjective.
La tâche se répète et vous la superviseriez autrement. Les déploiements planifiés de CMA (horaires cron, maintenant en bêta publique depuis le 9 juin 2026) permettent à un agent de se déclencher seul ; vous obtenez pause, reprise, archivage et réexécutions à la demande, avec une limite organisationnelle de 1 000 déploiements planifiés.
Les sources de données sont compatibles avec l'automatisation — vos propres API, la recherche web, des services avec des identifiants injectés par coffre-fort (CMA peut injecter des secrets dans le sandbox au moment de l'exécution sans que le modèle ne les voie jamais).

Passez votre tour et écrivez le cronjob quand :

La tâche est déterministe. Si un script de quarante lignes produit exactement la bonne réponse à chaque fois, une boucle LLM est une manière strictement plus chère d'obtenir un résultat moins bien défini. Ne payez pas des tarifs Opus pour faire du if/else.
La source de données est hostile aux bots (je te regarde, Reddit) et vous n'avez pas d'accès API légitime. La boucle va retenter dans votre portefeuille.
Vous avez besoin de coûts serrés et prévisibles. Un script coûte des centimes en calcul. Une boucle de raisonnement coûte ce qu'il faut pour satisfaire vos critères, ce que vous ne pouvez pas prédire parfaitement à l'avance.

Cela se connecte à un changement plus large sur lequel j'écris constamment : l'unité d'automatisation passe des scripts que vous maintenez aux objectifs que vous déléguez. J'ai approfondi le côté toujours actif et planifié de cela dans mon article sur l'exécution de boucles Claude Code sur un horaire cron. Le Launch Your Agent skill est la rampe d'accès la plus conviviale à ce monde que j'ai trouvée — tant que vous y entrez en sachant que c'est un taxi à taximètre, pas un abonnement à tarif fixe.

Ce que je vous conseillerais de faire concrètement

Ne déployez pas un agent quotidien lors de votre première exécution. C'était mon erreur, et elle est évitable.

Voici la séquence qui m'aurait épargné onze dollars et beaucoup de temps à fixer le tableau de bord :

Installez le skill et lancez l'interview sur une vraie tâche — mais pour le premier agent, choisissez quelque chose avec une source de données sympathique. Vos propres fichiers, votre propre API ou une simple recherche web. Pas Reddit. Pas quelque chose qui combat les scrapers.
Définissez d'abord une limite de dépenses sur la clé API dans la Console. Un plafond de 5 $ sur une nouvelle clé transforme « j'ai perdu le fil des coûts » en « l'exécution s'est arrêtée toute seule ». Assurance bon marché.
Lancez-le une fois, à la demande. Lisez la sortie notée et le dossier my-agent/. Traitez la première exécution comme une leçon payante sur la façon dont la boucle se comporte avec votre tâche, pas comme de la production.
Seulement alors, planifiez-le. Une fois que vous avez vu une exécution propre et bon marché, activez le déploiement cron. Maintenant vous automatisez une quantité connue plutôt qu'un point d'interrogation.
Lancez /wrap-up pour obtenir le récapitulatif et les améliorations suggérées, puis décidez si la v1 vaut la dépense.

La leçon plus large sous tout cela : le skill n'a pas rendu l'automatisation facile. Il a rendu facile la définition de l'objectif — puis il a impitoyablement exposé chaque endroit où ma définition était bâclée, en me faisant payer la négligence en vrais tokens. Ce n'est pas un défaut. C'est la boucle de feedback la plus honnête que j'ai reçue d'un outil IA depuis un bon moment.

Alors voici la question que je vous laisse, la même que l'agent m'a essentiellement posée à la minute dix-neuf : si vous deviez écrire les critères de succès exacts pour une tâche que vous faites chaque jour — la définition précise de « bien fait » — pourriez-vous le faire ? Car au moment où vous le pouvez, vous pouvez la confier à une boucle. Et au moment où vous ne le pouvez pas, vous avez trouvé la partie de votre travail qui n'allait de toute façon jamais être automatisée.

Questions Fréquemment Posées

Qu'est-ce que le Launch Your Agent skill pour Claude Code ?

Le Launch Your Agent skill est un ensemble gratuit et open-source de skills Claude Code d'Anthropic qui vous interview sur une tâche et la déploie comme un Claude Managed Agent actif et hébergé dans le cloud sans aucun code. Il comprend deux skills, launch-your-agent et wrap-up, sous licence Apache 2.0 sur github.com/anthropics/launch-your-agent. Pour le guide d'installation complet, consultez la section d'installation ci-dessus.

Le Launch Your Agent skill est-il gratuit ?

Le skill lui-même est gratuit et open-source, mais il déploie sur Claude Managed Agents, qui vous facture les tarifs standard de tokens de l'API Claude plus 0,08 $ par heure de session sur votre propre compte Anthropic. Ma première vraie exécution a coûté environ 12 $ parce que la boucle continuait de retenter une source de données instable — donc « skill gratuit » ne signifie pas « gratuit à exécuter ».

Comment installer le Launch Your Agent skill ?

Clonez le dépôt avec git clone https://github.com/anthropics/launch-your-agent, faites cd dedans, exécutez claude pour ouvrir Claude Code depuis le dossier, puis tapez /launch-your-agent. Claude Code auto-découvre les skills dans .claude/skills/, il n'y a donc pas d'étape d'installation séparée. Vous aurez également besoin d'une clé API Anthropic de platform.claude.com.

Qu'est-ce qu'un Claude Managed Agent (CMA) ?

Un Claude Managed Agent est un agent hébergé dans le cloud qu'Anthropic exécute dans un conteneur isolé sur sa propre infrastructure, gérant le sandboxing, l'état et l'exécution des outils, tout en vous facturant par token plus 0,08 $ par heure de session. Depuis juin 2026, CMA prend en charge les déploiements planifiés de type cron et les identifiants injectés par coffre-fort en bêta publique. Le Launch Your Agent skill est un moyen d'en créer un.

Pourquoi mon exécution Launch Your Agent a-t-elle tant coûté ?

Les exécutions deviennent coûteuses quand la boucle retente répétitivement une étape qui échoue — dans mon cas, Reddit refusait les requêtes de l'agent, et chaque retry brûlait des tokens de classe Opus à 5 $ en entrée / 25 $ en sortie par million. Des critères de succès vagues aggravent les choses, car la boucle continue d'essayer d'atteindre une cible indéfinie. Des critères serrés et des sources de données compatibles avec l'automatisation maintiennent les coûts bas.

Travaillons Ensemble

Vous cherchez à construire des systèmes IA, automatiser des flux de travail ou faire évoluer votre infrastructure tech ? J'adorerais vous aider.

Fiverr (builds personnalisés et intégrations) : fiverr.com/s/EgxYmWD
Portfolio : mejba.me
Ramlit Limited (solutions entreprise) : ramlit.com
ColorPark (design et branding) : colorpark.io
xCyberSecurity (services de sécurité) : xcybersecurity.io

Launch Your Agent : J'ai Testé le Skill Gratuit d'Anthropic